JP2001143019A - 文字列認識装置 - Google Patents

文字列認識装置

Info

Publication number
JP2001143019A
JP2001143019A JP32096599A JP32096599A JP2001143019A JP 2001143019 A JP2001143019 A JP 2001143019A JP 32096599 A JP32096599 A JP 32096599A JP 32096599 A JP32096599 A JP 32096599A JP 2001143019 A JP2001143019 A JP 2001143019A
Authority
JP
Japan
Prior art keywords
character
recognition
processing
character string
word
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP32096599A
Other languages
English (en)
Inventor
Yasushi Ishizuka
康司 石塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP32096599A priority Critical patent/JP2001143019A/ja
Publication of JP2001143019A publication Critical patent/JP2001143019A/ja
Pending legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 「枠無し認識」手法において「枠有り認識」手法
と同等の処理速度を高認識精度で実現する。 【解決手段】 文字切り出し部2は、ストローク入力装
置1からストロークが入力される毎に、既に入力された
ストロークと合せて切り出し処理を行う。文字認識部3
は、新たな1文字が切り出される毎に文字認識処理を行
う。言語処理部4は、1文字の文字認識結果候補が得ら
れる毎に、既に得られた文字認識結果候補と組み合わせ
て単語辞書照合処理を行う。その際に、上記切り出し処
理,文字認識処理および単語辞書照合処理を、次ストロ
ークの入力が開始されるまでの時間を利用して行う。そ
の結果、「枠無し認識」において、総ての入力文字に対す
る文字認識処理が終了した後に、後処理によって単語辞
書照合処理を行う必要が無く、「枠有り認識」手法と同等
の処理速度を高認識精度で実現できる。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】この発明は、タブレット等の
座標入力装置を介して入力される文字列を認識する文字
列認識装置に関する。
【0002】
【従来の技術】携帯端末等で用いられているオンライン
文字認識装置の多くは、複数の文字記入枠を表示して1
つの記入枠に1文字だけを記入する「枠有り認識」と呼ば
れる手法を用いている。このような「枠有り認識」手法を
用いたオンライン文字認識装置の一例として、特開平8
‐249424号公報に開示されたようなものがある。
このオンライン文字認識装置においては、上記記入枠に
対する1文字単位の記入を行うので文字を切り出す必要
がなく、高速な文字認識処理を行うことができるという
長所を有する。ところが、その反面、オペレータ(記入
者)にとって、上記記入枠単位でしか文字を記入できな
いという文字記入上の制約がある。
【0003】一方、上記「枠有り認識」に対して、記入枠
を廃止した「枠無し認識」と呼ばれる文字認識の手法があ
る。この「枠無し認識」手法を用いた文字列認識装置にお
いては、入力パターンのどこまでが一つの文字であるか
を確定する「文字切り出し処理」を行う必要である。その
ために、様々な切り出し手法を適用して文字単位の切り
出しを行なっている。ところが、何れの切り出し手法に
おいても、入力パターンの形状のみでは一意に決定でき
ない場合が多い。
【0004】そのために、上記「枠無し認識」手法を用い
た文字列認識の結果として出力される文字列候補の数
は、上記「枠有り認識」手法を用いた文字列認識結果と比
較して切り出し位置候補の組合せに相当する数だけ増加
している。
【0005】さらに、漢字の「口」と片仮名の「ロ」との識
別等の上記「枠有り認識」手法にも共通する同形文字の問
題に加えて、1文字「旧」と2文字「1日」との識別等の形
状が同じで文字数が異なる文字列の問題がある。
【0006】従来の上記「枠無し認識」手法を用いた文字
列認識装置においては、上記「同形文字の問題」や「形状
が同じで文字数が異なる文字列の問題」を解決するため
に、総ての入力文字に対する文字認識処理終了後に、各
文字列候補内における文字間の遷移確率の利用や単語辞
書の照合等による後処理を行っている。
【0007】
【発明が解決しようとする課題】しかしながら、上記従
来の「枠無し認識」手法を用いた文字列認識装置において
は、上記記入枠を無くすことによって増加した文字列候
補に対して、総ての入力文字に対する文字認識処理終了
後の後処理によって、各文字列候補内における文字間の
遷移確率の利用や単語辞書の照合を行う必要がある。そ
のために、上記後処理量は飛躍的に増加し、文字列認識
のトータル処理時間が極端に長くなって、処理速度の低
下を引き起こすという問題がある。
【0008】尚、上記後処理の内容を簡素化することに
よって、処理速度の向上を図ることは可能ではある。し
かしながら、その場合には、認識精度が低下するという
問題が発生する。
【0009】そこで、この発明の目的は、「枠有り認識」
手法と同等の処理速度を高認識精度で実現する「枠無し
認識」手法を用いた文字列認識装置を提供することにあ
る。
【0010】
【課題を解決するための手段】上記目的を達成するため
に、この発明は、座標入力装置から入力された文字列を
オンラインで認識する文字列認識装置であって、上記入
力された文字の筆跡をストローク単位で座標列データと
して順次記録するストローク記憶手段と、上記ストロー
ク記憶手段に1ストロークの座標列データが記録される
毎に,新たな1ストロークの座標列データと既に記録さ
れている各ストロークの座標列データとに基づいて文字
の切り出し位置を推定する文字切り出し手段と、上記切
り出し手段によって1文字の切り出し位置が推定される
毎に,新たな推定切り出し位置で1文字を分割して文字
認識処理を行い,認識結果として文字認識結果候補を得
る文字認識手段と、上記文字認識手段によって文字認識
結果候補が得られる毎に,新たな文字認識結果候補と既
に得られている各文字列との組み合わせに対して言語処
理を行って文字列認識結果を得る言語処理手段を備えた
ことを特徴としている。
【0011】上記構成によれば、ストローク記憶手段に
1ストロークの座標列データが記録される毎に、文字切
り出し手段によって文字の切り出し位置が推定される。
さらに、1文字の切り出し位置が推定される毎に、文字
認識手段によって1文字が分離されて文字認識処理が行
われる。さらに、1文字の文字認識結果候補が得られる
毎に、言語処理手段によって言語処理が行われて文字列
認識結果が得られる。
【0012】こうして、「枠無し認識」手法を用いた文字
列認識が行われるに際して、総ての入力文字に対する文
字認識処理が終了した後に後処理によって言語処理を行
うのではなく、1文字の文字認識結果候補が得られる毎
に次ストロークの入力開始までの時間を利用して言語処
理が行われる。したがって、1文字が認識される毎に行
われる上記言語処理によって文字列候補の数が絞り込ま
れることと相俟って、「枠有り認識」手法と同等の処理速
度が、高認識精度を保ちつつ得られる。
【0013】また、この発明の文字列認識装置は、上記
言語処理手段による言語処理を,単語辞書に登録された
単語との照合を行う単語辞書照合を含むように成し、上
記単語辞書を登録単語の先頭文字あるいは先頭文字列を
インデックスとして有するように成し、上記言語処理手
段を,上記単語辞書照合に際して,上記新たな文字認識結
果候補と既に得られている各文字列との組み合わせが上
記インデックスに存在する場合には,次回の単語辞書照
合の範囲を当該インデックスに対応付けられた単語群に
限定するように成すことが望ましい。
【0014】上記構成によれば、上記単語辞書照合を行
う際に、新たな文字認識結果候補と既に得られている各
文字列との組み合わせが上記インデックスに存在する場
合には、次回の単語辞書照合時には、当該インデックス
に対応付けられた単語群のみとの照合が行われ、単語辞
書に登録された全単語との照合を行う場合に比して、単
語照合の範囲が限定されて単語照合時間が低減される。
【0015】また、この発明の文字列認識装置は、上記
インデックとして、上記登録単語の先頭文字である文字
インデックスに加えて、2文字目の文字を構成するパタ
ーンの一部分であるサブパターンを用いることが望まし
い。
【0016】上記構成によれば、先頭文字に加えて2文
字目の文字を構成するサブパターンもインデックスとし
て用いられて、さらに単語辞書照合の範囲が限定され
る。こうして、さらに単語照合時間が低減されて効率的
に文字列認識が行われる。
【0017】
【発明の実施の形態】以下、この発明を図示の実施の形
態により詳細に説明する。図1は、本実施の形態の文字
列認識装置におけるブロック図である。
【0018】ストローク入力装置1は、筆記者によって
ペンを用いて文字のストロークが入力される。文字切り
出し部2は、入力された文字を1文字単位で切り出す切
り出し処理を行い、入力ストロークを文字単位に分割す
る。その場合、切り出し位置が一意に特定できない場合
には、複数の切り出し位置の組合せに基づく複数の切り
出し候補を出力する。
【0019】文字認識部3は、上記文字切り出し部2に
よって文字に分割された領域に含まれるストロークを入
力とし、照合用文字パターン辞書6を参照して文字認識
処理を行う。そして、文字認識処理の結果を、文字認識
結果候補として出力する。言語処理部4は、文字認識部
3で得られた複数の文字認識結果候補に基づいて、照合
用単語辞書7及び遷移確率テーブル8を用いて文字列候
補を求める。そして、得られた文字列候補を表示装置5
に表示する。
【0020】図2は、図1に示す文字列認識装置におけ
る具体的な構成例を示す。図1におけるストローク入力
装置1は、表示一体型タブレット11を構成する例えば
静電誘導型のタブレット装置で実現される。また、図1
における表示装置5は、表示一体型タブレット11を構
成する例えば液晶表示パネルで実現される。また、図1
における文字切り出し部2,文字認識部3および言語処
理部4は、CPU(中央演算処理装置)12によって実現
される。
【0021】そして、上記CPU12による切り出し処
理,文字認識処理および言語処理の結果得られた切り出
し候補,文字認識結果候補,文字列候補およびそれらの中
間データは、RAM(ランダム・アクセス・メモリ)13の
切出候補バッファ14,認識結果バッファ15および中
間辞書バッファ16に格納される。また、図1における
照合用文字パターン辞書6,照合用単語辞書7および遷
移確率テーブル8は、ROM(リード・オンリ・メモリ)1
8に格納される。尚、CPU12によって実行される切
り出し処理,文字認識処理および言語処理の実行プログ
ラムは、ROM18のプログラム格納部19に格納され
る。
【0022】ストローク記憶装置20は、上記表示一体
型タブレット11から入力されたストロークの軌跡を表
す座標列データを格納する。ビデオメモリ21は、表示
一体型タブレット11に表示するイメージ・データを格
納する。
【0023】図3は、図2におけるCPU12の制御の
下に実行される文字列認識処理動作のフローチャートで
ある。以下、図3に従って文字列認識処理動作について
説明する。CPU12によって、表示一体型タブレット
11に対するペンによる入力が検知されると文字列認識
処理動作が開始される。
【0024】ステップS1で、上記表示一体型タブレッ
ト11から入力されたストロークの軌跡が座標列データ
として読み込まれ、ストローク記憶装置20に格納され
る。ステップS2で、ペンが表示一体型タブレット11
から離れたか否かで、1ストロークの入力が完了したか
否かが判別される。その結果、1ストロークの入力が完
了すればステップS3に進む。ステップS3で、切出候補
バッファ14に、今までの中間切り出し結果が格納され
ているか否かが判別される。その結果、中間切り出し結
果が有ればステップS6に進み、無ければステップS4に
進む。
【0025】ステップS4で、上記ストローク記憶装置
20に格納されている座標列データが読み出されて、上
記切り出し処理が実行される。ここで、上記切り出し処
理の具体的な方法は以下のように行われる。すなわち、
新たに得られたストロークの座標列データから、各スト
ロークの始点および終点の座標やx,y座標夫々の最大
値等の特徴を抽出する。そして、横書きの場合には、位
置的に隣接するストロークとの距離を求め、所定値以上
の距離を有するストローク間を文字切り出し位置の候補
として切出候補バッファ14に記憶するのである。
【0026】ステップS5で、前回1文字を切り出して
からのストロークの数、各ストロークの特徴、分割の候
補位置、切り出し後の文字候補位置等で成る中間切り出
し結果が求められ、後の文字切り出しの際に利用するた
めに切出候補バッファ14に格納される。そうした後、
ステップS9に進む。
【0027】ステップS6で、上記切出候補バッファ1
4から中間切り出し結果が読み込まれる。ステップS7
で、上記読み込まれた中間切り出し結果に、新たに得ら
れた座標列データから抽出された特徴(新たに入力され
たストロークの情報)が加えられ、上述のようにして切
り出し処理が実行される。ステップS8で、上記中間切
り出し結果が求められて切出候補バッファ14に格納さ
れる。ステップS9で、切出候補バッファ14に記憶さ
れた上記分割の候補位置に基づいて、上記ステップS4,
S7における切り出し処理の結果新たな文字領域が生成
されたか否かが判別される。その結果、生成された場合
はステップS10に進み、生成されない場合は上記ステッ
プS1に戻って、次のストロークの取り込みと切り出し
処理に移行する。
【0028】こうして、1ストロークが入力される毎
に、次のストロークの入力開始までの時間を利用して、
上記ストローク記憶装置20に新たに格納されたストロ
ークに既に格納されているストロークを加えた複数のス
トロークに基づいて切り出し処理を行う。そして、この
処理が1文字領域が生成されるまで、つまり1文字が切
り出されるまで繰り返されるのである。その結果、1文
字が切り出されるとステップS10に進む。
【0029】ステップS10で、上記生成された新たな文
字領域に含まれるストロークの座標列データを入力とし
て、照合用文字パターン辞書6を用いた文字認識が実行
される。そして、文字認識結果候補が認識結果バッファ
15に格納される。ここで、照合用文字パターン辞書6
とは、文字とこの文字を構成するサブパターンとを対応
付けたものである。尚、上記サブパターンは、文字を左
右に分離できるパターン、低画数文字のパターン全体、
統計上一筆書きされ易いパターンの全体等である。ま
た、上記文字認識に関する詳細な説明は省略するが、上
記文字認識の具体的な方法としては、例えば、特開平8
‐249424号公報(特に第1実施例)に開示された方
法がある。
【0030】ステップS11で、上記中間辞書バッファ1
6に中間照合結果が格納されているか否かが判別され
る。その結果、中間照合結果が有ればステップS15に進
み、無ければステップS12に進む。ステップS12で、認
識結果バッファ15に格納された文字認識結果候補に対
して遷移確率テーブル8を用いた確率方式による言語処
理が実行される。ステップS13で、上記確率方式による
言語処理の結果選出された言語的に確からしい文字認識
結果候補に対して、照合用単語辞書7を用いた新規の単
語辞書照合が実行される。そして、得られた文字列候補
が認識結果バッファ15に格納される。ステップS14
で、得られた照合結果が中間照合結果として中間辞書バ
ッファ16に格納される。そうした後にステップS19に
進む。
【0031】ステップS15で、上記中間辞書バッファ1
6に格納されている中間照合結果が読み込まれる。ステ
ップS16で、認識結果バッファ15に格納された文字認
識結果候補が読み込まれ、上記読み込まれた中間照合結
果に接続して文字認識結果候補の列が生成される。そし
て、この文字認識結果候補の列に対して遷移確率テーブ
ル8を用いた確率方式による言語処理が実行される。こ
うして、言語的に確からしい文字認識結果候補の列が得
られる。ステップS17で、上記得られた言語的に確から
しい文字認識結果候補の列に対して、照合用単語辞書7
を用いた継続の単語辞書照合が実行される。そして、得
られた文字列候補が認識結果バッファ15に格納され
る。ステップS18で、得られた照合結果が中間照合結果
として中間辞書バッファ16に格納される。
【0032】こうして、各ストロークが入力されて1文
字が認識される毎に、次のストロークの入力開始までの
時間を利用して、中間辞書バッファ16に格納されてい
る中間照合結果に当該認識結果を加えた文字列に対して
照合用単語辞書7を用いた単語照合を行う。そして、こ
の処理が当該認識結果の全文字認識結果候補が照合され
るまで繰り返されるのである。その結果、上記全文字認
識結果候補に対する単語照合が終了するとステップS19
に進む。
【0033】ステップS19で、文字列入力が終了したか
否かが判別される。その結果、終了すればステップS20
に進み、終了していなければ上記ステップS1に戻っ
て、次の文字に関するストロークの取り込みと文字切り
出しに移行する。ここで、上記文字列入力の終了判定
は、例えば、上記表示一体型タブレット11からの入力
が所定時間以上途絶えたか否かを判別することによって
行う。ステップS20で、認識結果バッファ15に格納さ
れている文字列候補がビデオメモリ21に送出されて表
示一体型タブレット11に出力される。そうした後、文
字列認識処理動作が終了する。
【0034】すなわち、上記文字列認識処理動作におけ
るステップS3〜ステップS9が文字切り出し部2による
切り出し処理に相当し、ステップS10が文字認識部3に
よる文字認識処理に相当し、ステップS11〜ステップS
18が言語処理部4による言語処理に相当するのである。
【0035】以下、上記文字列認識処理動作におけるス
テップS13,S14及びステップS17,S18において実行さ
れる単語辞書照合および中間照合結果の保存について詳
細に説明する。図4は、単語辞書照合・保存処理動作の
フローチャートである。上記文字列認識処理動作におい
て、遷移確率テーブル8を用いた確率方式の言語処理が
終了すると、単語辞書照合・保存処理動作がスタートす
る。
【0036】ステップS21で、上記確率方式の言語処理
によって得られた言語的に確からしい認識結果が取得さ
れる。ステップS22で、上記取得された認識結果から1
つの文字認識結果候補が読み出される。ステップS23
で、上記読み出された文字認識結果候補を照合用単語辞
書7に登録されている単語の文字と照合する単語照合が
行われる。その場合、中間照合結果がある場合の単語辞
書照合・保存処理動作であれば、中間辞書バッファ16
から読み出された後に詳述する未完成文字列(中間照合
結果)に対して単語照合が行われる。
【0037】ステップS24で、上記単語照合の結果、当
該文字認識結果候補あるいは文字列が照合用単語辞書7
あるいは上記未完成文字列にあったか否かが判別され
る。その結果、ある場合にはステップS25に進み、無い
場合にはステップS25をスキップする。ステップS25
で、当該文字認識結果候補あるいは文字列が、完成文字
列候補として認識結果バッファ15に格納される。
【0038】ステップS26で、当該文字認識結果候補あ
るいは文字列が照合用単語辞書7のインデックスにある
か否かが判別される。その結果、上記インデックスにあ
ればステップS27に進み、無ければステップS27をスキ
ップする。ここで、上記インデックスは照合用単語辞書
7を引くための索引であり、例えば、図5に示すよう
に、照合用単語辞書7に登録されている単語の先頭文字
あるいは先頭文字列である。ステップS27で、上記イン
デックスに存在する当該文字認識結果候補あるいは文字
列を先頭とする総ての単語が照合用単語辞書7から読み
出され、未完成文字列として当該文字認識結果候補ある
いは文字列と対応付けられて中間辞書バッファ16に格
納される。この未完成文字列が次回の単語照合の際に上
記中間照合結果として使用されるのである。ステップS
28で、上記ステップS21において取得された総ての文字
認識結果候補に関する単語照合が、終了したか否かが判
別される。その結果、未だ単語照合されていない文字認
識結果候補があれば、上記ステップS22に戻って次の文
字認識結果候補に対する処理に移行する。一方、無けれ
ばステップS29に進む。
【0039】ステップS29で、上記認識結果バッファ1
5に格納されている総ての完成文字列候補および中間辞
書バッファ16に格納されている総ての未完成文字列
(中間照合結果)に関して、後に詳述する単語列精度Dが
算出される。そして、この単語列精度Dの昇順に上記完
成文字列候補および未完成文字列がソートされる。ステ
ップS30で、上記ソート結果に基づいて所定数の完成文
字列候補および未完成文字列から成る候補結果が選定さ
れる。ステップS31で、選定された完成文字列候補およ
び未完成文字列が認識結果バッファ15に格納されて文
字列候補が決定される。その後、単語辞書照合・保存処
理動作を終了して、上記文字列認識処理動作におけるス
テップS19に移行するのである。
【0040】すなわち、上記ステップS21〜ステップS
23は上記文字列認識処理動作におけるステップS13,S1
7に相当し、ステップS24〜ステップS31は上記文字列
認識処理動作におけるステップS14,S18に相当するの
である。
【0041】こうして、上記照合用単辞書7に登録され
ている単語の中から、切り出された全文字の文字認識結
果候補の組み合わせと完全一致あるいは部分一致する単
語が単語列精度Dの昇順にソートされて、文字列候補と
して得られるのである。
【0042】尚、上記単語列精度Dの算出は、次式に従
って行われる。 照合用単語辞書7と完全一致した場合(完成文字列候補
である場合): D=Σ(照合用文字パターン辞書6との距離)−α×(一
致文字数) 照合用単語辞書7と部分一致した場合(未完成文字列で
ある場合): D=Σ(照合用文字パターン辞書6との距離) ここで、αは文字認識手法に応じて適宜に定められる定
数であり、本実施の形態においてはα=10とする。
【0043】以下、上記単語辞書照合・保存処理動作に
ついて、表示一体型タブレット11から文字列「言語処
理」が入力された場合を例に挙げて具体的に説明する。
この場合、上記文字列認識処理動作におけるステップS
10での文字認識処理によって、図6に示すような文字認
識結果候補が順次得られるものとする。尚、説明を簡単
にするために、上記確率方式による言語処理に関する説
明は省略する。
【0044】先ず、1文字目が切り出されて文字認識が
行われると、その認識結果「言」が取得される。ここで、
1文字目の場合には「中間照合結果」は格納されていな
い。そこで、直ちに1文字目の認識結果「言」と図5に示
す照合用単語辞書7に登録された単語の文字とが照合さ
れる。その結果、認識結果「言」1字のみの単語は照合用
単語辞書7にないので、照合用単語辞書7のインデック
スとの照合が行われる。その結果、認識結果「言」は上記
インデックスに登録されているので、文字「言」を先頭と
する単語「言語」,「言動」,「言う」,「言語処理」等が未完成
文字列として選出され、文字「言」と共に中間辞書バッフ
ァ16に格納される。ここで、1文字目の認識結果は
「言」のみであるから、次に上記未完成文字列「言語」,「言
動」,「言う」,「言語処理」等の単語列精度Dが算出され
る。例えば、未完成文字列「言語」の単語列精度Dは、 D=41(「言」の距離) となる。
【0045】こうして得られた単語列精度Dの値が小さ
い順に上記未完成文字列がソートされる。そして、ソー
ト後の未完成文字列から例えば上位100位を候補結果
として選定し、認識結果バッファ15に格納されて文字
列候補が決定される。上記候補結果の選定は、計算処理
量の低減とメモリの節約を目的として行われる。
【0046】次に、2文字目が切り出されて文字認識が
行われると、その2文字目の認識結果「話」,「語」,「詞」が
取得される。そして、第1候補「話」が読み出され、中間
辞書バッファ16に保存されている1文字目の文字認識
結果候補「言」と合せて2文字列「言話」が生成される。こ
の文字列「言話」は、上記未完成文字列「言語」,「言動」,
「言う」,「言語処理」,…の中には無く、上記インデックス
にも無いので、第1候補「話」に関する処理を終了する。
次に、第2候補「語」が読み出されて2文字列「言語」が生
成される。この場合、この2文字列「言語」は、未完成文
字列「言語」,「言動」,「言う」,「言語処理」,…の中に在るの
で、完成文字列候補「言語」として認識結果バッファ15
に格納される。更に、この2文字列「言語」は上記インデ
ックスに登録されているので、2文字列「言語」を先頭と
する単語「言語」,「言語処理」等が未完成文字列として2
文字列「言語」と共に中間辞書バッファ16に格納され
る。次に、第3候補「詞」が読み出されて2文字列「言詞」
が生成される。そして、この2文字列「言詞」は、上記未
完成文字列「言語」,「言動」,「言う」,「言語処理」,…の中に
は無く、上記インデックスにも無いので、第3候補「詞」
に関する処理を終了する。
【0047】そして、上記完成文字列候補「言語」と未完
成文字列「言語処理」等との単語列精度Dが算出される。
例えば、完成文字列候補「言語」の単語列精度Dは、 D={41(「言」の距離)+54(「語」の距離)}−10(α)
×2=75 となる。また、未完成文字列「言語処理」の単語列精度D
は、 D=41(「言」の距離)+54(「語」の距離)=95 となる。次に、こうして算出された単語列精度Dの値が
小さい順に上記文字列がソートされ(第1位は「言語」)、
ソート後の文字列から候補結果が選定されて文字列候補
が決定される。そして、認識結果バッファ15の文字列
候補が更新されるのである。
【0048】以下同様にして、3文字目の認識結果
「処」,「机」に対する処理、4文字目の認識結果「理」,「埋」
に対する処理が行われる。その結果、4文字列「言語処
理」を第1位とする文字列候補が認識結果バッファ15
に得られるのである。
【0049】上述のように、本実施の形態においては、
表示一体型タブレット11からストロークが入力される
毎に、中間切り出し結果が在る場合にはその中間切り出
し結果も用いて切り出し処理を行う。そして、新たな1
文字が切り出される毎に、その新たな1文字に対する文
字認識処理を行う。さらに、1文字の文字認識結果候補
が得られる毎に、中間照合結果が在る場合にはその中間
照合結果も用いて、照合用単語辞書7を用いた単語辞書
照合処理を行うようにしている。
【0050】オペレータが、上記表示一体型タブレット
11に対して1つのストロークを入力するのに、ペンで
記入する場合には通常約0.2秒〜0.3秒の時間が必要
である。さらに、1つのストロークの入力が完了後に次
のストロークの入力を開始するまでに、上記ペン移動の
ための時間も必要である。そこで、本実施の形態におい
ては、このオペレータが入力に必要な時間内に、既に入
力されたストローク列の情報を用いて文字切り出し位置
の候補を推定し、この推定した文字切り出し位置で1文
字を切り出して文字認識し、得られた文字認識結果候補
の組み合わせと照合用単語辞書7との単語照合を行うの
である。したがって、最後のストロークが入力されると
略同時に、最後の文字が切り出されて認識され、最後の
候補文字列に対する言語処理が行われることになる。
【0051】すなわち、本実施の形態によれば、上記
「枠無し認識」手法を用いた文字列認識装置において、総
ての入力文字に対する文字認識処理が終了した後に、後
処理によって言語処理を行う必要がない。また、記入枠
を無くすことによって文字列候補が増加しても、文字認
識結果候補が生成される毎に言語処理を行って文字列候
補の数を絞り込むことができる。したがって、「枠有り
認識」手法と同等の処理速度を、高認識精度を保ちつつ
得ることができるのである。
【0052】ここで、上記照合用単語辞書7のインデッ
クスの構成は、図5に限定されるものではない。図7に
示す照合用単語辞書25のインデックスの構成は、図5
に示すような文字単位のみではなく、上記サブパターン
単位をも併用する。例えば、単語「往復」の場合には、1
文字目「往」の文字全体のパターンを表す文字インデック
スと、2文字目「復」のサブパターン(SP)「彳」のSPイ
ンデックスとの2つのインデックスを用意するのであ
る。
【0053】そして、上記単語辞書照合・保存処理動作
におけるステップS26において、照合用単語辞書25の
インデックスとの照合を行う際には、照合の対象となる
文字列「往復」の1文字目「往」の文字インデックスと2文
字目「復」のサブパターン(SP)「彳」との組み合わせを指
定することによって、得られる未完成文字列の数をより
少なくすることができる。したがって、文字認識処理終
了後の処理量をさらに低減して、効率的な入力作業を可
能にするのである。
【0054】尚、上記実施の形態においては、図4に示
す単語辞書照合・保存処理動作のステップS27におい
て、上記中間辞書バッファ16に、上記インデックスに
存在する当該文字認識結果候補あるいは文字列と未完成
文字列とを格納するようにしている。しかしながら、照
合用単語辞書7上における当該インデックスのアドレス
を格納して、中間辞書バッファ16の情報量を削減して
も差し支えない。
【0055】
【発明の効果】以上より明らかなように、この発明の文
字列認識装置は、ストローク記憶手段に1ストロークの
座標列データが記録される毎に、文字切り出し手段によ
って新たな1ストロークの座標列データと既に記録され
ている各ストロークの座標列データとに基づいて文字の
切り出し位置を推定し、文字の切り出し位置が推定され
る毎に、文字認識手段によって分割文字の文字認識処理
を行なって文字認識結果候補を得、1文字の認識結果候
補が得られる毎に、言語処理手段によって上記文字認識
結果候補と既に得られている各文字列との組み合わせに
対して言語処理を行って文字列認識結果を得るので、
「枠無し認識」手法を用いた文字列認識を行うに際して、
総ての入力文字に対する文字認識処理が終了した後に、
後処理によって言語処理を行う必要が無く、次ストロー
クの入力開始までの時間を利用して言語処理を行うこと
ができる。
【0056】したがって、上記ストロークの入力終了か
ら上記文字列認識結果を得るまでの時間を短縮して、リ
アルタイムで枠無し文字列認識を行うことができる。そ
の際に、「枠無し認識」手法によって増加した文字列候補
の数を、1文字認識毎に行われる上記言語処理によって
順次絞り込むことができる。すなわち、この発明によれ
ば、「枠有り認識」手法と同等の処理速度を高認識精度で
実現できるのである。
【0057】また、この発明の文字列認識装置は、上記
言語処理手段による言語処理を単語辞書照合を含むよう
に成し、上記単語辞書に登録単語の先頭文字あるいは先
頭文字列をインデックスとして設け、上記単語辞書照合
に際して、新たな文字認識結果候補と既に得られている
各文字列との組み合わせが上記インデックスに存在する
場合には、次回の単語辞書照合の範囲を当該インデック
スに対応付けられた単語群に限定すれば、単語辞書に登
録された全単語との照合を行う場合に比して、単語照合
の範囲を限定することができる。すなわち、単語照合時
間を低減して、上記ストロークの入力終了から上記文字
列認識結果を得るまでの時間を更に短縮できる。
【0058】また、この発明の文字列認識装置は、上記
インデックとして、上記登録単語の先頭文字である文字
インデックスに加えて、2文字目の文字を構成するパタ
ーンの一部分であるサブパターンを用いれば、上記単語
辞書照合の範囲をさらに限定できる。したがって、上記
ストロークの入力終了から上記文字列認識結果を得るま
での時間を更に短縮して、より効率的に文字列認識処理
を行うことができる。
【図面の簡単な説明】
【図1】 この発明の文字列認識装置におけるブロック
図である。
【図2】 図1に示す文字列認識装置における具体的な
構成例を示す図である。
【図3】 図2におけるCPUの制御の下に実行される
文字列認識処理動作のフローチャートである。
【図4】 図3に示す文字列認識処理動作において実行
される単語辞書照合・保存処理動作のフローチャートで
ある。
【図5】 照合用単語辞書のインデックスの説明図であ
る。
【図6】 図3における文字認識処理によって得られる
文字認識結果候補の例を示す図である。
【図7】 図5とは異なるインデックスの説明図であ
る。
【符号の説明】
1…ストローク入力装置、2…文字切り出し部、
3…文字認識部、4…言語処理部、
5…表示装置、6…照合用文字パターン辞
書、 7,25…照合用単語辞書、8…遷移確率
テーブル、 11…表示一体型タブレット、
12…CPU、 13…RAM、
14…切出候補バッファ、 15…認識結果
バッファ、16…中間辞書バッファ、 18
…ROM、19…プログラム格納部、 20
…ストローク記憶装置、21…ビデオメモリ。

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】 座標入力装置から入力された文字列をオ
    ンラインで認識する文字列認識装置であって、 上記入力された文字の筆跡をストローク単位で座標列デ
    ータとして順次記録するストローク記憶手段と、 上記ストローク記憶手段に1ストロークの座標列データ
    が記録される毎に、新たな1ストロークの座標列データ
    と既に記録されている各ストロークの座標列データとに
    基づいて文字の切り出し位置を推定する文字切り出し手
    段と、 上記切り出し手段によって1文字の切り出し位置が推定
    される毎に、新たな推定切り出し位置で1文字を分割し
    て文字認識処理を行い、認識結果として文字認識結果候
    補を得る文字認識手段と、 上記文字認識手段によって文字認識結果候補が得られる
    毎に、新たな文字認識結果候補と既に得られている各文
    字列との組み合わせに対して言語処理を行って文字列認
    識結果を得る言語処理手段を備えたことを特徴とする文
    字列認識装置。
  2. 【請求項2】 請求項1に記載の文字列認識装置におい
    て、 上記言語処理手段による言語処理は、単語辞書に登録さ
    れた単語との照合を行う単語辞書照合を含み、 上記単語辞書は、登録単語の先頭文字あるいは先頭文字
    列をインデックスとして有し、 上記言語処理手段は、上記単語辞書照合に際して、上記
    新たな文字認識結果候補と既に得られている各文字列と
    の組み合わせが上記インデックスに存在する場合には、
    次回の単語辞書照合の範囲を当該インデックスに対応付
    けられた単語群に限定することを特徴とする文字列認識
    装置。
  3. 【請求項3】 請求項2に記載の文字列認識装置におい
    て、 上記インデックとして、上記登録単語の先頭文字である
    文字インデックスに加えて、2文字目の文字を構成する
    パターンの一部分であるサブパターンを用いることを特
    徴とする文字列認識装置。
JP32096599A 1999-11-11 1999-11-11 文字列認識装置 Pending JP2001143019A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP32096599A JP2001143019A (ja) 1999-11-11 1999-11-11 文字列認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP32096599A JP2001143019A (ja) 1999-11-11 1999-11-11 文字列認識装置

Publications (1)

Publication Number Publication Date
JP2001143019A true JP2001143019A (ja) 2001-05-25

Family

ID=18127285

Family Applications (1)

Application Number Title Priority Date Filing Date
JP32096599A Pending JP2001143019A (ja) 1999-11-11 1999-11-11 文字列認識装置

Country Status (1)

Country Link
JP (1) JP2001143019A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007200005A (ja) * 2006-01-26 2007-08-09 Honda Motor Co Ltd 運転支援装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007200005A (ja) * 2006-01-26 2007-08-09 Honda Motor Co Ltd 運転支援装置
JP4621600B2 (ja) * 2006-01-26 2011-01-26 本田技研工業株式会社 運転支援装置

Similar Documents

Publication Publication Date Title
JP2007317022A (ja) 手書文字処理装置及び手書文字処理方法
JP2009539181A (ja) 手書き文字認識改善用コンバイナ
JPH02266485A (ja) 情報認識装置
JPH0610829B2 (ja) 手書き文字認識方法
JP2001143019A (ja) 文字列認識装置
JP4101345B2 (ja) 文字認識装置
JPH0896081A (ja) 文字認識装置及び文字認識方法
JPH07302306A (ja) 文字入力装置
JPH07320001A (ja) 文字認識装置,認識辞書の参照方法
KR100204618B1 (ko) 문자 또는 도형의 인식 방법 및 시스템
JPH07152754A (ja) 文章作成補助機能を持つ文章作成装置
JPH0744656A (ja) 手書文字認識装置
JPH0689368A (ja) 手書き文字認識のための特定ユーザ用プロトタイプ集合生成方法
JPH0916587A (ja) 文字列予測方法及び文書作成装置
JPS6059487A (ja) 手書文字認識装置
JP3190776B2 (ja) オンライン手書き文字認識装置
JPH0340434B2 (ja)
JPS61131089A (ja) 手書き文字認識装置
JPS6293776A (ja) 情報認識装置
JPH07141468A (ja) 手書入力文字装置における手書文字認識処理方法
JPH03176786A (ja) 手書き文字の認識装置
JPH03189890A (ja) 複合語照合方法
JPH09185677A (ja) ストロークの始点・終点決定方法、認識辞書登録方法及びその装置
JPH0793483A (ja) 手書き文字認識方法および手書き文字認識装置
JPH05135213A (ja) 文書処理装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20041012

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20041124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050120

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20050308