JPH08263487A

JPH08263487A - 文字認識装置

Info

Publication number: JPH08263487A
Application number: JP7066282A
Authority: JP
Inventors: Minako Kuwata; みな子桑田; Hideaki Tanaka; 秀明田中
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 1995-03-24
Filing date: 1995-03-24
Publication date: 1996-10-11

Abstract

(57)【要約】【構成】入力部１にて操作者が入力した入力文字列に
おける各入力文字に対して、認識部２が認識候補文字を
出力し、後処理部４が、有意な文字列の各文字が、該文
字列における位置、および該文字の前後の文字に関する
情報と共に、あらかじめ登録されている後処理用辞書５
を用いることにより、上記認識部２から出力される認識
候補文字と一致する文字であって、且つ有意な文字列に
おける位置が、上記認識候補文字が対応する入力文字の
入力文字列における位置と一致する文字を検索し、検索
結果の文字の前後の文字に関する情報に基づいて有意な
文字列を抽出する。【効果】入力文字列における入力文字の少なくとも１
文字に対して正しい認識候補文字が認識されていれば、
この認識候補文字に基づいて有意な文字列を辞書から抽
出することが可能となる。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、例えば手書き文字等の
自動認識を行い、さらに認識した文字列が適合する有意
な単語を求める後処理を行った結果を認識結果として出
力する文字認識装置に関する。

【０００２】

【従来の技術】従来、ＯＣＲ（Optical Character Read
er）、オンライン文字認識装置および音声認識装置等の
認識装置において、認識部で文字や音声等の自動認識処
理を行った後に、上記認識部から出力される認識候補か
ら有意な単語を導き出すいわゆる後処理を行う認識装置
が知られている。

【０００３】上記した従来の認識装置として、例えば、
特公平１−１９１９４号公報に開示されているように、
入力された各文字を認識する過程で、認識部が各入力文
字に対して複数の順位のついた候補文字を出力し、候補
文字どうしを組合せて候補単語を作成し、この候補単語
とあらかじめ準備されている単語辞書の内容とを比較し
て一致した候補単語を認識結果として出力する構成が知
られている。

【０００４】

【発明が解決しようとする課題】しかしながら、上記従
来の構成では、入力文字列におけるすべての入力文字に
対して、認識部から出力された候補文字の中に正しく認
識された文字が存在することが、有意な単語を認識結果
として導き出すための条件となっており、入力文字列に
おける少なくとも１つの入力文字に対して正しい候補文
字がない場合には、認識結果として有意な単語を導き出
すことは不可能であるという問題点を有している。例え
ば、操作者が「奏でる」という３文字の文字列を手書き
入力し、認識部が、各入力文字に対する候補文字を、以
下の表１に示すように１０文字ずつ出力したとする。

【０００５】

【表１】

【０００６】上記表１に示すように、３文字目の候補文
字に「る」が存在しない場合、上記候補文字の組合せと
して文字列「奏でる」を作成することはできない。従っ
て、有意な単語としての「奏でる」を導き出すことは不
可能である。このため、認識部における入力文字の認識
率が悪い場合には、有効な認識結果を得られる可能性が
小さくなってしまう。

【０００７】また、入力された文字列が長くなるに従っ
て、この文字列から認識される候補文字どうしを組み合
わせて作成される候補単語の数は爆発的に増加する。例
えば、上記表１に示した候補文字を組み合わせて作成す
ることができる候補単語の数は、１０×１０×１０＝１
０００種類である。従って、候補単語が単語辞書に登録
されている単語と一致するか否かを判定するためには単
語辞書を１０００回参照することが必要となり、無駄な
検索に多くの時間が費やされ、認識結果が出力されるま
での操作者の待ち時間が増大するという問題点もさらに
有している。

【０００８】本発明は、上記した各問題点に鑑みなされ
たもので、有効な認識結果をより効率的に出力すること
ができる文字認識装置を実現することを目的としてい
る。

【０００９】

【課題を解決するための手段】上記の課題を解決するた
めに、本発明の請求項１記載の文字認識装置は、操作者
が入力した入力文字列における各入力文字に対して認識
候補文字を出力する認識手段と、有意な文字列の各文字
が、該文字列における位置、および該文字の前後の文字
に関する情報と共に、あらかじめ登録されている辞書
と、上記認識手段から出力される認識候補文字と一致す
る文字であって、且つ有意な文字列における位置が、上
記認識候補文字が対応する入力文字の入力文字列におけ
る位置と一致する文字を、上記辞書において検索し、検
索結果の文字の前後の文字に関する情報に基づいて有意
な文字列を上記辞書から抽出する検索・抽出手段とを備
えていることを特徴としている。

【００１０】請求項２記載の文字認識装置は、請求項１
記載の文字認識装置において、上記認識手段が、入力文
字列における各入力文字に対して認識候補文字を出力す
る際に、各認識候補文字の上記入力文字に対する類似度
を算出し、上記検索・抽出手段が、抽出した有意な文字
列における各文字を認識候補文字と比較し、各文字に一
致した認識候補文字の類似度に基づいて、有意な文字列
の得点を算出すると共に、上記得点に基づいて、抽出し
た有意な文字列から認識結果としての文字列を選択して
出力する出力手段をさらに備えていることを特徴として
いる。

【００１１】請求項３記載の文字認識装置は、請求項１
記載の文字認識装置において、上記辞書が、有意な文字
列の各文字に関して、文字コードと有意な文字列におけ
る該文字の前後の文字に関する情報とを含む文字情報を
あらかじめ登録した辞書本体部と、文字列における文字
位置ごとに、該文字位置に存在する文字の文字コードと
上記文字コードを有する文字に関する上記文字情報とを
関連づける索引とを備えていることを特徴としている。

【００１２】

【作用】請求項１記載の構成によれば、認識手段が入力
文字列の各入力文字から認識した認識候補文字に基づい
て、検索・抽出手段が辞書を検索し、上記認識候補文字
を上記入力文字列と同じ位置に含む有意な文字列を上記
辞書から抽出する。これにより、入力文字列における入
力文字の少なくとも１文字に対して正しい認識候補文字
が認識手段によって出力されていれば、この認識候補文
字に基づいて有意な文字列を辞書から抽出することが可
能となる。この結果、入力文字列に対する認識率が悪い
場合であっても、操作者が入力した文字列が正しく認識
される確率の低下を効果的に抑制することができる。

【００１３】請求項２記載の構成によれば、検索・抽出
手段が有意な文字列を辞書から抽出する際に、この文字
列における各文字と認識候補文字とを比較し、一致した
場合には認識候補文字に与えられた類似度に基づいて抽
出する文字列の得点を算出し、出力手段がこの得点に基
づいて選択した文字列を認識結果として出力する。つま
り、例えば、認識手段が、認識候補文字が入力文字に類
似するほど高い類似度を数値として算出する場合、抽出
された文字列の得点を、この文字列の各文字と一致する
認識候補文字の類似度の和とすれば、出力手段は最も高
い得点を有する文字列を認識結果として選択する。これ
により、操作者が入力した入力文字列に最も類似した文
字列であり、且つ有意な文字列が選択されて、認識結果
として出力されることとなる。この結果、操作者が所望
する認識結果が得られる可能性を向上させることができ
る。また、操作者が入力した文字列からかけ離れた文字
列が認識結果として多数出力されることを防止できるの
で、装置の信頼性を向上させることが可能となると共
に、操作者が多数出力された文字列から適切なものを選
択する手間を省いて認識効率を向上させることができ
る。

【００１４】請求項３記載の構成によれば、辞書におい
て、検索したい文字の文字コードと該文字の文字列にお
ける文字位置とによって索引を検索することにより、該
文字に関して辞書本体部に登録されている文字情報を得
ることができ、この文字情報によって、該文字の前後の
文字に関する情報を得ることができ、有意な文字列を抽
出することが可能となる。この結果、入力文字列におけ
る入力文字の少なくとも１文字に対して正しい認識候補
文字が認識手段によって出力されていれば、この認識候
補文字に基づいて有意な文字列を辞書から抽出すること
が可能となると共に、検索効率を向上させることが可能
となる。

【００１５】

【実施例】本発明の一実施例について図１ないし図６に
基づいて説明すれば、以下の通りである。本実施例にお
ける文字認識装置としてのオンライン手書き文字認識装
置は、図１に示すように、入力部１と、認識部２（認識
手段）と、認識辞書３と、後処理部４（検索・抽出手
段）と、後処理用辞書５（辞書）と、出力部６（出力手
段）とを備えている。

【００１６】上記入力部１は、図示しないタブレットお
よびスタイラス・ペン等のポインティング・デバイスを
含んでおり、操作者がタブレットに対してポインティン
グ・デバイスを用いて手書き入力を行うと、上記タブレ
ットから得られるストローク入力座標、方向、および画
数等の入力情報が上記認識部２へ送られる。

【００１７】認識部２では、入力部１から送られた入力
情報と認識辞書３とのマッチングを行い、上記認識辞書
３から、手書き入力された文字のそれぞれに対して一致
すると思われる認識候補を、一致度が高いものから順に
ｍ個取り出す。これにより、例えば入力文字数をｎ個と
すると、ｎ×ｍの候補マトリクスが作成されて、後処理
部４へ送られる。

【００１８】後処理部４は、認識部２から送られてきた
候補マトリクスと後処理用辞書５とに基づいて、後に詳
述する後処理を行い、その結果を認識結果として出力部
６へ送る。出力部６は、この認識結果を出力する。

【００１９】ここで、上記した後処理の説明に先立ち、
後処理で用いられる後処理用辞書５の構造について、図
２ないし図５を参照しながら説明する。

【００２０】後処理用辞書５は、辞書本体部と検索テー
ブル（索引）とから成っており、項目として上記辞書本
体部にあらかじめ登録されている単語や活用語の語尾等
を、キー文字によって検索することができる。なお、後
に詳述するが、この後処理用辞書５で項目を検索する際
には、項目の先頭文字だけでなく２文字目以降の任意の
文字をキー文字と比較することが可能である。

【００２１】まず、後処理用辞書５の辞書本体部の構造
について説明する。今、辞書本体部に登録されている項
目が、以下の８個であるとすると、東京東京都東北東北地方東西東南東大阪東住吉これらの単語は、図２に示すように、先頭文字である
「東」から広がるツリー構造として、後処理用辞書５の
辞書本体部に登録されている。なお、図２に示すツリー
構造において、ツリーの先端部に表示されている丸印
は、文字列の終端であることを示す終端記号である。

【００２２】図３は、上記ツリー構造を実現する実際の
データ構造を示したものである。同図から明らかなよう
に、各項目に含まれる文字のそれぞれを表す文字情報１
１は、該当文字それぞれの文字コードが記述される文字
コード表示部１５の他に、次の文字への分岐数が記述さ
れる分岐数表示部１２と、次の文字に関する文字情報１
１の位置が記述される正ポインタ表示部１３と、前の文
字に関する文字情報１１の位置が記述される逆ポインタ
表示部１４とを含んでいる。

【００２３】なお、各文字情報１１における正ポインタ
表示部１３は、上記の分岐数表示部１２に記述されてい
る分岐数と同数の位置表示領域から成っており、各位置
表示領域に次の文字に関する文字情報１１の位置がそれ
ぞれ記述されている。例えば、「東京都」の「東」の文
字は、図２に示すツリー構造によると、「京」、
「北」、「西」、「南」、「大」および「住」の６文字
へ分岐するため、「東」の文字に関する文字情報１１に
おける分岐数表示部１２には分岐数として「６」が記述
されると共に、正ポインタ表示部１３は、上記の６文字
に関する文字情報１１の位置がそれぞれ記述された６つ
の位置表示領域を有している。また、例えば、「東京
都」の「都」の文字のように、文字列の最後の文字の文
字情報１１における正ポインタ表示部１３には、文字列
の最後であることを示す"EOD"(End Of Data)が記述され
ている。

【００２４】また、「東京都」の「京」および「都」、
並びに「東北」の「北」に関する文字情報１１には、逆
ポインタ表示部１４に前の文字に関する文字情報１１の
位置が記述されている。例えば、図３において上から２
つ目に示す「京」の文字に関する文字情報１１の逆ポイ
ンタ表示部１４には、前の文字である「東」に関する文
字情報１１の位置である“ａ₁”が記述されている。

【００２５】このように、ある文字に関する文字情報１
１が、正ポインタ表示部１３および逆ポインタ表示部１
４に、次の文字の情報および前の文字の情報をそれぞれ
保持していることにより、先頭文字以外の文字をキー文
字として文字列の検索および抽出を行うことが可能とな
っている。また、項目が上記のようにツリー構造であら
かじめ登録されているので、項目の検索効率を向上させ
ることができ、高速な検索が可能となっている。

【００２６】次に、後処理用辞書５の検索テーブルの構
造について説明する。検索テーブルは、後処理用辞書５
を構成する項目の最大文字数と同じ数、すなわち本実施
例のオンライン手書き文字認識装置が認識可能な最大文
字列の文字数と同じ数だけ設けられる。また、検索テー
ブルは、先頭文字を検索するための先頭文字検索テーブ
ルと、２文字目以降の文字（以下、後続文字と称する）
を検索するための後続文字検索テーブルとの２種類に分
けられる。

【００２７】図４は、上記の先頭文字検索テーブルの構
造を示す説明図であり、同図に示すように、先頭文字検
索テーブル２１には、後処理用辞書５に登録されている
すべての項目の先頭文字の文字コードｃ₁ないしｃ
_nと、上記先頭文字のそれぞれに関する文字情報の前記
辞書本体部中の位置が、項目位置ｐ₁ないしｐ_nとして
記述されている。

【００２８】また、図５は、上記の後続文字検索テーブ
ルの構造を示す説明図である。前述したように、検索テ
ーブルは、文字認識装置で１回の認識動作で認識可能な
文字列の長さに対応した数だけ設けられることが必要で
あり、例えば１回の認識動作で１０文字までの文字列の
認識を行うためには、前記した先頭文字検索テーブル
と、この先頭文字検索テーブルに加えて、図５に示すよ
うな、２文字目の文字に関する２文字目検索テーブル３
１、３文字目の文字に関する３文字目検索テーブル３
２、４文字目の文字に関する４文字目検索テーブル３
３、図示しない５つの５文字目検索テーブルないし９文
字目検索テーブル、および１０文字目の文字に関する１
０文字目検索テーブル３４までの合計９つの後続文字検
索テーブルが必要となる。

【００２９】ここで、図５を参照しながら、各後続文字
検索テーブルの構造について説明する。例えば上記の２
文字目検索テーブル３１には、後処理用辞書５に登録さ
れているすべての項目における２文字目の文字に関する
情報を記述するために、文字コード表示部３１ａ・３１
ａ…と、項目数表示部３１ｂ・３１ｂ…と、項目位置表
示部３１ｃ・３１ｃ…とが設けられている。

【００３０】上記文字コード表示部３１ａには、後処理
用辞書５に登録されている項目における２文字目の文字
の文字コードが記述されている。例えば、「東京都」と
いう項目が後処理用辞書５に登録されている場合、２文
字目の「京」の文字コードが上記文字コード表示部３１
ａに記述されている。また、この場合、上記文字コード
表示部３１ａに続く項目数表示部３１ｂには、後処理用
辞書５に登録されている項目の内で２文字目に「京」が
存在する項目の数が記述されている。さらに、上記項目
数表示部３１ｂに続く項目位置表示部３１ｃには、上記
の２文字目に「京」が存在する項目すべてについて、各
項目の辞書本体部における位置がそれぞれ記述されてい
る。

【００３１】同様にして、３文字目検索テーブル３２に
は、後処理用辞書５に登録されているすべての項目にお
ける３文字目の文字に関する情報が記述され、以下順次
１０文字目の文字に関する１０文字目検索テーブル３４
に至るまで、同様の情報が各後続文字検索テーブルに記
述されている。

【００３２】次に、後処理部４における後処理の流れに
ついて、図６に示すフローチャートを参照しながら以下
に説明する。

【００３３】まず、前記したように、操作者が入力部１
にて手書き入力を行い、ｎ文字の文字列を入力すると、
ストローク入力座標、方向、および画数等の入力情報が
上記認識部２へ送られ、認識部２は、入力部１から送ら
れた入力情報と認識辞書３とのマッチングを行い、上記
認識辞書３から、手書き入力された文字のそれぞれに対
して一致すると思われる認識候補を一致度が高いものか
ら順にｍ個取り出してｎ×ｍの候補マトリクスを作成す
る。後処理部４はこの候補マトリクスを入力する（ステ
ップ１、以下、Ｓ１のように表記する）。

【００３４】以下では、説明を分かりやすくするため
に、操作者が手書き入力により「図書館」という文字列
を入力した場合を例に挙げて、より具体的に説明する。
次に示す表２は、入力された文字列における先頭文字の
「図」、２文字目の「書」、および３文字目の「館」の
それぞれに対して認識部２が認識辞書３から選び出した
上位から１０個の認識候補、すなわち３×１０の候補マ
トリクスと共に、各入力文字と各認識候補との間の距離
値を示したものである。上記の距離値とは、手書き入力
文字と認識辞書３に登録されている文字との一致度に応
じて認識部２が算出するものであり、その値が小さくな
るほど、手書き入力文字が認識辞書３に登録されている
文字に一致する可能性が高いことを示す。

【００３５】

【表２】

【００３６】後処理部４は、上記表２に示す３×１０の
候補マトリクスを認識部２から入力した後、入力した候
補マトリクスから、後処理用辞書５を検索するためのキ
ー文字を１文字取り出す（Ｓ３）。ここでまず、キー文
字として上記表２に示したような先頭文字の認識候補の
第１位である「図」が取り出される。

【００３７】次に、取り出したキー文字に基づいて後処
理用辞書５を検索し、先頭文字が「図」である項目を単
語候補文字列として抽出する（Ｓ４）。この抽出の際
に、後処理部４は前述した検索テーブルを利用する。例
えばキー文字が先頭文字の認識候補であれば、後処理部
４は先頭文字検索テーブル２１を参照し、まず、キー文
字として与えられた文字が先頭文字である項目の、辞書
本体部における位置情報を得る。

【００３８】さらに、この位置情報に基づいて辞書本体
部を検索し、キー文字として与えられた文字に関する文
字情報１１の分岐数表示部１２および正ポインタ表示部
１３の内容に基づいてツリー構造をたどることにより、
上記キー文字を先頭文字に有する項目すべてを単語候補
文字列として辞書本体部から抽出する。なお、この時、
手書き入力された入力文字列が３文字であるので、３文
字の文字列が検索されて抽出される。すなわち、３文字
目の文字の文字情報１１における正ポインタ表示部１３
に、文字列の終端を示す"EOD" が記述されているものが
単語候補文字列として抽出されることとなる。

【００３９】このように、「図」をキー文字として抽出
される単語候補文字列は、例えば以下のとおりとなる。

【００４０】図取り図書館図書券図書室図書費図太い図入り図面化上記Ｓ４が終了すると、Ｓ２へ移行して、候補マトリク
スからすべてのキー文字の取り出しが終了しているか否
かを確認し（Ｓ２）、候補マトリクスにおける先頭文
字、２文字目および３文字目についてそれぞれ第１０位
より上位のすべての認識候補をキー文字として取り出し
て上記の検索・抽出処理が終了するまで、上記のＳ３お
よびＳ４の処理を繰り返す。つまり、表２に示した候補
マトリクスについては、合計２９文字の認識候補をキー
文字として単語候補文字列の検索・抽出処理が行われる
こととなる。

【００４１】ここで、表２に示した先頭文字の認識候補
の上位１０文字をキー文字とした検索・抽出処理を行っ
た結果の例を示すと、上記した８個の単語候補文字列に
さらに加えて、下記のとおりとなる。なお、２文字目お
よび３文字目の認識候補をキー文字とした検索・抽出処
理の結果の例示は省略する。

【００４２】困らす困り事困り者風の子風の神風よけ風ノ神風圧計風雲児風越山風間浦風強く風薫る風見鶏風向き風向計風合い風刺画風邪気風邪声風邪薬風受け風除け風水害風成層風切り風折り風折れ風船玉風速計風俗画風太郎風待ち風通し風定め風土記風土色風土病風入れ風配図風媒花風抜き風物詩風来坊風流人風力計風蓮湖風呂屋風呂桶風呂釜風呂場風呂敷貝の口貝ヶ森貝屋町貝殻骨貝殻虫貝割り貝割れ貝細工貝杓子貝拾い貝焼き貝独楽質請け質入れ質問者質問状質問箱質問票質問表質流れ宜しい宜しき宜しく宜寸川宜野座宜野湾典型的実業家実業界実業団実験機実験後実験式実験室実験台実験着実験中実験的実験品実験用実験例実行力実行例実際上実際的実在性実支出実施権実施中実時間実質性実質的実社会実車率実収入実習生実証的実人生実生活実体鏡実体験実体法実定法実入り実物大実務家実務者実用化実用機実用性実用品実力者実力派また、上記Ｓ３で２文字目の認識候補をキー文字として
取出し、Ｓ４で検索・抽出処理を行う場合、後処理部４
は、まず、後処理用辞書５の２文字目検索テーブル３１
を参照し、文字コード表示部３１ａを検索して上記キー
文字と一致する文字コードを探す。

【００４３】文字コードが一致する文字コード表示部３
１ａが検出されたら、該文字コード表示部３１ａに続く
項目数表示部３１ｂに記述された項目数に基づいて、さ
らにその後に続く項目位置表示部３１ｃから項目位置を
すべて取り出す。これらの項目位置のそれぞれは、辞書
本体部において文字列の２文字目としての上記キー文字
に関する文字情報１１が登録されている位置を示してい
る。

【００４４】次に、この項目位置に基づいて辞書本体部
を参照し、該当する文字情報１１において、正ポインタ
表示部１３を参照することにより３文字目以後の文字を
検索することができ、また、２文字目よりも前の文字す
なわち先頭文字については、逆ポインタ表示部１４を参
照することにより検索することができる。

【００４５】このように、後処理部４が、まず、検索テ
ーブルを参照し、検索テーブルの情報に基づいて、キー
文字よりも前の文字については辞書本体部の文字情報１
１における逆ポインタ表示部１４を参照することにより
検索することができ、キー文字よりも後ろの文字につい
ては上記文字情報１１の正ポインタ表示部１３を参照す
ることにより単語候補文字列を検索・抽出する。

【００４６】次に、上記のように抽出された単語候補文
字列があれば（Ｓ５）、以下のＳ６ないしＳ１０の処理
を行い、抽出された単語候補文字列と、候補マトリクス
とのマッチングを行い、各単語候補文字列の得点を算出
する。まず、得点の初期値として０をセットし、抽出さ
れた単語候補文字列から１つの文字列を取り出す（Ｓ
７）。例えば、上記した単語候補文字列から「図書館」
が取り出されたとして以下に説明を続ける。

【００４７】次に、この文字列から、文字列の終端に達
するまで（Ｓ８）、１文字ずつ文字を取り出す（Ｓ
９）。すなわち、最初に「図」が取り出される。取り出
された文字は、候補マトリクスに存在するか否かが判定
される（Ｓ１０）。ここで、「図」は、先頭文字の認識
候補の第１位として候補マトリクスに存在するため、候
補マトリクスにおける該文字の距離値である４８を１０
００から減じて、差として求められた９５２を得点に加
算する（Ｓ１１）。２文字目の「書」および３文字目の
「館」が順次取り出され、候補マトリクスの２文字目お
よび３文字目にそれぞれ存在するか否かが判定され、存
在する場合には、上記と同様にして１０００から距離値
を減じた結果が得点に加算される。この結果、単語候補
文字列としての「図書館」の得点は、２８３３点とな
る。

【００４８】上記のＳ６ないしＳ１１の処理を、単語候
補文字列として抽出されたすべての文字列について終了
したら（Ｓ６）、Ｓ１２へ移行して、最高得点の文字列
を認識結果として出力する。なお、上記した単語候補文
字列の内、得点の高い単語候補文字列を次の表３に示
す。

【００４９】

【表３】

【００５０】上記表３から明らかなように、候補文字列
「図書館」が最も有力な認識候補として、出力されるこ
ととなる。なお、上記したＳ５において、キー文字によ
り抽出された単語候補文字列が１つもないと判定された
場合には、認識エラーを示すメッセージ等が出力される
（Ｓ１３）。

【００５１】以上で説明したように、本実施例のオンラ
イン手書き文字認識装置は、後処理部４が、認識部２か
ら認識候補としての候補マトリクスを距離値と共に入力
し、各認識候補をキー文字として後処理用辞書５を検索
し、上記キー文字を該当位置に有する文字列を単語候補
文字列として抽出する。さらに、単語候補文字列の各文
字を候補マトリクスの該当位置の文字と比較して、一致
した場合に該文字の距離値を１０００から減じた値を得
点に加算することにより得点を算出する処理を、すべて
の単語候補文字列について行った後に、最も得点の高い
単語候補文字列を認識結果として出力する構成である。

【００５２】これにより、入力文字列における入力文字
の少なくとも１文字に対して正しい認識候補文字が認識
手段によって出力されていれば、この認識候補文字に基
づいて有意な文字列を辞書から抽出することが可能とな
る。この結果、入力文字列に対する認識率が悪い場合で
あっても、操作者が入力した文字列が正しく認識される
確率の低下を効果的に抑制できるという効果を奏する。

【００５３】また、最も得点の高い単語候補文字列を認
識結果とすることにより、操作者が入力した入力文字列
に最も類似した文字列であり、且つ有意な文字列が選択
されて出力されることとなる。この結果、操作者が所望
する認識結果が得られる可能性を向上させることがで
き、また、操作者が入力した文字列からかけ離れた文字
列が認識結果として多数出力されることを防止できるの
で、装置の信頼性を向上させることが可能となると共
に、操作者が多数出力された文字列から適切なものを選
択する手間を省いて認識効率を向上させることができ
る。

【００５４】なお、上記した実施例は本発明を限定する
ものではなく、例えば、上記実施例では、単語候補文字
列の得点の算出において、認識候補文字の距離値を１０
００から減じた値を加算する方法を例にあげて説明した
が、上記距離値以外の値を用いることも可能であり、ま
た、単純に加算する以外の方法を採っても良いといった
ように、発明の範囲内で種々の変更を加えることが可能
である。

【００５５】

【発明の効果】以上のように、本発明の請求項１記載の
文字認識装置は、操作者が入力した入力文字列における
各入力文字に対して認識候補文字を出力する認識手段
と、有意な文字列の各文字が、該文字列における位置、
および該文字の前後の文字に関する情報と共に、あらか
じめ登録されている辞書と、上記認識手段から出力され
る認識候補文字と一致する文字であって、且つ有意な文
字列における位置が、上記認識候補文字が対応する入力
文字の入力文字列における位置と一致する文字を、上記
辞書において検索し、検索結果の文字の前後の文字に関
する情報に基づいて有意な文字列を上記辞書から抽出す
る検索・抽出手段とを備えた構成である。

【００５６】これにより、入力文字列における入力文字
の少なくとも１文字に対して正しい認識候補文字が認識
手段によって出力されていれば、この認識候補文字に基
づいて有意な文字列を辞書から抽出することが可能とな
る。この結果、入力文字列に対する認識率が悪い場合で
あっても、操作者が入力した文字列が正しく認識される
確率の低下を効果的に抑制することができるという効果
を奏する。

【００５７】請求項２記載の文字認識装置は、上記認識
手段が、入力文字列における各入力文字に対して認識候
補文字を出力する際に、各認識候補文字の上記入力文字
に対する類似度を算出し、上記検索・抽出手段が、抽出
した有意な文字列における各文字を認識候補文字と比較
し、各文字に一致した認識候補文字の類似度に基づい
て、有意な文字列の得点を算出すると共に、上記得点に
基づいて、抽出した有意な文字列から認識結果としての
文字列を選択して出力する出力手段をさらに備えた構成
である。

【００５８】これにより、操作者が入力した入力文字列
に最も類似した文字列であり、且つ有意な文字列が選択
されて、認識結果として出力されることとなるため、操
作者が所望する認識結果が得られる可能性を向上させる
ことができる。また、操作者が入力した文字列からかけ
離れた文字列が認識結果として多数出力されることを防
止できるので、装置の信頼性を向上させることが可能と
なると共に、操作者が多数出力された文字列から適切な
ものを選択する手間を省いて認識効率を向上させること
ができるという効果を奏する。

【００５９】請求項３記載の文字認識装置は、上記辞書
が、有意な文字列の各文字に関して、文字コードと有意
な文字列における該文字の前後の文字に関する情報とを
含む文字情報をあらかじめ登録した辞書本体部と、文字
列における文字位置ごとに、該文字位置に存在する文字
の文字コードと上記文字コードを有する文字に関する上
記文字情報とを関連づける索引とを備えた構成である。

【００６０】これにより、入力文字列における入力文字
の少なくとも１文字に対して正しい認識候補文字が認識
手段によって出力されていれば、この認識候補文字に基
づいて有意な文字列を辞書から抽出することが可能とな
ると共に、検索効率を向上させて認識処理の処理速度を
向上させることができるという効果を奏する。

【図面の簡単な説明】

【図１】本発明の一実施例におけるオンライン手書き文
字認識装置の概略構成を示すブロック図である。

【図２】上記オンライン手書き文字認識装置が備える後
処理用辞書に登録されている単語の構造を示す説明図で
ある。

【図３】上記後処理用辞書の辞書本体部におけるデータ
構造を示す説明図である。

【図４】上記後処理用辞書の検索テーブルにおける先頭
文字検索テーブルのデータ構造を示す説明図である。

【図５】上記後処理用辞書の検索テーブルにおける後続
文字検索テーブルのデータ構造を示す説明図である。

【図６】上記オンライン手書き文字認識装置が行う後処
理の流れを示すフローチャートである。

【符号の説明】

２認識部（認識手段）４後処理部（検索・抽出手段）５後処理用辞書（辞書）６出力部（出力手段）

Claims

【特許請求の範囲】

【請求項１】操作者が入力した入力文字列における各入
力文字に対して認識候補文字を出力する認識手段と、有意な文字列の各文字が、該文字列における位置、およ
び該文字の前後の文字に関する情報と共に、あらかじめ
登録されている辞書と、上記認識手段から出力される認識候補文字と一致する文
字であって、且つ有意な文字列における位置が、上記認
識候補文字が対応する入力文字の入力文字列における位
置と一致する文字を、上記辞書において検索し、検索結
果の文字の前後の文字に関する情報に基づいて有意な文
字列を上記辞書から抽出する検索・抽出手段とを備えて
いることを特徴とする文字認識装置。
【請求項２】上記認識手段が、入力文字列における各入
力文字に対して認識候補文字を出力する際に、各認識候
補文字の上記入力文字に対する類似度を算出し、上記検索・抽出手段が、抽出した有意な文字列における
各文字を認識候補文字と比較し、各文字に一致した認識
候補文字の類似度に基づいて、有意な文字列の得点を算
出すると共に、上記得点に基づいて、抽出した有意な文字列から認識結
果としての文字列を選択して出力する出力手段をさらに
備えていることを特徴とする請求項１記載の文字認識装
置。
【請求項３】上記辞書が、有意な文字列の各文字に関し
て、文字コードと有意な文字列における該文字の前後の
文字に関する情報とを含む文字情報をあらかじめ登録し
た辞書本体部と、文字列における文字位置ごとに、該文
字位置に存在する文字の文字コードと上記文字コードを
有する文字に関する上記文字情報とを関連づける索引と
を備えていることを特徴とする請求項１記載の文字認識
装置。