JPH08263487A - 文字認識装置 - Google Patents

文字認識装置

Info

Publication number
JPH08263487A
JPH08263487A JP7066282A JP6628295A JPH08263487A JP H08263487 A JPH08263487 A JP H08263487A JP 7066282 A JP7066282 A JP 7066282A JP 6628295 A JP6628295 A JP 6628295A JP H08263487 A JPH08263487 A JP H08263487A
Authority
JP
Japan
Prior art keywords
character
recognition
character string
input
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP7066282A
Other languages
English (en)
Inventor
Minako Kuwata
みな子 桑田
Hideaki Tanaka
秀明 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sharp Corp
Original Assignee
Sharp Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sharp Corp filed Critical Sharp Corp
Priority to JP7066282A priority Critical patent/JPH08263487A/ja
Publication of JPH08263487A publication Critical patent/JPH08263487A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Document Processing Apparatus (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Character Discrimination (AREA)

Abstract

(57)【要約】 【構成】 入力部1にて操作者が入力した入力文字列に
おける各入力文字に対して、認識部2が認識候補文字を
出力し、後処理部4が、有意な文字列の各文字が、該文
字列における位置、および該文字の前後の文字に関する
情報と共に、あらかじめ登録されている後処理用辞書5
を用いることにより、上記認識部2から出力される認識
候補文字と一致する文字であって、且つ有意な文字列に
おける位置が、上記認識候補文字が対応する入力文字の
入力文字列における位置と一致する文字を検索し、検索
結果の文字の前後の文字に関する情報に基づいて有意な
文字列を抽出する。 【効果】 入力文字列における入力文字の少なくとも1
文字に対して正しい認識候補文字が認識されていれば、
この認識候補文字に基づいて有意な文字列を辞書から抽
出することが可能となる。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、例えば手書き文字等の
自動認識を行い、さらに認識した文字列が適合する有意
な単語を求める後処理を行った結果を認識結果として出
力する文字認識装置に関する。
【0002】
【従来の技術】従来、OCR(Optical Character Read
er)、オンライン文字認識装置および音声認識装置等の
認識装置において、認識部で文字や音声等の自動認識処
理を行った後に、上記認識部から出力される認識候補か
ら有意な単語を導き出すいわゆる後処理を行う認識装置
が知られている。
【0003】上記した従来の認識装置として、例えば、
特公平1−19194号公報に開示されているように、
入力された各文字を認識する過程で、認識部が各入力文
字に対して複数の順位のついた候補文字を出力し、候補
文字どうしを組合せて候補単語を作成し、この候補単語
とあらかじめ準備されている単語辞書の内容とを比較し
て一致した候補単語を認識結果として出力する構成が知
られている。
【0004】
【発明が解決しようとする課題】しかしながら、上記従
来の構成では、入力文字列におけるすべての入力文字に
対して、認識部から出力された候補文字の中に正しく認
識された文字が存在することが、有意な単語を認識結果
として導き出すための条件となっており、入力文字列に
おける少なくとも1つの入力文字に対して正しい候補文
字がない場合には、認識結果として有意な単語を導き出
すことは不可能であるという問題点を有している。例え
ば、操作者が「奏でる」という3文字の文字列を手書き
入力し、認識部が、各入力文字に対する候補文字を、以
下の表1に示すように10文字ずつ出力したとする。
【0005】
【表1】
【0006】上記表1に示すように、3文字目の候補文
字に「る」が存在しない場合、上記候補文字の組合せと
して文字列「奏でる」を作成することはできない。従っ
て、有意な単語としての「奏でる」を導き出すことは不
可能である。このため、認識部における入力文字の認識
率が悪い場合には、有効な認識結果を得られる可能性が
小さくなってしまう。
【0007】また、入力された文字列が長くなるに従っ
て、この文字列から認識される候補文字どうしを組み合
わせて作成される候補単語の数は爆発的に増加する。例
えば、上記表1に示した候補文字を組み合わせて作成す
ることができる候補単語の数は、10×10×10=1
000種類である。従って、候補単語が単語辞書に登録
されている単語と一致するか否かを判定するためには単
語辞書を1000回参照することが必要となり、無駄な
検索に多くの時間が費やされ、認識結果が出力されるま
での操作者の待ち時間が増大するという問題点もさらに
有している。
【0008】本発明は、上記した各問題点に鑑みなされ
たもので、有効な認識結果をより効率的に出力すること
ができる文字認識装置を実現することを目的としてい
る。
【0009】
【課題を解決するための手段】上記の課題を解決するた
めに、本発明の請求項1記載の文字認識装置は、操作者
が入力した入力文字列における各入力文字に対して認識
候補文字を出力する認識手段と、有意な文字列の各文字
が、該文字列における位置、および該文字の前後の文字
に関する情報と共に、あらかじめ登録されている辞書
と、上記認識手段から出力される認識候補文字と一致す
る文字であって、且つ有意な文字列における位置が、上
記認識候補文字が対応する入力文字の入力文字列におけ
る位置と一致する文字を、上記辞書において検索し、検
索結果の文字の前後の文字に関する情報に基づいて有意
な文字列を上記辞書から抽出する検索・抽出手段とを備
えていることを特徴としている。
【0010】請求項2記載の文字認識装置は、請求項1
記載の文字認識装置において、上記認識手段が、入力文
字列における各入力文字に対して認識候補文字を出力す
る際に、各認識候補文字の上記入力文字に対する類似度
を算出し、上記検索・抽出手段が、抽出した有意な文字
列における各文字を認識候補文字と比較し、各文字に一
致した認識候補文字の類似度に基づいて、有意な文字列
の得点を算出すると共に、上記得点に基づいて、抽出し
た有意な文字列から認識結果としての文字列を選択して
出力する出力手段をさらに備えていることを特徴として
いる。
【0011】請求項3記載の文字認識装置は、請求項1
記載の文字認識装置において、上記辞書が、有意な文字
列の各文字に関して、文字コードと有意な文字列におけ
る該文字の前後の文字に関する情報とを含む文字情報を
あらかじめ登録した辞書本体部と、文字列における文字
位置ごとに、該文字位置に存在する文字の文字コードと
上記文字コードを有する文字に関する上記文字情報とを
関連づける索引とを備えていることを特徴としている。
【0012】
【作用】請求項1記載の構成によれば、認識手段が入力
文字列の各入力文字から認識した認識候補文字に基づい
て、検索・抽出手段が辞書を検索し、上記認識候補文字
を上記入力文字列と同じ位置に含む有意な文字列を上記
辞書から抽出する。これにより、入力文字列における入
力文字の少なくとも1文字に対して正しい認識候補文字
が認識手段によって出力されていれば、この認識候補文
字に基づいて有意な文字列を辞書から抽出することが可
能となる。この結果、入力文字列に対する認識率が悪い
場合であっても、操作者が入力した文字列が正しく認識
される確率の低下を効果的に抑制することができる。
【0013】請求項2記載の構成によれば、検索・抽出
手段が有意な文字列を辞書から抽出する際に、この文字
列における各文字と認識候補文字とを比較し、一致した
場合には認識候補文字に与えられた類似度に基づいて抽
出する文字列の得点を算出し、出力手段がこの得点に基
づいて選択した文字列を認識結果として出力する。つま
り、例えば、認識手段が、認識候補文字が入力文字に類
似するほど高い類似度を数値として算出する場合、抽出
された文字列の得点を、この文字列の各文字と一致する
認識候補文字の類似度の和とすれば、出力手段は最も高
い得点を有する文字列を認識結果として選択する。これ
により、操作者が入力した入力文字列に最も類似した文
字列であり、且つ有意な文字列が選択されて、認識結果
として出力されることとなる。この結果、操作者が所望
する認識結果が得られる可能性を向上させることができ
る。また、操作者が入力した文字列からかけ離れた文字
列が認識結果として多数出力されることを防止できるの
で、装置の信頼性を向上させることが可能となると共
に、操作者が多数出力された文字列から適切なものを選
択する手間を省いて認識効率を向上させることができ
る。
【0014】請求項3記載の構成によれば、辞書におい
て、検索したい文字の文字コードと該文字の文字列にお
ける文字位置とによって索引を検索することにより、該
文字に関して辞書本体部に登録されている文字情報を得
ることができ、この文字情報によって、該文字の前後の
文字に関する情報を得ることができ、有意な文字列を抽
出することが可能となる。この結果、入力文字列におけ
る入力文字の少なくとも1文字に対して正しい認識候補
文字が認識手段によって出力されていれば、この認識候
補文字に基づいて有意な文字列を辞書から抽出すること
が可能となると共に、検索効率を向上させることが可能
となる。
【0015】
【実施例】本発明の一実施例について図1ないし図6に
基づいて説明すれば、以下の通りである。本実施例にお
ける文字認識装置としてのオンライン手書き文字認識装
置は、図1に示すように、入力部1と、認識部2(認識
手段)と、認識辞書3と、後処理部4(検索・抽出手
段)と、後処理用辞書5(辞書)と、出力部6(出力手
段)とを備えている。
【0016】上記入力部1は、図示しないタブレットお
よびスタイラス・ペン等のポインティング・デバイスを
含んでおり、操作者がタブレットに対してポインティン
グ・デバイスを用いて手書き入力を行うと、上記タブレ
ットから得られるストローク入力座標、方向、および画
数等の入力情報が上記認識部2へ送られる。
【0017】認識部2では、入力部1から送られた入力
情報と認識辞書3とのマッチングを行い、上記認識辞書
3から、手書き入力された文字のそれぞれに対して一致
すると思われる認識候補を、一致度が高いものから順に
m個取り出す。これにより、例えば入力文字数をn個と
すると、n×mの候補マトリクスが作成されて、後処理
部4へ送られる。
【0018】後処理部4は、認識部2から送られてきた
候補マトリクスと後処理用辞書5とに基づいて、後に詳
述する後処理を行い、その結果を認識結果として出力部
6へ送る。出力部6は、この認識結果を出力する。
【0019】ここで、上記した後処理の説明に先立ち、
後処理で用いられる後処理用辞書5の構造について、図
2ないし図5を参照しながら説明する。
【0020】後処理用辞書5は、辞書本体部と検索テー
ブル(索引)とから成っており、項目として上記辞書本
体部にあらかじめ登録されている単語や活用語の語尾等
を、キー文字によって検索することができる。なお、後
に詳述するが、この後処理用辞書5で項目を検索する際
には、項目の先頭文字だけでなく2文字目以降の任意の
文字をキー文字と比較することが可能である。
【0021】まず、後処理用辞書5の辞書本体部の構造
について説明する。今、辞書本体部に登録されている項
目が、以下の8個であるとすると、 東京 東京都 東北 東北地方 東西 東南 東大阪 東住吉 これらの単語は、図2に示すように、先頭文字である
「東」から広がるツリー構造として、後処理用辞書5の
辞書本体部に登録されている。なお、図2に示すツリー
構造において、ツリーの先端部に表示されている丸印
は、文字列の終端であることを示す終端記号である。
【0022】図3は、上記ツリー構造を実現する実際の
データ構造を示したものである。同図から明らかなよう
に、各項目に含まれる文字のそれぞれを表す文字情報1
1は、該当文字それぞれの文字コードが記述される文字
コード表示部15の他に、次の文字への分岐数が記述さ
れる分岐数表示部12と、次の文字に関する文字情報1
1の位置が記述される正ポインタ表示部13と、前の文
字に関する文字情報11の位置が記述される逆ポインタ
表示部14とを含んでいる。
【0023】なお、各文字情報11における正ポインタ
表示部13は、上記の分岐数表示部12に記述されてい
る分岐数と同数の位置表示領域から成っており、各位置
表示領域に次の文字に関する文字情報11の位置がそれ
ぞれ記述されている。例えば、「東京都」の「東」の文
字は、図2に示すツリー構造によると、「京」、
「北」、「西」、「南」、「大」および「住」の6文字
へ分岐するため、「東」の文字に関する文字情報11に
おける分岐数表示部12には分岐数として「6」が記述
されると共に、正ポインタ表示部13は、上記の6文字
に関する文字情報11の位置がそれぞれ記述された6つ
の位置表示領域を有している。また、例えば、「東京
都」の「都」の文字のように、文字列の最後の文字の文
字情報11における正ポインタ表示部13には、文字列
の最後であることを示す"EOD"(End Of Data)が記述され
ている。
【0024】また、「東京都」の「京」および「都」、
並びに「東北」の「北」に関する文字情報11には、逆
ポインタ表示部14に前の文字に関する文字情報11の
位置が記述されている。例えば、図3において上から2
つ目に示す「京」の文字に関する文字情報11の逆ポイ
ンタ表示部14には、前の文字である「東」に関する文
字情報11の位置である“a1 ”が記述されている。
【0025】このように、ある文字に関する文字情報1
1が、正ポインタ表示部13および逆ポインタ表示部1
4に、次の文字の情報および前の文字の情報をそれぞれ
保持していることにより、先頭文字以外の文字をキー文
字として文字列の検索および抽出を行うことが可能とな
っている。また、項目が上記のようにツリー構造であら
かじめ登録されているので、項目の検索効率を向上させ
ることができ、高速な検索が可能となっている。
【0026】次に、後処理用辞書5の検索テーブルの構
造について説明する。検索テーブルは、後処理用辞書5
を構成する項目の最大文字数と同じ数、すなわち本実施
例のオンライン手書き文字認識装置が認識可能な最大文
字列の文字数と同じ数だけ設けられる。また、検索テー
ブルは、先頭文字を検索するための先頭文字検索テーブ
ルと、2文字目以降の文字(以下、後続文字と称する)
を検索するための後続文字検索テーブルとの2種類に分
けられる。
【0027】図4は、上記の先頭文字検索テーブルの構
造を示す説明図であり、同図に示すように、先頭文字検
索テーブル21には、後処理用辞書5に登録されている
すべての項目の先頭文字の文字コードc1 ないしc
n と、上記先頭文字のそれぞれに関する文字情報の前記
辞書本体部中の位置が、項目位置p1 ないしpn として
記述されている。
【0028】また、図5は、上記の後続文字検索テーブ
ルの構造を示す説明図である。前述したように、検索テ
ーブルは、文字認識装置で1回の認識動作で認識可能な
文字列の長さに対応した数だけ設けられることが必要で
あり、例えば1回の認識動作で10文字までの文字列の
認識を行うためには、前記した先頭文字検索テーブル
と、この先頭文字検索テーブルに加えて、図5に示すよ
うな、2文字目の文字に関する2文字目検索テーブル3
1、3文字目の文字に関する3文字目検索テーブル3
2、4文字目の文字に関する4文字目検索テーブル3
3、図示しない5つの5文字目検索テーブルないし9文
字目検索テーブル、および10文字目の文字に関する1
0文字目検索テーブル34までの合計9つの後続文字検
索テーブルが必要となる。
【0029】ここで、図5を参照しながら、各後続文字
検索テーブルの構造について説明する。例えば上記の2
文字目検索テーブル31には、後処理用辞書5に登録さ
れているすべての項目における2文字目の文字に関する
情報を記述するために、文字コード表示部31a・31
a…と、項目数表示部31b・31b…と、項目位置表
示部31c・31c…とが設けられている。
【0030】上記文字コード表示部31aには、後処理
用辞書5に登録されている項目における2文字目の文字
の文字コードが記述されている。例えば、「東京都」と
いう項目が後処理用辞書5に登録されている場合、2文
字目の「京」の文字コードが上記文字コード表示部31
aに記述されている。また、この場合、上記文字コード
表示部31aに続く項目数表示部31bには、後処理用
辞書5に登録されている項目の内で2文字目に「京」が
存在する項目の数が記述されている。さらに、上記項目
数表示部31bに続く項目位置表示部31cには、上記
の2文字目に「京」が存在する項目すべてについて、各
項目の辞書本体部における位置がそれぞれ記述されてい
る。
【0031】同様にして、3文字目検索テーブル32に
は、後処理用辞書5に登録されているすべての項目にお
ける3文字目の文字に関する情報が記述され、以下順次
10文字目の文字に関する10文字目検索テーブル34
に至るまで、同様の情報が各後続文字検索テーブルに記
述されている。
【0032】次に、後処理部4における後処理の流れに
ついて、図6に示すフローチャートを参照しながら以下
に説明する。
【0033】まず、前記したように、操作者が入力部1
にて手書き入力を行い、n文字の文字列を入力すると、
ストローク入力座標、方向、および画数等の入力情報が
上記認識部2へ送られ、認識部2は、入力部1から送ら
れた入力情報と認識辞書3とのマッチングを行い、上記
認識辞書3から、手書き入力された文字のそれぞれに対
して一致すると思われる認識候補を一致度が高いものか
ら順にm個取り出してn×mの候補マトリクスを作成す
る。後処理部4はこの候補マトリクスを入力する(ステ
ップ1、以下、S1のように表記する)。
【0034】以下では、説明を分かりやすくするため
に、操作者が手書き入力により「図書館」という文字列
を入力した場合を例に挙げて、より具体的に説明する。
次に示す表2は、入力された文字列における先頭文字の
「図」、2文字目の「書」、および3文字目の「館」の
それぞれに対して認識部2が認識辞書3から選び出した
上位から10個の認識候補、すなわち3×10の候補マ
トリクスと共に、各入力文字と各認識候補との間の距離
値を示したものである。上記の距離値とは、手書き入力
文字と認識辞書3に登録されている文字との一致度に応
じて認識部2が算出するものであり、その値が小さくな
るほど、手書き入力文字が認識辞書3に登録されている
文字に一致する可能性が高いことを示す。
【0035】
【表2】
【0036】後処理部4は、上記表2に示す3×10の
候補マトリクスを認識部2から入力した後、入力した候
補マトリクスから、後処理用辞書5を検索するためのキ
ー文字を1文字取り出す(S3)。ここでまず、キー文
字として上記表2に示したような先頭文字の認識候補の
第1位である「図」が取り出される。
【0037】次に、取り出したキー文字に基づいて後処
理用辞書5を検索し、先頭文字が「図」である項目を単
語候補文字列として抽出する(S4)。この抽出の際
に、後処理部4は前述した検索テーブルを利用する。例
えばキー文字が先頭文字の認識候補であれば、後処理部
4は先頭文字検索テーブル21を参照し、まず、キー文
字として与えられた文字が先頭文字である項目の、辞書
本体部における位置情報を得る。
【0038】さらに、この位置情報に基づいて辞書本体
部を検索し、キー文字として与えられた文字に関する文
字情報11の分岐数表示部12および正ポインタ表示部
13の内容に基づいてツリー構造をたどることにより、
上記キー文字を先頭文字に有する項目すべてを単語候補
文字列として辞書本体部から抽出する。なお、この時、
手書き入力された入力文字列が3文字であるので、3文
字の文字列が検索されて抽出される。すなわち、3文字
目の文字の文字情報11における正ポインタ表示部13
に、文字列の終端を示す"EOD" が記述されているものが
単語候補文字列として抽出されることとなる。
【0039】このように、「図」をキー文字として抽出
される単語候補文字列は、例えば以下のとおりとなる。
【0040】 図取り 図書館 図書券 図書室 図書費 図太い 図入り 図面化 上記S4が終了すると、S2へ移行して、候補マトリク
スからすべてのキー文字の取り出しが終了しているか否
かを確認し(S2)、候補マトリクスにおける先頭文
字、2文字目および3文字目についてそれぞれ第10位
より上位のすべての認識候補をキー文字として取り出し
て上記の検索・抽出処理が終了するまで、上記のS3お
よびS4の処理を繰り返す。つまり、表2に示した候補
マトリクスについては、合計29文字の認識候補をキー
文字として単語候補文字列の検索・抽出処理が行われる
こととなる。
【0041】ここで、表2に示した先頭文字の認識候補
の上位10文字をキー文字とした検索・抽出処理を行っ
た結果の例を示すと、上記した8個の単語候補文字列に
さらに加えて、下記のとおりとなる。なお、2文字目お
よび3文字目の認識候補をキー文字とした検索・抽出処
理の結果の例示は省略する。
【0042】 困らす 困り事 困り者 風の子 風の神 風よけ 風ノ神 風圧計 風雲児 風越山 風間浦 風強く 風薫る 風見鶏 風向き 風向計 風合い 風刺画 風邪気 風邪声 風邪薬 風受け 風除け 風水害 風成層 風切り 風折り 風折れ 風船玉 風速計 風俗画 風太郎 風待ち 風通し 風定め 風土記 風土色 風土病 風入れ 風配図 風媒花 風抜き 風物詩 風来坊 風流人 風力計 風蓮湖 風呂屋 風呂桶 風呂釜 風呂場 風呂敷 貝の口 貝ヶ森 貝屋町 貝殻骨 貝殻虫 貝割り 貝割れ 貝細工 貝杓子 貝拾い 貝焼き 貝独楽 質請け 質入れ 質問者 質問状 質問箱 質問票 質問表 質流れ 宜しい 宜しき 宜しく 宜寸川 宜野座 宜野湾 典型的 実業家 実業界 実業団 実験機 実験後 実験式 実験室 実験台 実験着 実験中 実験的 実験品 実験用 実験例 実行力 実行例 実際上 実際的 実在性 実支出 実施権 実施中 実時間 実質性 実質的 実社会 実車率 実収入 実習生 実証的 実人生 実生活 実体鏡 実体験 実体法 実定法 実入り 実物大 実務家 実務者 実用化 実用機 実用性 実用品 実力者 実力派 また、上記S3で2文字目の認識候補をキー文字として
取出し、S4で検索・抽出処理を行う場合、後処理部4
は、まず、後処理用辞書5の2文字目検索テーブル31
を参照し、文字コード表示部31aを検索して上記キー
文字と一致する文字コードを探す。
【0043】文字コードが一致する文字コード表示部3
1aが検出されたら、該文字コード表示部31aに続く
項目数表示部31bに記述された項目数に基づいて、さ
らにその後に続く項目位置表示部31cから項目位置を
すべて取り出す。これらの項目位置のそれぞれは、辞書
本体部において文字列の2文字目としての上記キー文字
に関する文字情報11が登録されている位置を示してい
る。
【0044】次に、この項目位置に基づいて辞書本体部
を参照し、該当する文字情報11において、正ポインタ
表示部13を参照することにより3文字目以後の文字を
検索することができ、また、2文字目よりも前の文字す
なわち先頭文字については、逆ポインタ表示部14を参
照することにより検索することができる。
【0045】このように、後処理部4が、まず、検索テ
ーブルを参照し、検索テーブルの情報に基づいて、キー
文字よりも前の文字については辞書本体部の文字情報1
1における逆ポインタ表示部14を参照することにより
検索することができ、キー文字よりも後ろの文字につい
ては上記文字情報11の正ポインタ表示部13を参照す
ることにより単語候補文字列を検索・抽出する。
【0046】次に、上記のように抽出された単語候補文
字列があれば(S5)、以下のS6ないしS10の処理
を行い、抽出された単語候補文字列と、候補マトリクス
とのマッチングを行い、各単語候補文字列の得点を算出
する。まず、得点の初期値として0をセットし、抽出さ
れた単語候補文字列から1つの文字列を取り出す(S
7)。例えば、上記した単語候補文字列から「図書館」
が取り出されたとして以下に説明を続ける。
【0047】次に、この文字列から、文字列の終端に達
するまで(S8)、1文字ずつ文字を取り出す(S
9)。すなわち、最初に「図」が取り出される。取り出
された文字は、候補マトリクスに存在するか否かが判定
される(S10)。ここで、「図」は、先頭文字の認識
候補の第1位として候補マトリクスに存在するため、候
補マトリクスにおける該文字の距離値である48を10
00から減じて、差として求められた952を得点に加
算する(S11)。2文字目の「書」および3文字目の
「館」が順次取り出され、候補マトリクスの2文字目お
よび3文字目にそれぞれ存在するか否かが判定され、存
在する場合には、上記と同様にして1000から距離値
を減じた結果が得点に加算される。この結果、単語候補
文字列としての「図書館」の得点は、2833点とな
る。
【0048】上記のS6ないしS11の処理を、単語候
補文字列として抽出されたすべての文字列について終了
したら(S6)、S12へ移行して、最高得点の文字列
を認識結果として出力する。なお、上記した単語候補文
字列の内、得点の高い単語候補文字列を次の表3に示
す。
【0049】
【表3】
【0050】上記表3から明らかなように、候補文字列
「図書館」が最も有力な認識候補として、出力されるこ
ととなる。なお、上記したS5において、キー文字によ
り抽出された単語候補文字列が1つもないと判定された
場合には、認識エラーを示すメッセージ等が出力される
(S13)。
【0051】以上で説明したように、本実施例のオンラ
イン手書き文字認識装置は、後処理部4が、認識部2か
ら認識候補としての候補マトリクスを距離値と共に入力
し、各認識候補をキー文字として後処理用辞書5を検索
し、上記キー文字を該当位置に有する文字列を単語候補
文字列として抽出する。さらに、単語候補文字列の各文
字を候補マトリクスの該当位置の文字と比較して、一致
した場合に該文字の距離値を1000から減じた値を得
点に加算することにより得点を算出する処理を、すべて
の単語候補文字列について行った後に、最も得点の高い
単語候補文字列を認識結果として出力する構成である。
【0052】これにより、入力文字列における入力文字
の少なくとも1文字に対して正しい認識候補文字が認識
手段によって出力されていれば、この認識候補文字に基
づいて有意な文字列を辞書から抽出することが可能とな
る。この結果、入力文字列に対する認識率が悪い場合で
あっても、操作者が入力した文字列が正しく認識される
確率の低下を効果的に抑制できるという効果を奏する。
【0053】また、最も得点の高い単語候補文字列を認
識結果とすることにより、操作者が入力した入力文字列
に最も類似した文字列であり、且つ有意な文字列が選択
されて出力されることとなる。この結果、操作者が所望
する認識結果が得られる可能性を向上させることがで
き、また、操作者が入力した文字列からかけ離れた文字
列が認識結果として多数出力されることを防止できるの
で、装置の信頼性を向上させることが可能となると共
に、操作者が多数出力された文字列から適切なものを選
択する手間を省いて認識効率を向上させることができ
る。
【0054】なお、上記した実施例は本発明を限定する
ものではなく、例えば、上記実施例では、単語候補文字
列の得点の算出において、認識候補文字の距離値を10
00から減じた値を加算する方法を例にあげて説明した
が、上記距離値以外の値を用いることも可能であり、ま
た、単純に加算する以外の方法を採っても良いといった
ように、発明の範囲内で種々の変更を加えることが可能
である。
【0055】
【発明の効果】以上のように、本発明の請求項1記載の
文字認識装置は、操作者が入力した入力文字列における
各入力文字に対して認識候補文字を出力する認識手段
と、有意な文字列の各文字が、該文字列における位置、
および該文字の前後の文字に関する情報と共に、あらか
じめ登録されている辞書と、上記認識手段から出力され
る認識候補文字と一致する文字であって、且つ有意な文
字列における位置が、上記認識候補文字が対応する入力
文字の入力文字列における位置と一致する文字を、上記
辞書において検索し、検索結果の文字の前後の文字に関
する情報に基づいて有意な文字列を上記辞書から抽出す
る検索・抽出手段とを備えた構成である。
【0056】これにより、入力文字列における入力文字
の少なくとも1文字に対して正しい認識候補文字が認識
手段によって出力されていれば、この認識候補文字に基
づいて有意な文字列を辞書から抽出することが可能とな
る。この結果、入力文字列に対する認識率が悪い場合で
あっても、操作者が入力した文字列が正しく認識される
確率の低下を効果的に抑制することができるという効果
を奏する。
【0057】請求項2記載の文字認識装置は、上記認識
手段が、入力文字列における各入力文字に対して認識候
補文字を出力する際に、各認識候補文字の上記入力文字
に対する類似度を算出し、上記検索・抽出手段が、抽出
した有意な文字列における各文字を認識候補文字と比較
し、各文字に一致した認識候補文字の類似度に基づい
て、有意な文字列の得点を算出すると共に、上記得点に
基づいて、抽出した有意な文字列から認識結果としての
文字列を選択して出力する出力手段をさらに備えた構成
である。
【0058】これにより、操作者が入力した入力文字列
に最も類似した文字列であり、且つ有意な文字列が選択
されて、認識結果として出力されることとなるため、操
作者が所望する認識結果が得られる可能性を向上させる
ことができる。また、操作者が入力した文字列からかけ
離れた文字列が認識結果として多数出力されることを防
止できるので、装置の信頼性を向上させることが可能と
なると共に、操作者が多数出力された文字列から適切な
ものを選択する手間を省いて認識効率を向上させること
ができるという効果を奏する。
【0059】請求項3記載の文字認識装置は、上記辞書
が、有意な文字列の各文字に関して、文字コードと有意
な文字列における該文字の前後の文字に関する情報とを
含む文字情報をあらかじめ登録した辞書本体部と、文字
列における文字位置ごとに、該文字位置に存在する文字
の文字コードと上記文字コードを有する文字に関する上
記文字情報とを関連づける索引とを備えた構成である。
【0060】これにより、入力文字列における入力文字
の少なくとも1文字に対して正しい認識候補文字が認識
手段によって出力されていれば、この認識候補文字に基
づいて有意な文字列を辞書から抽出することが可能とな
ると共に、検索効率を向上させて認識処理の処理速度を
向上させることができるという効果を奏する。
【図面の簡単な説明】
【図1】本発明の一実施例におけるオンライン手書き文
字認識装置の概略構成を示すブロック図である。
【図2】上記オンライン手書き文字認識装置が備える後
処理用辞書に登録されている単語の構造を示す説明図で
ある。
【図3】上記後処理用辞書の辞書本体部におけるデータ
構造を示す説明図である。
【図4】上記後処理用辞書の検索テーブルにおける先頭
文字検索テーブルのデータ構造を示す説明図である。
【図5】上記後処理用辞書の検索テーブルにおける後続
文字検索テーブルのデータ構造を示す説明図である。
【図6】上記オンライン手書き文字認識装置が行う後処
理の流れを示すフローチャートである。
【符号の説明】
2 認識部(認識手段) 4 後処理部(検索・抽出手段) 5 後処理用辞書(辞書) 6 出力部(出力手段)

Claims (3)

    【特許請求の範囲】
  1. 【請求項1】操作者が入力した入力文字列における各入
    力文字に対して認識候補文字を出力する認識手段と、 有意な文字列の各文字が、該文字列における位置、およ
    び該文字の前後の文字に関する情報と共に、あらかじめ
    登録されている辞書と、 上記認識手段から出力される認識候補文字と一致する文
    字であって、且つ有意な文字列における位置が、上記認
    識候補文字が対応する入力文字の入力文字列における位
    置と一致する文字を、上記辞書において検索し、検索結
    果の文字の前後の文字に関する情報に基づいて有意な文
    字列を上記辞書から抽出する検索・抽出手段とを備えて
    いることを特徴とする文字認識装置。
  2. 【請求項2】上記認識手段が、入力文字列における各入
    力文字に対して認識候補文字を出力する際に、各認識候
    補文字の上記入力文字に対する類似度を算出し、 上記検索・抽出手段が、抽出した有意な文字列における
    各文字を認識候補文字と比較し、各文字に一致した認識
    候補文字の類似度に基づいて、有意な文字列の得点を算
    出すると共に、 上記得点に基づいて、抽出した有意な文字列から認識結
    果としての文字列を選択して出力する出力手段をさらに
    備えていることを特徴とする請求項1記載の文字認識装
    置。
  3. 【請求項3】上記辞書が、有意な文字列の各文字に関し
    て、文字コードと有意な文字列における該文字の前後の
    文字に関する情報とを含む文字情報をあらかじめ登録し
    た辞書本体部と、文字列における文字位置ごとに、該文
    字位置に存在する文字の文字コードと上記文字コードを
    有する文字に関する上記文字情報とを関連づける索引と
    を備えていることを特徴とする請求項1記載の文字認識
    装置。
JP7066282A 1995-03-24 1995-03-24 文字認識装置 Pending JPH08263487A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP7066282A JPH08263487A (ja) 1995-03-24 1995-03-24 文字認識装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP7066282A JPH08263487A (ja) 1995-03-24 1995-03-24 文字認識装置

Publications (1)

Publication Number Publication Date
JPH08263487A true JPH08263487A (ja) 1996-10-11

Family

ID=13311328

Family Applications (1)

Application Number Title Priority Date Filing Date
JP7066282A Pending JPH08263487A (ja) 1995-03-24 1995-03-24 文字認識装置

Country Status (1)

Country Link
JP (1) JPH08263487A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052651A (zh) * 2020-08-14 2020-12-08 深圳市欢太科技有限公司 诗词生成方法、装置、电子设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112052651A (zh) * 2020-08-14 2020-12-08 深圳市欢太科技有限公司 诗词生成方法、装置、电子设备及存储介质
CN112052651B (zh) * 2020-08-14 2024-01-23 深圳市欢太科技有限公司 诗词生成方法、装置、电子设备及存储介质

Similar Documents

Publication Publication Date Title
JP3141015B2 (ja) 手書き漢字認識方法および装置
CN107679070B (zh) 一种智能阅读推荐方法与装置、电子设备
CN1106620C (zh) 信息处理方法和设备
Abdelaziz et al. Altecondb: A large-vocabulary arabic online handwriting recognition database
CN111444720A (zh) 一种英文文本的命名实体识别方法
JPH08263487A (ja) 文字認識装置
US7546233B2 (en) Succession Chinese character input method
EP1758012A2 (en) Succession Chinese character input method
JP6537477B2 (ja) 検索システム、検索方法、それらのコンピュータプログラム及びそれらのコンピュータプログラムを記録した記録媒体
JPH1055409A (ja) 手書き入力情報処理装置
JP5132430B2 (ja) 姓名候補を生成する情報処理装置、情報処理方法、およびプログラム
JPS59229683A (ja) 認識処理装置
JP3233803B2 (ja) 難読漢字検索装置
JP2009020567A (ja) 文書検索装置
JPS6059487A (ja) 手書文字認識装置
JPS6097477A (ja) 誤読文字修正方式
CN117917621A (zh) 汉字输入方法和系统以及键盘
JPH053631B2 (ja)
JPH07325888A (ja) 辞書登録方法,文字認識方法及び文字認識装置
JPS6072089A (ja) 認識装置
CN111553365A (zh) 一种题目选取的方法、装置、电子设备及存储介质
JP2020177689A (ja) 情報処理装置、プログラム及び情報処理方法
JPH11134437A (ja) 手書き文字認識装置
CN116756345A (zh) 一种实体链接方法和系统
CN117634474A (zh) 一种应用于中日文本的语种识别方法及相关设备

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040203

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040210

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040412

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20040525

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040723

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20040812

A912 Re-examination (zenchi) completed and case transferred to appeal board

Free format text: JAPANESE INTERMEDIATE CODE: A912

Effective date: 20040903