JP2000082113A - 文字認識装置および辞書作成方法および記録媒体 - Google Patents

文字認識装置および辞書作成方法および記録媒体

Info

Publication number
JP2000082113A
JP2000082113A JP10268952A JP26895298A JP2000082113A JP 2000082113 A JP2000082113 A JP 2000082113A JP 10268952 A JP10268952 A JP 10268952A JP 26895298 A JP26895298 A JP 26895298A JP 2000082113 A JP2000082113 A JP 2000082113A
Authority
JP
Japan
Prior art keywords
character
dictionary
recognition
standard
pattern
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10268952A
Other languages
English (en)
Other versions
JP3868637B2 (ja
Inventor
Toshio Miyazawa
利夫 宮澤
Takako Oi
貴子 大井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP26895298A priority Critical patent/JP3868637B2/ja
Publication of JP2000082113A publication Critical patent/JP2000082113A/ja
Application granted granted Critical
Publication of JP3868637B2 publication Critical patent/JP3868637B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Abstract

(57)【要約】 【課題】 低品質文字についても、認識精度を向上させ
ることの可能な文字認識装置を提供する。 【解決手段】 この文字認識装置では、標準辞書5の他
に、さらに、拡張辞書6を設け、該拡張辞書6には、標
準辞書5を用いて正しく識別できなかった文字につい
て、該文字の文字パターンに基づく情報が記憶されてい
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、文字認識装置およ
び辞書作成方法および記録媒体に関する。
【0002】
【従来の技術】従来、例えば特開平4−242494号
には、認識用辞書として、出現頻度の高い文字を含む第
1の辞書と、出現頻度の低い文字を含む第2の辞書とを
有し、未知の文字パターンの特徴量を、まず、第1の辞
書に格納された特徴と照合し、その認識結果についての
判定結果により第2の辞書を照合することにより認識精
度の低下を防止する技術が示されている。
【0003】また、従来では、入力画像から文字を切り
出して認識処理を行なうとき、標準辞書を用いて認識処
理を行なった結果、その文字切り出し位置が間違ってい
ると判断した時には、改めて文字切り出しを行ない、再
び標準辞書を用いて認識処理を行なうようにしている。
すなわち、誤認識の原因としては、文字が正しく切り出
されていないことによるものと、文字は正しく切り出さ
れているがマッチングされないこととの2つに大別する
ことができる。上述した従来の方式では、文字が正しく
切り出されていない場合を想定して、まず、標準辞書で
認識処理を行ない、その類似度や文字サイズなどから、
正しく切り出されていない文字を判定し、再度文字切り
出し処理を行ない、新たな文字矩形座標で、再び標準辞
書を用いて認識処理を行ない、1回目の結果と、2回目
の結果を比較するといった再認識処理を行なっている。
【0004】
【発明が解決しようとする課題】しかしながら、上述し
た特開平4−242494号に示されている技術では、
2つの辞書を設けているものの、これらの2つの辞書
は、出現頻度により分けられているため、低品質文字に
ついては、その認識精度を向上させることができなかっ
た。
【0005】また、文字切り出し位置が間違っていると
判断した時に改めて文字切り出しを行ない、標準辞書を
用いて再認識する従来の方式においても、標準辞書だけ
を用いて認識処理を行なっているため、低品質文字につ
いては、その認識精度を向上させることができなかっ
た。すなわち、文字認識位置がずれ、かつ、品質が悪い
文字については、認識処理を正しく行なうことができな
いという問題があった。
【0006】本発明は、特に低品質文字についても、認
識精度を向上させることの可能な文字認識装置および辞
書作成方法および記録媒体を提供することを目的として
いる。
【0007】
【課題を解決するための手段】上記目的を達成するため
に、請求項1記載の発明は、所定の文字の文字パターン
に基づく情報が文字毎に予め記憶されている標準辞書
と、入力画像から文字を切り出す文字切出手段と、未知
の文字の文字パターンに基づく情報と標準辞書に予め記
憶されている文字毎の情報とをそれぞれ比較照合して、
類似度の最も大きい文字を認識結果として出力する認識
処理手段とを有する文字認識装置において、前記標準辞
書の他に、さらに、拡張辞書を設け、該拡張辞書には、
標準辞書を用いて正しく識別できなかった文字につい
て、該文字の文字パターンに基づく情報が記憶されるこ
とを特徴としている。
【0008】また、請求項2記載の発明は、所定の文字
の文字パターンから抽出された特徴量が文字毎に予め記
憶されている標準辞書と、入力画像から文字を切り出す
文字切出手段と、未知の文字の文字パターンから特徴量
を抽出し、該特徴量と標準辞書に予め記憶されている文
字毎の特徴量とをそれぞれ比較照合して、類似度の最も
大きい文字を認識結果として出力する認識処理手段とを
有する文字認識装置において、前記標準辞書の他に、さ
らに、拡張辞書を設け、該拡張辞書には、標準辞書を用
いて正しく識別できなかった文字について、該文字の文
字パターンから抽出された特徴量が記憶されることを特
徴としている。
【0009】また、請求項3記載の発明は、所定の文字
の文字パターンが文字毎に予め記憶されている標準辞書
と、入力画像から文字を切り出す文字切出手段と、未知
の文字の文字パターンと標準辞書に予め記憶されている
文字毎の文字パターンとをそれぞれ比較照合して、類似
度の最も大きい文字を認識結果として出力する認識処理
手段とを有する文字認識装置において、前記標準辞書の
他に、さらに、拡張辞書を設け、該拡張辞書には、標準
辞書を用いて正しく識別できなかった文字について、該
文字の文字パターンが記憶されることを特徴としてい
る。
【0010】また、請求項4記載の発明は、請求項1乃
至請求項3のいずれか一項に記載の文字認識装置におい
て、標準辞書には、全ての認識対象文字についての文字
パターンに基づく情報が記憶されていることを特徴とし
ている。
【0011】また、請求項5記載の発明は、請求項1乃
至請求項4のいずれか一項に記載の文字認識装置におい
て、前記標準辞書は、文字品質の良好な文字パターンの
みから作成されていることを特徴としている。
【0012】また、請求項6記載の発明は、請求項1乃
至請求項3のいずれか一項に記載の文字認識装置におい
て、前記拡張辞書には、全ての認識対象文字のうちの一
部の認識対象文字についての文字パターンに基づく情報
のみが記憶されることを特徴としている。
【0013】また、請求項7記載の発明は、請求項6記
載の文字認識装置において、前記拡張辞書には、漢字の
文字パターンに基づく情報のみが記憶されることを特徴
としている。
【0014】また、請求項8記載の発明は、請求項1乃
至請求項7のいずれか一項に記載の文字認識装置におい
て、未知の文字の文字パターンに対して、まず標準辞書
で認識処理を行ない、その結果、類似度が所定の閾値よ
りも小さかった場合には、拡張辞書を用いて認識処理を
さらに行なうことを特徴としている。
【0015】また、請求項9記載の発明は、請求項1乃
至請求項7のいずれか一項に記載の文字認識装置におい
て、未知の文字の文字パターンに対して、まず標準辞書
で認識処理を行ない、その結果、該文字の入力画像から
の文字切り出し位置が正しくないと判断された場合に
は、拡張辞書を用いて認識処理を行なうことを特徴とし
ている。
【0016】また、請求項10記載の発明は、請求項1
乃至請求項7のいずれか一項に記載の文字認識装置にお
いて、未知の文字の文字パターンに対して、まず標準辞
書で認識処理を行ない、その結果、該文字の入力画像か
らの文字切り出し位置が正しくないと判断された場合に
は、新たな切り出し位置で文字の切り出しを行ない、新
たな切り出し位置で切り出された文字の文字パターンに
対して、標準辞書と拡張辞書との2つの辞書を用いて認
識処理を行なうことを特徴としている。
【0017】また、請求項11記載の発明は、請求項1
乃至請求項7のいずれか一項に記載の文字認識装置にお
いて、未知の文字の文字パターンに対して、標準辞書と
拡張辞書とを用いてそれぞれ認識処理を行ない、標準辞
書を用いて得られた認識結果である類似度と拡張辞書を
用いて得られた認識結果である類似度とを比較し、類似
度の大きい方を最終認識結果として出力することを特徴
としている。
【0018】また、請求項12記載の発明は、所定の文
字の文字パターンに基づく情報が文字毎に予め記憶され
ている標準辞書と、入力画像から文字を切り出す文字切
出手段と、未知の文字の文字パターンに基づく情報と標
準辞書に予め記憶されている文字毎の情報とをそれぞれ
比較照合して、類似度の最も大きい文字を認識結果とし
て出力する認識処理手段とを有する文字認識装置におい
て、多値画像の2値化閾値を、2値画像が潰れる値から
かすれる値まで順次変化させ、2値化閾値を順次に変化
させるときに得られる2値画像を標準辞書を用いて認識
させ、標準辞書を用いて始めて認識できた閾値での2値
文字パターンと、最後に認識できた閾値での2値文字パ
ターンとを用いて、拡張辞書を作成することを特徴とし
ている。
【0019】また、請求項13記載の発明は、所定の文
字の文字パターンに基づく情報が文字毎に予め記憶され
ている標準辞書と、入力画像から文字を切り出す文字切
出手段と、未知の文字の文字パターンに基づく情報と標
準辞書に予め記憶されている文字毎の情報とをそれぞれ
比較照合して、類似度の最も大きい文字を認識結果とし
て出力する認識処理手段とを有する文字認識装置におい
て、多値画像の2値化閾値を、2値画像が潰れる値から
かすれる値まで順次変化させ、2値化閾値を順次に変化
させるときに得られる2値画像を標準辞書を用いて認識
させ、標準辞書を用いて始めて認識できた閾値での2値
文字パターンを用いて、拡張辞書を作成することを特徴
としている。
【0020】また、請求項14記載の発明は、所定の文
字の文字パターンに基づく情報が文字毎に予め記憶され
ている標準辞書と、入力画像から文字を切り出す文字切
出手段と、未知の文字の文字パターンに基づく情報と標
準辞書に予め記憶されている文字毎の情報とをそれぞれ
比較照合して、類似度の最も大きい文字を認識結果とし
て出力する認識処理手段とを有する文字認識装置におい
て、多値画像の2値化閾値を、2値画像が潰れる値から
かすれる値まで順次変化させ、2値化閾値を順次に変化
させるときに得られる2値画像を標準辞書を用いて認識
させ、最後に認識できた閾値での2値文字パターンとを
用いて、拡張辞書を作成することを特徴としている。
【0021】また、請求項15記載の発明は、請求項1
乃至請求項11のいずれか一項に記載の文字認識装置を
コンピュータに実行させるためのプログラムを該コンピ
ュータが読取可能に記録媒体に記録したことを特徴とし
ている。
【0022】また、請求項16記載の発明は、請求項1
2乃至請求項14のいずれか一項に記載の辞書作成方法
をコンピュータに実行させるためのプログラムを前記コ
ンピュータが読取可能な記録媒体に記録したことを特徴
としている。
【0023】また、請求項17記載の発明は、ネットワ
ークで接続されたサーバーマシンに所定の文字の文字パ
ターンを記憶させておき、別のクライアントマシン上
で、前記サーバーマシンに記憶されている所定の文字の
文字パターンに基づいて、標準辞書および/または拡張
辞書を作成することを特徴としている。
【0024】
【発明の実施の形態】以下、本発明の実施形態を図面に
基づいて説明する。図1は本発明に係る文字認識装置の
ブロック図である。図1を参照すると、この文字認識装
置は、所定の文字の認識処理用の標準情報が文字毎に予
め記憶されている標準辞書5と、画像を入力する画像入
力部1(例えば、スキャナなど)と、入力画像から文字を
切り出したりする前処理部2と、未知の文字の文字パタ
ーンに基づく情報と標準辞書5に予め記憶されている文
字毎の標準情報とをそれぞれ比較照合して、類似度の最
も大きい文字を認識結果として出力する認識処理部3
と、全体を制御する制御部4とを有しており、この文字
認識装置では、標準辞書5の他に、さらに、拡張辞書6
を設け、該拡張辞書6には、標準辞書5を用いて正しく
識別できなかった文字について、該文字の文字パターン
に基づく情報が記憶されている。
【0025】より詳しくは、標準辞書5には、全ての認
識対象文字についての文字パターンに基づく情報が記憶
されるようになっており、そして、標準辞書5は、文字
品質の良好な文字パターンのみから作成されている。ま
た、拡張辞書6には、全ての認識対象文字のうちの一部
の認識対象文字についての文字パターンに基づく情報の
みが記憶されるようになっている。特に、漢字の文字パ
ターンに基づく情報のみが記憶されるようになってい
る。
【0026】なお、標準辞書5,拡張辞書6に記憶され
ている文字パターンに基づく情報としては、文字パター
ンそのものである場合と、文字パターンから抽出された
特徴量である場合とが考えられる。
【0027】標準辞書5,拡張辞書6に記憶されている
文字パターンに基づく情報が、文字パターンから抽出さ
れた特徴量である場合には、認識処理部3は、未知の文
字の文字パターンから特徴量を抽出し、該特徴量と標準
辞書5,拡張辞書6に予め記憶されている文字毎の特徴
量とをそれぞれ比較照合するようになっている。また、
標準辞書5,拡張辞書6に記憶されている文字パターン
に基づく情報が、文字パターンそのものである場合に
は、認識処理部3は、未知の文字の文字パターンと標準
辞書5,拡張辞書6に予め記憶されている文字毎の文字
パターンとをそれぞれ比較照合するようになっている。
本発明は、標準辞書5,拡張辞書6に記憶されている文
字パターンに基づく情報としては、文字パターンそのも
のである場合と、文字パターンから抽出された特徴量で
ある場合とのいずれにも適用可能である。
【0028】また、制御部4は、画像入力部1,前処理
部2,認識処理部3の制御を行なったり、標準辞書5と
拡張辞書6との切り替え制御を行なうようになってい
る。
【0029】次に、上述のような構成の文字認識装置の
処理動作を説明する。この文字認識装置では、まず、画
像入力部1により、認識処理を行ないたい原稿,帳票な
どを読み込む。このように、入力画像が読み込まれる
と、前処理部2では、読み込まれた原稿がカラーや多値
画像原稿である場合は、2値化処理を行なったり、文字
と表,図などを識別する領域識別処理や、文字領域に対
して行を切り出す行切り出し処理や、文字を切り出す文
字切り出し処理などを行なう。このようにして、前処理
部2では、最終的には、入力画像から認識対象となる文
字(文字画像)が切り出されて出力される。このことから
わかるように、前処理部2は、文字切出部としての機能
を含んでいる。
【0030】次に、認識処理部3では、前処理部2で切
り出された文字の文字パターンに基づく情報を、標準辞
書5および/または拡張辞書6と照合する。
【0031】図2は認識処理部3の処理流れを示すフロ
ーチャートである。図2を参照すると、前処理部2で文
字が切り出されると、認識処理部3では、切り出された
文字の文字パターンに基づく情報を、先ず、標準辞書5
と比較照合する(ステップS1)。この比較照合では、標
準辞書5内の全ての文字についての情報との比較照合が
なされ、最も大きい類似度を与える文字が標準辞書5で
の認識結果として出力される。
【0032】このようにして、標準辞書5との照合の結
果、最も大きい類似度(類似度1とする)を与える文字が
得られたとき、この類似度1と予め定められた閾値とを
比較する(ステップS2)。この結果、閾値よりも類似度
1が大きかった場合、拡張辞書6との比較照合は行なわ
ず、標準辞書5との比較照合結果(すなわち、最も大き
い類似度(類似度1)を与える文字)を最終認識結果とす
る(ステップS3)。
【0033】これに対し、ステップS2において、類似
度1が閾値よりも大きくないときには、さらに、拡張辞
書6との比較照合を行なう(ステップS4)。この比較照
合では、拡張辞書6内の全ての文字についての情報との
比較照合がなされ、最も大きい類似度を与える文字が拡
張辞書6での認識結果として出力される。
【0034】このようにして、拡張辞書6との照合の結
果、最も大きい類似度(類似度2とする)を与える文字が
得られたとき、この類似度2とステップS1で求められ
た類似度1とを比較する(ステップS5)。この結果、類
似度1よりも類似度2の方が大きい場合には、拡張辞書
6での認識結果を最終認識結果とし(ステップS6)、類
似度2よりも類似度1の方が大きい場合には、標準辞書
5での認識結果を最終認識結果とする(ステップS3)。
【0035】ここで、拡張辞書6は、様々な画像品質の
文字画像を標準辞書5で認識させ、標準辞書5で認識で
きなかった低品質な文字画像から作成されたものであ
る。
【0036】従って、画像品質の良い画像(原稿)は、画
像品質の良い画像から作成されている標準辞書5との照
合で、閾値よりも大きな類似度をもつものとして認識さ
れるので、拡張辞書6と照合されることは少なく、認識
処理時間を短かくすることができる。
【0037】また、低品質画像(原稿)は、拡張辞書6と
の比較照合がなされることで、より高精度な認識が可能
になる。
【0038】このように、本発明では、標準辞書5の他
に、さらに、拡張辞書6を設け、拡張辞書6は、様々な
画像品質の文字画像を標準辞書5で認識させた結果、標
準辞書5で認識できなかった低品質な文字画像から作成
されたものであることから、低品質文字についても、認
識精度を向上させることができる。さらに、このような
拡張辞書6を設けることで、例えば、文字認識位置がず
れ、かつ、品質が悪い文字についての認識処理にも対処
(適用)できる。
【0039】すなわち、第1の適用例としては、未知の
文字の文字パターンに対して、まず標準辞書5で認識処
理を行ない、その結果、該文字の入力画像からの文字切
り出し位置が正しくないと判断された場合に、拡張辞書
6を用いて認識処理を行なうようにすることもできる。
【0040】また、第2の適用例としては、未知の文字
の文字パターンに対して、まず標準辞書5で認識処理を
行ない、その結果、該文字の入力画像からの文字切り出
し位置が正しくないと判断された場合には、新たな切り
出し位置で文字の切り出しを行ない、新たな切り出し位
置で切り出された文字の文字パターンに対して、標準辞
書5と拡張辞書6との2つの辞書を用いて認識処理を行
なうようにすることもできる。すなわち、文字サイズと
しては正しく切り出されているにも関わらず、標準辞書
5に登録されているパターンではマッチングできない
(すなわち、類似度が低い)場合、標準辞書には登録され
ていないパターン(例えば、潰れたパターンや掠れた文
字パターン)から作成されている拡張辞書6を用いて、
従来と同じ文字切り出し矩形座標で再認識処理を行なう
ことで、正しく認識できるようになる。
【0041】第1,第2の適用例のように、未知の文字
の文字パターンに対して、まず標準辞書5で認識処理を
行ない、その結果、該文字の入力画像からの文字切り出
し位置が正しくないと判断された場合に、拡張辞書6を
用いて認識処理を行なうことで(従来のように標準辞書
5だけでなく、拡張辞書6をも活用することで)、例え
ば、文字認識位置がずれ、かつ、品質が悪い文字につい
ても、認識精度を向上させることができる。
【0042】換言すれば、本発明の文字認識装置では、
基本的に、まず標準辞書5で認識処理を行ない、認識結
果の信頼度(確信度)が低い場合などに、拡張辞書6を用
いて認識処理を行なう。このことにより品質が良好な原
稿は標準辞書5のみのマッチングを行なうだけで、拡張
辞書6とのマッチングを行なう必要がないので、処理速
度が高速となる。
【0043】このような文字認識装置で使われるため
に、標準辞書5は認識対象の文字の全ての文字コード
(例えば、記号、平仮名、カタカナ、漢字など)を含む必
要があるが、拡張辞書6は、品質の劣化したパターンの
みを認識対象にするため、劣化が比較的起こりにくいパ
ターン(例えば、記号、平仮名、カタカナなど)は登録を
行なわないことにより、拡張辞書6でのマッチング回数
を減らすことで、処理速度の高速化がはかれる。劣化が
生じやすく拡張辞書6に登録を行なう必要がある文字と
しては、例えば「漢字」が挙げられる。「漢字」は平仮
名やカタカナなどと比べると、画数が多く、潰れたり、
かすれたりすることが多いためである。また、文字認識
処理に用いる特徴量として例えば文字の輪郭特徴の場
合、輪郭が複雑な文字は劣化が生じ易いことを利用し、
認識に用いる特徴量によって判断を行っても良い。ま
た、認識に用いない特徴、例えば黒画素数などを用いて
判断を行っても良い。
【0044】また、本発明において、拡張辞書6は、例
えば図3に示すようなシステムを用いて作成される。図
3のシステムは、文字画像データを保存し、また、作成
した辞書を保存するハードディスク,フロッピーディス
クドライブ(FDドライブ),CD−ROMドライブなど
の記憶部40と、文字画像データをもとに辞書作成を行
なう計算機部(CPU,ROM,RAM)41などを有し
ている。なお、記憶部40は、計算機部41の中に組み
込まれ一体となっていても良いし、あるいは、通信装置
42によってインターネットなどのネットワークを介し
てアクセスできれば、通信回線で結ばれた他の装置内に
設けられていても良い。
【0045】図3に示すようなシステムを用いて、拡張
辞書6の作成は、次のようにしてなされる。すなわち、
まず、ハードディスクなどの記憶部40から多値の文字
画像データを読み出す。ここで読み出された画像データ
は256階調に量子化されているとする(量子化の段階
は16,64などでも構わない。また、カラーデータで
あっても構わない)。この画像データを2値化閾値を、
例えば、0から255まで順次変化させて2値化する。
2値化することにより「白」と「黒」の2値画像が作ら
れる。ここで作られる2値画像は、2値化閾値によっ
て、潰れた文字画像になったり、かすれた文字画像にな
ったりする。
【0046】この2値画像をまず良好な品質の文字パタ
ーンで作られた標準辞書5を用いて文字認識処理をす
る。一般に、潰れたり、かすれたりする画像は、標準辞
書5では認識できない。そこで、2値化閾値を潰れ方向
(2値化閾値の小さな方向)からかすれ方向(2値化閾値
の大きな方向)に変化させながら、2値画像を作成し認
識処理する場合を例に説明する。潰れ方向から順次かす
れ方向に閾値を変化させ認識処理した結果、始めて正し
く認識できた2値画像を潰れ限界パターンとする。さら
に閾値を変化させながら認識処理を行ない、最後に正し
く認識できた2値画像をかすれ限界パターンとする。図
4にはこの様子が示されている。ここで、作成された潰
れ限界パターンとかすれ限界パターンの2つのパターン
から作成される辞書が拡張辞書6になる。
【0047】図5は拡張辞書6の辞書作成の処理流れを
示すフローチャートである。図5を参照すると、まず、
2値化閾値thを”0”に初期設定する(ステップS
1)。次いで、2値化閾値thを”1”だけ歩進する(ス
テップS2)。しかる後、グレー画像を2値化閾値th
で2値化し(ステップS3)、この2値化画像に対して標
準辞書5で認識処理する(ステップS4)。この結果、こ
の2値化画像が図4に示したような潰れ限界画像あるい
はかすれ限界画像であるかを判断する(ステップS5)。
【0048】2値化画像が潰れ限界画像あるいはかすれ
限界画像でない場合には、2値化閾値thが”256”
以下か否かを判断し(ステップS6)、2値化閾値th
が”256”以下でない場合には、ステップS2に戻
り、2値化閾値thを”1”だけ歩進し、同様の処理を
繰り返し行なう。
【0049】そして、ステップS5で、2値化画像が潰
れ限界画像あるいはかすれ限界画像であると判断された
場合には、この潰れ限界画像あるいはかすれ限界画像を
劣化パターン画像として保存(登録)する(ステップS
7)。次いで、ステップS6に進み、2値化閾値th
が”256”以下か否かを判断し(ステップS6)、2値
化閾値thが”256”以下でない場合には、ステップ
S2に戻り、2値化閾値thを”1”だけ歩進し、同様
の処理を繰り返し行なう。
【0050】このような処理を繰り返し行ない、ステッ
プS6で2値化閾値thが”256”以下でなくなった
ときには、ステップS7で保存(登録)された劣化パター
ン画像に基づいて拡張辞書6を作成する(ステップS
8)。
【0051】図6には、このように作成された拡張辞書
6の認識可能範囲が示されている。図6からわかるよう
に、拡張辞書6を用いることによって、標準辞書5での
認識可能範囲を拡張辞書6での認識可能範囲により拡大
することができる。
【0052】このように、本発明では、所定の文字の文
字パターンに基づく情報が文字毎に予め記憶されている
標準辞書5と、入力画像から文字を切り出す文字切出手
段と、未知の文字の文字パターンに基づく情報と標準辞
書に予め記憶されている文字毎の情報とをそれぞれ比較
照合して、類似度の最も大きい文字を認識結果として出
力する認識処理手段とを有する文字認識装置において、
多値画像の2値化閾値を、2値画像が潰れる値からかす
れる値まで順次変化させ、2値化閾値を順次に変化させ
るときに得られる2値画像を標準辞書5を用いて認識さ
せ、標準辞書5を用いて始めて認識できた閾値での2値
文字パターン(潰れパターン)と、最後に認識できた閾値
での2値文字パターン(かすれパターン)とを用いて、拡
張辞書6を作成することができる。
【0053】あるいは、多値画像の2値化閾値を2値画
像が潰れる値からかすれる値まで順次変化させ、2値化
閾値を順次に変化させるときに得られる2値画像を標準
辞書5を用いて認識させ、標準辞書5を用いて始めて認
識できた閾値での2値文字パターン(潰れパターン)を用
いて、拡張辞書6を作成することもできる。
【0054】あるいは、多値画像の2値化閾値を、2値
画像が潰れる値からかすれる値まで順次変化させ、2値
化閾値を順次に変化させるときに得られる2値画像を標
準辞書5を用いて認識させ、標準辞書5を用いて最後に
認識できた閾値での2値文字パターン(かすれパターン)
を用いて、拡張辞書6を作成することもできる。
【0055】また、標準辞書5,拡張辞書6を作成する
場合に、ネットワークで接続されたサーバーマシンに所
定の文字の文字パターンを記憶させておき、別のクライ
アントマシン上で、前記サーバーマシンに記憶されてい
る所定の文字の文字パターンに基づいて、標準辞書5お
よび/または拡張辞書6を作成することもできる。
【0056】また、図7は図1の文字認識装置のハード
ウェア構成例を示す図である。図7を参照すると、この
文字認識装置は、例えばパーソナルコンピュータ等で実
現され、全体を制御するCPU21と、CPU21の制
御プログラム等が記憶されているROM22と、CPU
21のワークエリア等として使用されるRAM23と、
文書を文書画像として読込むスキャナ24と、文書画像
に含まれている各文字画像に対し認識処理を行なった結
果の情報を出力する結果出力装置(例えば、ディスプレ
イやプリンタ)26とを有している。
【0057】ここで、CPU21は、図1の制御部4,
前処理部2,認識処理部3の機能を有している。また、
RAM23内には、標準辞書5,拡張辞書6を格納する
ことができる。
【0058】CPU21におけるこのような制御部4,
前処理部2,認識処理部3等としての機能は、例えばソ
フトウェアパッケージ(具体的には、CD−ROM等の
情報記録媒体)の形で提供することができ、このため、
図3の例では、情報記録媒体30がセットさせるとき、
これを駆動する媒体駆動装置31が設けられている。
【0059】換言すれば、本発明の文字認識装置は、イ
メージスキャナ,ディスプレイ等を備えた汎用の計算機
システムにCD−ROM等の情報記録媒体に記録された
プログラムを読み込ませて、この汎用計算機システムの
マイクロプロセッサに前処理,認識処理を実行させる装
置構成においても実施することが可能である。この場
合、本発明の前処理,認識処理を実行するためのプログ
ラム(すなわち、ハードウェアシステムで用いられるプ
ログラム)は、媒体に記録された状態で提供される。プ
ログラムなどが記録される情報記録媒体としては、CD
−ROMに限られるものではなく、ROM,RAM,フ
レキシブルディスク,メモリカード等が用いられても良
い。媒体に記録されたプログラムは、ハードウェアシス
テムに組み込まれている記憶装置、例えばハードディス
ク装置にインストールされることにより、このプログラ
ムを実行して、前処理機能、認識処理機能を実現でき
る。
【0060】なお、上述の説明では、図3は辞書作成に
用いるシステムの構成例として挙げられ、また、図7は
図1の文字認識装置のハードウェア構成例として挙げら
れているが、図3と図7とにおいて、CPU,ROM,
RAM、あるいは記憶部40などを共用して、図3と図
7とを1つの装置として構成することもできる。
【0061】
【発明の効果】以上に説明したように、請求項1乃至請
求項11,請求項15記載の発明によれば、標準辞書の
他に、認識できなかった文字パターンを登録した拡張辞
書をも用いて認識処理を行なうことにより、認識速度を
低下させることなく、低品質文字の認識精度をも向上さ
せることができる。すなわち、画像品質の良い画像は高
速に、低品質画像でも高精度で認識できる文字認識装置
を提供することができる。
【0062】また、請求項12乃至請求項14,請求項
16乃至請求項17記載の発明によれば、品質が劣化し
た文字パターンを高速にかつ高精度に認識可能な辞書作
成を行なうことができる。
【図面の簡単な説明】
【図1】本発明に係る文字認識装置のブロック図であ
る。
【図2】認識処理部の処理流れを示すフローチャートで
ある。
【図3】辞書作成に用いるシステムの構成例を示す図で
ある。
【図4】潰れ限界画像あるいはかすれ限界画像の保存
(登録)を説明するための図である。
【図5】拡張辞書の辞書作成の処理流れを示すフローチ
ャートである。
【図6】作成された拡張辞書の認識可能範囲を示す図で
ある。
【図7】図1の文字認識装置のハードウェア構成例を示
す図である。
【符号の説明】
1 画像入力部 2 前処理部 3 認識処理部 4 制御部 5 標準辞書 6 拡張辞書 21 CPU 22 ROM 23 RAM 24 スキャナ 26 結果出力装置 30 情報記録媒体 31 媒体駆動装置 40 記憶部 41 計算機部 42 通信装置

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 所定の文字の文字パターンに基づく情報
    が文字毎に予め記憶されている標準辞書と、入力画像か
    ら文字を切り出す文字切出手段と、未知の文字の文字パ
    ターンに基づく情報と標準辞書に予め記憶されている文
    字毎の情報とをそれぞれ比較照合して、類似度の最も大
    きい文字を認識結果として出力する認識処理手段とを有
    する文字認識装置において、前記標準辞書の他に、さら
    に、拡張辞書を設け、該拡張辞書には、標準辞書を用い
    て正しく識別できなかった文字について、該文字の文字
    パターンに基づく情報が記憶されることを特徴とする文
    字認識装置。
  2. 【請求項2】 所定の文字の文字パターンから抽出され
    た特徴量が文字毎に予め記憶されている標準辞書と、入
    力画像から文字を切り出す文字切出手段と、未知の文字
    の文字パターンから特徴量を抽出し、該特徴量と標準辞
    書に予め記憶されている文字毎の特徴量とをそれぞれ比
    較照合して、類似度の最も大きい文字を認識結果として
    出力する認識処理手段とを有する文字認識装置におい
    て、前記標準辞書の他に、さらに、拡張辞書を設け、該
    拡張辞書には、標準辞書を用いて正しく識別できなかっ
    た文字について、該文字の文字パターンから抽出された
    特徴量が記憶されることを特徴とする文字認識装置。
  3. 【請求項3】 所定の文字の文字パターンが文字毎に予
    め記憶されている標準辞書と、入力画像から文字を切り
    出す文字切出手段と、未知の文字の文字パターンと標準
    辞書に予め記憶されている文字毎の文字パターンとをそ
    れぞれ比較照合して、類似度の最も大きい文字を認識結
    果として出力する認識処理手段とを有する文字認識装置
    において、前記標準辞書の他に、さらに、拡張辞書を設
    け、該拡張辞書には、標準辞書を用いて正しく識別でき
    なかった文字について、該文字の文字パターンが記憶さ
    れることを特徴とする文字認識装置。
  4. 【請求項4】 請求項1乃至請求項3のいずれか一項に
    記載の文字認識装置において、前記標準辞書には、全て
    の認識対象文字についての文字パターンに基づく情報が
    記憶されていることを特徴とする文字認識装置。
  5. 【請求項5】 請求項1乃至請求項4のいずれか一項に
    記載の文字認識装置において、前記標準辞書は、文字品
    質の良好な文字パターンのみから作成されていることを
    特徴とする文字認識装置。
  6. 【請求項6】 請求項1乃至請求項3のいずれか一項に
    記載の文字認識装置において、前記拡張辞書には、全て
    の認識対象文字のうちの一部の認識対象文字についての
    文字パターンに基づく情報のみが記憶されることを特徴
    とする文字認識装置。
  7. 【請求項7】 請求項6記載の文字認識装置において、
    前記拡張辞書には、漢字の文字パターンに基づく情報の
    みが記憶されることを特徴とする文字認識装置。
  8. 【請求項8】 請求項1乃至請求項7のいずれか一項に
    記載の文字認識装置において、未知の文字の文字パター
    ンに対して、まず標準辞書で認識処理を行ない、その結
    果、類似度が所定の閾値よりも小さかった場合には、拡
    張辞書を用いて認識処理をさらに行なうことを特徴とす
    る文字認識装置。
  9. 【請求項9】 請求項1乃至請求項7のいずれか一項に
    記載の文字認識装置において、未知の文字の文字パター
    ンに対して、まず標準辞書で認識処理を行ない、その結
    果、該文字の入力画像からの文字切り出し位置が正しく
    ないと判断された場合には、拡張辞書を用いて認識処理
    を行なうことを特徴とする文字認識装置。
  10. 【請求項10】 請求項1乃至請求項7のいずれか一項
    に記載の文字認識装置において、未知の文字の文字パタ
    ーンに対して、まず標準辞書で認識処理を行ない、その
    結果、該文字の入力画像からの文字切り出し位置が正し
    くないと判断された場合には、新たな切り出し位置で文
    字の切り出しを行ない、新たな切り出し位置で切り出さ
    れた文字の文字パターンに対して、標準辞書と拡張辞書
    との2つの辞書を用いて認識処理を行なうことを特徴と
    する文字認識装置。
  11. 【請求項11】 請求項1乃至請求項7のいずれか一項
    に記載の文字認識装置において、未知の文字の文字パタ
    ーンに対して、標準辞書と拡張辞書とを用いてそれぞれ
    認識処理を行ない、標準辞書を用いて得られた認識結果
    である類似度と拡張辞書を用いて得られた認識結果であ
    る類似度とを比較し、類似度の大きい方を最終認識結果
    として出力することを特徴とする文字認識装置。
  12. 【請求項12】 所定の文字の文字パターンに基づく情
    報が文字毎に予め記憶されている標準辞書と、入力画像
    から文字を切り出す文字切出手段と、未知の文字の文字
    パターンに基づく情報と標準辞書に予め記憶されている
    文字毎の情報とをそれぞれ比較照合して、類似度の最も
    大きい文字を認識結果として出力する認識処理手段とを
    有する文字認識装置において、多値画像の2値化閾値
    を、2値画像が潰れる値からかすれる値まで順次変化さ
    せ、2値化閾値を順次に変化させるときに得られる2値
    画像を標準辞書を用いて認識させ、標準辞書を用いて始
    めて認識できた閾値での2値文字パターンと、最後に認
    識できた閾値での2値文字パターンとを用いて、拡張辞
    書を作成することを特徴とする辞書作成方法。
  13. 【請求項13】 所定の文字の文字パターンに基づく情
    報が文字毎に予め記憶されている標準辞書と、入力画像
    から文字を切り出す文字切出手段と、未知の文字の文字
    パターンに基づく情報と標準辞書に予め記憶されている
    文字毎の情報とをそれぞれ比較照合して、類似度の最も
    大きい文字を認識結果として出力する認識処理手段とを
    有する文字認識装置において、多値画像の2値化閾値
    を、2値画像が潰れる値からかすれる値まで順次変化さ
    せ、2値化閾値を順次に変化させるときに得られる2値
    画像を標準辞書を用いて認識させ、標準辞書を用いて始
    めて認識できた閾値での2値文字パターンを用いて、拡
    張辞書を作成することを特徴とする辞書作成方法。
  14. 【請求項14】 所定の文字の文字パターンに基づく情
    報が文字毎に予め記憶されている標準辞書と、入力画像
    から文字を切り出す文字切出手段と、未知の文字の文字
    パターンに基づく情報と標準辞書に予め記憶されている
    文字毎の情報とをそれぞれ比較照合して、類似度の最も
    大きい文字を認識結果として出力する認識処理手段とを
    有する文字認識装置において、多値画像の2値化閾値
    を、2値画像が潰れる値からかすれる値まで順次変化さ
    せ、2値化閾値を順次に変化させるときに得られる2値
    画像を標準辞書を用いて認識させ、最後に認識できた閾
    値での2値文字パターンとを用いて、拡張辞書を作成す
    ることを特徴とする辞書作成方法。
  15. 【請求項15】 請求項1乃至請求項11のいずれか一
    項に記載の文字認識装置をコンピュータに実行させるた
    めのプログラムを記録した前記コンピュータが読取可能
    な記録媒体。
  16. 【請求項16】 請求項12乃至請求項14のいずれか
    一項に記載の辞書作成方法をコンピュータに実行させる
    ためのプログラムを記録した前記コンピュータが読取可
    能な記録媒体。
  17. 【請求項17】 ネットワークで接続されたサーバーマ
    シンに所定の文字の文字パターンを記憶させておき、別
    のクライアントマシン上で、前記サーバーマシンに記憶
    されている所定の文字の文字パターンに基づいて、標準
    辞書および/または拡張辞書を作成することを特徴とす
    る辞書作成方法。
JP26895298A 1998-07-01 1998-09-07 文字認識装置および辞書作成方法および記録媒体 Expired - Lifetime JP3868637B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26895298A JP3868637B2 (ja) 1998-07-01 1998-09-07 文字認識装置および辞書作成方法および記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP20119398 1998-07-01
JP10-201193 1998-07-01
JP26895298A JP3868637B2 (ja) 1998-07-01 1998-09-07 文字認識装置および辞書作成方法および記録媒体

Publications (2)

Publication Number Publication Date
JP2000082113A true JP2000082113A (ja) 2000-03-21
JP3868637B2 JP3868637B2 (ja) 2007-01-17

Family

ID=26512642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26895298A Expired - Lifetime JP3868637B2 (ja) 1998-07-01 1998-09-07 文字認識装置および辞書作成方法および記録媒体

Country Status (1)

Country Link
JP (1) JP3868637B2 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003162B2 (en) * 2000-11-27 2006-02-21 Omron Corporation Apparatus and method for examining images
JP2006059351A (ja) * 2004-08-18 2006-03-02 Fujitsu Ltd 劣化辞書生成プログラム、方法および装置
CN101763516B (zh) * 2010-01-15 2012-02-29 南京航空航天大学 一种基于拟合函数的文字识别方法

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7003162B2 (en) * 2000-11-27 2006-02-21 Omron Corporation Apparatus and method for examining images
JP2006059351A (ja) * 2004-08-18 2006-03-02 Fujitsu Ltd 劣化辞書生成プログラム、方法および装置
CN101763516B (zh) * 2010-01-15 2012-02-29 南京航空航天大学 一种基于拟合函数的文字识别方法

Also Published As

Publication number Publication date
JP3868637B2 (ja) 2007-01-17

Similar Documents

Publication Publication Date Title
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5410611A (en) Method for identifying word bounding boxes in text
US5237627A (en) Noise tolerant optical character recognition system
EP1999688B1 (en) Converting digital images containing text to token-based files for rendering
Kise et al. Segmentation of page images using the area Voronoi diagram
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
US5212739A (en) Noise tolerant optical character recognition system
JP3904840B2 (ja) 多値画像から罫線を抽出する罫線抽出装置
JP4031210B2 (ja) 文字認識装置、文字認識方法、及び記録媒体
AU2006223761A1 (en) Method and system for adaptive recognition of distorted text in computer images
JP2000067164A (ja) パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体
JP2000082113A (ja) 文字認識装置および辞書作成方法および記録媒体
US7508986B2 (en) Document recognition device, document recognition method and program, and storage medium
JPH11272800A (ja) 文字認識装置
JP2751865B2 (ja) 文字列認識装置
Tzogka et al. OCR Workflow: Facing Printed Texts of Ancient, Medieval and Modern Greek Literature.
JP2001022883A (ja) 文字認識方式及び該文字認識方式の機能を実現させるための記録媒体
JP2002056356A (ja) 文字認識装置、文字認識方法および記録媒体
US8103103B2 (en) Multilevel bit-mapped image analysis method
JP3446794B2 (ja) 文字認識における多角形近似法および文字認識装置
JP3998439B2 (ja) 画像処理装置、画像処理方法およびこれらの方法をコンピュータに実行させるプログラム
JPH0795336B2 (ja) 文字認識方式
JP3428504B2 (ja) 文字認識装置
Shirali-Shahreza et al. Removing noises similar to dots from Persian scanned documents
JP3628000B2 (ja) 画像認識方法

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061010

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061011

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101020

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111020

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121020

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131020

Year of fee payment: 7

EXPY Cancellation because of completion of term