JP3868637B2 - 文字認識装置および辞書作成方法および記録媒体 - Google Patents

文字認識装置および辞書作成方法および記録媒体 Download PDF

Info

Publication number
JP3868637B2
JP3868637B2 JP26895298A JP26895298A JP3868637B2 JP 3868637 B2 JP3868637 B2 JP 3868637B2 JP 26895298 A JP26895298 A JP 26895298A JP 26895298 A JP26895298 A JP 26895298A JP 3868637 B2 JP3868637 B2 JP 3868637B2
Authority
JP
Japan
Prior art keywords
character
binarization
dictionary
pattern
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP26895298A
Other languages
English (en)
Other versions
JP2000082113A (ja
Inventor
利夫 宮澤
貴子 大井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP26895298A priority Critical patent/JP3868637B2/ja
Publication of JP2000082113A publication Critical patent/JP2000082113A/ja
Application granted granted Critical
Publication of JP3868637B2 publication Critical patent/JP3868637B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文字認識装置および辞書作成方法および記録媒体に関する。
【0002】
【従来の技術】
従来、例えば特開平4−242494号には、認識用辞書として、出現頻度の高い文字を含む第1の辞書と、出現頻度の低い文字を含む第2の辞書とを有し、未知の文字パターンの特徴量を、まず、第1の辞書に格納された特徴と照合し、その認識結果についての判定結果により第2の辞書を照合することにより認識精度の低下を防止する技術が示されている。
【0003】
また、従来では、入力画像から文字を切り出して認識処理を行なうとき、標準辞書を用いて認識処理を行なった結果、その文字切り出し位置が間違っていると判断した時には、改めて文字切り出しを行ない、再び標準辞書を用いて認識処理を行なうようにしている。すなわち、誤認識の原因としては、文字が正しく切り出されていないことによるものと、文字は正しく切り出されているがマッチングされないこととの2つに大別することができる。上述した従来の方式では、文字が正しく切り出されていない場合を想定して、まず、標準辞書で認識処理を行ない、その類似度や文字サイズなどから、正しく切り出されていない文字を判定し、再度文字切り出し処理を行ない、新たな文字矩形座標で、再び標準辞書を用いて認識処理を行ない、1回目の結果と、2回目の結果を比較するといった再認識処理を行なっている。
【0004】
【発明が解決しようとする課題】
しかしながら、上述した特開平4−242494号に示されている技術では、2つの辞書を設けているものの、これらの2つの辞書は、出現頻度により分けられているため、低品質文字については、その認識精度を向上させることができなかった。
【0005】
また、文字切り出し位置が間違っていると判断した時に改めて文字切り出しを行ない、標準辞書を用いて再認識する従来の方式においても、標準辞書だけを用いて認識処理を行なっているため、低品質文字については、その認識精度を向上させることができなかった。すなわち、文字認識位置がずれ、かつ、品質が悪い文字については、認識処理を正しく行なうことができないという問題があった。
【0006】
本発明は、特に低品質文字についても、認識精度を向上させることの可能な文字認識装置および辞書作成方法および記録媒体を提供することを目的としている。
【0007】
【課題を解決するための手段】
上記目的を達成するために、請求項1記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の2値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化手段と、前記閾値変化手段により2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化手段で2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により始めて正しく認識できた閾値での前記2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴としている。
【0008】
また、請求項2記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の2値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化手段と、前記閾値変化手段により2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化手段で2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により最後に正しく認識できた閾値での前記2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴としている。
【0009】
また、請求項3記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の2値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化手段と、前記閾値変化手段により2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化手段で2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により始めて正しく認識できた閾値での前記2値化パターンと最後に正しく認識できた閾値での前記2値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴としている。
【0010】
また、請求項4記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の2値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴としている。
【0011】
また、請求項5記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の2値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
最後に正しく認識できた閾値での2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴としている。
【0012】
また、請求項6記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の2値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での2値化パターンと最後に正しく認識できた閾値での2値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴としている。
【0013】
また、請求項7記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法をコンピュータに実行させるためのプログラムを記録した前記コンピュータが読取可能な記録媒体において、
多値画像の2値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での2値化パターンと最後に正しく認識できた閾値での2値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法をコンピュータに実行させるためのプログラムを記録した前記コンピュータが読取可能な記録媒体である。
【0024】
【発明の実施の形態】
以下、本発明の実施形態を図面に基づいて説明する。図1は本発明に係る文字認識装置のブロック図である。図1を参照すると、この文字認識装置は、所定の文字の認識処理用の標準情報が文字毎に予め記憶されている標準辞書5と、画像を入力する画像入力部1(例えば、スキャナなど)と、入力画像から文字を切り出したりする前処理部2と、未知の文字の文字パターンに基づく情報と標準辞書5に予め記憶されている文字毎の標準情報とをそれぞれ比較照合して、類似度の最も大きい文字を認識結果として出力する認識処理部3と、全体を制御する制御部4とを有しており、この文字認識装置では、標準辞書5の他に、さらに、拡張辞書6を設け、該拡張辞書6には、標準辞書5を用いて正しく識別できなかった文字について、該文字の文字パターンに基づく情報が記憶されている。
【0025】
より詳しくは、標準辞書5には、全ての認識対象文字についての文字パターンに基づく情報が記憶されるようになっており、そして、標準辞書5は、文字品質の良好な文字パターンのみから作成されている。また、拡張辞書6には、全ての認識対象文字のうちの一部の認識対象文字についての文字パターンに基づく情報のみが記憶されるようになっている。特に、漢字の文字パターンに基づく情報のみが記憶されるようになっている。
【0026】
なお、標準辞書5,拡張辞書6に記憶されている文字パターンに基づく情報としては、文字パターンそのものである場合と、文字パターンから抽出された特徴量である場合とが考えられる。
【0027】
標準辞書5,拡張辞書6に記憶されている文字パターンに基づく情報が、文字パターンから抽出された特徴量である場合には、認識処理部3は、未知の文字の文字パターンから特徴量を抽出し、該特徴量と標準辞書5,拡張辞書6に予め記憶されている文字毎の特徴量とをそれぞれ比較照合するようになっている。また、標準辞書5,拡張辞書6に記憶されている文字パターンに基づく情報が、文字パターンそのものである場合には、認識処理部3は、未知の文字の文字パターンと標準辞書5,拡張辞書6に予め記憶されている文字毎の文字パターンとをそれぞれ比較照合するようになっている。本発明は、標準辞書5,拡張辞書6に記憶されている文字パターンに基づく情報としては、文字パターンそのものである場合と、文字パターンから抽出された特徴量である場合とのいずれにも適用可能である。
【0028】
また、制御部4は、画像入力部1,前処理部2,認識処理部3の制御を行なったり、標準辞書5と拡張辞書6との切り替え制御を行なうようになっている。
【0029】
次に、上述のような構成の文字認識装置の処理動作を説明する。この文字認識装置では、まず、画像入力部1により、認識処理を行ないたい原稿,帳票などを読み込む。このように、入力画像が読み込まれると、前処理部2では、読み込まれた原稿がカラーや多値画像原稿である場合は、2値化処理を行なったり、文字と表,図などを識別する領域識別処理や、文字領域に対して行を切り出す行切り出し処理や、文字を切り出す文字切り出し処理などを行なう。このようにして、前処理部2では、最終的には、入力画像から認識対象となる文字(文字画像)が切り出されて出力される。このことからわかるように、前処理部2は、文字切出部としての機能を含んでいる。
【0030】
次に、認識処理部3では、前処理部2で切り出された文字の文字パターンに基づく情報を、標準辞書5および/または拡張辞書6と照合する。
【0031】
図2は認識処理部3の処理流れを示すフローチャートである。図2を参照すると、前処理部2で文字が切り出されると、認識処理部3では、切り出された文字の文字パターンに基づく情報を、先ず、標準辞書5と比較照合する(ステップS1)。この比較照合では、標準辞書5内の全ての文字についての情報との比較照合がなされ、最も大きい類似度を与える文字が標準辞書5での認識結果として出力される。
【0032】
このようにして、標準辞書5との照合の結果、最も大きい類似度(類似度1とする)を与える文字が得られたとき、この類似度1と予め定められた閾値とを比較する(ステップS2)。この結果、閾値よりも類似度1が大きかった場合、拡張辞書6との比較照合は行なわず、標準辞書5との比較照合結果(すなわち、最も大きい類似度(類似度1)を与える文字)を最終認識結果とする(ステップS3)。
【0033】
これに対し、ステップS2において、類似度1が閾値よりも大きくないときには、さらに、拡張辞書6との比較照合を行なう(ステップS4)。この比較照合では、拡張辞書6内の全ての文字についての情報との比較照合がなされ、最も大きい類似度を与える文字が拡張辞書6での認識結果として出力される。
【0034】
このようにして、拡張辞書6との照合の結果、最も大きい類似度(類似度2とする)を与える文字が得られたとき、この類似度2とステップS1で求められた類似度1とを比較する(ステップS5)。この結果、類似度1よりも類似度2の方が大きい場合には、拡張辞書6での認識結果を最終認識結果とし(ステップS6)、類似度2よりも類似度1の方が大きい場合には、標準辞書5での認識結果を最終認識結果とする(ステップS3)。
【0035】
ここで、拡張辞書6は、様々な画像品質の文字画像を標準辞書5で認識させ、標準辞書5で認識できなかった低品質な文字画像から作成されたものである。
【0036】
従って、画像品質の良い画像(原稿)は、画像品質の良い画像から作成されている標準辞書5との照合で、閾値よりも大きな類似度をもつものとして認識されるので、拡張辞書6と照合されることは少なく、認識処理時間を短かくすることができる。
【0037】
また、低品質画像(原稿)は、拡張辞書6との比較照合がなされることで、より高精度な認識が可能になる。
【0038】
このように、本発明では、標準辞書5の他に、さらに、拡張辞書6を設け、拡張辞書6は、様々な画像品質の文字画像を標準辞書5で認識させた結果、標準辞書5で認識できなかった低品質な文字画像から作成されたものであることから、低品質文字についても、認識精度を向上させることができる。
【0042】
換言すれば、本発明の文字認識装置では、基本的に、まず標準辞書5で認識処理を行ない、認識結果の信頼度(確信度)が低い場合などに、拡張辞書6を用いて認識処理を行なう。このことにより品質が良好な原稿は標準辞書5のみのマッチングを行なうだけで、拡張辞書6とのマッチングを行なう必要がないので、処理速度が高速となる。
【0043】
このような文字認識装置で使われるために、標準辞書5は認識対象の文字の全ての文字コード(例えば、記号、平仮名、カタカナ、漢字など)を含む必要があるが、拡張辞書6は、品質の劣化したパターンのみを認識対象にするため、劣化が比較的起こりにくいパターン(例えば、記号、平仮名、カタカナなど)は登録を行なわないことにより、拡張辞書6でのマッチング回数を減らすことで、処理速度の高速化がはかれる。劣化が生じやすく拡張辞書6に登録を行なう必要がある文字としては、例えば「漢字」が挙げられる。「漢字」は平仮名やカタカナなどと比べると、画数が多く、潰れたり、かすれたりすることが多いためである。また、文字認識処理に用いる特徴量として例えば文字の輪郭特徴の場合、輪郭が複雑な文字は劣化が生じ易いことを利用し、認識に用いる特徴量によって判断を行っても良い。また、認識に用いない特徴、例えば黒画素数などを用いて判断を行っても良い。
【0044】
また、本発明において、拡張辞書6は、例えば図3に示すようなシステムを用いて作成される。図3のシステムは、文字画像データを保存し、また、作成した辞書を保存するハードディスク,フロッピーディスクドライブ(FDドライブ),CD−ROMドライブなどの記憶部40と、文字画像データをもとに辞書作成を行なう計算機部(CPU,ROM,RAM)41などを有している。なお、記憶部40は、計算機部41の中に組み込まれ一体となっていても良いし、あるいは、通信装置42によってインターネットなどのネットワークを介してアクセスできれば、通信回線で結ばれた他の装置内に設けられていても良い。
【0045】
図3に示すようなシステムを用いて、拡張辞書6の作成は、次のようにしてなされる。すなわち、まず、ハードディスクなどの記憶部40から多値の文字画像データを読み出す。ここで読み出された画像データは256階調に量子化されているとする(量子化の段階は16,64などでも構わない。また、カラーデータであっても構わない)。この画像データを2値化閾値を、例えば、0から255まで順次変化させて2値化する。2値化することにより「白」と「黒」の2値画像が作られる。ここで作られる2値画像は、2値化閾値によって、潰れた文字画像になったり、かすれた文字画像になったりする。
【0046】
この2値画像をまず良好な品質の文字パターンで作られた標準辞書5を用いて文字認識処理をする。一般に、潰れたり、かすれたりする画像は、標準辞書5では認識できない。そこで、2値化閾値を潰れ方向(2値化閾値の小さな方向)からかすれ方向(2値化閾値の大きな方向)に変化させながら、2値画像を作成し認識処理する場合を例に説明する。潰れ方向から順次かすれ方向に閾値を変化させ認識処理した結果、始めて正しく認識できた2値画像を潰れ限界パターンとする。さらに閾値を変化させながら認識処理を行ない、最後に正しく認識できた2値画像をかすれ限界パターンとする。図4にはこの様子が示されている。ここで、作成された潰れ限界パターンとかすれ限界パターンの2つのパターンから作成される辞書が拡張辞書6になる。
【0047】
図5は拡張辞書6の辞書作成の処理流れを示すフローチャートである。図5を参照すると、まず、2値化閾値thを”0”に初期設定する(ステップS1)。次いで、2値化閾値thを”1”だけ歩進する(ステップS2)。しかる後、グレー画像を2値化閾値thで2値化し(ステップS3)、この2値化画像に対して標準辞書5で認識処理する(ステップS4)。この結果、この2値化画像が図4に示したような潰れ限界画像あるいはかすれ限界画像であるかを判断する(ステップS5)。
【0048】
2値化画像が潰れ限界画像あるいはかすれ限界画像でない場合には、2値化閾値thが”256”以下か否かを判断し(ステップS6)、2値化閾値thが”256”以下でない場合には、ステップS2に戻り、2値化閾値thを”1”だけ歩進し、同様の処理を繰り返し行なう。
【0049】
そして、ステップS5で、2値化画像が潰れ限界画像あるいはかすれ限界画像であると判断された場合には、この潰れ限界画像あるいはかすれ限界画像を劣化パターン画像として保存(登録)する(ステップS7)。次いで、ステップS6に進み、2値化閾値thが”256”以下か否かを判断し(ステップS6)、2値化閾値thが”256”以下でない場合には、ステップS2に戻り、2値化閾値thを”1”だけ歩進し、同様の処理を繰り返し行なう。
【0050】
このような処理を繰り返し行ない、ステップS6で2値化閾値thが”256”以下でなくなったときには、ステップS7で保存(登録)された劣化パターン画像に基づいて拡張辞書6を作成する(ステップS8)。
【0051】
図6には、このように作成された拡張辞書6の認識可能範囲が示されている。図6からわかるように、拡張辞書6を用いることによって、標準辞書5での認識可能範囲を拡張辞書6での認識可能範囲により拡大することができる。
【0052】
このように、本発明では、所定の文字の文字パターンに基づく情報が文字毎に予め記憶されている標準辞書5と、入力画像から文字を切り出す文字切出手段と、未知の文字の文字パターンに基づく情報と標準辞書に予め記憶されている文字毎の情報とをそれぞれ比較照合して、類似度の最も大きい文字を認識結果として出力する認識処理手段とを有する文字認識装置において、多値画像の2値化閾値を、2値画像が潰れる値からかすれる値まで順次変化させ、2値化閾値を順次に変化させるときに得られる2値画像を標準辞書5を用いて認識させ、標準辞書5を用いて始めて認識できた閾値での2値文字パターン(潰れパターン)と、最後に認識できた閾値での2値文字パターン(かすれパターン)とを用いて、拡張辞書6を作成することができる。
【0053】
あるいは、多値画像の2値化閾値を2値画像が潰れる値からかすれる値まで順次変化させ、2値化閾値を順次に変化させるときに得られる2値画像を標準辞書5を用いて認識させ、標準辞書5を用いて始めて認識できた閾値での2値文字パターン(潰れパターン)を用いて、拡張辞書6を作成することもできる。
【0054】
あるいは、多値画像の2値化閾値を、2値画像が潰れる値からかすれる値まで順次変化させ、2値化閾値を順次に変化させるときに得られる2値画像を標準辞書5を用いて認識させ、標準辞書5を用いて最後に認識できた閾値での2値文字パターン(かすれパターン)を用いて、拡張辞書6を作成することもできる。
【0056】
また、図7は図1の文字認識装置のハードウェア構成例を示す図である。図7を参照すると、この文字認識装置は、例えばパーソナルコンピュータ等で実現され、全体を制御するCPU21と、CPU21の制御プログラム等が記憶されているROM22と、CPU21のワークエリア等として使用されるRAM23と、文書を文書画像として読込むスキャナ24と、文書画像に含まれている各文字画像に対し認識処理を行なった結果の情報を出力する結果出力装置(例えば、ディスプレイやプリンタ)26とを有している。
【0057】
ここで、CPU21は、図1の制御部4,前処理部2,認識処理部3の機能を有している。また、RAM23内には、標準辞書5,拡張辞書6を格納することができる。
【0058】
CPU21におけるこのような制御部4,前処理部2,認識処理部3等としての機能は、例えばソフトウェアパッケージ(具体的には、CD−ROM等の情報記録媒体)の形で提供することができ、このため、図3の例では、情報記録媒体30がセットさせるとき、これを駆動する媒体駆動装置31が設けられている。
【0059】
換言すれば、本発明の文字認識装置は、イメージスキャナ,ディスプレイ等を備えた汎用の計算機システムにCD−ROM等の情報記録媒体に記録されたプログラムを読み込ませて、この汎用計算機システムのマイクロプロセッサに前処理,認識処理を実行させる装置構成においても実施することが可能である。この場合、本発明の前処理,認識処理を実行するためのプログラム(すなわち、ハードウェアシステムで用いられるプログラム)は、媒体に記録された状態で提供される。プログラムなどが記録される情報記録媒体としては、CD−ROMに限られるものではなく、ROM,RAM,フレキシブルディスク,メモリカード等が用いられても良い。媒体に記録されたプログラムは、ハードウェアシステムに組み込まれている記憶装置、例えばハードディスク装置にインストールされることにより、このプログラムを実行して、前処理機能、認識処理機能を実現できる。
【0060】
なお、上述の説明では、図3は辞書作成に用いるシステムの構成例として挙げられ、また、図7は図1の文字認識装置のハードウェア構成例として挙げられているが、図3と図7とにおいて、CPU,ROM,RAM、あるいは記憶部40などを共用して、図3と図7とを1つの装置として構成することもできる。
【0061】
【発明の効果】
以上に説明したように、請求項1乃至請求項7記載の発明によれば、標準辞書の他に、認識できなかった文字パターンを登録した拡張辞書をも用いて認識処理を行なうことにより、認識速度を低下させることなく、低品質文字の認識精度をも向上させることができる。すなわち、画像品質の良い画像は高速に、低品質画像でも高精度で認識できる文字認識装置を提供することができる。そして、請求項1乃至請求項7記載の発明によれば、品質が劣化した文字パターンを高速にかつ高精度に認識可能な辞書作成を行なうことができる。
【図面の簡単な説明】
【図1】本発明に係る文字認識装置のブロック図である。
【図2】認識処理部の処理流れを示すフローチャートである。
【図3】辞書作成に用いるシステムの構成例を示す図である。
【図4】潰れ限界画像あるいはかすれ限界画像の保存(登録)を説明するための図である。
【図5】拡張辞書の辞書作成の処理流れを示すフローチャートである。
【図6】作成された拡張辞書の認識可能範囲を示す図である。
【図7】図1の文字認識装置のハードウェア構成例を示す図である。
【符号の説明】
1 画像入力部
2 前処理部
3 認識処理部
4 制御部
5 標準辞書
6 拡張辞書
21 CPU
22 ROM
23 RAM
24 スキャナ
26 結果出力装置
30 情報記録媒体
31 媒体駆動装置
40 記憶部
41 計算機部
42 通信装置

Claims (7)

  1. 入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
    多値画像の2値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化手段と、前記閾値変化手段により2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化手段で2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により始めて正しく認識できた閾値での前記2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴とする文字認識装置。
  2. 入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
    多値画像の2値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化手段と、前記閾値変化手段により2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化手段で2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により最後に正しく認識できた閾値での前記2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴とする文字認識装置。
  3. 入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
    多値画像の2値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化手段と、前記閾値変化手段により2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化手段で2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により始めて正しく認識できた閾値での前記2値化パターンと最後に正しく認識できた閾値での前記2値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴とする文字認識装置。
  4. 入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
    多値画像の2値化閾値を順次変化させる閾値変化ステップと、
    拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
    前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
    始めて正しく認識できた閾値での2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法。
  5. 入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
    多値画像の2値化閾値を順次変化させる閾値変化ステップと、
    拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
    前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
    最後に正しく認識できた閾値での2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法。
  6. 入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
    多値画像の2値化閾値を順次変化させる閾値変化ステップと、
    拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
    前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
    始めて正しく認識できた閾値での2値化パターンと最後に正しく認識できた閾値での2値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法。
  7. 入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法をコンピュータに実行させるためのプログラムを記録した前記コンピュータが読取可能な記録媒体において、
    多値画像の2値化閾値を順次変化させる閾値変化ステップと、
    拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
    前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
    始めて正しく認識できた閾値での2値化パターンと最後に正しく認識できた閾値での2値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法をコンピュータに実行させるためのプログラムを記録した前記コンピュータが読取可能な記録媒体。
JP26895298A 1998-07-01 1998-09-07 文字認識装置および辞書作成方法および記録媒体 Expired - Lifetime JP3868637B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26895298A JP3868637B2 (ja) 1998-07-01 1998-09-07 文字認識装置および辞書作成方法および記録媒体

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10-201193 1998-07-01
JP20119398 1998-07-01
JP26895298A JP3868637B2 (ja) 1998-07-01 1998-09-07 文字認識装置および辞書作成方法および記録媒体

Publications (2)

Publication Number Publication Date
JP2000082113A JP2000082113A (ja) 2000-03-21
JP3868637B2 true JP3868637B2 (ja) 2007-01-17

Family

ID=26512642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26895298A Expired - Lifetime JP3868637B2 (ja) 1998-07-01 1998-09-07 文字認識装置および辞書作成方法および記録媒体

Country Status (1)

Country Link
JP (1) JP3868637B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163637A (ja) * 2000-11-27 2002-06-07 Omron Corp 画像検査装置及び画像検査方法
CN100373399C (zh) * 2004-08-18 2008-03-05 富士通株式会社 建立劣化字典的方法和装置
CN101763516B (zh) * 2010-01-15 2012-02-29 南京航空航天大学 一种基于拟合函数的文字识别方法

Also Published As

Publication number Publication date
JP2000082113A (ja) 2000-03-21

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5212739A (en) Noise tolerant optical character recognition system
US5438630A (en) Word spotting in bitmap images using word bounding boxes and hidden Markov models
JP4607633B2 (ja) 文字方向識別装置、画像形成装置、プログラム、記憶媒体および文字方向識別方法
US5745600A (en) Word spotting in bitmap images using text line bounding boxes and hidden Markov models
JP4031210B2 (ja) 文字認識装置、文字認識方法、及び記録媒体
US5592568A (en) Word spotting in bitmap images using context-sensitive character models without baselines
WO2011128777A2 (en) Segmentation of textual lines in an image that include western characters and hieroglyphic characters
CA2601144C (en) Method and system for adaptive recognition of distorted text in computer images
Marosi Industrial OCR approaches: architecture, algorithms, and adaptation techniques
JP3868637B2 (ja) 文字認識装置および辞書作成方法および記録媒体
Rahiman et al. A detailed study and analysis of ocr research in south indian scripts
Suen et al. Categorizing document images into script and language classes
SAWAKI et al. Recognition of degraded machine-printed characters using a complementary similarity measure and error-correction learning
JP2000067164A (ja) パターン認識方法及び装置並びにテンプレート作成プログラムを記録した記録媒体
JP2020119291A (ja) 情報処理装置及びプログラム
JP2002056356A (ja) 文字認識装置、文字認識方法および記録媒体
JPS63109592A (ja) 文字認識方式
CN112215783B (zh) 一种图像噪点识别方法、装置、存储介质及设备
JP3163698B2 (ja) 文字認識方法
Mori et al. Robust feature extraction based on run-length compensation for degraded handwritten character recognition
Shirali-Shahreza et al. Removing noises similar to dots from Persian scanned documents
JP3428504B2 (ja) 文字認識装置
JP3446794B2 (ja) 文字認識における多角形近似法および文字認識装置

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061010

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061011

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101020

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111020

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121020

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131020

Year of fee payment: 7

EXPY Cancellation because of completion of term