JP3868637B2 - Character recognition device, dictionary creation method, and recording medium - Google Patents

Character recognition device, dictionary creation method, and recording medium Download PDF

Info

Publication number
JP3868637B2
JP3868637B2 JP26895298A JP26895298A JP3868637B2 JP 3868637 B2 JP3868637 B2 JP 3868637B2 JP 26895298 A JP26895298 A JP 26895298A JP 26895298 A JP26895298 A JP 26895298A JP 3868637 B2 JP3868637 B2 JP 3868637B2
Authority
JP
Japan
Prior art keywords
character
binarization
dictionary
pattern
character recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP26895298A
Other languages
Japanese (ja)
Other versions
JP2000082113A (en
Inventor
利夫 宮澤
貴子 大井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP26895298A priority Critical patent/JP3868637B2/en
Publication of JP2000082113A publication Critical patent/JP2000082113A/en
Application granted granted Critical
Publication of JP3868637B2 publication Critical patent/JP3868637B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Landscapes

  • Character Discrimination (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、文字認識装置および辞書作成方法および記録媒体に関する。
【0002】
【従来の技術】
従来、例えば特開平4−242494号には、認識用辞書として、出現頻度の高い文字を含む第1の辞書と、出現頻度の低い文字を含む第2の辞書とを有し、未知の文字パターンの特徴量を、まず、第1の辞書に格納された特徴と照合し、その認識結果についての判定結果により第2の辞書を照合することにより認識精度の低下を防止する技術が示されている。
【0003】
また、従来では、入力画像から文字を切り出して認識処理を行なうとき、標準辞書を用いて認識処理を行なった結果、その文字切り出し位置が間違っていると判断した時には、改めて文字切り出しを行ない、再び標準辞書を用いて認識処理を行なうようにしている。すなわち、誤認識の原因としては、文字が正しく切り出されていないことによるものと、文字は正しく切り出されているがマッチングされないこととの2つに大別することができる。上述した従来の方式では、文字が正しく切り出されていない場合を想定して、まず、標準辞書で認識処理を行ない、その類似度や文字サイズなどから、正しく切り出されていない文字を判定し、再度文字切り出し処理を行ない、新たな文字矩形座標で、再び標準辞書を用いて認識処理を行ない、1回目の結果と、2回目の結果を比較するといった再認識処理を行なっている。
【0004】
【発明が解決しようとする課題】
しかしながら、上述した特開平4−242494号に示されている技術では、2つの辞書を設けているものの、これらの2つの辞書は、出現頻度により分けられているため、低品質文字については、その認識精度を向上させることができなかった。
【0005】
また、文字切り出し位置が間違っていると判断した時に改めて文字切り出しを行ない、標準辞書を用いて再認識する従来の方式においても、標準辞書だけを用いて認識処理を行なっているため、低品質文字については、その認識精度を向上させることができなかった。すなわち、文字認識位置がずれ、かつ、品質が悪い文字については、認識処理を正しく行なうことができないという問題があった。
【0006】
本発明は、特に低品質文字についても、認識精度を向上させることの可能な文字認識装置および辞書作成方法および記録媒体を提供することを目的としている。
【0007】
【課題を解決するための手段】
上記目的を達成するために、請求項1記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の2値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化手段と、前記閾値変化手段により2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化手段で2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により始めて正しく認識できた閾値での前記2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴としている。
【0008】
また、請求項2記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の2値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化手段と、前記閾値変化手段により2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化手段で2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により最後に正しく認識できた閾値での前記2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴としている。
【0009】
また、請求項3記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の2値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化手段と、前記閾値変化手段により2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化手段で2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により始めて正しく認識できた閾値での前記2値化パターンと最後に正しく認識できた閾値での前記2値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴としている。
【0010】
また、請求項4記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の2値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴としている。
【0011】
また、請求項5記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の2値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
最後に正しく認識できた閾値での2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴としている。
【0012】
また、請求項6記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の2値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での2値化パターンと最後に正しく認識できた閾値での2値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴としている。
【0013】
また、請求項7記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法をコンピュータに実行させるためのプログラムを記録した前記コンピュータが読取可能な記録媒体において、
多値画像の2値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での2値化パターンと最後に正しく認識できた閾値での2値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法をコンピュータに実行させるためのプログラムを記録した前記コンピュータが読取可能な記録媒体である。
【0024】
【発明の実施の形態】
以下、本発明の実施形態を図面に基づいて説明する。図1は本発明に係る文字認識装置のブロック図である。図1を参照すると、この文字認識装置は、所定の文字の認識処理用の標準情報が文字毎に予め記憶されている標準辞書5と、画像を入力する画像入力部1(例えば、スキャナなど)と、入力画像から文字を切り出したりする前処理部2と、未知の文字の文字パターンに基づく情報と標準辞書5に予め記憶されている文字毎の標準情報とをそれぞれ比較照合して、類似度の最も大きい文字を認識結果として出力する認識処理部3と、全体を制御する制御部4とを有しており、この文字認識装置では、標準辞書5の他に、さらに、拡張辞書6を設け、該拡張辞書6には、標準辞書5を用いて正しく識別できなかった文字について、該文字の文字パターンに基づく情報が記憶されている。
【0025】
より詳しくは、標準辞書5には、全ての認識対象文字についての文字パターンに基づく情報が記憶されるようになっており、そして、標準辞書5は、文字品質の良好な文字パターンのみから作成されている。また、拡張辞書6には、全ての認識対象文字のうちの一部の認識対象文字についての文字パターンに基づく情報のみが記憶されるようになっている。特に、漢字の文字パターンに基づく情報のみが記憶されるようになっている。
【0026】
なお、標準辞書5,拡張辞書6に記憶されている文字パターンに基づく情報としては、文字パターンそのものである場合と、文字パターンから抽出された特徴量である場合とが考えられる。
【0027】
標準辞書5,拡張辞書6に記憶されている文字パターンに基づく情報が、文字パターンから抽出された特徴量である場合には、認識処理部3は、未知の文字の文字パターンから特徴量を抽出し、該特徴量と標準辞書5,拡張辞書6に予め記憶されている文字毎の特徴量とをそれぞれ比較照合するようになっている。また、標準辞書5,拡張辞書6に記憶されている文字パターンに基づく情報が、文字パターンそのものである場合には、認識処理部3は、未知の文字の文字パターンと標準辞書5,拡張辞書6に予め記憶されている文字毎の文字パターンとをそれぞれ比較照合するようになっている。本発明は、標準辞書5,拡張辞書6に記憶されている文字パターンに基づく情報としては、文字パターンそのものである場合と、文字パターンから抽出された特徴量である場合とのいずれにも適用可能である。
【0028】
また、制御部4は、画像入力部1,前処理部2,認識処理部3の制御を行なったり、標準辞書5と拡張辞書6との切り替え制御を行なうようになっている。
【0029】
次に、上述のような構成の文字認識装置の処理動作を説明する。この文字認識装置では、まず、画像入力部1により、認識処理を行ないたい原稿,帳票などを読み込む。このように、入力画像が読み込まれると、前処理部2では、読み込まれた原稿がカラーや多値画像原稿である場合は、2値化処理を行なったり、文字と表,図などを識別する領域識別処理や、文字領域に対して行を切り出す行切り出し処理や、文字を切り出す文字切り出し処理などを行なう。このようにして、前処理部2では、最終的には、入力画像から認識対象となる文字(文字画像)が切り出されて出力される。このことからわかるように、前処理部2は、文字切出部としての機能を含んでいる。
【0030】
次に、認識処理部3では、前処理部2で切り出された文字の文字パターンに基づく情報を、標準辞書5および/または拡張辞書6と照合する。
【0031】
図2は認識処理部3の処理流れを示すフローチャートである。図2を参照すると、前処理部2で文字が切り出されると、認識処理部3では、切り出された文字の文字パターンに基づく情報を、先ず、標準辞書5と比較照合する(ステップS1)。この比較照合では、標準辞書5内の全ての文字についての情報との比較照合がなされ、最も大きい類似度を与える文字が標準辞書5での認識結果として出力される。
【0032】
このようにして、標準辞書5との照合の結果、最も大きい類似度(類似度1とする)を与える文字が得られたとき、この類似度1と予め定められた閾値とを比較する(ステップS2)。この結果、閾値よりも類似度1が大きかった場合、拡張辞書6との比較照合は行なわず、標準辞書5との比較照合結果(すなわち、最も大きい類似度(類似度1)を与える文字)を最終認識結果とする(ステップS3)。
【0033】
これに対し、ステップS2において、類似度1が閾値よりも大きくないときには、さらに、拡張辞書6との比較照合を行なう(ステップS4)。この比較照合では、拡張辞書6内の全ての文字についての情報との比較照合がなされ、最も大きい類似度を与える文字が拡張辞書6での認識結果として出力される。
【0034】
このようにして、拡張辞書6との照合の結果、最も大きい類似度(類似度2とする)を与える文字が得られたとき、この類似度2とステップS1で求められた類似度1とを比較する(ステップS5)。この結果、類似度1よりも類似度2の方が大きい場合には、拡張辞書6での認識結果を最終認識結果とし(ステップS6)、類似度2よりも類似度1の方が大きい場合には、標準辞書5での認識結果を最終認識結果とする(ステップS3)。
【0035】
ここで、拡張辞書6は、様々な画像品質の文字画像を標準辞書5で認識させ、標準辞書5で認識できなかった低品質な文字画像から作成されたものである。
【0036】
従って、画像品質の良い画像(原稿)は、画像品質の良い画像から作成されている標準辞書5との照合で、閾値よりも大きな類似度をもつものとして認識されるので、拡張辞書6と照合されることは少なく、認識処理時間を短かくすることができる。
【0037】
また、低品質画像(原稿)は、拡張辞書6との比較照合がなされることで、より高精度な認識が可能になる。
【0038】
このように、本発明では、標準辞書5の他に、さらに、拡張辞書6を設け、拡張辞書6は、様々な画像品質の文字画像を標準辞書5で認識させた結果、標準辞書5で認識できなかった低品質な文字画像から作成されたものであることから、低品質文字についても、認識精度を向上させることができる。
【0042】
換言すれば、本発明の文字認識装置では、基本的に、まず標準辞書5で認識処理を行ない、認識結果の信頼度(確信度)が低い場合などに、拡張辞書6を用いて認識処理を行なう。このことにより品質が良好な原稿は標準辞書5のみのマッチングを行なうだけで、拡張辞書6とのマッチングを行なう必要がないので、処理速度が高速となる。
【0043】
このような文字認識装置で使われるために、標準辞書5は認識対象の文字の全ての文字コード(例えば、記号、平仮名、カタカナ、漢字など)を含む必要があるが、拡張辞書6は、品質の劣化したパターンのみを認識対象にするため、劣化が比較的起こりにくいパターン(例えば、記号、平仮名、カタカナなど)は登録を行なわないことにより、拡張辞書6でのマッチング回数を減らすことで、処理速度の高速化がはかれる。劣化が生じやすく拡張辞書6に登録を行なう必要がある文字としては、例えば「漢字」が挙げられる。「漢字」は平仮名やカタカナなどと比べると、画数が多く、潰れたり、かすれたりすることが多いためである。また、文字認識処理に用いる特徴量として例えば文字の輪郭特徴の場合、輪郭が複雑な文字は劣化が生じ易いことを利用し、認識に用いる特徴量によって判断を行っても良い。また、認識に用いない特徴、例えば黒画素数などを用いて判断を行っても良い。
【0044】
また、本発明において、拡張辞書6は、例えば図3に示すようなシステムを用いて作成される。図3のシステムは、文字画像データを保存し、また、作成した辞書を保存するハードディスク,フロッピーディスクドライブ(FDドライブ),CD−ROMドライブなどの記憶部40と、文字画像データをもとに辞書作成を行なう計算機部(CPU,ROM,RAM)41などを有している。なお、記憶部40は、計算機部41の中に組み込まれ一体となっていても良いし、あるいは、通信装置42によってインターネットなどのネットワークを介してアクセスできれば、通信回線で結ばれた他の装置内に設けられていても良い。
【0045】
図3に示すようなシステムを用いて、拡張辞書6の作成は、次のようにしてなされる。すなわち、まず、ハードディスクなどの記憶部40から多値の文字画像データを読み出す。ここで読み出された画像データは256階調に量子化されているとする(量子化の段階は16,64などでも構わない。また、カラーデータであっても構わない)。この画像データを2値化閾値を、例えば、0から255まで順次変化させて2値化する。2値化することにより「白」と「黒」の2値画像が作られる。ここで作られる2値画像は、2値化閾値によって、潰れた文字画像になったり、かすれた文字画像になったりする。
【0046】
この2値画像をまず良好な品質の文字パターンで作られた標準辞書5を用いて文字認識処理をする。一般に、潰れたり、かすれたりする画像は、標準辞書5では認識できない。そこで、2値化閾値を潰れ方向(2値化閾値の小さな方向)からかすれ方向(2値化閾値の大きな方向)に変化させながら、2値画像を作成し認識処理する場合を例に説明する。潰れ方向から順次かすれ方向に閾値を変化させ認識処理した結果、始めて正しく認識できた2値画像を潰れ限界パターンとする。さらに閾値を変化させながら認識処理を行ない、最後に正しく認識できた2値画像をかすれ限界パターンとする。図4にはこの様子が示されている。ここで、作成された潰れ限界パターンとかすれ限界パターンの2つのパターンから作成される辞書が拡張辞書6になる。
【0047】
図5は拡張辞書6の辞書作成の処理流れを示すフローチャートである。図5を参照すると、まず、2値化閾値thを”0”に初期設定する(ステップS1)。次いで、2値化閾値thを”1”だけ歩進する(ステップS2)。しかる後、グレー画像を2値化閾値thで2値化し(ステップS3)、この2値化画像に対して標準辞書5で認識処理する(ステップS4)。この結果、この2値化画像が図4に示したような潰れ限界画像あるいはかすれ限界画像であるかを判断する(ステップS5)。
【0048】
2値化画像が潰れ限界画像あるいはかすれ限界画像でない場合には、2値化閾値thが”256”以下か否かを判断し(ステップS6)、2値化閾値thが”256”以下でない場合には、ステップS2に戻り、2値化閾値thを”1”だけ歩進し、同様の処理を繰り返し行なう。
【0049】
そして、ステップS5で、2値化画像が潰れ限界画像あるいはかすれ限界画像であると判断された場合には、この潰れ限界画像あるいはかすれ限界画像を劣化パターン画像として保存(登録)する(ステップS7)。次いで、ステップS6に進み、2値化閾値thが”256”以下か否かを判断し(ステップS6)、2値化閾値thが”256”以下でない場合には、ステップS2に戻り、2値化閾値thを”1”だけ歩進し、同様の処理を繰り返し行なう。
【0050】
このような処理を繰り返し行ない、ステップS6で2値化閾値thが”256”以下でなくなったときには、ステップS7で保存(登録)された劣化パターン画像に基づいて拡張辞書6を作成する(ステップS8)。
【0051】
図6には、このように作成された拡張辞書6の認識可能範囲が示されている。図6からわかるように、拡張辞書6を用いることによって、標準辞書5での認識可能範囲を拡張辞書6での認識可能範囲により拡大することができる。
【0052】
このように、本発明では、所定の文字の文字パターンに基づく情報が文字毎に予め記憶されている標準辞書5と、入力画像から文字を切り出す文字切出手段と、未知の文字の文字パターンに基づく情報と標準辞書に予め記憶されている文字毎の情報とをそれぞれ比較照合して、類似度の最も大きい文字を認識結果として出力する認識処理手段とを有する文字認識装置において、多値画像の2値化閾値を、2値画像が潰れる値からかすれる値まで順次変化させ、2値化閾値を順次に変化させるときに得られる2値画像を標準辞書5を用いて認識させ、標準辞書5を用いて始めて認識できた閾値での2値文字パターン(潰れパターン)と、最後に認識できた閾値での2値文字パターン(かすれパターン)とを用いて、拡張辞書6を作成することができる。
【0053】
あるいは、多値画像の2値化閾値を2値画像が潰れる値からかすれる値まで順次変化させ、2値化閾値を順次に変化させるときに得られる2値画像を標準辞書5を用いて認識させ、標準辞書5を用いて始めて認識できた閾値での2値文字パターン(潰れパターン)を用いて、拡張辞書6を作成することもできる。
【0054】
あるいは、多値画像の2値化閾値を、2値画像が潰れる値からかすれる値まで順次変化させ、2値化閾値を順次に変化させるときに得られる2値画像を標準辞書5を用いて認識させ、標準辞書5を用いて最後に認識できた閾値での2値文字パターン(かすれパターン)を用いて、拡張辞書6を作成することもできる。
【0056】
また、図7は図1の文字認識装置のハードウェア構成例を示す図である。図7を参照すると、この文字認識装置は、例えばパーソナルコンピュータ等で実現され、全体を制御するCPU21と、CPU21の制御プログラム等が記憶されているROM22と、CPU21のワークエリア等として使用されるRAM23と、文書を文書画像として読込むスキャナ24と、文書画像に含まれている各文字画像に対し認識処理を行なった結果の情報を出力する結果出力装置(例えば、ディスプレイやプリンタ)26とを有している。
【0057】
ここで、CPU21は、図1の制御部4,前処理部2,認識処理部3の機能を有している。また、RAM23内には、標準辞書5,拡張辞書6を格納することができる。
【0058】
CPU21におけるこのような制御部4,前処理部2,認識処理部3等としての機能は、例えばソフトウェアパッケージ(具体的には、CD−ROM等の情報記録媒体)の形で提供することができ、このため、図3の例では、情報記録媒体30がセットさせるとき、これを駆動する媒体駆動装置31が設けられている。
【0059】
換言すれば、本発明の文字認識装置は、イメージスキャナ,ディスプレイ等を備えた汎用の計算機システムにCD−ROM等の情報記録媒体に記録されたプログラムを読み込ませて、この汎用計算機システムのマイクロプロセッサに前処理,認識処理を実行させる装置構成においても実施することが可能である。この場合、本発明の前処理,認識処理を実行するためのプログラム(すなわち、ハードウェアシステムで用いられるプログラム)は、媒体に記録された状態で提供される。プログラムなどが記録される情報記録媒体としては、CD−ROMに限られるものではなく、ROM,RAM,フレキシブルディスク,メモリカード等が用いられても良い。媒体に記録されたプログラムは、ハードウェアシステムに組み込まれている記憶装置、例えばハードディスク装置にインストールされることにより、このプログラムを実行して、前処理機能、認識処理機能を実現できる。
【0060】
なお、上述の説明では、図3は辞書作成に用いるシステムの構成例として挙げられ、また、図7は図1の文字認識装置のハードウェア構成例として挙げられているが、図3と図7とにおいて、CPU,ROM,RAM、あるいは記憶部40などを共用して、図3と図7とを1つの装置として構成することもできる。
【0061】
【発明の効果】
以上に説明したように、請求項1乃至請求項7記載の発明によれば、標準辞書の他に、認識できなかった文字パターンを登録した拡張辞書をも用いて認識処理を行なうことにより、認識速度を低下させることなく、低品質文字の認識精度をも向上させることができる。すなわち、画像品質の良い画像は高速に、低品質画像でも高精度で認識できる文字認識装置を提供することができる。そして、請求項1乃至請求項7記載の発明によれば、品質が劣化した文字パターンを高速にかつ高精度に認識可能な辞書作成を行なうことができる。
【図面の簡単な説明】
【図1】本発明に係る文字認識装置のブロック図である。
【図2】認識処理部の処理流れを示すフローチャートである。
【図3】辞書作成に用いるシステムの構成例を示す図である。
【図4】潰れ限界画像あるいはかすれ限界画像の保存(登録)を説明するための図である。
【図5】拡張辞書の辞書作成の処理流れを示すフローチャートである。
【図6】作成された拡張辞書の認識可能範囲を示す図である。
【図7】図1の文字認識装置のハードウェア構成例を示す図である。
【符号の説明】
1 画像入力部
2 前処理部
3 認識処理部
4 制御部
5 標準辞書
6 拡張辞書
21 CPU
22 ROM
23 RAM
24 スキャナ
26 結果出力装置
30 情報記録媒体
31 媒体駆動装置
40 記憶部
41 計算機部
42 通信装置
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a character recognition device, a dictionary creation method, and a recording medium.
[0002]
[Prior art]
Conventionally, for example, in Japanese Patent Laid-Open No. Hei 4-242494, as a recognition dictionary, an unknown character pattern has a first dictionary including characters with high appearance frequency and a second dictionary including characters with low appearance frequency. First, a technique is shown in which the feature amount is compared with the feature stored in the first dictionary, and the second dictionary is checked based on the determination result of the recognition result, thereby preventing a reduction in recognition accuracy. .
[0003]
Further, conventionally, when performing recognition processing by cutting out characters from an input image, if it is determined that the character cut-out position is incorrect as a result of performing recognition processing using a standard dictionary, character extraction is performed again, Recognition processing is performed using a standard dictionary. That is, the cause of misrecognition can be broadly divided into two, that is, the fact that characters are not cut out correctly, and the case that characters are cut out correctly but are not matched. In the conventional method described above, assuming that characters are not cut out correctly, first, recognition processing is performed using a standard dictionary, and characters that are not cut out correctly are determined based on their similarity and character size. Character recognition processing is performed, new character rectangular coordinates are used to perform recognition processing again using the standard dictionary, and re-recognition processing is performed such that the first result is compared with the second result.
[0004]
[Problems to be solved by the invention]
However, although the technique disclosed in the above-mentioned Japanese Patent Application Laid-Open No. 4-242494 provides two dictionaries, these two dictionaries are divided according to the appearance frequency. Recognition accuracy could not be improved.
[0005]
In addition, in the conventional method of re-recognizing using the standard dictionary by re-cutting the character when it is determined that the character cut-out position is wrong, the recognition process is performed using only the standard dictionary. The recognition accuracy could not be improved. That is, there is a problem that the character recognition position is shifted and the character having poor quality cannot be correctly recognized.
[0006]
An object of the present invention is to provide a character recognition device, a dictionary creation method, and a recording medium capable of improving recognition accuracy especially for low-quality characters.
[0007]
[Means for Solving the Problems]
To achieve the above object, the invention according to claim 1 compares information based on a character pattern of an unknown character cut out from an input image with information based on a character pattern stored in a standard dictionary or an extended dictionary. In a character recognition device that performs character recognition by
Threshold changing means for sequentially changing the binarization threshold value of the multi-value image, and binarization means for binarizing the multi-value character image data for creating the extended dictionary by the binarization threshold value to generate a binarization pattern For each of the binarization patterns of the character image data binarized by the binarization means while sequentially changing the binarization threshold from the crushing direction to the fading direction by the threshold change means, a standard dictionary is used. An extension for creating the extended dictionary using character recognition means for performing character recognition using information based on stored character patterns, and the binarized pattern at a threshold value that can be correctly recognized for the first time by the character recognition means. And a dictionary creating means.
[0008]
The invention according to claim 2 performs character recognition by comparing information based on a character pattern of an unknown character cut out from an input image with information based on a character pattern stored in a standard dictionary or an extended dictionary. In a character recognition device,
Threshold changing means for sequentially changing the binarization threshold value of the multi-value image, and binarization means for binarizing the multi-value character image data for creating the extended dictionary by the binarization threshold value to generate a binarization pattern For each of the binarization patterns of the character image data binarized by the binarization means while sequentially changing the binarization threshold from the crushing direction to the fading direction by the threshold change means, a standard dictionary is used. The extended dictionary is created by using character recognition means for performing character recognition using information based on the stored character pattern, and the binarized pattern at the threshold value that was finally correctly recognized by the character recognition means. And an extended dictionary creating means.
[0009]
The invention according to claim 3 performs character recognition by comparing information based on a character pattern of an unknown character cut out from an input image with information based on a character pattern stored in a standard dictionary or an extended dictionary. In a character recognition device,
Threshold changing means for sequentially changing the binarization threshold value of the multi-value image, and binarization means for binarizing the multi-value character image data for creating the extended dictionary by the binarization threshold value to generate a binarization pattern For each of the binarization patterns of the character image data binarized by the binarization means while sequentially changing the binarization threshold from the crushing direction to the fading direction by the threshold change means, a standard dictionary is used. Character recognition means for performing character recognition using information based on a stored character pattern, the binarized pattern at a threshold value that can be correctly recognized for the first time by the character recognition means, and the threshold value that can be correctly recognized at the end An extended dictionary creating means for creating the extended dictionary using a binarized pattern is provided.
[0010]
The invention according to claim 4 performs character recognition by comparing information based on a character pattern of an unknown character cut out from an input image with information based on a character pattern stored in a standard dictionary or an extended dictionary. In the dictionary creation method in the character recognition device,
A threshold changing step for sequentially changing the binarization threshold of the multi-valued image;
A binarization step of binarizing the multi-value character image data for creating an extended dictionary with the binarization threshold value to generate a binarization pattern;
For each of the binarization patterns of the character image data binarized by the binarization step while sequentially changing the binarization threshold from the squashing direction to the fading direction by the threshold value changing step, it is stored in the standard dictionary. A character recognition step for performing character recognition using information based on the character pattern
And an extended dictionary creating step for creating the extended dictionary using a binarized pattern with a threshold value that can be correctly recognized for the first time.
[0011]
The invention according to claim 5 performs character recognition by comparing information based on a character pattern of an unknown character cut out from an input image with information based on a character pattern stored in a standard dictionary or an extended dictionary. In the dictionary creation method in the character recognition device,
A threshold changing step for sequentially changing the binarization threshold of the multi-valued image;
A binarization step of binarizing the multi-value character image data for creating an extended dictionary with the binarization threshold value to generate a binarization pattern;
For each of the binarization patterns of the character image data binarized by the binarization step while sequentially changing the binarization threshold from the squashing direction to the fading direction by the threshold value changing step, it is stored in the standard dictionary. A character recognition step for performing character recognition using information based on the character pattern
And an extended dictionary creating step for creating the extended dictionary using a binarized pattern with a threshold value that can be recognized correctly last.
[0012]
The invention according to claim 6 performs character recognition by comparing information based on a character pattern of an unknown character cut out from an input image with information based on a character pattern stored in a standard dictionary or an extended dictionary. In the dictionary creation method in the character recognition device,
A threshold changing step for sequentially changing the binarization threshold of the multi-valued image;
A binarization step of binarizing the multi-value character image data for creating an extended dictionary with the binarization threshold value to generate a binarization pattern;
For each of the binarization patterns of the character image data binarized by the binarization step while sequentially changing the binarization threshold from the squashing direction to the fading direction by the threshold value changing step, it is stored in the standard dictionary. A character recognition step for performing character recognition using information based on the character pattern
And an extended dictionary creating step for creating the extended dictionary using a binarized pattern with a threshold value that can be correctly recognized for the first time and a binarized pattern with a threshold value that can be correctly recognized at the end. It is said.
[0013]
The invention according to claim 7 performs character recognition by comparing information based on a character pattern of an unknown character cut out from an input image with information based on a character pattern stored in a standard dictionary or an extended dictionary. In the computer-readable recording medium recording a program for causing a computer to execute a dictionary creation method in a character recognition device,
A threshold changing step for sequentially changing the binarization threshold of the multi-valued image;
A binarization step of binarizing the multi-value character image data for creating an extended dictionary with the binarization threshold value to generate a binarization pattern;
For each of the binarization patterns of the character image data binarized by the binarization step while sequentially changing the binarization threshold from the squashing direction to the fading direction by the threshold value changing step, it is stored in the standard dictionary. A character recognition step for performing character recognition using information based on the character pattern
And an extended dictionary creating step for creating the extended dictionary using a binarized pattern with a threshold value that can be correctly recognized for the first time and a binarized pattern with a threshold value that can be correctly recognized at the end. The computer-readable recording medium having recorded thereon a program for causing a computer to execute the dictionary creation method.
[0024]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a block diagram of a character recognition apparatus according to the present invention. Referring to FIG. 1, this character recognition device includes a standard dictionary 5 in which standard information for recognition processing of a predetermined character is stored in advance for each character, and an image input unit 1 (for example, a scanner) for inputting an image. The preprocessing unit 2 that cuts out characters from the input image, the information based on the character pattern of unknown characters and the standard information for each character stored in advance in the standard dictionary 5 are compared and collated. A recognition processing unit 3 that outputs the largest character as a recognition result, and a control unit 4 that controls the entire character. In this character recognition device, in addition to the standard dictionary 5, an extended dictionary 6 is further provided. The extended dictionary 6 stores information based on the character pattern of characters that could not be correctly identified using the standard dictionary 5.
[0025]
More specifically, the standard dictionary 5 stores information based on character patterns for all recognition target characters, and the standard dictionary 5 is created only from character patterns having good character quality. ing. The extended dictionary 6 stores only information based on the character pattern for some of the recognition target characters among all the recognition target characters. In particular, only information based on kanji character patterns is stored.
[0026]
Note that the information based on the character patterns stored in the standard dictionary 5 and the extended dictionary 6 may be a character pattern itself or a feature amount extracted from the character pattern.
[0027]
When the information based on the character patterns stored in the standard dictionary 5 and the extended dictionary 6 is the feature amount extracted from the character pattern, the recognition processing unit 3 extracts the feature amount from the character pattern of the unknown character. The feature quantity is compared and collated with the feature quantity for each character stored in the standard dictionary 5 and the extended dictionary 6 in advance. If the information based on the character pattern stored in the standard dictionary 5 and the extended dictionary 6 is the character pattern itself, the recognition processing unit 3 determines whether the character pattern of the unknown character is the standard dictionary 5 or the extended dictionary 6. Each character pattern stored in advance is compared and collated. The present invention is applicable to both the case where the information based on the character pattern stored in the standard dictionary 5 and the extended dictionary 6 is the character pattern itself or the feature amount extracted from the character pattern. It is.
[0028]
The control unit 4 controls the image input unit 1, the preprocessing unit 2, and the recognition processing unit 3, and controls switching between the standard dictionary 5 and the extended dictionary 6.
[0029]
Next, the processing operation of the character recognition device configured as described above will be described. In this character recognition apparatus, first, the image input unit 1 reads a document, a form, or the like to be recognized. As described above, when the input image is read, the preprocessing unit 2 performs binarization processing or identifies characters, tables, figures, and the like when the read original is a color or multi-value image original. Area identification processing, line cutout processing for cutting out lines from character regions, character cutout processing for cutting out characters, and the like are performed. In this way, the preprocessing unit 2 finally cuts out a character (character image) to be recognized from the input image and outputs it. As can be seen from this, the preprocessing unit 2 includes a function as a character cutout unit.
[0030]
Next, the recognition processing unit 3 collates information based on the character pattern of the character extracted by the preprocessing unit 2 with the standard dictionary 5 and / or the extended dictionary 6.
[0031]
FIG. 2 is a flowchart showing a processing flow of the recognition processing unit 3. Referring to FIG. 2, when a character is cut out by the preprocessing unit 2, the recognition processing unit 3 first compares and collates information based on the character pattern of the cut out character with the standard dictionary 5 (step S1). In this comparison / collation, comparison / collation with information on all characters in the standard dictionary 5 is performed, and a character giving the highest similarity is output as a recognition result in the standard dictionary 5.
[0032]
In this way, when a character having the highest similarity (similarity 1) is obtained as a result of collation with the standard dictionary 5, the similarity 1 is compared with a predetermined threshold (step) S2). As a result, when the similarity 1 is larger than the threshold value, the comparison with the extended dictionary 6 is not performed, and the result of comparison with the standard dictionary 5 (that is, the character giving the largest similarity (similarity 1)) is obtained. The final recognition result is set (step S3).
[0033]
On the other hand, when the similarity 1 is not greater than the threshold value in step S2, comparison with the extended dictionary 6 is further performed (step S4). In this comparison / collation, comparison / collation with information on all characters in the extended dictionary 6 is performed, and a character giving the highest similarity is output as a recognition result in the expanded dictionary 6.
[0034]
In this way, when a character giving the highest similarity (similarity 2) is obtained as a result of collation with the extended dictionary 6, the similarity 2 and the similarity 1 obtained in step S1 are obtained. Compare (step S5). As a result, when the similarity 2 is larger than the similarity 1, the recognition result in the extended dictionary 6 is set as the final recognition result (step S6), and the similarity 1 is larger than the similarity 2. Uses the recognition result in the standard dictionary 5 as the final recognition result (step S3).
[0035]
Here, the extended dictionary 6 is created from low-quality character images that cannot be recognized by the standard dictionary 5 because character images of various image qualities are recognized by the standard dictionary 5.
[0036]
Accordingly, an image (original) with good image quality is recognized as having a similarity greater than the threshold value by collation with the standard dictionary 5 created from an image with good image quality. The recognition processing time can be shortened.
[0037]
Further, the low quality image (original) can be recognized with higher accuracy by being compared with the extended dictionary 6.
[0038]
As described above, in the present invention, in addition to the standard dictionary 5, the extended dictionary 6 is further provided. The extended dictionary 6 recognizes the character image having various image qualities in the standard dictionary 5, and as a result, recognizes it in the standard dictionary 5. Since it was created from a low-quality character image that could not be made, the recognition accuracy can be improved even for low-quality characters.
[0042]
In other words, in the character recognition device of the present invention, the recognition process is basically performed using the extended dictionary 6 when the recognition process is first performed by the standard dictionary 5 and the reliability (confidence level) of the recognition result is low. Do. As a result, a manuscript with good quality only needs to be matched only with the standard dictionary 5, and does not need to be matched with the extended dictionary 6. Therefore, the processing speed is increased.
[0043]
In order to be used in such a character recognition device, the standard dictionary 5 needs to include all character codes (for example, symbols, hiragana, katakana, kanji, etc.) of characters to be recognized. Since only the degraded pattern is recognized as a recognition target, a pattern (for example, a symbol, hiragana, katakana, etc.) that is relatively unlikely to be degraded is not registered, thereby reducing the number of matchings in the extended dictionary 6. The speed can be increased. Examples of characters that are likely to deteriorate and need to be registered in the extended dictionary 6 include “kanji”. This is because “Kanji” has a larger number of strokes and is often crushed or blurred compared to Hiragana and Katakana. In addition, for example, in the case of a contour feature of a character as a feature amount used for character recognition processing, it may be determined based on a feature amount used for recognition using the fact that a character with a complicated contour is likely to deteriorate. Alternatively, the determination may be made using features not used for recognition, such as the number of black pixels.
[0044]
In the present invention, the extended dictionary 6 is created by using a system as shown in FIG. 3, for example. The system shown in FIG. 3 stores character image data and stores a created dictionary, such as a hard disk, a floppy disk drive (FD drive), a CD-ROM drive, and the like, and a dictionary based on the character image data. A computer unit (CPU, ROM, RAM) 41 for performing the creation is included. The storage unit 40 may be integrated and integrated in the computer unit 41, or in another device connected by a communication line if the communication device 42 can be accessed via a network such as the Internet. May be provided.
[0045]
Using the system shown in FIG. 3, the extended dictionary 6 is created as follows. That is, first, multi-value character image data is read from the storage unit 40 such as a hard disk. Here, it is assumed that the read image data is quantized to 256 gradations (the quantization stage may be 16, 64, etc., or may be color data). This image data is binarized by sequentially changing the binarization threshold, for example, from 0 to 255. By binarizing, a binary image of “white” and “black” is created. The binary image created here becomes a crushed character image or a blurred character image depending on the binarization threshold.
[0046]
The binary image is first subjected to character recognition processing using the standard dictionary 5 made with a good quality character pattern. In general, the standard dictionary 5 cannot recognize an image that is crushed or blurred. Therefore, a case will be described as an example in which a binary image is created and recognized while changing the binarization threshold from the collapse direction (the direction in which the binarization threshold is small) to the blur direction (the direction in which the binarization threshold is large). . As a result of performing recognition processing by sequentially changing the threshold value from the collapse direction to the blur direction, a binary image that can be correctly recognized for the first time is defined as a collapse limit pattern. Further, recognition processing is performed while changing the threshold value, and the binary image that is finally recognized correctly is defined as a blur limit pattern. FIG. 4 shows this state. Here, the dictionary created from the two patterns of the collapse limit pattern and the blur limit pattern created is the extended dictionary 6.
[0047]
FIG. 5 is a flowchart showing the processing flow for creating the dictionary of the extended dictionary 6. Referring to FIG. 5, first, the binarization threshold th is initially set to “0” (step S1). Next, the binarization threshold th is incremented by “1” (step S2). Thereafter, the gray image is binarized with the binarization threshold th (step S3), and the binarized image is recognized by the standard dictionary 5 (step S4). As a result, it is determined whether the binarized image is a collapse limit image or a blur limit image as shown in FIG. 4 (step S5).
[0048]
If the binarized image is not a collapse limit image or a blur limit image, it is determined whether or not the binarization threshold th is “256” or less (step S6), and the binarization threshold th is not “256” or less. In step S2, the binarization threshold th is incremented by “1”, and the same processing is repeated.
[0049]
When it is determined in step S5 that the binarized image is a collapse limit image or a blur limit image, the collapse limit image or the blur limit image is stored (registered) as a degradation pattern image (step S7). . Next, the process proceeds to step S6, and it is determined whether or not the binarization threshold th is “256” or less (step S6). If the binarization threshold th is not “256” or less, the process returns to step S2, and the binary The threshold value th is incremented by “1” and the same processing is repeated.
[0050]
Such processing is repeated, and when the binarization threshold th is not less than “256” in step S6, the extended dictionary 6 is created based on the deteriorated pattern image stored (registered) in step S7 (step S8). ).
[0051]
FIG. 6 shows the recognizable range of the extended dictionary 6 created in this way. As can be seen from FIG. 6, by using the extended dictionary 6, the recognizable range in the standard dictionary 5 can be expanded by the recognizable range in the extended dictionary 6.
[0052]
As described above, in the present invention, the standard dictionary 5 in which information based on the character pattern of a predetermined character is stored in advance for each character, the character cutting means for cutting out the character from the input image, and the character pattern of the unknown character. In a character recognition apparatus having a recognition processing means for comparing and collating information based on information and information for each character stored in advance in a standard dictionary and outputting a character having the highest similarity as a recognition result, The binarization threshold value is sequentially changed from a value at which the binary image is crushed to a value at which the binary image is crushed, and the binary image obtained when the binarization threshold value is sequentially changed is recognized using the standard dictionary 5. The extended dictionary 6 can be created by using the binary character pattern (collapse pattern) at the threshold value recognized for the first time using the binary character pattern (blurred pattern) at the threshold value recognized last. .
[0053]
Alternatively, the binarization threshold of the multi-valued image is sequentially changed from a value at which the binary image is crushed to a value at which the binary image is crushed, and the binary image obtained when the binarization threshold is sequentially changed is recognized using the standard dictionary 5 The extended dictionary 6 can also be created using a binary character pattern (collapse pattern) with a threshold that can be recognized for the first time using the standard dictionary 5.
[0054]
Alternatively, the binarization threshold of the multi-valued image is sequentially changed from a value at which the binary image is crushed to a value to be blurred, and the binary image obtained when the binarization threshold is sequentially changed is recognized using the standard dictionary 5. The extended dictionary 6 can also be created using a binary character pattern (blurred pattern) with a threshold value that can be recognized last by using the standard dictionary 5.
[0056]
FIG. 7 is a diagram illustrating a hardware configuration example of the character recognition device of FIG. Referring to FIG. 7, this character recognition device is realized by, for example, a personal computer, and the CPU 21 that controls the whole, a ROM 22 that stores a control program of the CPU 21, and a RAM 23 that is used as a work area of the CPU 21, etc. A scanner 24 for reading the document as a document image, and a result output device (for example, a display or a printer) 26 for outputting information on the result of recognition processing for each character image included in the document image. is doing.
[0057]
Here, the CPU 21 has the functions of the control unit 4, the preprocessing unit 2, and the recognition processing unit 3 in FIG. 1. In addition, the standard dictionary 5 and the extended dictionary 6 can be stored in the RAM 23.
[0058]
The functions of the CPU 21, such as the control unit 4, the preprocessing unit 2, the recognition processing unit 3, and the like can be provided in the form of, for example, a software package (specifically, an information recording medium such as a CD-ROM). Therefore, in the example of FIG. 3, when the information recording medium 30 is set, a medium driving device 31 for driving the information recording medium 30 is provided.
[0059]
In other words, the character recognition apparatus of the present invention causes a general-purpose computer system equipped with an image scanner, a display, and the like to read a program recorded on an information recording medium such as a CD-ROM, and this general-purpose computer system microprocessor. The present invention can also be implemented in an apparatus configuration that executes preprocessing and recognition processing. In this case, a program for executing the pre-processing and recognition processing of the present invention (that is, a program used in the hardware system) is provided in a state recorded on a medium. The information recording medium on which the program is recorded is not limited to the CD-ROM, and a ROM, RAM, flexible disk, memory card, or the like may be used. The program recorded on the medium is installed in a storage device incorporated in the hardware system, for example, a hard disk device, so that this program can be executed to realize a preprocessing function and a recognition processing function.
[0060]
In the above description, FIG. 3 is cited as an example of the configuration of the system used for creating the dictionary, and FIG. 7 is cited as an example of the hardware configuration of the character recognition device of FIG. 3 and 7 can be configured as one device by sharing the CPU, ROM, RAM, storage unit 40, and the like.
[0061]
【The invention's effect】
As described above, according to the first to seventh aspects of the invention, in addition to the standard dictionary, recognition processing is performed using an extended dictionary in which character patterns that could not be recognized are registered. The recognition accuracy of low quality characters can be improved without reducing the speed. That is, it is possible to provide a character recognition device that can recognize an image with good image quality at high speed and even with a low quality image with high accuracy. According to the first to seventh aspects of the present invention, it is possible to create a dictionary capable of recognizing a character pattern with degraded quality at high speed and with high accuracy.
[Brief description of the drawings]
FIG. 1 is a block diagram of a character recognition device according to the present invention.
FIG. 2 is a flowchart illustrating a processing flow of a recognition processing unit.
FIG. 3 is a diagram illustrating a configuration example of a system used for creating a dictionary;
FIG. 4 is a diagram for explaining storage (registration) of a collapse limit image or a blur limit image.
FIG. 5 is a flowchart showing a processing flow of creating an extended dictionary.
FIG. 6 is a diagram showing a recognizable range of the created extended dictionary.
7 is a diagram illustrating a hardware configuration example of the character recognition device in FIG. 1; FIG.
[Explanation of symbols]
DESCRIPTION OF SYMBOLS 1 Image input part 2 Pre-processing part 3 Recognition processing part 4 Control part 5 Standard dictionary 6 Extended dictionary 21 CPU
22 ROM
23 RAM
24 Scanner 26 Result Output Device 30 Information Recording Medium 31 Medium Drive Device 40 Storage Unit 41 Computer Unit 42 Communication Device

Claims (7)

入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の2値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化手段と、前記閾値変化手段により2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化手段で2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により始めて正しく認識できた閾値での前記2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴とする文字認識装置。
In a character recognition device that performs character recognition by comparing information based on a character pattern of an unknown character cut out from an input image and information based on a character pattern stored in a standard dictionary or an extended dictionary,
Threshold changing means for sequentially changing the binarization threshold value of the multi-value image, and binarization means for binarizing the multi-value character image data for creating the extended dictionary by the binarization threshold value to generate a binarization pattern For each of the binarization patterns of the character image data binarized by the binarization means while sequentially changing the binarization threshold from the crushing direction to the fading direction by the threshold change means, a standard dictionary is used. An extension for creating the extended dictionary using character recognition means for performing character recognition using information based on stored character patterns, and the binarized pattern at a threshold value that can be correctly recognized for the first time by the character recognition means. A character recognition device comprising a dictionary creating means.
入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の2値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化手段と、前記閾値変化手段により2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化手段で2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により最後に正しく認識できた閾値での前記2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴とする文字認識装置。
In a character recognition device that performs character recognition by comparing information based on a character pattern of an unknown character cut out from an input image and information based on a character pattern stored in a standard dictionary or an extended dictionary,
Threshold changing means for sequentially changing the binarization threshold value of the multi-value image, and binarization means for binarizing the multi-value character image data for creating the extended dictionary by the binarization threshold value to generate a binarization pattern For each of the binarization patterns of the character image data binarized by the binarization means while sequentially changing the binarization threshold from the crushing direction to the fading direction by the threshold change means, a standard dictionary is used. The extended dictionary is created by using character recognition means for performing character recognition using information based on the stored character pattern, and the binarized pattern at the threshold value that was finally correctly recognized by the character recognition means. A character recognition device comprising: an extended dictionary creating means.
入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の2値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化手段と、前記閾値変化手段により2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化手段で2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により始めて正しく認識できた閾値での前記2値化パターンと最後に正しく認識できた閾値での前記2値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴とする文字認識装置。
In a character recognition device that performs character recognition by comparing information based on a character pattern of an unknown character cut out from an input image and information based on a character pattern stored in a standard dictionary or an extended dictionary,
Threshold changing means for sequentially changing the binarization threshold value of the multi-value image, and binarization means for binarizing the multi-value character image data for creating the extended dictionary by the binarization threshold value to generate a binarization pattern For each of the binarization patterns of the character image data binarized by the binarization means while sequentially changing the binarization threshold from the crushing direction to the fading direction by the threshold change means, a standard dictionary is used. Character recognition means for performing character recognition using information based on a stored character pattern, the binarized pattern at a threshold value that can be correctly recognized for the first time by the character recognition means, and the threshold value that can be correctly recognized at the end A character recognition device comprising: an extended dictionary creating means for creating the extended dictionary using a binarized pattern.
入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の2値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法。
In a dictionary creation method in a character recognition device that performs character recognition by comparing information based on a character pattern of an unknown character cut out from an input image and information based on a character pattern stored in a standard dictionary or an extended dictionary,
A threshold changing step for sequentially changing the binarization threshold of the multi-valued image;
A binarization step of binarizing the multi-value character image data for creating an extended dictionary with the binarization threshold value to generate a binarization pattern;
For each of the binarization patterns of the character image data binarized by the binarization step while sequentially changing the binarization threshold from the squashing direction to the fading direction by the threshold value changing step, it is stored in the standard dictionary. A character recognition step for performing character recognition using information based on the character pattern
A dictionary creation method, comprising: an extended dictionary creation step for creating the extended dictionary using a binarized pattern with a threshold value that can be correctly recognized for the first time.
入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の2値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
最後に正しく認識できた閾値での2値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法。
In a dictionary creation method in a character recognition device that performs character recognition by comparing information based on a character pattern of an unknown character cut out from an input image and information based on a character pattern stored in a standard dictionary or an extended dictionary,
A threshold changing step for sequentially changing the binarization threshold of the multi-valued image;
A binarization step of binarizing the multi-value character image data for creating an extended dictionary with the binarization threshold value to generate a binarization pattern;
For each of the binarization patterns of the character image data binarized by the binarization step while sequentially changing the binarization threshold from the squashing direction to the fading direction by the threshold value changing step, it is stored in the standard dictionary. A character recognition step for performing character recognition using information based on the character pattern
A dictionary creation method comprising: an extended dictionary creation step for creating the extended dictionary using a binarized pattern with a threshold value that can be correctly recognized last.
入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の2値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での2値化パターンと最後に正しく認識できた閾値での2値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法。
In a dictionary creation method in a character recognition device that performs character recognition by comparing information based on a character pattern of an unknown character cut out from an input image and information based on a character pattern stored in a standard dictionary or an extended dictionary,
A threshold changing step for sequentially changing the binarization threshold of the multi-valued image;
A binarization step of binarizing the multi-value character image data for creating an extended dictionary with the binarization threshold value to generate a binarization pattern;
For each of the binarization patterns of the character image data binarized by the binarization step while sequentially changing the binarization threshold from the squashing direction to the fading direction by the threshold value changing step, it is stored in the standard dictionary. A character recognition step for performing character recognition using information based on the character pattern
And an extended dictionary creating step for creating the extended dictionary using a binarized pattern with a threshold value that can be correctly recognized for the first time and a binarized pattern with a threshold value that can be correctly recognized at the end. A dictionary creation method.
入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法をコンピュータに実行させるためのプログラムを記録した前記コンピュータが読取可能な記録媒体において、
多値画像の2値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記2値化閾値で2値化して2値化パターンを生成する2値化ステップと、
前記閾値変化ステップにより2値化閾値を潰れ方向からかすれ方向に順次変化させながら前記2値化ステップで2値化した前記文字画像データの2値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での2値化パターンと最後に正しく認識できた閾値での2値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法をコンピュータに実行させるためのプログラムを記録した前記コンピュータが読取可能な記録媒体。
A method of creating a dictionary in a character recognition apparatus that performs character recognition by comparing information based on character patterns of unknown characters extracted from an input image with information based on character patterns stored in a standard dictionary or an extended dictionary. In the computer-readable recording medium recording the program for execution,
A threshold changing step for sequentially changing the binarization threshold of the multi-valued image;
A binarization step of binarizing the multi-value character image data for creating an extended dictionary with the binarization threshold value to generate a binarization pattern;
For each of the binarization patterns of the character image data binarized by the binarization step while sequentially changing the binarization threshold from the squashing direction to the fading direction by the threshold value changing step, it is stored in the standard dictionary. A character recognition step for performing character recognition using information based on the character pattern
And an extended dictionary creating step for creating the extended dictionary using a binarized pattern with a threshold value that can be correctly recognized for the first time and a binarized pattern with a threshold value that can be correctly recognized at the end. A computer-readable recording medium on which a program for causing a computer to execute the dictionary creation method is recorded.
JP26895298A 1998-07-01 1998-09-07 Character recognition device, dictionary creation method, and recording medium Expired - Lifetime JP3868637B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP26895298A JP3868637B2 (en) 1998-07-01 1998-09-07 Character recognition device, dictionary creation method, and recording medium

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP10-201193 1998-07-01
JP20119398 1998-07-01
JP26895298A JP3868637B2 (en) 1998-07-01 1998-09-07 Character recognition device, dictionary creation method, and recording medium

Publications (2)

Publication Number Publication Date
JP2000082113A JP2000082113A (en) 2000-03-21
JP3868637B2 true JP3868637B2 (en) 2007-01-17

Family

ID=26512642

Family Applications (1)

Application Number Title Priority Date Filing Date
JP26895298A Expired - Lifetime JP3868637B2 (en) 1998-07-01 1998-09-07 Character recognition device, dictionary creation method, and recording medium

Country Status (1)

Country Link
JP (1) JP3868637B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2002163637A (en) * 2000-11-27 2002-06-07 Omron Corp Device and method for examining image
CN100373399C (en) * 2004-08-18 2008-03-05 富士通株式会社 Method and apparatus for establishing degradation dictionary
CN101763516B (en) * 2010-01-15 2012-02-29 南京航空航天大学 Character recognition method based on fitting functions

Also Published As

Publication number Publication date
JP2000082113A (en) 2000-03-21

Similar Documents

Publication Publication Date Title
US5410611A (en) Method for identifying word bounding boxes in text
US5539841A (en) Method for comparing image sections to determine similarity therebetween
US5212739A (en) Noise tolerant optical character recognition system
US5438630A (en) Word spotting in bitmap images using word bounding boxes and hidden Markov models
JP4607633B2 (en) Character direction identification device, image forming apparatus, program, storage medium, and character direction identification method
US5745600A (en) Word spotting in bitmap images using text line bounding boxes and hidden Markov models
JP4031210B2 (en) Character recognition device, character recognition method, and recording medium
US7162086B2 (en) Character recognition apparatus and method
US5592568A (en) Word spotting in bitmap images using context-sensitive character models without baselines
EP2553626A2 (en) Segmentation of textual lines in an image that include western characters and hieroglyphic characters
CA2601144C (en) Method and system for adaptive recognition of distorted text in computer images
Marosi Industrial OCR approaches: architecture, algorithms, and adaptation techniques
JP3868637B2 (en) Character recognition device, dictionary creation method, and recording medium
Rahiman et al. A detailed study and analysis of ocr research in south indian scripts
Suen et al. Categorizing document images into script and language classes
SAWAKI et al. Recognition of degraded machine-printed characters using a complementary similarity measure and error-correction learning
JP2000067164A (en) Method and device for pattern recognition and record medium where template generating program is recorded
CN112215783B (en) Image noise point identification method, device, storage medium and equipment
JP2020119291A (en) Information processing device and program
JP2002056356A (en) Character recognizing device, character recognizing method, and recording medium
JPS63109592A (en) Character recognition system
JP3163698B2 (en) Character recognition method
Mori et al. Robust feature extraction based on run-length compensation for degraded handwritten character recognition
Shirali-Shahreza et al. Removing noises similar to dots from Persian scanned documents
JP3446794B2 (en) Polygon approximation method and character recognition device for character recognition

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20051226

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060309

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060516

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060714

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060905

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060905

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20061010

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20061011

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101020

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111020

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121020

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131020

Year of fee payment: 7

EXPY Cancellation because of completion of term