JP3868637B2

JP3868637B2 - 文字認識装置および辞書作成方法および記録媒体

Info

Publication number: JP3868637B2
Application number: JP26895298A
Authority: JP
Inventors: 利夫宮澤; 貴子大井
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 1998-07-01
Filing date: 1998-09-07
Publication date: 2007-01-17
Anticipated expiration: 2018-09-07
Also published as: JP2000082113A

Description

【０００１】
【発明の属する技術分野】
本発明は、文字認識装置および辞書作成方法および記録媒体に関する。
【０００２】
【従来の技術】
従来、例えば特開平４−２４２４９４号には、認識用辞書として、出現頻度の高い文字を含む第１の辞書と、出現頻度の低い文字を含む第２の辞書とを有し、未知の文字パターンの特徴量を、まず、第１の辞書に格納された特徴と照合し、その認識結果についての判定結果により第２の辞書を照合することにより認識精度の低下を防止する技術が示されている。
【０００３】
また、従来では、入力画像から文字を切り出して認識処理を行なうとき、標準辞書を用いて認識処理を行なった結果、その文字切り出し位置が間違っていると判断した時には、改めて文字切り出しを行ない、再び標準辞書を用いて認識処理を行なうようにしている。すなわち、誤認識の原因としては、文字が正しく切り出されていないことによるものと、文字は正しく切り出されているがマッチングされないこととの２つに大別することができる。上述した従来の方式では、文字が正しく切り出されていない場合を想定して、まず、標準辞書で認識処理を行ない、その類似度や文字サイズなどから、正しく切り出されていない文字を判定し、再度文字切り出し処理を行ない、新たな文字矩形座標で、再び標準辞書を用いて認識処理を行ない、１回目の結果と、２回目の結果を比較するといった再認識処理を行なっている。
【０００４】
【発明が解決しようとする課題】
しかしながら、上述した特開平４−２４２４９４号に示されている技術では、２つの辞書を設けているものの、これらの２つの辞書は、出現頻度により分けられているため、低品質文字については、その認識精度を向上させることができなかった。
【０００５】
また、文字切り出し位置が間違っていると判断した時に改めて文字切り出しを行ない、標準辞書を用いて再認識する従来の方式においても、標準辞書だけを用いて認識処理を行なっているため、低品質文字については、その認識精度を向上させることができなかった。すなわち、文字認識位置がずれ、かつ、品質が悪い文字については、認識処理を正しく行なうことができないという問題があった。
【０００６】
本発明は、特に低品質文字についても、認識精度を向上させることの可能な文字認識装置および辞書作成方法および記録媒体を提供することを目的としている。
【０００７】
【課題を解決するための手段】
上記目的を達成するために、請求項１記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の２値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化手段と、前記閾値変化手段により２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化手段で２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により始めて正しく認識できた閾値での前記２値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴としている。
【０００８】
また、請求項２記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の２値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化手段と、前記閾値変化手段により２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化手段で２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により最後に正しく認識できた閾値での前記２値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴としている。
【０００９】
また、請求項３記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の２値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化手段と、前記閾値変化手段により２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化手段で２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により始めて正しく認識できた閾値での前記２値化パターンと最後に正しく認識できた閾値での前記２値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴としている。
【００１０】
また、請求項４記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の２値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化ステップと、
前記閾値変化ステップにより２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化ステップで２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での２値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴としている。
【００１１】
また、請求項５記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の２値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化ステップと、
前記閾値変化ステップにより２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化ステップで２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
最後に正しく認識できた閾値での２値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴としている。
【００１２】
また、請求項６記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の２値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化ステップと、
前記閾値変化ステップにより２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化ステップで２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での２値化パターンと最後に正しく認識できた閾値での２値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴としている。
【００１３】
また、請求項７記載の発明は、入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法をコンピュータに実行させるためのプログラムを記録した前記コンピュータが読取可能な記録媒体において、
多値画像の２値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化ステップと、
前記閾値変化ステップにより２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化ステップで２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での２値化パターンと最後に正しく認識できた閾値での２値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法をコンピュータに実行させるためのプログラムを記録した前記コンピュータが読取可能な記録媒体である。
【００２４】
【発明の実施の形態】
以下、本発明の実施形態を図面に基づいて説明する。図１は本発明に係る文字認識装置のブロック図である。図１を参照すると、この文字認識装置は、所定の文字の認識処理用の標準情報が文字毎に予め記憶されている標準辞書５と、画像を入力する画像入力部１(例えば、スキャナなど)と、入力画像から文字を切り出したりする前処理部２と、未知の文字の文字パターンに基づく情報と標準辞書５に予め記憶されている文字毎の標準情報とをそれぞれ比較照合して、類似度の最も大きい文字を認識結果として出力する認識処理部３と、全体を制御する制御部４とを有しており、この文字認識装置では、標準辞書５の他に、さらに、拡張辞書６を設け、該拡張辞書６には、標準辞書５を用いて正しく識別できなかった文字について、該文字の文字パターンに基づく情報が記憶されている。
【００２５】
より詳しくは、標準辞書５には、全ての認識対象文字についての文字パターンに基づく情報が記憶されるようになっており、そして、標準辞書５は、文字品質の良好な文字パターンのみから作成されている。また、拡張辞書６には、全ての認識対象文字のうちの一部の認識対象文字についての文字パターンに基づく情報のみが記憶されるようになっている。特に、漢字の文字パターンに基づく情報のみが記憶されるようになっている。
【００２６】
なお、標準辞書５，拡張辞書６に記憶されている文字パターンに基づく情報としては、文字パターンそのものである場合と、文字パターンから抽出された特徴量である場合とが考えられる。
【００２７】
標準辞書５，拡張辞書６に記憶されている文字パターンに基づく情報が、文字パターンから抽出された特徴量である場合には、認識処理部３は、未知の文字の文字パターンから特徴量を抽出し、該特徴量と標準辞書５，拡張辞書６に予め記憶されている文字毎の特徴量とをそれぞれ比較照合するようになっている。また、標準辞書５，拡張辞書６に記憶されている文字パターンに基づく情報が、文字パターンそのものである場合には、認識処理部３は、未知の文字の文字パターンと標準辞書５，拡張辞書６に予め記憶されている文字毎の文字パターンとをそれぞれ比較照合するようになっている。本発明は、標準辞書５，拡張辞書６に記憶されている文字パターンに基づく情報としては、文字パターンそのものである場合と、文字パターンから抽出された特徴量である場合とのいずれにも適用可能である。
【００２８】
また、制御部４は、画像入力部１，前処理部２，認識処理部３の制御を行なったり、標準辞書５と拡張辞書６との切り替え制御を行なうようになっている。
【００２９】
次に、上述のような構成の文字認識装置の処理動作を説明する。この文字認識装置では、まず、画像入力部１により、認識処理を行ないたい原稿，帳票などを読み込む。このように、入力画像が読み込まれると、前処理部２では、読み込まれた原稿がカラーや多値画像原稿である場合は、２値化処理を行なったり、文字と表，図などを識別する領域識別処理や、文字領域に対して行を切り出す行切り出し処理や、文字を切り出す文字切り出し処理などを行なう。このようにして、前処理部２では、最終的には、入力画像から認識対象となる文字(文字画像)が切り出されて出力される。このことからわかるように、前処理部２は、文字切出部としての機能を含んでいる。
【００３０】
次に、認識処理部３では、前処理部２で切り出された文字の文字パターンに基づく情報を、標準辞書５および／または拡張辞書６と照合する。
【００３１】
図２は認識処理部３の処理流れを示すフローチャートである。図２を参照すると、前処理部２で文字が切り出されると、認識処理部３では、切り出された文字の文字パターンに基づく情報を、先ず、標準辞書５と比較照合する(ステップＳ１)。この比較照合では、標準辞書５内の全ての文字についての情報との比較照合がなされ、最も大きい類似度を与える文字が標準辞書５での認識結果として出力される。
【００３２】
このようにして、標準辞書５との照合の結果、最も大きい類似度(類似度１とする)を与える文字が得られたとき、この類似度１と予め定められた閾値とを比較する(ステップＳ２)。この結果、閾値よりも類似度１が大きかった場合、拡張辞書６との比較照合は行なわず、標準辞書５との比較照合結果(すなわち、最も大きい類似度(類似度１)を与える文字)を最終認識結果とする(ステップＳ３)。
【００３３】
これに対し、ステップＳ２において、類似度１が閾値よりも大きくないときには、さらに、拡張辞書６との比較照合を行なう(ステップＳ４)。この比較照合では、拡張辞書６内の全ての文字についての情報との比較照合がなされ、最も大きい類似度を与える文字が拡張辞書６での認識結果として出力される。
【００３４】
このようにして、拡張辞書６との照合の結果、最も大きい類似度(類似度２とする)を与える文字が得られたとき、この類似度２とステップＳ１で求められた類似度１とを比較する(ステップＳ５)。この結果、類似度１よりも類似度２の方が大きい場合には、拡張辞書６での認識結果を最終認識結果とし(ステップＳ６)、類似度２よりも類似度１の方が大きい場合には、標準辞書５での認識結果を最終認識結果とする(ステップＳ３)。
【００３５】
ここで、拡張辞書６は、様々な画像品質の文字画像を標準辞書５で認識させ、標準辞書５で認識できなかった低品質な文字画像から作成されたものである。
【００３６】
従って、画像品質の良い画像(原稿)は、画像品質の良い画像から作成されている標準辞書５との照合で、閾値よりも大きな類似度をもつものとして認識されるので、拡張辞書６と照合されることは少なく、認識処理時間を短かくすることができる。
【００３７】
また、低品質画像(原稿)は、拡張辞書６との比較照合がなされることで、より高精度な認識が可能になる。
【００３８】
このように、本発明では、標準辞書５の他に、さらに、拡張辞書６を設け、拡張辞書６は、様々な画像品質の文字画像を標準辞書５で認識させた結果、標準辞書５で認識できなかった低品質な文字画像から作成されたものであることから、低品質文字についても、認識精度を向上させることができる。
【００４２】
換言すれば、本発明の文字認識装置では、基本的に、まず標準辞書５で認識処理を行ない、認識結果の信頼度(確信度)が低い場合などに、拡張辞書６を用いて認識処理を行なう。このことにより品質が良好な原稿は標準辞書５のみのマッチングを行なうだけで、拡張辞書６とのマッチングを行なう必要がないので、処理速度が高速となる。
【００４３】
このような文字認識装置で使われるために、標準辞書５は認識対象の文字の全ての文字コード(例えば、記号、平仮名、カタカナ、漢字など)を含む必要があるが、拡張辞書６は、品質の劣化したパターンのみを認識対象にするため、劣化が比較的起こりにくいパターン(例えば、記号、平仮名、カタカナなど)は登録を行なわないことにより、拡張辞書６でのマッチング回数を減らすことで、処理速度の高速化がはかれる。劣化が生じやすく拡張辞書６に登録を行なう必要がある文字としては、例えば「漢字」が挙げられる。「漢字」は平仮名やカタカナなどと比べると、画数が多く、潰れたり、かすれたりすることが多いためである。また、文字認識処理に用いる特徴量として例えば文字の輪郭特徴の場合、輪郭が複雑な文字は劣化が生じ易いことを利用し、認識に用いる特徴量によって判断を行っても良い。また、認識に用いない特徴、例えば黒画素数などを用いて判断を行っても良い。
【００４４】
また、本発明において、拡張辞書６は、例えば図３に示すようなシステムを用いて作成される。図３のシステムは、文字画像データを保存し、また、作成した辞書を保存するハードディスク，フロッピーディスクドライブ(ＦＤドライブ)，ＣＤ−ＲＯＭドライブなどの記憶部４０と、文字画像データをもとに辞書作成を行なう計算機部(ＣＰＵ，ＲＯＭ，ＲＡＭ)４１などを有している。なお、記憶部４０は、計算機部４１の中に組み込まれ一体となっていても良いし、あるいは、通信装置４２によってインターネットなどのネットワークを介してアクセスできれば、通信回線で結ばれた他の装置内に設けられていても良い。
【００４５】
図３に示すようなシステムを用いて、拡張辞書６の作成は、次のようにしてなされる。すなわち、まず、ハードディスクなどの記憶部４０から多値の文字画像データを読み出す。ここで読み出された画像データは２５６階調に量子化されているとする(量子化の段階は１６，６４などでも構わない。また、カラーデータであっても構わない)。この画像データを２値化閾値を、例えば、０から２５５まで順次変化させて２値化する。２値化することにより「白」と「黒」の２値画像が作られる。ここで作られる２値画像は、２値化閾値によって、潰れた文字画像になったり、かすれた文字画像になったりする。
【００４６】
この２値画像をまず良好な品質の文字パターンで作られた標準辞書５を用いて文字認識処理をする。一般に、潰れたり、かすれたりする画像は、標準辞書５では認識できない。そこで、２値化閾値を潰れ方向(２値化閾値の小さな方向)からかすれ方向(２値化閾値の大きな方向)に変化させながら、２値画像を作成し認識処理する場合を例に説明する。潰れ方向から順次かすれ方向に閾値を変化させ認識処理した結果、始めて正しく認識できた２値画像を潰れ限界パターンとする。さらに閾値を変化させながら認識処理を行ない、最後に正しく認識できた２値画像をかすれ限界パターンとする。図４にはこの様子が示されている。ここで、作成された潰れ限界パターンとかすれ限界パターンの２つのパターンから作成される辞書が拡張辞書６になる。
【００４７】
図５は拡張辞書６の辞書作成の処理流れを示すフローチャートである。図５を参照すると、まず、２値化閾値ｔｈを”０”に初期設定する(ステップＳ１)。次いで、２値化閾値ｔｈを”１”だけ歩進する(ステップＳ２)。しかる後、グレー画像を２値化閾値ｔｈで２値化し(ステップＳ３)、この２値化画像に対して標準辞書５で認識処理する(ステップＳ４)。この結果、この２値化画像が図４に示したような潰れ限界画像あるいはかすれ限界画像であるかを判断する(ステップＳ５)。
【００４８】
２値化画像が潰れ限界画像あるいはかすれ限界画像でない場合には、２値化閾値ｔｈが”２５６”以下か否かを判断し(ステップＳ６)、２値化閾値ｔｈが”２５６”以下でない場合には、ステップＳ２に戻り、２値化閾値ｔｈを”１”だけ歩進し、同様の処理を繰り返し行なう。
【００４９】
そして、ステップＳ５で、２値化画像が潰れ限界画像あるいはかすれ限界画像であると判断された場合には、この潰れ限界画像あるいはかすれ限界画像を劣化パターン画像として保存(登録)する(ステップＳ７)。次いで、ステップＳ６に進み、２値化閾値ｔｈが”２５６”以下か否かを判断し(ステップＳ６)、２値化閾値ｔｈが”２５６”以下でない場合には、ステップＳ２に戻り、２値化閾値ｔｈを”１”だけ歩進し、同様の処理を繰り返し行なう。
【００５０】
このような処理を繰り返し行ない、ステップＳ６で２値化閾値ｔｈが”２５６”以下でなくなったときには、ステップＳ７で保存(登録)された劣化パターン画像に基づいて拡張辞書６を作成する(ステップＳ８)。
【００５１】
図６には、このように作成された拡張辞書６の認識可能範囲が示されている。図６からわかるように、拡張辞書６を用いることによって、標準辞書５での認識可能範囲を拡張辞書６での認識可能範囲により拡大することができる。
【００５２】
このように、本発明では、所定の文字の文字パターンに基づく情報が文字毎に予め記憶されている標準辞書５と、入力画像から文字を切り出す文字切出手段と、未知の文字の文字パターンに基づく情報と標準辞書に予め記憶されている文字毎の情報とをそれぞれ比較照合して、類似度の最も大きい文字を認識結果として出力する認識処理手段とを有する文字認識装置において、多値画像の２値化閾値を、２値画像が潰れる値からかすれる値まで順次変化させ、２値化閾値を順次に変化させるときに得られる２値画像を標準辞書５を用いて認識させ、標準辞書５を用いて始めて認識できた閾値での２値文字パターン(潰れパターン)と、最後に認識できた閾値での２値文字パターン(かすれパターン)とを用いて、拡張辞書６を作成することができる。
【００５３】
あるいは、多値画像の２値化閾値を２値画像が潰れる値からかすれる値まで順次変化させ、２値化閾値を順次に変化させるときに得られる２値画像を標準辞書５を用いて認識させ、標準辞書５を用いて始めて認識できた閾値での２値文字パターン(潰れパターン)を用いて、拡張辞書６を作成することもできる。
【００５４】
あるいは、多値画像の２値化閾値を、２値画像が潰れる値からかすれる値まで順次変化させ、２値化閾値を順次に変化させるときに得られる２値画像を標準辞書５を用いて認識させ、標準辞書５を用いて最後に認識できた閾値での２値文字パターン(かすれパターン)を用いて、拡張辞書６を作成することもできる。
【００５６】
また、図７は図１の文字認識装置のハードウェア構成例を示す図である。図７を参照すると、この文字認識装置は、例えばパーソナルコンピュータ等で実現され、全体を制御するＣＰＵ２１と、ＣＰＵ２１の制御プログラム等が記憶されているＲＯＭ２２と、ＣＰＵ２１のワークエリア等として使用されるＲＡＭ２３と、文書を文書画像として読込むスキャナ２４と、文書画像に含まれている各文字画像に対し認識処理を行なった結果の情報を出力する結果出力装置(例えば、ディスプレイやプリンタ)２６とを有している。
【００５７】
ここで、ＣＰＵ２１は、図１の制御部４，前処理部２，認識処理部３の機能を有している。また、ＲＡＭ２３内には、標準辞書５，拡張辞書６を格納することができる。
【００５８】
ＣＰＵ２１におけるこのような制御部４，前処理部２，認識処理部３等としての機能は、例えばソフトウェアパッケージ(具体的には、ＣＤ−ＲＯＭ等の情報記録媒体)の形で提供することができ、このため、図３の例では、情報記録媒体３０がセットさせるとき、これを駆動する媒体駆動装置３１が設けられている。
【００５９】
換言すれば、本発明の文字認識装置は、イメージスキャナ，ディスプレイ等を備えた汎用の計算機システムにＣＤ−ＲＯＭ等の情報記録媒体に記録されたプログラムを読み込ませて、この汎用計算機システムのマイクロプロセッサに前処理，認識処理を実行させる装置構成においても実施することが可能である。この場合、本発明の前処理，認識処理を実行するためのプログラム(すなわち、ハードウェアシステムで用いられるプログラム)は、媒体に記録された状態で提供される。プログラムなどが記録される情報記録媒体としては、ＣＤ−ＲＯＭに限られるものではなく、ＲＯＭ，ＲＡＭ，フレキシブルディスク，メモリカード等が用いられても良い。媒体に記録されたプログラムは、ハードウェアシステムに組み込まれている記憶装置、例えばハードディスク装置にインストールされることにより、このプログラムを実行して、前処理機能、認識処理機能を実現できる。
【００６０】
なお、上述の説明では、図３は辞書作成に用いるシステムの構成例として挙げられ、また、図７は図１の文字認識装置のハードウェア構成例として挙げられているが、図３と図７とにおいて、ＣＰＵ，ＲＯＭ，ＲＡＭ、あるいは記憶部４０などを共用して、図３と図７とを１つの装置として構成することもできる。
【００６１】
【発明の効果】
以上に説明したように、請求項１乃至請求項７記載の発明によれば、標準辞書の他に、認識できなかった文字パターンを登録した拡張辞書をも用いて認識処理を行なうことにより、認識速度を低下させることなく、低品質文字の認識精度をも向上させることができる。すなわち、画像品質の良い画像は高速に、低品質画像でも高精度で認識できる文字認識装置を提供することができる。そして、請求項１乃至請求項７記載の発明によれば、品質が劣化した文字パターンを高速にかつ高精度に認識可能な辞書作成を行なうことができる。
【図面の簡単な説明】
【図１】本発明に係る文字認識装置のブロック図である。
【図２】認識処理部の処理流れを示すフローチャートである。
【図３】辞書作成に用いるシステムの構成例を示す図である。
【図４】潰れ限界画像あるいはかすれ限界画像の保存(登録)を説明するための図である。
【図５】拡張辞書の辞書作成の処理流れを示すフローチャートである。
【図６】作成された拡張辞書の認識可能範囲を示す図である。
【図７】図１の文字認識装置のハードウェア構成例を示す図である。
【符号の説明】
１画像入力部
２前処理部
３認識処理部
４制御部
５標準辞書
６拡張辞書
２１ＣＰＵ
２２ＲＯＭ
２３ＲＡＭ
２４スキャナ
２６結果出力装置
３０情報記録媒体
３１媒体駆動装置
４０記憶部
４１計算機部
４２通信装置

Claims

入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の２値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化手段と、前記閾値変化手段により２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化手段で２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により始めて正しく認識できた閾値での前記２値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴とする文字認識装置。
入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の２値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化手段と、前記閾値変化手段により２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化手段で２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により最後に正しく認識できた閾値での前記２値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴とする文字認識装置。
入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置において、
多値画像の２値化閾値を順次変化させる閾値変化手段と、拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化手段と、前記閾値変化手段により２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化手段で２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行なう文字認識手段と、前記文字認識手段により始めて正しく認識できた閾値での前記２値化パターンと最後に正しく認識できた閾値での前記２値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成手段とを有していることを特徴とする文字認識装置。
入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の２値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化ステップと、
前記閾値変化ステップにより２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化ステップで２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での２値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法。
入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の２値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化ステップと、
前記閾値変化ステップにより２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化ステップで２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
最後に正しく認識できた閾値での２値化パターンを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法。
入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法において、
多値画像の２値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化ステップと、
前記閾値変化ステップにより２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化ステップで２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での２値化パターンと最後に正しく認識できた閾値での２値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法。
入力画像から切り出した未知の文字の文字パターンに基づく情報と標準辞書又は拡張辞書に記憶されている文字パターンに基づく情報とを比較することにより文字認識を行なう文字認識装置における辞書作成方法をコンピュータに実行させるためのプログラムを記録した前記コンピュータが読取可能な記録媒体において、
多値画像の２値化閾値を順次変化させる閾値変化ステップと、
拡張辞書作成用の多値の文字画像データを前記２値化閾値で２値化して２値化パターンを生成する２値化ステップと、
前記閾値変化ステップにより２値化閾値を潰れ方向からかすれ方向に順次変化させながら前記２値化ステップで２値化した前記文字画像データの２値化パターンの各々に対して、標準辞書に記憶されている文字パターンに基づく情報を用いて文字認識を行う文字認識ステップと、
始めて正しく認識できた閾値での２値化パターンと最後に正しく認識できた閾値での２値化パターンとを用いて、前記拡張辞書を作成する拡張辞書作成ステップとを有していることを特徴とする辞書作成方法をコンピュータに実行させるためのプログラムを記録した前記コンピュータが読取可能な記録媒体。