JP4706187B2 - 文字認識装置およびその文字認識方法 - Google Patents

文字認識装置およびその文字認識方法 Download PDF

Info

Publication number
JP4706187B2
JP4706187B2 JP2004142736A JP2004142736A JP4706187B2 JP 4706187 B2 JP4706187 B2 JP 4706187B2 JP 2004142736 A JP2004142736 A JP 2004142736A JP 2004142736 A JP2004142736 A JP 2004142736A JP 4706187 B2 JP4706187 B2 JP 4706187B2
Authority
JP
Japan
Prior art keywords
image
character recognition
contour
character
evaluation value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2004142736A
Other languages
English (en)
Other versions
JP2005326971A (ja
Inventor
建展 池内
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Corp
Panasonic Holdings Corp
Original Assignee
Panasonic Corp
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Panasonic Corp, Matsushita Electric Industrial Co Ltd filed Critical Panasonic Corp
Priority to JP2004142736A priority Critical patent/JP4706187B2/ja
Publication of JP2005326971A publication Critical patent/JP2005326971A/ja
Application granted granted Critical
Publication of JP4706187B2 publication Critical patent/JP4706187B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Character Input (AREA)
  • Facsimile Image Signal Circuits (AREA)

Description

本発明はOCR(Optical Character Reader)などの文字認識装置に係り、特に擬似中間調処理が加えられた文字画像を自動的に認識可能な文字認識装置およびその文字認識方法に関する。
従来の文字認識装置は、「特許文献1」に開示したように、通常の文字画像と網点画像を含む文書をスキャナで読み込んで得られる一次2値画像から連結図形の外接矩形を求め、外接矩形の大きさで文字領域を判定する一次文字領域判定部と、非文字領域から全体の大きさに対する白黒の変化点の割合から網点領域を抽出する網点領域抽出部と、網点領域をスキャナより薄く読み込んで得られる二次2値画像から一次文字領域判定部と同様にして文字領域を判定する二次文字領域判定部と、一次文字領域および二次文字領域から文字パターンを切り出す文字切り出し部と、文字パターンから特徴を抽出する文字特徴抽出部と、全ての文字特徴を記憶した文字特徴辞書と文字特徴を比較して文字確度を求める認識確度計算部と、認識確度から認識文字を決定する認識文字決定部とを備えたものが知られている。
このような構成により、網点文字を含む認識対象文書を容易に、かつ自動的に文字認識できるものである。
特開平6−231306号公報
「特許文献1」に開示された従来の文字認識装置は、白黒の変化点の割合から網点領域を抽出し、網点領域をスキャナより薄く読み込んで得られた二次2値画像から文字領域を判定するものであり、スキャナから読み込んだ画像濃度を薄くすることによって文字画像を認識できるようにしたものである。ところで、網点画像ではなく、通常の文字画像に誤差拡散法などの擬似中間調処理を施すことがある。このように文字部分に擬似中間調処理を施すと、文字部分に画像抜けが発生してしまい、このような画像に対して文字認識を行うことは非常に困難であり、上記した技術を用いても、擬似中間調処理が施された文字画像に対しては、文字認識を行うことができない。
擬似中間調処理が施された文字画像に対しては、人手を用いて文字認識できるように所定の画像加工を行うことが考えられるが、画像加工に工数を要し、擬似中間調処理が施された文字画像を含む画像に対する文字認識の処理効率が低下してしまう課題ある。
この発明はこのような課題を解決するためになされたもので、その目的は擬似中間調画像を含む画像において、擬似中間調画像には補正処理を施し、通常の文字画像はそのままで文字認識を行い、文字認識の精度ならびに処理効率が高い文字認識装置を提供することにある。
前記課題を解決するためこの発明に係る文字認識装置は、擬似中間調画像を含む画像データから文字を認識して文字コードで出力する文字認識装置であって、紙面などの文書を光学的に読取り、電気的な画像イメージに変換する画像入力手段と、画像入力手段からの画像イメージが擬似中間調画像であるか否かを所定領域毎に判定する判定手段と、判定手段が擬似中間調画像と判定した場合には、画像イメージに所定の補正を施して補正画像を生成する補正手段と、補正手段が生成した補正画像から文字を認識する文字認識手段と、画像イメージや補正画像などの画像データを記憶する記憶手段と、装置全体の動作ならびに動作順序を制御する制御手段とを備え、判定手段は、画像イメージから輪郭を抽出して輪郭イメージを出力する輪郭抽出手段と、輪郭抽出手段からの輪郭イメージにラベリングを施し、ラベル情報を発生するラベリング手段と、ラベリング手段が発生するラベル情報に基づいて各ラベルが画像ノイズか否かのノイズ評価値を出力するノイズ評価手段と、ラベリング手段が発生したラベル情報と輪郭抽出手段が発生した輪郭イメージに基づいて画像イメージの変化点評価値を出力する変化点評価手段と、ノイズ評価手段から供給されるノイズ評価値と変化点評価手段から供給される変化点評価値に基づいて画像イメージが擬似中間調画像であるか否かを総合判別する総合判別手段とを有することを特徴とする。
この発明に係る文字認識装置は、擬似中間調画像を含む画像データから文字を認識して文字コードで出力する文字認識装置であって、紙面などの文書を光学的に読取り、電気的な画像イメージに変換する画像入力手段と、画像入力手段からの画像イメージが擬似中間調画像であるか否かを所定領域毎に判定する判定手段と、判定手段が擬似中間調画像と判定した場合には、画像イメージに所定の補正を施して補正画像を生成する補正手段と、補正手段が生成した補正画像から文字を認識する文字認識手段と、画像イメージや補正画像などの画像データを記憶する記憶手段と、装置全体の動作ならびに動作順序を制御する制御手段とを備え、判定手段は、画像イメージから輪郭を抽出して輪郭イメージを出力する輪郭抽出手段と、輪郭抽出手段からの輪郭イメージにラベリングを施し、ラベル情報を発生するラベリング手段と、ラベリング手段が発生するラベル情報に基づいて各ラベルが画像ノイズか否かのノイズ評価値を出力するノイズ評価手段と、ラベリング手段が発生したラベル情報と輪郭抽出手段が発生した輪郭イメージに基づいて画像イメージの変化点評価値を出力する変化点評価手段と、ノイズ評価手段から供給されるノイズ評価値と変化点評価手段から供給される変化点評価値に基づいて画像イメージが擬似中間調画像であるか否かを総合判別する総合判別手段とを有するので、入力画像を読取って、ノイズ評価値と変化点評価値から擬似中間調画像と単純2値画像を判別し、擬似中間調画像には補正処理を施して文字認識するとともに、単純2値画像はそのままで文字認識することができる。
さらに、この発明に係る文字認識装置の文字認識方法は、擬似中間調画像を含む画像データから文字を認識して文字コードで出力する文字認識装置の文字認識方法であって、入力画像を2値の画像イメージに変換して保存するステップS1と、保存した画像イメージを所定領域毎に擬似中間調画像が存在するか否かを判別するステップS2と、擬似中間調画像が存在する場合には、対応した補正を実行するステップS3と、補正画像を文字認識するステップS4と、文字データを文字コードで出力するステップS5とを備え、ステップS2において、画像イメージの輪郭を抽出した輪郭イメージを生成するサブステップSUB1と、輪郭イメージにラベリングを行い、ラベル情報を取得するサブステップSUB2と、ラベル情報に基づいて、ラベルが画像ノイズか否かのノイズ評価値を出力するサブステップSUB3と、ラベル情報と輪郭イメージに基づいて、画像イメージの変化点評価値を出力するサブステップSUB4とを有し、ノイズ評価値と変化点評価値とに基づいて画像イメージが擬似中間調画像であるか否かを総合判断することを特徴とする。
この発明に係る文字認識装置の文字認識方法は、擬似中間調画像を含む画像データから文字を認識して文字コードで出力する文字認識装置の文字認識方法であって、入力画像を2値の画像イメージに変換して保存するステップS1と、保存した画像イメージを所定領域毎に擬似中間調画像が存在するか否かを判別するステップS2と、擬似中間調画像が存在する場合には、対応した補正を実行するステップS3と、補正画像を文字認識するステップS4と、文字データを文字コードで出力するステップS5とを備え、ステップS2において、画像イメージの輪郭を抽出した輪郭イメージを生成するサブステップSUB1と、輪郭イメージにラベリングを行い、ラベル情報を取得するサブステップSUB2と、ラベル情報に基づいて、ラベルが画像ノイズか否かのノイズ評価値を出力するサブステップSUB3と、ラベル情報と輪郭イメージに基づいて、画像イメージの変化点評価値を出力するサブステップSUB4とを有し、ノイズ評価値と変化点評価値とに基づいて画像イメージが擬似中間調画像であるか否かを総合判断するので、擬似中間調画像と単純2値画像が混在した入力画像を読取って、擬似中間調画像と単純2値画像を効率的に判別し、擬似中間調画像には補正処理を施して文字認識することができる。
この発明に係る文字認識装置は、擬似中間調画像を含む画像データから文字を認識して文字コードで出力する文字認識装置であって、紙面などの文書を光学的に読取り、電気的な画像イメージに変換する画像入力手段と、画像入力手段からの画像イメージが擬似中間調画像であるか否かを所定領域毎に判定する判定手段と、判定手段が擬似中間調画像と判定した場合には、画像イメージに所定の補正を施して補正画像を生成する補正手段と、補正手段が生成した補正画像から文字を認識する文字認識手段と、画像イメージや補正画像などの画像データを記憶する記憶手段と、装置全体の動作ならびに動作順序を制御する制御手段とを備え、判定手段は、画像イメージから輪郭を抽出して輪郭イメージを出力する輪郭抽出手段と、輪郭抽出手段からの輪郭イメージにラベリングを施し、ラベル情報を発生するラベリング手段と、ラベリング手段が発生するラベル情報に基づいて各ラベルが画像ノイズか否かのノイズ評価値を出力するノイズ評価手段と、ラベリング手段が発生したラベル情報と輪郭抽出手段が発生した輪郭イメージに基づいて画像イメージの変化点評価値を出力する変化点評価手段と、ノイズ評価手段から供給されるノイズ評価値と変化点評価手段から供給される変化点評価値に基づいて画像イメージが擬似中間調画像であるか否かを総合判別する総合判別手段とを有するので、入力画像を読取って、ノイズ評価値と変化点評価値から擬似中間調画像と単純2値画像を判別し、擬似中間調画像には補正処理を施して文字認識するとともに、単純2値画像はそのままで文字認識することができ、擬似中間調画像が含まれる文字画像の文字認識精度ならびに処理効率の向上を図ることができる。
さらに、この発明に係る文字認識装置の文字認識方法は、擬似中間調画像を含む画像データから文字を認識して文字コードで出力する文字認識装置の文字認識方法であって、入力画像を2値の画像イメージに変換して保存するステップS1と、保存した画像イメージを所定領域毎に擬似中間調画像が存在するか否かを判別するステップS2と、擬似中間調画像が存在する場合には、対応した補正を実行するステップS3と、補正画像を文字認識するステップS4と、文字データを文字コードで出力するステップS5とを備え、ステップS2において、画像イメージの輪郭を抽出した輪郭イメージを生成するサブステップSUB1と、輪郭イメージにラベリングを行い、ラベル情報を取得するサブステップSUB2と、ラベル情報に基づいて、ラベルが画像ノイズか否かのノイズ評価値を出力するサブステップSUB3と、ラベル情報と輪郭イメージに基づいて、画像イメージの変化点評価値を出力するサブステップSUB4とを有し、ノイズ評価値と変化点評価値とに基づいて画像イメージが擬似中間調画像であるか否かを総合判断するので、擬似中間調画像と単純2値画像が混在した入力画像を読取って、擬似中間調画像と単純2値画像を効率的に判別し、擬似中間調画像には補正処理を施して文字認識することができ、擬似中間調画像が含まれる文字画像の文字認識精度ならびに処理効率の向上を図ることができる。
以下、この発明の実施の形態を添付図面に基づいて説明する。図1はこの発明に係る文字認識装置の一実施の形態要部ブロック構成図である。図1において、文字認識装置1は、画像入力手段2、制御手段3、判定手段4、記憶手段5、補正手段6、文字認識手段7、出力手段8およびモード選択手段10を備える。
画像入力手段2は、スキャナなどで構成し、文書11の文字写真が混在した原稿を光学的に読取って電気変換し、擬似中間調および単純2値の混在した2値の画像イメージを制御手段3に供給する。なお、画像入力手段2は、2値の入力画像を制御手段3に供給する機能を持つものであるならば利用可能である。例えば、ファクシミリやネットワークスキャナなど外部装置で作成した2値のイメージを供給し、利用可能であることを補足しておく。また、本発明は、2値画像であるならば、その色などに拘わらず実施が可能であるが、本実施の形態では、白画素および黒画素の2値画像について説明する。さらに、本発明の処理は、画像中の部分領域に対して実施することが可能であるが、本実施の形態では、画像の全領域に対して実施するものとして説明する。
制御手段3は、マイクロプロセッサを基本に各種演算機能、処理機能、アクセス機能などを備え、画像入力手段2、判定手段4、記憶手段5、補正手段6、文字認識手段7、出力手段8およびモード選択手段10の装置全体の動作を制御する。
また、制御手段3は、画像入力手段2、判定手段4、記憶手段5、補正手段6、文字認識手段7の動作の実行順序を制御するシーケンス手段9を備える。
このように、この発明に係る制御手段3は、画像入力手段2、判定手段4、補正手段6、文字認識手段7、記憶手段5の動作順序を制御するシーケンス手段9を備えたので、入力画像の取込み、擬似中間調画像の判別、擬似中間調画像の補正ならびに文字認識を予め設定された手順で実行することができ、文字認識を自動的に実行することができる。
判定手段4は、輪郭抽出手段、ラベリング手段、ノイズ評価手段、変化点評価手段および総合判別手段を備え、画像イメージを擬似中間調画像と通常の画像に判別する。
図2はこの発明に係る判定手段の実施の形態要部ブロック構成図である。図2において、判定手段4は、輪郭抽出手段12、ラベリング手段13、ノイズ評価手段14、変化点評価手段15および総合判別手段16を備え、対象画像が擬似中間調画像か単純2値画像かを判別する。
輪郭抽出手段12は、シーケンス手段9の制御により、メモリ(後述する画像イメージ記憶領域5a)に保存された画像イメージを読み出し、輪郭を抽出する。輪郭の抽出は、図6に示すフィルタを用いて実行する。図6において、「a」,「b」,「c」,「d」,「p」,「e」,「f」,「g」,「h」は、それぞれ1画素を表わす。「p」が現在注目している画素であり、画素の位置関係を示す。
{(b==0)||(d==0)||(e==0)||(g==0)}&&(p==1)の式が真ならば“1”、偽ならば“0”をフィルタ出力としてメモリに保存する。この処理を画像イメージの全ての画素「p」に対して実行する。画像イメージにメモリ(保存)されている順番と、フィルタ出力にメモリ(保存)される順番は同じである。ここで、x==iは、xの値がiである場合に真となることを表わす。また、“||”、“&&”は、それぞれ論理和、論理積を表わす。そして、黒画素の場合の値を“1”とし、白画素の場合の値を“0”としており、以下、同様に表わす。
なお、画素「p」が画像イメージの上下左右端に存在する場合には、画素「a」,「b」,「c」,「d」,「e」,「f」,「g」,「h」のうち、いずれかの画素の値が存在しないことになる。例えば、注目する画素「p」が(0,0){画像イメージの左上端}にあるような場合、画素「a」,「b」,「c」,「d」,「f」は、画像イメージの外の領域になるために存在せず、画素「a」,「b」,「c」,「d」,「f」を“0”として処理する。
輪郭抽出手段12は、上記の処理を画像イメージの全ての画素に対して実行し、画像イメージの輪郭を抽出し、輪郭イメージをメモリ(後述する輪郭イメージ記憶領域5b)に保存する。
ラベリング手段13は、シーケンス手段9の制御により、輪郭抽出手段12で抽出され、メモリに保存されている輪郭イメージに対してラベリング処理を実行する。ラベリング処理は、連続する画素(例えば、黒画素)を追跡して画素の塊を検出し、検出したそれぞれの塊にラベルを付与する。ラベリング処理により、ラベルの外接矩形座標が得られる。
外接矩形の座標は、左上の角の座標(x0,y0)と対角をなす右下の角の座標(x1,y1)の対で得られ、この外接矩形情報をラベル情報としてメモリ(後述するラベル記憶領域5c)に保存する。
ノイズ評価手段14は、シーケンス手段9の制御により、ラベリング手段13が作成し、メモリに保存されているラベル情報に基づいて各ラベルが画像ノイズか、それ以外かを評価するための評価値を作成する。
図4はこの発明に係るノイズ評価手段の一実施の形態ノイズ評価処理手順図である。図4において、パラメータ「NOISE」とパラメータ「CHAR」を導入して処理を開始し、ステップP1で、パラメータを初期化してNOISE=0、CHAR=0とする。
ステップP2では、ラベル情報からラベルを取り出し、ステップP3で、「SIZE」の計算を実行する。ステップP4では、算出したSIZEと予め設定した閾値TH1を比較し、閾値TH1がSIZEを越える(閾値TH1>SIZE)場合にはステップP5に移行する。一方、閾値TH1がSIZE以下の(閾値TH1≦SIZE)場合にはステップP6に移行する。
ステップP5では、パラメータ「NOISE」に“1”を加算して(NOISE+1)とする。ステップP6では、SIZEと予め設定した閾値TH2を比較し、閾値TH2がSIZEを越える(閾値TH2>SIZE)場合にはステップP7に移行する。一方、閾値TH2がSIZE以下の(閾値TH2≦SIZE)場合にはステップP8に移行する。
ステップP7では、パラメータ「CHAR」に“1”を加算して(CHAR+1)とする。ステップP8では、全ラベルについて、ステップP2〜ステップP7の処理を繰り返して実行し、全ラベルの処理が終了すると、ステップP9に移行する。
ステップP9では、ノイズ評価値「EVAL1」を計算し、ステップP10では、評価結果を出力する。なお、ノイズ評価値EVALl=NOISE/(CHAR+1)で演算される。また、ノイズ評価値EVALlは、メモリ(後述するノイズ評価値記憶領域5d)に保存される。
変化点評価手段15は、シーケンス手段9の制御により、ラベル情報の領域毎に、変化点評価値「EVAL2」を出力する。この処理において、ラベル情報の領域を用いず、全領域を対象にして評価値EVAL2を作成し、以下の処理を単純化することも可能である。
図5はこの発明に係る変化点評価手段の一実施の形態変化点評価処理手順図である。図5において、変化点評価の処理を開始し、ステップP11で、ラベル情報の1つを取り出す。ラベル情報は、既に説明したように、ラベル外接矩形の左上の角の座標(x0,y0)と対角をなす右下の角の座標(x1,y1)の対で与えられる。
ステップP12では、ラベル情報から座標(x0,y0)と右下の角の座標(x1,y1)の矩形領域を取り出し、輪郭イメージ領域から該当する領域の輪郭イメージを取り出す。ステップP13では、ステップP12で取り出された輪郭イメージにおいて、画素値が“1”である点の数をカウントする。画素値が“1”である点の数とは、対象とする矩形領域の変化点の数を表わす。カウントされた変化点の数を「EGNUM」とする。
ステップP14では、ステップP12で取り出されたラベル情報に対応する矩形領域の画像を画像イメージ記憶領域から取り出す。ステップP15では、ステップP14において取り出された画像の黒画素数をカウントする。黒画素数を「BPNUM」とする。
ステップP16では、変化点の数「EGNUM」と黒画素数「BPNUM」から変化点評価値EVAL2=EGNUM/(BPNUM+1)を算出し、ステップP17で、評価結果を出力する。
ステップP18では、全てのラベルについて、ステップP1〜ステップP17の処理を実行し、変化点評価の処理を終了する。なお、変化点評価値EVAL2は、メモリ(後述する変化点評価値記憶領域5e)に保存される。
総合判別手段16は、メモリ(後述するノイズ評価値記憶領域5d)に保存されているノイズ評価値EVALlとメモリ(後述する変化点評価値記憶領域5e)に保存されている変化点評価値EVAL2から画像補正を選択する判別結果「LEVEL」を作成し、判別結果「LEVEL」をメモリ(後術する判別結果記憶領域5f)に保存する。
判別結果LEVELは、予め設定した閾値TH3、閾値TH4および閾値TH5を用いて下記のように算出する。まず、閾値TH3>EVAL1ならば、LEVEL=0、閾値TH4>EVAL1>閾値TH3なら、LEVEL=1、EVAL1>閾値4ならば、LEVEL=2に設定する。次に、EVAL2>閾値5ならば、上記のLEVELに“1”を追加する。LEVELは、上記の方法によってラベル記憶領域に記憶された全てのラベルの領域毎に求められる。
このように、この発明に係る判定手段4は、画像イメージから輪郭を抽出して輪郭イメージを出力する輪郭抽出手段12と、輪郭抽出手段12からの輪郭イメージにラベリングを施し、ラベル情報を発生するラベリング手段13と、ラベリング手段13が発生するラベル情報に基づいて各ラベルが画像ノイズか否かのノイズ評価値(EVALl)を出力するノイズ評価手段14と、ラベリング手段13が発生したラベル情報と輪郭抽出手段12が発生した輪郭イメージに基づいて画像イメージの変化点評価値(EVAL2)を出力する変化点評価手段15と、ノイズ評価手段14から供給されるノイズ評価値(EVALl)と変化点評価手段15から供給される変化点評価値(EVAL2)に基づいて画像イメージが擬似中間調画像であるか否かを総合判別する総合判別手段16とを備えたので、ノイズ評価値と変化点評価値から対象画像が擬似中間調画像であるか否か判別することができ、擬似中間調画像と単純2値画像とに対して、それぞれ最適な処理を選択することができる。
記憶手段5は、EEPROM、フラッシュメモリ、DRAM等の書き換え可能なメモリで構成し、シーケンス手段9の制御により、各種プログラムや各種データを保存(格納)する。
図3はこの発明に係る記憶手段の一実施の形態記憶領域イメージ図である。図3において、記憶手段5は、画像イメージを保存する画像イメージ記憶領域5a、輪郭抽出手段12が抽出した輪郭イメージを保存する輪郭イメージ記憶領域5b、ラベリング手段13が作成したラベル情報を保存するラベル記憶領域5c、ノイズ評価手段14が判定したノイズ評価値EVALlを保存するノイズ評価値記憶領域5d、変化点評価手段15が判定した変化点評価値EVAL2を保存する変化点評価値記憶領域5e、総合判別手段16が作成した判別結果LEVELを保存する判別結果記憶領域5fおよび補正手段6が補正した補正画像を保存する補正画像記憶領域5gの記憶領域を備える。
このように、この発明に係る記憶手段5は、画像イメージを格納する画像イメージ記憶領域5a、輪郭イメージを格納する輪郭イメージ記憶領域5b、ラベル情報を格納するラベル記憶領域5c、ノイズ評価値(EVAL1)を格納するノイズ評価値記憶領域5d、変化点評価値EVAL2を格納する変化点評価値記憶領域5e、ノイズ評価値および変化点評価値に基づいて総合判別した結果を格納する判別結果記憶領域5f、補正画像を格納する補正画像記憶領域5gを備えたので、擬似中間調画像の判別ならびに補正の処理手順に応じて必要とされるデータを手順毎に格納することができ、擬似中間調画像の判別処理ならびに補正処理を効率的に実行することができる。
補正手段6は、シーケンス手段9の制御により、画像イメージ記憶領域5aに格納されている画像イメージに対してフィルタを用いて画像補正を実行し、補正画像を図3に示す補正画像記憶領域5gに保存する。フィルタの切替えは、図3に示す判別結果記憶領域5fに保存されている判別結果LEVELに基づいて実行する。補正は、ベル記憶領域5cに記憶されているラベル情報毎に行うことが可能であるが、予め全領域に対するEVAL1の平均値を求めるなどして、全領域に対して均一の補正を行うことも可能である。
次に、フィルタの切替えについて説明する。図7−1はこの発明に係るフィルタの一実施の形態イメージ図、図7−2はこの発明に係るフィルタの別実施の形態イメージ図、図7−3はこの発明に係るフィルタの別実施の形態イメージ図である。本実施の形態のフィルタのみではなく、場合によって多重化し、メディアンフィルタ、ガウシャンフィルタなどを使用することも可能である。
図7−1において、画素「p」は注目画素であり、画素「p」をなんら補正することなく、そのまま出力する。画像イメージの画素「p」が単純2値画像の場合に適用する。なお、このフィルタは、判別結果記憶領域5fの判別結果LEVEL=0の場合に適用する。
図7−2において、フィルタは、注目画素「p」と周辺画素「a」,「b」,「c」で形成し、(a==1)||(b==1)||(c==1)の場合に、「p」の位置に“1”を出力する。なお、このフィルタは、判別結果記憶領域5fの判別結果LEVEL=1の場合に適用する。
図7−3において、フィルタは、注目画素「p」と周辺画素「a」,「b」,「c」,「d」,「e」,「f」,「g」,「h」で形成し、(a==1)||(b==1)||(c==1)||(d==1)||(e==1)||(f==1)||(g==1)||(h==1)の場合に、「p」の位置に“1”を出力する。なお、このフィルタは、判別結果記憶領域5fの判別結果LEVEL≧2の場合に適用する。
このように、この発明に係る補正手段6は、総合判別手段16から提供される総合判定情報(結果)に基づいて選択されたフィルタを用いて、画像イメージを補正した補正画像を出力するので、擬似中間調画像の状態に応じた補正を施すことができ、擬似中間調画像から最適な文字画像を生成することができる。
文字認識手段7は、シーケンス手段9の制御により、図3に示す補正画像記憶領域5gに保存された補正画像に対して文字認識を実行し、文字認識された画像をUNICODEなどの文字コードに変換して出力手段8に供給する。
出力手段8は、文字認識手段7から供給される文字コード出力する。
このように、この発明に係る制御手段3は、画像入力手段2、判定手段4、補正手段6、文字認識手段7、記憶手段5の動作順序を制御するシーケンス手段9を備えたので、入力画像の取込み、擬似中間調画像の判別、擬似中間調画像の補正ならびに文字認識を予め設定された手順で実行することができ、文字認識を自動的に実行することができる。
モード選択手段10は、タッチパネル上の操作ボタン等の切替スイッチやアプリケーションプログラムにおけるモード設定用ボタン等で構成し、判定手段4を使用する擬似中間調判別モードと、予め設定したフィルタを使用するフィルタモードの選択を切替える。
このように、この発明に文字認識装置1は、判定手段4を使用する擬似中間調判別モードと、予め設定したフィルタを使用するフィルタモードの選択を実行するモード選択手段10を備えたので、使用する原稿の状態や種類等に応じてユーザがモードを選択することができ、ユーザがより効率の高い方法を選択することができる。
以上説明したように、この発明に係る文字認識装置1は、紙面などの文書11を光学的に読取り、電気的な画像イメージに変換する画像入力手段2と、画像入力手段2からの画像イメージが擬似中間調画像であるか否かを所定領域毎に判定する判定手段4と、判定手段4が擬似中間調画像と判定した場合には、画像イメージに所定の補正を施して補正画像を生成する補正手段6と、補正手段6が生成した補正画像から文字を認識する文字認識手段7と、画像イメージや補正画像などの画像データを記憶する記憶手段5と、装置全体の動作ならびに動作順序を制御する制御手段3とを備えたので、入力画像を読取って、擬似中間調画像と単純2値画像を判別し、擬似中間調画像には補正処理を施して文字認識するとともに、単純2値画像はそのままで文字認識することができ、擬似中間調画像が含まれる文字画像の文字認識精度ならびに処理効率の向上を図ることができる。
次に、文字認識装置の文字認識方法について説明する。図8はこの発明に係る文字認識装置の文字認識方法の一実施の形態動作フロー図である。
図8において、この発明に係る文字認識装置の文字認識方法は、擬似中間調画像を含む画像データを文字認識し、文字コードを出力する文字認識方法であって、ステップS1では、入力画像を2値の画像イメージに変換して保存する。
ステップS2では、保存した画像イメージを所定領域毎に擬似中間調画像が存在するか否かを判別し、擬似中間調画像が存在する場合にはステップS3に移行し、擬似中間調画像が存在しない場合にはステップS4に移行する。なお、判別処理は、上記で説明した通り、ラベル情報毎に行うため、ラベル情報毎に得られる。また、上述した通り、判別処理を領域毎に行うことにより、判別結果を領域毎に得ることも可能である。半別結果に応じて擬似中間調画像部分にはステップS3を実行し、擬似中間調以外の部分にはステップS4を実行する。
ステップS3では、対応した画像補正を実行する。
ステップS4では、補正画像を文字認識する。
ステップS5では、文字データを文字コードで出力する。
このように、この発明に係る文字認識装置の文字認識方法は、擬似中間調画像を含む画像データから文字を認識して文字コードで出力する文字認識装置の文字認識方法であって、入力画像を2値の画像イメージに変換して保存するステップS1と、保存した画像イメージを所定領域毎に擬似中間調画像が存在するか否かを判別するステップS2と、擬似中間調画像が存在する場合には、対応した補正を実行するステップS3と、補正画像を文字認識するステップS4と、文字データを文字コードで出力するステップS5とを備えたので、擬似中間調画像と単純2値画像が混在した入力画像を読取って、擬似中間調画像と単純2値画像を判別し、擬似中間調画像には補正処理を施して文字認識することができ、擬似中間調画像が含まれる文字画像の文字認識精度ならびに処理効率の向上を図ることができる。
図9は図8に示す文字認識方法の実施の形態一部分動作フロー図である。図8に示すステップS2は、サブステップSUB1〜サブステップSUB4を備える。
ステップS2において、サブステップSUB1では、画像イメージの輪郭を抽出した輪郭イメージを生成する。
サブステップSUB2では、輪郭イメージにラベリングを行い、ラベル情報を取得する。
サブステップSUB3では、ラベル情報に基づいて、ラベルが画像ノイズか否かのノイズ評価値を出力する。
サブステップSUB4では、ラベル情報と輪郭イメージに基づいて、画像イメージの変化点評価値を出力する。
このように、この発明に係る文字認識装置の文字認識方法は、ステップS2において、画像イメージの輪郭を抽出した輪郭イメージを生成するサブステップSUB1と、輪郭イメージにラベリングを行い、ラベル情報を取得するサブステップSUB2と、ラベル情報に基づいて、ラベルが画像ノイズか否かのノイズ評価値を出力するサブステップSUB3と、ラベル情報と輪郭イメージに基づいて、画像イメージの変化点評価値を出力するサブステップSUB4とを有し、ノイズ評価値と変化点評価値とに基づいて画像イメージが擬似中間調画像であるか否かを総合判断するので、処理画像が擬似中間調画像であるか単純2値画像であるかを効率的に判定することができ、擬似中間調の階調レベルやパターンの影響を受けにくい、文字認識を行うことができる。
図10は図8に示す文字認識方法の実施の形態一部分動作フロー図である。図8に示すステップS3は、サブステップSUB5およびサブステップSUB6を備える。
ステップS3において、サブステップSUB5では、ノイズ評価値と変化点評価値とに基づいて補正値を設定する。
サブステップSUB6では、補正値に基づいて画像イメージを補正する。
このように、この発明に係る文字認識装置の文字認識方法は、ステップS3において、ノイズ評価値と変化点評価値とに基づいて補正値を設定するサブステップSUB5と、補正値に基づいて画像イメージを補正するサブステップSUB6とを有し、文字認識にかかる補正画像を出力するので、補正値を設定して文字と判定した擬似中間調画像を補正することができ、画像の状態に応じて最適な補正方法を適用した文字画像を生成することができる。
本発明に係る文字認識装置は、擬似中間調画像と単純2値画像が混在した入力画像を読取って、所定の領域が、擬似中間調画像か単純2値画像のどちらであるかを判別し、擬似中間調画像には補正処理を施して文字認識し、単純2値画像はそのままで文字認識することができ、擬似中間調画像が含まれる文字画像を認識するあらゆる文字認識装置に適用することができる。
この発明に係る文字認識装置の一実施の形態要部ブロック構成図 この発明に係る判定手段の実施の形態要部ブロック構成図 この発明に係る記憶手段の一実施の形態記憶領域イメージ図 この発明に係るノイズ評価手段の一実施の形態ノイズ評価処理手順図 この発明に係る変化点評価手段の一実施の形態変化点評価処理手順図 この発明に係るフィルタの一実施の形態イメージ図 この発明に係るフィルタの一実施の形態イメージ図 この発明に係るフィルタの別実施の形態イメージ図 この発明に係るフィルタの別実施の形態イメージ図 この発明に係る文字認識装置の文字認識方法の一実施の形態動作フロー図 図8に示す文字認識方法の実施の形態一部分動作フロー図 図8に示す文字認識方法の実施の形態一部分動作フロー図
符号の説明
1 文字認識装置
2 画像入力手段
3 制御手段
4 判定手段
5 記憶手段
5a 画像イメージ記憶領域
5b 輪郭イメージ記憶領域
5c ラベル記憶領域
5d ノイズ評価領域
5e 変化点評価値記憶領域
5f 判別結果記憶領域
5g 補正画像記憶領域
6 補正手段
7 文字認識手段
8 出力手段
9 シーケンス手段
10 モード選択手段
11 文書
12 輪郭抽出手段
13 ラベリング手段
14 ノイズ評価手段
15 変化点評価手段
16 総合判別手段

Claims (2)

  1. 擬似中間調画像を含む画像データから文字を認識して文字コードで出力する文字認識装置であって、
    紙面などの文書を光学的に読取り、電気的な画像イメージに変換する画像入力手段と、前記画像入力手段からの画像イメージが擬似中間調画像であるか否かを所定領域毎に判定する判定手段と、前記判定手段が擬似中間調画像と判定した場合には、画像イメージに所定の補正を施して補正画像を生成する補正手段と、前記補正手段が生成した補正画像から文字を認識する文字認識手段と、画像イメージや補正画像などの画像データを記憶する記憶手段と、装置全体の動作ならびに動作順序を制御する制御手段とを備え、
    前記判定手段は、画像イメージから輪郭を抽出して輪郭イメージを出力する輪郭抽出手段と、前記輪郭抽出手段からの輪郭イメージにラベリングを施し、ラベル情報を発生するラベリング手段と、前記ラベリング手段が発生するラベル情報に基づいて各ラベルが画像ノイズか否かのノイズ評価値を出力するノイズ評価手段と、前記ラベリング手段が発生したラベル情報と前記輪郭抽出手段が発生した輪郭イメージに基づいて画像イメージの変化点評価値を出力する変化点評価手段と、前記ノイズ評価手段から供給されるノイズ評価値と前記変化点評価手段から供給される変化点評価値に基づいて画像イメージが擬似中間調画像であるか否かを総合判別する総合判別手段とを有することを特徴とする文字認識装置。
  2. 擬似中間調画像を含む画像データから文字を認識して文字コードで出力する文字認識装置の文字認識方法であって、
    入力画像を2値の画像イメージに変換して保存するステップS1と、
    保存した画像イメージを所定領域毎に擬似中間調画像が存在するか否かを判別するステップS2と、
    擬似中間調画像が存在する場合には、対応した補正を実行するステップS3と、
    補正画像を文字認識するステップS4と、
    文字データを文字コードで出力するステップS5とを備え、
    前記ステップS2において、
    画像イメージの輪郭を抽出した輪郭イメージを生成するサブステップSUB1と、
    輪郭イメージにラベリングを行い、ラベル情報を取得するサブステップSUB2と、
    ラベル情報に基づいて、ラベルが画像ノイズか否かのノイズ評価値を出力するサブステップSUB3と、
    ラベル情報と輪郭イメージに基づいて、画像イメージの変化点評価値を出力するサブステップSUB4とを有し、
    ノイズ評価値と変化点評価値とに基づいて画像イメージが擬似中間調画像であるか否かを総合判断することを特徴とする文字認識装置の文字認識方法。
JP2004142736A 2004-05-12 2004-05-12 文字認識装置およびその文字認識方法 Expired - Fee Related JP4706187B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004142736A JP4706187B2 (ja) 2004-05-12 2004-05-12 文字認識装置およびその文字認識方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004142736A JP4706187B2 (ja) 2004-05-12 2004-05-12 文字認識装置およびその文字認識方法

Publications (2)

Publication Number Publication Date
JP2005326971A JP2005326971A (ja) 2005-11-24
JP4706187B2 true JP4706187B2 (ja) 2011-06-22

Family

ID=35473300

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004142736A Expired - Fee Related JP4706187B2 (ja) 2004-05-12 2004-05-12 文字認識装置およびその文字認識方法

Country Status (1)

Country Link
JP (1) JP4706187B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8947736B2 (en) 2010-11-15 2015-02-03 Konica Minolta Laboratory U.S.A., Inc. Method for binarizing scanned document images containing gray or light colored text printed with halftone pattern
US9319556B2 (en) 2011-08-31 2016-04-19 Konica Minolta Laboratory U.S.A., Inc. Method and apparatus for authenticating printed documents that contains both dark and halftone text

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03224070A (ja) * 1990-01-30 1991-10-03 Fujitsu Ltd 画像細線化装置
JPH09167204A (ja) * 1995-12-18 1997-06-24 Oki Electric Ind Co Ltd 文字認識装置
JPH09223230A (ja) * 1996-02-19 1997-08-26 Oki Electric Ind Co Ltd ディザマスク判別装置、ディザ画像補正装置、及び、文字認識装置
JPH11203404A (ja) * 1998-01-20 1999-07-30 Nippon Telegr & Teleph Corp <Ntt> 景観画像中文字読み取り方法およびその装置およびその方法を記録した記録媒体
JPH11213150A (ja) * 1998-01-30 1999-08-06 Oki Electric Ind Co Ltd 画像補正装置及びこれを用いた文字認識装置
JP2002279346A (ja) * 2001-03-15 2002-09-27 Ricoh Co Ltd 画像処理装置、画像処理方法、記録媒体および文字認識装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03224070A (ja) * 1990-01-30 1991-10-03 Fujitsu Ltd 画像細線化装置
JPH09167204A (ja) * 1995-12-18 1997-06-24 Oki Electric Ind Co Ltd 文字認識装置
JPH09223230A (ja) * 1996-02-19 1997-08-26 Oki Electric Ind Co Ltd ディザマスク判別装置、ディザ画像補正装置、及び、文字認識装置
JPH11203404A (ja) * 1998-01-20 1999-07-30 Nippon Telegr & Teleph Corp <Ntt> 景観画像中文字読み取り方法およびその装置およびその方法を記録した記録媒体
JPH11213150A (ja) * 1998-01-30 1999-08-06 Oki Electric Ind Co Ltd 画像補正装置及びこれを用いた文字認識装置
JP2002279346A (ja) * 2001-03-15 2002-09-27 Ricoh Co Ltd 画像処理装置、画像処理方法、記録媒体および文字認識装置

Also Published As

Publication number Publication date
JP2005326971A (ja) 2005-11-24

Similar Documents

Publication Publication Date Title
EP1456816B1 (en) Apparatus and method for recognizing code
US8094946B2 (en) Image processing system and image tampering assessment method and control program of the same
US6944340B1 (en) Method and apparatus for efficient determination of recognition parameters
CN110210467B (zh) 一种文本图像的公式定位方法、图像处理装置、存储介质
JP4706187B2 (ja) 文字認識装置およびその文字認識方法
JP2020067959A (ja) 画像処理装置、その制御方法及びプログラム
JP2020046736A (ja) 画像処理装置及びプログラム
JP7341758B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP2001222683A (ja) 画像処理方法、画像処理装置、文字認識方法、文字認識装置及び記憶媒体
JPH02293989A (ja) 文字認識装置
JP2007028164A (ja) 画像形成装置
JPH07129713A (ja) 文字認識装置
JPH03201772A (ja) イメージスキャナ
JP2002109470A (ja) 画像認識装置、画像認識方法、および、画像認識プログラムを記憶したコンピュータ読取り可能な記録媒体
KR940010474B1 (ko) 화질 개선 방법
JP3358133B2 (ja) 画像処理装置
JP2000276553A (ja) 情報コードの2値化方法、当該2値化方法を用いた光学情報読取装置、及び当該2値化方法を用いたコード品質判断補助装置
JP7362405B2 (ja) 画像処理装置、画像処理方法、およびプログラム
JP4209804B2 (ja) 画像処理装置および画像処理方法ならびに記憶媒体、プログラム
JP2002157552A (ja) 光学式文字読取装置
JP2859936B2 (ja) 画情報処理装置
JP2002279345A (ja) 画像処理装置、画像処理方法及び該方法を実行するためのプログラムを格納したコンピュータ読み取り可能な記憶媒体
JP2000331118A (ja) 画像処理装置及び記録媒体
JPH06274691A (ja) 文字認識装置
JP2674475B2 (ja) 文字読取装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070507

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20090911

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20090915

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101207

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110121

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110215

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110228

LAPS Cancellation because of no payment of annual fees