JP2008123245A - 画像処理装置及び画像処理プログラム - Google Patents
画像処理装置及び画像処理プログラム Download PDFInfo
- Publication number
- JP2008123245A JP2008123245A JP2006306186A JP2006306186A JP2008123245A JP 2008123245 A JP2008123245 A JP 2008123245A JP 2006306186 A JP2006306186 A JP 2006306186A JP 2006306186 A JP2006306186 A JP 2006306186A JP 2008123245 A JP2008123245 A JP 2008123245A
- Authority
- JP
- Japan
- Prior art keywords
- image
- image processing
- character
- processing apparatus
- image data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Character Discrimination (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
Abstract
【課題】画像データに含まれる文字に適切な文字認識処理を施す。
【解決手段】非可逆圧縮方法で圧縮された画像データを取得し(S10)、画像データに付加されている圧縮度を示す情報に応じて画像を分割するか否かを判定し(S12)、画像を分割すると判定された場合に画像データを領域分割し(S14)、分割された領域毎に文字品質を評価し(S16,S18)、評価された文字品質に基づいて、分割された領域毎に異なる画像処理を行う(S20,S22)。
【選択図】図2
【解決手段】非可逆圧縮方法で圧縮された画像データを取得し(S10)、画像データに付加されている圧縮度を示す情報に応じて画像を分割するか否かを判定し(S12)、画像を分割すると判定された場合に画像データを領域分割し(S14)、分割された領域毎に文字品質を評価し(S16,S18)、評価された文字品質に基づいて、分割された領域毎に異なる画像処理を行う(S20,S22)。
【選択図】図2
Description
本発明は、画像処理装置及び画像処理プログラムに関する。
JPEG等の非可逆的な圧縮方法により圧縮された画像に含まれる文字情報に対する文字認識処理では、圧縮に伴う文字の品質の劣化により文字認識の精度が低下する問題がある。
そこで、圧縮処理による文字の劣化を考慮した文字パターンを含めて文字認識用の辞書に登録しておく方法が知られている。例えば、圧縮による文字のかすれや潰れを考慮した文字パターン(かすれ文字パターン/潰れ文字パターン)を登録する。
また、特許文献1には、かすれや潰れを含む文字品質の劣化した文字の認識処理が開示されている。認識対象となる文字全体を、文字品質の劣化に強い文字のグループと文字品質の劣化に弱いグループとに分け、後者については品質の劣化のない文字パターンから得られる特徴量のみならず、かすれや潰れを有する文字パターンからも特徴量を抽出して、これらの特徴量を含む辞書を設けることによって文字認識処理を高い確度で行うことを可能としている。
ところで、かすれ文字パターン/潰れ文字パターンを含む辞書を予め用意しておく方法では、文字認識用の辞書の規模が大きくなる。さらに、1文字の認識処理のための照合処理において照合しなくてはならない文字パターンの数が増え、処理速度の低下等を招くおそれがある。
また、文書の一部を仮認識して文書全体の文字の品質の劣化の度合いを判断し、文字品質が悪いと判断された場合に、本認識においてさらに文字毎に品質の劣化に弱いグループに属するか否かを判断する必要があり、処理が複雑化する問題がある。さらに、判断結果に応じて、認識に利用する辞書を切り替える必要があるために処理の負担が大きくなり、処理速度の低下等を招くおそれがある。
本発明は、非可逆圧縮方法で圧縮された画像データを取得する画像取得手段と、前記画像データに付加されている圧縮度を示す情報に応じて画像を分割するか否かを判定する判定部と、前記判定部において画像を分割すると判定された場合に前記画像データを領域分割する領域分割手段と、前記領域分割手段において分割された領域毎に文字品質を評価する文字品質評価手段と、前記文字品質評価手段において評価された文字品質に基づいて、前記領域分割手段において分割された領域毎に異なる画像処理を行う画像処理手段と、を備えることを特徴とする画像処理装置である。
このような画像処理装置は、コンピュータを、非可逆圧縮方法で圧縮された画像データを取得する画像取得手段と、前記画像データに付加されている圧縮度を示す情報に応じて画像を分割するか否かを判定する判定部と、前記判定部において画像を分割すると判定された場合に前記画像データを領域分割する領域分割手段と、前記領域分割手段において分割された領域毎に文字品質を評価する文字品質評価手段と、前記文字品質評価手段において評価された文字品質に基づいて、前記領域分割手段において分割された領域毎に異なる画像処理を行う画像処理手段と、を含む画像処理装置として機能させることを特徴とする画像処理プログラムによって実現することができる。
ここで、前記領域分割手段は、画像のレイアウト情報に基づいて領域分割を行うものとしてもよい。
また、前記圧縮度を示す情報は量子化テーブルに含まれる量子化係数であるものとしてもよい。ここで、前記判定部は、前記画像データの解像度に応じて、画像を分割するか否かの判定に用いる前記量子化テーブルの参照位置を変更するものとしてもよい。
本発明によれば、画像データの圧縮の度合いに応じて画像データを領域分割して、分割された領域毎に文字品質を評価して画像処理を施すことによって、適切に画質補正処理や文字認識処理を行うことができる。
1.装置構成
本発明の実施の形態における画像処理装置100は、図1に示すように、制御部10、記憶部12、入力部14、出力部16及びインターフェース部18を含んで構成される。制御部10、記憶部12、入力部14、出力部16及びインターフェース部18は互いに情報伝達可能となるようにバス等の通信手段によって接続される。また、画像処理装置100は、インターフェース部18を用いて、通信手段(以下、例としてネットワーク102)を介して他の外部装置と接続可能である。
本発明の実施の形態における画像処理装置100は、図1に示すように、制御部10、記憶部12、入力部14、出力部16及びインターフェース部18を含んで構成される。制御部10、記憶部12、入力部14、出力部16及びインターフェース部18は互いに情報伝達可能となるようにバス等の通信手段によって接続される。また、画像処理装置100は、インターフェース部18を用いて、通信手段(以下、例としてネットワーク102)を介して他の外部装置と接続可能である。
制御部10は、記憶部12に保存された画像処理プログラムを読み出して実行する。また、処理に必要なデータを入力部14、ネットワーク102から取り込み、記憶部12に格納する。また、処理に必要な場合には、記憶部12に保持されたデータを読み出して処理に供する。さらに、処理結果を再び記憶部12に格納し、必要に応じて出力部16又はネットワーク102に出力する。
記憶部12は、画像処理プログラム並びに高品質用辞書及び低品質用辞書等の各種データを格納及び保持する。また、入力部14やインターフェース部18から入力された画像データ等を一時的に格納及び保持する。記憶部12としては、主として半導体メモリが用いられるが、例えば、ハードディスク、光ディスク、光磁気ディスク、磁気テープなどの記憶装置を用いることもできる。
入力部14は、使用者が処理に必要なデータを入力する際に用いられる。入力部14としては、例えば、キーボード等の文字入力装置やマウス、ライトペン等のポインティングデバイスを用いることができる。また、紙などの記録媒体に画像形成された画像データ等を電子データとして読み込む場合には、スキャナ等のドキュメント読取装置を備えてもよい。
出力部16は、処理に必要なデータの入力を促す入力画面、制御部10での処理結果を示す出力画面等を表示する。出力部16としては、例えば、ディスプレイ、プリンタ等のドキュメント出力装置を用いることができる。
インターフェース部18は、ネットワークインターフェース装置を含んで構成される。インターフェース部18は、画像処理装置100をネットワーク102と情報伝達可能に接続するために用いられる。インターフェース部18は、リピータ・ハブ、LANスイッチ、ルーター等の機能を含んでいてもよい。
なお、本実施の形態では、画像処理装置を1つのコンピュータで実現する態様で例示するが、これに限定されるものではなく、各部の機能を情報伝達可能に接続された複数の装置で実現してもよい。例えば、文字認識用の辞書を他のコンピュータの記憶部に格納及び保持させておき、ネットワーク等の通信手段を介して辞書にアクセスするようにしてもよい。このように、コンピュータでの処理を複数のコンピュータで分散処理できることは当業者であれば当然に理解できることである。
2.画像処理方法
本発明の実施の形態における画像処理方法について、図2のフローチャートを参照して説明する。画像処理は、画像処理装置100の記憶部12に記憶されている画像処理プログラムを制御部10によって実行することによって、画像処理装置100の各部を図2のフローチャートの各行程の処理を実現する手段として機能させることによって行われる。
本発明の実施の形態における画像処理方法について、図2のフローチャートを参照して説明する。画像処理は、画像処理装置100の記憶部12に記憶されている画像処理プログラムを制御部10によって実行することによって、画像処理装置100の各部を図2のフローチャートの各行程の処理を実現する手段として機能させることによって行われる。
ステップS10では、画像形成装置100において圧縮画像が取得される。制御部10は、インターフェース部18を用いて、他の装置からネットワークを介して送信されてくる圧縮された画像データを受信する。受信された画像データは、記憶部12に格納及び保持される。
画像データは、文字情報を含む画像の電子データとする。また、画像データは、JPEG等の不可逆的な画像圧縮方法によって圧縮されたものとする。画像データには、画像を圧縮処理した際の量子化テーブル定義(DQT:Difine Quantization Tables)が付加されている。
また、原稿画像を入力部14のスキャナ等で読み取り、その原稿画像をJPEG等の不可逆的な画像圧縮方法によって圧縮して画像データを生成してもよい。この場合も、画像を圧縮処理した際の量子化テーブル定義(DQT:Difine Quantization Tables)を圧縮処理で得られた画像データに関連付けて記憶する。
ステップS12では、取得した画像データの圧縮の度合いを判定する。画像データの圧縮の度合いは、画像データに付加されている量子化テーブル定義(DQT:Difine Quantization Tables)を参照することによって、量子化テーブル定義に含まれる圧縮に関する係数に基づいて、画像データに含まれる文字形状がどの程度劣化しているのか(以降、文字の品質と称す)を統計的に推定することができる。
具体的には、制御部10は、記憶部12から取得した画像データに付加されている量子化テーブル定義を読み出し、量子化テーブルの内容に基づいて取得した画像データに含まれる文字の品質が高いと判断される場合にはステップS14へ処理を移行させ、取得した画像データに含まれる文字の品質が低いと判断される場合にはステップS26へ処理を移行させる。
具体的には、所定の周波数に対応する量子化係数が所定の閾値THよりも小さく、取得した画像データに含まれる文字の品質が高いと判断される場合にはステップS14へ処理を移行させる。一方、量子化テーブル定義に含まれる所定の周波数に対応する量子化係数が所定の閾値TH以上であり、取得した画像データに含まれる文字の品質が低いと判断される場合にはステップS26へ処理を移行させる。
このとき、文字のディテールの劣化の度合いは、量子化テーブルの高周波成分の量子化係数に依存するので、画像の解像度が低くなるほどより低い周波数に対応する量子化係数に基づいて文字の品質の評価を行うようにしてもよい。
また、画像情報を圧縮処理する際の量子化テーブル定義と画像情報に含まれている文字情報の劣化の度合いとの関係を予め調査し、その関係を記憶部12に圧縮評価データベースとして登録しておき、受信した画像データに付加されている量子化テーブル定義に関係付けられている量子化係数に基づいてその画像データに含まれる文字形状の劣化の度合いを評価することができる。
また、画像データに含まれるであろう文字種(アルファベット、漢字、カタカナ、ひらがな等)、文字サイズ等に応じて、量子化テーブル定義と文字の劣化の度合いの関係を表す閾値THを変更してもよい。このように、文字種や文字サイズに応じて評価の方法を変更することによって、より正確に文字の劣化を評価することができる。
なお、ステップS12における画像データの圧縮の度合いを判定するその他の手段として、圧縮前と圧縮後の画像データの大きさを比較するアプローチも知られているが、白紙のようにコンテンツとしての情報量が少ない画像の場合には、高い画質を意識した量子化テーブルを用いて圧縮をしても結果として圧縮画像データの大きさが小さくなったり、逆に情報量が多い画像の場合には圧縮率を優先した量子化テーブルを用いて圧縮をしても、圧縮画像データファイルの大きさが小さくならなかったりすることがあるため、必ずしも文字形状の劣化度合いを推測するために利用できるものであるとはいえない。
ステップS14では、取得した画像データの領域分割処理が行われる。制御部10は、記憶部12からステップS10で取得した画像データを読み出し、レイアウト解析処理により画像データのレイアウトを解析して、取得した画像データを領域分割する。
ステップS16では、取得した画像データの各領域における文字の品質の推定処理が行われる。制御部10は、ステップS14の領域分割処理によって得られた領域のいずれか1つを着目領域として選択し、その着目領域に含まれる文字の品質を評価する。
具体的には、着目領域に高速フーリエ変換処理を施し、着目領域の画像データの空間周波数特性を求め、高周波成分が欠如している場合に文字の品質が劣化しているものと判断する。より具体的には、着目領域の空間周波数特性において、所定の周波数以上の成分がそれより小さい周波数成分に対して所定の割合以下である場合に高周波成分が欠如しており、文字の品質が劣化しているものと判定することができる。
また、着目領域の濃度の分布に基づいて文字の品質を評価してもよい。制御部10は、着目領域の濃度ヒストグラムを求める。着目領域に含まれる画像データの高周波成分が欠如すると、画像に含まれる文字の輪郭のエッジが鈍り、文字を構成する画素の濃度のピーク値が低下するとともに、文字のエッジ近傍での濃度の階調が増加する。換言すると、画像データの濃度ヒストグラムのピークがなだらかになる。そこで、着目領域の濃度ヒストグラムの分散が所定の閾値以上である場合に周波成分が欠如しており、文字の品質が劣化しているものと判定することができる。
ステップS18では、文字品質の判定結果に基づいて処理の分岐を行う。制御部10は、ステップS16において着目領域に含まれる文字の品質が劣化していないと判定した場合にはステップS20へ処理を移行させ、そうでない場合にはステップS22へ処理を移行させる。
ステップS20では、着目領域に対して通常の画像処理が施される。例えば、文字を読みやすくするためのシャープネス処理であるとか、文字認識処理等が施される。文字認識処理を例にすれば、制御部10は、着目領域の画像データを二値化して二値画像データを生成し、生成した二値画像データから個々の文字を切り出し、記憶部12に予め格納及び保持されている高品質の文字パターンを登録した高品質用辞書を参照して、切り出した各文字と高品質用辞書に登録されている文字パターンとのマッチング処理を行うことによって各文字の認識を行う。
ステップS22では、着目領域に対して低品質用の画像処理が施される。例えば、画像を圧縮することにより発生したブロックノイズを除去する処理であるとか、文字認識処理等が施される。文字認識処理を例にすれば、制御部10は、着目領域の画像データを二値化して二値画像データを生成し、生成した二値画像データから個々の文字を切り出し、記憶部12に予め格納及び保持されている低品質の文字パターン(かすれ文字パターンや潰れ文字パターン)を登録した低品質用辞書を参照して、抽出された各文字と低品質用辞書に登録されている文字パターンとのマッチング処理を行うことによって各文字の認識を行う。
なお、本実施の形態では、マッチング対象となるデータベースを高品質の文字用と低品質の文字用とに分けて用意し、圧縮された画像に含まれる文字の品質の推定に基づいてこれらのデータベースを使い分けて文字認識処理を行う態様としたがこれに限定されるものではない。ステップS20における高品質の文字に対する処理及びステップS22における低品質の文字に対する処理を異なるものとしてもよい。例えば、ステップS20における高品質の文字に対する処理及びステップS22における低品質の文字に対する処理において同一の文字パターンの辞書を用い、ステップS22では抽出された文字画像に対してエッジ強調処理を施したうえで文字パターンのマッチング処理を行う等の処理としてもよい。
ステップS24では、ステップS14において領域分割された全領域についてステップS16〜22の処理が行われたか否かが判定される。制御部10は、総ての領域について処理が終わっていない場合、既に処理に供された領域以外の領域を新たな着目領域として選択し、処理をステップS16へ戻す。一方、総ての領域について処理が終了した場合、画像処理を終了する。
ステップS26では、ステップS22と同様の効果を得る処理を画像全面に対して実施する。すなわち、画像全面に対して画像を圧縮することにより発生したブロックノイズを除去する処理であったり、低品質文字を対象とした文字認識処理を施す等である。文字認識処理を例にすれば、制御部10は、画像のレイアウトを解析して文字領域を抽出し、抽出された各文字領域を二値化して二値画像データを生成し、生成した二値画像データから個々の文字を切り出し、記憶部12に予め格納及び保持されている低品質の文字パターン(かすれ文字パターンや潰れ文字パターン)を登録した低品質用辞書を参照して、抽出された各文字と低品質用辞書に登録されている文字パターンとのマッチング処理を行うことによって各文字の認識を行う。
このステップでも、ステップS20における高品質の文字に対する処理と同一の文字パターンの辞書を用い、ステップS26では抽出された文字画像に対してエッジ強調処理を施したうえで文字パターンのマッチング処理を行う等の処理としてもよい。このとき、ステップS22に比べてより文字の劣化の影響が低減されるように前処理を強化してもよい。
10 制御部、12 記憶部、14 入力部、16 出力部、18 インターフェース部、100 画像処理装置、102 ネットワーク。
Claims (8)
- 非可逆圧縮方法で圧縮された画像データを取得する画像取得手段と、
前記画像データに付加されている圧縮度を示す情報に応じて画像を分割するか否かを判定する判定部と、
前記判定部において画像を分割すると判定された場合に前記画像データを領域分割する領域分割手段と、
前記領域分割手段において分割された領域毎に文字品質を評価する文字品質評価手段と、
前記文字品質評価手段において評価された文字品質に基づいて、前記領域分割手段において分割された領域毎に異なる画像処理を行う画像処理手段と、
を備えることを特徴とする画像処理装置。 - 請求項1に記載の画像処理装置において、
前記画像処理手段は、文字認識処理を含むことを特徴とする画像処理装置。 - 請求項1に記載の画像処理装置において、
前記画像処理手段は、フィルター処理を含むことを特徴とする画像処理装置。 - 請求項1に記載の画像処理装置において、
前記画像処理手段は、前記文字品質に応じて処理のパラメータを変更することを特徴とする画像処理装置。 - 請求項1に記載の画像処理装置において、
前記領域分割手段は、画像のレイアウト情報に基づいて領域分割を行うことを特徴とする画像処理装置。 - 請求項1〜5のいずれか1つに記載の画像処理装置において、
前記圧縮度を示す情報は量子化テーブルに含まれる量子化係数であることを特徴とする画像処理装置。 - 請求項6に記載の画像処理装置において、
前記判定部は、前記画像データの解像度に応じて、画像を分割するか否かの判定に用いる前記量子化テーブルの参照位置を変更することを特徴とする画像処理装置。 - コンピュータを、
非可逆圧縮方法で圧縮された画像データを取得する画像取得手段と、
前記画像データに付加されている圧縮度を示す情報に応じて画像を分割するか否かを判定する判定部と、
前記判定部において画像を分割すると判定された場合に前記画像データを領域分割する領域分割手段と、
前記領域分割手段において分割された領域毎に文字品質を評価する文字品質評価手段と、
前記文字品質評価手段において評価された文字品質に基づいて、前記領域分割手段において分割された領域毎に異なる画像処理を行う画像処理手段と、
を含む画像処理装置として機能させることを特徴とする画像処理プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006306186A JP2008123245A (ja) | 2006-11-13 | 2006-11-13 | 画像処理装置及び画像処理プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2006306186A JP2008123245A (ja) | 2006-11-13 | 2006-11-13 | 画像処理装置及び画像処理プログラム |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2008123245A true JP2008123245A (ja) | 2008-05-29 |
Family
ID=39507935
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2006306186A Pending JP2008123245A (ja) | 2006-11-13 | 2006-11-13 | 画像処理装置及び画像処理プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2008123245A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9679217B2 (en) | 2014-08-26 | 2017-06-13 | Kabushiki Kaisha Toshiba | Information processing apparatus, information processing system, information processing method and storage medium |
US9819860B2 (en) | 2015-03-09 | 2017-11-14 | Kabushiki Kaisha Toshiba | Data processor, data processing method and storage medium |
US10121086B2 (en) | 2015-07-14 | 2018-11-06 | Kabushiki Kaisha Toshiba | Information processing apparatus and information processing method |
-
2006
- 2006-11-13 JP JP2006306186A patent/JP2008123245A/ja active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US9679217B2 (en) | 2014-08-26 | 2017-06-13 | Kabushiki Kaisha Toshiba | Information processing apparatus, information processing system, information processing method and storage medium |
US9819860B2 (en) | 2015-03-09 | 2017-11-14 | Kabushiki Kaisha Toshiba | Data processor, data processing method and storage medium |
US10121086B2 (en) | 2015-07-14 | 2018-11-06 | Kabushiki Kaisha Toshiba | Information processing apparatus and information processing method |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7965892B2 (en) | Image processing apparatus, control method thereof, and program | |
JP3345350B2 (ja) | 文書画像認識装置、その方法、及び記録媒体 | |
JP6139396B2 (ja) | 文書を表す二値画像を圧縮する方法及びプログラム | |
US7831107B2 (en) | Image processing apparatus, image processing method, and program | |
US7376272B2 (en) | Method for image segmentation to identify regions with constant foreground color | |
US9596378B2 (en) | Method and apparatus for authenticating printed documents that contains both dark and halftone text | |
US8355578B2 (en) | Image processing apparatus, image processing method, and storage medium | |
JP4494563B2 (ja) | トークン化によるイメージ分割を用いたイメージ処理方法および装置 | |
US8411937B2 (en) | Image processing apparatus, image processing method and computer-readable medium | |
US8024655B2 (en) | Compressing page descriptions while preserving high quality | |
JP2001167131A (ja) | 文書シグネチュアを使用する文書の自動分類方法 | |
US7796817B2 (en) | Character recognition method, character recognition device, and computer product | |
JP2006174461A (ja) | 機械可読コード検出方法及び装置 | |
JP4391704B2 (ja) | 多値画像から二値画像を生成する画像処理装置および方法 | |
JP2004336282A (ja) | 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体 | |
JP2008123245A (ja) | 画像処理装置及び画像処理プログラム | |
JP4441300B2 (ja) | 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体 | |
CN111126273B (zh) | 图像处理方法、装置、电子设备以及存储介质 | |
JP2011013900A (ja) | 画像処理装置、画像処理方法、プログラム、及び記憶媒体 | |
JP2007109177A (ja) | 画像処理装置及びその制御方法、プログラム | |
JPH11272798A (ja) | ボ―ルド体文字を区別する方法及び装置 | |
JP4001446B2 (ja) | 画像背景色特定のための方法、装置及びコンピュータ読み取り可能な記録媒体 | |
US8488886B2 (en) | Font matching | |
JP7508212B2 (ja) | 画像処理装置、画像処理方法及びプログラム | |
CN118628367A (zh) | 热敏打印的图片处理方法、装置、电子设备及存储介质 |