JP4169674B2 - 画像処理装置、画像処理プログラムおよび記憶媒体 - Google Patents

画像処理装置、画像処理プログラムおよび記憶媒体 Download PDF

Info

Publication number
JP4169674B2
JP4169674B2 JP2003353505A JP2003353505A JP4169674B2 JP 4169674 B2 JP4169674 B2 JP 4169674B2 JP 2003353505 A JP2003353505 A JP 2003353505A JP 2003353505 A JP2003353505 A JP 2003353505A JP 4169674 B2 JP4169674 B2 JP 4169674B2
Authority
JP
Japan
Prior art keywords
area
background
pixels belonging
function
belonging
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2003353505A
Other languages
English (en)
Other versions
JP2005110184A (ja
Inventor
広文 西田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ricoh Co Ltd
Original Assignee
Ricoh Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ricoh Co Ltd filed Critical Ricoh Co Ltd
Priority to JP2003353505A priority Critical patent/JP4169674B2/ja
Publication of JP2005110184A publication Critical patent/JP2005110184A/ja
Application granted granted Critical
Publication of JP4169674B2 publication Critical patent/JP4169674B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Color, Gradation (AREA)

Description

本発明は、画像処理装置、画像処理プログラムおよび記憶媒体に関する。
用紙に印刷された画像をカラースキャナ等のカラー画像入力機器を用いて入力することにより得られるデジタル画像を、カラープリンタ等のカラー画像出力機器を用いて別の用紙に印刷することで出力する場合に、該画像に対して何も画像処理を施さずにそのまま出力すると、文字と背景との間のコントラストが低かったり、本来黒であるべき黒文字や白であるべき背景に色が付いたりすることによって、文章としての読み易さが低下することがある。
これは、画像入力機器と画像出力機器との間で、色や階調の整合性がとれていないためである。
例えば、用紙に印刷された画像が文書である場合、一般的には、この印刷文書を入力することによって得られるデジタル画像の利用目的も内容の伝達である。当然、このデジタル画像の出力に際しては、出力された文書画像における文章の読み易さを向上させることが最重要課題である。
ところで、近年のネットワーク環境の普及に伴い、画像入力機器を通して入力された画像が画像出力機器によってネットワークを介して遠隔地に送信され、受信者が該画像をPC上で編集・再利用・印刷・再送信するという状況が出現している。このようなネットワーク環境では、未知の画像入力機器を通して入力された画像に対して編集・再利用・印刷・再送信といった処理を行なうため、従来にはなかった新たな技術的課題が考えられる。
その一つとして、多様な特性を有する画像入力機器を通して入力された画像に対する編集・再利用・印刷・再送信といった画像処理を簡単に行なうことが挙げられる。
ここで、画像入力機器や画像出力機器等の画像処理機器がスタンドアロンの場合、画像処理アルゴリズムやパラメータを機器の特性に合わせて設計することが多い。
例えば、複写機等に実装され、黒文字に相当する画素を強調する処理(例えば、特許文献1〜5参照)や、中間調領域を特定する処理(例えば、特許文献6〜9参照)に加えて、画素信号値のヒストグラムを基に階調補正する処理(例えば、特許文献10〜21参照)を行なうようにした技術がある。このような技術では、画像処理のアルゴリズムやパラメータが、通常、入力機器の色特性、解像度、周波数特性に大きく依存する。
特許第2558915号公報 特開2000−196871公報 特開2000−316097公報 特開2001−078036公報 特開2001−169133公報 特許第3158498号公報 特開2001−036748公報 特開2001−144962公報 特開平11−220631号公報 特開2000−013616公報 特開2000−013625公報 特開2000−115538公報 特開2000−242777公報 特開2001−045303公報 特開2001−148785公報 特開2001−167260公報 特開2001−189862公報 特開2001−189863公報 特開2001−197312公報 特開2001−222711公報 特開2001−222711公報
ところで、ネットワーク環境下では、多様な特性の画像入出力機器が存在する。また、デジタル画像が遠隔地で入力・送信されてきたような場合には、入力機器が未知のことすらある。
ある特定の機種に対して最適な画像処理系が、特性が異なる機種に対して効果を発揮するとは限らないため、或る画像入力機器で入力された画像を或る画像出力機器から出力する場合に、画像の識別の精度がばらつき、出力画像の品質が低下して、文章としての読み易さが低下してしまうことがある。
一方で、個々のデジタル画像の特性に対して複雑なパラメータ設定を必要とすることは好ましくない。
なお、テキストを主体とする「文書画像」では,黒文字と背景とが、それぞれ黒と白とに変換されるように階調を変換すればコントラストが強調される。
しかしながら、このような階調変換処理を、写真が混在している文書画像に対してそのまま適用すると、テキスト(黒文字)が強調される反面で写真部分が暗くなってしまうことがある。
この対策として、テキストと写真とが混在するデジタル画像をテキスト領域と写真領域とに分割し、領域毎に異なる補正を加える方法も従来から行われている。
しかしながら、遠隔地で入力されたデジタル画像がネットワークを介して送信されてくるような環境では、このデジタル画像を入力した画像入力機器の特性が不定であるため、領域を正確に識別することが難しくなる。
また、背景に白色以外の色が付いているような文書の背景を白色に縮約するかどうかはユーザの好み次第である。
本発明の目的は、多様な画像入力機器から入力されてテキストと写真とが混在するデジタル画像におけるテキストと写真との割合や背景の色などのコンテンツに応じ、最適な階調補正を行なうことである。
請求項1記載の発明の画像処理装置は、デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する手段と、前記文字領域および前記背景領域以外の領域である中間階調領域に属する画素の割合を取得する手段と、階調補正変換関数に基づき原画像に対する階調補正を行なう手段と、前記文字領域に属する画素と前記背景領域に属する画素とにおける色分布の統計量および前記中間階調領域に属する画素の割合に基づいて前記階調補正変換関数におけるパラメータを調整する手段と、を具備する。また、前記パラメータを調整する手段は、前記中間階調領域に属する画素の割合に応じて、中間階調領域に属する画素の割合が減少するに伴い黒強調を強く施すような前記階調補正変換関数となるように前記パラメータを調整し、かつ背景色の飽和度の低下に伴い高輝度成分を白に補正し、背景色の飽和度が増加に伴い高輝度成分を保存するような前記階調補正変換関数となるように前記パラメータを調整する。
したがって、デジタル画像におけるテキストと写真との割合や、背景の色等のデジタル画像毎のコンテンツに応じた階調補正を行なうことができる。また、写真領域の割合が大きいデジタル画像である場合には黒強調が抑制される。更に、背景色の飽和度が高いデジタル画像である場合には背景色を保存することができる。
請求項記載の発明の画像処理装置デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する手段と、前記文字領域および前記背景領域以外の領域である中間階調領域に属する画素の割合を取得する手段と、階調補正変換関数に基づき原画像に対する階調補正を行なう手段と、前記文字領域に属する画素と前記背景領域に属する画素とにおける色分布の統計量および前記中間階調領域に属する画素の割合に基づいて前記階調補正変換関数におけるパラメータを調整する手段と、を具備する。また、前記パラメータを調整する手段は、前記中間階調領域に属する画素の割合に応じて、中間階調領域に属する画素の割合が減少するに伴い黒強調を強く施すような前記階調補正変換関数となるように前記パラメータを調整する。
したがって、デジタル画像におけるテキストと写真との割合や、背景の色等のデジタル画像毎のコンテンツに応じた階調補正を行なうことができる。また、写真領域の割合が大きいデジタル画像である場合には黒強調が抑制される。
請求項3記載の発明の画像処理装置デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する手段と、前記文字領域および前記背景領域以外の領域である中間階調領域に属する画素の割合を取得する手段と、階調補正変換関数に基づき原画像に対する階調補正を行なう手段と、前記文字領域に属する画素と前記背景領域に属する画素とにおける色分布の統計量および前記中間階調領域に属する画素の割合に基づいて前記階調補正変換関数におけるパラメータを調整する手段と、を具備する。また、前記パラメータを調整する手段は、背景色の飽和度の低下に伴い高輝度成分を白に補正し、背景色の飽和度が増加に伴い高輝度成分を保存するような前記階調補正変換関数となるように前記パラメータを調整する。
したがって、デジタル画像におけるテキストと写真との割合や、背景の色等のデジタル画像毎のコンテンツに応じた階調補正を行なうことができる。また、背景色の飽和度が高いデジタル画像である場合には背景色を保存することができる。
請求項4記載の発明は、請求項1ないし3のいずれか一項に記載の画像処理装置において、前記中間階調領域に属する画素の割合を取得する手段は、前記文字領域に属する画素と前記背景領域に属する画素とにおける前記文字領域の色分布と前記背景領域の色分布との間に色が分布する画素を前記中間階調領域に属する画素として抽出する。
したがって、文字領域、背景領域、中間階調領域を明確に分離することができる。
請求項5記載の発明の画像処理プログラムは、コンピュータに解釈され、このコンピュータに、デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する機能と、文字領域および背景領域以外の領域である中間階調領域に属する画素の割合を取得する機能と、前記階調補正変換関数に基づき原画像に対する階調補正を行なう機能と、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量および中間階調領域に属する画素の割合に基づいて前記階調補正変換関数におけるパラメータを調整する機能と、を実行させる。更に、前記パラメータを調整する機能を、前記中間階調領域に属する画素の割合に応じて、中間階調領域に属する画素の割合が減少するに伴い黒強調を強く施すような前記階調補正変換関数となるように前記パラメータを調整し、かつ背景色の飽和度の低下に伴い高輝度成分を白に補正し、背景色の飽和度が増加に伴い高輝度成分を保存するような前記階調補正変換関数となるように前記パラメータを調整する機能として実行させる。
したがって、デジタル画像におけるテキストと写真との割合や、背景の色等のデジタル画像毎のコンテンツに応じた階調補正を行なうことができる。また、写真領域の割合が大きいデジタル画像である場合には黒強調が抑制される。これによって、写真領域の割合が大きいデジタル画像の画質を良好に維持することができる。更に、背景色の飽和度が高いデジタル画像である場合には背景色を保存することができる。
請求項6記載の発明の画像処理プログラムコンピュータに解釈され、このコンピュータに、デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する機能と、文字領域および背景領域以外の領域である中間階調領域に属する画素の割合を取得する機能と、前記階調補正変換関数に基づき原画像に対する階調補正を行なう機能と、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量および中間階調領域に属する画素の割合に基づいて前記階調補正変換関数におけるパラメータを調整する機能と、を実行させる。更に、前記パラメータを調整する機能を、前記中間階調領域に属する画素の割合に応じて、中間階調領域に属する画素の割合が減少するに伴い黒強調を強く施すような前記階調補正変換関数となるように前記パラメータを調整する機能として実行させる。
したがって、デジタル画像におけるテキストと写真との割合や、背景の色等のデジタル画像毎のコンテンツに応じた階調補正を行なうことができる。また、写真領域の割合が大きいデジタル画像である場合には黒強調が抑制される。これによって、写真領域の割合が大きいデジタル画像の画質を良好に維持することができる。
請求項7記載の発明の画像処理プログラムコンピュータに解釈され、このコンピュータに、デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する機能と、文字領域および背景領域以外の領域である中間階調領域に属する画素の割合を取得する機能と、前記階調補正変換関数に基づき原画像に対する階調補正を行なう機能と、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量および中間階調領域に属する画素の割合に基づいて前記階調補正変換関数におけるパラメータを調整する機能と、を実行させる。更に、前記パラメータを調整する機能を、背景色の飽和度の低下に伴い高輝度成分を白に補正し、背景色の飽和度が増加に伴い高輝度成分を保存するような前記階調補正変換関数となるように前記パラメータを調整する機能として実行させる。
したがって、デジタル画像におけるテキストと写真との割合や、背景の色等のデジタル画像毎のコンテンツに応じた階調補正を行なうことができる。また、背景色の飽和度が高いデジタル画像である場合には背景色を保存することができる。
請求項8記載の発明は、請求項5ないし7のいずれか一項に記載の画像処理プログラムにおいて、前記中間階調領域に属する画素の割合を取得する機能は、前記文字領域に属する画素と前記背景領域に属する画素とにおける前記文字領域の色分布と前記背景領域の色分布との間に色が分布する画素を前記中間階調領域に属する画素として抽出する機能を実行させる。
したがって、文字領域、背景領域、中間階調領域を明確に分離することができる。
請求項9記載の発明の記憶媒体は、請求項5ないし8のいずれか一記載の画像処理プログラムを記憶し、機械読み取り可能である。
したがって、請求項5ないし8のいずれか一に記載の発明の作用を得ることができる。
請求項1記載の発明の画像処理装置によれば、多様な画像入力機器から入力されてテキストと写真とが混在するデジタル画像におけるテキストと写真との割合や背景の色等のデジタル画像毎のコンテンツに応じ、最適な階調補正を行なうことができる。また、写真領域の割合が大きいデジタル画像である場合には黒強調が抑制されるので、写真領域の割合が大きいデジタル画像の画質を良好に維持することができる。更に、背景色の飽和度が高いデジタル画像である場合には背景色が保存されるので、写真領域の割合が大きいデジタル画像の画質を良好に維持することができる。
請求項2記載の発明の画像処理装置によれば多様な画像入力機器から入力されてテキストと写真とが混在するデジタル画像におけるテキストと写真との割合や背景の色等のデジタル画像毎のコンテンツに応じ、最適な階調補正を行なうことができる。また、写真領域の割合が大きいデジタル画像である場合には黒強調が抑制されるので、写真領域の割合が大きいデジタル画像の画質を良好に維持することができる。
請求項3記載の発明の画像処理装置によれば多様な画像入力機器から入力されてテキストと写真とが混在するデジタル画像におけるテキストと写真との割合や背景の色等のデジタル画像毎のコンテンツに応じ、最適な階調補正を行なうことができる。また、背景色の飽和度が高いデジタル画像である場合には背景色が保存されるので、写真領域の割合が大きいデジタル画像の画質を良好に維持することができる。
請求項4記載の発明によれば、請求項1ないし3のいずれか一項に記載の画像処理装置において、文字領域、背景領域、中間階調領域を明確に分離することができるので、実用上の領域分類処理を容易化することができる。
請求項5記載の発明の画像処理プログラムによれば、多様な画像入力機器から入力されてテキストと写真とが混在するデジタル画像におけるテキストと写真との割合や背景の色等のデジタル画像毎のコンテンツに応じ、最適な階調補正を行なうことができる。また、写真領域の割合が大きいデジタル画像である場合には黒強調が抑制されるので、写真領域の割合が大きいデジタル画像の画質を良好に維持することができる。更に、背景色の飽和度が高いデジタル画像である場合には背景色が保存されるので、写真領域の割合が大きいデジタル画像の画質を良好に維持することができる。
請求項6記載の発明の画像処理プログラムによれば多様な画像入力機器から入力されてテキストと写真とが混在するデジタル画像におけるテキストと写真との割合や背景の色等のデジタル画像毎のコンテンツに応じ、最適な階調補正を行なうことができる。また、写真領域の割合が大きいデジタル画像である場合には黒強調が抑制されるので、写真領域の割合が大きいデジタル画像の画質を良好に維持することができる。
請求項7記載の発明の画像処理プログラムによれば多様な画像入力機器から入力されてテキストと写真とが混在するデジタル画像におけるテキストと写真との割合や背景の色等のデジタル画像毎のコンテンツに応じ、最適な階調補正を行なうことができる。また、背景色の飽和度が高いデジタル画像である場合には背景色が保存されるので、写真領域の割合が大きいデジタル画像の画質を良好に維持することができる。
請求項8記載の発明によれば、請求項5ないし7のいずれか一項に記載の画像処理プログラムにおいて、文字領域、背景領域、中間階調領域を明確に分離することができるので、実用上の領域分類処理を容易化することができる。
請求項9記載の発明の記憶媒体によれば、請求項5ないし8のいずれか一に記載の発明の効果を得ることができる。
本発明を実施するための最良の一実施の形態について図1ないし図6を参照して説明する。
図1は、本発明を実施するための最良の一実施の形態のシステム構築例を示す模式図である。図1に示すように、本実施の形態のシステムでは、サーバコンピュータ101にLAN等のネットワーク201を介して画像処理装置としてのパーソナルコンピュータ301が複数台接続されたサーバクライアントシステム11を想定している。
このサーバクライアントシステム11は、スキャナやデジタルカメラ等の画像入力機器401、および、プリンタ等の画像出力機器501をネットワーク201上でシェアし得るように整えられた環境を備えている。ネットワーク201上には、マルチファンクションペリフェラル(以下、MFPとする)601が接続されている。サーバクライアントシステム11では、このMFP601が、画像入力機器401や画像出力機器501として機能するような環境として構築しても良い。
サーバクライアントシステム11は、例えばイントラネット21を介して別のサーバクライアントシステム31とのデータ通信可能に構築され、インターネット通信網41を介して外部環境とデータ通信可能に構築されている。
次に、パーソナルコンピュータ301のモジュール構成について図2を参照して説明する。図2は、本実施の形態におけるパーソナルコンピュータ301のモジュール構成図である。パーソナルコンピュータ301は、情報処理を行なうCPU302、情報を格納するROM303、および、RAM304等の一次記憶装置305、HDD306(ハードディスクドライブ)等の二次記憶装置307、情報を保管したり外部に情報を配布したり等外部から情報を入手するための可搬性を有するメディア308aに記憶された情報を読み取るリムーバブルディスク装置308、外部の他のコンピュータと通信により情報を伝達するためのネットワークインターフェイス309、処理経過や結果等を操作者に表示する表示装置310、操作者がパーソナルコンピュータ301に命令や情報等を入力するためのキーボード311、マウス等のポインティングディバイス312等から構成されている。
なお、本実施の形態では、可搬性を有するメディア308aとしてCD−ROMを用いるものとし、CD−ROMに記憶された情報の読み取りが可能なCD−ROMドライブによってリムーバブルディスク装置308を実現するようにした。
CPU302、一次記憶装置305、二次記憶装置307、リムーバブルディスク装置308、ネットワークインターフェイス309、表示装置310、キーボード311、ポインティングディバイス312等のパーソナルコンピュータ301が備える各部間でのデータの送受信は、バスコントローラ313によって調停され、パーソナルコンピュータ301が備える各部はバスコントローラ313によって調停されるデータ等に基づいて動作する。
パーソナルコンピュータ301では、ユーザが電源を投入するとCPU302がROM303内のローダーというプログラムを起動させ、コンピュータのハードウェアとソフトウェアとを管理するプログラムをHDD306からRAM304に読み込み、読み込んだプログラムを起動させる。本実施の形態では、HDD306からRAM304に読み込まれて、コンピュータのハードウェアとソフトウェアとを管理するプログラムをオペレーティングシステムという。オペレーティングシステムは、ユーザの操作に応じてアプリケーションプログラム等を起動したり、情報を読み込んだり、保存を行ったりする。オペレーティングシステムのうち代表的なものとしては、例えば、Windows(登録商標)、UNIX(登録商標)等が知られている。なお、本実施の形態では、オペレーティングシステム上で実行される動作プログラムをアプリケーションプログラムとする。
本実施の形態のパーソナルコンピュータ301は、アプリケーションプログラムとして、画像処理プログラムをHDD306に記憶している。このため、本実施の形態では、HDD306によって画像処理プログラムを記憶する記憶媒体が実現される。
HDD306等の二次記憶装置307にインストールされる画像処理プログラム等の各種動作プログラムは、例えば、各種動作プログラムを記憶するCD−ROM等の光情報記録メディアやFD等の磁気メディア等からインストールすることが可能である。このため、CD−ROM等の光情報記録メディアやFD等の磁気メディア等の可搬性を有する記憶媒体によっても、画像処理プログラムを記憶する記憶媒体を実現することが可能である。
また、HDD306等の二次記憶装置307にインストールされる画像処理プログラム等の各種動作プログラムは、例えば、ネットワークインターフェイス309を介して外部から二次記憶装置307にインストールしたものであっても良い。
なお、本実施の形態では、HDD306によって記憶媒体を実現したが、これに限るものではなく、HDD306等の二次記憶装置307にインストールされる画像処理プログラム等の各種動作プログラムは、例えば、CD−ROM等の光情報記録メディアやFD等の磁気メディア等からインストールすることも可能であり、CD−ROM等の光情報記録メディアやFD等の磁気メディア等の可搬性を有する各種メディアによっても、画像処理プログラムを記憶する記憶媒体を実現することが可能である。
また、本実施の形態では、HDD306等の二次記憶装置307にインストールされた画像処理プログラムにしたがって後述する画像処理を実行するようにしたが、これに限るものではなく、例えば、ネットワークインターフェイス309を介して外部から二次記憶装置307にダウンロードした画像処理プログラムにしたがって後述する画像処理を実行するようにしても良い。
次に、パーソナルコンピュータ301で実行される手段について図3ないし図6を参照して模式的に説明する。図3は、画像処理プログラムにしたがってパーソナルコンピュータ301よって実行される手段を模式的に示す機能ブロック図である。
パーソナルコンピュータ301は、オペレーティングシステム上で実行される画像処理プログラムを起動させ、この画像処理プログラムにしたがって、CPU302で各種の演算処理を実行することにより、パーソナルコンピュータ301が備える各部を集中的に制御する。画像処理プログラムの実行に際して、パーソナルコンピュータ301は、図3の機能ブロック図に示す各機能によって以下に説明する各種の手段を実行する。
テキスト領域と写真領域とが混在するデジタル画像におけるテキスト領域においては、一般的に、紙面の何も印刷されていない部分に黒い文字が直接印刷されている部分がある。
このことから、まず、入力されたデジタル画像から文字がありそうな領域を抽出し、該デジタル画像を十分に小さいブロックに分割すると、黒い文字が紙面に直接印刷されているようなブロックが存在すると仮定できる。例えば、背景色となる紙面色が白であるとすると、以下のように画像処理の流れを規定することができる。
本実施の形態における画像処理プログラムは、ネットワークインターフェイス309を介して、パーソナルコンピュータ301が原画像I0を受信していることを前提として実行される。なお、原画像I0は、デジタル化されたカラー画像とする。
まず、文字/背景色統計量計算手段1000によって、文字色および背景色の統計量を計算する。ここに、デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する手段が実現される。
具体的には、原画像(I0)から原画像(I0)よりも解像度の低い低解像度画像(I)を生成する。
低解像度画像の生成に際しては、計算量を減らすために、原画像(I0)を100dpi程度の低解像度画像(I)に変換する。
具体的には、まず、単純に、入力画像を重なりのないブロックに分割し、各ブロック内での信号の平均値を、低解像度画像(I)で対応する画素の信号として設定する。このとき、ブロックの大きさ、すなわち、縮小率をrとすると、ブロック内での信号の平均値は以下に示す(1)式の演算により取得することができる。
Figure 0004169674
ここで、縮小率rは、常に自然数になるようにし、原画像(I0)の解像度が100で割り切れない場合、rは自然数に丸めた値にする。例えば、360dpiの場合、rは3となる。
このように、原画像(I0)よりも解像度の低い低解像度画像(I)を用いることにより、画像処理における以降の計算量を減らすことができ、処理を簡易化することができる。
次に、生成した低解像度画像(I)を、平滑化手段2001によって平滑化し、該低解像度画像(I)の各画素の周りに固定サイズのウィンドウを設定してR,G,Bの各チャンネルで信号の平均値μと標準偏差σを計算することで低解像度画像(I)の特徴量を計算する。
なお、平滑化に際しては、ノイズ除去のため、低解像度画像(I)を線形フィルタで平滑化する。
また、特徴量の計算に際しては、低解像度画像(I)に対して、各画素の周りに固定サイズのウィンドウを設定して、R,G,Bの各チャンネルで信号の平均値μと標準偏差σとを計算する。
また、生成した低解像度画像(I)に対して局所適応的閾値処理と膨張処理とを行なってカラー成分の局所適応的二値化を行なうことにより、文字領域の抽出検出を行なう。
文字領域の抽出に際しては、低解像度画像(I)に対して、カラー成分の局所適応的二値化を行なうことにより、文字領域の抽出を行なう。文字領域の抽出に際しては、aとbとをパラメータとした閾値μ(a+bσ)と各画素の信号値との比較を行ない、信号値が閾値μ(a+bσ)よりも高いか低いかに基づいて文字領域を抽出する。例えば、背景に文字が直接印刷された画像である場合、R,G,Bのすべてのチャンネルにおいてコントラストが強くなる傾向がある。このため、本実施の形態では、信号値が、すべてのチャンネルにおいて、閾値μ(a+bσ)よりも低い画素[i,j]を文字領域の要素として設定する((2)式参照)。
Figure 0004169674
また、文字領域の抽出に際しては、原画像(I0)と同じサイズで、文字領域(Cの要素)ではON値、それ以外ではOFF値を持つような2値画像を構成し、この2値画像において背景画素(OFF値の画素)が横方向に沿う横方向のランを構築する。ここで、あるランの長さが予め規定された閾値τよりも短ければ、その画素を一時的にONにする。このようにして、横方向に対して、背景画素のランのsmearingを行ない、同様にして、縦方向にも背景画素のランのsmearingを行なう。そして、横方向背景画素のランと縦方向の背景画素のランとのsmearingのANDをとり、両方のsmearingでON値になる画素だけを最終的なモノクロ前景画素(文字領域)として設定する。これにより、例えば、原画像(I0)から、文字領域を抽出した画像I’を得ることができる。
そして、入力された原画像(I0)を固定サイズの互いに重なりのないブロックに分割し、分割した各ブロックにおいて、文字領域に属する画素を2つの代表色に応じて第1のクラスと第2のクラスとの2クラスに分類する。
クラス分類に際しては、原画像(I0)を互いに重なりのない十分に小さいブロックに分割する。このとき、各ブロックのサイズおよび形は、例えば、辺の長さrが20mm(200dpiで160画素、400dpiで320画素)相当の正方形などとすればよい。クラス分類手段は、分割した各ブロック内において、文字領域に属する画素を輝度に応じて2つのクラスに分類する。
分類に際しては、各画素の色信号から輝度を計算し、閾値処理する。閾値処理には、判別分析法、モーメント保持法、エントロピ法等の既知の方法を用いることができる。なお、判別分析法、モーメント保持法、エントロピ法等を用いた閾値処理については既知の技術であるため説明を省略する。クラス分類手段は、ブロックiにおいて、暗い方の(輝度が低い)画素群を第1のクラスRi1として分類し、明るい方の(輝度が高い)画素群を第2のクラスRi2として分類する。通常は、明るい色の方を文字領域の背景色に対応させ、暗い色の方を文字色に対応させることから、ここでは、第1のクラスRi1が文字に対応し、Ri2が背景(背景)に対応するものとする。このようにして、すべてのブロックにおいて、文字領域に属する画素をRi1とRi2とに分類する。
また、文字領域に属する画素が2つの代表色に分類された各ブロックから、一方のクラスに分類された画素数が最大になるブロックをウィンドウWとして選択し、このウィンドウWにおける2つの代表色を入力画像における背景の平均色および文字の平均色としてそれぞれ設定し、さらに、輝度の統計量に基づいて、文字色と背景色とを推定する。ここで、輝度は、例えば、以下に示す(3)式の演算により取得されるR,G,B信号の平均値であり、この輝度から取得される該輝度の平均値および標準偏差を輝度の統計量とする。
Figure 0004169674
文字色/背景色の統計量の計算に際しては、文字領域に属する画素をRi1とRi2とに分類した全てのブロックから、第2のクラスRi2に属する画素数が最大になるブロックをウィンドウWとして選択し、選択されたウィンドウWにおいて第1のクラスRi1に属する画素(画素群Rw1)の平均色を原画像の文字色として設定する。
続いて、文字色および背景色の輝度の平均と標準偏差とを取得する。ここでは、文字色の輝度の平均をl0とし、文字色の輝度の標準偏差σ0とする。また、背景色の輝度の平均をl1とし、背景色の輝度の標準偏差σ1とする。
また、背景色の飽和度の平均sを取得する。
次に、中間輝度領域抽出手段2000によって、以下に示す(4)式の演算により文字領域および背景領域以外の領域である中間色領域に属する画素の割合を計算する。ここに、中間階調領域に属する画素の割合を取得する手段が実現される。
Figure 0004169674
なお、デジタル画像全体における画素に対する中間色領域に属する画素Pの割合をp(ただし、0≦p≦1)とすると、背景上に文字だけが書かれているような単純な文書画像では、pの値は0に近くなる。一方、写真の割合が大きい画像では、中間輝度に属する画素が多くなるため、pの値が大きくなる。
続いて、階調変換関数設定手段3000によって、後述する階調変換に際して参照する階調変換関数を設定する。ここに、階調補正変換関数におけるパラメータを調整する手段が実現される。
ここで、図4は、本実施の形態における階調変換係数のデフォルトを示すグラフである。本実施の形態の階調変換係数のデフォルトは、以下に示す(5)式によって定義される。
Figure 0004169674
ここで、a,bは、それぞれ黒強調と背景除去の強さとを制御するパラメータである。パラメータa,bの値が大きいほど、黒強調と背景除去の強さの効果が強くなる。通常は、a=−1.0、b=1.0程度に設定すれば良い。
本実施の形態では、()式におけるt0,t1を階調変換関数とし、処理対象とするデジタル画像のコンテンツに応じて,t0,t1の値を制御することを考える。
例えば、デジタル画像における写真領域の割合が大きい場合、黒強調を控えるように制御する。具体的には、階調変換関数t0の値をpによって以下に示す(6)式にしたがって制御する。本実施の形態における階調変換係数のデフォルトを示すグラフである。
Figure 0004169674
なお、p0,p1は,予め設定するパラメータである。
なお、図5は、(6)式にしたがって、中間階調画素の割合pと階調変換関数t0との関係を示すグラフである。
また、例えば、デジタル画像における背景色の飽和度が高い場合には、背景色を保存するように階調変換関数t1の値をsによって以下に示す(7)式にしたがって制御する。
Figure 0004169674
なお、c,s0は、予め設定されるパラメータである。
なお、図6は、(7)式にしたがって、背景色の飽和度sと階調変換関数t1との関係を示すグラフである。
最後に、階調補正手段4000によって、上述のようにして設定した階調変換関数t0,t1に基づく階調変換係数に基づき階調補正を行なう。ここに、階調補正変換関数に基づき原画像に対する階調補正を行なう手段が実現される。なお、階調補正手段5000による階調補正処理については公知の技術であるため説明を省略する。
このように、本実施の形態によれば、デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する手段(文字/背景色統計量計算手段1000)と、文字領域および背景領域以外の領域である中間階調領域に属する画素の割合を取得する手段(中間輝度領域抽出手段2000)と、階調補正変換関数に基づき原画像に対する階調補正を行なう手段(階調補正手段4000)と、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量および中間階調領域に属する画素の割合に基づいて階調補正変換関数におけるパラメータを調整する手段(中間輝度領域抽出手段2000)と、を具備するため、多様な画像入力機器から入力されてテキストと写真とが混在するデジタル画像におけるテキストと写真との割合や背景の色等のデジタル画像毎のコンテンツに応じ、最適な階調補正を行なうことができる。
また、本実施の形態によれば、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量の算出に用いない画素を前記中間階調領域に属する画素として抽出することにより、文字領域、背景領域、中間階調領域を明確に分離することができるので、実用上の領域分類処理を容易化することができる。
さらに、本実施の形態によれば、中間階調領域に属する画素の割合に応じて、中間階調領域に属する画素の割合が減少するに伴い黒強調を強く施すような階調補正変換関数となるようにパラメータを調整することにより、写真領域の割合が大きいデジタル画像である場合には黒強調が抑制されるので、写真領域の割合が大きいデジタル画像の画質を良好に維持することができる。
加えて、本実施の形態によれば、背景色の飽和度の低下に伴い高輝度成分を白に補正し、背景色の飽和度が増加に伴い高輝度成分を保存するような階調補正変換関数となるようにパラメータを調整することで、背景色の飽和度が高いデジタル画像である場合には背景色を保存することができるので、写真領域の割合が大きいデジタル画像の画質を良好に維持することができる。
本発明を実施するための最良の一実施の形態のシステム構築例を示す模式図である。 本実施の形態におけるパーソナルコンピュータのモジュール構成図である。 画像処理プログラムにしたがってパーソナルコンピュータよって実行される手段を模式的に示す機能ブロック図である。 本実施の形態における階調変換係数のデフォルトを示すグラフである。 中間階調画素の割合pと階調変換関数t0との関係を示すグラフである。 背景色の飽和度sと階調変換関数t1との関係を示すグラフである。
符号の説明
301 画像処理装置

Claims (9)

  1. デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する手段と、
    前記文字領域および前記背景領域以外の領域である中間階調領域に属する画素の割合を取得する手段と、
    階調補正変換関数に基づき原画像に対する階調補正を行なう手段と、
    前記文字領域に属する画素と前記背景領域に属する画素とにおける色分布の統計量および前記中間階調領域に属する画素の割合に基づいて前記階調補正変換関数におけるパラメータを調整する手段と、を具備し、
    前記パラメータを調整する手段は、
    前記中間階調領域に属する画素の割合に応じて、中間階調領域に属する画素の割合が減少するに伴い黒強調を強く施すような前記階調補正変換関数となるように前記パラメータを調整し、かつ背景色の飽和度の低下に伴い高輝度成分を白に補正し、背景色の飽和度が増加に伴い高輝度成分を保存するような前記階調補正変換関数となるように前記パラメータを調整することを特徴とする画像処理装置。
  2. デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する手段と、
    前記文字領域および前記背景領域以外の領域である中間階調領域に属する画素の割合を取得する手段と、
    階調補正変換関数に基づき原画像に対する階調補正を行なう手段と、
    前記文字領域に属する画素と前記背景領域に属する画素とにおける色分布の統計量および前記中間階調領域に属する画素の割合に基づいて前記階調補正変換関数におけるパラメータを調整する手段と、を具備し、
    前記パラメータを調整する手段は、
    背景色の飽和度の低下に伴い高輝度成分を白に補正し、背景色の飽和度が増加に伴い高輝度成分を保存するような前記階調補正変換関数となるように前記パラメータを調整することを特徴とする画像処理装置。
  3. デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する手段と、
    前記文字領域および前記背景領域以外の領域である中間階調領域に属する画素の割合を取得する手段と、
    階調補正変換関数に基づき原画像に対する階調補正を行なう手段と、
    前記文字領域に属する画素と前記背景領域に属する画素とにおける色分布の統計量および前記中間階調領域に属する画素の割合に基づいて前記階調補正変換関数におけるパラメータを調整する手段と、を具備し、
    前記パラメータを調整する手段は、
    背景色の飽和度の低下に伴い高輝度成分を白に補正し、背景色の飽和度が増加に伴い高輝度成分を保存するような前記階調補正変換関数となるように前記パラメータを調整することを特徴とする画像処理装置。
  4. 前記中間階調領域に属する画素の割合を取得する手段は、
    前記文字領域に属する画素と前記背景領域に属する画素とにおける前記文字領域の色分布と前記背景領域の色分布との間に色が分布する画素を前記中間階調領域に属する画素として抽出する請求項1ないし3のいずれか一項に記載の画像処理装置。
  5. コンピュータに解釈され、このコンピュータに、
    デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する機能と、
    文字領域および背景領域以外の領域である中間階調領域に属する画素の割合を取得する機能と、
    前記階調補正変換関数に基づき原画像に対する階調補正を行なう機能と、
    文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量および中間階調領域に属する画素の割合に基づいて前記階調補正変換関数におけるパラメータを調整する機能と、を実行させ
    更に、前記パラメータを調整する機能を、
    前記中間階調領域に属する画素の割合に応じて、中間階調領域に属する画素の割合が減少するに伴い黒強調を強く施すような前記階調補正変換関数となるように前記パラメータを調整し、かつ背景色の飽和度の低下に伴い高輝度成分を白に補正し、背景色の飽和度が増加に伴い高輝度成分を保存するような前記階調補正変換関数となるように前記パラメータを調整する機能として実行させる画像処理プログラム。
  6. コンピュータに解釈され、このコンピュータに、
    デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する機能と、
    文字領域および背景領域以外の領域である中間階調領域に属する画素の割合を取得する機能と、
    前記階調補正変換関数に基づき原画像に対する階調補正を行なう機能と、
    文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量および中間階調領域に属する画素の割合に基づいて前記階調補正変換関数におけるパラメータを調整する機能と、を実行させ、
    更に、前記パラメータを調整する機能
    背景色の飽和度の低下に伴い高輝度成分を白に補正し、背景色の飽和度が増加に伴い高輝度成分を保存するような前記階調補正変換関数となるように前記パラメータを調整する機能として実行させる画像処理プログラム。
  7. コンピュータに解釈され、このコンピュータに、
    デジタル画像である原画像に対して、文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量を取得する機能と、
    文字領域および背景領域以外の領域である中間階調領域に属する画素の割合を取得する機能と、
    前記階調補正変換関数に基づき原画像に対する階調補正を行なう機能と、
    文字領域に属する画素と背景領域に属する画素とにおける色分布の統計量および中間階調領域に属する画素の割合に基づいて前記階調補正変換関数におけるパラメータを調整する機能と、を実行させ、
    更に、前記パラメータを調整する機能を、
    背景色の飽和度の低下に伴い高輝度成分を白に補正し、背景色の飽和度が増加に伴い高輝度成分を保存するような前記階調補正変換関数となるように前記パラメータを調整する機能として実行させる画像処理プログラム。
  8. 前記中間階調領域に属する画素の割合を取得する機能は、
    前記文字領域に属する画素と前記背景領域に属する画素とにおける前記文字領域の色分布と前記背景領域の色分布との間に色が分布する画素を前記中間階調領域に属する画素として抽出する機能を実行させる請求項5ないし7のいずれか一項に記載の画像処理プログラム。
  9. 請求項5ないし8のいずれか一記載の画像処理プログラムを記憶し、機械読み取り可能である記憶媒体。
JP2003353505A 2003-09-12 2003-10-14 画像処理装置、画像処理プログラムおよび記憶媒体 Expired - Fee Related JP4169674B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003353505A JP4169674B2 (ja) 2003-09-12 2003-10-14 画像処理装置、画像処理プログラムおよび記憶媒体

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2003320767 2003-09-12
JP2003353505A JP4169674B2 (ja) 2003-09-12 2003-10-14 画像処理装置、画像処理プログラムおよび記憶媒体

Publications (2)

Publication Number Publication Date
JP2005110184A JP2005110184A (ja) 2005-04-21
JP4169674B2 true JP4169674B2 (ja) 2008-10-22

Family

ID=34554362

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003353505A Expired - Fee Related JP4169674B2 (ja) 2003-09-12 2003-10-14 画像処理装置、画像処理プログラムおよび記憶媒体

Country Status (1)

Country Link
JP (1) JP4169674B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4615462B2 (ja) * 2006-03-15 2011-01-19 株式会社リコー 画像処理装置、画像形成装置、プログラムおよび画像処理方法
US8244039B2 (en) 2007-07-12 2012-08-14 Ricoh Company, Limited Apparatus, method, and computer program product for acquiring processing content for image data
US8254669B2 (en) 2007-09-19 2012-08-28 Ricoh Company, Ltd. Data processing apparatus, computer program product, and data processing method for predicting an optimum function based on a case database and image feature values calculated by a feature-value calculating unit
JP6031921B2 (ja) * 2012-09-28 2016-11-24 ブラザー工業株式会社 画像処理装置およびプログラム

Also Published As

Publication number Publication date
JP2005110184A (ja) 2005-04-21

Similar Documents

Publication Publication Date Title
JP4118749B2 (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
US7324247B2 (en) Image processing apparatus, image processing program and storage medium storing the program
JP4350778B2 (ja) 画像処理装置、画像処理プログラムおよび記録媒体
US8384964B2 (en) Image processing apparatus and image processing method
US20130251280A1 (en) Systems and methods of processing scanned data
US9497353B2 (en) Image processing apparatus, image processing method, and image processing system
JP2004529404A (ja) 画像を分析するための方法及び装置
JP2008192138A (ja) 画像の顔領域を修整するシステムおよび方法
JP2009005312A (ja) 画像処理装置及び画像処理方法及びコンピュータプログラム及び記憶媒体
US8369614B2 (en) Edge control in a digital color image via tone and size dependent dilation of pixels
JP4579759B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4093413B2 (ja) 画像処理装置、画像処理プログラム及び該プログラムを記録した記録媒体
JP2007053749A (ja) スキャナによって獲得されるデジタル画像を変換する変換方法、装置、およびコンピュータプログラム
JP2009207145A (ja) ディジタル画像の近無彩色の画素を分離するシステムおよび方法
US8175397B2 (en) Device adaptively switching image processes in accordance with characteristic of object included in image
US10872216B2 (en) Image output device, image output method, and output image data production method
JP7382834B2 (ja) 画像処理装置、画像処理方法、及びプログラム
JP4169674B2 (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JP4059389B2 (ja) 画像処理装置、画像処理プログラムおよび記憶媒体
JP2010057017A (ja) 画像処理装置および画像処理方法
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
US20110007334A1 (en) Between-segment discontinuity reduction for text vectorization using dominant point classification
JP7317557B2 (ja) 画像処理装置、画像処理方法、プログラム、記録媒体及び画像形成装置
JP7330337B2 (ja) 画像処理装置、画像処理方法、及び、プログラム
JP4412339B2 (ja) 画像形成装置および画像データの補正方法

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051021

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20060807

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060905

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20071213

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20080108

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080307

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20080708

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20080805

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110815

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110815

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120815

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120815

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130815

Year of fee payment: 5

LAPS Cancellation because of no payment of annual fees