JP2007006142A - 画像処理方法、画像形成装置、プログラム及び記録媒体 - Google Patents
画像処理方法、画像形成装置、プログラム及び記録媒体 Download PDFInfo
- Publication number
- JP2007006142A JP2007006142A JP2005183911A JP2005183911A JP2007006142A JP 2007006142 A JP2007006142 A JP 2007006142A JP 2005183911 A JP2005183911 A JP 2005183911A JP 2005183911 A JP2005183911 A JP 2005183911A JP 2007006142 A JP2007006142 A JP 2007006142A
- Authority
- JP
- Japan
- Prior art keywords
- color
- colors
- color space
- image processing
- divided
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Image Processing (AREA)
- Facsimile Image Signal Circuits (AREA)
- Color Image Communication Systems (AREA)
Abstract
【課題】 文字の色を少ない色数で表現する際、カラー画像中の文字の色が偏った場合や使用頻度の低い文字色がある場合でも、精度よく文字の色の推定が行えるようにする。
【解決手段】 カラー画像から文字領域を抽出するステップと、色空間をN色の代表点で分割するステップと、前記文字領域の文字を構成する画素を前記分割した色空間に分類するステップと、分類結果の画素数に基づいて分割した色空間毎の構成色数を決定するステップと、前記分割した色空間毎に分類された画素の画素値でヒストグラムを作成するステップと、作成したヒストグラムから前記分割した色空間毎に、色の出現度合いを求め、求めた出現度合いの大きい画素値を順に前記決定した構成色数だけ構成色とするステップとを設けた。
【選択図】 図1
【解決手段】 カラー画像から文字領域を抽出するステップと、色空間をN色の代表点で分割するステップと、前記文字領域の文字を構成する画素を前記分割した色空間に分類するステップと、分類結果の画素数に基づいて分割した色空間毎の構成色数を決定するステップと、前記分割した色空間毎に分類された画素の画素値でヒストグラムを作成するステップと、作成したヒストグラムから前記分割した色空間毎に、色の出現度合いを求め、求めた出現度合いの大きい画素値を順に前記決定した構成色数だけ構成色とするステップとを設けた。
【選択図】 図1
Description
本発明は、カラー画像処理方法、複写機、印刷装置、ファクシミリ等の画像形成装置に関し、特にカラー画像中の文字色を少ない色数で表す技術に関する。
カラー画像に対してJPEG以上のファイルサイズの圧縮が可能となる高圧縮PDFという技術がよく用いられている。この技術ではカラー画像中の写真や文字などを、その特徴から分類し、それぞれの特徴にあった圧縮技術を用いることで高圧縮を実現している。図6および図7は、高圧縮PDFにおける画像圧縮の原理を説明する図である。高圧縮PDFでは、文字の領域と文字以外の領域とを分離し、文字が単一色に見えるという特徴から、文字の色毎の二値画像を作成することで文字領域部分のファイルサイズを削減し、従来に較べさらなる高圧縮を実現している(図7参照)。
しかし、プリンタによるカラー印刷やスキャナによる読み込みなどで取得したカラー画像中の文字を構成する画素は、完全に単一色とはならない。図8は変色(劣化)した文字の例を示す図である。同図のように、文字を構成する画素の色(この場合は無彩色に見える)は色々な色の成分からなり、たとえ同じ文字であっても図のようにモザイク状となる。そのため文字矩形を抽出し、それらの矩形内の画素値(例えばRGBの成分値)を求めて文字色を推定すると、原稿が黒一色で書かれた場合であっても、スキャナなどでの読み取り時の文字色の劣化により、多数の黒色文字(純粋の黒だけでなく、濃いグレーや他の色成分が混ざった黒に近い色)が求められ、上記のファイルサイズ削減による高圧縮を困難にしている。
そこで、一般的には色空間で色クラスタリング等の処理を行い、カラー画像中の色数を減らすという処理が行われている。色クラスタリングは現在様々な方法が提案されており、例えばPA法はカラー画像の画素から3次元ヒストグラムを作成し、ヒストグラムでの頻度が高い色を順に取る手法である(非特許文献1参照)。
また、色空間を格子上に分割し、その格子内に入る画素の重心を求め、重心をその格子の色にする方法も提案されている(非特許文献2参照)。
なお、カラー文書画像から背景色を取り除き、文字を構成する画素の色(複数)から代表色を1色求め、その色を文字の色とする方法もある(特許文献1)。
特開2002−236921公報
P.Heckbert, "Color image quantization for frame buffer display", Computer Graphics, 1982, vol.16, no.3, pp.297-307
長谷 博行など,"カラー文書画像中の文字領域抽出を目的とした色分割についての検討",信学論, 2000, Vol.J83-D-II No.5, pp.1294-1304
しかし、プリンタによるカラー印刷やスキャナによる読み込みなどで取得したカラー画像中の文字を構成する画素は、完全に単一色とはならない。図8は変色(劣化)した文字の例を示す図である。同図のように、文字を構成する画素の色(この場合は無彩色に見える)は色々な色の成分からなり、たとえ同じ文字であっても図のようにモザイク状となる。そのため文字矩形を抽出し、それらの矩形内の画素値(例えばRGBの成分値)を求めて文字色を推定すると、原稿が黒一色で書かれた場合であっても、スキャナなどでの読み取り時の文字色の劣化により、多数の黒色文字(純粋の黒だけでなく、濃いグレーや他の色成分が混ざった黒に近い色)が求められ、上記のファイルサイズ削減による高圧縮を困難にしている。
そこで、一般的には色空間で色クラスタリング等の処理を行い、カラー画像中の色数を減らすという処理が行われている。色クラスタリングは現在様々な方法が提案されており、例えばPA法はカラー画像の画素から3次元ヒストグラムを作成し、ヒストグラムでの頻度が高い色を順に取る手法である(非特許文献1参照)。
また、色空間を格子上に分割し、その格子内に入る画素の重心を求め、重心をその格子の色にする方法も提案されている(非特許文献2参照)。
なお、カラー文書画像から背景色を取り除き、文字を構成する画素の色(複数)から代表色を1色求め、その色を文字の色とする方法もある(特許文献1)。
しかし、非特許文献1のPA法は、カラー画像の全画素から3次元ヒストグラムを作成するため、カラー画像内の文字色に偏りがある場合などは、その偏っている色の周辺の色を多く取ってしまうという欠点がある。また、PA法の欠点を改良した非特許文献2では、格子の大きさによっては使用頻度の低い文字の色が無視されたり、重心を求めることによって色が変化するなどの問題があった。
本発明は、上述した実情を考慮してなされたものであって、文字の色を少ない色数で表現する際、カラー画像中の文字の色が偏った場合や使用頻度の低い文字色がある場合でも、精度よく文字の色の推定が行える画像処理技術を提供することを目的とする。
本発明は、上述した実情を考慮してなされたものであって、文字の色を少ない色数で表現する際、カラー画像中の文字の色が偏った場合や使用頻度の低い文字色がある場合でも、精度よく文字の色の推定が行える画像処理技術を提供することを目的とする。
上記の課題を解決するために、請求項1に記載の画像処理方法は、カラー画像から文字領域を抽出する抽出ステップと、色空間をN色の代表点で分割する分割ステップと、前記文字領域の文字を構成する画素を前記分割ステップにより分割した色空間に分類する分類ステップと、分類結果の画素数に基づいて分割した色空間毎の構成色数を決定する構成色数決定ステップと、前記分割した色空間毎に分類された画素の画素値でヒストグラムを作成するヒストグラム作成ステップと、作成したヒストグラムから前記分割ステップにより分割した色空間毎に、色の出現度合いを求め、求めた出現度合いの大きい画素値を順に前記構成色数決定ステップにより決定した構成色数だけ構成色とする構成色ステップとを備えたことを特徴とする。
また、請求項2の画像処理方法は、カラー画像から文字領域を抽出する抽出ステップと、色空間をN色の代表点で分割する分割ステップと、前記文字領域の文字を構成する画素を前記分割ステップにより分割した色空間に分類する分類ステップと、分類結果の画素数に基づいて分割した色空間毎の構成色数を決定する構成色数決定ステップと、前記分割した色空間毎に分類された画素の画素値でヒストグラムを作成するヒストグラム作成ステップと、作成したヒストグラムから前記分割した色空間毎に色の出現度合いを求め、それらを合成する合成ステップと、合成した出現度合いの大きい画素値を順に構成色とする構成色ステップとを備えたことを特徴とする。
また、請求項3の画像処理方法は、カラー画像から文字領域を抽出する抽出ステップと、HSV色空間をN色の代表点で分割する分割ステップと、前記文字領域の文字を構成する画素を前記分割ステップにより分割した色空間に分類する分類ステップと、分類結果の画素数に基づいて分割した色空間毎の構成色数を決定する構成色数決定ステップと、前記分割した色空間毎に分類された画素の画素値で軸ヒストグラムを作成するヒストグラム作成ステップと、作成した軸ヒストグラムから前記分割した色空間毎に前記決定した構成色数だけ、各軸の頻度の大きい画素値を順に組にして構成色とする構成色ステップとを備えたことを特徴とする。
また、請求項2の画像処理方法は、カラー画像から文字領域を抽出する抽出ステップと、色空間をN色の代表点で分割する分割ステップと、前記文字領域の文字を構成する画素を前記分割ステップにより分割した色空間に分類する分類ステップと、分類結果の画素数に基づいて分割した色空間毎の構成色数を決定する構成色数決定ステップと、前記分割した色空間毎に分類された画素の画素値でヒストグラムを作成するヒストグラム作成ステップと、作成したヒストグラムから前記分割した色空間毎に色の出現度合いを求め、それらを合成する合成ステップと、合成した出現度合いの大きい画素値を順に構成色とする構成色ステップとを備えたことを特徴とする。
また、請求項3の画像処理方法は、カラー画像から文字領域を抽出する抽出ステップと、HSV色空間をN色の代表点で分割する分割ステップと、前記文字領域の文字を構成する画素を前記分割ステップにより分割した色空間に分類する分類ステップと、分類結果の画素数に基づいて分割した色空間毎の構成色数を決定する構成色数決定ステップと、前記分割した色空間毎に分類された画素の画素値で軸ヒストグラムを作成するヒストグラム作成ステップと、作成した軸ヒストグラムから前記分割した色空間毎に前記決定した構成色数だけ、各軸の頻度の大きい画素値を順に組にして構成色とする構成色ステップとを備えたことを特徴とする。
また、請求項4は、請求項1、2または3記載の画像処理方法において、前記色空間をN色の代表点で分割する分割ステップは、色空間を4色(黒、赤、緑、青)の代表点で分割することを特徴とする。
また、請求項5は、請求項1、2または3記載の画像処理方法において、前記色空間をN色の代表点で分割する分割ステップは、色空間を所定の色のグループで指定した代表点を用いて段階的に分割することを特徴とする。
また、請求項6は、請求項1、2または3記載の画像処理方法において、前記色空間をN色の代表点で分割する分割ステップは、前記代表点を任意に指定するようにしたことを特徴とする。
また、請求項7は、請求項1〜6のいずれか1項に記載の画像処理方法において、前記決定した構成色を用いて文字を構成する各画素の画素値を一番近い構成色の画素値に変更するステップを設けたことを特徴とする。
また、請求項8は、請求項1〜7のいずれか1項に記載の画像処理方法を用いて画像処理を行う画像形成装置である。
また、請求項9は、コンピュータを、請求項8に記載の画像形成装置として機能させるためのプログラムである。
また、請求項10は、コンピュータに、請求項1〜7のいずれか1項に記載の画像処理方法を実現させるためのプログラムである。
また、請求項11は、請求項9または10に記載の画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体である。
また、請求項5は、請求項1、2または3記載の画像処理方法において、前記色空間をN色の代表点で分割する分割ステップは、色空間を所定の色のグループで指定した代表点を用いて段階的に分割することを特徴とする。
また、請求項6は、請求項1、2または3記載の画像処理方法において、前記色空間をN色の代表点で分割する分割ステップは、前記代表点を任意に指定するようにしたことを特徴とする。
また、請求項7は、請求項1〜6のいずれか1項に記載の画像処理方法において、前記決定した構成色を用いて文字を構成する各画素の画素値を一番近い構成色の画素値に変更するステップを設けたことを特徴とする。
また、請求項8は、請求項1〜7のいずれか1項に記載の画像処理方法を用いて画像処理を行う画像形成装置である。
また、請求項9は、コンピュータを、請求項8に記載の画像形成装置として機能させるためのプログラムである。
また、請求項10は、コンピュータに、請求項1〜7のいずれか1項に記載の画像処理方法を実現させるためのプログラムである。
また、請求項11は、請求項9または10に記載の画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体である。
本発明によれば、劣化して増大した文字色を少ない文字色にすることができ、画像圧縮の効果が増大する。
また、文書中に少数しかない文字色でも精度よく取り出すことができ、従来法よりも精度良く色数の推定が可能になる。
さらに、事前情報等によって色空間を自由に分割できるので、文字の色を理想的な色あるいは所望の色に変更することが可能となる。
また、文書中に少数しかない文字色でも精度よく取り出すことができ、従来法よりも精度良く色数の推定が可能になる。
さらに、事前情報等によって色空間を自由に分割できるので、文字の色を理想的な色あるいは所望の色に変更することが可能となる。
以下、図面を参照して、本発明の実施形態を詳細に説明する。
図1は本発明の画像処理手順を示すフローチャートである。
イメージスキャナなどの入力機器、またはインターネットなどネットワークよりカラー画像を取得し(ステップS1)、取得したカラー画像から文字の領域を抽出する(ステップS2)。文字領域を判別するアルゴリズムは多く公開されており、例えば特開平8−123901号などを使用することができる。次に、文字色を分類するために、色空間を分割するための代表点を決定する(ステップS3)。決定方法は、サンプル画像から求める方法や事前の知識を活用して与える方法等がある。
代表点をサンプル画像から求める方法は、スキャナやプリンタなどの文字の色が単一色から劣化した原因と思われる過程が既知の場合に、劣化過程を考慮した色空間の分割が可能になる。例えば、想定されているシステムが既知の場合には、そのシステムで出力された文書を代表色毎に用意して、その文書を用いて各代表色の情報(例えば、平均や分散など)を求めて代表色にする。
事前の知識を活用して与える方法では、様々な事前知識や条件(例えば、カラー文書画像には黒文字が多いなど)によって色空間をその特性に合わせて分割できるという利点がある。例えば、黒い文字はカラー文書画像に比較的多い文字という事前知識があった場合には、黒の代表点のみ2点用意する、または黒文字の分布を仮定する場合などは黒の分散を比較的大きく見積もるなどが可能である。図2は、文字色の割合の例を示す図である。例えば、オフィス文書には黒文字が多く使われているという事前知識から、黒は他の色より広い区間を占めるように代表点を設定する。
本実施例として、色空間を4色(黒、赤、緑、青)の代表色で分割し、それぞれの代表点をRGB空間の(R,G,B)=(128,128,128),(255,0,0),(0,255,0),(0,0,255)の4点とする。これら4色に分割した理由としては、「黒」はカラー文書画像中に多く見られる文字色で、「赤、緑、青」は文書中で強調したり目立たせるのに使用される色であり、光の3原色で色を表す上で重要な色であるという理由からである。この他に、代表点を6色(黒、赤、緑、青、黄、シアン、マジェンタ)で指定してもよい。すなわち、文書がどのくらい多彩な色で書かれているかによって色分割を変更すると効果的である。なお、ここで言う色空間は、RGBや、HSV、L*u*v*などの色空間モデルを示している。例えば、色差式を使って分類する場合などはL*u*v*を用いる方が良い。この実施例1では、RGBを用いた例である。
イメージスキャナなどの入力機器、またはインターネットなどネットワークよりカラー画像を取得し(ステップS1)、取得したカラー画像から文字の領域を抽出する(ステップS2)。文字領域を判別するアルゴリズムは多く公開されており、例えば特開平8−123901号などを使用することができる。次に、文字色を分類するために、色空間を分割するための代表点を決定する(ステップS3)。決定方法は、サンプル画像から求める方法や事前の知識を活用して与える方法等がある。
代表点をサンプル画像から求める方法は、スキャナやプリンタなどの文字の色が単一色から劣化した原因と思われる過程が既知の場合に、劣化過程を考慮した色空間の分割が可能になる。例えば、想定されているシステムが既知の場合には、そのシステムで出力された文書を代表色毎に用意して、その文書を用いて各代表色の情報(例えば、平均や分散など)を求めて代表色にする。
事前の知識を活用して与える方法では、様々な事前知識や条件(例えば、カラー文書画像には黒文字が多いなど)によって色空間をその特性に合わせて分割できるという利点がある。例えば、黒い文字はカラー文書画像に比較的多い文字という事前知識があった場合には、黒の代表点のみ2点用意する、または黒文字の分布を仮定する場合などは黒の分散を比較的大きく見積もるなどが可能である。図2は、文字色の割合の例を示す図である。例えば、オフィス文書には黒文字が多く使われているという事前知識から、黒は他の色より広い区間を占めるように代表点を設定する。
本実施例として、色空間を4色(黒、赤、緑、青)の代表色で分割し、それぞれの代表点をRGB空間の(R,G,B)=(128,128,128),(255,0,0),(0,255,0),(0,0,255)の4点とする。これら4色に分割した理由としては、「黒」はカラー文書画像中に多く見られる文字色で、「赤、緑、青」は文書中で強調したり目立たせるのに使用される色であり、光の3原色で色を表す上で重要な色であるという理由からである。この他に、代表点を6色(黒、赤、緑、青、黄、シアン、マジェンタ)で指定してもよい。すなわち、文書がどのくらい多彩な色で書かれているかによって色分割を変更すると効果的である。なお、ここで言う色空間は、RGBや、HSV、L*u*v*などの色空間モデルを示している。例えば、色差式を使って分類する場合などはL*u*v*を用いる方が良い。この実施例1では、RGBを用いた例である。
次に、ステップS2で抽出した文字領域の文字を構成する画素を画素値(R,G,B)を基にステップ3で与えた代表点で代表する色空間に分類する(ステップS4)。図3は、色空間の分割の例を示す図である。破線で示す領域はそれぞれ、上記代表点(×印)で分割された色空間である。各画素の色による分類方法は距離による分類(ユークリッド距離やマハラノビス距離など)、判別関数による分類(参考文献:石井健一郎、“わかりやすいパターン認識”、オーム社、1998年)、色差式の大小比較(参考文献:大田登、“色彩工学”、東京電機大学出版、2001年)などで行う。画素が分類された各々の集合(色空間)をWi(i=1,…,N)とする。Nは代表点数で、本実施例では、N=4である。
次に、分割した各色空間で取られる構成色の最大数mi(i=1,…,N)を求める(ステップS5)。miを求める方法は、事前の知識によって決定する方法(例えば、黒と赤に分類された文字はそれぞれ1色のみである)などもあるが、ここでは、画素の集合Wiに含まれる画素数ti(i=1,…,N)と、文字領域全体の画素数T=Σtiから、分割した各色空間で取られる構成色(採用する色)の最大数miを下記のように求める。
すなわち、mi=int(ti*10/T)そして、総構成色数Mは、M=Σmiとなる。上の式では、10は文字領域全体の文字の色数をほぼ10色にすることを示している。この例では、全体の10%がWiに分類されないと、その色は存在しないと扱われる。つまりmi=0となる。
mi=int((ti/T+0.09)*10)としてもよい。この例では、例えば全画素1万個中100個(1%)の画素が存在すれば、その色の文字が存在するとして処理される。この修正項(0.09)をあまり大きい値にすると、ノイズを文字色に採用してしまい、反対に小さい値にすると、実際に存在する色の文字が別の色になってしまう。勿論、10も0.09も、パラメータとして実行時に変更できるようにしてもよい。
次に、分割した各色空間で取られる構成色の最大数mi(i=1,…,N)を求める(ステップS5)。miを求める方法は、事前の知識によって決定する方法(例えば、黒と赤に分類された文字はそれぞれ1色のみである)などもあるが、ここでは、画素の集合Wiに含まれる画素数ti(i=1,…,N)と、文字領域全体の画素数T=Σtiから、分割した各色空間で取られる構成色(採用する色)の最大数miを下記のように求める。
すなわち、mi=int(ti*10/T)そして、総構成色数Mは、M=Σmiとなる。上の式では、10は文字領域全体の文字の色数をほぼ10色にすることを示している。この例では、全体の10%がWiに分類されないと、その色は存在しないと扱われる。つまりmi=0となる。
mi=int((ti/T+0.09)*10)としてもよい。この例では、例えば全画素1万個中100個(1%)の画素が存在すれば、その色の文字が存在するとして処理される。この修正項(0.09)をあまり大きい値にすると、ノイズを文字色に採用してしまい、反対に小さい値にすると、実際に存在する色の文字が別の色になってしまう。勿論、10も0.09も、パラメータとして実行時に変更できるようにしてもよい。
次に、ステップS4で分類された画素Wiの集合毎に画素値のヒストグラムHi(r,g,b)(i=1,…,N)を作成する(ステップS6)。このHi(r,g,b)という表記は、要素数がそれぞれr、g、b個の3次元の行列(配列)を表すものとし、例えば、H(256,256,256)という配列がN個あり、ヒストグラムHの場合、配列要素に入る値は画素値の度数である。以降も同様の表記を用いて説明する。そして、求めたヒストグラムHi(r,g,b)(i=1,…,N)をWiの画素数tiで各々割る。これによってヒストグラムHi(r,g,b)は、代表点で分割した色空間iにおける色の出現率を表すPi(r、g、b)(i=1,…、N)となる。
即ち、Pi(r,g,b)=Hi(r,g,b)/tiで、左辺は色空間iにおける、ある色(r,g,b)の出現割合を表す。そして、分割した色空間i毎に、色の出現率Pi(r,g,b)の大きい順にステップ5で求めたmiの数だけ、それぞれの色空間iごとに構成色Cij(r,g,bの画素値 j=1,…,mi)を取り出す(ステップS7)。
なお、文字の各画素の色は最終的に、それぞれの色空間ごとにPi(r,g,b)の値の大きい順に取り出した色Cijのうち一番距離が近い色に変更することで、文字色の減色を行うことができる(ステップS8)。この場合、mi=1なら色空間の代表点の画素値にしてもよい。こうすると、劣化した色を忠実に再現するのではなく、理想の色あるいは所望の色に変換することもできる。
以上の処理を行うことで、カラー画像から従来手法よりも精度よく文字の色数を求めることができる。その主な理由は、代表点をサンプル画像によって決定した場合には、スキャナやプリンタの特性を考慮した色分割が適切に行えること、代表点を事前の知識を活用して決定した場合には、色の分布の偏りや、人間が容易に見分けられる色(例えば、黒、赤、青、緑など)などの事前情報により、色空間の分割を適切に行えること、色空間を分割し、分割した色空間毎の色の出現確率を参照することにより、文字の色が偏っていても、それぞれの分類で色を評価できること、また、分類された画素数から分割した色空間の構成色数を決定できることによる。
即ち、Pi(r,g,b)=Hi(r,g,b)/tiで、左辺は色空間iにおける、ある色(r,g,b)の出現割合を表す。そして、分割した色空間i毎に、色の出現率Pi(r,g,b)の大きい順にステップ5で求めたmiの数だけ、それぞれの色空間iごとに構成色Cij(r,g,bの画素値 j=1,…,mi)を取り出す(ステップS7)。
なお、文字の各画素の色は最終的に、それぞれの色空間ごとにPi(r,g,b)の値の大きい順に取り出した色Cijのうち一番距離が近い色に変更することで、文字色の減色を行うことができる(ステップS8)。この場合、mi=1なら色空間の代表点の画素値にしてもよい。こうすると、劣化した色を忠実に再現するのではなく、理想の色あるいは所望の色に変換することもできる。
以上の処理を行うことで、カラー画像から従来手法よりも精度よく文字の色数を求めることができる。その主な理由は、代表点をサンプル画像によって決定した場合には、スキャナやプリンタの特性を考慮した色分割が適切に行えること、代表点を事前の知識を活用して決定した場合には、色の分布の偏りや、人間が容易に見分けられる色(例えば、黒、赤、青、緑など)などの事前情報により、色空間の分割を適切に行えること、色空間を分割し、分割した色空間毎の色の出現確率を参照することにより、文字の色が偏っていても、それぞれの分類で色を評価できること、また、分類された画素数から分割した色空間の構成色数を決定できることによる。
この実施例2では、構成色Cのとり方において実施例1との違いがある。従って処理については、図1のフローチャートで、ステップS6までは同じである。本実施例のステップ7では、Pi(r,g,b)を用いて正規化した出現率A(r,g,b)を求める。
すなわち、
A(r,g,b)=(ΣPi(r,g,b))/N(i=1,…,N)
のように正規化する。この式は、N個のP(r,g,b)の配列要素同士を足し合わせNで割り、行列Aの対応する配列要素に代入することを意味する。こうすることにより、分割した色空間iと無関係となる。そして、出現率A(r,g,b)から値の大きい順に構成色Cjを最大M個取り出す。ただし、取り出した色の出現率A(r,g,b)が所定の閾値Xよりも小さい場合は構成色として採用せずに処理を終了する。
以上の処理を行うことにより、カラー画像から従来手法よりも精度よく文字の色数を求めることができる。その主な理由は、色空間を分割し、分割した色空間毎の色の出現率とすることにより、文字の色が偏っていても、それぞれの分類で色を評価できること、閾値Xを決定することにより、色クラスタリングの結果を制御できることによる。
すなわち、
A(r,g,b)=(ΣPi(r,g,b))/N(i=1,…,N)
のように正規化する。この式は、N個のP(r,g,b)の配列要素同士を足し合わせNで割り、行列Aの対応する配列要素に代入することを意味する。こうすることにより、分割した色空間iと無関係となる。そして、出現率A(r,g,b)から値の大きい順に構成色Cjを最大M個取り出す。ただし、取り出した色の出現率A(r,g,b)が所定の閾値Xよりも小さい場合は構成色として採用せずに処理を終了する。
以上の処理を行うことにより、カラー画像から従来手法よりも精度よく文字の色数を求めることができる。その主な理由は、色空間を分割し、分割した色空間毎の色の出現率とすることにより、文字の色が偏っていても、それぞれの分類で色を評価できること、閾値Xを決定することにより、色クラスタリングの結果を制御できることによる。
まず、実施例1のステップS6までの処理を行う。但し、この実施例では、色空間モデルとして、RGB空間でなく、色空間を構成する各軸が互いに独立な(または相関が低い)色空間を用いることとする。
図4はHSV色空間モデルを説明する図である。同図において、Hは基準となる0°から反時計周りに計った角度で、例えば0°は赤、120°は緑のように色相を表す。Sは彩度を表し、中心からの距離で外に行くほど高く、Vは明度を表し、上に行くほど高くなる。原色は、明度V、彩度Sともに100%である。
本実施例では、HSV空間を用いるが、主成分分析による軸変換を行って、直交系への変換を行っても良い。従って、代表点もHSVで与え、RGB画素値は公知の変換式(例えば、前掲の大田登著“色彩工学”)を用いて変換する。
まず、ヒストグラムHi(h,s,v)(i=1,…,N)を用いて、色空間を構成する各軸(H,S,V)毎のヒストグラムUhi(h)、Usi(s)、Uvi(v)を作成する。そして、Uhi(h)、Usi(s)、Uvi(v)毎に最大値を取り出して、構成色候補C’を作る。C’はそのときの各h、s、vの値を画素値とした色である。
分割した色空間で取り出した構成色数C’がmi以下ならば、Hi(h,s,v)から取り出した構成色候補C’に対応する値を削除(配列要素をクリア)して、C’を構成色Cjとし、上記の処理を繰り返す。分割した色空間で取り出した現在の構成色数がmiを超えたならば分割した色空間iでの処理を終了する。この処理は、すべての分割した色空間iについて行う。
以上の処理を行うことにより、カラー画像から従来手法よりも精度よく文字の色数を求めることができる。主な理由は、文書中に多い色の文字を順に削除できるため、偏りに左右されずに構成色を取り出せること、また、分類された画素数から分割した色空間の構成色数を決定できることによる。
図4はHSV色空間モデルを説明する図である。同図において、Hは基準となる0°から反時計周りに計った角度で、例えば0°は赤、120°は緑のように色相を表す。Sは彩度を表し、中心からの距離で外に行くほど高く、Vは明度を表し、上に行くほど高くなる。原色は、明度V、彩度Sともに100%である。
本実施例では、HSV空間を用いるが、主成分分析による軸変換を行って、直交系への変換を行っても良い。従って、代表点もHSVで与え、RGB画素値は公知の変換式(例えば、前掲の大田登著“色彩工学”)を用いて変換する。
まず、ヒストグラムHi(h,s,v)(i=1,…,N)を用いて、色空間を構成する各軸(H,S,V)毎のヒストグラムUhi(h)、Usi(s)、Uvi(v)を作成する。そして、Uhi(h)、Usi(s)、Uvi(v)毎に最大値を取り出して、構成色候補C’を作る。C’はそのときの各h、s、vの値を画素値とした色である。
分割した色空間で取り出した構成色数C’がmi以下ならば、Hi(h,s,v)から取り出した構成色候補C’に対応する値を削除(配列要素をクリア)して、C’を構成色Cjとし、上記の処理を繰り返す。分割した色空間で取り出した現在の構成色数がmiを超えたならば分割した色空間iでの処理を終了する。この処理は、すべての分割した色空間iについて行う。
以上の処理を行うことにより、カラー画像から従来手法よりも精度よく文字の色数を求めることができる。主な理由は、文書中に多い色の文字を順に削除できるため、偏りに左右されずに構成色を取り出せること、また、分類された画素数から分割した色空間の構成色数を決定できることによる。
これまでの実施例では、N色(例えば黒、赤、緑、青)によって色空間を分割したが、段階的に分割してもよい。例えば、2色(無彩色、有彩色)に分割後、各3色(黒、灰、白)、(赤、緑、青)で分割するような方法でもよい。分類の方法は、例えば無彩色をまとめて抽出するには、上記実施例1、2で使用したRGB色空間を用い、有彩色をxy色度図を用いて分類するとよい。黒や灰色は文書画像に比較的多く存在しているため、ヒストグラムの上位から色を決定すると、精度を低下させる原因になる。xy色度図では、黒、灰色などの無彩色はxy色度図全体に広がるため、xy色度図を分割する場合などは、まず無彩色と有彩色を分離する必要がある。
図5は本発明を実施するためのハードウエア構成例を示す図である。本発明の機能は、ソフトウェアによって実現するものであり、CPU1、メモリ2、ハードディスク4、入力装置5、CD−ROMドライブ3、ディスプレイ6、マウスなどからなる汎用の処理装置(例えばパーソナルコンピュータ)や同様な構成のハードウエアで実施可能である。
本発明の機能を複写機や印刷装置、ファクシミリ等の画像形成装置に組み込む場合は、画像形成装置に備わったCPUやメモリ等を利用してもよいし、必要に応じて上記のハードウエアとプログラム等を追加すればよい。
本発明をパーソナルコンピュータで実施する場合は、CD−ROMなどの記録媒体7には、本発明の処理機能や処理手順を実現するためのプログラムが記録されている。また、処理対象の原稿画像は、例えば入力装置5を通してハードディスク4などに格納されている。CPU1は、記録媒体7から上述した処理機能、手順を実現するためのプログラムを読み出し実行し、画像処理の結果をハードディスク4に保存し、必要に応じてディスプレイ6に出力すればよい。
本発明の機能を複写機や印刷装置、ファクシミリ等の画像形成装置に組み込む場合は、画像形成装置に備わったCPUやメモリ等を利用してもよいし、必要に応じて上記のハードウエアとプログラム等を追加すればよい。
本発明をパーソナルコンピュータで実施する場合は、CD−ROMなどの記録媒体7には、本発明の処理機能や処理手順を実現するためのプログラムが記録されている。また、処理対象の原稿画像は、例えば入力装置5を通してハードディスク4などに格納されている。CPU1は、記録媒体7から上述した処理機能、手順を実現するためのプログラムを読み出し実行し、画像処理の結果をハードディスク4に保存し、必要に応じてディスプレイ6に出力すればよい。
1…CPU、
2…メモリ、
3…CD−ROMドライブ、
4…ハードディスク、
5…入力装置、
6…ディスプレイ、
7…記録媒体、
8…バス
2…メモリ、
3…CD−ROMドライブ、
4…ハードディスク、
5…入力装置、
6…ディスプレイ、
7…記録媒体、
8…バス
Claims (11)
- カラー画像から文字領域を抽出する抽出ステップと、色空間をN色の代表点で分割する分割ステップと、前記文字領域の文字を構成する画素を前記分割ステップにより分割した色空間に分類する分類ステップと、分類結果の画素数に基づいて分割した色空間毎の構成色数を決定する構成色数決定ステップと、前記分割した色空間毎に分類された画素の画素値でヒストグラムを作成するヒストグラム作成ステップと、作成したヒストグラムから前記分割ステップにより分割した色空間毎に、色の出現度合いを求め、求めた出現度合いの大きい画素値を順に前記構成色数決定ステップにより決定した構成色数だけ構成色とする構成色ステップとを備えたことを特徴とする画像処理方法。
- カラー画像から文字領域を抽出する抽出ステップと、色空間をN色の代表点で分割する分割ステップと、前記文字領域の文字を構成する画素を前記分割ステップにより分割した色空間に分類する分類ステップと、分類結果の画素数に基づいて分割した色空間毎の構成色数を決定する構成色数決定ステップと、前記分割した色空間毎に分類された画素の画素値でヒストグラムを作成するヒストグラム作成ステップと、作成したヒストグラムから前記分割した色空間毎に色の出現度合いを求め、それらを合成する合成ステップと、合成した出現度合いの大きい画素値を順に構成色とする構成色ステップとを備えたことを特徴とする画像処理方法。
- カラー画像から文字領域を抽出する抽出ステップと、HSV色空間をN色の代表点で分割する分割ステップと、前記文字領域の文字を構成する画素を前記分割ステップにより分割した色空間に分類する分類ステップと、分類結果の画素数に基づいて分割した色空間毎の構成色数を決定する構成色数決定ステップと、前記分割した色空間毎に分類された画素の画素値で軸ヒストグラムを作成するヒストグラム作成ステップと、作成した軸ヒストグラムから前記分割した色空間毎に前記決定した構成色数だけ、各軸の頻度の大きい画素値を順に組にして構成色とする構成色ステップとを備えたことを特徴とする画像処理方法。
- 前記色空間をN色の代表点で分割する分割ステップは、色空間を4色(黒、赤、緑、青)の代表点で分割することを特徴とする請求項1、2または3記載の画像処理方法。
- 前記色空間をN色の代表点で分割する分割ステップは、色空間を所定の色のグループで指定した代表点を用いて段階的に分割することを特徴とする請求項1、2または3記載の画像処理方法。
- 前記色空間をN色の代表点で分割する分割ステップは、前記代表点を任意に指定するようにしたことを特徴とする請求項1、2または3記載の画像処理方法。
- 請求項1〜6のいずれか1項に記載の画像処理方法において、前記決定した構成色を用いて文字を構成する各画素の画素値を一番近い構成色の画素値に変更するステップを設けたことを特徴とする画像処理方法。
- 請求項1〜7のいずれか1項に記載の画像処理方法を用いて画像処理を行う画像形成装置。
- コンピュータを、請求項8に記載の画像形成装置として機能させるためのプログラム。
- コンピュータに、請求項1〜7のいずれか1項に記載の画像処理方法を実現させるためのプログラム。
- 請求項9または10に記載の画像処理プログラムを記録したコンピュータ読み取り可能な記録媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005183911A JP2007006142A (ja) | 2005-06-23 | 2005-06-23 | 画像処理方法、画像形成装置、プログラム及び記録媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2005183911A JP2007006142A (ja) | 2005-06-23 | 2005-06-23 | 画像処理方法、画像形成装置、プログラム及び記録媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2007006142A true JP2007006142A (ja) | 2007-01-11 |
Family
ID=37691314
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2005183911A Pending JP2007006142A (ja) | 2005-06-23 | 2005-06-23 | 画像処理方法、画像形成装置、プログラム及び記録媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2007006142A (ja) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013145873A1 (ja) * | 2012-03-27 | 2013-10-03 | 株式会社サタケ | 光学式粒状物選別機 |
WO2014126232A1 (ja) * | 2013-02-18 | 2014-08-21 | 株式会社サタケ | 光学式粒状物選別機 |
-
2005
- 2005-06-23 JP JP2005183911A patent/JP2007006142A/ja active Pending
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2013145873A1 (ja) * | 2012-03-27 | 2013-10-03 | 株式会社サタケ | 光学式粒状物選別機 |
US9024223B2 (en) | 2012-03-27 | 2015-05-05 | Satake Corporation | Optical type granule sorting machine |
JPWO2013145873A1 (ja) * | 2012-03-27 | 2015-12-10 | 株式会社サタケ | 光学式粒状物選別機 |
WO2014126232A1 (ja) * | 2013-02-18 | 2014-08-21 | 株式会社サタケ | 光学式粒状物選別機 |
JP2014157119A (ja) * | 2013-02-18 | 2014-08-28 | Satake Corp | 光学式粒状物選別機 |
US9676005B2 (en) | 2013-02-18 | 2017-06-13 | Satake Corporation | Optical type granule sorting machine |
TWI618582B (zh) * | 2013-02-18 | 2018-03-21 | 佐竹股份有限公司 | 光學式粒狀物選別機 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5032911B2 (ja) | 画像処理装置及び画像処理方法 | |
JP5795548B2 (ja) | 拡張rgb空間へのトーンマッピングを用いた高ダイナミックレンジ画像の処理方法 | |
US10332262B2 (en) | Removal of background information from digital images | |
US20110116713A1 (en) | Image contrast enhancement apparatus and method thereof | |
JP2015011585A (ja) | 画像処理装置、画像形成装置、画像形成システム、画像処理方法およびプログラム | |
JP2008028717A (ja) | 画像処理装置および方法、プログラム | |
JP2004334852A (ja) | ピクセルタイプによる画像処理 | |
US8810877B2 (en) | Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image | |
JP5151708B2 (ja) | 画像処理装置および画像処理プログラム | |
JP2007006142A (ja) | 画像処理方法、画像形成装置、プログラム及び記録媒体 | |
US8259347B2 (en) | Image processing apparatus and computer readable medium | |
JP2009171158A (ja) | モザイク画像生成装置、方法及びプログラム | |
JP5863723B2 (ja) | 画像処理装置および画像形成装置 | |
JP6091400B2 (ja) | 画像処理装置 | |
JP2007005907A (ja) | 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体 | |
CN105631812B (zh) | 一种对显示图像进行色彩增强的控制方法及控制装置 | |
JP2010050832A (ja) | 画像処理装置、画像処理方法、プログラムおよび記録媒体 | |
JP4228905B2 (ja) | 画像処理装置及びプログラム | |
JP7362405B2 (ja) | 画像処理装置、画像処理方法、およびプログラム | |
US20100232717A1 (en) | Image processing apparatus, information processing apparatus, and image reading apparatus | |
JP6145983B2 (ja) | 画像処理装置およびコンピュータプログラム | |
JP2007335983A (ja) | 画像処理装置 | |
JP2005045342A (ja) | 画像処理装置及び画像処理をコンピュータに実行させる画像処理プログラム | |
JP7185451B2 (ja) | 画像処理装置と画像処理方法、及びプログラム | |
JP5884509B2 (ja) | 画像処理装置、画像読取装置およびプログラム |