JP4050220B2

JP4050220B2 - 画像処理方法及び画像処理装置並びに画像形成装置、プログラム、記録媒体

Info

Publication number: JP4050220B2
Application number: JP2003392991A
Authority: JP
Inventors: 豊久松田
Original assignee: Sharp Corp
Current assignee: Sharp Corp
Priority date: 2003-11-21
Filing date: 2003-11-21
Publication date: 2008-02-20
Anticipated expiration: 2023-11-21
Also published as: JP2005159576A

Description

本発明は、画像処理方法及び画像処理装置並びに画像形成装置、プログラム、記録媒体に関するものである。より詳しくは、入力画像データを文字領域・網点領域・連続階調領域などの複数に分離する画像処理方法及び画像処理装置並びに画像形成装置、プログラム、記録媒体に関するものである。

近年、デジタル画像システムが目覚しい発達を遂げ、デジタル画像処理技術の構築が進んでいる。例えば複写機の分野においては、文字、及び、絵柄領域が混在するような原稿に対しても高画質で出力されることが要求されている。また、スキャナ部で読み込まれた画像に対して、高画質化処理を行なうために、入力画像データを、文字領域、絵柄領域などの複数の領域に分離し、その領域毎に適応的な画質改善処理を適用することが一般的である。本明細書では、網点領域、及び、連続階調領域（例えば、印画紙写真）を総称して絵柄領域とする。

例えば、非特許文献１及び非特許文献２に、スキャナにより読み込まれた画像データの処理方法が記載されている。

上記の非特許文献１及び２では、原稿からの反射光像が、カラー画像入力装置（画像読取手段）に設けられたＣＣＤ(charge coupled device)により、ＲＧＢのアナログ信号として読み取られ、Ａ／Ｄ（アナログ／デジタル）変換部にて、デジタル信号に変換される。そして、カラー画像入力装置の照明系、結像系、撮像系で生じる各種の歪みを取り除くシェーディング補正がなされる。そして、カラーバランスを整える処理、及び、ＲＧＢの反射率信号を濃度信号に変換する処理が施される。

そして、入力画像中の各画素を文字領域、絵柄領域等の複数の領域に分離する領域分離処理がなされ、画素がどの領域に属しているのかを示す領域識別信号が、出力される。

次に、色再現の忠実化を実現するために、不要吸収成分を含むＣＭＹ（Ｃ：シアン・Ｍ：マゼンタ・Ｙ：イエロー）色材の分光特性に基づいた色濁りを取り除く色補正処理がなされる。そして、画像をＣＭＹＢ（Ｂ：黒）の４色で再現するために、黒生成下色除去処理が行なわれる。

例えば、文字／絵柄領域が混在する原稿において、上記領域分離処理により文字に分離された領域は、特に黒文字、または、色文字の再現性を高めるために、フィルタ処理（空間フィルタ処理）による鮮鋭強調処理で高周波数の強調量が大きくされる。同時に、中間調処理（階調再現処理）においては、高域周波数の再現に適した高解像度のスクリーンでの二値化、または、多値化処理が選択される。

また、上記領域分離処理により絵柄領域に分離された領域に関しては、フィルタ処理において、入力網点成分を除去するためのローパスフィルタ処理が施される。中間調処理が施されたＣＭＹＫの画像データは、カラー画像入力装置に出力され、紙などの記録媒体上に画像形成が成される（非特許文献１参照）。

また、上記非特許文献２の６５頁に記載されているように、ＲＧＢの画像データをＬ^＊ａ^＊ｂ^＊信号に変換して、領域分離処理等を行う方法もある。

例えば、特許文献１（従来例１とする）に、文字／絵柄領域を分類する画像領域分離方法が開示されている。従来例１では、絵柄、及び、文字などの異なる複数種類の非背景領域と、非背景領域が存在しない背景領域とからなる入力画像データから、非背景色画素を抽出している。そして、連続する非背景画素（ラン）の数と、当該連続する非背景画素中におけるエッジ画素数との割合に基づいて、入力画像データから、写真や文字などの異なる複数種類の非背景領域を分離している。
電子写真学会誌第３６巻第４号（１９９７年）ｐ．３４３〜３５２第４９回日本画像学会技術講習会（２０００年）、日本画像学会主催、ｐ．６４〜７６特許第３０７３８３７号特許公報（公開日：１９９４年２月２５日）

しかしながら、上記従来例１に開示されている画像処理方法には、文字領域と絵柄領域とを高精度に分類することができないという問題点を有する。

また、一般的に、文字領域の分離は、入力画像データのエッジ情報に基づいて行なわれる。上記従来例１の画像領域分離方法においても、連続する非背景画素中のエッジ画素の比率から文字領域の分離が行われており、基本的には、エッジ情報に基づいて、文字領域の分離が行われる。つまり、この処理は、文字・写真を精度よく分離できる。しかしながら、網点には非常に多数のエッジ情報が含まれているため、連続する背景画素のラン数と該連続する非背景画素中におけるエッジ画素数との割合だけでは、精度良く文字・網点を識別することは困難である。したがって、上記従来例１では、文字間スペースのような、エッジ情報とは独立した特徴に基づいて、文字領域の分離が行なわれていない。また、上記従来例１の文字検知処理と、従来のエッジ情報に基づく文字検知とを併用しても、それほど高い文字検知精度を期待できない。

本発明は、上記従来の問題点に鑑みなされたものであって、その目的は、文字領域と絵柄領域とを高精度に分類し得る画像処理方法及び画像処理装置並びに画像形成装置、プログラム、記録媒体を提供することにある。

本発明の画像処理装置は、上記の課題を解決するために、入力画像データを、少なくとも背景領域と、文字領域と、網点領域または連続階調領域である絵柄領域とに分離する画像処理装置において、入力画像データから背景画素を検知する背景画素検知処理手段と、上記背景画素検知処理手段にて得られた背景画素に基づいて、複数の画素よりなるブロック単位で、背景画素数をカウントする背景画素カウント処理手段と、注目ブロックの背景画素数に基づいて複数のブロックを背景ブロックと非背景ブロックとに分類すると共に、背景ブロックを近傍ブロックの背景画素数に基づいて文字領域のブロックと背景領域のブロックとに分類する背景分類処理手段と、上記背景分類処理手段にて得られた非背景ブロックを、近傍ブロックの分類結果に基づいて文字領域のブロックと絵柄領域のブロックとに分類する非背景分類処理手段とを備えることを特徴としている。

なお、本願明細書において、「近傍ブロック」とは、注目ブロックを中心とする所定領域内に存在する注目ブロック以外のブロック、例えば、注目ブロックを中心とする１×３ブロックの領域内に存在する注目ブロック以外のブロック（すなわち、注目ブロックに隣接する２つのブロック）を指すものとする。

上記ブロックは、複数の画素よりなっていればよいが、複数画素×複数画素のブロック、特に４画素×４画素のブロックであることが好ましい。尚、ブロックは矩形形状に限定されるものでなく、任意の形状であっても構わない。

上記背景分類処理手段は、少なくとも１つの近傍ブロックが、非背景ブロックに分類される背景画素数を有するブロック、すなわち非背景ブロックである場合に、背景ブロックを文字領域のブロックに分類するものであることが好ましい。上記背景分類処理手段は、注目ブロックの左右方向に隣接する２つの近傍ブロックの少なくとも１つが、非背景ブロックに分類される背景画素数を有するブロック、すなわち非背景ブロックである場合に、背景ブロックを文字領域のブロックに分類するものであることがより好ましい。

上記非背景分類処理手段は、注目ブロックが、非背景ブロックであり、かつ、注目ブロックの左右方向に存在する複数の近傍ブロックのうちの１つが局所的でない背景ブロックに分類されていた場合に、注目ブロックを文字領域のブロックに分類するものであることが好ましい。上記非背景分類処理手段は、注目ブロックが非背景ブロックであり、かつ、注目ブロックを中心とする左右方向に長い領域（例えば、注目ブロックを中心とする左右方向に長い１ブロック×３１ブロックの領域）内に存在する複数の近傍ブロックのうちの１つが局所的でない背景ブロックに分類されていた場合に、注目ブロックを文字領域のブロックに分類するものであることがより好ましい。

また、本発明の画像処理装置は、上記非背景分類処理手段で得られた絵柄領域のブロックについて、注目ブロックを含む絵柄領域のブロック数に基づいて絵柄領域に分類することが妥当であるか否かを判定し、妥当でないと判断された場合にはそのブロックの分類を文字領域のブロックに変更する絵柄領域判定処理手段をさらに備えることが好ましい。

上記絵柄領域判定処理手段は、上記非背景分類処理手段で得られた絵柄領域のブロックについて、注目ブロックを含む絵柄領域のブロック数が所定値以下であればその絵柄領域ブロックの分類を文字領域のブロックに変更するものであることが好ましい。

また、本発明の画像処理装置は、上記背景分類処理手段が、近傍ブロックの背景画素数と閾値との比較結果に基づいて背景ブロックを文字領域のブロックと背景領域のブロックとに分類するものであり、注目ブロックと近傍ブロックとの間における背景画素数の差、及び、非背景分類処理手段にて得られた近傍ブロックの分類結果に基づいて、上記閾値を動的に設定する動的閾値設定手段がさらに備えられていることが好ましい。

上記動的閾値設定手段は、注目ブロックと近傍ブロックとの間における背景画素数の差が大きいときに閾値を小さくするものであることが好ましく、注目ブロックと近傍ブロックとの間における背景画素数の差が所定値より大きい場合にその差が所定値以下である場合よりも閾値を小さくするものであることがより好ましい。また、上記動的閾値設定手段は、注目ブロックに対して所定の方向（好ましくは上下方向、例えば上方向）に隣接する１つの近傍ブロックが、非背景ブロックでない（すなわち、背景ブロックである）場合に、他の場合よりも閾値を小さくするものであることがより好ましい。上記動的閾値設定手段は、注目ブロックと近傍ブロックとの間における背景画素数の差が所定値より大きく、かつ、注目ブロックに対して所定の方向（好ましくは上下方向、例えば上方向）に隣接する１つの近傍ブロックが、非背景ブロックでない場合に、他の場合よりも閾値を小さくするものであることがより好ましい。

また、本発明の画像処理装置は、入力画像データからエッジ情報に基づいて文字領域を分離する第１の文字領域分離手段と、上記非背景分類処理手段にて得られた文字領域のブロックを文字領域として分離する第２の文字領域分離手段と、上記第２の文字領域分離手段による文字領域の分離結果と、上記第１の文字領域分離手段による文字領域の分離結果とに基づいて最終的な文字領域を決定する分離結果統合手段とをさらに備えていることが好ましい。

上記分離結果統合手段は、上記領域分離手段による文字領域の分離結果と、上記文字領域分離手段による文字領域の分離結果との論理和をとるもの、すなわち、両方の分離結果において文字領域として分離された領域のみを最終的な文字領域として決定する（一方の分離結果のみにおいて文字領域として分離された領域は最終的な文字領域としない）ものであることが好ましい。

また、本発明の画像処理装置は、上記絵柄領域のブロックを、ブロック内の輝度値の分散値に基づいて、網点領域と連続階調領域とに分類する網点領域・連続階調領域判定手段をさらに備えることが好ましい。

本発明の画像形成装置は、上記の課題を解決するために、上述の画像処理装置と、該画像処理装置で処理された画像データに基づいて画像を形成する画像出力部とを備えていることを特徴としている。

本発明の画像処理方法は、上記の課題を解決するために、入力画像データを、背景領域と、文字領域と、網点領域または連続階調領域である絵柄領域とに分離する画像処理方法において、入力画像データから背景画素を検知する背景画素検知処理ステップと、上記背景画素検知処理ステップにて得られた背景画素に基づいて、複数の画素よりなるブロック単位で、背景画素数をカウントする背景画素カウント処理ステップと、注目ブロックの背景画素数に基づいて複数のブロックを背景ブロックと非背景ブロックとに分類すると共に、背景ブロックを近傍ブロックの背景画素数に基づいて文字領域のブロックと背景領域のブロックとに分類する背景分類処理ステップと、上記背景分類処理ステップにて得られた非背景ブロックを、近傍ブロックの分類結果に基づいて文字領域のブロックと絵柄領域のブロックとに分類する非背景分類処理ステップとを備えることを特徴としている。

本発明のプログラムは、上記の課題を解決するために、上述の画像処理方法における各ステップをコンピュータに実行させることを特徴としている。

本発明の記録媒体は、上記の課題を解決するために、上記プログラムを記録したコンピュータ読取り可能であることを特徴としている。

本発明の画像処理装置は、以上のように、入力画像データから背景画素を検知する背景画素検知処理手段と、上記背景画素検知処理手段にて得られた背景画素に基づいて、複数の画素よりなるブロック単位で、背景画素数をカウントする背景画素カウント処理手段と、注目ブロックの背景画素数に基づいて複数のブロックを背景ブロックと非背景ブロックとに分類すると共に、背景ブロックを近傍ブロックの背景画素数に基づいて文字領域のブロックと背景領域のブロックとに分類する背景分類処理手段と、上記背景分類処理手段にて得られた非背景ブロックを、近傍ブロックの分類結果に基づいて文字領域のブロックと絵柄領域のブロックとに分類する非背景分類処理手段とを備えているので、非背景ブロックの近傍にある背景ブロックと、この領域の近傍の領域とを文字領域として検知することができる。これにより、文字間スペースに基づいて文字領域を検知することができる。その結果、従来のエッジ領域に基づく文字領域検知のように、絵柄領域として誤検知することなく文字領域として検知できる。

本発明の画像処理装置は、文字間スペースに基づいて文字と絵柄領域（写真・網点）を識別するものである。一般的に、文字間スペースは網点パターンの間隔に比べて広くなっている。従って、この特徴を用いて精度良く文字と網点を識別することができる。更に、写真は滑らかな濃度変化を有しており、写真領域内において背景画素が頻繁に（高周波パターンとして）現れることは希である。従って、この特徴を用いて文字・網点・写真を分離することができる。

更に、本発明の画像処理装置は、文字間スペースというエッジ情報とは独立した情報に基づいて文字・網点・写真を分離しており、エッジ情報を併用することによる更なる精度の向上が見込まれる。

したがって、本発明の画像処理装置は、文字領域と絵柄領域とを高精度に分類し得る画像処理装置を提供することができる。

文字には、様々なスタイル、サイズのものが存在するため、従来例１の画像領域分離方法では、様々なスタイル、サイズの文字を含む画像から文字領域を確実に抽出しようとすると、文字領域を判定するための閾値を、文字領域として判定され易くなるように設定する（緩める）必要がある。その結果、写真領域を文字領域として誤検知する可能性がある。そのため、必ずしも、文字領域と絵柄領域とを精度よく分離できるわけではない。

また、本発明の画像処理装置は、以上のように、上記非背景分類処理手段で得られた絵柄領域のブロックについて、注目ブロックを含む絵柄領域のブロック数（注目ブロックを含む、連続する絵柄領域ブロックの数）に基づいて絵柄領域に分類することが妥当であるか否かを判定し、妥当でないと判断された場合にはそのブロックの分類を文字領域のブロックに変更する絵柄領域判定処理手段をさらに備えるので、上記背景分類処理手段は、背景画素数がブロック間で大幅に変化するようなブロックがどの程度文字領域のブロックとして検知され易いかを、文字領域の行間に応じて適宜設定することができる。

したがって、比較的正方に配列されており、行間が一定である文字（例えば、日本語）だけでなく、文字領域の行間が一定でない文字（例えば、アルファベット）に対しても高精度に文字領域を検知することができる。

本発明の画像処理装置による文字検知は、以上のように、入力画像データからエッジ情報に基づいて文字領域を分離する第１の文字領域分離手段と、上記非背景分類処理手段にて得られた文字領域のブロックを文字領域として分離する第２の文字領域分離手段と、上記第２の文字領域分離手段による文字領域の分離結果と、上記第１の文字領域分離手段による文字領域の分離結果とに基づいて最終的な文字領域を決定する分離結果統合手段とをさらに備えているので、さらに文字領域の検知精度が向上するという効果を奏する。

また、本発明の画像処理装置は、以上のように、上記絵柄領域のブロックを、ブロック内の輝度値の分散値に基づいて、網点領域と連続階調領域とに分類する網点領域・連続階調領域判定手段をさらに備えるので、本発明の画像処理装置は、文字領域と絵柄領域とを高精度に分類できるとともに、絵柄領域を網点領域と連続階調領域とを分類し得る画像処理装置を提供できる。

本発明の画像形成装置は、以上のように、上述の画像処理装置と、該画像処理装置で処理された画像データに基づいて画像を形成する画像出力部とを備えているので、文字領域と絵柄領域とを精度良く分離した結果に基づいて画像処理された画像データを画像出力部にて画像として形成することができる。それゆえ、品質のよい画像を形成し得る画像形成装置を提供できる。

本発明の画像処理方法は、以上のように、上記背景画素検知処理ステップと、上記背景画素カウント処理ステップと、上記背景画素数に基づいて、注目ブロックを、背景ブロック、背景画素と非背景画素とを含む局所的な背景ブロック、及び、非背景ブロックの何れかに分類する背景分類処理ステップと、上記背景分類処理ステップにて得られた、注目ブロック、及び、当該注目ブロック近傍の背景分類に基づいて、背景分類を修正する背景分類修正処理ステップと、上記背景分類修正処理ステップにて得られた非背景ブロックのうち、連結する非背景ブロックの数に基づいて絵柄領域を判定する絵柄領域判定処理ステップとを含む。

これにより、画像処理装置として既に説明したように、上記背景分類修正ステップにて、注目ブロック近傍に背景ブロックが存在するか、すなわち、文字間スペースが存在するかに基づいて、文字領域を検知している。したがって、従来のエッジ領域に基づく文字検知のように、文字領域を絵柄領域として誤検知することはなく、高精度に文字領域と絵柄領域とを分離することができる。

本発明のプログラムは、以上のように、上述の画像処理方法における各ステップをコンピュータに実行させている。それゆえ、文字間スペースに基づいて文字領域と絵柄領域とを分離する画像処理方法を汎用的なものにできる。

本発明の記録媒体は、以上のように、上記プログラムを記録したコンピュータ読取り可能である。それゆえ、文字間スペースに基づいて文字領域と絵柄領域とを分離する上記の画像処理方法をコンピュータ・プログラムにより汎用的に実行できる。さらに、上記文字間スペースに基づいて文字領域と絵柄領域とを分離する画像処理方法を実行するためのコンピュータ・プログラムを、記録媒体を介することより、容易にコンピュータに供給できる。

本発明の実施の一形態について図１ないし図１９に基づいて説明すれば、以下の通りである。また、本発明は、入力画像を文字領域と絵柄領域（網点領域および連続階調領域）と背景領域とに分離し、各領域に応じた画像処理を行う画像処理装置に関するものである。ここでは、一実施形態としてデジタル複写機（画像形成装置）１を取り上げ、図２に基づいて説明する。

デジタル複写機１は、画像入力装置１００と、カラー画像処理装置（画像処理装置）１１１と、画像出力装置（画像出力部）１０９と、操作パネル１１０とを備えている。

画像入力装置１００は、例えばＣＣＤを備えたスキャナ部より構成されている。画像入力装置１００は、例えばラインＣＣＤを所定の方向に移動させるようになっている。そして、画像入力装置１００は、原稿からの反射光像をＣＣＤによって読み込んで、ＲＧＢ（Ｒ：赤・Ｇ：緑・Ｂ：青）のアナログ信号の状態にあるコピー用の入力画像信号（反射率信号）としてカラー画像処理装置１１１に入力する。

カラー画像処理装置１１１は、画像入力装置１００から入力された入力画像信号に所定の画像処理を行って、画像出力装置１０９に入力される画像出力用データとして出力する。このカラー画像処理装置１１１は、後述する、所定の領域分離処理を含む画像処理をコンピュータ（ＣＰＵ(central processing unit)およびメモリ）に実行させるプログラムの指示によってコンピュータ（ＣＰＵおよびメモリ）が上記画像処理を実行するようになっている。カラー画像処理装置１１１から出力された画像出力用データは、図示しない記憶手段に一旦記憶され、その記憶手段から所定のタイミングで読み出されて画像出力装置１０９に入力される。

画像出力装置１０９は、図示しない記憶手段から所定のタイミングで読み出された画像出力用データが入力されると、上記画像出力用データを記録材（例えば紙など）上に出力する。画像出力装置１０９としては、例えば、電子写真方式やインクジェット方式を用いたカラー画像出力装置などを挙げることができるが、特に限定されるものではない。

操作パネル１１０は、例えば、図示しない液晶ディスプレイからなる表示画面と、設定ボタン、テンキーなどの入力手段とを備えている。そして、ユーザの指示を受けると共に、設定されているコピーモードなどをユーザに対して表示する機能を有している。ユーザは、この操作パネル１１０を通してコピー枚数などの設定指示を入力する。

上記カラー画像処理装置１１１は、Ａ／Ｄ変換部１０１、シェーディング補正部１０２、入力階調補正部１０３、領域分離処理部１０４、色補正部１０５、黒生成下色除去部１０６、空間フィルタ処理部１０７、及び、中間調出力階調処理部１０８を備えている。本発明に係る入力画像データに対して画像処理を行う画像処理装置は、カラー画像処理装置１１１におけるＡ／Ｄ変換部１０１以外の各部に対応している。

上記画像入力装置１００から上記カラー画像処理装置１１１に入力されたアナログ信号は、Ａ／Ｄ変換部１０１、シェーディング補正部１０２、入力階調補正部１０３、領域分離処理部１０４、色補正部１０５、黒生成下色除去部１０６、空間フィルタ処理部１０７、及び、中間調出力階調処理部１０８の順で送られ、画像出力装置１０９へ出力される。

上記Ａ／Ｄ変換部１０１は、画像入力装置１００から与えられるＲＧＢの反射率信号を、デジタル信号に変換する。

上記シェーディング補正部１０２は、Ａ／Ｄ変換部１０１にてＡ／Ｄ変換された反射率信号に対して、シェーディング補正処理を実施する。

上記入力階調補正部１０３は、シェーディング補正部１０２にてシェーディング補正処理が施された反射率信号に、入力階調補正処理を実施する。この入力階調補正処理は、上記反射率信号を、濃度信号などの、カラー画像処理装置１１１が扱いやすい信号に変換する処理である。入力階調補正部１０３は、上記反射率信号に、カラーバランス処理を、さらに実施してもよい。

上記領域分離処理部１０４は、入力階調補正部１０３より出力されたＲＧＢの濃度信号を、画素毎に、あるいは、複数の画素からなるブロック毎に、文字領域、絵柄領域（網点領域および連続階調領域）、および背景領域に分離する領域分離処理を実施する。また、領域分離処理部１０４における分離結果である領域識別信号は、後続の黒生成下色除去部１０６、空間フィルタ処理部１０７、及び、中間調出力階調処理部１０８へ入力される。この領域分離処理部１０４の構成及び機能に関しては後述する。領域分離処理部１０４は、さらににじみ領域など他の領域に分離する機能を備えていても構わない。

上記色補正部１０５は、ＲＧＢの濃度信号をＣＭＹ（Ｃ：シアン・Ｍ：マゼンタ・Ｙ：イエロー）の濃度信号に変換する。そして、画像出力装置１０９における色再現の忠実化実現のために、ＣＭＹの濃度信号に色補正処理を実施する。色補正処理は、具体的には、不要吸収成分をそれぞれ含む、ＣＭＹのトナーやインクの分光特性に基づいた色濁りを、ＣＭＹの濃度信号から取り除く処理である。

上記黒生成下色除去部１０６は、色補正部１０５から出力されたＣＭＹの色信号に基づいて、黒（Ｋ）の色信号を生成する黒生成処理を行なう。また、黒生成下色除去部１０６は、ＣＭＹの色信号に対して、下色除去処理を実施する。この下色除去処理は、ＣＭＹの色信号から黒生成処理で生成された黒の色信号を差し引いて、新たなＣＭＹの色信号を得る処理である。これらの処理の結果、上記ＣＭＹの濃度信号は、ＣＭＹＫの色信号からなる画像データに変換される。

上記空間フィルタ処理部１０７は、黒生成下色除去部１０６で得られたＣＭＹＫ画像データに対して、デジタルフィルタを用いた空間フィルタ処理を実施する。この処理により、画像の空間周波数特性が補正される。したがって、画像出力装置１０９が出力する画像に、ぼやけ、または、粒状性劣化を生じることを防止することができる。

そして、最終的に、中間調出力階調処理部１０８で、画像を画素に分離してそれぞれの階調を再現できるように処理する中間調生成処理がなされる。この中間調生成処理としては、例えば、２値や多値のディザ法・誤差拡散法等を用いることができる。また、上記中間調出力階調処理部１０８は、画像データの濃度値を、画像出力装置１０９の特性値である網点面積率に変換する出力階調補正処理を行なってもよい。中間調出力階調処理部１０８により処理された濃度信号は、画像出力装置１０９に入力される。

本発明の画像処理装置における領域分離処理部１０４は、入力画像データに対して背景検知処理を行い、ブロック単位で、局所的でない背景ブロック（非背景ブロックに隣接しない背景ブロック）、局所的な背景ブロック（非背景ブロックに隣接する背景ブロック）、および非背景ブロックを検知する。そして、領域分離処理部１０４は、この処理にて得られた背景ブロック以外の領域、すなわち非背景ブロックを、局所的な非背景ブロック、及び、局所的でない非背景ブロックに分類する。また、局所的でない非背景ブロックの領域であって、かつ、絵柄領域である場合、非背景ブロックが、全入力画像に対して、ある程度大きな領域に分布していると考えられる。そのため、領域分離処理部１０４は、連続する局所的でない非背景ブロックの領域の数をカウントする。領域分離処理部１０４は、このカウント数に基づいて、局所的でない非背景ブロックの領域が、絵柄領域であるのか、文字領域であるのかを判定する。

次に、領域分離処理部１０４について、詳細に説明する。

図１は、領域分離処理部１０４の概略構成を示すブロック図である。同図に示すように、領域分離処理部１０４は、背景画素検知処理部（背景画素検知処理手段）２０１と、背景画素カウント処理部（背景画素カウント処理手段）２０２と、背景分類処理部（背景分類処理手段）２０３と、分類変更処理部（非背景分類処理手段）２０４と、絵柄領域判定処理部（絵柄領域判定処理手段）２０５と、動的閾値設定部（動的閾値設定手段）２０６とを備えている。

この領域分離処理部１０４は、入力画像データに対して、背景画素検知処理部２０１にて、背景画像を検知する。そして、背景画素カウント処理部２０２にて、背景画素検知処理部２０１より得られた背景画素から、複数の画素からなるブロック単位で背景画素数を算出する。そして、背景分類処理部２０３にて、背景画素カウント処理部２０２により得られた背景画素数に基づいて、画像内の全ブロックが、局所的でない背景ブロック、局所的な背景ブロック、及び、非背景ブロックに分類される。そして、分類変更処理部２０４にて、背景分類処理部２０３より得られた分類結果が変更される。具体的には、分類変更処理部２０４にて、非背景ブロックが、局所的な非背景ブロックと、局所的でない非背景ブロックとに分類される。そして、最終的に、絵柄領域判定処理部２０５にて、局所的でない非背景ブロックが、文字領域のブロック、及び、絵柄領域のブロックの何れであるかが識別される。

背景画素検知処理部２０１は、入力画像の背景画素（下地）を検知するものである。背景画素検知処理部２０１としては、画像全体の濃度ヒストグラムを用いて、背景色（下地色）を推定し、背景画素を検知するものであってもよい。また、画像の局所的な情報から背景色（下地色）を推定し、背景画素を検知するものであってもよい。

背景画素カウント処理部２０２は、背景画素検知処理部２０１で得られた背景画素の情報を用いて、Ｍ×Ｎ画素（Ｍは２以上の整数、Ｎは自然数）のブロック単位で、背景画素数を算出するものである。

背景分類処理部２０３は、背景画素カウント処理部２０２で得られた背景画素数の分布状態に基づいて、局所的でない背景ブロック、局所的な背景ブロック、及び、非背景ブロックにブロック単位で分類し、局所的でない背景ブロックを背景領域として、局所的な背景ブロックを文字領域としてそれぞれ分類するものである。

分類変更処理部２０４は、背景分類処理部２０３で得られた分類結果の分布状態に基づいて、分類結果を変更するものである。具体的には、背景分類変更処理部２０４は、背景分類処理部２０３で得られた近傍ブロックの分類結果に基づいて、非背景ブロックを、局所的な非背景ブロックと、局所的でない非背景ブロックとに分類し、局所的な非背景ブロックを文字領域として、局所的でない非背景ブロックを絵柄領域としてそれぞれ分類するものである。

絵柄領域判定処理部２０５は、背景分類変更処理部２０４で得られた局所的でない非背景ブロック（分類変更処理部２０４で絵柄領域に分類された非背景ブロック）が、絵柄領域として分類することが妥当であるかどうかを局所的でない非背景ブロックの連続する数に基づいて判定するものである。絵柄領域判定処理部２０５において、局所的でない非背景ブロックが、絵柄領域として分類することが妥当でないと判定された場合には、その非背景ブロックが、局所的な非背景ブロックと同様に文字領域として扱われる。すなわち、その非背景ブロックの分類が、絵柄領域から文字領域に変更される。一方、絵柄領域判定処理部２０５において、局所的でない非背景ブロックが、絵柄領域として分類することが妥当であると判定された場合には、その局所的でない非背景ブロックが絵柄領域として扱われる。

最終的に、絵柄領域判定処理部２０５は、局所的な背景ブロック、局所的な非背景ブロック、および絵柄領域判定処理部２０５で絵柄領域として妥当でないと判定された非背景ブロックを文字領域、絵柄領域判定処理部２０５で絵柄領域として妥当であると判定された非背景ブロックを絵柄領域、局所的でない背景ブロックを背景領域として扱うことにより、入力画像データを、文字領域、絵柄領域、および背景領域に分類する。そして、絵柄領域判定処理部２０５は、この分類結果を領域識別信号として出力する。

次に、領域分離処理部１０４における各処理について、更に詳細に説明する。なお、本実施の形態では、入力画像データの赤色濃度値Ｒ、緑色濃度値Ｇ、および青色濃度値Ｂから下記の式（１）により算出された輝度値Ｙに対して、以下の処理を行なうこととする。

背景画素検知処理部２０１は、入力画像データから背景色（下地色）を推定して、背景画素を検知するものである。

背景画素を検知する手段の１つとして、画像全体の濃度ヒストグラムを用いるものがある。すなわち、背景画素検知処理部２０１は、入力画像データに対して濃度ヒストグラムを生成し、この濃度ヒストグラムの分布状態に基づいて背景色を推定する。上記濃度ヒストグラムとしては、例えば、図３に示す濃度ヒストグラムが挙げられる。

図３は、２５６階調（８ビット）に多値化された入力画像データの画素値（輝度値Ｙ）を１６の濃度レベルに分類し、各濃度レベルにおける度数と、それに対応する濃度レベルとの関係を示す濃度ヒストグラム図である。以下、上記１６の濃度レベルをＢＩＮと称する。表１に、ＢＩＮと、それと対応する画素値範囲との対応を示す。なお、表１において、画素値が「０」：黒、画素値が「２５５」：白を表わす。

背景画素検知処理部２０１において、入力画像データの画像全体の濃度ヒストグラムから背景色を推定する、最も一般的な方法は、濃度ヒストグラムの度数が最大になるＢＩＮ（以下、ＢＩＮｍａｘとする）を探索し、当該ＢＩＮｍａｘを背景色として扱うことである。そして、背景色であると判定されたＢＩＮｍａｘに属する画素値を有する画素を背景として判定することにより、背景画素を得る。例えば、図３に示す濃度ヒストグラムの場合、濃度ヒストグラムの度数が最大となるＢＩＮｍａｘは、１６である。したがって、ＢＩＮ１６が背景色であり、ＢＩＮ１６に属する画素値範囲、すなわち、２４０〜２５５の値域を有する画素を背景画素として扱う。

また、背景画素を検知する別の手段としては、局所的な画像の濃度ヒストグラムを用いるものがある。すなわち、背景色が入力原稿の紙の色であるとして、必ず入力原稿の周縁領域に余白が存在すると仮定した場合、入力原稿の余白に相当する周縁領域の画素値の濃度ヒストグラムに基づいて、背景色を検知することができる。例えば、画像入力装置１００がラインＣＣＤを所定の方向に移動させるものである場合、ラインＣＣＤの移動方向に対して、上側（ラインＣＣＤの出発位置の側）の端の数ラインの濃度ヒストグラムを作成する。その後は、画像全体の濃度ヒストグラムを用いる場合と同様に、この濃度ヒストグラムの度数が最大となるＢＩＮｍａｘを探索して、当該ＢＩＮｍａｘを背景色として扱う。そして、背景色であると判定されたＢＩＮｍａｘに属する画素値を有する画素を背景として判定することにより、背景画素を得る。図４は、入力原稿に対して、上側の端の数ライン画素（余白部）における濃度ヒストグラム図を示す。例えば、図４に示すヒストグラム図の場合、濃度ヒストグラムの度数が最大となるＢＩＮｍａｘは、１６である。したがって、ＢＩＮ１６が下地色であり、ＢＩＮ１６に属する画素値範囲、すなわち、２４０〜２５５の値域を有する画素を背景画素として扱う。

以上のように、背景画素検知処理部２０１は、入力画像データから、背景画素を検知することができる。

背景画素カウント処理部２０２は、背景画素検知処理部２０１により得られた背景画素を用いて、所定ブロック単位で背景ブロックを検知する。この背景ブロックの検知は、所定ブロック内の背景画素数に基づいている。例えば、図５に示すような、４×４画素のブロック単位で背景ブロックを検知する場合、４×４画素のブロック内の背景画素数をカウントする。

背景分類処理部２０３は、背景画素カウント処理部２０２により得られた所定ブロック単位の背景画素数を用いて、入力画像データを、局所的でない背景ブロック、局所的な背景ブロック、及び、非背景ブロックに分類する。この分類は、注目ブロック及びその近傍ブロック内の背景画素数と、動的閾値TH＿BGCNTとを比較することにより実施される。この動的閾値TH＿BGCNTについては、後述する。

本実施の形態では、注目ブロック、及び、当該注目ブロックと水平方向に隣り合う２つの近傍ブロック内の背景画素数と、動的閾値TH＿BGCNTとを比較している。注目ブロック、及び、水平方向に隣り合う２つの近傍ブロックの全てのブロックにおける背景画素数が、動的閾値TH＿BGCNTよりも大きい場合、注目ブロックおよび２つの近傍ブロックの全てが背景であるので、ある程度広範囲に背景が存在すると考えられる。このため、注目ブロックを局所的でない背景ブロック（背景領域のブロック）として分類する。また、注目ブロック、及び、近傍ブロックのうち、注目ブロックの背景画素数が動的閾値TH＿BGCNTよりも大きく、近傍ブロックの少なくとも１つの背景画素数が動的閾値TH＿BGCNT以下である場合、注目ブロックは背景である一方、近傍ブロックは背景でない。このため、注目ブロックを局所的な背景ブロック（文字領域のブロック）として分類する。上記の場合以外では、注目ブロックは、背景でない。したがって、注目ブロックを非背景ブロック（非白地）として分類する。

以下、背景分類処理部２０３による背景分類処理ステップについて、図６及び７を用いて、詳細に説明する。

図６は、注目ブロックと、当該注目ブロックと水平方向に隣り合う近傍ブロックを示す。各ブロックにおける背景画素数をbg＿cntとして表わしている。そして、図６において、注目ブロックにおける背景画素数をbg＿cnt(x)として表わし、当該注目ブロックと、左方向に隣り合う近傍ブロック（以下、「左隣近傍ブロック」と称する）の背景画素数をbg＿cnt(x-1)、右方向に隣り合う近傍ブロック（以下、「右隣近傍ブロック」と称する）の背景画素数をbg＿cnt(x+1)として表わしている。

また、図７は、背景分類処理部２０３による背景分類過程の流れを示すフローチャート図である。図７に示すように、まず、注目ブロックにおける背景画素数bg＿cnt(x)と動的閾値TH＿BGCNTとを比較する（Ｓ７１）。Ｓ７１において、bg＿cnt(x)＞TH＿BGCNTを満たさない場合、この注目ブロックを非背景ブロックとして判定する（Ｓ７１→Ｓ７６）。一方、bg＿cnt(x)＞TH＿BGCNTを満たす場合、左隣近傍ブロックにおける背景画素数bg＿cnt(x-1)と動的閾値TH＿BGCNTとを比較する（Ｓ７２）。Ｓ７２において、bg＿cnt(x-1)＞TH＿BGCNTを満たさない場合、この注目ブロックを局所的な背景ブロックとして判定する（Ｓ７２→Ｓ７５）。bg＿cnt(x-1)＞TH＿BGCNTを満たす場合、右隣近傍ブロックにおける背景画素数bg＿cnt(x+1)と動的閾値TH＿BGCNTとを比較する（Ｓ７３）。Ｓ７３において、bg＿cnt(x+1)＞TH＿BGCNTを満たさない場合、この注目ブロックを局所的な背景ブロックとして判定する（Ｓ７３→Ｓ７５）。bg＿cnt(x-1)＞TH＿BGCNTを満たす場合、この注目ブロックを局所的でない背景ブロックとして判定する（Ｓ７３→Ｓ７４）。

次に、動的閾値設定部２０６による動的閾値TH＿BGCNTの設定について、詳細に説明する。動的閾値TH＿BGCNTは、動的閾値設定部２０６にて、注目ブロック及びその近傍ブロック内の背景画素数に基づいて設定される。これにより、動的閾値TH＿BGCNTが文字間スペース（文字間隔）の大きさに応じて設定される。このため、各文字が比較的正方形に近い形状であり、行間が一定である日本語文字領域だけでなく、文字が比較的正方形から遠い形状であり、行間が一定でないアルファベット文字領域に対しても、良好な結果を得ることができる。近傍ブロックとの間で背景画素数bg＿cntが変化するようなブロックは、文字間スペースである可能性が高い。そのため、動的閾値設定部２０６は、そのようなブロックが背景ブロック、または、局所的な背景ブロックとして検知されやすくなるように、動的閾値TH＿BGCNTを設定する。動的閾値TH＿BGCNTは、下記判定式に基づいて設定される。

ただし、BG_i-1(x)は、注目ブロックの直上ブロックにおける最終判定結果（後段の分類変更処理部２０４にて分類された結果）を示す。すなわち、この動的閾値TH＿BGCNTの設定処理は、分類変更処理部２０４にて所定ライン数（例えば１ライン）の処理が終了した後に行なわれる。

注目ブロックの直上ブロックが、非背景ブロックではなく、注目ブロックにおける背景画素数（bg＿cent(x)）と左隣近傍ブロックにおける背景画素数（bg＿cent(x-1)）との差分が所定の閾値TH＿CNTDIFF（例えば５）よりも大きく、かつ、注目ブロックにおける背景画素数（bg＿cent(x)）と右隣近傍ブロックにおける背景画素数（bg＿cent(x+1)）との差分が所定の閾値TH＿CNTDIFF（例えば５）よりも大きい場合、動的閾値TH＿BGCNTは、所定閾値TH＿BGCNT1に設定される。上記の場合以外では、動的閾値TH＿BGCNTは、所定閾値TH＿BGCNT2に設定される。また、前者の場合、注目ブロックは、文字である可能性が高い。このため、注目ブロックが、局所的な背景ブロックとして検知されやすいように、所定閾値TH＿BGCNT1は、所定閾値TH＿BGCNT2よりも低く設定されている。

文字間スペースの領域は、文字部の領域に比べて、背景画素数が多いと考えられる。このため、上記の設定により、注目ブロックにおける背景画素数が水平方向に隣り合うブロックにおける背景画素数よりも多いかどうかも判定できる。

所定閾値TH＿BGCNT2は、注目ブロックが背景ブロックであるかどうか判定するための閾値である。このため、注目ブロック中で、少なくとも３／４以上の画素が背景画素でなければ、背景ブロックでないと考えられる。従って、例えば、注目ブロックが４×４ブロックである場合、所定閾値TH＿BGCNT2は、１２〜１６が好ましい。

これに対して、所定閾値TH＿BGCNT1は、文字間スペースを背景ブロックとして検地するための閾値であり、所定閾値TH＿BGCNT2より小さい値を設定する。したがって、所定閾値TH＿BGCNT1は、所定閾値TH＿BGCNT2−３以上、すなわち、以下の式
TH＿BGCNT1≧TH＿BGCNT2−３
を満たすことが好ましい。
例えば、所定閾値TH＿BGCNT1、及び、所定閾値TH＿BGCNT2は、それぞれ１３、及び１５に設定される。

また、閾値TH＿CNTDIFFは、注目ブロックが文字間スペースであるかどうかを判定するための閾値であり、注目ブロックにおける背景画素数と水平方向に隣り合うブロックの背景画素数との差分値と該閾値TH＿CNTDIFFを比較する。このような閾値の設定は、英字など、文字間スペースが非常に狭い原稿に対して非常に有効であり、閾値TH＿CNTDIFFは、その文字間スペースの広さに依存する。この閾値TH＿CNTDIFFは、経験的に４〜８が妥当である。

これらの閾値は、種々の画像に対して処理を行い、最も好ましい結果が得られる値が設定される。

次に、動的閾値設定部２０６による動的閾値TH＿BGCNTの設定方法の一例について、図１８に基づいて説明する。

まず、注目ブロックの直上ブロックの分類が非背景ブロック（局所的な非背景ブロック、または局所的でない非背景ブロック）でないかを判定する（Ｓ２１）。注目ブロックの直上ブロックが非背景ブロックであれば、動的閾値TH＿BGCNTをより高い閾値TH＿BGCNT2に設定する（Ｓ２５）。注目ブロックの直上ブロックが非背景ブロックでなければ、次式
(bg＿cnt(x)-bg＿cnt(x-1))>TH＿CNTDIFF
を満たすか否かを判定する（Ｓ２２）。上記式を満たさない場合には、動的閾値TH＿BGCNTをより高い閾値TH＿BGCNT2に設定する（Ｓ２５）。上記式を満たす場合には、次式
(bg＿cnt(x)-bg＿cnt(x+1))>TH＿CNTDIFF
を満たすか否かを判定する（Ｓ２３）。上記式を満たさない場合には、動的閾値TH＿BGCNTをより高い閾値TH＿BGCNT2に設定し（Ｓ２５）、動的閾値TH＿BGCNTをより低い閾値TH＿BGCNT1に設定する（Ｓ２４）。

以上のように、背景分類処理部２０３は、入力画像データを、ブロック単位で、局所的でない背景ブロック、局所的な背景ブロック、及び、非背景ブロックに分類する。

入力画像データに文字領域が存在する場合、必ず文字間スペースが存在するため、広い文字間スペースであっても、狭い文字間スペースであっても、局所的な背景ブロックが存在する。さらに、注目ブロックの左右両方向に、文字間スペースであると予想される局所的な背景ブロックが存在する場合、この注目ブロックは、文字である可能性が高い。

分類変更処理部２０４は、背景分類処理部２０３にて得られた分類結果を、近傍ブロックの分布状態に基づいて変更するものである。例えば、図６に示す、注目ブロックを中心とした３１×１ブロックのマスクを用いて、注目ブロックの左方向、及び、右方向について、局所的でない背景ブロックの有無を確認する。その結果、注目ブロックの左右両方向に、局所的でない背景ブロックが存在し、かつ、注目ブロックが非背景ブロックである場合、この注目ブロックを局所的な非背景ブロック（文字領域のブロック）に変更する。

次に、分類変更処理部２０４による分類結果の変更方法の一例について、図１６に基づいて説明する。

まず、注目ブロックが非背景ブロックであるかを判定する（Ｓ１）。注目ブロックが非背景ブロックでなければ、その注目ブロックの分類を変更しない。すなわち、背景分類結果の変更処理は、非背景ブロックのみに対して行われ、局所的でない背景ブロック、及び局所的な背景ブロックに対しては行われない。注目ブロックが非背景ブロックであれば、注目ブロックを中心とした３１×１ブロックのマスク内に、局所的でない背景ブロックがあるかを判定する（Ｓ２）。上記マスク内に局所的でない背景ブロックがあれば、注目ブロックの分類を「非背景ブロック」から「局所的な非背景ブロック（文字領域のブロック）」に変更する（Ｓ３）。上記マスク内に局所的でない背景ブロックがなければ、注目ブロックの分類を「非背景ブロック」から「局所的でない非背景ブロック（絵柄領域のブロック）」に変更する（Ｓ４）。

以上の処理により、分類変更処理部２０４は、入力画像データを、局所的でない背景ブロック（背景領域のブロック）と、局所的な背景ブロック（文字領域のブロック）および局所的な非背景ブロック（文字領域のブロック）と、局所的でない非背景ブロック（絵柄領域のブロック）とに分類する。

絵柄領域判定処理部２０５は、上記背景分類処理部２０３にて得られた局所的でない非背景ブロックが、絵柄領域として妥当かどうかを、当該非背景ブロックの領域の大きさに基づいて判定する。

絵柄領域は、比較的大きな領域で形成されているため、上記局所的な非背景ブロックは、文字である可能性が高い。また、逆に、上記局所的でない非背景ブロックは、絵柄領域（網点領域または連続階調領域）であると考えられる。しかしながら、上記背景分類処理部２０３、及び、上記分類変更処理部２０４は、文字間スペースに依存して、入力画像データを分類しているので、必ずしも文字領域のブロックが局所的な非背景ブロックとして判別されるわけではない。そこで、絵柄領域判定処理部２０５は、局所的でない非背景ブロックとして誤り検出されたブロックの分類を、局所的な非背景ブロック（文字領域のブロック）に変更するために、局所的でない非背景ブロックが絵柄領域として妥当かどうかを、注目ブロックを含む、局所的でない非背景ブロックの領域の大きさ（注目ブロックを含む絵柄領域のブロック数）、すなわち非背景ブロックの連結数（連続している数）に基づいて判定する。この判定には、以下のラベリング処理を用いる。

このラベリング処理においては、局所的でない非背景ブロックの値を１、それ以外のブロック（背景ブロック）の値を０として扱う。また、このラベリング処理は、一般的なラベリング処理において各画素に対して行われている処理を各ブロックに対して行う。また、ラベリング処理に伴い、各ラベル情報、すなわち、各ラベルのブロック数を抽出する。

ラベリング処理とは、前景画素（ラベルが１の画素）に対し、連結する前景画素に対して同じラベルを割り当て、互いに連結していない前景画素（異なる連結成分）に対して、異なるラベルを割り当てる処理である（例えば、画像処理標準テキストブックＣＧ−ＡＲＴＳ協会ｐ．２６２〜２６８を参照）。ラベリング処理としては、種々のものが提案されているが、本実施の形態では、２回の走査を行う方式について説明する。本実施の形態のラベリング処理について、図９及び１０を用いて説明する。図９は、上記ラベリング処理の順序を示す説明図である。また。図１０は、ラベリング処理の流れを示すフローチャート図である。

上記ラベリング処理では、まず、１回目の走査で、入力画像データの左上のブロックから、ラスタスキャンの順序で分類を調べ、非背景ブロックには「１」の値をつけ、それ以外のブロック（背景ブロック）には「０」の値をつける。そして、２回目の走査で、注目ブロックＸの値が１である場合、図９に示す以下のラベリング処理を行う。

(I)注目ブロックＸの上隣のブロックＹの値が１で、かつ、上隣のブロックＹには、既にラベルＡがつけられている場合、注目ブロックＸにも、上隣のブロックＹと同じラベルＡをつける（図９（ａ）参照）。

(II)注目ブロックＸの左隣のブロックＺの値が１であるが、左隣のブロックＺに、注目ブロックＸの上隣のブロックＹのラベルＡとは異なる、ラベルＢがつけられている場合、注目ブロックＸには、上隣のブロックＹと同じラベルＡをつけると共に、上隣のブロックＹのラベルＡと左隣のブロックＺのラベルＢとの間に相関があることを保持（記憶）する（図９（ｂ）参照）。

(III)注目ブロックＸの上隣のブロックＹの値が０であり、かつ、注目ブロックＸの左隣のブロックＺの値が１である場合、注目ブロックＸには、左隣のブロックＺと同じラベルＡをつける（図９（ｃ）参照）。

(IV)注目ブロックＸの上隣のブロックＹ及び左隣のブロックＺの値が、ともに０である場合、注目ブロックＸには、新しく、注目ブロックＸの上隣のブロックＹ及び左隣のブロックＺのラベルと異なるラベルＣをつける（図９（ｄ）参照）。

(V)全ブロックに対して、ラベル付けを行なう。

(VI)複数のラベルが記録されている場合、上記(I)〜(IV)の規則に基づいて、ラベルを統一する。

最後に、上記(II)で保持しておいた、上隣のブロックＹのラベルＡと左隣のブロックＺのラベルＢとの間の相関関係に基づいて、例えば最も小さいラベルに、統一するラベルを変更する。

上記ラベリング処理により、入力画像データに対して、ラベル数分のラベルを割り当てる。このとき、上記(I)〜(IV)のステップでは、ラベルが離散的になります（例えば、1、６、１０、・・・）。従って、最後に扱い易いように、離散的なラベルを1から始まる連続的なラベル（1、２、３、・・・）に修正する。

以上の順序で、入力画像データ中のブロックすべてに対して、ラベリング処理を行なう。以下、ラベリング処理を、図１０のフローチャート図を用いて、説明する。

まず、注目ブロックの値が１かどうかを判定する（Ｓ９１）。注目ブロックの値が１である場合、上隣のブロックの値が１、かつ、左隣のブロックの値が０であるかを判定する（Ｓ９２）。Ｓ９２の判定条件を満たしている場合、注目ブロックに、上隣のブロックと同じラベルをつける（Ｓ９３）。Ｓ９２の判定条件を満たしていない場合、上隣のブロックの値が０、かつ、左隣のブロックの値が１であるかを判定する（Ｓ９４）。Ｓ９４の判定条件を満たしている場合、注目ブロックに、左隣のブロックと同じラベルをつける（Ｓ９５）。Ｓ９４の判定条件を満たしていない場合、上隣及び左隣のブロックの値が１であり、かつ、左隣のブロックのラベルが、上隣のブロックのラベルと異なるかどうかを判定する（Ｓ９６）。Ｓ９６の判定条件を満たしている場合、注目ブロックに、上隣のブロックと同じラベルをつけ、左隣のブロックのラベルと上隣のブロックのラベルとに相関があることを保持する（Ｓ９７）。Ｓ９６の判定条件を満たしていない場合、注目ブロックに、上隣のブロック及び左隣のブロックのラベルと異なる新しいラベルをつける（Ｓ９８）。

以上の処理により、入力画像データの全てのブロックにラベルをつける処理（ラベリング処理）が施されたラベリング画像が得られる。

また、ラベリング処理を実施した後、同じラベルがつけられたブロックの数をカウントすることにより、最終的に、各ラベルのブロック数を得る。

次に、上記ラベリング処理により得られた各ラベルのブロック数に基づいて、上記局所的でない非背景ブロックの領域が、絵柄領域として妥当であるかを判定する。具体的には、下記の（２）式に基づいて、この判定を行う。但し、（２）式において、連結ブロック数Ｌ_Ｎは、注目ブロックに付けられているのと同じラベルＮがつけられているブロックの数、すなわち注目ブロックを含む連結した非背景ブロックの塊に含まれるブロック数を表わす。

入力画像データの全体ブロック数に対する、ラベル数Ｌ_Ｎの割合（（２）式の左辺）と、所定閾値ＴＨ_Ｌとを比較することにより、絵柄領域として妥当であるかを判定する。局所的でない非背景ブロックに対して（２）式に基づく判定を行い、（２）式において、連結ブロック数Ｌ_Ｎ／全体ブロック数が所定閾値ＴＨ_Ｌよりも大きい場合、非背景ブロックの領域が、絵柄領域として妥当であると判定し、注目ブロックの分類をそのままの分類、すなわち局所的でない非背景ブロック（絵柄領域のブロック）とする。また、上記（２）式を満たさない場合、局所的でない非背景ブロックの分類を、局所的な非背景ブロック（文字領域のブロック）に変更する。

次に、絵柄領域判定処理部２０５における絵柄領域判定処理の一例について、図１７に基づいて説明する。

まず、注目ブロックが局所的でない非背景ブロックであるかを判定する（Ｓ１１）。注目ブロックが局所的でない非背景ブロックでなければ、後段のＳ１２の判定処理を行わない。すなわち、Ｓ１２の判定処理は、局所的でない非背景ブロックのみに対して行われ、局所的でない背景ブロック、局所的な背景ブロック、および局所的な非背景ブロックに対しては行われない。注目ブロックが局所的でない非背景ブロックであれば、上記（２）式を満たすかを判定する（Ｓ１２）。上記（２）式を満たせば、注目ブロックを絵柄領域と判定し、注目ブロックの分類を変更しない（Ｓ１３）。上記（２）式を満たさなければ、注目ブロックを文字領域と判定して、注目ブロックの分類を「局所的でない非背景ブロック」から「局所的な非背景ブロック」に変更する（Ｓ１４）。

以上のように、上記カラー画像処理装置１１１の領域分離処理部１０４は、局所的な背景ブロック、及び、局所的な非背景ブロックを文字領域として、局所的でない非背景ブロックを絵柄領域として、背景ブロックを背景領域として扱うことにより、最終的に、画像の全領域をブロック単位で文字領域、絵柄領域、および背景領域の３つの領域に分類する。そして、領域分離処理部１０４は、この分類結果を領域識別信号として出力する。

また、上記カラー画像処理装置１１１は、背景画素検知処理部２０１、背景画素カウント処理部２０２、背景分類処理部２０３、分類変更処理部２０４、絵柄領域判定処理部２０５、および動的閾値設定部２０６にて、文字領域を検知するものであり、結果としてエッジ情報とほぼ独立した文字間スペース情報を用いて文字領域を検知することができる。

しかしながら、上記カラー画像処理装置１１１には、ブロックのエッジ情報に基づき文字領域検知を行なう文字領域検知処理部が備えられていてもよい。これにより、カラー画像処理装置１１１は、上記文字間スペース情報に基づく文字領域検知処理と、従来のエッジ情報に基づく文字領域検知処理とを併用して、文字領域を検知することができる。これにより、さらに文字領域検知精度を向上させることができる。

このような画像処理装置の一例を、図１２及び１３を用いて説明する。

本例の画像処理装置は、領域検知処理部（領域分離手段）１２１と、エッジ抽出処理に基づく文字領域検知処理を行う文字領域検知処理部（文字領域分離手段）１２２と、論理積演算部１２３とを備えている。領域検知処理部１２１は、背景画素検知処理部２０１、背景画素カウント処理部２０２、背景分類処理部２０３、分類変更処理部２０４、絵柄領域判定処理部２０５および動的閾値設定部２０６と同様の機能を有し、文字間スペースに基づく文字領域検知処理を行うものである。

文字領域検知処理部１２２は、まず、図１３に示すエッジ検知フィルタを用いたフィルタ処理によって、各画素のエッジ強度（エッジ情報）を抽出する。なお、図１３に記載されている数字はフィルタ係数である。そして、このエッジ検知フィルタによるフィルタ処理結果の絶対値（エッジ強度）が、所定閾値以上になる画素を求め、この画素をエッジ情報に基づく文字領域検知結果とする。一方、領域検知処理部１２１における文字間スペース情報に基づく文字領域検知処理は、上述の背景画素検知処理部２０１、背景画素カウント処理部２０２、背景分類処理部２０３、分類変更処理部２０４、絵柄領域判定処理部２０５および動的閾値設定部２０６による画像処理方法を用いる。そして、これにより算出される文字領域のブロック（局所的な背景ブロックなど）を、文字間スペース情報に基づく文字領域検知結果とする。次に、図１２に示す論理積演算部１２３により、上記の２つの文字領域検知結果のＡＮＤ（論理積）を取る。すなわち、領域検知処理部１２１による文字領域の検知結果と、文字領域検知処理部１２２による文字領域の検知結果とのいずれにおいても、文字領域として検知された領域を最終的な文字領域とする。このようにして、領域検知処理部１２１による文字領域の分離結果と、文字領域検知処理部１２２による文字領域の分離結果とに基づいて、最終的な文字領域が決定される。これにより、さらに文字検知精度を向上させることができる。

また、本発明の画像処理装置は、局所的でない非背景ブロックにおける近傍画素間の輝度の変化量を参照することにより、絵柄領域と判定された非背景ブロックが、網点領域であるのか、連続階調領域であるのかを判定する網点領域・連続階調領域判定手段を備えていてもよい。このような画像処理装置の実施の一形態に係るカラー画像処理装置を図１９に基づいて説明する。図１９に示すように、本形態に係るカラー画像処理装置は、図２に示すカラー画像処理装置１１１に対し、網点領域・連続階調領域判定部２０６を追加した構成を備えている。

一般的に、絵柄領域が網点画像である場合、輝度変化が多い。また、絵柄領域が連続階調画像である場合、輝度変化が少ない。そこで、上記網点・連続階調判定部２０６は、近傍画素間の輝度変化量を表わす特徴として、ブロック内の画素における画素値の分散値を用いる。例えば図１４に示すような５×５画素のブロック内の各画素の輝度値Ｙから、５×５画素のブロック内での輝度値Ｙの分散値を求める。そして、この判定は、上記絵柄領域判定処理部２０５においてラベリング処理を実施した各ラベルについて行なわれる。すなわち、上記判定は、各ラベルを有するブロックに対して、分散値が所定の閾値より高いブロックが占める割合（注目ブロックを含む絵柄領域における、全ブロック数に対する分散値の高いブロックの数の割合）に基づいて行われる。絵柄領域が網点画像である場合、各ラベルを有するブロックに対して、分散値が所定の閾値より高いブロックが占める割合が非常に高くなる。これに対して、絵柄領域が連続階調画像である場合、各ラベルを有するブロックに対して、分散値が所定の閾値より高いブロックが占める割合が非常に低くなる。上記判定を行なうための判定式は、下記式（３）で表わされる。

上記（３）式左辺の、分散値が高いブロック数の比率が、所定閾値TH HT RATIO（例えば、０．５）よりも大きい場合、絵柄領域は、網点領域（網点画像領域）として判定される。また、所定閾値TH HT RATIOよりも小さい場合、絵柄領域は、連続階調領域（連続階調画像領域）として判定される。

以上のように、本実施形態にかかる画像処理方法は、入力画像データを、背景領域と、文字領域と、網点領域または連続階調領域である絵柄領域とに分離する画像処理方法であって、背景画素検知処理部２０１によって入力画像データから背景画素を検知するステップと、背景画素カウント処理部２０２によって、得られた背景画素に基づいて複数の画素よりなるブロック単位で背景画素数をカウントするステップと、背景分類処理部２０３によって、注目ブロックの背景画素数に基づいて複数のブロックを背景ブロックと非背景ブロックとに分類すると共に、背景ブロックを近傍ブロックの背景画素数に基づいて文字領域のブロックと背景領域のブロックとに分類するステップと、分類変更処理部２０４によって、得られた非背景ブロックを、近傍ブロックの分類結果に基づいて文字領域のブロックと絵柄領域のブロックとに分類するステップと、上記非背景分類処理手段で得られた絵柄領域のブロックについて、注目ブロックを含む絵柄領域のブロック数に基づいて絵柄領域に分類することが妥当であるか否かを判定し、妥当でないと判断された場合にはそのブロックの分類を文字領域のブロックに変更するステップとを含んでいる。

また、本実施の形態では、上記画像処理方法の各ステップ、すなわち絵柄領域判定処理ステップ等をコンピュータに実行させるためのプログラムをコンピュータ（ＣＰＵおよびメモリ）が実行することで、上記カラー画像処理装置の各ブロックが実現されている。また、本実施の形態では、上記プログラムをコンピュータ読み取り可能な記録媒体に記録するものとなっている。この結果、画像処理方法をコンピュータに実行させるプログラムを記録した記録媒体を、持ち運び自在に提供することができる。

なお、本実施の形態のプログラムを記録した記録媒体としては、コンピュータ（マイクロコンピュータ）のＣＰＵで処理が行われるために設けられている図示していないメモリ（内部記憶装置）、例えばＲＯＭ（Read-Only Memory）などであるプログラムメディアであってもよい。また、本実施の形態のプログラムを記録した記録媒体は、図示していない外部記憶装置としてのプログラム読み取り装置が設けられ、このプログラム読み取り装置に挿入することで読み取り可能になるプログラムメディアであってもよい。

いずれの場合においても、記録媒体に格納されているプログラムの実行は、マイクロプロセッサ（ＣＰＵ）が記録媒体にアクセスしてプログラムを実行させる構成であってもよいし、あるいは、プログラムが記録媒体から読み出され、コンピュータ（マイクロコンピュータ）内の図示していないメモリのプログラム記憶エリアにダウンロードされて、そのプログラムがマイクロプロセッサによって実行される方式であってもよい。なお、このダウンロード用のプログラムは予め本体装置（デジタル複写機１）に格納されているものとする。

ここで、上記プログラムメディアは、デジタル複写機１本体などの装置本体と分離可能に構成される記録媒体である。このプログラムメディアとしては、例えば、磁気テープやカセットテープ等のテープ系；フロッピー（登録商標）ディスクやハードディスク等の磁気ディスク、ＣＤ−ＲＯＭ（Compact Disc Read-Only Memory）、ＭＯ（Magneto-Optical disc）、ＭＤ（Mini Disc）、ＤＶＤ（Digital Versatile Disc）等の光ディスクのディスク系；ＩＣ（Integrated Circuit）カード（メモリカードを含む）／光カード等のカード系；または、マスクＲＯＭ、ＥＰＲＯＭ（Erasable Programmable Read-Only Memory）、ＥＥＰＲＯＭ（Electrically Erasable Programmable Read-Only Memory）、フラッシュＲＯＭ等による半導体メモリを含めた固定的にプログラムを担持する媒体であってもよい。

また、本実施の形態のデジタル複写機１は、図示しないインターネットを含む通信ネットワークを、接続可能にしたシステム構成であってもよい。したがって、上記記録媒体は、通信ネットワークからプログラムをダウンロードするように、流動的にプログラムを保持する媒体であってもよい。なお、このように通信ネットワークから、プログラムをダウンロードする場合には、そのダウンロード用プログラムは、予め本体装置（デジタル複写機１）内の記録媒体に格納しておくか、あるいは、別な記録媒体から本体装置（デジタル複写機１）にインストールされるものであってもよい。また、ダウンロード用プログラムは、ユーザーインターフェースを介して実行されるものであってもよいし、定期的に実行されて、決められたＵＲＬ（Uniform Resource Locater）からプログラムをダウンロードできるようなものであってもよい。

上記記録媒体は、画像読取装置やコンピュータ・システムに備えられるプログラム読み取り装置により読み取られることで、上述した画像処理方法が実行される。

以上、本発明に係る画像処理装置をデジタル複写機に適用した例について説明したが、本発明に係る画像処理装置は、他の装置、例えばプリンタドライバまたはスキャナドライバがインストールされたコンピュータ・システム、画像読取装置（スキャナ）、プリンタなどにも適用できる。したがって、本発明に係るプログラムは、デジタル複写機内の画像処理部で領域分離処理をコンピュータに実行させるものに限らず、コンピュータ・システムにインストールされるプリンタドライバやスキャナドライバ、画像読取装置またはプリンタ内の画像処理部で領域分離処理をコンピュータに実行させるプログラムなどにも適用できる。

次に、上記プログラムを、コンピュータ・システムに備えられるプリンタドライバに適用した例について説明する。

図１１は、上記プログラムを、パーソナル・コンピュータ等のコンピュータ・システムに備えられるプリンタドライバに適用した例を示す図である。図１１に示すように、コンピュータ・システム３は、プリンタドライバ３１３、通信ポートドライバ３１４、通信ポート３１５を備えている。プリンタドライバ３１３は、色補正部３０５、黒生成下色除去部３０６、空間フィルタ処理部３０７、中間調出力階調処理部３０８、及び、プリンタ言語翻訳部３０９と備えている。また、コンピュータ・システム３は、ＲＳ２３２Ｃ・ＬＡＮ（Local Area Network）等の通信ポートドライバ３１０・通信ポート３１１を介して、コンピュータの処理結果を紙などに出力するための電子写真方式やインクジェット方式のプリンタ３１２（画像出力装置）と接続している。

上記コンピュータ・システム３において、領域分離処理は、前記の領域分離処理部１０４と同様の領域分離処理部３０４によって実行される。領域分離処理部３０４では、記録媒体に記録されたプログラムを読み取り、このプログラムの指示によってコンピュータ（ＣＰＵおよびメモリ）が領域分離処理を実行する。そして、上記領域分離処理により生成された画像データは、プリンタドライバ３１３内の色補正部３０５、黒生成下色除去部３０６、空間フィルタ処理部３０７、及び、中間調出力階調処理部３０８に送られて、上述のカラー画像処理装置１１１に備えられた各処理部と同様の処理が実施される。すなわち、領域分離処理部３０４から送られた入力画像データに対し、色補正部３０５では色補正部１０５と同様の処理が実行され、黒生成下色除去部３０６、空間フィルタ処理部３０７、及び中間調出力階調処理部３０８では、領域分離処理部３０４の上記領域分離処理により生成された領域識別信号に基づいて、黒生成下色除去部１０６、空間フィルタ処理部１０７、及び中間調出力階調処理部１０８と同様の処理が実行される。そして、中間調出力階調処理部３０８から出力された入力画像データは、プリンタ言語翻訳部３０９へ送られ、プリンタ言語に変換される。プリンタ言語翻訳部３０９から出力された画像データは、通信ポートドライバ３１０および通信ポート３１１を介して、プリンタ３１２に入力される。プリンタ３１２では、入力された画像データを紙等の記録材に出力する。

また、コンピュータ・システム３は、所定のプログラムがロードされることにより上記画像処理方法など様々な処理を行うものである。コンピュータ・システム３は、さらに、フラットベッドスキャナ・フィルムスキャナ・デジタルカメラなどの画像入力装置、コンピュータの処理結果を表示するＣＲＴディスプレイ・液晶ディスプレイなどの画像表示装置と接続されていてもよい。さらには、コンピュータ・システム３は、ネットワークを介してサーバーなどに接続するための通信手段としてのネットワークカードやモデムなどを備えていてもよい。

また、スキャナに領域分離処理部を備え、その結果をコンピュータやプリンタに出力するようにしてもよい。図１５に、本発明に係る画像処理装置としての領域分離処理部を備えたスキャナの概略構成を示す。

図１５に示すように、スキャナ４０６は、カラー画像入力装置４００と、カラー画像処理装置４１１とを備えている。カラー画像処理装置４１１は、Ａ／Ｄ変換部４０１、シェーディング補正部４０２、入力階調補正部４０３、及び、領域分離処理部４０４を備えている。

カラー画像入力装置４００から出力されたアナログ信号は、上述のカラー画像処理装置１１１の各処理部と同様に処理される。すなわち、カラー画像入力装置４００から出力されたアナログ信号に対してＡ／Ｄ変換部４０１でＡ／Ｄ変換部１０１と同様の処理が実行され、シェーディング補正部４０２でシェーディング補正部１０２と同様の処理が実行され、入力階調補正部４０３で入力階調補正部１０３と同様の処理が実行される。これらの処理には、領域識別信号は使用されない。そして、領域分離処理部４０４にて、入力階調補正部４０３で処理されたアナログ信号に対して領域分離処理部１０４と同様の領域分離処理が実行され、入力画像信号、及び、領域識別信号が、図示しないコンピュータやプリンタに出力される。そして、図示しないコンピュータやプリンタの画像処理部にて、上記領域識別信号に基づいた画像処理が行われる。

なお、本発明は、上述した各実施形態に限定されるものではなく、請求項に示した範囲で種々の変更が可能であり、異なる実施形態にそれぞれ開示された技術的手段を適宜組み合わせて得られる実施形態についても本発明の技術的範囲に含まれる。

例えば、図２に示すカラー画像処理装置１１１の領域分離処理部１０４では、ＲＧＢのデジタル信号が入力されるようになっていたが、ＣＭＹのデジタル信号が入力されるようになっていても構わない。

また、図２に示すカラー画像処理装置１１１では、領域分離処理部１０４から出力された領域識別信号に基づいて、黒生成下色除去処理、空間フィルタ処理、および中間調出力階調処理を行うようになっていた。しかしながら、領域識別信号に基づいて行われる画像処理については、これらに限定されるものではなく、例えば、変倍処理や解像度変換処理などであってもよい。

また、図１・２に示すカラー画像処理装置１１１では、背景分類処理部２０３における背景ブロックと非背景ブロックとの分類（背景／非背景分類処理）のための閾値を動的に設定する動的閾値設定部２０６が備えられていたが、動的閾値設定部２０６を省き、上記閾値を一定の値としてもよい。すなわち、例えば、上記閾値を、日本語の文字領域の分離に最適な値としてもよい。この場合、日本語の文字領域を精度良く分離できる一方、他の種類の文字領域、例えばアルファベットの文字領域を精度良く分離することは難しいが、構成は簡素化できる。また、図２に示す動的閾値設定部２０６は、閾値を２つの値の間で切り替えるようになっていたが、閾値を３つ以上の値で切り替えてもよく、また、閾値を連続的に変化させてもよい。

また、図１・２に示すカラー画像処理装置１１１では、絵柄領域判定処理部２０５が備えられていたが、絵柄領域判定処理部２０５を省略しても、ある程度の精度で文字領域と絵柄領域とを分離することができる。ただし、より高い精度で文字領域と絵柄領域とを分離するためには、絵柄領域判定処理部２０５を設けることが好ましい。

本発明の画像処理方法及び画像処理装置並びに画像形成装置、プログラム、記録媒体は、入力画像データの文字領域と絵柄領域とを高精度に分類することができるので、複写機、プリンタ、スキャナ、画像処理装置、プリンタドライバ、スキャナドライバ、プリンタドライバやスキャナドライバを記録した各種記録媒体などとして有用である。

本発明の一実施形態にかかるデジタル複写機に備えられた領域分離処理部の概略構成を示すブロック図である。図１は、本発明の一実施形態にかかるデジタル複写機の概略構成を示すブロック図である。２５６階調（８ビット）に多値化された入力画像データの画素値を１６の濃度レベルに分類し、各濃度レベルにおける度数と、それに対応する濃度レベルとの関係を示す濃度ヒストグラム図である。入力原稿に対して、上側数ライン画素（余白部）における濃度ヒストグラム図である。図２の領域分離処理部に備えられた背景画素カウント処理部が背景画素数をカウントする単位ブロックの一例を示す説明図である。注目ブロックと、当該注目ブロックと水平方向に隣り合う近傍ブロックを示す説明図である。図２の背景分類処理部による背景分類過程の流れを示すフローチャートである。図２の分類変更処理部による分類変更処理の一例を示す説明図である。図２の絵柄領域判定処理部によるラベリング処理の順序を示す説明図である。図２の絵柄領域判定処理部によるラベリング処理の流れを示すフローチャートである。本発明のプログラムを、コンピュータに備えられるプリンタドライバに適用した例を示すブロック図である。本発明の画像処理方法と、従来のエッジ情報に基づく画像処理方法とを併用した画像処理方法を示す説明図である。従来のエッジ情報に基づく文字検知処理における、エッジ検知フィルタの一例を示す説明図である。本発明の他の実施形態にかかるデジタル複写機に備えられた領域分離処理部の網点領域・連続階調領域判定部が、非背景ブロックを、網点領域、または、連続階調領域として判定する単位ブロックの一例を示す説明図である。本発明に係る画像処理装置としての領域分離処理部を備えたスキャナの概略構成を示すブロック図である。図２の分類変更処理部による分類変更処理の流れを示すフローチャートである。図２の絵柄領域判定処理部による絵柄領域判定処理の流れを示すフローチャートである。図２の動的閾値設定部による動的閾値設定処理の流れを示すフローチャートである。本発明の他の実施形態にかかるデジタル複写機に備えられた領域分離処理部の概略構成を示すブロック図である。

符号の説明

１デジタル複写機（画像形成装置）
１００画像入力装置
１０１Ａ／Ｄ変換部
１０２シェーディング補正部
１０３入力階調補正部
１０４領域分離処理部
１０５色補正部
１０６黒生成下色除去部
１０７空間フィルタ処理部
１０８中間調出力階調処理部
１０９画像出力装置（画像出力部）
１１０操作パネル
１１１カラー画像処理装置（画像処理装置）
１２１領域検知処理部（領域分離手段）
１２２文字領域検知処理部（文字領域分離手段）
１２３論理積演算部（分離結果統合手段）
２０１背景画素検知処理部（背景画素検知処理手段）
２０２背景画素カウント処理部（背景画素カウント処理手段）
２０３背景分類処理部（背景分類処理手段）
２０４分類変更処理部（非背景分類処理手段）
２０５絵柄領域判定処理部（絵柄領域判定処理手段）
２０６動的閾値設定部（動的閾値設定手段）
２０７網点領域・連続階調領域判定部（網点領域・連続階調領域判定手段）

Claims

入力画像データを、少なくとも背景領域と、文字領域と、網点領域または連続階調領域である絵柄領域とに分離する画像処理装置において、
入力画像データから背景画素を検知する背景画素検知処理手段と、
上記背景画素検知処理手段にて得られた背景画素に基づいて、複数の画素よりなるブロック単位で、背景画素数をカウントする背景画素カウント処理手段と、
注目ブロックの背景画素数に基づいて複数のブロックを背景ブロックと非背景ブロックとに分類すると共に、背景ブロックを近傍ブロックの背景画素数に基づいて文字領域のブロックと背景領域のブロックとに分類する背景分類処理手段と、
上記背景分類処理手段にて得られた非背景ブロックを、近傍ブロックの分類結果に基づいて文字領域のブロックと絵柄領域のブロックとに分類する非背景分類処理手段とを備えることを特徴とする画像処理装置。
上記非背景分類処理手段で得られた絵柄領域のブロックについて、注目ブロックを含む絵柄領域のブロック数に基づいて絵柄領域に分類することが妥当であるか否かを判定し、妥当でないと判断された場合にはそのブロックの分類を文字領域のブロックに変更する絵柄領域判定処理手段をさらに備えることを特徴とする請求項１記載の画像処理装置。
上記背景分類処理手段は、
近傍ブロックの背景画素数と閾値との比較結果に基づいて背景ブロックを文字領域のブロックと背景領域のブロックとに分類するものであり、
注目ブロックと近傍ブロックとの間における背景画素数の差、及び、非背景分類処理手段にて得られた近傍ブロックの分類結果に基づいて、上記閾値を動的に設定する動的閾値設定手段がさらに備えられていることを特徴とする請求項１に記載の画像処理装置。
入力画像データからエッジ情報に基づいて文字領域を分離する第１の文字領域分離手段と、
上記非背景分類処理手段にて得られた文字領域のブロックを文字領域として分離する第２の文字領域分離手段と、
上記第２の文字領域分離手段による文字領域の分離結果と、上記第１の文字領域分離手段による文字領域の分離結果とに基づいて最終的な文字領域を決定する分離結果統合手段とをさらに備えていることを特徴とする請求項１に記載の画像処理装置。
上記絵柄領域のブロックを、ブロック内の輝度値の分散値に基づいて、網点領域と連続階調領域とに分類する網点領域・連続階調領域判定手段をさらに備えることを特徴とする請求項１に記載の画像処理装置。
請求項１〜５の何れか１項に記載の画像処理装置と、
該画像処理装置で処理された画像データに基づいて画像を形成する画像出力部とを備えることを特徴とする画像形成装置。
入力画像データを、少なくとも背景領域と、文字領域と、網点領域または連続階調領域である絵柄領域とに分離する画像処理方法において、
入力画像データから背景画素を検知する背景画素検知処理ステップと、
上記背景画素検知処理ステップにて得られた背景画素に基づいて、複数の画素よりなるブロック単位で、背景画素数をカウントする背景画素カウント処理ステップと、
注目ブロックの背景画素数に基づいて複数のブロックを背景ブロックと非背景ブロックとに分類すると共に、背景ブロックを近傍ブロックの背景画素数に基づいて文字領域のブロックと背景領域のブロックとに分類する背景分類処理ステップと、
上記背景分類処理ステップにて得られた非背景ブロックを、近傍ブロックの分類結果に基づいて文字領域のブロックと絵柄領域のブロックとに分類する非背景分類処理ステップとを備えることを特徴とする画像処理方法。
請求項７記載の画像処理方法における各ステップをコンピュータに実行させるためのプログラム。
請求項８に記載のプログラムを記録したコンピュータ読取り可能な記録媒体。