JP5178490B2

JP5178490B2 - 画像処理装置、画像処理方法、コンピュータプログラム

Info

Publication number: JP5178490B2
Application number: JP2008321625A
Authority: JP
Inventors: 暁艶戴
Original assignee: Canon Inc
Current assignee: Canon Inc
Priority date: 2008-12-17
Filing date: 2008-12-17
Publication date: 2013-04-10
Anticipated expiration: 2028-12-17
Also published as: US20100158360A1; US8363934B2; JP2010146218A

Description

本発明は、カラー文書画像を処理する画像処理装置及び画像処理方法に関するものである。

近年、情報の電子化が進み、紙文書をスキャナ等によりスキャンして電子化して保存したり、その電子データを他装置に送信したりするシステムが普及してきている。そのようなシステムにおいて、送信コストを削減するため、電子化された文書に対して高い圧縮性が要求されている。ところが、文書画像に文字領域や写真領域が混在する場合は、文字領域に適した圧縮を行うと画質が良いが圧縮率が低くなり、写真領域に適した圧縮を行うと圧縮率が高いが文字が劣化してしまう問題がある。また、電子データは、部分的に編集できる再利用性と、拡大しても縮小しても画質が落ちない高画質性とを有するものが望まれている。

これに対し、特許文献１では、電子化された文書画像を文字領域や写真領域に分離し、再利用性と高画質性が重視されている文字領域をベクトルデータに変換し、それ以外の簡易にベクトル化で再現できない写真領域等をＪＰＥＧ圧縮する。そして、各領域から得たベクトルデータや圧縮データを合成して出力することにより、文書画像の高圧縮性、再利用性、高画質性を実現する手法を提案している。

特許文献１では、文字・線・線画・表の属性を有する領域をベクトルデータに変換していた。さらに、本出願人は特許文献２において、ベクトル処理対象を拡大し、画像内のオブジェクトの輪郭が明瞭（すなわち、色の境界が明確）で、出現色も限られている等の特徴を有する画像（イラストなどの画像）もベクトル化する手法を提案している。以下の本明細書では、そのようなベクトル化処理に適した特徴を有する画像（イラストなどの画像）を、「グラフィックス」（または「グラフィック画像」）と呼ぶこととする。なお、特許文献２では、そのようなグラフィック画像を色の類似度により色領域に分割し、各色領域の輪郭をアウトライン法で近似し、色情報を加えてベクトルデータを出力している。

一方、写真領域とイラストなどのグラフィックスは、似た特性を有することが多いため、文書画像から、写真領域とグラフィックスを正確に判別するのは難しく、写真領域をグラフィックスと誤判定する場合があった。グラフィックスと誤判定された写真領域をベクトル化した場合、画質や圧縮率が低下する等の問題点がある。
特開２００４−２６５３８４号公報特開２００６−３４４０６９号公報

本発明は従来技術の有する問題点を鑑みなされたものであり、処理対象画像が、グラフィックスか否かの判定精度を向上させることを目的とする。

上記課題を解決するために、本発明の画像処理装置は、処理対象画像を色領域に分割する色領域分割手段と、前記分割された各色領域における連結領域に関する情報を取得する連結情報取得手段と、前記連結情報取得手段で取得した情報に基づいて、前記処理対象画像がグラフィックスであるか否かを判定する判定手段と、を備え、前記連結情報取得手段で取得する情報は、前記分割された各色領域における連結領域の数を含むことを特徴とする。

本発明によれば、文書画像内のグラフィックスの判定精度を向上させることができるので、写真領域をグラフィックスとして誤判定する可能性が低くなる。したがって、グラフィックスをベクトル化処理対象とし、写真領域をベクトル化処理対象としないことで、文書画像の圧縮性も画質も向上させることができる。

（実施例１）
以下、図面を参照して、本発明に係る画像処理装置を用いたグラフィックス・写真の判定処理について、詳細に説明する。

図１は、本発明の実施形態１に係るベクトル化処理内部でのグラフィックス・写真の判定処理、判定結果によりベクトル化するか圧縮するかを切り替える機能を有する画像処理装置の構成を示すブロック図である。画像入力部１０は処理対象の画像を入力する。なお、画像入力部１０は、文書をスキャンして画像入力するスキャナであってもよいし、処理対象の画像を受信するインターフェースであってもよい。また、入力される画像は、従来の領域分割処理で分割された領域のうち、文字・線画・線・表と判定された領域以外の領域を、処理対象画像として入力されるように構成してもよい。色領域分割部１１は、入力された処理対象画像を色ごとの領域（色領域）に分ける色領域分割処理を行う。連結情報取得部１２は、各色領域を構成する連結画素の識別（ラベリング処理）を行い、連結画素に関する情報（連結情報）を獲得する。グラフィックス・写真判定部１３は、連結情報に基づき、処理対象画像がグラフィックスか写真かを判定する。グラフィックスの微小領域再処理部１４は、グラフィックスと判定された画像において、スキャンや圧縮により発生したノイズ領域を再処理する。グラフィックスのベクトル変換部１５は、ノイズを除去した色領域をベクトル化する。写真の圧縮部１６は、写真と判定された画像領域をＪＰＥＧ等で圧縮する。出力部１７は処理結果を１つのファイル（例えばＸＭＬ形式のファイル）にまとめるなどして出力する。

図２は、図１に示す画像処理装置を実現した一実施形態であるディジタル複合機（ＭＦＰ）の主要部構成を示すブロック図である。尚、本実施形態では、画像処理装置として、スキャナ機能やプリンタ機能を有するディジタル複合機（ＭＦＰ）を用いているが、汎用のスキャナとパーソナルコンピュータとを接続したシステムを当該画像処理装置として用いてもよい。

図２に示すように、ＭＦＰは、画像処理装置として機能するコントローラユニット２０００を備えている。当該コントローラユニット２０００は、画像入力デバイスであるスキャナ２０７０や画像出力デバイスであるプリンタ２０９５とデバイスＩ／Ｆ２０２０を介して接続する。そして、スキャナ２０７０で原稿画像から読み取られた画像データをプリンタ２０９５によって印刷出力するコピー機能を実現するための制御を行うこともできる。また、コントローラユニット２０００は、ＬＡＮ１００６や公衆回線（ＷＡＮ）１００８を介して他装置との間でパターン画像やデバイス情報等の入出力を行うための制御を行う。

コントローラユニット２０００は、図２に示すように、ＣＰＵ２００１を有している。ＣＰＵ２００１は、ＲＯＭ２００３に格納されているブートプログラムによりオペレーションシステム（ＯＳ）を立ち上げる。そして、このＯＳ上でＨＤＤ（ハードディスクドライブ）２００４に格納されているコンピュータプログラム（アプリケーションプログラム）を実行することによって、本発明の処理などの各種処理を実行する。すなわち、ＨＤＤなどのコンピュータ読み取り可能な記憶媒体に格納されたコンピュータプログラムは、コンピュータ（ＣＰＵ）を図１に示した各処理部として機能させるためのプログラムである。また、このＣＰＵ２００１の作業領域として、ＲＡＭ２００２が用いられる。ＲＡＭ２００２はまた、ＣＰＵ２００１の作業領域だけでなく、画像データを一時記憶するための画像メモリ領域をも提供する。ＨＤＤ２００４は、上記アプリケーションプログラムとともに、画像データを格納する。なお、本実施形態では、コンピュータがコンピュータプログラムを実行することで、図１に示した各処理を実現するものとしたが、その一部または全部を電子回路で実現するようにしても構わない。

ＣＰＵ２００１には、システムバス２００７を介して、ＲＯＭ２００３やＲＡＭ２００２が接続されている。さらに、ＣＰＵ２００１には、操作部Ｉ／Ｆ（操作部インタフェース）２００６、ネットワークＩ／Ｆ（ネットワークインタフェース）２０１０、モデム２０５０及びイメージバスＩ／Ｆ（イメージバスインタフェース）２００５が接続されている。

操作部Ｉ／Ｆ２００６は、タッチパネルを有する操作部２０１２とのインタフェースであり、操作部２０１２に表示する画像データを操作部２０１２に対して出力する。また、操作部Ｉ／Ｆ２００６は、操作部２０１２においてユーザにより入力された指示情報をＣＰＵ２００１に送出する。

また、ネットワークＩ／Ｆ２０１０は、ＬＡＮ１００６に接続され、当該ＬＡＮ１００６を介してＬＡＮ１００６に接続された各装置との間で情報の入出力を行う。モデム２０５０は、公衆回線（ＷＡＮ）１００８に接続し、公衆回線１００８を介して他装置との間で情報の入出力を行う。

イメージバスＩ／Ｆ２００５は、システムバス２００７と画像データを高速で転送する画像バス２００８を接続し、データ構造を変換するためのバスブリッジである。画像バス２００８は、ＰＣＩバス又はＩＥＥＥ１３９４から構成される。画像バス２００８には、ラスタイメージプロセッサ（ＲＩＰ）２０６０、デバイスＩ／Ｆ２０２０、スキャナ画像処理部２０８０、プリンタ画像処理部２０９０、画像回転部２０３０、サムネイル作成部２０３５及び画像圧縮部２０４０が接続されている。

ＲＩＰ２０６０は、ＰＤＬコードをビットマップイメージに展開するプロセッサである。デバイスＩ／Ｆ２０２０には、スキャナ２０７０及びプリンタ２０９５が接続され、画像データの同期系／非同期系の変換を行う。スキャナ画像処理部２０８０は、入力画像データに対して補正、加工、編集処理を行う。プリンタ画像処理部２０９０は、プリント出力画像データに対してプリント時の補正、解像度変換等を行う。画像回転部２０３０は、画像データの回転を行う。画像圧縮部２０４０は、多値画像データをＪＰＥＧデータに、２値画像データをＪＢＩＧ、ＭＭＲ、ＭＨ等のデータに圧縮する機能を有し、また、それらのデータの伸長処理を行う機能も有する。

＜ベクトル化処理と圧縮処理の切り替え＞
図３は、グラフィックス・写真の判定結果によりベクトル化処理と圧縮処理との切り替え処理が行われることの概要を説明するためのフローチャートである。本実施形態では、ＣＰＵ２００１がコンピュータプログラムを実行すると、図３に示すフローチャートに沿った処理が行われて、図１に示した各機能ブロック図を実現することになる。すなわち、図３のステップＳ１０の処理は、図１の入力部１０で行われる処理に対応する。また、図３のステップＳ１１の処理は、図１の色領域分割部１１で行われる処理に対応する。また、図３のステップＳ１２の処理は、図１の連結情報取得部１２で行われる処理に対応する。また、図３のステップＳ１３の処理は、図１のグラフィックス・写真判定部１３で行われる処理に対応する。また、図３のステップＳ１５の処理は、図１のグラフィックスの微小領域再処理部１４で行われる処理に対応する。また、図３のステップＳ１６の処理は、図１のグラフィックスのベクトル変換部１５で行われる処理に対応する。また、図３のステップＳ１７の処理は、図１の写真の圧縮部１６で行われる処理に対応する。また、図３のステップＳ１８の処理は、図１の出力部１７で行われる処理に対応する。以下、図３に沿って処理を説明する。

先ず、ステップＳ１０では、処理対象の画像を入力する。入力画像には、写真のような画像もあれば、グラフィック画像もある。

次に、ステップＳ１１では、入力された画像を、色ごとの領域（色領域）に分割する色領域分割を行う。本実施例では、クラスタリング処理により画像の色領域分割を実現する。このクラスタリング処理の詳細については後述する。

次に、ステップＳ１２では、前工程で得られたクラスタリングの結果に基づき、各クラスタのラベル数や画素数といったクラスタに関する情報（連結情報）を求める。この連結情報取得処理について例を挙げて後述する。

次に、ステップＳ１３では、前工程で得られた各クラスタのラベル数及び画素数に基づき、グラフィックスか写真かを判定する。このグラフィックス・写真の判定処理の詳細についても後述する。ステップＳ１４では、ステップＳ１３の判定処理によりグラフィックスと判定されたか写真と判定されたかを判断し、グラフィックスと判定された場合はステップＳ１５に進み、写真と判定された場合はステップＳ１７に進む。

ステップＳ１５では、グラフィックスと判定された画像内に存在するノイズ領域（微小領域）を見つけ、再処理を行う。そして、ステップＳ１６では、ノイズが再処理された（ノイズ除去された）各色領域をベクトルデータに変換するベクトル化処理を実行する。この抽出された領域に対するベクトル化処理は、公知の技術を応用することが可能であり、例えば、特許第２８８５９９９号公報に記載の、２値画像の輪郭線の追跡を行い、その座標ベクトルを選択することによりベクトル化するものが挙げられる。

ステップＳ１７では、写真と判定された領域についてＪＰＥＧ等で圧縮する。

ステップＳ１８では、ステップＳ１６における画像のベクトル化処理の結果、或いは、ステップＳ１７における画像の圧縮処理の結果を出力する。なお、文書画像から抽出した複数の部分領域を処理対象画像とした場合は、それぞれの領域についてベクトル化処理または圧縮処理を行った後、それらのデータを１つのファイルにまとめて出力するようにしてもよい。

＜入力画像の例＞
図４の画像４ａ，４ｂは、入力画像の一例を示す図である。入力画像は、前述したように、写真画像４ａもあれば、グラフィック画像４ｂもある。ここで例にしたのは単なる画像であるが、文書画像を文字・線画・線・表・写真・グラフィックスなどの領域に分離し、分離された領域のうち、文字・線画・線・表の領域以外の領域を入力画像として用いることも可能である。なお、入力画像は、カラー画像もしくはグレー画像であるとする。

＜クラスタリング処理＞
画像のクラスタリング処理について説明する。入力画像の各画素をラスタスキャンし、各画素がどのクラスタに属するか判定していくことにより、クラスタリング処理が行われる。

先ず、入力画像のラスタスキャンしたスタートの画素を、最初のクラスタとして生成する。そして、次の処理対象の画素に対して、生成済みの全てのクラスタ間との、色の類似度を求める。すなわち、処理対象の画素の色と各クラスタの色との比較を行って、各クラスタに対する類似度を算出する。なお、クラスタの色は、例えば、当該クラスタに属している画素の色の平均値と色空間での分散とに基づいて、該クラスタに属する色の範囲を求めるようにしてもよい。類似度が高いほど、画素とクラスタとの特徴が近いと考えられる。ここでは、類似度の計算にＲＧＢ値を用いるが、他の色空間の情報、或いは、カラー以外の情報を特徴量としても使える。そして、一番高い類似度とこの類似度に対応したクラスタ番号を記録し、この類似度を事前に設定された閾値とを比較する。類似度が該閾値以上であれば、対象画素を記録されたクラスタに属させる。類似度が該閾値より低ければ、対象画素により新たなクラスタを生成する。この処理は全ての画素の処理が終わるまで繰り返し実行する。

次に、上述したクラスタリング処理の結果に基づき、クラスタ統合処理を行う。この処理では、まず、分離したいクラスタ数（色領域の数）の目標値を入力する。本発明では、何色くらいに分離するかの目安にする。そして、現在のクラスタの数を数える。現在のクラスタの数を領域数の目標値とを比較する。現在のクラスタ数が目標値より多ければ、クラスタの統合を行う。統合処理では、各クラスタ間の類似度を計算し、その中から一番類似度の高い二つのクラスタを一つに統合する。領域統合処理は、現在のクラスタ数が目標値以下になるまで繰り返し実行する。

＜連結情報取得処理の例＞
図５は、図４で例示した画像４ａ，４ｂそれぞれに対して、クラスタリング処理を行った後に、獲得した連結情報の結果例である。例では、クラスタリング処理の目標クラスタ数を１２としたので、クラスタ番号１〜１２の１２個の色ごとのクラスタに分離したものとする。また、各クラスタに属する画素に対してラベリング処理を行って、ラベル数を求める。ラベリング処理とは、縦横斜めのいずれかで連結する画素（隣接する画素）に対して同一ラベルを付与する処理であり、離れた位置にある連結画素に対しては別のラベルが付与される。すなわち、同一ラベルが付与された画素群は１つの連結領域を形成する。そのようにして各クラスタに属する画素についてラベリング処理を行った結果に基づいて、ラベル数が求められる。すなわち、ラベル数（連結領域の数）は、同色のクラスタに属すると判断された画素において、連結領域（連結画素塊）がいくつ存在するかを示すことになる。また、各クラスタに属する画素数も求める。このようにして、処理対象画像４ａ，４ｂそれぞれについて、クラスタ番号、各クラスタにおけるラベル数、各クラスタに属する画素数を求めた結果を、図５に示している。本実施形態では、これらのクラスタ番号・ラベル数・画素数を、連結情報と呼ぶこととする。

＜グラフィックス・写真の判定処理＞
グラフィックス・写真の判定処理について、図６のフローチャートを参照して説明する。

先ず、ステップＳ１３０では、画像から獲得した各クラスタの画素数及びラベル数といった連結情報を入力する。

ステップＳ１３１では、各クラスタの画素数とラベル数の比率Ｒを計算する。本実施形態では、各クラスタに対して、Ｒ＝（画素数）／（ラベル数）に基づいて比率を求めることとする。

ステップＳ１３２では、予め決めた第１の閾値以下の比率を持つクラスタがあるか見て、画像を判定する。処理対象画像に、第１の閾値以下の比率になるクラスタがあれば、ステップＳ１３３では、当該処理対象画像をグラフィックスと判定する。一方、処理対象画像に閾値以下の比率を持つクラスタがなければ、ステップＳ１３４では、当該処理対象画像を写真と判定する。なお、第１の閾値はスキャン解像度等に応じて予め設定しておけばよい。そして、ステップＳ１３５では、画像の判定結果を出力する。

＜グラフィックス・写真の判定処理の例＞
図５は、画像４ａ，４ｂそれぞれに対して、連結情報を獲得した後に、比率Ｒを求めてグラフィックス・写真の判定処理を行った場合の例を示す。ここで、例えば、第１の閾値を「３．８」とした場合、画像４ａには、画素数とラベル数の比率が低いクラスタはないので、写真と判定される。一方、画像４ｂは、クラスタ番号３，７，８，９の、画素数とラベル数の比率が相対的に低いので、グラフィックスと判定される。

＜グラフィックス・写真の判定処理の根拠＞
連結情報に基づいたグラフィックス・写真の判定処理の根拠について、図７を参照して説明する。

図７の画像７ａ，７ｂは、図４の画像４ａ（写真画像）の一部を拡大した画像と、画像４ｂ（グラフィックス）の一部を拡大した画像とを示している。また、画像７ａと７ｂの部分のクラスタリング結果をそれぞれ７ｃと７ｄで示す。

写真は色数が多いが、色が滑らかに変化する特徴があるので、各色の色領域のエッジ付近にある画素も色が徐々に変化する。そのため、写真のクラスタリング処理では、エッジ付近の画素を含めて、纏まった色領域に分けられる。例えば、画像７ａにおいて、色領域のエッジ部分を矢印で示すと、画像７ａのクラスタリング処理の結果７ｃでは、エッジ付近にある画素は独立した色領域になるのではなく、近い色を有する色領域に入れられ、纏まった黄色領域と黒領域が得られている。

一方、グラフィックスは、各色領域の色がはっきり変化するので、スキャンや圧縮の影響により、色の激しい変化する所にノイズ領域が発生しやすい。このノイズ領域は、色領域のエッジ付近に存在し、隣接する色領域の中間色を持ち、隣接領域の色と十分異なる色になっていることが多い。そのため、クラスタリング処理では、ノイズの小さな領域が主な色クラスタに統合されずに、独立したクラスタと判断され、画素数とラベル数の比率が低いクラスタがいくつか出現することになる。すなわち、１ラベルあたりの画素数が小さいくラスタは、ノイズによる小領域によるクラスタであると考えられる。例えば、画像７ｂにおいて、色の変化箇所（エッジ部分）を矢印で示す。このとき、画像７ｂのクラスタリング処理の結果７ｄでは、近い色部分、つまり、青色領域と黒領域と黄色領域については、纏まったクラスタになるが、エッジ付近に隣接色領域の中間色領域も生成されて、別のクラスタとなっている。

本発明では、このような写真とグラフィックスの特徴に基づき、切り分け処理を行う。

＜グラフィックスの微小領域の再処理＞
グラフィックスと判定された画像に含まれる微小領域（ノイズと判断される領域）の再処理について説明する。先ず、画像の連結情報、即ち、各クラスタにおいて各ラベルが付与されている連結画素（ラベル領域）の画素数に基づいて、各ラベル領域はノイズ領域なのかを判定する。ラベル領域の画素数がある閾値以下であれば、当該ラベルが付与されている連結画素をノイズ領域と判定し、微小領域の再処理の対象にする。そして、微小領域の再処理対象となったノイズ領域は、当該ノイズ領域の周囲の画素が属する各クラスタ間との色類似度を計算し、一番類似度の高いクラスタに統合する。

上述したように、本実施例１によれば、処理対象画像のクラスタリング処理を行い、各クラスタのラベル数と画素数とを求め、各クラスタの連結情報（ラベル数と画素数）に基づいて、グラフィックスと写真の判定を行う。このようにして、処理対象画像が、グラフィックスであるか、写真であるかの判定を、精度よく行うことができる。

（実施例２）
実施例１は、連結情報に基づき、入力画像がグラフィックスか写真かを判定する例である。実施例２では、先ず入力画像がグラフィックスか写真かを判定し、更に、当該グラフィックスと判定された画像が、ベクトル処理に向く画像か向かない画像かを判定する。

図８は、本発明の実施形態２における画像処理装置の構成を示すブロック図である。図８において、画像入力部２０は処理対象の画像を入力する。色領域分割部２１は入力された処理対象画像を色ごとの領域（色領域）に分ける。連結情報取得部２２は各色領域を構成する連結画素の識別（ラベリング処理）を行い、連結画素に関する情報（連結情報）を獲得する。グラフィックス・写真判定部２３は連結情報に基づき、処理対象画像がグラフィックスか写真かを判定する。処理対象判定部２４は、グラフィックス・写真判定部２３でグラフィックスと判定された画像を、更にベクトル処理に向く画像か向かない画像かを判定する。微小領域再処理部２５は、ベクトル化処理に向くグラフィックスと判定された画像において、スキャンや圧縮により発生したノイズ領域を再処理する。ベクトル変換部２６はノイズを除去した色領域をベクトル化する。圧縮部２７は、グラフィックス・写真判定部２３で写真と判定された画像や、処理対象判定部２４でベクトル化に向かないグラフィックス（例えば複雑なグラフィックス）と判定された画像を、ＪＰＥＧ等で圧縮する。出力部２８は処理結果を出力する。

＜実施例２のベクトル化処理と圧縮処理の切り替え＞
図９は、本発明の実施形態２におけるベクトル化処理と圧縮処理との切り替え処理の概要を説明するためのフローチャートである。

本実施形態２では、ＣＰＵ２００１がコンピュータプログラムを実行すると、図９に示すフローチャートに沿った処理が行われて、図８に示した各機能ブロック図を実現することになる。すなわち、図９のステップＳ２０の処理は、図８の画像入力部２０で行われる処理に対応する。また、図９のステップＳ２１の処理は、図８の色領域分割部２１で行われる処理に対応する。また、図９のステップＳ２２の処理は、図８の連結情報取得部２２で行われる処理に対応する。また、図９のステップＳ２３の処理は、図８のグラフィックス・写真判定部２３で行われる処理に対応する。また、図９のステップＳ２５の処理は、図８の処理対象判定部２４で行われる処理に対応する。また、図９のステップＳ２７の処理は、図８の微小領域再処理部２５で行われる処理に対応する。また、図９のステップＳ２８の処理は、図８のベクトル変換部２６で行われる処理に対応する。また、図９のステップＳ２９の処理は、図８の圧縮部２７で行われる処理に対応する。また、図９のステップＳ３０の処理は、図８の出力部２８で行われる処理に対応する。以下、図９に沿って処理を説明する。

先ず、ステップＳ２０では、処理対象の画像を入力する。入力画像には、写真のような画像もあれば、グラフィック画像もある。更に、グラフィック画像には、ベクトル化処理に向くグラフィックスもあれば、小さなサイズの色領域をたくさん含みベクトル化処理に向かないグラフィックスもある。

次に、ステップＳ２１では、入力された画像を、色ごとの領域（色領域）に分割する処理を行う。本実施例では、クラスタリング処理により画像の色領域分割を実現する。

次に、ステップＳ２２では、前工程で得られたクラスタリングの結果に基づき、各クラスタのラベル数や画素数といったクラスタに関する情報（連結情報）を求める。

次に、ステップＳ２３では、前工程で得られた各クラスタのラベル数及び画素数に基づき、グラフィックスか写真かを判定する。グラフィックス・写真の判定処理は実施例１と同様である。ステップＳ２４では、ステップＳ２３の判定処理によりグラフィックスと判定されたか写真と判定されたかを判断し、グラフィックスと判定された場合はステップＳ２５に進み、写真と判定された場合はステップＳ２９に進む。

ステップＳ２５では、グラフィックスと判定された画像をベクトル化処理に向くグラフィックスか向かないグラフィックスかを判定する。ステップＳ２６では、ベクトル化処理に向くグラフィックスと判定された画像をベクトル化処理対象としてステップＳ２７に進み、ベクトル処理に向かないグラフィックスと判定された画像をベクトル化処理対象外にしてステップＳ２９に進む。この処理対象判定処理について、後述で詳細に説明する。

ステップＳ２７では、前工程で処理対象と判定された画像内に存在するノイズ領域（微小領域）を見つけ、再処理を行う。そして、ステップＳ２８では、ノイズが再処理された各色領域をベクトルデータに変換するベクトル化処理を実行する。

ステップＳ２９では、ステップ２３のグラフィックス・写真の判定処理により写真と判定された画像と、ステップＳ２５でベクトル化処理に向かないグラフィックスと判定された画像とを、ＪＰＥＧ等で圧縮する。

ステップＳ３０では、ステップＳ２８における画像のベクトル化処理の結果、或いは、ステップＳ２９における画像の圧縮処理の結果を出力する。

＜グラフィックスの例＞
図１０の画像１０ａ、１０ｂは、実施形態２による画像処理において、入力グラフィック画像の一例を示す図である。入力グラフィック画像には、画像１０ａのように大きなサイズの色領域が多く、ベクトル化処理に向くものもあれば、画像１０ｂのような地図などの画像は小さく細かい領域が多く、ベクトル化処理に向かないものもある。ベクトル化処理に向かない画像をベクトル化処理すると、ベクトル近似により画質が落ちるこがある。

＜連結情報取得処理の例＞
図１１は、実施形態２の連結情報取得処理により、図１０で例示した画像１０ａ，１０ｂそれぞれに対して、クラスタリング処理を行った後に、獲得した連結情報の結果例である。それぞれの画像に対するクラスタリング処理で、クラスタ番号１〜１２の１２個の色ごとのクラスタに分離したものとする。また、各クラスタに属する画素に対してラベリング処理を行って、ラベル数を求める。ラベリング処理とは、縦横斜めのいずれかで連結する画素（隣接する画素）に対して同一ラベルを付与する処理であり、離れた位置にある連結画素に対しては別のラベルが付与される。そのようにして各クラスタに属する画素についてラベリング処理を行った結果に基づいて、ラベル数が求められる。すなわち、ラベル数は、同色のクラスタに属すると判断された画素について、連結画素の塊がいくつ存在するかを示すことになる。また、各クラスタに属する画素数も求める。このようにして、処理対象画像１０ａ，１０ｂそれぞれについて、クラスタ番号、各クラスタにおけるラベル数、各クラスタに属する画素数を求めた結果を、図１１に示している。本実施形態では、これらのクラスタ番号・ラベル数・画素数を、連結情報と呼ぶこととする。

＜グラフィックスのベクトル化処理対象判定処理＞
グラフィックス・写真の判定処理（ステップＳ２３）は、実施例１と同様の処理により行われる。そして、グラフィックス・写真の判定処理（ステップＳ２３）によりグラフィックスと判定された画像は、更に、処理対象判定処理（ステップＳ２５）でベクトル化処理に適したグラフィックスか否か判定される。ここで、ラベル数が第２の閾値以上のクラスタがある画像は、ベクトル化処理に適さないグラフィックス（ベクトル化処理対象外グラフィックス）と判定する。一方、ラベル数が第２の閾値以上のクラスタがない画像であれば、ベクトル化処理対象に適したグラフィックスと判定する。なお、第２の閾値は、画像サイズやスキャン解像度等に応じて予め設定しておけばよい。

＜グラフィックス・写真の判定処理と、ベクトル化処理対象判定処理の例＞
図１１は、画像１０ａ，１０ｂそれぞれに対して、連結情報（各クラスタのラベル数・画素数）を求めた結果である。このとき、比率Ｒを求め、例えば閾値を「３．８」としてグラフィックス・写真の判定処理を行った場合、画像１０ａでは、クラスタ番号３，７，８，９の比率が閾値より低くなる。また、画像１０ｂでは、クラスタ番号３，６，１２の比率が閾値より低くなる。したがって、グラフィックス・写真の判定処理（ステップＳ２３）では、画像１０ａ，１０ｂのいずれもグラフィックスと判定される。次に、処理対象判定処理（ステップＳ２５）で、ラベル数と第２の閾値を比較する。例えば、第２の閾値を１０００とすると、画像１０ａには、ラベル数が第２の閾値以上のクラスタはないので、ベクトル化処理対象のグラフィックスと判定する。一方、画像１０ｂには、ラベル数が第２の閾値以上のクラスタが存在するので、ベクトル化処理対象外と判定する。すなわち、画像１０ｂのようにラベル数が多い画像は、細かな領域が多数存在することを示しているので、ベクトル化処理を行うとデータ量が増えてしまうので、ベクトル化に向いていないと判定している。

（実施例３）
実施例２は、先ずグラフィックス・写真の判定処理を行った後、グラフィックスと判定された画像を更にベクトル化処理対象にするか否かの処理対象判定処理を行う、２段階の処理で判定した。この判定は２段階で行うものに限るものではなく、１段階で判定するようにしてもよい。実施例３では、画像のクラスタ情報及び連結情報を元に、画像をベクトル化処理対象にするか否かの判定を１段階の処理で行うようにしてもよい。

（実施例４）
実施例４は、グラフィックスか写真かの判定を、クラスタのラベル数のみで簡易的に判定する。

写真は、各クラスタのラベル数が相対的に少ないが、グラフィックスはラベル数が多いクラスタがある。この特徴を利用し、ラベル数の閾値を設定し、ラベルだけを使って判定する。以下で具体的に説明する。

先ず、判定用のラベル数の第３の閾値を設定する。そして、第３の閾値以上のラベル数を持つクラスタがなければ、写真と判定し、第３の閾値以上のラベル数を持つクラスタがあれば、グラフィックスと判定する。

（実施例５）
実施例５は、ラベル数のみを用いて、入力画像がグラフィックスか写真かを判定し、グラフィックスと判定された画像は、更に、ベクトル化処理に向くグラフィックスか、ベクトル化処理に向かないグラフィックスかを判定する。

写真は各クラスタのラベル数が相対的に少ないが、グラフィックスはラベル数の多いクラスタがある。また、グラフィックスの中で、地図等細かな領域を沢山含む画像はラベル数が相対的に高い。この特徴を利用し、ラベル数の閾値を二つ設定し、ラベルだけを使って判定する。以下で具体的に説明する。

先ず、判定用のラベル数の閾値（第３の閾値Ｒ１、第４の閾値Ｒ２）を設定する。ただし、Ｒ１＜Ｒ２とする。

そして、Ｒ１以上のラベル数を持つクラスタがなければ、写真と判定し、Ｒ１以上のラベル数を持つクラスタがあれば、グラフィックスと判定する。

次に、グラフィックスと判定された画像は更にベクトル化処理に向くグラフィックスであるかを判定する。ここで、Ｒ２以上（第４の閾値以上）のラベル数を持つクラスタがなければ、ベクトル化処理対象のグラフィックスと判定し、Ｒ２以上のラベル数を持つクラスタがあれば、ベクトル化処理対象外と判定にする。

なお、上述した例では、ベクトル化処理対象とするか否かの判定を２段階で行っているが、１段階で行うようにしてもよい。すなわち、各クラスタのラベル数が、閾値Ｒ１とＲ２の間にあるか否かでベクトル化処理対象か否か判定するようにしてもよい。

＜その他の実施形態＞
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体（記録媒体）等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。

尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム（実施形態では図に示すフローチャートに対応したプログラム）を、システムあるいは装置に直接あるいは遠隔から供給する。そして、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。

従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。

その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、ＯＳに供給するスクリプトデータ等の形態であっても良い。

プログラムを供給するための記録媒体としては、例えば、以下のようなものがある。磁気ディスク、光ディスク、光磁気ディスク、ハードディスク、ＭＯ、ＣＤ−ＲＯＭ、ＣＤ−Ｒ、ＣＤ−ＲＷ、磁気テープ、不揮発性のメモリカード、ＲＯＭ、ＤＶＤ（ＤＶＤ−ＲＯＭ，ＤＶＤ−Ｒ）。

その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページからハードディスク等の記録媒体にダウンロードすることによっても供給できる。すなわち、ホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをダウンロードする。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるＷＷＷサーバも、本発明に含まれるものである。

また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他にも、そのプログラムの指示に基づき、コンピュータ上で稼動しているＯＳなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。

さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後にも前述した実施形態の機能が実現される。すなわち、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるＣＰＵなどが実際の処理の一部または全部を行うことによっても前述した実施形態の機能が実現される。

本発明の実施形態１に係る画像処理装置の構成を示すブロック図である。図１に示す画像処理装置を実現した一実施形態であるディジタル複合機（ＭＦＰ）の主要部構成を示すブロック図である。本発明の実施形態１におけるグラフィックス・写真の判定によりベクトル化処理と圧縮処理との切り替えが行われることの概要を示すフローチャートである。入力画像の一例を示す図である。クラスタリング処理を行った後に得た連結情報の例である。本発明の実施形態１におけるグラフィックス・写真の判定処理を説明するためのフローチャートである。入力画像の一例の拡大図と、クラスタリング結果である。本発明の実施形態２に係る画像処理装置の構成を示すブロック図である。本発明の実施形態２におけるベクトル化処理と圧縮処理の切り替えを説明するためのフローチャートである。入力画像の一例である。クラスタリング処理を行った後に得た連結情報の例である。

Claims

処理対象画像を色領域に分割する色領域分割手段と、
前記分割された各色領域における連結領域に関する情報を取得する連結情報取得手段と、
前記連結情報取得手段で取得した情報に基づいて、前記処理対象画像がグラフィックスであるか否かを判定する判定手段と、
を備え、
前記連結情報取得手段で取得する情報は、前記分割された各色領域における連結領域の数を含むことを特徴とする画像処理装置。
前記連結情報取得手段で取得する情報は、前記分割された各色領域における連結領域の数と、前記分割された各色領域の画素数とを含むことを特徴とする請求項１に記載の画像処理装置。
前記判定手段は、前記各色領域における画素数と連結領域の数との比率を求め、第１の閾値以下の比率となった色領域があるか否かに基づいて、前記処理対象画像がグラフィックスであるか否かを判定することを特徴とする請求項２に記載の画像処理装置。
前記判定手段でグラフィックスと判定された処理対象画像について、前記各色領域における連結領域の数に基づいて、ベクトル化処理対象に適した処理対象画像であるか否かを判定する処理対象判定手段を、更に備えることを特徴とする請求項２または３に記載の画像処理装置。
前記処理対象判定手段は、前記連結領域の数が第２の閾値以上の色領域がある場合、前記処理対象画像はベクトル化処理対象に適さないと判定することを特徴とする請求項４に記載の画像処理装置。
前記判定手段は、前記連結領域の数が第３の閾値以上の色領域があるか否かに基づいて、前記処理対象画像がグラフィックスであるか否かを判定することを特徴とする請求項１に記載の画像処理装置。
前記判定手段は、前記連結領域の数が第３の閾値以上である色領域があり、且つ前記連結領域の数が第４の閾値以上である色領域がなければ、前記処理対象画像をベクトル化処理対象に適したグラフィックスであると判定することを特徴とする請求項１に記載の画像処理装置。
前記色領域分割手段は、クラスタリング処理を実行することにより、前記処理対象画像を前記色領域に分割することを特徴とする請求項１乃至７のいずれか１項に記載の画像処理装置。
前記連結情報取得手段は、ラベリング処理を実行することにより、前記分割された各色領域における連結領域に関する情報を取得することを特徴とする請求項１乃至８のいずれか１項に記載の画像処理装置。
前記処理対象画像をベクトル化するベクトル化手段を、更に備えることを特徴とする請求項１乃至９のいずれか１項に記載の画像処理装置。
色領域分割手段が、処理対象画像を色領域に分割する色領域分割ステップと、
連結情報取得手段が、前記分割された各色領域における連結領域に関する情報を取得する連結情報取得ステップと、
判定手段が、前記連結情報取得ステップで取得した情報に基づいて、前記処理対象画像がグラフィックスであるか否かを判定する判定ステップと、
を備え、
前記連結情報取得ステップで取得する情報は、前記分割された各色領域における連結領域の数を含むことを特徴とする画像処理方法。
コンピュータを、請求項１乃至１０のいずれか１項に記載の画像処理装置の各手段
として機能させるためのコンピュータプログラム。
請求項１２に記載のコンピュータプログラムを格納した、コンピュータ読み取り可能な記憶媒体。