JP2007158725A - 画像処理装置及び画像処理方法並びにプログラム - Google Patents

画像処理装置及び画像処理方法並びにプログラム Download PDF

Info

Publication number
JP2007158725A
JP2007158725A JP2005351312A JP2005351312A JP2007158725A JP 2007158725 A JP2007158725 A JP 2007158725A JP 2005351312 A JP2005351312 A JP 2005351312A JP 2005351312 A JP2005351312 A JP 2005351312A JP 2007158725 A JP2007158725 A JP 2007158725A
Authority
JP
Japan
Prior art keywords
image
clip art
cluster
region
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005351312A
Other languages
English (en)
Other versions
JP4632443B2 (ja
JP2007158725A5 (ja
Inventor
Xiao Yan Dai
暁艶 戴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005351312A priority Critical patent/JP4632443B2/ja
Priority to US11/444,389 priority patent/US7623712B2/en
Publication of JP2007158725A publication Critical patent/JP2007158725A/ja
Publication of JP2007158725A5 publication Critical patent/JP2007158725A5/ja
Priority to US12/580,005 priority patent/US7936929B2/en
Application granted granted Critical
Publication of JP4632443B2 publication Critical patent/JP4632443B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 クリップアート画像領域を高速に判定し、当該画像に対してのみベクトル化処理を行って圧縮時の画質の劣化を好適に防止することができる画像処理装置及び画像処理方法並びにプログラムを提供する。
【解決手段】 画像が入力部11から入力すると、領域分離部12で当該画像が領域分割され、グラフィックス画像抽出部13で分割領域からグラフィックス領域を抽出する。次いで、クリップアート判定部18でグラフィックス領域がクリップアート画像であるか否かが判定され、領域分割部16でクリップアート画像と判定された領域をさらに領域分割する。そして、ベクトル変換部17で、領域分割されたクリップアート画像がベクトルデータに変換される。
【選択図】 図1

Description

本発明は、紙文書をスキャンして取得した画像を領域分割して領域ごとにベクトル化する画像処理装置及び画像処理方法並びにプログラムに関する。
従来、文書画像において、文字や写真等の領域分離処理が注目されている。その中に、画像を小領域に分割し、各小領域の特徴により文字か写真かを判定する手法が多く提案されている。また、文書画像の応用において、文字や写真等の領域分離処理後、領域毎に圧縮処理や補正処理をすることが頻繁に行われている(例えば、特許文献1、2参照。)。 また、文書画像の領域分離後の各情報を損うことなく効率に伝送・蓄積するために、分割すべき領域であるか否かの決定を判断する方法が知られている(例えば、特許文献3参照。)。特許文献3に記載の方法は、減色処理(ヒストグラム分割)を行い、処理後と処理前の差異が改めて決められた値より小さいかで判断するものである。
特開平5−114045号公報 特開平9−186866号公報 特開2001−236517公報
しかしながら、グラフィックスの中には、単純なクリップアート画像や、自然画像のようなテクスチャ模様を含んだり、色数が多くて複雑な画像もある。尚、ここでいうクリップアート画像とは、例えば、イラスト画像のような色の数が限られている画像(色数の少ない画像)のことをいう。また、画像情報を損なうことなく、効率良く圧縮出来る領域分割に基づいたベクトル化処理は、クリップアート画像には向いている。しかし、領域分離の精度によりグラフィックスではない部分がグラフィックスとして誤判定されたものや、グラフィックスと判定されても自然画像のようなものには向かないので、このような処理対象に対して、画質の良い圧縮結果を得ることは難しい。
また、特許文献3に記載の方法では、グラフィックス領域のクリップアートの特徴を考慮していないので、グラフィックス領域がクリップアート画像であるかの判定には適応できない。
本発明は、このような事情を考慮し、クリップアート画像領域を高速に判定し、当該画像に対してのみベクトル化処理を行って圧縮時の画質の劣化を好適に防止することができる画像処理装置及び画像処理方法並びにプログラムを提供することを目的とする。
上記課題を解決するために、本発明は、画像を圧縮する画像処理装置であって、
画像を入力する入力手段と、
前記画像を領域分割する第1の領域分割手段と、
分割された領域からグラフィックス領域を抽出する抽出手段と、
抽出されたグラフィックス領域がクリップアート画像であるか否かを判定する判定手段と、
クリップアート画像と判定された領域をさらに領域分割する第2の領域分割手段と、
領域分割されたクリップアート画像をベクトルデータに変換する変換手段と
を備えることを特徴とする。
また、上記課題を解決するために、本発明は、画像を圧縮する画像処理方法であって、
前記画像を領域分割する第1の領域分割工程と、
分割された領域からグラフィックス領域を抽出する抽出工程と、
抽出されたグラフィックス領域がクリップアート画像であるか否かを判定する判定工程と、
クリップアート画像と判定された領域をさらに領域分割する第2の領域分割工程と、
領域分割されたクリップアート画像をベクトルデータに変換する変換工程と
を有することを特徴とする。
さらに、上記課題を解決するために、本発明は、コンピュータに、画像を圧縮させるためのプログラムであって、
前記画像を領域分割する第1の領域分割手順と、
分割された領域からグラフィックス領域を抽出する抽出手順と、
抽出されたグラフィックス領域がクリップアート画像であるか否かを判定する判定手順と、
クリップアート画像と判定された領域をさらに領域分割する第2の領域分割手順と、
領域分割されたクリップアート画像をベクトルデータに変換する変換手順と
を実行させることを特徴とする。
本発明によれば、クリップアート画像領域を高速に判定し、当該画像に対してのみベクトル化処理を行って圧縮時の画質の劣化を好適に防止することができる。
以下、図面を参照して、本発明の一実施形態に係る画像処理装置及び画像処理方法について詳細に説明する。
<第1の実施例>
図1は、本発明の第1の実施例に係る領域分割に基づいてベクトル化処理を行う画像処理装置の構成を示すブロック図である。図1において、11は文書画像を入力する入力部、12は文書画像を文字や写真等の領域に分離する領域分離部、13は領域分離の結果から属性がグラフィックスである部分を抽出するグラフィックス画像抽出部である。また、14はクリップアート画像判定のため、グラフィックスをクラスタリング処理するクラスタリング処理部、15はクリップアート画像判定のため、クラスタリングの結果からクラスタ数を計数するクラスタ数統計部である。尚、クラスタリング処理部14とクラスタ数統計部15とを用いてクリップアート判定部18が構成される。さらに、16はクリップアート画像と判定された画像を領域分割する領域分割部、17は領域分割の結果をベクトルデータに変換するベクトル化変換部である。
図12は、図1に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP)の主要部構成を示すブロック図である。尚、本実施形態では、画像処理装置として、スキャナ機能やプリンタ機能を有するディジタル複合機(MFP)を用いているが、汎用のスキャナとパーソナルコンピュータとを接続したシステムを当該画像処理装置として用いてもよい。
図12に示すように、MFPは、画像処理装置として機能するコントローラユニット2000を備えている。当該コントローラユニット2000は、画像入力デバイスであるスキャナ2070や画像出力デバイスであるプリンタ2095を接続する。そして、スキャナ2070で原稿画像から読み取られた画像データをプリンタ2095によって印刷出力するコピー機能を実現するための制御を行う。また、コントローラユニット2000は、LAN1006や公衆回線(WAN)1008を介して他装置との間でパターン画像やデバイス情報等の入出力を行うための制御を行う。
コントローラユニット2000は、図12に示すように、CPU2001を有している。CPU2001は、ROM2003に格納されているブートプログラムによりオペレーションシステム(OS)を立ち上げる。そして、このOS上でHDD(ハードディスクドライブ)2004に格納されているアプリケーションプログラムを実行することによって各種処理を実行する。このCPU2001の作業領域として、RAM2002が用いられる。RAM2002はまた、CPU2001の作業領域だけでなく、画像データを一時記憶するための画像メモリ領域をも提供する。HDD2004は、上記アプリケーションプログラムとともに、画像データを格納する。
CPU2001には、システムバス2007を介して、ROM2003やRAM2002が接続している。さらに、CPU2001には、操作部I/F(操作部インタフェース)2006、ネットワークI/F(ネットワークインタフェース)2010、モデム2050及びイメージバスI/F(イメージバスインタフェース)2005が接続されている。
操作部I/F2006は、タッチパネルを有する操作部2012とのインタフェースであり、操作部2012に表示する画像データを操作部2012に対して出力する。また、操作部I/F2006は、操作部2012においてユーザにより入力された情報をCPU2001に送出する。
また、ネットワークI/F2010は、LAN1006に接続され、当該LAN1006を介してLAN1006に接続された各装置との間で情報の入出力を行う。モデム2050は、公衆回線1008に接続し、公衆回線1008を介して他装置との間で情報の入出力を行う。
イメージバスI/F2005は、システムバス2007と画像データを高速で転送する画像バス2008を接続し、データ構造を変換するためのバスブリッジである。画像バス2008は、PCIバス又はIEEE1394から構成される。画像バス2008上には、ラスタイメージプロセッサ(RIP)2060、デバイスI/F2020、スキャナ画像処理部2080、プリンタ画像処理部2090、画像回転部2030、サムネイル作成部2035及び画像圧縮部2040が設けられている。
RIP2060は、PDLコードをビットマップイメージに展開するプロセッサである。デバイスI/F2020には、スキャナ2070及びプリンタ2095が接続され、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部2080は、入力画像データに対して補正、加工、編集処理を行う。プリンタ画像処理部2090は、プリント出力画像データに対してプリンタの補正、解像度変換等を行う。画像回転部2030は、画像データの回転を行う。画像圧縮部2040は、多値画像データをJPEGデータに、ニ値画像データをJBIG、MMR、MH等のデータに圧縮するとともに、その伸長処理も行う。
図2は、本発明の第1の実施例に係る画像処理装置による領域分割に基づいたベクトル化処理手順の概略について説明するためのフローチャートである。
まず、入力部11において、文書画像を入力する(ステップS11)。次に、領域分離部12において、文書画像を文字や写真等の領域に分離する領域分離処理を行う(ステップS12)。尚、領域分離処理方法としては、例えば特開2002−314806公報で開示されている公知の方法等を使用することができる。
次に、グラフィックス抽出部13において、上記領域分離処理の結果からグラフィックス属性の領域を抽出する(ステップS13)。図3は、本発明の第1の実施例における領域分離処理の結果の一例を示す図である。
続いて、クリップアート画像判定部18において、クリップアート画像の判定処理を行う。まず、クリップアート画像判定部18のクラスタリング処理部14において、色特徴に基づき、類似度の閾値を低く設定し、画像を大まかに分割するクラスタリング処理を行う(ステップS14)。そして、クリップアート画像判定部18のクラスタ数統計部15において、上記クラスタリング処理の結果から分割されたクラスタ数を計算する(ステップS15)。次いで、クリップアート画像は色数が限られているものとの特徴を利用し、クラスタ数が少ないか否かを見てクリップアート画像であるか否かを判定する(ステップS16)。その結果、クラスタ数が少ない場合(Yes)はクリップアート画像と判定してステップS17に進み、そうでない場合(No)はクリップアート画像ではないと判定する。尚、クリップアート画像判定ためのクラスタリング処理の詳細について図4を参照して後述する。
ステップS17では、領域分割部16において、上記クリップアート画像と判定された画像に対して領域分割処理を行う。尚、この領域分割処理の詳細については図5を参照して後述する。
次に、ベクトル変換部16において、上記の領域分割結果をベクトルデータに変換するためのベクトル化処理を行う(ステップS16)。尚、ベクトル化処理は、公知のベジェ近似や平滑処理等を用いることができる。
[クリップアート画像判定ためのクラスタリング処理(ステップS14)]
図4は、本発明の第1の実施例におけるクリップアート画像判定ためのクラスタリング処理(ステップS14)の詳細を説明するためのフローチャートである。
まず、ラスタスキャンしたスタートの画素により、最初のクラスタを生成する(ステップS1401)。次に、次の画素に対して、全てのクラスタ間との類似度を求める(ステップS1402)。ここで、類似度はRGB距離の逆数であり、RGB距離はEuclidean距離である。その結果、RGB距離が近いほど類似度が高く、画素とクラスタとの特徴が近いと考えられる。尚、本実施例では、類似度の計算にRGB値を用いるが、他のカラー空間の情報、或いは、カラー以外の情報を特徴量として使用することも可能である。
そして、一番高い類似度とこの類似度に対応したクラスタ番号を記録し、この類似度を事前に設定された閾値と比較する(ステップS1403)。その結果、閾値より高い場合(Yes)は、対象画素を記録されたクラスタに属させる(ステップS1404)。一方、閾値より低い場合(No)は、対象画素により新たなクラスタを生成する(ステップS1405)。そして、ステップS1404又はステップS1405の処理の後、全ての画素に対する処理が終わるかどうかを判断する(ステップS1406)。その結果、未処理の画素がある場合(No)は、ステップS1402に戻って、上記処理を繰り返し実行する。一方、未処理の画素がない場合(Yes)は、クラスタリング処理を終了する。
基本的に、クラスタリング処理では、類似度の閾値によりクラスタリングの結果も変わり、処理時間も変わる。そのため、類似度の閾値を高く設定すると、画素をクラスタに属す時に、処理対象画素は一番類似度の高いクラスタ間の類似度はこの閾値以上でなければそのクラスタに入れないので、新しいクラスタを生成することになる。その結果、クラスタの数が多くなり、処理時間もかかることになってしまう。また、クリップアート画像は色の数が限られており、各色は違うので、類似度の閾値を低く設定したクラスタリング処理により、ある程度収束したクラスタ数(すなわち、色の数)を得ることができ、処理時間の短縮もできる。
[領域分割処理(ステップS17)]
図5は、本発明の第1の実施例における領域分割処理(ステップS17)の詳細を説明するためのフローチャートである。
まず、クリップアート画像判定処理(ステップS14)でクリップアート画像と判定された画像を処理対象画像として入力する(ステップS1701)。そして、処理対象画像に対して、領域分割ためのクラスタリング処理を行う(ステップS1702)。この領域分割ためのクラスタリング処理は、クリップアート画像判定処理ためのクラスタリング処理とは処理自体は同じである。但し、最終的に正確な領域分割結果を得るように、このクラスタリング処理で画像を細かくクラスタに分割することが必要なため、類似度の閾値を高く設定している。
そして、クラスタリング処理結果に基づき、領域統合処理を行う(ステップS1703)。この処理では、まず、分離したい領域数の目標値(目標クラスタ数)、すなわち何色くらいに分離するかの目安を入力する。そして、現在のクラスタの数を数え、この数と領域数の目標値とを比較する。その結果、現在のクラスタ数が目標値より多い場合はクラスタの統合を行う。統合処理では、各クラスタ間の類似度を計算し、その中から一番類似度の高い二つのクラスタを一つのクラスタに統合する。尚、本領域統合処理は、現在のクラスタ数が目標値以下になるまで繰り返し実行する。
そして、領域統合処理の結果に基づき、ノイズ領域判定処理を行う(ステップS1704)。この処理では、まず、領域分割の結果をラベリングし、そして、各ラベル領域の面積を計算する。ここで、ラベル領域の面積とは、この領域内に存在する画素の数とする。そして、ラベル領域の面積がある閾値より小さい場合に、この領域をノイズ領域と判定する。
次いで、この領域に含まれた画素毎に、周囲に隣接する領域との類似度を計算し、処理対象画素を一番類似度の高い領域に属させる(ステップS1705)。尚、ノイズ領域判定処理は全てのラベル領域が処理済みになるまで繰り返し実行する。文書画像の領域分離後のグラフィックス領域は良く圧縮されて保存でき、このノイズ領域判定処理とノイズ領域再処理は圧縮の影響により発生したノイズへの好適な対応策となる。
[領域分割に基づいたベクトル化処理の例]
図6は、本発明の第1の実施例におけるクリップアート画像の領域分割に基づいたベクトル化処理の一例を示す図である。図6において、81はクリップアート画像と判定された画像、82は領域分割の各クラスタの結果、83は領域分割の結果から選んだ任意の一つのクラスタである。また、図6において、84及び85は領域分割結果のベクトル化処理に必要なクラスタの輪郭情報とクラスタの内部色情報であり、86は領域分割結果のベクトル結果である。
以上説明したように、第1の実施例によれば、文書画像から領域分離されたグラフィックス領域を類似度の閾値を低く設定したクラスタリング処理を行い、クラスタ数を統計することで、クリップアート画像の判定を早く簡単に行うことができる。また、クリップアート画像と判定された画像のみを好適にベクトル化することにより、画質の劣化を最小限にした画像の高圧縮化が可能となる。
<第2の実施例>
文書画像の領域分離後に抽出されたグラフィックス領域の中に、クリップアート画像のような色数が少ない画像が見受けられる場合がある。このような画像を、クラスタリング処理のクラスタ数では正しく判定できない場合がある。そのため、第2の実施例では、クラスタ数の代わりに、クリップアート画像の各色のクラスタは色の相当近い画素の塊であることから、標本の色分散値が低いという特徴を利用したクリップアート画像判定条件を用いる。
図7は、本発明の第2の実施例に係る領域分割に基づいてベクトル化処理を行う画像処理装置の構成を示すブロック図である。図7において、11は文書画像を入力する入力部、12は文書画像を文字や写真等の領域に分離する領域分離部、13は領域分離の結果から属性はグラフィックスである部分を抽出するグラフィックス画像抽出部である。また、14はクリップアート画像判定のためグラフィックス画像をクラスタリング処理するクラスタリング処理部、21はクリップアート画像判定のためクラスタリング結果から各クラスタ内の標本の色分散値を計算するクラスタ分散値計算部である。尚、クラスタリング処理部14とクラスタ分散値計算部21とを用いてクリップアート判定部22が構成される。さらに、図7において、16はクリップアート画像と判定された画像を領域分割する領域分割部、17は領域分割の結果をベクトルデータに変換するベクトル化変換部である。すなわち、第1の実施例と第2の実施例の画像処理装置とは、クラスタ数統計部15に代えてクラスタ分散値計算部21を備える点で異なる。
図8は、本発明の第2の実施例に係る画像処理装置による領域分割に基づいたベクトル化処理手順の概略について説明するためのフローチャートである。尚、第1の実施例と同様の処理については同一の符号を用いて説明する。
まず、入力部11において、文書画像を入力する(ステップS11)。次に、領域分離部12において、文書画像を文字や写真等の領域に分離する領域分離処理を行う(ステップS12)。そして、グラフィックス抽出部13において、上記領域分離処理の結果からグラフィックス属性の領域を抽出する(ステップS13)。
次に、クリップアート判定部22において、クリップアート画像の判定処理を行う。そこで、クリップアート判定部22のクラスタリング処理部14において、色特徴に基づいて類似度の閾値を通常よりも低く設定し、画像を大まかに分割するクラスタリング処理を行う(ステップS14)。次いで、クリップアート判定部22のクラスタ分散値計算部21において、上記クラスタリング処理の結果から分割された各クラスタ内の標本分散値を計算する(ステップS21)。そして、各クラスタの分散値を見て、クリップアート画像であるか否かを判定する(ステップS22)。その結果、各クラスタの分散値がすべて低い場合(Yes)はクリップアート画像と判定してステップS17に進み、そうでない場合(No)はクリップアート画像ではないと判定する。
ステップS17では、領域分割部16において、上記クリップアート画像と判定された画像に対して領域分割処理を行う。そして、ベクトル変換部16において、上記領域分割結果をベクトルデータに変換するベクトル化処理を行う(ステップS18)。
上述したように、ステップS21のクリップアート画像判定ためのクラスタ分散値計算処理のみが第1の実施例と違う処理であることから、以下では当該部分についてのみ説明する。
[クリップアート画像判定処理ためのクラスタ分散値計算処理]
クリップアート画像判定ためのクラスタリング処理では、画像を幾つのクラスタに分割する。図9は、画像を3つのクラスタに分けたクラスタリング処理の一例を示す図である。図9における3つの円は3つのクラスタを示し、各円の黒点は各クラスタの中心点を示す。また、各円の白点は各クラスタに属した画素を示し、各画素の位置と中心点の位置は、画素とクラスタ中心点の類似度の高低を示す。
ここで、クラスタ分散値計算処理を説明するために、RGBカラー情報を利用し、画像をN個のクラスタに分けた場合を例に挙げる。まず、各クラスタの中心点(Ri、Gi,Bi)を計算する。各クラスタの中心点は、このクラスタに属された各画素のRGBの平均値であって、下記式(1)で計算される。
Figure 2007158725
ここで、niはi番目のクラスタに属された画素の数であり、Ri,j、Gi,j,Bi,jは、i番目のクラスタに属されたj番目の画素の色値である。
次に、各クラスタの分散値σiを計算する。各クラスタの分散値は、このクラスタに属された各画素のRGB値とこのクラスタの中心値との差の2乗平均であり、下記式(2)で計算される。
Figure 2007158725
このように、各クラスタの分散値を上記処理によってそれぞれを求め、クリップアート画像の判定を行う。
以上説明したように、第2の実施例によれば、文書画像から領域分離されたグラフィックス領域を類似度の閾値を低く設定したクラスタリング処理を行い、各クラスタの標本分散値を求めた。これにより、クラスタの数が少ないクリップアート画像ではない画像の判定を正確に行うことが可能となった。
<第3の実施例>
文書画像の領域分離後に抽出されたグラフィックス領域中に、クリップアート画像のように色数が少ないが、あるクラスタの分散値が高い画像、或いは、色数が多いが、各クラスタの分散値が低い画像が見受けられる場合がある。この場合は、単なるクラスタ数での判断と単なるクラスタの標本分散値の判断ではうまく行かない可能性がある。そこで、クラスタ数とクラスタの分散値の判断条件とを組み合わせてクリップアート画像であるか否かを判定する必要である。
図10は、本発明の第3の実施例に係る領域分割に基づいてベクトル化処理を行う画像処理装置の構成を示すブロック図である。図10において、11は文書画像を入力する入力部、12は文書画像を文字や写真等の領域に分離する領域分離部、13は領域分離の結果から属性はグラフィックスである部分を抽出するグラフィックス画像抽出部である。また、図10において、14はクリップアート画像判定のためにグラフィックス画像をクラスタリング処理するクラスタリング処理部、15はクリップアート画像判定のためにクラスタリングの結果からクラスタ数を数えるクラスタ数統計部である。さらに、21はクリップアート画像判定のためにクラスタリングの結果から各クラスタ内の標本値の色分散値を計算するクラスタ分散値計算部である。尚、クラスタリング処理部14とクラスタ数統計部15とクラスタ分散値計算部21とを用いてクリップアート判定部23が構成される。さらにまた、図10において、16はクリップアート画像と判定された画像を領域分割する領域分割部、17は領域分割の結果をベクトルデータに変換するベクトル化変換部である。
図11は、本発明の第3の実施例に係る画像処理装置による領域分割に基づいたベクトル化処理手順の概略について説明するためのフローチャートである。尚、第1及び第2の実施例と同様の処理については同一の符号を用いて説明する。
まず、入力部11において文書画像を入力する(ステップS11)。次に、領域分離部12において、文書画像を文字や写真等の領域に分離する領域分離処理を行う(ステップS12)。さらに、グラフィックス抽出部13において、上記領域分離処理の結果からグラフィックス属性の領域を抽出する(ステップS13)。
次に、ステップS14〜S16、S21、S22では、クリップアート判定部23において、クリップアート画像の判定処理を行う。まず、クリップアート判定部23のクラスタリング処理部14において、色特徴に基づいて類似度の閾値を低く設定し、画像を大まかに分割するクラスタリング処理を行う(ステップS14)。次に、クリップアート判定部23のクラスタ数統計部15において、上記クラスタリング処理の結果から分割されたクラスタ数を計算する(ステップS15)。さらに、クラスタ数を見て、クリップアート画像であるか否かを判定する(ステップS16)。その結果、クラスタ数が多い場合(No)はクリップアート画像ではないと判定し、そうでない場合(Yes)はステップS21に進んでクリップアート画像の判定に入る。
ステップS21では、クリップアート判定部23のクラスタ分散値計算部21において、上記クラスタリング処理の結果から分割された各クラスタ内の標本分散値を計算する。そして、各クラスタの分散値を見て、クリップアート画像であるか否かを判定する(ステップS22)。その結果、各クラスタの分散値がすべて低い場合(Yes)はクリップアート画像と判定してステップS17に進み、そうでない場合(No)はクリップアート画像ではないと判定する。
ステップS17では、領域分割部16において、上記クリップアート画像と判定された画像に対して、領域分割処理を行う。そして、ベクトル変換部16において、上記の領域分割結果をベクトルデータに変換するベクトル化処理を行う(ステップS16)。
以上説明したように、本発明の第3の実施例では、クリップアート画像のような色数が少ないが、各クラスタの分散値が高い画像、或いは、色数が多いが、各クラスタの分散値が低い画像の場合でも、正確にクリップアート画像の判定が可能になった。
<その他の実施形態>
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給する。そして、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、以下のようなものがある。フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページからハードディスク等の記録媒体にダウンロードすることによっても供給できる。すなわち、ホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをダウンロードする。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布する。そして、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他にも、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後にも前述した実施形態の機能が実現される。すなわち、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行うことによっても前述した実施形態の機能が実現される。
本発明の第1の実施例に係る領域分割に基づいてベクトル化処理を行う画像処理装置の構成を示すブロック図である。 本発明の第1の実施例に係る画像処理装置による領域分割に基づいたベクトル化処理手順の概略について説明するためのフローチャートである。 本発明の第1の実施例における領域分離処理の結果の一例を示す図である。 本発明の第1の実施例におけるクリップアート画像判定ためのクラスタリング処理(ステップS14)の詳細を説明するためのフローチャートである。 本発明の第1の実施例における領域分割処理(ステップS17)の詳細を説明するためのフローチャートである。 本発明の第1の実施例におけるクリップアート画像の領域分割に基づいたベクトル化処理の一例を示す図である。 本発明の第2の実施例に係る領域分割に基づいてベクトル化処理を行う画像処理装置の構成を示すブロック図である。 本発明の第2の実施例に係る画像処理装置による領域分割に基づいたベクトル化処理手順の概略について説明するためのフローチャートである。 画像を3つのクラスタに分けたクラスタリング処理の一例を示す図である。 本発明の第3の実施例に係る領域分割に基づいてベクトル化処理を行う画像処理装置の構成を示すブロック図である。 本発明の第3の実施例に係る画像処理装置による領域分割に基づいたベクトル化処理手順の概略について説明するためのフローチャートである。 図1に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP)の主要部構成を示すブロック図である。
符号の説明
11 入力部
12 領域分離部
13 グラフィック画像抽出部
14 クラスタリング処理部
15 クラスタ数統計部
16 領域分割部
17 ベクトル変換部
18、22、23 クリップアート判定部
21 クラスタ分散値計算部

Claims (9)

  1. 画像を圧縮する画像処理装置であって、
    画像を入力する入力手段と、
    前記画像を領域分割する第1の領域分割手段と、
    分割された領域からグラフィックス領域を抽出する抽出手段と、
    抽出されたグラフィックス領域がクリップアート画像であるか否かを判定する判定手段と、
    クリップアート画像と判定された領域をさらに領域分割する第2の領域分割手段と、
    領域分割されたクリップアート画像をベクトルデータに変換する変換手段と
    を備えることを特徴とする画像処理装置。
  2. 前記判定手段が、
    前記グラフィックス領域内の画素のクラスタリング処理を行うクラスタリング手段と、
    クラスタリング処理結果からクラスタ数を計数するクラスタ数計数手段と、
    前記クラスタ数が閾値以下の場合に前記グラフィックス領域をクリップアート画像と判定するクリップアート判定手段と
    を備えることを特徴とする請求項1に記載の画像処理装置。
  3. 前記判定手段が、
    前記グラフィックス領域内の画素のクラスタリング処理を行うクラスタリング手段と、
    クラスタリング処理結果から各クラスタ内の分散値を計算するクラスタ分散計算手段と、
    前記各クラスタ内の分散値がすべて閾値以下の場合に前記グラフィック領域をクリップアート画像と判定するクリップアート判定手段と
    を備えることを特徴とする請求項1に記載の画像処理装置。
  4. 前記判定手段が、
    前記グラフィックス領域内の画素のクラスタリング処理を行うクラスタリング手段と、
    クラスタリング処理結果からクラスタ数を計数するクラスタ数計数手段と、
    前記クラスタ数が閾値以下であるか否かを判定するクラスタ数判定手段と
    前記クラスタ数が閾値以下の場合に、各クラスタ内の分散値を計算するクラスタ分散計算手段と、
    前記各クラスタ内の分散値がすべて閾値以下の場合に前記グラフィック領域をクリップアート画像と判定するクリップアート判定手段と
    を備えることを特徴とする請求項1に記載の画像処理装置。
  5. 前記クラスタリング手段が、前記グラフィックス領域内の各画素の色特徴を用いて、各クラスタ間の類似度を閾値よりも低く設定したクラスタリング処理を行うことを特徴とする請求項2から4までのいずれか1項に記載の画像処理装置。
  6. 前記第2の領域分割手段が、
    クリップアート画像と判定された前記領域をクラスタリング処理する手段と、
    クラスタリング処理結果からクラスタ数を計数する手段と、
    目標クラスタ数を入力する手段と、
    前記クラスタ数が前記目標クラスタ数以下になるまでクラスタ間の統合処理を行う手段と、
    統合処理が終了した後の各クラスタについて、クラスタ内の画素数が閾値以下のクラスタをノイズ領域として判定する手段と、
    ノイズ領域と判定されたクラスタ内の各画素を近傍に位置するクラスタに所属させる手段と
    を備えることを特徴とする請求項1から5までのいずれか1項に記載の画像処理装置。
  7. 前記クラスタリング処理する手段が、前記領域内の各画素の色特徴を用いて、各クラスタ間の類似度を閾値よりも高く設定したクラスタリング処理を行うことを特徴とする請求項6に記載の画像処理装置。
  8. 画像を圧縮する画像処理方法であって、
    前記画像を領域分割する第1の領域分割工程と、
    分割された領域からグラフィックス領域を抽出する抽出工程と、
    抽出されたグラフィックス領域がクリップアート画像であるか否かを判定する判定工程と、
    クリップアート画像と判定された領域をさらに領域分割する第2の領域分割工程と、
    領域分割されたクリップアート画像をベクトルデータに変換する変換工程と
    を有することを特徴とする画像処理方法。
  9. コンピュータに、画像を圧縮させるためのプログラムであって、
    前記画像を領域分割する第1の領域分割手順と、
    分割された領域からグラフィックス領域を抽出する抽出手順と、
    抽出されたグラフィックス領域がクリップアート画像であるか否かを判定する判定手順と、
    クリップアート画像と判定された領域をさらに領域分割する第2の領域分割手順と、
    領域分割されたクリップアート画像をベクトルデータに変換する変換手順と
    を実行させるためのプログラム。
JP2005351312A 2005-06-09 2005-12-05 画像処理装置及び画像処理方法並びにプログラム Expired - Fee Related JP4632443B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005351312A JP4632443B2 (ja) 2005-12-05 2005-12-05 画像処理装置及び画像処理方法並びにプログラム
US11/444,389 US7623712B2 (en) 2005-06-09 2006-06-01 Image processing method and apparatus
US12/580,005 US7936929B2 (en) 2005-06-09 2009-10-15 Image processing method and apparatus for removing noise from a document image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005351312A JP4632443B2 (ja) 2005-12-05 2005-12-05 画像処理装置及び画像処理方法並びにプログラム

Publications (3)

Publication Number Publication Date
JP2007158725A true JP2007158725A (ja) 2007-06-21
JP2007158725A5 JP2007158725A5 (ja) 2009-01-29
JP4632443B2 JP4632443B2 (ja) 2011-02-16

Family

ID=38242509

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005351312A Expired - Fee Related JP4632443B2 (ja) 2005-06-09 2005-12-05 画像処理装置及び画像処理方法並びにプログラム

Country Status (1)

Country Link
JP (1) JP4632443B2 (ja)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009290780A (ja) * 2008-05-30 2009-12-10 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2011028459A (ja) * 2009-07-23 2011-02-10 Canon Inc 画像処理方法および画像処理装置およびプログラム
JP2011034410A (ja) * 2009-08-03 2011-02-17 Canon Inc クラスタリング処理方法、クラスタリング処理装置、およびプログラム
US8175407B2 (en) 2009-02-10 2012-05-08 Canon Kabushiki Kaisha Image processing method, image processing apparatus, and program for clustering data
US8290255B2 (en) 2009-02-06 2012-10-16 Canon Kabushiki Kaisha Image processing method, image processing apparatus, and program
US8300939B2 (en) 2009-07-27 2012-10-30 Canon Kabushiki Kaisha Image processing method, image processing apparatus, and program
US8553991B2 (en) 2010-06-29 2013-10-08 Canon Kabushiki Kaisha Clustering processing apparatus and clustering processing method
US8934710B2 (en) 2011-05-09 2015-01-13 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer-readable medium
US8995761B2 (en) 2011-05-09 2015-03-31 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer-readable medium

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003085556A (ja) * 2001-09-07 2003-03-20 Fuji Xerox Co Ltd 画像処理装置およびプログラム
JP2004252843A (ja) * 2003-02-21 2004-09-09 Canon Inc 画像処理方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003085556A (ja) * 2001-09-07 2003-03-20 Fuji Xerox Co Ltd 画像処理装置およびプログラム
JP2004252843A (ja) * 2003-02-21 2004-09-09 Canon Inc 画像処理方法

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009290780A (ja) * 2008-05-30 2009-12-10 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体
US8396298B2 (en) 2008-05-30 2013-03-12 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium with vectorization process for data from graphic areas
US8290255B2 (en) 2009-02-06 2012-10-16 Canon Kabushiki Kaisha Image processing method, image processing apparatus, and program
US8175407B2 (en) 2009-02-10 2012-05-08 Canon Kabushiki Kaisha Image processing method, image processing apparatus, and program for clustering data
JP2011028459A (ja) * 2009-07-23 2011-02-10 Canon Inc 画像処理方法および画像処理装置およびプログラム
US8472720B2 (en) 2009-07-23 2013-06-25 Canon Kabushiki Kaisha Image processing method, apparatus and program
US8300939B2 (en) 2009-07-27 2012-10-30 Canon Kabushiki Kaisha Image processing method, image processing apparatus, and program
JP2011034410A (ja) * 2009-08-03 2011-02-17 Canon Inc クラスタリング処理方法、クラスタリング処理装置、およびプログラム
US8218881B2 (en) 2009-08-03 2012-07-10 Canon Kabushiki Kaisha Clustering processing method, clustering processing apparatus, and non-transitory computer-readable medium
US8553991B2 (en) 2010-06-29 2013-10-08 Canon Kabushiki Kaisha Clustering processing apparatus and clustering processing method
US8934710B2 (en) 2011-05-09 2015-01-13 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer-readable medium
US8995761B2 (en) 2011-05-09 2015-03-31 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer-readable medium

Also Published As

Publication number Publication date
JP4632443B2 (ja) 2011-02-16

Similar Documents

Publication Publication Date Title
US7936929B2 (en) Image processing method and apparatus for removing noise from a document image
JP4766661B2 (ja) 画像処理方法及び画像処理装置
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
US8331671B2 (en) Image processing apparatus and image encoding method related to non-photo image regions
US7903307B2 (en) Image processing method and image processing apparatus
US8396298B2 (en) Image processing apparatus, image processing method, and storage medium with vectorization process for data from graphic areas
US7831107B2 (en) Image processing apparatus, image processing method, and program
JP4732315B2 (ja) 画像処理装置及び方法
JP5219706B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP4250483B2 (ja) 画像処理装置、画像処理方法ならびにプログラム、記憶媒体
JP2010033541A (ja) 画像処理装置及び画像処理方法
JP4579759B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4739082B2 (ja) 画像処理方法及び画像処理装置
JP2006197178A (ja) 画像処理装置および画像処理方法およびプログラムおよび記憶媒体
US8810877B2 (en) Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image
JP4748789B2 (ja) 画像処理方法及び画像処理装置
JP5132440B2 (ja) 画像処理装置及び画像処理方法
JP2005275854A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP4504096B2 (ja) 画像処理装置、プログラム、及び記憶媒体
JP2009105659A (ja) 画像形成装置及び画像形成装置の制御方法及びプログラム及び記憶媒体
JP4957570B2 (ja) 画像処理装置
JP2007174523A (ja) 画像処理装置、画像処理方法、プログラムコード及び記憶媒体
JP2005328348A (ja) 画像処理装置、プログラム、及び記憶媒体

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081205

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20100630

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20100709

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20100906

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20101112

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20101115

R150 Certificate of patent or registration of utility model

Ref document number: 4632443

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131126

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees