JP4748789B2 - 画像処理方法及び画像処理装置 - Google Patents

画像処理方法及び画像処理装置 Download PDF

Info

Publication number
JP4748789B2
JP4748789B2 JP2005351309A JP2005351309A JP4748789B2 JP 4748789 B2 JP4748789 B2 JP 4748789B2 JP 2005351309 A JP2005351309 A JP 2005351309A JP 2005351309 A JP2005351309 A JP 2005351309A JP 4748789 B2 JP4748789 B2 JP 4748789B2
Authority
JP
Japan
Prior art keywords
cluster
edge
pixel
image
clusters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2005351309A
Other languages
English (en)
Other versions
JP2007156841A (ja
JP2007156841A5 (ja
Inventor
暁艶 戴
秀史 大澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005351309A priority Critical patent/JP4748789B2/ja
Priority to US11/539,428 priority patent/US7831107B2/en
Publication of JP2007156841A publication Critical patent/JP2007156841A/ja
Publication of JP2007156841A5 publication Critical patent/JP2007156841A5/ja
Application granted granted Critical
Publication of JP4748789B2 publication Critical patent/JP4748789B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Image Processing (AREA)

Description

本発明は、紙原稿をスキャンして取得した画像を領域分割して領域毎にベクトル化する画像処理方法及び画像処理装置に関する。
近年、情報の電子化が進み、紙文書をそのまま保持するのではなく、電子化して保存したり、その電子データを他装置に送信するシステムが普及してきている。また、その電子化の対象となる文書は、白黒二値の画像だけに留まらず、フルカラー(多値)文書のような電子文書へその対象を広げつつある。
さらに、対象となる電子文書は、単に紙上の文書をスキャナ等によりスキャンして画像データにしたものだけに留まっていない。例えば、文書画像の領域を分離して、文字領域に対しては文字認識処理を施して文字コード列に変換し、写真領域に対しては輪郭線のベクトルデータに変換する等、電子文書は、より高度な情報に変換されたデータを含んできている(特許文献1参照。)。
また、カラー画像をベクトル化対象画像にしたいという要求もある。このようなカラー画像の中には、フルカラー画像であっても、イラストや図形作成ソフトウェアで作成・印刷された原稿をスキャンすることによって得た画像(色数の少ない画像)等もある。これらの画像は、出現色も限られており、また、写真等の自然画像に比べて物体の輪郭に縁がついたように明瞭な場合(例えば、黒色の縁で内部は他の色)もある等の特徴を有している。尚、以下では、このような色数の少ない画像を「クリップアート画像」と呼ぶ。
従来、画像のベクトル化処理は、次のように行われる。まず、フルカラーで入力された画像を二値画像に変換し、次いで、二値画像から輪郭線及び中心線を抽出し、得られた線と原画像の色情報をベクトルデータに変換する。この際に、クリップアート画像の特徴に応じて、領域分割手法に基づいたベクトル化処理が有効である。
特開2004−265384号公報
しかしながら、もともと縁が比較的明瞭なクリップアート画像に対して、上述した輪郭線抽出に基づいたベクトル化処理を行った場合、ノイズの影響により二値化する時に縁が消失してしまう問題がある。また、上述した領域分割に基づいたベクトル化処理においても、縁部分が多数のクラスタに分割される問題や、縁ではない部分と縁部分とが間違って同じクラスタに入る等の問題がある。これらの問題は、ベクトルデータ量の増大の原因や部品化の際に、不効率な形に分割されてしまう原因になる。
本発明は、このような事情を考慮してなされたものであり、クリップアート画像における輪郭情報を統合し、画質を保持しつつデータ量を好適に削減したベクトルデータを生成することができる画像処理方法及び画像処理装置を提供することを目的とする。
上記課題を解決するために、本発明は、クリップアート画像を含む文書画像を画像処理装置に入力してベクトル化する画像処理方法において、
選択手段が、前記文書画像を領域分割して前記クリップアート画像を選択する選択工程と、
抽出手段が、エッジ強度を求めるための所定のフィルタを前記クリップアート画像に適用することにより、当該クリップアート画像の各画素におけるエッジ強度を抽出する抽出工程と、
エッジクラスタ形成手段が、前記エッジ強度が第1の閾値よりも高い画素によりエッジクラスタを形成するエッジクラスタ形成工程と、
分割手段が、前記クリップアート画像における前記エッジクラスタ以外の画素を順に処理対象として、
当該処理対象の画素についてエッジ強度が0であるか否かを判断し、当該エッジ強度が0でないと判断した画素に関しては前記エッジクラスタを含む生成済みクラスタそれぞれの色特徴と当該処理対象の画素の色特徴との類似度を求め、当該エッジ強度が0であると判断した画素に関しては前記エッジクラスタ以外の生成済みクラスタそれぞれの色特徴と当該処理対象の画素の色特徴との類似度を求め、
当該処理対象の画素について求めた類似度のうちの最も高い類似度が第2の閾値よりも高ければ当該処理対象の画素を当該最も高い類似度を示したクラスタに属させ、当該処理対象の画素について求めた類似度のうちの最も高い類似度が前記第2の閾値以下であれば当該処理対象の画素により新たなクラスタを生成することにより、前記クリップアート画像に対するクラスタリング処理を行う分割工程と、
領域統合手段が、前記分割工程でクラスタリング処理を行った後のクラスタの数が目標値より多い場合は、前記クラスタの数が前記目標値になるまで、前記エッジクラスタ以外のクラスタを対象として、当該対象としたクラスタ間の色特徴の類似度を求め、当該類似度が高いクラスタ同士から順に統合していく領域統合工程と、
変換手段が、前記領域統合工程で統合された後、前記エッジクラスタを含む各クラスタを、該クラスタの輪郭線と内部色に基づいてベクトルデータに変換する変換工程と
を有することを特徴とする。
また、上記課題を解決するために、本発明は、クリップアート画像を含む文書画像をベクトル化する画像処理装置であって、
前記文書画像を入力する入力手段と、
前記文書画像を領域分割して前記クリップアート画像を選択する選択手段と、
エッジ強度を求めるための所定のフィルタを前記クリップアート画像に適用することにより、当該クリップアート画像の各画素におけるエッジ強度を抽出する抽出手段と、
前記エッジ強度が第1の閾値よりも高い画素によりエッジクラスタを形成するエッジクラスタ形成手段と、
前記クリップアート画像における前記エッジクラスタ以外の画素を順に処理対象として、
当該処理対象の画素についてエッジ強度が0であるか否かを判断し、当該エッジ強度が0でないと判断した画素に関しては前記エッジクラスタを含む生成済みクラスタそれぞれの色特徴と当該処理対象の画素の色特徴との類似度を求め、当該エッジ強度が0であると判断した画素に関しては前記エッジクラスタ以外の生成済みクラスタそれぞれの色特徴と当該処理対象の画素の色特徴との類似度を求め、
当該処理対象の画素について求めた類似度のうちの最も高い類似度が第2の閾値よりも高ければ当該処理対象の画素を当該最も高い類似度を示したクラスタに属させ、当該処理対象の画素について求めた類似度のうちの最も高い類似度が前記第2の閾値以下であれば当該処理対象の画素により新たなクラスタを生成することにより、前記クリップアート画像に対するクラスタリング処理を行う分割手段と、
前記分割手段でクラスタリング処理を行った後のクラスタの数が目標値より多い場合は、前記クラスタの数が前記目標値になるまで、前記エッジクラスタ以外のクラスタを対象として、当該対象としたクラスタ間の色特徴の類似度を求め、当該類似度が高いクラスタ同士から順に統合していく領域統合手段と、
前記領域統合手段で統合された後、前記エッジクラスタを含む各クラスタを、該各クラスタの輪郭線と内部色に基づいてベクトルデータに変換する変換手段と
を備えることを特徴とする。
本発明によれば、クリップアート画像における輪郭情報を統合し、画質を保持しつつデータ量を好適に削減したベクトルデータを生成することができる。
また、縁のあるクリップアート画像から、縁の部分をエッジクラスタとして、ベクトル化するので、より正確な縁情報を取得できる。さらにクリップアート内の縁情報を1つのエッジクラスタにまとめることができるので、縁情報の再利用性がよくなる。
以下、図面を参照して、本発明に係る画像処理装置を用いた画像データのベクトル化処理について、詳細に説明する。
<装置構成>
図1は、本発明の一実施形態に係る領域分割に基づいたベクトル化処理を行う機能を有する画像処理装置の構成を示すブロック図である。図1において、入力部11は、スキャンによって紙情報をカラー文書画像として入力する。また、領域分離部12は、カラー文書画像を写真領域を含む複数種類の領域に分離する。さらに、クリップアート選択部13は、分離されたそれぞれの領域からクリップアート画像を選択する。さらにまた、エッジ抽出部14は、クリップアート画像から色特徴に基づいてエッジを抽出する。さらにまた、エッジクラスタ形成部15は、エッジ情報に基づいてエッジクラスタを形成する。
さらにまた、領域分割部16は、エッジクラスタ以外の画素を色特徴に基づく領域に分割する。さらにまた、領域統合部17は、類似する領域を統合する。さらにまた、ノイズ領域判定部18は、分割された領域からノイズ領域を判定する。さらにまた、ノイズ領域再処理部19は、ノイズ領域と判定された場合に、当該ノイズ領域を再処理する。さらにまた、エッジクラスタ判定部20は、分割された領域からエッジクラスタを判定する。さらにまた、エッジクラスタ統合部21は、エッジクラスタと判定されたエッジクラスタと最初に形成したエッジクラスタとを統合する。そして、ベクトル化部22は、領域分割結果をベクトルデータに変換する。
図13は、図1に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP)の主要部構成を示すブロック図である。尚、本実施形態では、画像処理装置として、スキャナ機能やプリンタ機能を有するディジタル複合機(MFP)を用いているが、汎用のスキャナとパーソナルコンピュータとを接続したシステムを当該画像処理装置として用いてもよい。
図13に示すように、MFPは、画像処理装置として機能するコントローラユニット2000を備えている。当該コントローラユニット2000は、画像入力デバイスであるスキャナ2070や画像出力デバイスであるプリンタ2095を接続する。そして、スキャナ2070で原稿画像から読み取られた画像データをプリンタ2095によって印刷出力するコピー機能を実現するための制御を行う。また、コントローラユニット2000は、LAN1006や公衆回線(WAN)1008を介して他装置との間でパターン画像やデバイス情報等の入出力を行うための制御を行う。
コントローラユニット2000は、図13に示すように、CPU2001を有している。CPU2001は、ROM2003に格納されているブートプログラムによりオペレーションシステム(OS)を立ち上げる。そして、このOS上でHDD(ハードディスクドライブ)2004に格納されているアプリケーションプログラムを実行することによって各種処理を実行する。このCPU2001の作業領域として、RAM2002が用いられる。RAM2002はまた、CPU2001の作業領域だけでなく、画像データを一時記憶するための画像メモリ領域をも提供する。HDD2004は、上記アプリケーションプログラムとともに、画像データを格納する。
CPU2001には、システムバス2007を介して、ROM2003やRAM2002が接続されている。さらに、CPU2001には、操作部I/F(操作部インタフェース)2006、ネットワークI/F(ネットワークインタフェース)2010、モデム2050及びイメージバスI/F(イメージバスインタフェース)2005が接続されている。
操作部I/F2006は、タッチパネルを有する操作部2012とのインタフェースであり、操作部2012に表示する画像データを操作部2012に対して出力する。また、操作部I/F2006は、操作部2012においてユーザにより入力された情報をCPU2001に送出する。
また、ネットワークI/F2010は、LAN1006に接続され、当該LAN1006を介してLAN1006に接続された各装置との間で情報の入出力を行う。モデム2050は、公衆回線1008に接続し、公衆回線1008を介して他装置との間で情報の入出力を行う。
イメージバスI/F2005は、システムバス2007と画像データを高速で転送する画像バス2008を接続し、データ構造を変換するためのバスブリッジである。画像バス2008は、PCIバス又はIEEE1394から構成される。画像バス2008上には、ラスタイメージプロセッサ(RIP)2060、デバイスI/F2020、スキャナ画像処理部2080、プリンタ画像処理部2090、画像回転部2030、サムネイル作成部2035及び画像圧縮部2040が設けられている。
RIP2060は、PDLコードをビットマップイメージに展開するプロセッサである。デバイスI/F2020には、スキャナ2070及びプリンタ2095が接続され、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部2080は、入力画像データに対して補正、加工、編集処理を行う。プリンタ画像処理部2090は、プリント出力画像データに対してプリンタの補正、解像度変換等を行う。画像回転部2030は、画像データの回転を行う。画像圧縮部2040は、多値画像データをJPEGデータに、二値画像データをJBIG、MMR、MH等のデータに圧縮するとともに、その伸長処理も行う。
<領域分割に基づいたベクトル化処理の概要>
図2は、本発明の一実施形態におけるクリップアート画像の領域分割に基づいたベクトル化処理についての概略を説明するためのフローチャートである。
まず、入力部11において、スキャナより紙情報を入力し、カラー文書画像データを得る(ステップS11)。次に、領域分離部12において、入力されたカラー文書画像を二値データに変換し、この二値画像データを文字、写真、表等の複数種類の領域に分離する(ステップS12)。尚、この領域分離処理を実現する一例として、米国特許第5,680,478号公報に記載の領域分離技術を用いることができる。尚、当該公報には、「Method and Apparatus for character recognition (Shin-YwanWang et aI./Canon K.K.)」が記載されている。さらに、クリップアート画像選択部13において、前工程で分離された領域からクリップアート画像を選択する(ステップS13)。
次に、エッジ抽出部14において、色特徴に基づいてエッジ抽出処理を行う(ステップS14)。エッジ抽出手法としては、公知のラプラシアンフィルタ等が用いられて、エッジ画像情報(画素値はエッジ強度を示す)が生成される。そして、エッジクラスタ形成部15において、エッジ強度の高い画素によりエッジクラスタを形成する(ステップS15)。尚、このエッジクラスタ形成処理の詳細については後述する。このようにエッジクラスタを作成することによって、クリップアート画像から縁の部分をクラスタ化できる。
次に、領域分割部16においては、色特徴に基づき、エッジクラスタ以外の画素によりクラスタリング処理を行い、画像をクラスタ(領域)に分割する(ステップS16)。尚、この領域分割処理の詳細については後述する。さらに、領域統合部17において、前工程で分割されたクラスタを類似度によりクラスタの統合を行う(ステップS17)。尚、この領域統合処理の詳細については後述する。
次に、ノイズ領域判定部18において、領域分割の結果をラベリングし(ステップS18)、各ラベル領域の大きさによりノイズ領域であるかどうかを判定する(ステップS19)。その結果、ラベル領域がある程度小さい場合(Yes)は、ノイズ領域と判定する。尚、このノイズ判定処理の例については後述する。そして、ステップS19でノイズ領域であると判定された後は、ノイズ再処理部19において、判定されたノイズ領域に含まれたノイズ画素を隣接する領域間との類似度に基づき再びクラスタリング処理を行う(ステップS20)。尚、このノイズ領域の再処理の詳細については後述する。ステップS20の再処理の後、全てのラベル領域に対してノイズ処理が終わったかどうかを判定する(ステップS21)。その結果、処理対象がある場合(No)はステップS19に戻り、上記ノイズ領域判定処理とノイズ領域再処理を繰り返し実行する。一方、処理対象がない場合(Yes)はノイズ処理を終了して、ステップS22に進む。
ステップS22では、エッジクラスタ判定部20において、分割された領域から最初に形成したエッジクラスタ以外にエッジを含むクラスタをエッジクラスタとして判定する。次いで、エッジクラスタ統合部21において、エッジクラスタと判定されたクラスタを統合する(ステップS23)。尚、エッジクラスタ判定処理と統合処理の詳細については後述する。
そして、ステップS24では、ベクトル化部22において、エッジクラスタと、前記分割されたエッジクラスタ以外のクラスタとを、クラスタ毎に輪郭線と領域内部の色に基づきベクトルデータに変換する。このベクトル化処理を実現する一例としては、例えば、特許第2885999号公報に記載の、二値画像の輪郭線の追跡を行い、その座標ベクトルを選択することによりベクトル化するものが挙げられる。そして、本実施形態におけるベクトル化処理においても当該技術を利用するものとする。
<クリップアート画像の選択例>
図3は、本発明の一実施形態による画像処理において文書画像からクリップアート画像を選択した一例を示す図である。図3に示す文書画像では、前述した領域分離法により、写真領域31、テキスト領域32、及びクリップアート領域33がそれぞれ矩形領域として分離されている。
<エッジクラスタ形成処理>
図4は、図2のステップS15におけるエッジクラスタ形成処理の詳細について説明するためのフローチャートである。
まず、クリップアート画像から抽出されたエッジ強度を示すエッジ画像が入力される(ステップS1501)。そして、ラスタスキャンしたスタート画素のエッジ強度を事前に設定された閾値と比較して、対象画素のエッジ強度が閾値よりも高いか否かを判定する(ステップS1502)。その結果、対象画素のエッジ強度が閾値より高い場合(Yes)は、この画素は確実にエッジにあると判断して、この画素をエッジクラスタに属させる(ステップS1503)。一方、対象画素のエッジ強度が閾値より低い場合(No)は、この画素をエッジクラスタに入れないようにする(ステップS1504)。そして、ステップS1503、S1504の処理の後、全ての画素に対する処理が終わるかどうかを判断する(ステップS1505)。その結果、未処理の画素がある場合(No)はステップS1502に戻って、上述した処理を繰り返し実行する。一方、未処理の画素がない場合(Yes)はエッジクラスタ形成処理を終了する。尚、本実施例ではエッジクラスタは1つであるとして説明するが、エッジに複数の色がある場合、色毎に複数のエッジクラスタに分割して生成するようにしても構わない。
<エッジクラスタの形成例>
図5は、本発明の一実施形態による画像処理によってクリップアート画像から形成したエッジクラスタの一例を示す図である。図5に示すクリップアート画像では、エッジ抽出によりエッジ画像51を形成し、そして、前述したエッジクラスタ形成処理により閾値を120に設定した場合にエッジクラスタ52を形成している。
<領域分割処理>
図6は、図2のステップS16における領域分割処理の詳細について説明するためのフローチャートである。
まず、エッジクラスタ以外の画素を領域分割の処理対象とする(ステップS1601)。次いで、ラスタスキャンしたエッジクラスタ以外のスタート画素により、最初のクラスタを生成する(ステップS1602)。そして、次の画素に対して、エッジにあるかどうかを判断する(ステップS1603)。その結果、対象画素のエッジ強度が0でない場合はエッジにある可能性があると判断し(Yes)、この画素と各クラスタ(ステップS15で形成したエッジクラスタを含む)との距離を計算する(ステップS1604)。一方、対象画素のエッジ強度が0であればエッジにないと判断し(No)、この画素をエッジクラスタに入れないようにエッジクラスタ以外のクラスタとの距離を計算する(ステップS1605)。尚、距離は色特徴のEuclidean距離を用い、距離が近い場合は対象画素とクラスタとの特徴が近い、即ち、類似度が高い、と考えられる。ここでは、距離の計算にRGB値を用いるが、他のカラー空間の情報、或いは、カラー以外の情報を特徴量として用いてもよい。
そして、ステップS1604、又はステップS1605の処理の後、一番高い類似度とこの類似度に対応したクラスタ番号を記録し、この類似度と事前に設定された閾値とを比較する(ステップS1606)。その結果、閾値より高い場合(Yes)は、対象画素を記録されたクラスタに属させる(ステップS1607)。一方、閾値より低い場合(No)は、対象画素により新たなクラスタを生成する(ステップS1608)。そして、ステップS1607、又はステップS1608の処理の後、全ての画素に対する処理が終わりであるかどうかを判断する(ステップS1609)。その結果、未処理の画素がある場合(No)はステップS1603に戻って、上記処理を繰り返し実行する。一方、未処理の画素がない場合(Yes)は、領域分割処理を終了する。
<領域統合処理>
図7は、図2のステップS17における領域統合処理の詳細について説明するためのフローチャートである。
まず、分離したい領域数の目標値を入力する(ステップS1701)。この目標値は、本実施形態では、何色くらいに分離するかの目安になる。次いで、現在のクラスタの数を数える(ステップS1702)。さらに、現在のクラスタの数を目標値とを比較する(ステップS1703)。その結果、現在のクラスタ数が目標値より少ない場合(No)は、領域統合処理を終了する。一方、クラスタ数が目標値より多い場合は、ステップS1704、S1705において、クラスタの統合処理を行う。
統合処理では、画像のエッジ部分とエッジではない部分の間違った統合を防ぐため、エッジクラスタを統合処理対象外にする。そこでまず、ステップS1704では、各クラスタ間の類似度を計算し、その中から一番類似度の高い二つのクラスタを統合処理の対象とする。次いで、ステップS1705では、統合処理対象の二つのクラスタを一つに統合する。一回目の領域統合は終わった後、再びステップS1702に戻って、クラスタ数を数える。
<ノイズ領域の判定処理>
図8は、図2のステップS18において判定されるノイズ領域について説明するための図である。
図8において、クラスタ61とクラスタ62は、領域分割処理及び領域統合処理後のクラスタから挙げた二つのクラスタの例である。これらのクラスタには多くの小さな領域が含まれているため、そのままクラスタの輪郭線と内部色情報をベクトルデータに変換してしまうと、データ量が膨大となり問題となる。この問題を解決するため、前述したようにステップS18では、領域分割の結果をラベリング処理する。そして、ステップS19では、各ラベル領域の大きさによりノイズ領域であるかどうかを判定する。その結果、ラベル領域が、ある閾値より小さい場合にノイズ領域と判定し、ノイズ領域再処理(ステップS20)に進むこととなる。尚、図8において、ノイズ63に含まれる各領域は、ノイズ領域と判定された部分である。
<ノイズ領域の再処理>
図9は、図2のステップS20におけるノイズ領域の再処理の詳細について説明するためのフローチャートである。そこで、ステップS19において判定されたノイズ領域をノイズ領域の再処理対象にし、ノイズ領域に含まれたノイズ画素毎に再処理を行う。
まず、ノイズ画素と各隣接クラスタ間の類似度を計算する(ステップS2001)。次いで、ノイズ画素を計算された類似度から一番類似度の高いクラスタに属させる(ステップS2002)。そして、このノイズ領域に全てのノイズ画素に対する除去処理が終わるかどうかを判断する(ステップS2003)。その結果、未処理の画素がある場合(Yes)はステップS2001に戻って、以上の処理を繰り返し実行する。一方、未処理の画素がない場合(No)は、このノイズ領域の再処理を終了する。
<エッジクラスタ判定処理と統合処理>
図10は、図2のステップS22におけるエッジクラスタ判定処理及びステップS23におけるエッジクラスタ統合処理の詳細について説明するためのフローチャートである。
まず、ステップS15で形成したエッジクラスタ以外のクラスタのエッジ率を計算する(ステップS2201)。エッジ率とは、エッジにある画素数とクラスタの画素数の割合であって、高いほどクラスタにエッジとみなされる画素が多いと考えられる。そして、エッジ率により処理対象となるクラスタがエッジクラスタであるか否かを判断する(ステップS2202)。その結果、エッジ率がある程度高い場合はエッジクラスタと判断し(Yes)、このクラスタの情報をステップS15で形成したエッジクラスタに加えて、一つのクラスタに統合して(ステップS2203)、ステップS2204に進む。一方、エッジ率が高くない場合はエッジクラスタではないと判定し(No)、ステップS2204に進む。ステップS2204では、未処理のクラスタがあるかどうかを判断する。その結果、未処理のクラスタがある場合(Yes)はステップS2201に戻って、上記処理を繰り返し実行する。一方、未処理のクラスタがない場合(No)は、エッジクラスタ判定処理と統合処理を終了する。
<エッジクラスタ統合の例>
図11は、本発明の一実施形態における分割されたクラスタからエッジクラスタと判定されたエッジクラスタに統合された例を示す図である。図11において、71はステップS15で形成したエッジクラスタである。72はクラスタのエッジ率によりエッジクラスタと判定されたクラスタである。また、73はクラスタ71とクラスタ72とを統合した後のエッジクラスタである。
<クリップアート画像の領域分割に基づいたベクトル化の例>
図12は、本発明の一実施形態によるクリップアート画像の領域分割に基づいたベクトル化の一例を示す図である。
まず、領域分割処理結果例について示す。図12において、81は領域分割されるクリップアート画像である。クリップアート画像81は、一連の処理により、分割したい領域数の目標値が16と指定される場合、領域分割結果82の各クラスタに分割される。ここで、一連の処理とは、前述したエッジクラスタ形成、領域分割、領域統合、ノイズ領域判定、ノイズ領域再処理、エッジクラスタ判定、エッジクラスタ統合の一連の処理である。
次に、ベクトル化処理結果の例を示す。ベクトル化処理に必要なクラスタの輪郭と内部色情報の例としては、クラスタ83、輪郭線84、内部色情報85が示される。領域分割結果82をベクトルデータに変換された結果はベクトル画像86になる。
以上説明したように、本実施形態によれば、エッジ情報からエッジクラスタを形成し、そして、分割された領域からエッジ率の高いエッジクラスタの統合処理により、縁情報を一つのエッジクラスタに納めた。そのため、縁情報を部品としての再利用性が高くなり、領域分割に基づいたベクトルデータ量を減らした。
このように、本発明によれば、縁情報を完全に一つのエッジクラスタに納め、各領域の輪郭を正確に追跡してベクトル化することで、画質の劣化を最小限に抑えるとともに、ベクトル化データ量を削減し、良好な画像の部品を得ることができるようになる。
<その他の実施形態>
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給する。そして、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、以下のようなものがある。フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページからハードディスク等の記録媒体にダウンロードすることによっても供給できる。すなわち、ホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをダウンロードする。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布する。そして、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他にも、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後にも前述した実施形態の機能が実現される。すなわち、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行うことによっても前述した実施形態の機能が実現される。
本発明の一実施形態に係る領域分割に基づいたベクトル化処理を行う機能を有する画像処理装置の構成を示すブロック図である。 本発明の一実施形態におけるクリップアート画像の領域分割に基づいたベクトル化処理についての概略を説明するためのフローチャートである。 本発明の一実施形態による画像処理において文書画像からクリップアート画像を選択した一例を示す図である。 図2のステップS15におけるエッジクラスタ形成処理の詳細について説明するためのフローチャートである。 本発明の一実施形態による画像処理によってクリップアート画像から形成したエッジクラスタの一例を示す図である。 図2のステップS16における領域分割処理の詳細について説明するためのフローチャートである。 図2のステップS17における領域統合処理の詳細について説明するためのフローチャートである。 図2のステップS18において判定されるノイズ領域について説明するための図である。 図2のステップS20におけるノイズ領域の再処理の詳細について説明するためのフローチャートである。 図2のステップS22におけるエッジクラスタ判定処理及びステップS23におけるエッジクラスタ統合処理の詳細について説明するためのフローチャートである。 本発明の一実施形態における分割されたクラスタからエッジクラスタと判定されたエッジクラスタに統合された例を示す図である。 本発明の一実施形態によるクリップアート画像の領域分割に基づいたベクトル化の一例を示す図である。 図1に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP)の主要部構成を示すブロック図である。
符号の説明
11 入力部
12 領域分離部
13 クリップアート画像選択部
14 エッジ抽出部
15 エッジクラスタ形成部
16 領域分割部
17 領域統合部
18 ノイズ領域判定部
19 ノイズ領域再処理部
20 エッジクラスタ判定部
21 エッジクラスタ統合部
22 ベクトル化部

Claims (6)

  1. クリップアート画像を含む文書画像を画像処理装置に入力してベクトル化する画像処理方法において、
    選択手段が、前記文書画像を領域分割して前記クリップアート画像を選択する選択工程と、
    抽出手段が、エッジ強度を求めるための所定のフィルタを前記クリップアート画像に適用することにより、当該クリップアート画像の各画素におけるエッジ強度を抽出する抽出工程と、
    エッジクラスタ形成手段が、前記エッジ強度が第1の閾値よりも高い画素によりエッジクラスタを形成するエッジクラスタ形成工程と、
    分割手段が、前記クリップアート画像における前記エッジクラスタ以外の画素を順に処理対象として、
    当該処理対象の画素についてエッジ強度が0であるか否かを判断し、当該エッジ強度が0でないと判断した画素に関しては前記エッジクラスタを含む生成済みクラスタそれぞれの色特徴と当該処理対象の画素の色特徴との類似度を求め、当該エッジ強度が0であると判断した画素に関しては前記エッジクラスタ以外の生成済みクラスタそれぞれの色特徴と当該処理対象の画素の色特徴との類似度を求め、
    当該処理対象の画素について求めた類似度のうちの最も高い類似度が第2の閾値よりも高ければ当該処理対象の画素を当該最も高い類似度を示したクラスタに属させ、当該処理対象の画素について求めた類似度のうちの最も高い類似度が前記第2の閾値以下であれば当該処理対象の画素により新たなクラスタを生成することにより、前記クリップアート画像に対するクラスタリング処理を行う分割工程と、
    領域統合手段が、前記分割工程でクラスタリング処理を行った後のクラスタの数が目標値より多い場合は、前記クラスタの数が前記目標値になるまで、前記エッジクラスタ以外のクラスタを対象として、当該対象としたクラスタ間の色特徴の類似度を求め、当該類似度が高いクラスタ同士から順に統合していく領域統合工程と、
    変換手段が、前記領域統合工程で統合された後、前記エッジクラスタを含む各クラスタを、該各クラスタの輪郭線と内部色に基づいてベクトルデータに変換する変換工程と
    を有することを特徴とする画像処理方法。
  2. クラスタ判定手段が、前記領域統合工程で統合された後、更に、前記エッジクラスタ以外の各クラスタについて、前記エッジ強度が0でないエッジにある画素数と当該クラスタの画素数との割合を示すエッジ率を計算し、当該計算したエッジ率が第3の閾値以上であるクラスタを新たなエッジクラスタとして判定するクラスタ判定工程と、
    クラスタ統合手段が、前記クラスタ判定工程で新たエッジクラスタとして判定されたクラスタと、前記エッジクラスタ形成工程および前記分割工程により形成されたエッジクラスタとを統合するクラスタ統合工程と
    をさらに有し、
    前記変換工程において、前記クラスタ統合工程で統合された後、前記エッジクラスタを含む各クラスタを、該各クラスタの輪郭線と内部色に基づいてベクトルデータに変換することを特徴とする請求項1に記載の画像処理方法。
  3. ノイズ判定手段が、前記分割工程でクラスタリング処理を行った後の各クラスタについて、ラベリングすることによってラベル領域を求め、当該求めた各ラベル領域のうち、大きさが第4の閾値より小さいラベル領域についてはノイズ領域として判定するノイズ判定工程と、
    類似度算出手段が、前記ノイズ領域内の各画素と隣接する他のクラスタとの類似度を算出する類似度算出工程と、
    ノイズ領域再処理手段が、前記ノイズ領域内の各画素を前記隣接する他のクラスタのうち最も類似度の高いクラスタに統合するノイズ領域再処理工程と
    をさらに備えることを特徴とする請求項1または2のいずれか1項に記載の画像処理方法。
  4. 前記クリップアート画像とは、色数の少ない画像であることを特徴とする請求項1乃至3のいずれか1項に記載の画像処理方法。
  5. クリップアート画像を含む文書画像をベクトル化する画像処理装置であって、
    前記文書画像を領域分割して前記クリップアート画像を選択する選択手段と、
    エッジ強度を求めるための所定のフィルタを前記クリップアート画像に適用することにより、当該クリップアート画像の各画素におけるエッジ強度を抽出する抽出手段と、
    前記エッジ強度が第1の閾値よりも高い画素によりエッジクラスタを形成するエッジクラスタ形成手段と、
    前記クリップアート画像における前記エッジクラスタ以外の画素を順に処理対象として、
    当該処理対象の画素についてエッジ強度が0であるか否かを判断し、当該エッジ強度が0でないと判断した画素に関しては前記エッジクラスタを含む生成済みクラスタそれぞれの色特徴と当該処理対象の画素の色特徴との類似度を求め、当該エッジ強度が0であると判断した画素に関しては前記エッジクラスタ以外の生成済みクラスタそれぞれの色特徴と当該処理対象の画素の色特徴との類似度を求め、
    当該処理対象の画素について求めた類似度のうちの最も高い類似度が第2の閾値よりも高ければ当該処理対象の画素を当該最も高い類似度を示したクラスタに属させ、当該処理対象の画素について求めた類似度のうちの最も高い類似度が前記第2の閾値以下であれば当該処理対象の画素により新たなクラスタを生成することにより、前記クリップアート画像に対するクラスタリング処理を行う分割手段と、
    前記分割手段でクラスタリング処理を行った後のクラスタの数が目標値より多い場合は、前記クラスタの数が前記目標値になるまで、前記エッジクラスタ以外のクラスタを対象として、当該対象としたクラスタ間の色特徴の類似度を求め、当該類似度が高いクラスタ同士から順に統合していく領域統合手段と、
    前記領域統合手段で統合された後、前記エッジクラスタを含む各クラスタを、該各クラスタの輪郭線と内部色に基づいてベクトルデータに変換する変換手段と
    を備えることを特徴とする画像処理装置。
  6. コンピュータを、
    文書画像を領域分割してクリップアート画像を選択させる選択手段、
    エッジ強度を求めるための所定のフィルタを前記クリップアート画像に適用することにより、当該クリップアート画像の各画素におけるエッジ強度を抽出させる抽出手段、
    前記エッジ強度が第1の閾値よりも高い画素によりエッジクラスタを形成させるエッジクラスタ形成手段、
    前記クリップアート画像における前記エッジクラスタ以外の画素を順に処理対象として、
    当該処理対象の画素についてエッジ強度が0であるか否かを判断し、当該エッジ強度が0でないと判断した画素に関しては前記エッジクラスタを含む生成済みクラスタそれぞれの色特徴と当該処理対象の画素の色特徴との類似度を求め、当該エッジ強度が0であると判断した画素に関しては前記エッジクラスタ以外の生成済みクラスタそれぞれの色特徴と当該処理対象の画素の色特徴との類似度を求め、
    当該処理対象の画素について求めた類似度のうちの最も高い類似度が第2の閾値よりも高ければ当該処理対象の画素を当該最も高い類似度を示したクラスタに属させ、当該処理対象の画素について求めた類似度のうちの最も高い類似度が前記第2の閾値以下であれば当該処理対象の画素により新たなクラスタリング処理を行う分割手段、
    前記分割手段でクラスタリング処理を行った後のクラスタの数が目標値より多い場合は、前記クラスタの数が前記目標値になるまで、前記エッジクラスタ以外のクラスタを対象として、当該対象としたクラスタ間の色特徴の類似度を求め、当該類似度が高いクラスタ同士から順に統合していく領域統合手段、
    前記領域統合手段で統合された後、前記エッジクラスタを含む各クラスタを、該各クラスタの輪郭線と内部色に基づいてベクトルデータに変換させる変換手段
    として機能させるためのコンピュータプログラム。
JP2005351309A 2005-10-17 2005-12-05 画像処理方法及び画像処理装置 Expired - Fee Related JP4748789B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2005351309A JP4748789B2 (ja) 2005-12-05 2005-12-05 画像処理方法及び画像処理装置
US11/539,428 US7831107B2 (en) 2005-10-17 2006-10-06 Image processing apparatus, image processing method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005351309A JP4748789B2 (ja) 2005-12-05 2005-12-05 画像処理方法及び画像処理装置

Publications (3)

Publication Number Publication Date
JP2007156841A JP2007156841A (ja) 2007-06-21
JP2007156841A5 JP2007156841A5 (ja) 2009-01-29
JP4748789B2 true JP4748789B2 (ja) 2011-08-17

Family

ID=38241130

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005351309A Expired - Fee Related JP4748789B2 (ja) 2005-10-17 2005-12-05 画像処理方法及び画像処理装置

Country Status (1)

Country Link
JP (1) JP4748789B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5149690B2 (ja) * 2008-05-02 2013-02-20 キヤノン株式会社 画像処理装置、画像処理方法、及び、画像処理プログラム
JP5180670B2 (ja) 2008-05-07 2013-04-10 キヤノン株式会社 画像処理装置及び画像処理方法
JP5067882B2 (ja) * 2008-07-18 2012-11-07 キヤノン株式会社 画像処理装置、画像処理方法およびプログラム
WO2020216808A1 (en) 2019-04-23 2020-10-29 L'oréal Sa Machine image colour extraction and machine image construction using an extracted colour

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH01158561A (ja) * 1987-10-15 1989-06-21 Honda Motor Co Ltd 編集方法
JPH02138674A (ja) * 1988-08-24 1990-05-28 Hitachi Ltd 文書処理方法及び装置
JPH08335264A (ja) * 1995-06-09 1996-12-17 Hitachi Ltd 道路車線認識方法及び装置
JPH09204525A (ja) * 1996-01-29 1997-08-05 Canon Inc 画像像域分離装置及びその方法
JPH09223236A (ja) * 1996-02-20 1997-08-26 Toshiba Corp 画像処理装置
JP3465531B2 (ja) * 1997-05-12 2003-11-10 オムロン株式会社 物体認識方法およびその装置
JP3899602B2 (ja) * 1997-07-28 2007-03-28 石川島播磨重工業株式会社 閉領域検出方法及び装置
JP2001022925A (ja) * 1999-07-09 2001-01-26 Mitsubishi Chemicals Corp 人工生命的手法に基づく画像処理方法及び装置並びに画像処理プログラムを記録したコンピュータ読取可能な記録媒体
JP4586241B2 (ja) * 2000-06-14 2010-11-24 コニカミノルタビジネステクノロジーズ株式会社 画像処理装置
JP4251629B2 (ja) * 2003-01-31 2009-04-08 キヤノン株式会社 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
JP2004246644A (ja) * 2003-02-14 2004-09-02 Pentax Corp 画像処理装置、画像処理方法および画像処理プログラム

Also Published As

Publication number Publication date
JP2007156841A (ja) 2007-06-21

Similar Documents

Publication Publication Date Title
JP4766661B2 (ja) 画像処理方法及び画像処理装置
JP4799246B2 (ja) 画像処理方法及び画像処理装置
US7623712B2 (en) Image processing method and apparatus
JP5047051B2 (ja) 画像処理装置及び画像符号化方法
US7831107B2 (en) Image processing apparatus, image processing method, and program
JP5302768B2 (ja) 画像処理装置及び画像処理方法
US8396298B2 (en) Image processing apparatus, image processing method, and storage medium with vectorization process for data from graphic areas
JP4732315B2 (ja) 画像処理装置及び方法
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
JP5219706B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP5541672B2 (ja) 装置、方法、プログラム
JP4484896B2 (ja) 画像処理装置及びその制御方法ならびにそのプログラム及び記憶媒体
KR20190033451A (ko) 화상 처리 장치, 화상 처리 방법, 및 저장 매체
JP4739082B2 (ja) 画像処理方法及び画像処理装置
JP4748789B2 (ja) 画像処理方法及び画像処理装置
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2006023944A (ja) 画像処理システム及び画像処理方法
JP2007109177A (ja) 画像処理装置及びその制御方法、プログラム
JP2008124996A (ja) 画像処理装置、および画像処理方法
JP4950835B2 (ja) 画像形成装置及び画像形成装置の制御方法及びプログラム及び記憶媒体
JP2008147712A (ja) 画像処理装置および画像処理方法
JP2010068198A (ja) 画像形成装置

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081205

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20081205

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110209

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110218

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110418

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110513

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110516

R150 Certificate of patent or registration of utility model

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140527

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees