JP2006344069A - 画像処理方法及び画像処理装置 - Google Patents

画像処理方法及び画像処理装置 Download PDF

Info

Publication number
JP2006344069A
JP2006344069A JP2005170043A JP2005170043A JP2006344069A JP 2006344069 A JP2006344069 A JP 2006344069A JP 2005170043 A JP2005170043 A JP 2005170043A JP 2005170043 A JP2005170043 A JP 2005170043A JP 2006344069 A JP2006344069 A JP 2006344069A
Authority
JP
Japan
Prior art keywords
cluster
noise
image
clusters
area
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2005170043A
Other languages
English (en)
Other versions
JP2006344069A5 (ja
JP4766661B2 (ja
Inventor
Xiao Yan Dai
暁艶 戴
Hideshi Osawa
秀史 大澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2005170043A priority Critical patent/JP4766661B2/ja
Priority to US11/444,389 priority patent/US7623712B2/en
Publication of JP2006344069A publication Critical patent/JP2006344069A/ja
Publication of JP2006344069A5 publication Critical patent/JP2006344069A5/ja
Priority to US12/580,005 priority patent/US7936929B2/en
Application granted granted Critical
Publication of JP4766661B2 publication Critical patent/JP4766661B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Abstract

【課題】 文書画像から選択された図形領域について、ノイズを削減してデータ量を低減させたベクトルデータを好適に生成することができる画像処理方法及び画像処理装置を提供することを目的とする。
【解決手段】 入力部11は文書画像を入力し、領域分割部12はそれを複数の領域に分割する。そして、クリップアート画像選択部13は、その中からクリップアート画像を選択し、領域分割部14が、その画像領域について複数のクラスタから成るクラスタ群を生成する。ここで、領域統合部15は、複数のクラスタのうち類似するクラスタを統合してクラスタ群を更新し、ノイズ判定部16は、更新後のクラスタ群に含まれる各クラスタがノイズであるか否かを判定し、ノイズ除去部17でノイズが除去された後、ベクトル変換部18は最終的なクラスタ群をベクトルデータに変換する。
【選択図】 図1

Description

本発明は、紙原稿をスキャンして取得した画像を領域分割して領域毎にベクトル化する画像処理方法及び画像処理装置に関する。
近年、情報の電子化が進み、紙文書をそのまま保存するのではなく、電子化して保存したり、その電子データを他装置に送信するシステムが普及してきている。また、その電子化の対象となる文書は、白黒二値の画像だけに留まらず、フルカラー(多値)画像の電子文書へとその対象を広げつつある。
さらに、対象となる電子文書は、単に紙上の文書をスキャナ等によりスキャンして画像データにしたものだけに留まっていない。例えば、文書画像の領域を分離して、文字領域に対しては文字認識処理を施して文字コード列に変換し、写真領域に対しては輪郭線のベクトルデータに変換する等、電子文書は、より高度な情報へ変換され生成された文書画像を含んできている(例えば、特許文献1参照。)。
上述したようなベクトル化された画像の中には、フルカラー画像であっても、イラストや図形作成ソフトウェアで作成された原稿をスキャンしてベクトル化した画像等もある。これらの画像は、写真等の自然画像に比べて物体の輪郭が明瞭であり、出現色も限られている等の特徴を有している。尚、以下では、このような画像を「クリップアート画像」と呼ぶ。
また、特許文献2の道路データ生成方法では、まず、フルカラーで入力された写真画像を二値画像に変換する。次いで、二値画像から輪郭線及び中心線を抽出して、得られた線と原画像の色情報をベクトルデータに変換する。尚、ノイズに対する処理は、孤立のノイズを膨張・収縮処理を施して除去することが記載されている。
特開2004−265384号公報 特開2004−246554号公報
しかしながら、上述したような従来の処理では、有用領域を間違ってノイズ領域として消去してしまうことがあり、そのような場合は正確な輪郭線を得ることができず、ベクトル化後の画像が画質劣化したものになってしまう。また、ノイズ除去を行わずにノイズ領域をそのまま残して輪郭線をベクトル化した場合には、ベクトルデータ量が膨大となってしまうという問題がある。
本発明は、このような事情を考慮してなされたものであり、文書画像から選択された図形領域について、ノイズを削減してデータ量を低減させたベクトルデータを好適に生成することができる(特に、イラストなどのクリップアート画像領域に対して好適なベクトルデータを生成することができる)画像処理方法及び画像処理装置を提供することを目的とする。
上記課題を解決するために、本発明に係る画像処理方法は、
文書画像を画像処理装置に入力する入力工程と、
前記文書画像を複数の領域に分割する分割工程と、
前記複数の領域から図形領域を選択する選択工程と、
選択された前記図形領域内に含まれる各画素をクラスタとして、複数のクラスタから成るクラスタ群を生成するクラスタリング工程と、
前記複数のクラスタのうち類似するクラスタを統合して前記クラスタ群を更新する統合工程と、
更新後の前記クラスタ群に含まれる各クラスタがノイズであるか否かを判定する判定工程と、
ノイズと判定されたクラスタを前記クラスタ群から除去する除去工程と、
前記クラスタ群をベクトルデータに変換する変換工程と
を有することを特徴とする。
また、本発明に係る上記画像処理方法は、
前記選択工程が、前記文書画像から分割された前記複数の領域からカラー成分を有する図形領域を選択し、
前記統合工程が、前記図形領域内の各画素の色特徴が類似する複数のクラスタを統合して前記クラスタ群を更新する
ことを特徴とする。
さらに、本発明に係る上記画像処理方法は、
生成するクラスタ数の目標値を設定する設定工程をさらに有し、
前記統合工程が、前記クラスタリング工程によって生成されたクラスタのクラスタ数が前記目標値に達するまで前記クラスタ群の更新を行う
ことを特徴とする。
さらにまた、本発明に係る上記画像処理方法は、
前記判定工程が、
前記統合工程によって更新された前記クラスタ群に含まれる各クラスタの輪郭線を追跡して該輪郭線を構成する画素数を計数する第1の工程と、
各クラスタ毎にクラスタの輪郭線を構成する画素数と所定値とを比較して、前記画素数が前記所定値よりも小さい場合に前記クラスタをノイズと判定する第2の工程と
を有することを特徴とする。
さらにまた、本発明に係る上記画像処理方法は、前記第2の工程が、前記画素数が前記所定値よりも小さいと判定されたクラスタに対して、さらに、該クラスタの周囲に他のクラスタのエッジが存在することを条件として該クラスタをノイズと判定することを特徴とする。
さらにまた、本発明に係る上記画像処理方法は、前記第2の工程が、前記画素数が前記所定値よりも小さいと判定されたクラスタに対して、さらに、該クラスタの周囲に該クラスタと同じ色特徴を有する所定値以上の画素数を有する他のクラスタが存在することを条件として該クラスタをノイズと判定することを特徴とする。
さらにまた、本発明に係る上記画像処理方法は、前記除去工程が、ノイズと判定された前記クラスタに含まれる画素を、該画素に隣接するクラスタのうち最も類似度の高いクラスタの画素として該クラスタに属させることにより、ノイズと判定された前記クラスタを除去することを特徴とする。
さらにまた、本発明に係る上記画像処理方法において、前記図形領域は、イラスト作成アプケーションを用いて作成された図形が印刷された原稿が読み取られて電子化された画像、又は紙原稿上に描かれたイラストが読み取られて電子化された画像からなる領域であることを特徴とする。
さらにまた、本発明に係る上記画像処理方法は、前記図形領域が、クリップアート画像領域であることを特徴とする。
本発明によれば、文書画像から選択された図形領域について、ノイズを削減してデータ量を低減させたベクトルデータを好適に生成することができる。
以下、図面を参照して、本発明の一実施形態に係る画像処理装置を用いた画像データのベクトル化処理について、詳細に説明する。
<第1の実施形態>
[装置構成]
図1は、本発明の第1の実施形態に係る、領域分割に基づいてベクトル化処理を行う機能を有する画像処理装置の構成を示すブロック図である。図1において、入力部11は、紙原稿等をスキャンすることによってカラー文書画像を入力する。また、領域分離部12は、入力部11で入力されたカラー文書画像を写真領域を含む複数種類の領域に分離する。さらに、クリップアート画像選択部13は、領域分離部12の処理によって分離された領域からクリップアート画像を選択する。
さらにまた、図1において、領域分割部14は、クリップアート画像選択部13によって選択されたクリップアート画像をその色特徴に基づいて複数の領域に分割する。さらにまた、領域統合部15は、分割された複数の領域のうち類似する領域を統合する。さらにまた、ノイズ判定部16は、分割され統合された各領域からノイズ領域を判定する。さらにまた、ノイズ除去部17は、ノイズ判定部16によってノイズ領域と判定された領域を除去する。そして、ベクトル化部18は、領域分割された結果である領域(統合された場合は統合された後の領域、ノイズ除去された場合はノイズ除去後の領域)をそれぞれベクトルデータに変換する。
図10は、図1に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP)の主要部構成を示すブロック図である。尚、本実施形態では、画像処理装置として、スキャナ機能やプリンタ機能を有するディジタル複合機(MFP)を用いているが、汎用のスキャナとパーソナルコンピュータとを接続したシステムを当該画像処理装置として用いてもよい。
図10に示すように、MFPは、画像処理装置として機能するコントローラユニット2000を備えている。当該コントローラユニット2000は、画像入力デバイスであるスキャナ2070や画像出力デバイスであるプリンタ2095を接続し、スキャナ2070で原稿画像から読み取られた画像データをプリンタ2095によって印刷出力するコピー機能を実現するための制御を行う。また、コントローラユニット2000は、LAN1006や公衆回線(WAN)1008を介して他装置との間でパターン画像やデバイス情報等の入出力を行うための制御を行う。
コントローラユニット2000は、図10に示すように、CPU2001を有している。CPU2001は、ROM2003に格納されているブートプログラムによりオペレーションシステム(OS)を立ち上げ、このOS上でHDD(ハードディスクドライブ)2004に格納されているアプリケーションプログラムを実行することによって各種処理を実行する。このCPU2001の作業領域として、RAM2002が用いられる。RAM2002はまた、CPU2001の作業領域だけでなく、画像データを一時記憶するための画像メモリ領域をも提供する。HDD2004は、上記アプリケーションプログラムとともに、画像データを格納する。
CPU2001には、システムバス2007を介して、ROM2003やRAM2002とともに、操作部I/F(操作部インタフェース)2006、ネットワークI/F(ネットワークインタフェース)2010、モデム2050及びイメージバスI/F(イメージバスインタフェース)2005が接続されている。
操作部I/F2006は、タッチパネルを有する操作部2012とのインタフェースであり、操作部2012に表示する画像データを操作部2012に対して出力する。また、操作部I/F2006は、操作部2012においてユーザにより入力された情報をCPU2001に送出する。
また、ネットワークI/F2010は、LAN1006に接続され、当該LAN1006を介してLAN1006に接続された各装置との間で情報の入出力を行う。モデム2050は、公衆回線1008に接続し、公衆回線1008を介して他装置との間で情報の入出力を行う。
イメージバスI/F2005は、システムバス2007と画像データを高速で転送する画像バス2008を接続し、データ構造を変換するためのバスブリッジである。画像バス2008は、PCIバス又はIEEE1394から構成される。画像バス2008上には、ラスタイメージプロセッサ(RIP)2060、デバイスI/F2020、スキャナ画像処理部2080、プリンタ画像処理部2090、画像回転部2030、サムネイル作成部2035及び画像圧縮部2040が設けられている。
RIP2060は、PDLコードをビットマップイメージに展開するプロセッサである。デバイスI/F2020には、スキャナ2070及びプリンタ2095が接続され、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部2080は、入力画像データに対して補正、加工、編集処理を行う。プリンタ画像処理部2090は、プリント出力画像データに対してプリンタの補正、解像度変換等を行う。画像回転部2030は、画像データの回転を行う。画像圧縮部2040は、多値画像データをJPEGデータに、ニ値画像データをJBIG、MMR、MH等のデータに圧縮するとともに、その伸長処理も行う。
[領域分割に基づいたベクトル化処理の概要]
図2は、本発明の第1の実施形態に係るクリップアート画像の領域分割に基づいたベクトル化処理の詳細について説明するためのフローチャートである。
画像処理装置では、まず、入力部11において、紙原稿をスキャン等することによってカラー文書画像データを得る(ステップS11)。次に、領域分離部12において、ステップS11で入力されたカラー文書画像に二値化処理を行って二値の画像データに変換し、この二値の画像データを文字、写真、表等の複数種類の領域に分離する(ステップS12)。尚、この領域分離処理を実現するための一例として、米国特許第5,680,478号公報「Method and Apparatus for character recognition (Shin−YwanWang et aI./Canon K.K.)」に記載の技術を用いることができる。そして、本実施形態における領域分離処理も当該技術を利用することとする。
次いで、クリップアート画像選択部13において、ステップS12の領域分離工程で分離された領域からクリップアート画像を選択する(ステップS13)。さらに、領域分割部14において、選択された各クリップアート画像の色特徴に基づいてクラスタリング処理を行い、クリップアート画像をクラスタに分割(領域分割)する(ステップS14)。尚、この領域分割処理の詳細については後述する。
そして、領域統合部15において、ステップS14の工程で分割されたクラスタを類似度により統合することによって領域統合を行う(ステップS15)。尚、この領域統合処理の詳細については後述する。
その後、ノイズ判定部16において領域分割の結果をラベリングして各クラスタの輪郭線を追跡して輪郭線を構成する画素するを計数し(ステップS16)、そして、各ラベル領域の輪郭線を構成する画素数の大きさとある閾値との大きさを比較することにより、当該領域がノイズ領域であるか否かを判定する(ステップS17)。その結果、ラベル領域がある程度小さいものをノイズ領域と判定する(Yes)。一方、ラベル領域がある程度以上の大きさがあるものはノイズ領域と判定せずに(No)、ステップS19に進む。尚、このノイズ判定処理の詳細については後述する。
そして、ノイズ除去部17において、ステップS17で判定されたノイズ領域に含まれたノイズ画素について、隣接する領域間との類似度に基づいて再びクラスタリング処理を行うことによってノイズ除去処理を行い(ステップS18)、ステップS19に進む。尚、このノイズ除去処理の詳細について後述する。
ステップS19では、全てのラベル領域に対して処理が終わったかどうか、すなわち、全てのラベル領域の処理が終了したか否かを判定する。その結果、処理対象がまだ存在する場合(No)はステップS17に戻って、当該領域について上述したノイズ領域の判定処理(ステップS17)とノイズ領域の除去処理(ステップS18)を繰り返し実行する。一方、既に全てのラベル領域の処理が終了して処理対象がない場合(Yes)は、ステップS20に進む。
そして、ステップS20では、ベクトル化部18において、分割された領域毎に輪郭線と領域内部の色に基づきベクトルデータに変換する。このベクトル化処理を実現する技術としては、例えば、特許第2885999号の二値画像の輪郭線の追跡をし、その座標ベクトルを選択することにより、ベクトル化するものが挙げられる。尚、本実施形態に係るベクトル化処理についても当該技術を利用するものとする。
[クリップアート画像の選択例]
図3は、本発明の第1の実施形態に係る画像処理において文書画像からクリップアート画像を選択した一例を示す図である。図3では、一文書画像から前述した領域分離法を用いて写真領域31、テキスト領域32、及びクリップアート領域33がそれぞれ矩形領域として分離されている様子を示している。
[領域分割処理]
以下、図2に示すフローチャートにおける領域分割処理(ステップS14)について詳細に説明する。図4は、図2に示すフローチャートにおける領域分割処理(ステップS14)を詳細に説明するためのフローチャートである。
まず、ラスタスキャンされたスタートの画素により、最初のクラスタを生成する(ステップS1401)。次いで、次の画素に対して、全てのクラスタ間との類似度を求める(ステップS1402)。類似度が高いほど、画素とクラスタとの特徴が近いと考えられる。類似度の計算処理においては、例えばRGB値の色情報が用いられるが、他のカラー空間の情報、或いは、カラー以外の情報を特徴量としても使ってもよい。
そして、一番高い類似度とこの類似度に対応したクラスタ番号を記録して、この類似度を事前に設定された閾値とを比較する(ステップS1403)。その結果、閾値より高い場合(Yes)は、対象画素を記録された当該クラスタに属させる(ステップS1404)。一方、閾値より低い場合(No)は、対象画素に対して新たなクラスタを生成する(ステップS1405)。尚、上記画素に対してクラスタ間との類似度を画素間距離で求めた場合には、類似度が閾値より高い場合とは、当該閾値より画素間距離が小さいということを意味する。
ステップS1404又はステップS1405の処理後、全ての画素に対する処理が終わったかどうかを判断する(ステップS1406)。その結果、未処理の画素がまだある場合(No)はステップS1402に戻って、上述した処理を繰り返し実行する。一方、未処理の画素がない場合(Yes)は、領域分割処理(ステップS14)を終了する。
[領域統合処理]
次に、図2に示すフローチャートにおける領域統合処理(ステップS15)について詳細に説明する。図5は、図2に示すフローチャートにおける領域統合処理(ステップS15)を詳細に説明するためのフローチャートである。
まず、最終的に分離される領域数の目標値を設定(入力)する(ステップS1501)。本実施形態では、一例として何色くらいに分離するかを目安にして行うものとする。次いで、現在のクラスタの数を計数する(ステップS1502)。そして、計数された現在のクラスタの数と設定された目標値とを比較する(ステップS1503)。
その結果、現在のクラスタ数が目標値よりも多い場合(Yes)は、クラスタの統合を行う。本実施形態では、クラスタの統合処理として、まず各クラスタ間の類似度(距離)を計算し(ステップS1504)、その中から一番類似度の高い2つのクラスタ(一番距離の短い2つのクラスタ)を統合処理の対象とし、当該統合処理対象の2つのクラスタを1つのクラスタに統合する(ステップS1505)。
上述したクラスタの統合処理が終った後、再びステップS1502に戻って、統合処理後のクラスタ群に対して上記処理を繰り返し実行する。尚、ステップS1503の比較処理において、現在のクラスタ数が設定された目標値よりも少ない場合(No)は、本領域統合処理(ステップS15)を終了する。
[ノイズ判定処理]
次に、図2に示すフローチャートにおけるノイズ判定処理(ステップS17)について図6を用いて詳細に説明する。図6は、図2に示すフローチャートにおけるノイズ判定処理(ステップS17)について詳細に説明するための図である。
図6において、クラスタ61とクラスタ62は、領域分割処理(ステップS14)及び領域統合処理(ステップS15)後のクラスタから、それぞれ代表として選ばれた2つのクラスタ例である。図6に示すこれらのクラスタ61、62には小さな領域が数多く含まれており、これらをそのままクラスタの輪郭線と内部色情報とをベクトルデータに変換してしまうと、データ量が膨大となって問題となる。そこで、この問題を解決するため、前述したように領域分割の結果をラベリングし(ステップS16)、そして、各ラベル領域の大きさによりノイズ領域であるかどうかを判定することとしている(ステップS17)。その結果、領域63に含まれた各領域はノイズ領域と判定され、それぞれがノイズ除去処理の対象となる。
[ノイズ除去処理]
次に、図2に示すフローチャートにおけるノイズの除去処理(ステップS18)について詳細に説明する。図7は、図2に示すフローチャートにおけるノイズ除去処理(ステップS18)を詳細に説明するためのフローチャートである。ノイズ除去処理では、ノイズ判定処理(ステップS17)において判定されたノイズ領域をノイズ除去処理対象として、ノイズ領域に含まれたノイズ画素毎に除去処理を行う。
そこで、まず、ノイズ画素と各隣接クラスタ間の類似度(例えば、ノイズ画素と隣接領域との距離)を計算する(ステップS1801)。次いで、ノイズ画素を計算された類似度から一番類似度の高いクラスタに属させて(類似度の高い隣接クラスタに統合)、ノイズ画素の属する領域を更新する(ステップS1802)。そして、このノイズ領域に未処理のノイズ画素が存在しているかどうかを判断する(ステップS1803)。
その結果、未処理の画素がある場合(Yes)はステップS1801に戻って、上記処理を繰り返し実行する。一方、未処理の画素がない場合(No)は、このノイズ領域のノイズ除去処理を終了する。
[クリップアート画像の領域分割に基づいたベクトル化の一例]
図8は、本発明の一実施形態によるクリップアート画像の領域分割に基づいたベクトル化の一例を示す図である。図8において、81は領域分割されるクリップアート画像である。また、82は領域分割結果の一例を示す。すなわち、クリップアート画像81は、前述した領域分割、領域統合、ノイズ判定、ノイズ除去の一連の処理により、例えば、分割したい領域数の目標値が16と設定された場合は、領域分割結果82に示す16個のクラスタから成るクラスタ群に分割される。
ベクトル化処理に必要なクラスタの輪郭と内部色情報の例としては、図8では、クラスタ83、輪郭線84、及び内部色情報85が示されている。領域分割結果82を上記情報に基づいてベクトルデータに変換された結果がベクトル画像86である。ベクトル画像86のファイルサイズは24Kバイトであり、元のクリップアート画像81のファイルサイズが2739Kバイトであるので、ベクトル化によって1/100以下のサイズに減ることになる。また、ベクトル画像86の各クラスタ82を部品として、各クラスタの内部色の塗り潰し等の処理を行うこともできる。
以上説明したように、本実施形態によれば、ラベリング処理により判定されたノイズ領域を再クラスタリング処理することで、ノイズを効果良く除去することができる。また、ノイズ除去された領域分割の結果をベクトル化することで、データ量を減らすことができる。
<第2の実施形態>
以下、本発明に係る第2実施形態について説明する。
前述した第1実施形態においては、ラベリング処理後にラベル領域の大きさによりノイズ領域であるかどうかを判定する例を示した。第2実施形態においては、画像の有用な情報が除去されるのを防ぐため、ラベル領域の大きさによりノイズ領域の判定後、さらに他の情報を利用してノイズ領域であるかどうかを判定する例について、図9を参照して説明する。尚、第2の実施形態における領域分割に基づいてベクトル化処理を行う機能を有する画像処理装置の構成について前述した第1の実施形態に係る画像処理装置と同様である。
図9は、本発明の第2の実施形態に係るクリップアート画像の領域分割に基づいたベクトル化処理の詳細について説明するためのフローチャートである。図9のフローチャートにおいて、ステップS1701とステップS1702は第2の実施形態におけるノイズ領域の判定部分であり、他のステップは前述した第1の実施形態と同じである。
まず、ステップS1701では、ラベル領域の大きさによりノイズ領域の候補であるかどうかを判定する。その結果、ラベル領域が小さくなければ(No)、ノイズ領域ではないと判定してステップS19の処理に遷移する。一方、ラベル領域が小さいと判定された場合(Yes)は、ノイズ領域候補として記録して、ステップS1702の処理に遷移する。
次に、ステップS1702では、ステップS1701で記録されたノイズ領域を、周囲にエッジがあるかによって確実にノイズ領域であるかどうかを判定する。その結果、ノイズ領域候補の周囲にエッジ画素がある場合(Yes)は、ノイズ領域であると判定し、ステップS18のノイズ除去処理に遷移する。一方、ノイズ領域候補の周囲に強いエッジ画素がない場合(No)は、ノイズ領域ではないと判定し、ステップS19の処理に遷移する。尚、エッジ画素とは、隣接画素から色や輝度が大きく変化する画素を示すものとし、例えば、ソベルフィルタを用いることによりエッジか否か判定することができる。ここでは、エッジの周囲にはノイズが生じやすいというスキャナの特性やJPEG圧縮等の特性に着目して、ノイズか否か判断している。
また、上記エッジ情報の他にも、ラベル領域の大きさにより判定されたノイズ領域に対して、さらに周囲領域との位置関係によりノイズ領域を判定するようにしてもよい。すなわち、小さいラベル領域に対して、周囲に同じ色の大きい領域がある場合は、確実にノイズ領域として判定する。
以上第1及び第2の実施形態を示して説明したように、本発明によれば、ノイズ除去を行った領域分割処理により各領域の輪郭を正確に取ることにより、画質の向上が出来、さらに各領域輪郭のベクトル化記述ためのデータ量を削減し、良好な画像の部品を得ることができるようになる。
<その他の実施形態>
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能であり、具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給し、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)などがある。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをハードディスク等の記録媒体にダウンロードすることによっても供給できる。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布し、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせ、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される他、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現される。
本発明の第1の実施形態に係る、領域分割に基づいてベクトル化処理を行う機能を有する画像処理装置の構成を示すブロック図である。 本発明の第1の実施形態に係るクリップアート画像の領域分割に基づいたベクトル化処理の詳細について説明するためのフローチャートである。 本発明の第1の実施形態に係る画像処理において文書画像からクリップアート画像を選択した一例を示す図である。 図2に示すフローチャートにおける領域分割処理(ステップS14)を詳細に説明するためのフローチャートである。 図2に示すフローチャートにおける領域統合処理(ステップS15)を詳細に説明するためのフローチャートである。 図2に示すフローチャートにおけるノイズ判定処理(ステップS17)について詳細に説明するための図である。 図2に示すフローチャートにおけるノイズ除去処理(ステップS18)を詳細に説明するためのフローチャートである。 本発明の一実施形態によるクリップアート画像の領域分割に基づいたベクトル化の一例を示す図である。 本発明の第2の実施形態に係るクリップアート画像の領域分割に基づいたベクトル化処理の詳細について説明するためのフローチャートである。 図1に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP)の主要部構成を示すブロック図である。
符号の説明
11 入力部
12 領域分離部
13 クリップアート画像選択部
14 領域分割部
14 領域統合部
16 ノイズ判定部
17 ノイズ除去部
18 ベクトル化部

Claims (12)

  1. 文書画像を画像処理装置に入力する入力工程と、
    前記文書画像を複数の領域に分割する分割工程と、
    前記複数の領域から図形領域を選択する選択工程と、
    選択された前記図形領域内に含まれる各画素をクラスタとして、複数のクラスタから成るクラスタ群を生成するクラスタリング工程と、
    前記複数のクラスタのうち類似するクラスタを統合して前記クラスタ群を更新する統合工程と、
    更新後の前記クラスタ群に含まれる各クラスタがノイズであるか否かを判定する判定工程と、
    ノイズと判定されたクラスタを前記クラスタ群から除去する除去工程と、
    前記クラスタ群をベクトルデータに変換する変換工程と
    を有することを特徴とする画像処理方法。
  2. 前記選択工程が、前記文書画像から分割された前記複数の領域からカラー成分を有する図形領域を選択し、
    前記統合工程が、前記図形領域内の各画素の色特徴が類似する複数のクラスタを統合して前記クラスタ群を更新する
    ことを特徴とする請求項1に記載の画像処理方法。
  3. 生成するクラスタ数の目標値を設定する設定工程をさらに有し、
    前記統合工程が、前記クラスタリング工程によって生成されたクラスタのクラスタ数が前記目標値に達するまで前記クラスタ群の更新を行う
    ことを特徴とする請求項1又は2に記載の画像処理方法。
  4. 前記判定工程が、
    前記統合工程によって更新された前記クラスタ群に含まれる各クラスタの輪郭線を追跡して該輪郭線を構成する画素数を計数する第1の工程と、
    各クラスタ毎にクラスタの輪郭線を構成する画素数と所定値とを比較して、前記画素数が前記所定値よりも小さい場合に前記クラスタをノイズと判定する第2の工程と
    を有することを特徴とする請求項1から3までのいずれか1項に記載の画像処理方法。
  5. 前記第2の工程が、前記画素数が前記所定値よりも小さいと判定されたクラスタに対して、さらに、該クラスタの周囲に他のクラスタのエッジが存在することを条件として該クラスタをノイズと判定することを特徴とする請求項4に記載の画像処理方法。
  6. 前記第2の工程が、前記画素数が前記所定値よりも小さいと判定されたクラスタに対して、さらに、該クラスタの周囲に該クラスタと同じ色特徴を有する所定値以上の画素数を有する他のクラスタが存在することを条件として該クラスタをノイズと判定することを特徴とする請求項4に記載の画像処理方法。
  7. 前記除去工程が、ノイズと判定された前記クラスタに含まれる画素を、該画素に隣接するクラスタのうち最も類似度の高いクラスタの画素として該クラスタに属させることにより、ノイズと判定された前記クラスタを除去することを特徴とする請求項1から6までのいずれか1項に記載の画像処理方法。
  8. 前記図形領域は、イラスト作成アプケーションを用いて作成された図形が印刷された原稿が読み取られて電子化された画像、又は紙原稿上に描かれたイラストが読み取られて電子化された画像からなる領域であることを特徴とする請求項1から7までのいずれか1項に記載の画像処理方法。
  9. 前記図形領域が、クリップアート画像領域であることを特徴とする請求項1に記載の画像処理方法。
  10. 文書画像を入力する入力手段と、
    前記文書画像を複数の領域に分割する分割手段と、
    前記複数の領域から図形領域を選択する選択手段と、
    選択された前記図形領域内に含まれる各画素をクラスタとして、複数のクラスタから成るクラスタ群を生成するクラスタリング手段と、
    前記複数のクラスタのうち類似するクラスタを統合して前記クラスタ群を更新する統合手段と、
    更新後の前記クラスタ群に含まれる各クラスタがノイズであるか否かを判定する判定手段と、
    ノイズと判定されたクラスタを前記クラスタ群から除去する除去手段と、
    前記クラスタ群をベクトルデータに変換する変換手段と
    を疎なることを特徴とする画像処理装置。
  11. コンピュータに、
    文書画像を入力する入力手順と、
    前記文書画像を複数の領域に分割する分割手順と、
    前記複数の領域から図形領域を選択する選択手順と、
    選択された前記図形領域内に含まれる各画素をクラスタとして、複数のクラスタから成るクラスタ群を生成するクラスタリング手順と、
    前記複数のクラスタのうち類似するクラスタを統合して前記クラスタ群を更新する統合手順と、
    更新後の前記クラスタ群に含まれる各クラスタがノイズであるか否かを判定する判定手順と、
    ノイズと判定されたクラスタを前記クラスタ群から除去する除去手順と、
    前記クラスタ群をベクトルデータに変換する変換手順と
    を実行させるためのプログラム。
  12. 請求項11に記載のプログラムを格納したことを特徴とするコンピュータ読み取り可能な記憶媒体。
JP2005170043A 2005-06-09 2005-06-09 画像処理方法及び画像処理装置 Expired - Fee Related JP4766661B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2005170043A JP4766661B2 (ja) 2005-06-09 2005-06-09 画像処理方法及び画像処理装置
US11/444,389 US7623712B2 (en) 2005-06-09 2006-06-01 Image processing method and apparatus
US12/580,005 US7936929B2 (en) 2005-06-09 2009-10-15 Image processing method and apparatus for removing noise from a document image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2005170043A JP4766661B2 (ja) 2005-06-09 2005-06-09 画像処理方法及び画像処理装置

Publications (3)

Publication Number Publication Date
JP2006344069A true JP2006344069A (ja) 2006-12-21
JP2006344069A5 JP2006344069A5 (ja) 2008-07-24
JP4766661B2 JP4766661B2 (ja) 2011-09-07

Family

ID=37640983

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2005170043A Expired - Fee Related JP4766661B2 (ja) 2005-06-09 2005-06-09 画像処理方法及び画像処理装置

Country Status (1)

Country Link
JP (1) JP4766661B2 (ja)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009290780A (ja) * 2008-05-30 2009-12-10 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2009301141A (ja) * 2008-06-10 2009-12-24 Konica Minolta Business Technologies Inc 減色方法、減色処理装置、画像形成装置、およびコンピュータプログラム
JP2010033541A (ja) * 2008-06-26 2010-02-12 Canon Inc 画像処理装置及び画像処理方法
JP2010146218A (ja) * 2008-12-17 2010-07-01 Canon Inc 画像処理装置、画像処理方法、コンピュータプログラム
JP2010211639A (ja) * 2009-03-11 2010-09-24 Canon Inc 画像処理方法、画像処理装置、及びプログラム
WO2011001669A1 (en) * 2009-07-01 2011-01-06 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
JP2011034410A (ja) * 2009-08-03 2011-02-17 Canon Inc クラスタリング処理方法、クラスタリング処理装置、およびプログラム
US8270722B2 (en) 2009-02-10 2012-09-18 Canon Kabushiki Kaisha Image processing with preferential vectorization of character and graphic regions
US8284451B2 (en) 2008-05-07 2012-10-09 Canon Kabushiki Kaisha Generating print data based on attributes of segmented regions of an input image
US8295641B2 (en) 2008-09-19 2012-10-23 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and medium storing image processing program
US8300939B2 (en) 2009-07-27 2012-10-30 Canon Kabushiki Kaisha Image processing method, image processing apparatus, and program
US8331671B2 (en) 2008-05-02 2012-12-11 Canon Kabushiki Kaisha Image processing apparatus and image encoding method related to non-photo image regions
US8422774B2 (en) 2010-03-23 2013-04-16 Canon Kabushiki Kaisha Image processing method, image processing apparatus and program storage medium
US8472720B2 (en) 2009-07-23 2013-06-25 Canon Kabushiki Kaisha Image processing method, apparatus and program
US8553985B2 (en) 2010-08-27 2013-10-08 Canon Kabushiki Kaisha Image processing apparatus, image processing method and computer-readable medium
US8620068B2 (en) 2008-05-02 2013-12-31 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and medium storing program thereof
US8737749B2 (en) 2008-09-12 2014-05-27 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and medium storing image processing program
US8774524B2 (en) 2010-03-18 2014-07-08 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium of image processing method
US8810877B2 (en) 2009-07-01 2014-08-19 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image
US8934710B2 (en) 2011-05-09 2015-01-13 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer-readable medium
US8995761B2 (en) 2011-05-09 2015-03-31 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer-readable medium

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07144078A (ja) * 1993-11-25 1995-06-06 Brother Ind Ltd 刺繍データ作成装置
JPH1049687A (ja) * 1996-08-01 1998-02-20 Canon Inc 画像処理装置及びその方法
JP2004246554A (ja) * 2003-02-13 2004-09-02 Zenrin Co Ltd 道路データ生成方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH07144078A (ja) * 1993-11-25 1995-06-06 Brother Ind Ltd 刺繍データ作成装置
JPH1049687A (ja) * 1996-08-01 1998-02-20 Canon Inc 画像処理装置及びその方法
JP2004246554A (ja) * 2003-02-13 2004-09-02 Zenrin Co Ltd 道路データ生成方法

Cited By (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8620068B2 (en) 2008-05-02 2013-12-31 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and medium storing program thereof
US8331671B2 (en) 2008-05-02 2012-12-11 Canon Kabushiki Kaisha Image processing apparatus and image encoding method related to non-photo image regions
US8284451B2 (en) 2008-05-07 2012-10-09 Canon Kabushiki Kaisha Generating print data based on attributes of segmented regions of an input image
US8396298B2 (en) 2008-05-30 2013-03-12 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium with vectorization process for data from graphic areas
JP2009290780A (ja) * 2008-05-30 2009-12-10 Canon Inc 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP2009301141A (ja) * 2008-06-10 2009-12-24 Konica Minolta Business Technologies Inc 減色方法、減色処理装置、画像形成装置、およびコンピュータプログラム
JP4586891B2 (ja) * 2008-06-10 2010-11-24 コニカミノルタビジネステクノロジーズ株式会社 減色方法、減色処理装置、画像形成装置、およびコンピュータプログラム
US8395813B2 (en) 2008-06-10 2013-03-12 Konica Minolta Business Technologies, Inc. Subtractive color method, subtractive color processing apparatus, image forming apparatus, and computer-readable storage medium for computer program
JP2010033541A (ja) * 2008-06-26 2010-02-12 Canon Inc 画像処理装置及び画像処理方法
US8417029B2 (en) 2008-06-26 2013-04-09 Canon Kabushiki Kaisha Image processing apparatus and method, including fill-up processing
US8737749B2 (en) 2008-09-12 2014-05-27 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and medium storing image processing program
US8295641B2 (en) 2008-09-19 2012-10-23 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and medium storing image processing program
US8363934B2 (en) 2008-12-17 2013-01-29 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer program
JP2010146218A (ja) * 2008-12-17 2010-07-01 Canon Inc 画像処理装置、画像処理方法、コンピュータプログラム
US8270722B2 (en) 2009-02-10 2012-09-18 Canon Kabushiki Kaisha Image processing with preferential vectorization of character and graphic regions
JP2010211639A (ja) * 2009-03-11 2010-09-24 Canon Inc 画像処理方法、画像処理装置、及びプログラム
US8488190B2 (en) 2009-03-11 2013-07-16 Canon Kabushiki Kaisha Image processing apparatus, image processing apparatus control method, and storage medium storing program
US8810877B2 (en) 2009-07-01 2014-08-19 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image
CN102473278A (zh) * 2009-07-01 2012-05-23 佳能株式会社 图像处理装置、图像处理方法和存储介质
CN102473278B (zh) * 2009-07-01 2014-04-16 佳能株式会社 图像处理装置、图像处理方法和存储介质
JP2011013898A (ja) * 2009-07-01 2011-01-20 Canon Inc 画像処理装置、画像処理方法、及び、プログラム
WO2011001669A1 (en) * 2009-07-01 2011-01-06 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
US8675256B2 (en) 2009-07-01 2014-03-18 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium
US8472720B2 (en) 2009-07-23 2013-06-25 Canon Kabushiki Kaisha Image processing method, apparatus and program
US8300939B2 (en) 2009-07-27 2012-10-30 Canon Kabushiki Kaisha Image processing method, image processing apparatus, and program
JP2011034410A (ja) * 2009-08-03 2011-02-17 Canon Inc クラスタリング処理方法、クラスタリング処理装置、およびプログラム
US8218881B2 (en) 2009-08-03 2012-07-10 Canon Kabushiki Kaisha Clustering processing method, clustering processing apparatus, and non-transitory computer-readable medium
US8774524B2 (en) 2010-03-18 2014-07-08 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and storage medium of image processing method
US8422774B2 (en) 2010-03-23 2013-04-16 Canon Kabushiki Kaisha Image processing method, image processing apparatus and program storage medium
US8553985B2 (en) 2010-08-27 2013-10-08 Canon Kabushiki Kaisha Image processing apparatus, image processing method and computer-readable medium
US8934710B2 (en) 2011-05-09 2015-01-13 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer-readable medium
US8995761B2 (en) 2011-05-09 2015-03-31 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and computer-readable medium

Also Published As

Publication number Publication date
JP4766661B2 (ja) 2011-09-07

Similar Documents

Publication Publication Date Title
JP4766661B2 (ja) 画像処理方法及び画像処理装置
US7903307B2 (en) Image processing method and image processing apparatus
US7623712B2 (en) Image processing method and apparatus
JP5047051B2 (ja) 画像処理装置及び画像符号化方法
JP5302768B2 (ja) 画像処理装置及び画像処理方法
US7831107B2 (en) Image processing apparatus, image processing method, and program
US8244035B2 (en) Image processing apparatus and control method thereof
US7551753B2 (en) Image processing apparatus and method therefor
JP5111268B2 (ja) 画像処理装置、画像処理方法、そのプログラムおよび記憶媒体
JP4251629B2 (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US8396298B2 (en) Image processing apparatus, image processing method, and storage medium with vectorization process for data from graphic areas
US8203748B2 (en) Image processing apparatus, control method therefor, and program
JP5219706B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP2007174270A (ja) 画像処理装置、画像処理方法、記憶媒体、プログラム
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
US20090074291A1 (en) Image processing apparatus and image processing method
JP4739082B2 (ja) 画像処理方法及び画像処理装置
JP2006025129A (ja) 画像処理システム及び画像処理方法
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2006023944A (ja) 画像処理システム及び画像処理方法
JP4748789B2 (ja) 画像処理方法及び画像処理装置
JP2007109177A (ja) 画像処理装置及びその制御方法、プログラム
JP2007109178A (ja) 画像処理装置及びその制御方法、プログラム
JP2011053901A (ja) 文書画像データ提供装置、文書画像データ提供システム、文書画像データ提供方法、文書画像データ提供プログラム、背景処理プログラム
JP2007216434A (ja) 印刷装置および印刷制御方法

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080609

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080609

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20110119

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20110124

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110318

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110610

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110613

R150 Certificate of patent or registration of utility model

Ref document number: 4766661

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140624

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees