JP5028337B2 - 画像処理装置、画像処理方法、プログラム、及び記憶媒体 - Google Patents

画像処理装置、画像処理方法、プログラム、及び記憶媒体 Download PDF

Info

Publication number
JP5028337B2
JP5028337B2 JP2008143617A JP2008143617A JP5028337B2 JP 5028337 B2 JP5028337 B2 JP 5028337B2 JP 2008143617 A JP2008143617 A JP 2008143617A JP 2008143617 A JP2008143617 A JP 2008143617A JP 5028337 B2 JP5028337 B2 JP 5028337B2
Authority
JP
Japan
Prior art keywords
cluster
area
color
region
line drawing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008143617A
Other languages
English (en)
Other versions
JP2009290780A (ja
Inventor
暁艶 戴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008143617A priority Critical patent/JP5028337B2/ja
Priority to US12/474,082 priority patent/US8396298B2/en
Publication of JP2009290780A publication Critical patent/JP2009290780A/ja
Application granted granted Critical
Publication of JP5028337B2 publication Critical patent/JP5028337B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Description

本発明は、画像処理技術に関するものである。
近年、情報の電子化が進み、紙文書をそのまま保存するのではなく、スキャナ等によりスキャンして電子化して保存したり、その電子データを他装置に送信したりするシステムが普及してきている。送信コストを削減するため、電子化された文書に対して高い圧縮性が要求されている。一方、電子データの圧縮においては、電子化データを部分的に編集できる再利用性と、拡大しても縮小しても画質が落ちない高画質性とが要求されている。
ところが、文書データに文字領域や写真領域が混在する場合は、文字領域に適した圧縮を行うと画質が良いが圧縮率が低くなり、写真領域に適した圧縮を行うと圧縮率が高いが文字が劣化してしまう問題がある。そこで、電子化された文書データ(文書画像)を文字領域や写真領域に分離し、再利用性と高画質性が重視されている文字領域をベクトルデータに変換する。そして、それ以外の簡易にベクトル化で再現できない写真領域等をJPEGで圧縮し、各領域の圧縮結果を合成して出力することにより、文書画像の高圧縮性、再利用性、高画質性を実現する手法が提案されている(特許文献1を参照)。
従来、文書画像から分離された線が多く含まれている画像(以下、「線画画像」という)をベクトル化する手段が提案されている(特許文献2を参照)。例えば、画像を2値化し、2値化画像にある各閉じた線から取り出された粗輪郭を近似処理するアウトラインベクトル法と、各閉じた線の線芯を近似するラインアート法が提案されている。
さらに、ベクトル処理の対象を拡大し、文書画像の高圧縮性、再利用性、高画質性を向上させるための手法が提案されている(特許文献3を参照)。今まで写真としてJPEGで圧縮されていた画像の中に物体の輪郭に縁がついたように明瞭で、出現色も限られている等の特徴を有する特定画像(イラスト)(以下「クリップアート画像」)をベクトル化する手法が提案されている。ここで提案されている方法は、画像を色の類似度により色領域に分割し、各色領域の輪郭をアウトライン法で近似し、色情報を加えてベクトルデータを出力するものである。
しかしながら、今までは画像データのベクトル化の際に、入力画像がクリップアート画像なのか線画なのかは開発者の経験に基づき判断され、それによって、適用するベクトル手法が切り替えられている。従来の技術では、入力画像がクリップアートなのか線画なのかの自動判定により自動的にベクトル手法を切り替えることが出来ない。文書画像を文字領域や写真領域などの属性領域に分離する手段に関して、画素単位で文字画素か写真画素等の判定方法が沢山提案されているが、処理対象となる文書画像の全体がクリップアート画像なのか線画なのかの判定を行うものではない。
また、2値線画のベクトル化処理に関しても種々の提案がなされている。例えば、カラー線画のベクトル化処理に関して、入力画像の三つの単色多値画像を生成し、それぞれの多値画像が有する等濃度線の形状を抽出してベクトル化する手法が提案されている(特許文献4を参照)。
特開2004−265384号公報 特許第3049672号公報 特開2006−344069号公報 特開平11−069145号公報
しかしながらカラー線画の単色多値画像の生成に閾値に大きく影響されることや、スキャンノイズへの対応がうまく出来ないこと等の問題点がある。
本発明は、クリップアートと線画の混在領域に対して、自動的にクリップアートなのか線画なのかを判定し、画像の種類(属性)に応じて自動的にベクトル化手法を切り替える画像処理技術を提供することを目的とする。
また、カラー線画のベクトル化に関しては、カラー線画を各色領域に分割し、各色領域のベクトル化結果を合成しベクトルデータを生成する画像処理方法及び画像処理装置を提供することをもう一つの目的とする。
上記課題を解決するために、本発明にかかる画像処理装置は、入力された文書画像データから、前記文書画像データに含まれるデータの属性を判定し、当該属性ごとの領域に前記文書画像データを分離する分離手段と、
前記分離手段で分離された領域のうち、前記属性が文字、写真、表のいずれでもない属性の領域を、グラフィックス領域として抽出する抽出手段と、
前記抽出手段で抽出された前記グラフィックス領域内の各画素のエッジ強度を求め、当該求めたエッジ強度が予め定められた第1の閾値よりも高い画素の数をカウントするエッジ画素数カウント手段と、
前記抽出手段で抽出された前記グラフィックス領域を構成する各画素が有する色情報に基づいて色ごとのクラスタに分け、該グラフィックス領域の四辺にある画素が属する各クラスタの出現頻度をカウントし、最も出現頻度の高いクラスタを背景として同定し、当該背景として同定されたクラスタ以外のクラスタに属する画素の数をカウントする背景以外画素数カウント手段と、
前記エッジ画素数カウント手段でカウントされた画素の数と、前記背景以外画素数カウント手段でカウントされた画素の数との割合をエッジ率として計算するエッジ率計算手段と、
前記エッジ率計算手段で計算された前記エッジ率が予め定められた第2の閾値より高い場合は前記グラフィックス領域を線画により構成される線画領域であると判定し、前記エッジ率が前記第2の閾値以下である場合は前記グラフィックス領域をクリップアート領域であると判定する判定手段と、
前記判定手段で前記クリップアート領域であると判定された場合は当該グラフィックス領域に対してクリップアート領域に適したベクトル化処理を行い、前記判定手段で前記線画領域であると判定された場合は当該グラフィックス領域に対して線画領域に適したベクトル化処理を行うベクトル変換手段と、
を備えることを特徴とする。
本発明によれば、クリップアート画像と線画画像の自動判定ができ、それにより画像の属性に応じたベクトル化手法を自動的に切り替えることが可能になる。
ベクトル化手法を自動的に切り替えることにより、文書画像の処理効率や画質の向上が可能になる。
カラー線画の特徴に合った色分離処理ができ、それによりカラー線画のベクトル化結果が改善され、文書画像の圧縮性や再利用性を向上させることが可能になる。
以下、図面を参照して、本発明に係る画像処理装置を用いたクリップアート領域と線画領域の自動判定によりベクトル化処理の自動切り替え及びカラー線画のベクトル化処理ための色分離処理について、詳細に説明する。ただし、この実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術的範囲は、特許請求の範囲によって確定されるのであって、以下の個別の実施形態によって限定されるわけではない。
(第1実施形態)
(装置構成)
図1は、本発明の実施形態にかかる画像処理装置の構成を示すブロック図である。画像形成装置は、クリップアート領域と線画領域の自動判定によりベクトル化処理の自動切り替え処理及びカラー線画のベクトル化処理ための色分離処理を行う機能を有する。
図1において、入力部10は、例えば、スキャナなどの画像読取手段を介して紙情報から入力されたモノクロまたはカラー画像データの入力を受け付ける。領域分離部11はカラー画像から文字領域や写真等を含む複数種類の領域に分離する。グラフィックス領域抽出部12は分離されたそれぞれの領域から、属性が文字でもない写真でもないグラフィックス領域を抽出する。クリップアート領域・線画領域判定部13はグラフィックス領域に含まれるクリップアート領域と線画領域とを判定する。なお、本実施形態において、クリップアートとは、写真や自然画などの色数が多い複雑な画像とは異なり、出現する色数が限られた単純なイラストのような画像のことを指すものとする。クリップアート領域分割部14はクリップアート領域にある各画素を色特徴に基づき領域に分割する。クリップアート領域ベクトル変換部15はクリップアート領域分割結果をベクトルデータに変換する。線画領域色分離部16はカラー線画領域を色成分に分ける。線画領域ベクトル変換部17は線画領域の色分離結果をベクトルデータに変換する。ベクトルデータ出力部18は、クリップアート領域ベクトル変換部15の処理結果と、線画領域ベクトル変換部17の処理結果と、を出力することが可能である。
図2は、図1に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP)の主要部構成を示すブロック図である。尚、本実施形態では、画像処理装置として、スキャナ機能やプリンタ機能を有するディジタル複合機(MFP)を用いているが、汎用のスキャナとパーソナルコンピュータとを接続したシステムを当該画像処理装置として用いてもよい。
図2に示すように、MFPは、画像処理装置の制御手段として機能するコントローラユニット2000を備えている。コントローラユニット2000は、画像入力デバイスであるスキャナ2070や画像出力デバイスであるプリンタ2095と、デバイスインタフェース(I/F)を介して接続する。そして、コントローラユニット2000は、スキャナ2070で原稿画像から読み取られた画像データをプリンタ2095によって印刷出力するコピー機能を実現するための制御を行うことが可能である。また、コントローラユニット2000は、LAN1006や公衆回線(WAN)1008を介して他装置との間でパターン画像やデバイス情報等の入出力を行うための制御を行うことが可能である。
コントローラユニット2000は、図2に示すように、CPU2001を有している。CPU2001は、ROM2003に格納されているブートプログラムによりオペレーションシステム(OS)を立ち上げる。そして、このOS上でHDD(ハードディスクドライブ)2004に格納されているアプリケーションプログラムを実行することによって各種処理を実行する。CPU2001の作業領域として、RAM2002が用いられる。RAM2002はまた、CPU2001の作業領域だけでなく、画像データを一時記憶するための画像メモリ領域をも提供する。HDD2004は、上記アプリケーションプログラムとともに、画像データを格納する。
CPU2001には、システムバス2007を介して、ROM2003やRAM2002が接続している。CPU2001には、操作部I/F(インタフェース)2006、ネットワークI/F(インタフェース)2010、モデム2050及びイメージバスI/F(インタフェース)2005が接続されている。
操作部I/F2006は、タッチパネルを有する操作部2012とのインタフェースであり、操作部2012に表示する画像データを操作部2012に対して出力する。また、操作部I/F2006は、操作部2012においてユーザにより入力された情報をCPU2001に送出する。
また、ネットワークI/F2010は、LAN1006に接続され、LAN1006を介してLAN1006に接続された各装置との間で情報の入出力を行う。モデム2050は、公衆回線1008に接続し、公衆回線1008を介して他装置との間で情報の入出力を行う。
イメージバスI/F2005は、システムバス2007と画像データを高速で転送する画像バス2008を接続し、データ構造を変換するためのバスブリッジである。画像バス2008は、PCIバス又はIEEE1394から構成される。画像バス2008上には、ラスタイメージプロセッサ(RIP)2060、デバイスI/F2020、スキャナ画像処理部2080、プリンタ画像処理部2090、画像回転部2030、サムネイル作成部2035及び画像圧縮部2040が設けられている。
RIP2060は、PDLコードをビットマップイメージに展開するプロセッサである。デバイスI/F2020には、スキャナ2070及びプリンタ2095が接続され、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部2080は、入力画像データに対して補正、加工、編集処理を行う。プリンタ画像処理部2090は、プリント出力画像データに対してプリンタの補正、解像度変換等を行う。画像回転部2030は、画像データの回転を行う。画像圧縮部2040は、多値画像データをJPEGデータに、ニ値画像データをJBIG、MMR、MH等のデータに圧縮するとともに、その伸長処理も行う。
<クリップアート領域と線画領域の自動判定によるベクトル化処理の自動切り替え処理の概要>
図3は、第1実施形態におけるクリップアート領域と線画領域の自動判定によるベクトル化処理の自動切り替え処理の概略を説明するためのフローチャートである。
まず、入力部10において、スキャナより紙情報を入力し、カラー文書画像データを得る(ステップS310)。次に、領域分離部11において、入力されたカラー文書画像を二値データに変換し、この二値画像データを文字、写真、表等の複数種類の領域に分離する(ステップS311)。尚、この領域分離処理を実現する一例として、米国特許第5,680,478号公報に記載の領域分離技術を用いることができる。尚、当該公報には、「Method and Apparatus for character recognition (Shin-Ywan Wang et aI./Canon K.K.)」が記載されている。さらに、グラフィックス領域抽出部12において、前工程で分離された領域から、領域の属性が文字・写真・表のいずれでもないグラフィックス領域、即ち、クリップアート領域と線画領域が含まれる領域、を処理対象として選択する(ステップS312)。
次に、クリップアート領域・線画領域判定部13により、前工程(ステップS312)で抽出されたグラフィックス領域はクリップアート領域なのか線画領域なのかを判定する(ステップS313)。
クリップアート領域と判定されれば(ステップS314−Yes)、クリップアート領域分割部14において、色特徴に基づき画素をいくつかのクラスタ(領域)に分ける。この領域分割処理の詳細については後述する(ステップS315)。そして、クリップアート領域ベクトル変換部15において、分割された領域毎に輪郭線と領域内部色に基づきベクトルデータに変換する(ステップS316)。このベクトル処理を実現する一例としては、例えば、各色領域の境界線を取り出し、各境界線の輪郭線の追跡を行い、その座標ベクトルを選択することによりベクトル化するものが挙げられる。なお、クリップアート画像を色毎のクラスタ(色領域)に分け、各クラスタのアウトライン(輪郭)に基づいてベクトル化すると、各クラスタの境界線、つまり、他のクラスタが隣接する部分には隙間が出たり、或いは重なったりしてしまう可能性がある。本出願人は、特願2006-335070において、色領域間の境界の交点を同定し、同定した交点を端点として端点間をつなぐ境界ごとに端点間ベクトルを生成し、その端点間ベクトルを繋ぐことで各領域のベクトルデータを生成する手法を提案している。すなわち、ステップS316で行うベクトル化処理は、隣接する色領域間の隙間の発生や重なりの発生を防ぐために、境界線を同じ近似を使ってベクトル化する手法を用いるようにするのが望ましい。
一方、線画領域と判定されれば(ステップS314−No)、線画領域色分離部16において、各画素の色特徴及び各領域の連結等の情報に基づき各色領域に分ける。この線画色分離処理の詳細については後述する(ステップS317)。そして、線画領域ベクトル変換部17において、分離された各色領域毎にベクトルデータに変換する(ステップS318)。このベクトル処理を実現する一例としては、例えば、特許第2885999号公報に記載の、二値画像の輪郭線の追跡を行い、その座標ベクトルを選択することによりベクトル化するものが挙げられる。
次に、ベクトルデータ出力部18において、ベクトル化の結果を出力する(ステップS319)。
<グラフィックス領域の抽出例>
図4は、第1実施形態の画像処理において画像からクリップアート領域と線画領域が含まれるグラフィックス領域を選択した一例を示す図である。図4に示す文書画像では、前述した領域分離法により、写真領域431、文字領域432、及びクリップアート領域と線画領域が含まれるグラフィックス領域433、434がそれぞれ矩形領域として分離されている。
<クリップアート領域と線画領域の判定処理(S313)>
グラフィックス領域に含まれているクリップアート領域と線画領域の判定処理(S313)の詳細について、図5を参照して説明する。
先ず、ステップS501では、処理対象となるグラフィックス画像を入力する。そして、エッジ抽出工程として、ステップS502では、グラフィックス画像からエッジ強度を抽出する。エッジを抽出するには、公知のPrewittフィルタ、あるいはSobelフィルタを利用することが可能である。すなわち、エッジ強度を示す微分画像を生成する。そして、エッジ画素数カウント工程であるステップS503では、抽出されたエッジ強度に基づき、エッジ強度が予め定められた閾値より高い画素の数を、エッジの画素として、カウントする。
そして、背景以外の画素数カウント工程であるステップS504では、背景以外の画素数をカウントする。この背景以外の画素数のカウント(統計処理)についての詳細は後述する。そして、エッジ率計算工程として、ステップS505では、上記ステップS503で求めたエッジ強度の高い画素数とステップS504で求めた背景以外の画素数の割合(エッジ率)を計算する。
ステップS506、S507、S508では、クリップアート領域か線画領域かの判定を行う。ステップS506では、先のステップS505で求めたエッジ率を見て、エッジ率が予め定められた閾値より高ければ(S506−Yes)、ステップS508で入力グラフィックス画像を線画と判定する。一方、エッジ率がある閾値より低ければ(S506−No)、ステップS507で入力グラフィックス画像をクリップアートと判定する。そして、ステップS509では、クリップアート領域と線画領域の判定結果を出力する。
<背景以外の画素数の統計処理(S504)>
クリップアート領域は基本的にベタ領域が多い。一方、線画領域は線が沢山含まれている。この特徴を利用して、クリップアート領域と線画領域の判定に使われているエッジ率として、エッジ強度の高い画素数と背景以外の画素数の割合を求める。エッジ率を求めるのは、エッジ強度の高い画素数と画像全体の画素数の割合では、背景部分の影響が大きくなってしまうためである。
背景以外の画素数の統計処理(S504)の詳細を、図6を参照して説明する。先ず、ステップS501では、処理対象となるグラフィックス領域を入力する。そして、ステップS641では、処理対象のグラフィックス画像をおおまかなクラスタリング処理をする。この処理では、画像の色特徴(各画素が有する、彩度、濃度などの色情報を含む)を利用し、画像(各画素)の色特徴の類似度により色の塊に分ける。そして、ステップS642では、大まかなクラスタリング処理の結果に基づき、周囲の四辺を取る。そして、ステップS643では、周囲の四辺にある画素のクラスタ情報(例えば、各画素が有する色情報を含む)を見て、各クラスタの出現頻度をカウント(統計)する。そして、ステップS644では、各クラスタの中から一番出現頻度の高いクラスタを背景領域と同定する。そして、ステップS645では、同定された背景以外の領域に含まれる画素数をカウント(統計)し、そして、ステップS646では、そのカウント(統計)された背景以外の画素数を出力する。
<背景領域同定処理の例(S644)>
ステップS644における背景領域同定処理の具体例を説明する。図7は、第1実施形態の画像処理においてグラフィックス領域からの背景領域の同定を例示的に説明する図である。このグラフィックス領域は大まかなクラスタリング処理により緑色クラスタ701、黄色クラスタ702、青色クラスタ703、紫色クラスタ704の四つの領域に分けられる。背景同定処理では、グラフィックス画像の矩形領域の周囲の四辺にある各画素のクラスタ情報により、緑色クラスタ701の出現頻度が一番高いので、緑色クラスタ701は背景領域と同定する。
<クリップアート領域分割処理(S315)>
クリップアートの領域分割処理(S315)の詳細を図8の参照により説明する。まず、ステップS801では、処理対象となるクリップアート画像を入力する。そして、ステップS802では、各画素の色特徴量に基づいてクラスタリング処理を行う。この処理では、まず、ラスタスキャンしたスタートの画素により、最初のクラスタを生成する。そして、次の画素に対して、全てのクラスタ間との色特徴量の類似度を求める。類似度が高いほど、画素とクラスタとの特徴が近いと考えられる。ここでは、類似度の計算にRGB値を用いるが、他のカラー空間の情報、或いは、カラー以外の情報を特徴量としても使える。そして、一番高い類似度と、この類似度に対応したクラスタ番号と、を記録し、この類似度を事前に設定された閾値とを比較する。類似度が閾値より高ければ、対象画素が記録されたクラスタに属させる。類似度が閾値より低ければ、対象画素により新たなクラスタを生成する。この処理は全ての画素の処理が終わるまで繰り返し実行する。
次に、ステップS803では、先のステップS802のクラスタリング処理結果に基づき、クラスタ統合処理を行う。この処理では、まず、分離したい領域数の目標値を入力する。本発明では、例えば、何色くらいに分離するかの目安を目標値とすることができる。なお、ユーザにより目標値が入力されない場合は、予め決めておいたデフォルトの値(例えば、16色)を目標値として使うように構成しても構わない。そして、現在のクラスタの数を数える。現在のクラスタの数を領域数の目標値と、を比較する。現在のクラスタ数が目標値より多ければ、クラスタの統合を行う。統合処理では、各クラスタの代表値を示す特徴情報(例えば、類似度の計算にRGB値を含む)を求め、各クラスタの特徴情報の類似度を計算し、その中から一番類似度の高い二つのクラスタを一つに統合する。領域統合処理は現在のクラスタ数が目標値以下になるまで繰り返し実行する。
次に、ステップS804〜S807では、先のステップS803のクラスタ統合処理(領域統合処理)の結果に基づき、ノイズ領域の再処理を行う。この処理では、まず、ステップS804では、領域分割の結果をラベリングし、そして、ステップS805では、各ラベル領域の面積を計算する。ラベル領域の面積はこの領域にある画素の数である。ラベル領域の面積がある閾値より小さければ、この領域をノイズ領域と判定する。そして、ステップS806では、ノイズ領域と判定された領域に含まれた各画素に対して、周囲に隣接する領域との類似度を計算し、処理対象画素を一番類似度の高い領域に属させる(ノイズ除去)。ステップS807において、全てのラベル領域に対して処理済みか判定し、処理が完了していない場合は(S807−No)、処理をステップS805に戻し、同様の処理を全てのラベル領域が処理済みになるまで繰り返し実行する。一方、ステップS807の判定で、全てのラベル領域の処理が完了したと判定される場合は(S807−Yes)、ステップS808において、クリップアートの領域分割結果を出力する。
<線画領域の色分離処理(S317)>
カラー線画は基本的にクリップアートと同じ処理で良いと考えられる。しかしながら、クリップアート処理のままで、ノイズ領域の再処理を行うと、線画にある線の一部がなくなったり、ノイズ領域の再処理を行わなければ、線の周囲に大量のノイズが残ってしまったりする問題が生じる。そのため、クリップアートの処理をベースにカラー線画専用の処理を加える必要がある。
ステップS317における線画領域の色分離処理の詳細を、図9を参照して説明する。
まず、ステップS901では、処理対象となるカラー線画画像を入力する。そして、ステップS902では、各画素の色特徴量に基づいてクラスタリング処理を行う。そして、ステップS903では、クラスタの数が目標値に比べて多ければ、最も類似するクラスタ同士から順にクラスタ統合処理を行う。そして、ステップS904では、クラスタ統合処理後の各クラスタについて、ラベリング処理を行う。ステップS902〜S904はクリップアートの該当処理(S802〜S804)と同じである。
そして、ステップS905では、上記のラベリング処理により求められる、統合された各クラスタ内に含まれる連結領域の数を示す連結情報(ラベル数)に基づき、再統合が必要なクラスタの再統合処理を行う。この再統合処理対象領域の再処理についての詳細は後述する。そして、ステップS906では、各色領域の2値画像を出力する。
<再統合処理対象領域の再処理(S905)>
図9のステップS905における再統合処理対象領域の再処理について、図10を参照して説明する。
先ず、ステップS1001では、上記のラベリング処理(S904)の結果を入力する。再統合処理対象判定工程として、ステップS1002では、各クラスタにおいて、ラベル数がある閾値以上で、且つ、画素数がある閾値より少ないクラスタを再統合処理対象クラスタ(再統合対象領域)と判定する。そして、主要色領域判定工程として、ステップS1003では、画素数がある閾値以上のクラスタを主要色クラスタ(主要色領域)と判定する。そして、ステップS1004では、各再統合処理対象クラスタを一番色類似度の高い主要色クラスタに統合させ、ステップS1005では、再統合処理対象クラスタの再処理結果を出力する。なお、ラベル数がある閾値より少なく且つ画素数がある閾値より少ないクラスタに関しては、再統合対象クラスタにも、主要色クラスタ(再統合先のクラスタ)にもならないので、そのまま出力されることになる。
ここで、ラベル数の閾値は絶対値を使ってもいいし、各クラスタのラベル数と画像全体のトータルなラベル数の割合を使ってもいい。また、クラスタの画素数の閾値も同様である。また、処理する入力画像の画質などによって最適な閾値は異なると考えられるので、判定に用いる各閾値は、予め主なサンプル画像を用いて実験的に求めておいた閾値を適用するのが望ましい。
<線画領域の色分離処理(クラスタリング処理)の例>
図11と図12は、第1実施形態の画像処理において線画領域の色分離処理を実行する例を示す図である。図11は、再統合処理対象領域の再処理を実行する前の各クラスタの結果である。例えば、原画1100は見た目で茶色の線からなる画像である。クラスタリング、クラスタ統合処理により、線画領域の画像は、極薄い茶色の領域(クラスタ)1101、薄い茶色の領域(クラスタ)1102、濃い茶色の領域(クラスタ)1103、背景領域(クラスタ)1104との四つのクラスタに分けられたものとする。なお、図11の1101〜1104および図12の1203〜1204では、各クラスタに属する画素部分を黒で表現している。このように、1色に見えるような線画であっても厳密に色情報に基づいてクラスタリングした場合、色ムラ等により複数のクラスタに分かれる場合がある。クラスタリングにより、元々1つのクラスタで表したい線が切れてしまうと、ベクトル化処理を行った場合、データ量が多くなってしまうとともに、ベクトルデータとしての再利用にも適さないものになってしまう。
図12は、再統合処理対象領域の再処理を実行する後の各クラスタの結果である。再統合処理対象領域の再処理により、ラベル数がある閾値以上で、且つ、画素数がある閾値より少ないクラスタ1101、1102(図11)を再統合処理対象領域と判定する。また、画素数がある閾値以上のクラスタ1103、1104を主要色領域と判定する。また、再統合処理対象領域として判定されたクラスタ1101、1102を、主要色領域1203、12004の中で色類似度が一番近い主要色領域1203に統合する。
以上説明したように本実施形態によれば、クリップアート画像と線画画像の自動判定ができ、それにより画像の属性に応じたベクトル化手法を自動的に切り替えることが可能になる。
あるいは、本実施形態によれば、ベクトル化手法を自動的に切り替えることにより、文書画像の処理効率や画質の向上が可能になる。
あるいは、本実施形態によれば、カラー線画の特徴に合った色分離処理ができ、それによりカラー線画のベクトル化結果が改善され、文書画像の圧縮性や再利用性を向上させることが可能になる。
(第2実施形態)
先に説明した第1実施形態では、クリップアート領域と線画領域の判定処理に、エッジ強度の高い画素の数と背景以外の画素数の割合、即ち、エッジ率を用いた構成を例として説明した。本実施形態では、エッジ率、大まかなクラスタリングの領域数、グレーなのかカラーなのかの情報に基づき判定する構成例を説明する。本実施形態では、エッジ率が高い、あるいは、大まかなクラスタリングの領域数がある閾値より少ない、或いは、グレー画像であるのいずれかの条件を満たす画像を線画と判定する。
図13は、第2実施形態に係るクリップアート領域と線画領域の判定処理を説明するフローチャートである。
先ず、ステップS1301では、処理対象となるグラフィックス画像を入力する。そして、ステップS1302では、画像からエッジを抽出する。そして、ステップS1303では、エッジ情報に基づき、エッジ強度が予め定められた閾値より高い画素の数をカウント(統計)する。そして、ステップS1304では、背景以外の画素数をカウント(統計)する。そして、ステップS1305では、上記のステップS1303で求めたエッジ強度の高い画素数と、ステップS1304で求めた背景以外の画素数との割合、即ち、エッジ率を計算する。ここまでの処理は第1実施形態のクリップアート領域と線画領域の判定処理と同じである。
グレー画像・カラー画像判定工程として、ステップS1311〜S1313では、入力画像がグレー画像であるかカラー画像であるかを判定する。ステップS1311では、各画素のRGBカラー情報から、例えば、彩度等の色彩情報(S情報)を取得する(色彩情報取得工程)。色彩情報(S情報)を取得する方法としては、例えば、RGBカラー空間からHSVカラー空間へ変換するのが一つのやり方である。尚、本発明の趣旨は、この例に限定されるものではなく、それ以外に色彩情報(S情報)が取得できる方法でも可能である。
そして、ステップS1312では、色彩情報(S情報)がある閾値以上である画素数をカウント(統計)する。スキャン画像の場合は、画像にある元々白色の部分(色彩情報(S情報)は0である)は黄色っぽくなるが、この黄色部分は色彩情報(S情報)が低いので、色彩情報(S情報)がある閾値以下のものであれば、そもそも色がないと考えてもいい。そして、ステップS1313では、色彩情報(S情報)が予め定められた閾値以上である画素数と、画像サイズと、の割合を計算する。この割合が予め定められた閾値より低ければ、グレー画像と判定し(S1313−Yes)、閾値以上であれば、カラー画像と判定する(S1313−No)。
色数取得工程として、ステップS1314〜S1315では、画像の大まかな色数を取得する。ステップS1314では、画像を大まかにクラスタリングする。大まかなクラスタリング処理は基本的にクラスタリング処理と同じであるが、高速にクラスタリングして色数を求めるのが目的のため、クラスタリング処理の際に色類似度の閾値を高く設定する。ステップS1315の判定で、色数がある閾値より少ない場合(S1315−Yes)、処理はステップS1308に進められ、色数がある閾値より以上の場合(S1315−No)、処理は、ステップS1307に進められる。
ステップS1307〜S1308では、グラフィックス領域がクリップアート領域なのか線画領域なのか、グラフィックス画像の領域の種類を判定する。エッジ率が高ければ、或いは、グレー画像であれば、あるいは、色数がある閾値より少なければ、線画と判定する(S1308)。すなわち、S1306,S1313,S1315のいずれかがYesであれば、線画領域と判定する。
一方、エッジ率が高くない(S1306−No)、グレー画像でない(S1313−No)、色数がある閾値より少なくない場合(S1315−No)は、クリップアート領域と判定する。すなわち、S1306,S1313,S1315のいずれかがNoであれば、クリップアート領域と判定する。そして、ステップS1309では、クリップアート領域と線画領域の判定結果を出力する。
(第3実施形態)
第1実施形態では、再統合処理対象領域を主要色領域に再統合するための再統合処理対象領域の再処理に、色の類似度(色類似度)を用いた構成例を説明した。第3実施形態では、再統合処理対象領域の再処理に、色類似度および色彩の情報の両方を使う構成例を説明する。
図14は、本発明の実施形態2に係る線画領域色分離処理の再統合処理対象領域の再処理を説明するフローチャートである。
先ず、ステップS1401では、ラベリング処理の結果を入力する。そして、ステップS1402では、各クラスタにおいて、ラベル数がある閾値以上で、且つ、画素数がある閾値より少ないクラスタを再統合対象領域と判定する。ステップS1403では、画素数がある閾値以上のクラスタを主要色領域と判定する。
そして、ステップS1404では、各クラスタの色彩情報を取得する。この色彩情報の計算には、RGBカラー空間からHSVカラー空間への変換を用いることが可能であるが、本発明の趣旨はこの例に限定されるものではなく、他の方法により色彩情報が得られる手段も考えられる。
そして、ステップS1405では、再統合処理対象領域を主要色領域に再統合する。再統合の条件として、無彩色の再統合処理対象領域を色類似度の一番高い無彩色の主要色領域に、有彩色の再統合処理対象領域を色類似度の一番高い有彩色の主要色領域に統合する。
そして、ステップS1406では、再統合処理対象領域の再処理結果を出力する。
(第4実施形態)
第1実施形態では、線画領域の色分離処理に、クラスタリング処理、クラスタ統合処理、ラベリング処理、そして、再統合対象領域の再処理の流れで処理を説明した。第4実施形態では、更に微小領域を適切に無くすための改良の処理を説明する。
図15は、第4実施形態に係る線画領域色分離処理を説明するフローチャートである。まず、ステップS1501において、処理対象となるカラー線画画像を入力する。
そして、ステップS1502では、クラスタリング処理を行う。そして、ステップS1503では、クラスタ統合処理を行う。そして、ステップS1504では、ラベリング処理を行う。そして、ステップS1505では、上記のラベリング処理の連結情報に基づき、再統合が必要な領域の再統合処理を行う。
そして、ステップS1506では、微小領域の再処理を行う。この処理では、上記の再統合対象領域の再処理の結果からラベリング処理により各ラベル領域にある画素数がある閾値より少なければ、微小領域とする。そして、この微小領域にある全ての画素を周囲領域の中から、色類似度の一番高い領域に再配分させる。そして、ステップS1507では、各色領域の2値画像を出力する。
(第5実施形態)
第1乃至第4実施形態では、入力画像が領域分離された後に、文字・写真・表のいずれでもないグラフィックス領域からクリップアート領域か線画領域かの判定を行った。そして、その判定により線画と判定された領域を線画の色分離処理、線画のベクトル化処理をし、クリップアートと判定された領域をクリップアート領域分割、クリップアートのベクトル化処理をする構成例を説明した。
第5実施形態では、線画の属性を有する領域の色分離処理の適用例を説明する。
図16は、第5実施形態に係る線画のベクトル化処理ための色分離処理を行う機能を有する画像処理装置の構成を示すブロック図である。図16において、入力部1601はスキャンによって紙情報をカラー画像として入力する。領域分離部1602はカラー画像から文字領域や写真等を含む複数種類の領域に分離する。線画領域抽出部1603は分離されたそれぞれの領域から線画領域を抽出する。線画領域色分離部1604は線画領域を色成分に分ける。線画領域ベクトル変換部1605は線画領域の色分離結果をベクトルデータに変換する。ベクトルデータ出力部1606は線画領域ベクトル変換部1605の出力結果を出力する。
図17は、第5実施形態にかかる線画のベクトル化処理の流れを説明するためのフローチャートである。
まず、入力部1601において、スキャナより紙情報を入力し、カラー文書画像データを得る(ステップS1701)。次に、領域分離部1602において、入力されたカラー文書画像を二値データに変換し、この二値画像データを文字、写真、表等の複数種類の領域に分離する(ステップS1702)。さらに、線画領域抽出部1603において、前工程で分離された領域から属性が線画である領域を処理対象として選択する(ステップS1703)。例えば、ユーザに線画領域を指定させ、当該指定された領域を線画領域として選択する。
次に、線画領域色分離部1604において、各画素の色特徴及び各領域の連結等の情報に基づき各色領域に分ける(ステップS1704)。そして、線画領域ベクトル変換部1605において、分離された各色領域毎にベクトルデータに変換する(ステップS1705)。次に、ベクトルデータ出力部1606において、ベクトル化の結果を出力する(ステップS1706)。
線画領域の色分離処理、また、線画領域の色分離処理に係る再統合対象領域の再処理は、第1実施形態、第3実施形態、第4実施形態のいずれかを用いることが可能である。
以上説明したように本実施形態によれば、前述した線画領域の色分離処理(クラスタの再統合処理)を、他の手法によって決定された線画領域に適用することが可能になる。
本実施形態によれば、ベクトル化手法を自動的に切り替えることにより、文書画像の処理効率や画質の向上が可能になる。
あるいは、本実施形態によれば、カラー線画の特徴に合った色分離処理ができ、それによりカラー線画のベクトル化結果が改善され、文書画像の圧縮性や再利用性を向上させることが可能になる。
(第6実施形態)
図18は、本発明の実施形態にかかる画像処理装置の構成を示すブロック図である。画像処理装置は、クリップアート領域と線画領域の自動判定によりベクトル化処理の自動切り替え処理及びカラー線画のベクトル化処理ための色分離処理を行う機能を有する。
図18において、入力部10はスキャンによって紙情報をカラー画像として入力する。領域分離部1811はカラー画像から文字領域や写真等を含む複数種類の領域に分離する。グラフィックス領域抽出部1812は分離されたそれぞれの領域から、属性が文字でもない写真でもないグラフィックス領域を抽出する。クリップアート領域・線画領域判定部1813はグラフィックス領域に含まれるクリップアート領域と線画領域を判定する。クリップアート領域ベクトル変換部1814はクリップアート領域をベクトルデータに変換する。線画領域ベクトル変換部1815は線画領域をベクトルデータに変換する。ベクトルデータ出力部1816は、クリップアート領域ベクトル変換部1814の処理結果と、線画領域ベクトル変換部1815の処理結果と、を出力することが可能である。図18に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP)の主要部構成は、第1実施形態で説明したブロック図(図2)と同様のものとなり、重複した説明を避けるため、本実施形態では、その説明を省略する。
<クリップアート領域と線画領域の自動判定によるベクトル化処理の自動切り替え処理の概要>
図19は、第6実施形態におけるクリップアート領域と線画領域の自動判定によるベクトル化処理の自動切り替え処理の概略を説明するためのフローチャートである。
まず、入力部1810において、スキャナより紙情報を入力し、カラー文書画像データを得る(ステップS1910)。次に、領域分離部1811において、入力されたカラー文書画像を二値データに変換し、この二値画像データを文字、写真、表等の複数種類の領域に分離する(ステップS1911)。尚、この領域分離処理を実現する一例として、米国特許第5,680,478号公報に記載の領域分離技術を用いることができる。尚、当該公報には、「Method and Apparatus for character recognition (Shin-Ywan Wang et aI./Canon K.K.)」が記載されている。さらに、グラフィックス領域抽出部1812において、前工程で分離された領域から属性が文字でもない写真でもないグラフィックス領域、即ち、クリップアート領域と線画領域が含まれる領域、を処理対象として選択する(ステップS1912)。
次に、クリップアート領域・線画領域判定部1813において、前工程(ステップS1912)で抽出されたグラフィックス領域はクリップアート領域なのか線画領域なのかを判定する(ステップS1913)。クリップアート領域と線画領域の判定処理は、第1実施形態で説明したステップS313、ステップS313の内容を具体的に説明する図5のフローチャートと同様の処理である。また、図5のフローチャートの背景以外の画素数の統計処理(S504)と、ステップS504の内容を具体的に説明する図6のフローチャートの内容は、第1実施形態で説明した内容と同様である。
クリップアート領域と判定されれば(S1914−Yes)、クリップアート領域ベクトル変換部1814において、色特徴に基づき画素をいくつかのクラスタ(領域)に分ける(ステップS1915)。ステップS1915の領域分割処理は、第1実施形態で説明した図8のフローチャートと同様の処理に従う。そして、分割された領域毎に輪郭線と領域内部色に基づきベクトルデータに変換する(ステップS1916)。ベクトル処理の例としては、例えば、T10024542に記載の、各色領域の境界線を取り出し、各境界線の輪郭線の追跡を行い、その座標ベクトルを選択することによりベクトル化するものが挙げられる。そして、本実施形態におけるベクトル化処理においてもこの技術を利用するものとする。
一方、線画領域と判定されれば(ステップS1914−No)、線画領域ベクトル変換部17において、線画領域のデータをベクトルデータに変換する(ステップS1918)。このベクトル処理を実現する一例としては、例えば、特許第2885999号公報に記載の、二値画像の輪郭線の追跡を行い、その座標ベクトルを選択することによりベクトル化するものが挙げられる。
次に、ベクトルデータ出力部1816において、ベクトル化の結果を出力する(ステップS1919)。
(他の実施形態)
なお、本発明の目的は、前述した実施形態の機能を実現するソフトウェアのプログラムコードを記録したコンピュータ可読の記憶媒体を、システムあるいは装置に供給することによっても、達成されることは言うまでもない。また、システムあるいは装置のコンピュータ(またはCPUやMPU)が記憶媒体に格納されたプログラムコードを読出し実行することによっても、達成されることは言うまでもない。
この場合、記憶媒体から読出されたプログラムコード自体が前述した実施形態の機能を実現することになり、そのプログラムコードを記憶した記憶媒体は本発明を構成することになる。
プログラムコードを供給するための記憶媒体としては、例えば、フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、CD−ROM、CD−R、不揮発性のメモリカード、ROMなどを用いることができる。
また、コンピュータが読出したプログラムコードを実行することにより、前述した実施形態の機能が実現される。また、プログラムコードの指示に基づき、コンピュータ上で稼働しているOS(オペレーティングシステム)などが実際の処理の一部または全部を行い、その処理によって前述した実施形態が実現される場合も含まれることは言うまでもない。
本発明の第1実施形態に係る画像処理装置の機能構成を示すブロック図である。 図1に示す画像処理装置を実現したディジタル複合機(MFP)の主要部構成を例示するブロック図である。 クリップアート領域と線画領域の自動判定によりベクトル化処理の自動切り替え処理の概略を説明するためのフローチャートである。 入力画像の領域分離の結果からクリップアート領域と線画領域を含むグラフィックス領域を分離した例を示す図である。 クリップアート領域と線画領域の判定処理を説明するためのフローチャートである。 クリップアート領域と線画領域の判定処理に使われている背景以外の画素数の統計処理を説明するためのフローチャートである。 クリップアート領域と線画領域の判定処理に使われている背景領域同定処理の例を示す図である。 クリップアート領域の分割処理を説明するフローチャートである。 線画領域の色分離処理を説明するフローチャートである。 線画領域の再統合処理対象領域の再処理を説明するフローチャートである。 線画領域の色分離処理(再統合処理対象領域の再処理前)の例を示す図である。 線画領域の色分離処理(再統合処理対象領域の再処理後)の例を示す図である。 第2実施形態の画像処理においてクリップアート領域と線画領域の判定処理を説明するためのフローチャートである。 第3実施形態の画像処理において線画領域色分離処理の再統合処理対象領域の再処理を説明するフローチャートである。 第4実施形態による画像処理において線画領域色分離処理を説明するフローチャートである。 第5実施形態の線画のベクトル化処理ための色分離処理を行う機能を有する画像処理装置の構成を示すブロック図である。 第5実施形態の線画のベクトル化処理の概略を説明するためのフローチャートである。 第6の実施形態に係る画像処理装置の機能構成を示すブロック図である。 第6実施形態におけるクリップアート領域と線画領域の自動判定によりベクトル化処理の自動切り替え処理の概略を説明するためのフローチャートである。
符号の説明
10 入力部
11 領域分離部
12 グラフィックス領域抽出部
13 クリップアート領域・線画領域判定部
14 クリップアート領域分割部
15 クリップアート領域ベクトル変換部
16 線画領域色分離部
17 線画領域ベクトル変換部
18 出力部

Claims (10)

  1. 入力された文書画像データから、前記文書画像データに含まれるデータの属性を判定し、当該属性ごとの領域に前記文書画像データを分離する分離手段と、
    前記分離手段で分離された領域のうち、前記属性が文字、写真、表のいずれでもない属性の領域を、グラフィックス領域として抽出する抽出手段と、
    前記抽出手段で抽出された前記グラフィックス領域内の各画素のエッジ強度を求め、当該求めたエッジ強度が予め定められた第1の閾値よりも高い画素の数をカウントするエッジ画素数カウント手段と、
    前記抽出手段で抽出された前記グラフィックス領域を構成する各画素が有する色情報に基づいて色ごとのクラスタに分け、該グラフィックス領域の四辺にある画素が属する各クラスタの出現頻度をカウントし、最も出現頻度の高いクラスタを背景として同定し、当該背景として同定されたクラスタ以外のクラスタに属する画素の数をカウントする背景以外画素数カウント手段と、
    前記エッジ画素数カウント手段でカウントされた画素の数と、前記背景以外画素数カウント手段でカウントされた画素の数との割合をエッジ率として計算するエッジ率計算手段と、
    前記エッジ率計算手段で計算された前記エッジ率が予め定められた第2の閾値より高い場合は前記グラフィックス領域を線画により構成される線画領域であると判定し、前記エッジ率が前記第2の閾値以下である場合は前記グラフィックス領域をクリップアート領域であると判定する判定手段と、
    前記判定手段で前記クリップアート領域であると判定された場合は当該グラフィックス領域に対してクリップアート領域に適したベクトル化処理を行い、前記判定手段で前記線画領域であると判定された場合は当該グラフィックス領域に対して線画領域に適したベクトル化処理を行うベクトル変換手段と、
    を備えることを特徴とする画像処理装置。
  2. 前記ベクトル変換手段は、
    前記クリップアート領域を色ごとのクラスタに分け、各クラスタの輪郭線と各クラスタの内部色とに基づいてベクトルデータに変換することによって、前記クリップアート領域に適したベクトル化処理を行うクリップアート領域ベクトル変換手段と、
    前記線画領域を色ごとのクラスタに分け、各クラスタの2値画像に基づいてベクトルデータに変換することによって、前記線画領域に適したベクトル化処理を行う線画領域ベクトル変換手段と、を含むことを特徴とする請求項1に記載の画像処理装置。
  3. 前記クリップアート領域ベクトル変換手段は、
    前記クリップアート領域の画素が有する色の類似度により、前記クリップアート領域を前記クラスタに分離するクラスタリング処理手段と、
    前記クラスタを代表となる色の類似度により統合するクラスタ統合手段と、
    前記統合されたクラスタに含まれる画素数が、予め定められた閾値より小さい場合、当該クラスタをノイズ領域として除去するノイズ除去手段と
    記ノイズ領域が除去された後の各クラスタの輪郭線と各クラスタの内部色とに基づいてベクトルデータに変換することによって、前記クリップアート領域に適したベクトル化処理を行うベクトル化手段と、
    を含むことを特徴とする請求項2に記載の画像処理装置。
  4. 前記線画領域ベクトル変換手段は、
    前記線画領域の画素が有する特徴情報に基づいて、前記線画領域を複数のクラスタに分離するクラスタリング処理手段と、
    前記複数のクラスタそれぞれの特徴情報の類似度に基づき、類似度の高いクラスタを統合するクラスタ統合手段と、
    前記クラスタ統合手段で統合した後の各クラスタに含まれる連結領域の数を求めるラベリング処理手段と、
    前記連結領域の数が予め定められた閾値以上で、かつ、前記クラスタに含まれる画素数が予め定められた閾値より少ないクラスタを、更なる統合が必要な再統合対象クラスタとして判定する再統合処理対象判定手段と、
    前記クラスタに含まれる画素数が予め定められた閾値以上のクラスタを、主要色クラスタとして判定する主要色領域判定手段と、
    各クラスタの特徴情報に基づき、前記再統合対象クラスタを前記主要色クラスタのいずれかに統合する再統合手段と
    記再統合手段により統合された後の各クラスタの2値画像に基づいてベクトルデータに変換することによって、前記線画領域に適したベクトル化処理を行うベクトル化手段と、
    を含むことを特徴とする請求項2に記載の画像処理装置。
  5. 分離手段、抽出手段、エッジ画素数カウント手段、背景以外画素数カウント手段、エッジ率計算手段、判定手段、及びベクトル変換手段を有する画像処理装置における画像処理方法であって、
    前記分離手段が、入力された文書画像データから、前記文書画像データに含まれるデータの属性を判定し、当該属性ごとの領域に前記文書画像データを分離する分離工程と、
    前記抽出手段が、前記分離工程で分離された領域のうち、前記属性が文字、写真、表のいずれでもない属性の領域を、グラフィックス領域として抽出する抽出工程と、
    前記エッジ画素数カウント手段が、前記抽出工程で抽出された前記グラフィックス領域内の各画素のエッジ強度を求め、当該求めたエッジ強度が予め定められた第1の閾値よりも高い画素の数をカウントするエッジ画素数カウント工程と、
    前記背景以外画素数カウント手段が、前記抽出工程で抽出された前記グラフィックス領域を構成する各画素が有する色情報に基づいて色ごとのクラスタに分け、該グラフィックス領域の四辺にある画素が属する各クラスタの出現頻度をカウントし、最も出現頻度の高いクラスタを背景として同定し、当該背景として同定されたクラスタ以外のクラスタに属する画素の数をカウントする背景以外画素数カウント工程と、
    前記エッジ率計算手段が、前記エッジ画素数カウント工程でカウントされた画素の数と、前記背景以外画素数カウント工程でカウントされた画素の数との割合をエッジ率として計算するエッジ率計算工程と、
    前記エッジ率計算工程で計算された前記エッジ率が予め定められた第2の閾値より高い場合は前記グラフィックス領域を線画により構成される線画領域であると判定し、前記エッジ率が前記第2の閾値以下である場合は前記グラフィックス領域をクリップアート領域であると、判定手段が判定する判定工程と、
    前記ベクトル変換手段が、前記判定工程で前記クリップアート領域であると判定された場合は当該グラフィックス領域に対してクリップアート領域に適したベクトル化処理を行い、前記判定工程で前記線画領域であると判定された場合は当該グラフィックス領域に対して線画領域に適したベクトル化処理を行うベクトル変換工程と、
    を有することを特徴とする画像処理方法。
  6. 前記ベクトル変換工程は、
    前記クリップアート領域を色ごとのクラスタに分け、各クラスタの輪郭線と各クラスタの内部色とに基づいてベクトルデータに変換することによって、前記クリップアート領域に適したベクトル化処理を行うクリップアート領域ベクトル変換工程と、
    前記線画領域を色ごとのクラスタに分け、各クラスタの2値画像に基づいてベクトルデータに変換することによって、前記線画領域に適したベクトル化処理を行う線画領域ベクトル変換工程と、を有することを特徴とする請求項に記載の画像処理方法。
  7. 前記クリップアート領域ベクトル変換工程は、
    前記クリップアート領域の画素が有する特徴情報の類似度により、前記クリップアート領域を前記クラスタに分離するクラスタリング処理工程と、
    前記クラスタを代表する特徴情報の類似度に基づき、類似度の高いクラスタを1つのクラスタに統合するクラスタ統合工程と、
    前記統合されたクラスタに含まれる画素数が、予め定められた閾値より小さい場合、当該クラスタをノイズ領域として除去するノイズ除去工程と
    記ノイズ領域が除去された後の各クラスタの輪郭線と各クラスタの内部色とに基づいてベクトルデータに変換することによって、前記クリップアート領域に適したベクトル化処理を行うベクトル化工程と、
    を有することを特徴とする請求項に記載の画像処理方法。
  8. 前記線画領域ベクトル変換工程は、
    前記線画領域の画素が有する特徴情報に基づいて、前記線画領域を複数のクラスタに分離するクラスタリング処理工程と、
    前記複数のクラスタそれぞれの特徴情報の類似度に基づき、類似度の高いクラスタを統合するクラスタ統合工程と、
    前記クラスタ統合工程で統合された後の各クラスタに含まれる連結領域の数を求めるラベリング処理工程と、
    前記連結領域の数が予め定められた閾値以上で、かつ、前記クラスタに含まれる画素数が予め定められた閾値より少ないクラスタを、更なる統合が必要な再統合対象クラスタとして判定する再統合処理対象判定工程と、
    前記クラスタに含まれる画素数が予め定められた閾値以上のクラスタを主要色クラスタとして判定する主要色領域判定工程と、
    各クラスタの特徴情報に基づき、前記再統合対象クラスタを前記主要色クラスタのいずれかに統合する再統合工程と
    記再統合工程により統合された後の各クラスタの2値画像に基づいてベクトルデータに変換することによって、前記線画領域に適したベクトル化処理を行うベクトル化工程と、
    を有することを特徴とする請求項に記載の画像処理方法。
  9. コンピュータに、請求項乃至のいずれか1項に記載の画像処理方法を実行させるプログラム。
  10. 請求項に記載のプログラムを格納したコンピュータ可読の記憶媒体。
JP2008143617A 2008-05-30 2008-05-30 画像処理装置、画像処理方法、プログラム、及び記憶媒体 Expired - Fee Related JP5028337B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008143617A JP5028337B2 (ja) 2008-05-30 2008-05-30 画像処理装置、画像処理方法、プログラム、及び記憶媒体
US12/474,082 US8396298B2 (en) 2008-05-30 2009-05-28 Image processing apparatus, image processing method, and storage medium with vectorization process for data from graphic areas

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008143617A JP5028337B2 (ja) 2008-05-30 2008-05-30 画像処理装置、画像処理方法、プログラム、及び記憶媒体

Publications (2)

Publication Number Publication Date
JP2009290780A JP2009290780A (ja) 2009-12-10
JP5028337B2 true JP5028337B2 (ja) 2012-09-19

Family

ID=41379884

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008143617A Expired - Fee Related JP5028337B2 (ja) 2008-05-30 2008-05-30 画像処理装置、画像処理方法、プログラム、及び記憶媒体

Country Status (2)

Country Link
US (1) US8396298B2 (ja)
JP (1) JP5028337B2 (ja)

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5067501B2 (ja) * 2009-02-23 2012-11-07 富士通株式会社 多色ベクトル画像処理装置および方法
TWI498786B (zh) * 2009-08-24 2015-09-01 Semiconductor Energy Lab 觸控感應器及其驅動方法與顯示裝置
JP5549286B2 (ja) * 2010-03-10 2014-07-16 富士ゼロックス株式会社 画像処理装置及び画像処理プログラム
US8933962B2 (en) 2010-11-15 2015-01-13 Microsoft Corporation Clipart cartoon techniques
JP5776419B2 (ja) 2011-07-29 2015-09-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5853470B2 (ja) * 2011-07-29 2016-02-09 ブラザー工業株式会社 画像処理装置、画像処理プラグラム
JP5796392B2 (ja) * 2011-07-29 2015-10-21 ブラザー工業株式会社 画像処理装置、および、コンピュータプラグラム
JP5842441B2 (ja) 2011-07-29 2016-01-13 ブラザー工業株式会社 画像処理装置およびプログラム
US9264689B2 (en) * 2011-08-04 2016-02-16 Semiconductor Components Industries, Llc Systems and methods for color compensation in multi-view video
JP6167525B2 (ja) * 2012-03-21 2017-07-26 株式会社リコー 距離計測装置及び車両
JP5846011B2 (ja) * 2012-03-30 2016-01-20 ブラザー工業株式会社 画像処理装置およびプログラム
JP5974589B2 (ja) * 2012-03-30 2016-08-23 ブラザー工業株式会社 画像処理装置およびプログラム
JP5945487B2 (ja) * 2012-09-27 2016-07-05 株式会社沖データ 画像処理装置、プログラム及び方法
EP2966433B1 (en) * 2013-03-08 2023-04-26 Shimadzu Corporation Device for setting region of interest for analysis
US9520102B2 (en) * 2013-04-29 2016-12-13 International Business Machines Corporation Text extraction from graphical user interface content
US9740995B2 (en) * 2013-10-28 2017-08-22 Morningstar, Inc. Coordinate-based document processing and data entry system and method
CN104835134B (zh) * 2014-02-11 2018-01-02 阿里巴巴集团控股有限公司 一种计算商品图像牛皮癣分值的方法和装置
CN110659717B (zh) * 2018-07-12 2023-07-04 赛业(广州)生物科技有限公司 一种智能识别染色体数量的方法及系统
GB2577989B (en) * 2018-09-30 2021-03-24 Lenovo Beijing Co Ltd Information processing method and electronic device
CN111062993B (zh) * 2019-12-12 2023-09-26 广东智媒云图科技股份有限公司 色彩合并的作画图像处理方法、装置、设备及存储介质
CN113742288A (zh) * 2020-05-29 2021-12-03 伊姆西Ip控股有限责任公司 用于数据索引的方法、电子设备和计算机程序产品
US11573752B1 (en) * 2021-10-08 2023-02-07 Kyocera Document Solutions Inc. Image processing apparatus, image forming apparatus, and image forming method that perform compression suitable for the stage of image processing

Family Cites Families (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4759075A (en) * 1983-03-14 1988-07-19 Ana Tech Corporation Method and apparatus for vectorizing documents and symbol recognition
US4817187A (en) * 1987-02-19 1989-03-28 Gtx Corporation Apparatus and method for vectorization of incoming scanned image data
JP2823882B2 (ja) * 1989-04-03 1998-11-11 株式会社リコー 線画像ベクトル化方法
JPH05159050A (ja) * 1991-12-09 1993-06-25 Hitachi Ltd 代表色選択方法
JP3049672B2 (ja) * 1991-12-26 2000-06-05 キヤノン株式会社 画像処理方法及び装置
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JP2885999B2 (ja) 1992-07-29 1999-04-26 キヤノン株式会社 画像処理装置及びその方法
DE69332283D1 (de) * 1992-06-11 2002-10-17 Canon Kk Verfahren und Einrichtung zur Bildverarbeitung
JP3466034B2 (ja) * 1996-12-27 2003-11-10 富士通株式会社 半導体記憶装置
JPH1169145A (ja) 1997-08-19 1999-03-09 Canon Inc 画像処理装置及び画像処理方法
JP2002222419A (ja) * 2001-01-29 2002-08-09 Olympus Optical Co Ltd 画像領域分割装置及びその方法ならびに処理プログラムが記録された記録媒体
JP4756436B2 (ja) * 2001-07-03 2011-08-24 日本電気株式会社 パターン認識装置とそのパターン認識方法、及びパターン認識プログラム
US20030142344A1 (en) * 2002-01-31 2003-07-31 Jennifer Geske System and method for electronically monitoring the content of print data
JP3950777B2 (ja) * 2002-09-30 2007-08-01 キヤノン株式会社 画像処理方法、画像処理装置および画像処理プログラム
JP4251629B2 (ja) * 2003-01-31 2009-04-08 キヤノン株式会社 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US7391917B2 (en) * 2003-02-13 2008-06-24 Canon Kabushiki Kaisha Image processing method
JP4312524B2 (ja) * 2003-07-09 2009-08-12 株式会社セルシス マンガの線画像成形方法、装置およびコンピュータプログラム
JP4266784B2 (ja) * 2003-11-14 2009-05-20 キヤノン株式会社 画像処理システム及び画像処理方法
JP2005190010A (ja) * 2003-12-24 2005-07-14 Fuji Xerox Co Ltd 画像処理装置
JP2006091980A (ja) * 2004-09-21 2006-04-06 Seiko Epson Corp 画像処理装置、画像処理方法および画像処理プログラム
JP2006093810A (ja) * 2004-09-21 2006-04-06 Seiko Epson Corp 画像読取装置、画像読取方法、画像読取プログラム、複写装置、複写装置の制御方法、複写装置の制御プログラム
JP2006270589A (ja) * 2005-03-24 2006-10-05 Fuji Xerox Co Ltd 情報処理装置、情報処理方法、プログラムおよび記録媒体
JP4584771B2 (ja) * 2005-05-27 2010-11-24 株式会社リコー 画像処理装置
JP4766661B2 (ja) * 2005-06-09 2011-09-07 キヤノン株式会社 画像処理方法及び画像処理装置
US7623712B2 (en) * 2005-06-09 2009-11-24 Canon Kabushiki Kaisha Image processing method and apparatus
JP4632443B2 (ja) * 2005-12-05 2011-02-16 キヤノン株式会社 画像処理装置及び画像処理方法並びにプログラム
JP2007109178A (ja) * 2005-10-17 2007-04-26 Canon Inc 画像処理装置及びその制御方法、プログラム
JP4936045B2 (ja) * 2006-04-06 2012-05-23 住友電気工業株式会社 車体色判別装置、方法及びプログラム
JP4928313B2 (ja) * 2006-04-17 2012-05-09 キヤノン株式会社 画像処理装置および画像処理方法
US20080002864A1 (en) * 2006-06-29 2008-01-03 Eastman Kodak Company Using background for searching image collections
JP4747970B2 (ja) * 2006-07-04 2011-08-17 オムロン株式会社 画像処理装置
JP5058575B2 (ja) 2006-12-12 2012-10-24 キヤノン株式会社 画像処理装置及びその制御方法、プログラム

Also Published As

Publication number Publication date
US20090297024A1 (en) 2009-12-03
JP2009290780A (ja) 2009-12-10
US8396298B2 (en) 2013-03-12

Similar Documents

Publication Publication Date Title
JP5028337B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP5047051B2 (ja) 画像処理装置及び画像符号化方法
JP5302768B2 (ja) 画像処理装置及び画像処理方法
JP4766661B2 (ja) 画像処理方法及び画像処理装置
US7623712B2 (en) Image processing method and apparatus
US8023147B2 (en) Image processing method and image processing apparatus
JP5219706B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
US20090316213A1 (en) System and method of improving image quality in digital image scanning and printing by reducing noise in output image data
US8224073B2 (en) System and method for efficient storage of MRC images for easy classification and retrieval
JP5049920B2 (ja) 画像処理装置及び画像処理方法
JP5645612B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
JP5049921B2 (ja) 画像処理装置及び画像処理方法
US8810877B2 (en) Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image
JP4739082B2 (ja) 画像処理方法及び画像処理装置
JP2010146218A (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4748789B2 (ja) 画像処理方法及び画像処理装置
JP2008147712A (ja) 画像処理装置および画像処理方法
JP2006262258A (ja) 画像処理装置、画像処理方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110530

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120305

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120309

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120508

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120528

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120625

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150629

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5028337

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees