JP5178490B2 - 画像処理装置、画像処理方法、コンピュータプログラム - Google Patents

画像処理装置、画像処理方法、コンピュータプログラム Download PDF

Info

Publication number
JP5178490B2
JP5178490B2 JP2008321625A JP2008321625A JP5178490B2 JP 5178490 B2 JP5178490 B2 JP 5178490B2 JP 2008321625 A JP2008321625 A JP 2008321625A JP 2008321625 A JP2008321625 A JP 2008321625A JP 5178490 B2 JP5178490 B2 JP 5178490B2
Authority
JP
Japan
Prior art keywords
image
color
graphics
processing target
areas
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2008321625A
Other languages
English (en)
Other versions
JP2010146218A (ja
Inventor
暁艶 戴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008321625A priority Critical patent/JP5178490B2/ja
Priority to US12/639,891 priority patent/US8363934B2/en
Publication of JP2010146218A publication Critical patent/JP2010146218A/ja
Application granted granted Critical
Publication of JP5178490B2 publication Critical patent/JP5178490B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/60Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using transform coding
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/12Selection from among a plurality of transforms or standards, e.g. selection between discrete cosine transform [DCT] and sub-band transform or selection between H.263 and H.264
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/186Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being a colour or a chrominance component

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Theoretical Computer Science (AREA)
  • Discrete Mathematics (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)

Description

本発明は、カラー文書画像を処理する画像処理装置及び画像処理方法に関するものである。
近年、情報の電子化が進み、紙文書をスキャナ等によりスキャンして電子化して保存したり、その電子データを他装置に送信したりするシステムが普及してきている。そのようなシステムにおいて、送信コストを削減するため、電子化された文書に対して高い圧縮性が要求されている。ところが、文書画像に文字領域や写真領域が混在する場合は、文字領域に適した圧縮を行うと画質が良いが圧縮率が低くなり、写真領域に適した圧縮を行うと圧縮率が高いが文字が劣化してしまう問題がある。また、電子データは、部分的に編集できる再利用性と、拡大しても縮小しても画質が落ちない高画質性とを有するものが望まれている。
これに対し、特許文献1では、電子化された文書画像を文字領域や写真領域に分離し、再利用性と高画質性が重視されている文字領域をベクトルデータに変換し、それ以外の簡易にベクトル化で再現できない写真領域等をJPEG圧縮する。そして、各領域から得たベクトルデータや圧縮データを合成して出力することにより、文書画像の高圧縮性、再利用性、高画質性を実現する手法を提案している。
特許文献1では、文字・線・線画・表の属性を有する領域をベクトルデータに変換していた。さらに、本出願人は特許文献2において、ベクトル処理対象を拡大し、画像内のオブジェクトの輪郭が明瞭(すなわち、色の境界が明確)で、出現色も限られている等の特徴を有する画像(イラストなどの画像)もベクトル化する手法を提案している。以下の本明細書では、そのようなベクトル化処理に適した特徴を有する画像(イラストなどの画像)を、「グラフィックス」(または「グラフィック画像」)と呼ぶこととする。なお、特許文献2では、そのようなグラフィック画像を色の類似度により色領域に分割し、各色領域の輪郭をアウトライン法で近似し、色情報を加えてベクトルデータを出力している。
一方、写真領域とイラストなどのグラフィックスは、似た特性を有することが多いため、文書画像から、写真領域とグラフィックスを正確に判別するのは難しく、写真領域をグラフィックスと誤判定する場合があった。グラフィックスと誤判定された写真領域をベクトル化した場合、画質や圧縮率が低下する等の問題点がある。
特開2004−265384号公報 特開2006−344069号公報
本発明は従来技術の有する問題点を鑑みなされたものであり、処理対象画像が、グラフィックスか否かの判定精度を向上させることを目的とする。
上記課題を解決するために、本発明の画像処理装置は、処理対象画像を色領域に分割する色領域分割手段と、前記分割された各色領域における連結領域に関する情報を取得する連結情報取得手段と、前記連結情報取得手段で取得した情報に基づいて、前記処理対象画像がグラフィックスであるか否かを判定する判定手段と、を備え、前記連結情報取得手段で取得する情報は、前記分割された各色領域における連結領域の数を含むことを特徴とする。
本発明によれば、文書画像内のグラフィックスの判定精度を向上させることができるので、写真領域をグラフィックスとして誤判定する可能性が低くなる。したがって、グラフィックスをベクトル化処理対象とし、写真領域をベクトル化処理対象としないことで、文書画像の圧縮性も画質も向上させることができる。
(実施例1)
以下、図面を参照して、本発明に係る画像処理装置を用いたグラフィックス・写真の判定処理について、詳細に説明する。
図1は、本発明の実施形態1に係るベクトル化処理内部でのグラフィックス・写真の判定処理、判定結果によりベクトル化するか圧縮するかを切り替える機能を有する画像処理装置の構成を示すブロック図である。画像入力部10は処理対象の画像を入力する。なお、画像入力部10は、文書をスキャンして画像入力するスキャナであってもよいし、処理対象の画像を受信するインターフェースであってもよい。また、入力される画像は、従来の領域分割処理で分割された領域のうち、文字・線画・線・表と判定された領域以外の領域を、処理対象画像として入力されるように構成してもよい。色領域分割部11は、入力された処理対象画像を色ごとの領域(色領域)に分ける色領域分割処理を行う。連結情報取得部12は、各色領域を構成する連結画素の識別(ラベリング処理)を行い、連結画素に関する情報(連結情報)を獲得する。グラフィックス・写真判定部13は、連結情報に基づき、処理対象画像がグラフィックスか写真かを判定する。グラフィックスの微小領域再処理部14は、グラフィックスと判定された画像において、スキャンや圧縮により発生したノイズ領域を再処理する。グラフィックスのベクトル変換部15は、ノイズを除去した色領域をベクトル化する。写真の圧縮部16は、写真と判定された画像領域をJPEG等で圧縮する。出力部17は処理結果を1つのファイル(例えばXML形式のファイル)にまとめるなどして出力する。
図2は、図1に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP)の主要部構成を示すブロック図である。尚、本実施形態では、画像処理装置として、スキャナ機能やプリンタ機能を有するディジタル複合機(MFP)を用いているが、汎用のスキャナとパーソナルコンピュータとを接続したシステムを当該画像処理装置として用いてもよい。
図2に示すように、MFPは、画像処理装置として機能するコントローラユニット2000を備えている。当該コントローラユニット2000は、画像入力デバイスであるスキャナ2070や画像出力デバイスであるプリンタ2095とデバイスI/F2020を介して接続する。そして、スキャナ2070で原稿画像から読み取られた画像データをプリンタ2095によって印刷出力するコピー機能を実現するための制御を行うこともできる。また、コントローラユニット2000は、LAN1006や公衆回線(WAN)1008を介して他装置との間でパターン画像やデバイス情報等の入出力を行うための制御を行う。
コントローラユニット2000は、図2に示すように、CPU2001を有している。CPU2001は、ROM2003に格納されているブートプログラムによりオペレーションシステム(OS)を立ち上げる。そして、このOS上でHDD(ハードディスクドライブ)2004に格納されているコンピュータプログラム(アプリケーションプログラム)を実行することによって、本発明の処理などの各種処理を実行する。すなわち、HDDなどのコンピュータ読み取り可能な記憶媒体に格納されたコンピュータプログラムは、コンピュータ(CPU)を図1に示した各処理部として機能させるためのプログラムである。また、このCPU2001の作業領域として、RAM2002が用いられる。RAM2002はまた、CPU2001の作業領域だけでなく、画像データを一時記憶するための画像メモリ領域をも提供する。HDD2004は、上記アプリケーションプログラムとともに、画像データを格納する。なお、本実施形態では、コンピュータがコンピュータプログラムを実行することで、図1に示した各処理を実現するものとしたが、その一部または全部を電子回路で実現するようにしても構わない。
CPU2001には、システムバス2007を介して、ROM2003やRAM2002が接続されている。さらに、CPU2001には、操作部I/F(操作部インタフェース)2006、ネットワークI/F(ネットワークインタフェース)2010、モデム2050及びイメージバスI/F(イメージバスインタフェース)2005が接続されている。
操作部I/F2006は、タッチパネルを有する操作部2012とのインタフェースであり、操作部2012に表示する画像データを操作部2012に対して出力する。また、操作部I/F2006は、操作部2012においてユーザにより入力された指示情報をCPU2001に送出する。
また、ネットワークI/F2010は、LAN1006に接続され、当該LAN1006を介してLAN1006に接続された各装置との間で情報の入出力を行う。モデム2050は、公衆回線(WAN)1008に接続し、公衆回線1008を介して他装置との間で情報の入出力を行う。
イメージバスI/F2005は、システムバス2007と画像データを高速で転送する画像バス2008を接続し、データ構造を変換するためのバスブリッジである。画像バス2008は、PCIバス又はIEEE1394から構成される。画像バス2008には、ラスタイメージプロセッサ(RIP)2060、デバイスI/F2020、スキャナ画像処理部2080、プリンタ画像処理部2090、画像回転部2030、サムネイル作成部2035及び画像圧縮部2040が接続されている。
RIP2060は、PDLコードをビットマップイメージに展開するプロセッサである。デバイスI/F2020には、スキャナ2070及びプリンタ2095が接続され、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部2080は、入力画像データに対して補正、加工、編集処理を行う。プリンタ画像処理部2090は、プリント出力画像データに対してプリント時の補正、解像度変換等を行う。画像回転部2030は、画像データの回転を行う。画像圧縮部2040は、多値画像データをJPEGデータに、2値画像データをJBIG、MMR、MH等のデータに圧縮する機能を有し、また、それらのデータの伸長処理を行う機能も有する。
<ベクトル化処理と圧縮処理の切り替え>
図3は、グラフィックス・写真の判定結果によりベクトル化処理と圧縮処理との切り替え処理が行われることの概要を説明するためのフローチャートである。本実施形態では、CPU2001がコンピュータプログラムを実行すると、図3に示すフローチャートに沿った処理が行われて、図1に示した各機能ブロック図を実現することになる。すなわち、図3のステップS10の処理は、図1の入力部10で行われる処理に対応する。また、図3のステップS11の処理は、図1の色領域分割部11で行われる処理に対応する。また、図3のステップS12の処理は、図1の連結情報取得部12で行われる処理に対応する。また、図3のステップS13の処理は、図1のグラフィックス・写真判定部13で行われる処理に対応する。また、図3のステップS15の処理は、図1のグラフィックスの微小領域再処理部14で行われる処理に対応する。また、図3のステップS16の処理は、図1のグラフィックスのベクトル変換部15で行われる処理に対応する。また、図3のステップS17の処理は、図1の写真の圧縮部16で行われる処理に対応する。また、図3のステップS18の処理は、図1の出力部17で行われる処理に対応する。以下、図3に沿って処理を説明する。
先ず、ステップS10では、処理対象の画像を入力する。入力画像には、写真のような画像もあれば、グラフィック画像もある。
次に、ステップS11では、入力された画像を、色ごとの領域(色領域)に分割する色領域分割を行う。本実施例では、クラスタリング処理により画像の色領域分割を実現する。このクラスタリング処理の詳細については後述する。
次に、ステップS12では、前工程で得られたクラスタリングの結果に基づき、各クラスタのラベル数や画素数といったクラスタに関する情報(連結情報)を求める。この連結情報取得処理について例を挙げて後述する。
次に、ステップS13では、前工程で得られた各クラスタのラベル数及び画素数に基づき、グラフィックスか写真かを判定する。このグラフィックス・写真の判定処理の詳細についても後述する。ステップS14では、ステップS13の判定処理によりグラフィックスと判定されたか写真と判定されたかを判断し、グラフィックスと判定された場合はステップS15に進み、写真と判定された場合はステップS17に進む。
ステップS15では、グラフィックスと判定された画像内に存在するノイズ領域(微小領域)を見つけ、再処理を行う。そして、ステップS16では、ノイズが再処理された(ノイズ除去された)各色領域をベクトルデータに変換するベクトル化処理を実行する。この抽出された領域に対するベクトル化処理は、公知の技術を応用することが可能であり、例えば、特許第2885999号公報に記載の、2値画像の輪郭線の追跡を行い、その座標ベクトルを選択することによりベクトル化するものが挙げられる。
ステップS17では、写真と判定された領域についてJPEG等で圧縮する。
ステップS18では、ステップS16における画像のベクトル化処理の結果、或いは、ステップS17における画像の圧縮処理の結果を出力する。なお、文書画像から抽出した複数の部分領域を処理対象画像とした場合は、それぞれの領域についてベクトル化処理または圧縮処理を行った後、それらのデータを1つのファイルにまとめて出力するようにしてもよい。
<入力画像の例>
図4の画像4a,4bは、入力画像の一例を示す図である。入力画像は、前述したように、写真画像4aもあれば、グラフィック画像4bもある。ここで例にしたのは単なる画像であるが、文書画像を文字・線画・線・表・写真・グラフィックスなどの領域に分離し、分離された領域のうち、文字・線画・線・表の領域以外の領域を入力画像として用いることも可能である。なお、入力画像は、カラー画像もしくはグレー画像であるとする。
<クラスタリング処理>
画像のクラスタリング処理について説明する。入力画像の各画素をラスタスキャンし、各画素がどのクラスタに属するか判定していくことにより、クラスタリング処理が行われる。
先ず、入力画像のラスタスキャンしたスタートの画素を、最初のクラスタとして生成する。そして、次の処理対象の画素に対して、生成済みの全てのクラスタ間との、色の類似度を求める。すなわち、処理対象の画素の色と各クラスタの色との比較を行って、各クラスタに対する類似度を算出する。なお、クラスタの色は、例えば、当該クラスタに属している画素の色の平均値と色空間での分散とに基づいて、該クラスタに属する色の範囲を求めるようにしてもよい。類似度が高いほど、画素とクラスタとの特徴が近いと考えられる。ここでは、類似度の計算にRGB値を用いるが、他の色空間の情報、或いは、カラー以外の情報を特徴量としても使える。そして、一番高い類似度とこの類似度に対応したクラスタ番号を記録し、この類似度を事前に設定された閾値とを比較する。類似度が該閾値以上であれば、対象画素を記録されたクラスタに属させる。類似度が該閾値より低ければ、対象画素により新たなクラスタを生成する。この処理は全ての画素の処理が終わるまで繰り返し実行する。
次に、上述したクラスタリング処理の結果に基づき、クラスタ統合処理を行う。この処理では、まず、分離したいクラスタ数(色領域の数)の目標値を入力する。本発明では、何色くらいに分離するかの目安にする。そして、現在のクラスタの数を数える。現在のクラスタの数を領域数の目標値とを比較する。現在のクラスタ数が目標値より多ければ、クラスタの統合を行う。統合処理では、各クラスタ間の類似度を計算し、その中から一番類似度の高い二つのクラスタを一つに統合する。領域統合処理は、現在のクラスタ数が目標値以下になるまで繰り返し実行する。
<連結情報取得処理の例>
図5は、図4で例示した画像4a,4bそれぞれに対して、クラスタリング処理を行った後に、獲得した連結情報の結果例である。例では、クラスタリング処理の目標クラスタ数を12としたので、クラスタ番号1〜12の12個の色ごとのクラスタに分離したものとする。また、各クラスタに属する画素に対してラベリング処理を行って、ラベル数を求める。ラベリング処理とは、縦横斜めのいずれかで連結する画素(隣接する画素)に対して同一ラベルを付与する処理であり、離れた位置にある連結画素に対しては別のラベルが付与される。すなわち、同一ラベルが付与された画素群は1つの連結領域を形成する。そのようにして各クラスタに属する画素についてラベリング処理を行った結果に基づいて、ラベル数が求められる。すなわち、ラベル数(連結領域の数)は、同色のクラスタに属すると判断された画素において、連結領域(連結画素塊)がいくつ存在するかを示すことになる。また、各クラスタに属する画素数も求める。このようにして、処理対象画像4a,4bそれぞれについて、クラスタ番号、各クラスタにおけるラベル数、各クラスタに属する画素数を求めた結果を、図5に示している。本実施形態では、これらのクラスタ番号・ラベル数・画素数を、連結情報と呼ぶこととする。
<グラフィックス・写真の判定処理>
グラフィックス・写真の判定処理について、図6のフローチャートを参照して説明する。
先ず、ステップS130では、画像から獲得した各クラスタの画素数及びラベル数といった連結情報を入力する。
ステップS131では、各クラスタの画素数とラベル数の比率Rを計算する。本実施形態では、各クラスタに対して、R=(画素数)/(ラベル数)に基づいて比率を求めることとする。
ステップS132では、予め決めた第1の閾値以下の比率を持つクラスタがあるか見て、画像を判定する。処理対象画像に、第1の閾値以下の比率になるクラスタがあれば、ステップS133では、当該処理対象画像をグラフィックスと判定する。一方、処理対象画像に閾値以下の比率を持つクラスタがなければ、ステップS134では、当該処理対象画像を写真と判定する。なお、第1の閾値はスキャン解像度等に応じて予め設定しておけばよい。そして、ステップS135では、画像の判定結果を出力する。
<グラフィックス・写真の判定処理の例>
図5は、画像4a,4bそれぞれに対して、連結情報を獲得した後に、比率Rを求めてグラフィックス・写真の判定処理を行った場合の例を示す。ここで、例えば、第1の閾値を「3.8」とした場合、画像4aには、画素数とラベル数の比率が低いクラスタはないので、写真と判定される。一方、画像4bは、クラスタ番号3,7,8,9の、画素数とラベル数の比率が相対的に低いので、グラフィックスと判定される。
<グラフィックス・写真の判定処理の根拠>
連結情報に基づいたグラフィックス・写真の判定処理の根拠について、図7を参照して説明する。
図7の画像7a,7bは、図4の画像4a(写真画像)の一部を拡大した画像と、画像4b(グラフィックス)の一部を拡大した画像とを示している。また、画像7aと7bの部分のクラスタリング結果をそれぞれ7cと7dで示す。
写真は色数が多いが、色が滑らかに変化する特徴があるので、各色の色領域のエッジ付近にある画素も色が徐々に変化する。そのため、写真のクラスタリング処理では、エッジ付近の画素を含めて、纏まった色領域に分けられる。例えば、画像7aにおいて、色領域のエッジ部分を矢印で示すと、画像7aのクラスタリング処理の結果7cでは、エッジ付近にある画素は独立した色領域になるのではなく、近い色を有する色領域に入れられ、纏まった黄色領域と黒領域が得られている。
一方、グラフィックスは、各色領域の色がはっきり変化するので、スキャンや圧縮の影響により、色の激しい変化する所にノイズ領域が発生しやすい。このノイズ領域は、色領域のエッジ付近に存在し、隣接する色領域の中間色を持ち、隣接領域の色と十分異なる色になっていることが多い。そのため、クラスタリング処理では、ノイズの小さな領域が主な色クラスタに統合されずに、独立したクラスタと判断され、画素数とラベル数の比率が低いクラスタがいくつか出現することになる。すなわち、1ラベルあたりの画素数が小さいくラスタは、ノイズによる小領域によるクラスタであると考えられる。例えば、画像7bにおいて、色の変化箇所(エッジ部分)を矢印で示す。このとき、画像7bのクラスタリング処理の結果7dでは、近い色部分、つまり、青色領域と黒領域と黄色領域については、纏まったクラスタになるが、エッジ付近に隣接色領域の中間色領域も生成されて、別のクラスタとなっている。
本発明では、このような写真とグラフィックスの特徴に基づき、切り分け処理を行う。
<グラフィックスの微小領域の再処理>
グラフィックスと判定された画像に含まれる微小領域(ノイズと判断される領域)の再処理について説明する。先ず、画像の連結情報、即ち、各クラスタにおいて各ラベルが付与されている連結画素(ラベル領域)の画素数に基づいて、各ラベル領域はノイズ領域なのかを判定する。ラベル領域の画素数がある閾値以下であれば、当該ラベルが付与されている連結画素をノイズ領域と判定し、微小領域の再処理の対象にする。そして、微小領域の再処理対象となったノイズ領域は、当該ノイズ領域の周囲の画素が属する各クラスタ間との色類似度を計算し、一番類似度の高いクラスタに統合する。
上述したように、本実施例1によれば、処理対象画像のクラスタリング処理を行い、各クラスタのラベル数と画素数とを求め、各クラスタの連結情報(ラベル数と画素数)に基づいて、グラフィックスと写真の判定を行う。このようにして、処理対象画像が、グラフィックスであるか、写真であるかの判定を、精度よく行うことができる。
(実施例2)
実施例1は、連結情報に基づき、入力画像がグラフィックスか写真かを判定する例である。実施例2では、先ず入力画像がグラフィックスか写真かを判定し、更に、当該グラフィックスと判定された画像が、ベクトル処理に向く画像か向かない画像かを判定する。
図8は、本発明の実施形態2における画像処理装置の構成を示すブロック図である。図8において、画像入力部20は処理対象の画像を入力する。色領域分割部21は入力された処理対象画像を色ごとの領域(色領域)に分ける。連結情報取得部22は各色領域を構成する連結画素の識別(ラベリング処理)を行い、連結画素に関する情報(連結情報)を獲得する。グラフィックス・写真判定部23は連結情報に基づき、処理対象画像がグラフィックスか写真かを判定する。処理対象判定部24は、グラフィックス・写真判定部23でグラフィックスと判定された画像を、更にベクトル処理に向く画像か向かない画像かを判定する。微小領域再処理部25は、ベクトル化処理に向くグラフィックスと判定された画像において、スキャンや圧縮により発生したノイズ領域を再処理する。ベクトル変換部26はノイズを除去した色領域をベクトル化する。圧縮部27は、グラフィックス・写真判定部23で写真と判定された画像や、処理対象判定部24でベクトル化に向かないグラフィックス(例えば複雑なグラフィックス)と判定された画像を、JPEG等で圧縮する。出力部28は処理結果を出力する。
<実施例2のベクトル化処理と圧縮処理の切り替え>
図9は、本発明の実施形態2におけるベクトル化処理と圧縮処理との切り替え処理の概要を説明するためのフローチャートである。
本実施形態2では、CPU2001がコンピュータプログラムを実行すると、図9に示すフローチャートに沿った処理が行われて、図8に示した各機能ブロック図を実現することになる。すなわち、図9のステップS20の処理は、図8の画像入力部20で行われる処理に対応する。また、図9のステップS21の処理は、図8の色領域分割部21で行われる処理に対応する。また、図9のステップS22の処理は、図8の連結情報取得部22で行われる処理に対応する。また、図9のステップS23の処理は、図8のグラフィックス・写真判定部23で行われる処理に対応する。また、図9のステップS25の処理は、図8の処理対象判定部24で行われる処理に対応する。また、図9のステップS27の処理は、図8の微小領域再処理部25で行われる処理に対応する。また、図9のステップS28の処理は、図8のベクトル変換部26で行われる処理に対応する。また、図9のステップS29の処理は、図8の圧縮部27で行われる処理に対応する。また、図9のステップS30の処理は、図8の出力部28で行われる処理に対応する。以下、図9に沿って処理を説明する。
先ず、ステップS20では、処理対象の画像を入力する。入力画像には、写真のような画像もあれば、グラフィック画像もある。更に、グラフィック画像には、ベクトル化処理に向くグラフィックスもあれば、小さなサイズの色領域をたくさん含みベクトル化処理に向かないグラフィックスもある。
次に、ステップS21では、入力された画像を、色ごとの領域(色領域)に分割する処理を行う。本実施例では、クラスタリング処理により画像の色領域分割を実現する。
次に、ステップS22では、前工程で得られたクラスタリングの結果に基づき、各クラスタのラベル数や画素数といったクラスタに関する情報(連結情報)を求める。
次に、ステップS23では、前工程で得られた各クラスタのラベル数及び画素数に基づき、グラフィックスか写真かを判定する。グラフィックス・写真の判定処理は実施例1と同様である。ステップS24では、ステップS23の判定処理によりグラフィックスと判定されたか写真と判定されたかを判断し、グラフィックスと判定された場合はステップS25に進み、写真と判定された場合はステップS29に進む。
ステップS25では、グラフィックスと判定された画像をベクトル化処理に向くグラフィックスか向かないグラフィックスかを判定する。ステップS26では、ベクトル化処理に向くグラフィックスと判定された画像をベクトル化処理対象としてステップS27に進み、ベクトル処理に向かないグラフィックスと判定された画像をベクトル化処理対象外にしてステップS29に進む。この処理対象判定処理について、後述で詳細に説明する。
ステップS27では、前工程で処理対象と判定された画像内に存在するノイズ領域(微小領域)を見つけ、再処理を行う。そして、ステップS28では、ノイズが再処理された各色領域をベクトルデータに変換するベクトル化処理を実行する。
ステップS29では、ステップ23のグラフィックス・写真の判定処理により写真と判定された画像と、ステップS25でベクトル化処理に向かないグラフィックスと判定された画像とを、JPEG等で圧縮する。
ステップS30では、ステップS28における画像のベクトル化処理の結果、或いは、ステップS29における画像の圧縮処理の結果を出力する。
<グラフィックスの例>
図10の画像10a、10bは、実施形態2による画像処理において、入力グラフィック画像の一例を示す図である。入力グラフィック画像には、画像10aのように大きなサイズの色領域が多く、ベクトル化処理に向くものもあれば、画像10bのような地図などの画像は小さく細かい領域が多く、ベクトル化処理に向かないものもある。ベクトル化処理に向かない画像をベクトル化処理すると、ベクトル近似により画質が落ちるこがある。
<連結情報取得処理の例>
図11は、実施形態2の連結情報取得処理により、図10で例示した画像10a,10bそれぞれに対して、クラスタリング処理を行った後に、獲得した連結情報の結果例である。それぞれの画像に対するクラスタリング処理で、クラスタ番号1〜12の12個の色ごとのクラスタに分離したものとする。また、各クラスタに属する画素に対してラベリング処理を行って、ラベル数を求める。ラベリング処理とは、縦横斜めのいずれかで連結する画素(隣接する画素)に対して同一ラベルを付与する処理であり、離れた位置にある連結画素に対しては別のラベルが付与される。そのようにして各クラスタに属する画素についてラベリング処理を行った結果に基づいて、ラベル数が求められる。すなわち、ラベル数は、同色のクラスタに属すると判断された画素について、連結画素の塊がいくつ存在するかを示すことになる。また、各クラスタに属する画素数も求める。このようにして、処理対象画像10a,10bそれぞれについて、クラスタ番号、各クラスタにおけるラベル数、各クラスタに属する画素数を求めた結果を、図11に示している。本実施形態では、これらのクラスタ番号・ラベル数・画素数を、連結情報と呼ぶこととする。
<グラフィックスのベクトル化処理対象判定処理>
グラフィックス・写真の判定処理(ステップS23)は、実施例1と同様の処理により行われる。そして、グラフィックス・写真の判定処理(ステップS23)によりグラフィックスと判定された画像は、更に、処理対象判定処理(ステップS25)でベクトル化処理に適したグラフィックスか否か判定される。ここで、ラベル数が第2の閾値以上のクラスタがある画像は、ベクトル化処理に適さないグラフィックス(ベクトル化処理対象外グラフィックス)と判定する。一方、ラベル数が第2の閾値以上のクラスタがない画像であれば、ベクトル化処理対象に適したグラフィックスと判定する。なお、第2の閾値は、画像サイズやスキャン解像度等に応じて予め設定しておけばよい。
<グラフィックス・写真の判定処理と、ベクトル化処理対象判定処理の例>
図11は、画像10a,10bそれぞれに対して、連結情報(各クラスタのラベル数・画素数)を求めた結果である。このとき、比率Rを求め、例えば閾値を「3.8」としてグラフィックス・写真の判定処理を行った場合、画像10aでは、クラスタ番号3,7,8,9の比率が閾値より低くなる。また、画像10bでは、クラスタ番号3,6,12の比率が閾値より低くなる。したがって、グラフィックス・写真の判定処理(ステップS23)では、画像10a,10bのいずれもグラフィックスと判定される。次に、処理対象判定処理(ステップS25)で、ラベル数と第2の閾値を比較する。例えば、第2の閾値を1000とすると、画像10aには、ラベル数が第2の閾値以上のクラスタはないので、ベクトル化処理対象のグラフィックスと判定する。一方、画像10bには、ラベル数が第2の閾値以上のクラスタが存在するので、ベクトル化処理対象外と判定する。すなわち、画像10bのようにラベル数が多い画像は、細かな領域が多数存在することを示しているので、ベクトル化処理を行うとデータ量が増えてしまうので、ベクトル化に向いていないと判定している。
(実施例3)
実施例2は、先ずグラフィックス・写真の判定処理を行った後、グラフィックスと判定された画像を更にベクトル化処理対象にするか否かの処理対象判定処理を行う、2段階の処理で判定した。この判定は2段階で行うものに限るものではなく、1段階で判定するようにしてもよい。実施例3では、画像のクラスタ情報及び連結情報を元に、画像をベクトル化処理対象にするか否かの判定を1段階の処理で行うようにしてもよい。
(実施例4)
実施例4は、グラフィックスか写真かの判定を、クラスタのラベル数のみで簡易的に判定する。
写真は、各クラスタのラベル数が相対的に少ないが、グラフィックスはラベル数が多いクラスタがある。この特徴を利用し、ラベル数の閾値を設定し、ラベルだけを使って判定する。以下で具体的に説明する。
先ず、判定用のラベル数の第3の閾値を設定する。そして、第3の閾値以上のラベル数を持つクラスタがなければ、写真と判定し、第3の閾値以上のラベル数を持つクラスタがあれば、グラフィックスと判定する。
(実施例5)
実施例5は、ラベル数のみを用いて、入力画像がグラフィックスか写真かを判定し、グラフィックスと判定された画像は、更に、ベクトル化処理に向くグラフィックスか、ベクトル化処理に向かないグラフィックスかを判定する。
写真は各クラスタのラベル数が相対的に少ないが、グラフィックスはラベル数の多いクラスタがある。また、グラフィックスの中で、地図等細かな領域を沢山含む画像はラベル数が相対的に高い。この特徴を利用し、ラベル数の閾値を二つ設定し、ラベルだけを使って判定する。以下で具体的に説明する。
先ず、判定用のラベル数の閾値(第3の閾値R1、第4の閾値R2)を設定する。ただし、R1<R2とする。
そして、R1以上のラベル数を持つクラスタがなければ、写真と判定し、R1以上のラベル数を持つクラスタがあれば、グラフィックスと判定する。
次に、グラフィックスと判定された画像は更にベクトル化処理に向くグラフィックスであるかを判定する。ここで、R2以上(第4の閾値以上)のラベル数を持つクラスタがなければ、ベクトル化処理対象のグラフィックスと判定し、R2以上のラベル数を持つクラスタがあれば、ベクトル化処理対象外と判定にする。
なお、上述した例では、ベクトル化処理対象とするか否かの判定を2段階で行っているが、1段階で行うようにしてもよい。すなわち、各クラスタのラベル数が、閾値R1とR2の間にあるか否かでベクトル化処理対象か否か判定するようにしてもよい。
<その他の実施形態>
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給する。そして、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、以下のようなものがある。磁気ディスク、光ディスク、光磁気ディスク、ハードディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページからハードディスク等の記録媒体にダウンロードすることによっても供給できる。すなわち、ホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをダウンロードする。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他にも、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後にも前述した実施形態の機能が実現される。すなわち、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行うことによっても前述した実施形態の機能が実現される。
本発明の実施形態1に係る画像処理装置の構成を示すブロック図である。 図1に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP)の主要部構成を示すブロック図である。 本発明の実施形態1におけるグラフィックス・写真の判定によりベクトル化処理と圧縮処理との切り替えが行われることの概要を示すフローチャートである。 入力画像の一例を示す図である。 クラスタリング処理を行った後に得た連結情報の例である。 本発明の実施形態1におけるグラフィックス・写真の判定処理を説明するためのフローチャートである。 入力画像の一例の拡大図と、クラスタリング結果である。 本発明の実施形態2に係る画像処理装置の構成を示すブロック図である。 本発明の実施形態2におけるベクトル化処理と圧縮処理の切り替えを説明するためのフローチャートである。 入力画像の一例である。 クラスタリング処理を行った後に得た連結情報の例である。

Claims (13)

  1. 処理対象画像を色領域に分割する色領域分割手段と、
    前記分割された各色領域における連結領域に関する情報を取得する連結情報取得手段と、
    前記連結情報取得手段で取得した情報に基づいて、前記処理対象画像がグラフィックスであるか否かを判定する判定手段と、
    を備え
    前記連結情報取得手段で取得する情報は、前記分割された各色領域における連結領域の数を含むことを特徴とする画像処理装置。
  2. 前記連結情報取得手段で取得する情報は、前記分割された各色領域における連結領域の数と、前記分割された各色領域の画素数とを含むことを特徴とする請求項1に記載の画像処理装置。
  3. 前記判定手段は、前記各色領域における画素数と連結領域の数との比率を求め、第1の閾値以下の比率となった色領域があるか否かに基づいて、前記処理対象画像がグラフィックスであるか否かを判定することを特徴とする請求項2に記載の画像処理装置。
  4. 前記判定手段でグラフィックスと判定された処理対象画像について、前記各色領域における連結領域の数に基づいて、ベクトル化処理対象に適した処理対象画像であるか否かを判定する処理対象判定手段を、更に備えることを特徴とする請求項2または3に記載の画像処理装置。
  5. 前記処理対象判定手段は、前記連結領域の数が第2の閾値以上の色領域がある場合、前記処理対象画像はベクトル化処理対象に適さないと判定することを特徴とする請求項4に記載の画像処理装置。
  6. 記判定手段は、前記連結領域の数が第3の閾値以上の色領域があるか否かに基づいて、前記処理対象画像がグラフィックスであるか否かを判定することを特徴とする請求項1に記載の画像処理装置。
  7. 記判定手段は、前記連結領域の数が第3の閾値以上である色領域があり、且つ前記連結領域の数が第4の閾値以上である色領域がなければ、前記処理対象画像をベクトル化処理対象に適したグラフィックスであると判定することを特徴とする請求項1に記載の画像処理装置。
  8. 前記色領域分割手段は、クラスタリング処理を実行することにより、前記処理対象画像を前記色領域に分割することを特徴とする請求項1乃至7のいずれか1項に記載の画像処理装置。
  9. 前記連結情報取得手段は、ラベリング処理を実行することにより、前記分割された各色領域における連結領域に関する情報を取得することを特徴とする請求項1乃至8のいずれか1項に記載の画像処理装置。
  10. 前記処理対象画像をベクトル化するベクトル化手段を、更に備えることを特徴とする請求項1乃至9のいずれか1項に記載の画像処理装置。
  11. 色領域分割手段が、処理対象画像を色領域に分割する色領域分割ステップと、
    連結情報取得手段が、前記分割された各色領域における連結領域に関する情報を取得する連結情報取得ステップと、
    判定手段が、前記連結情報取得ステップで取得した情報に基づいて、前記処理対象画像がグラフィックスであるか否かを判定する判定ステップと、
    を備え
    前記連結情報取得ステップで取得する情報は、前記分割された各色領域における連結領域の数を含むことを特徴とする画像処理方法。
  12. コンピュータを、請求項1乃至10のいずれか1項に記載の画像処理装置の各手段
    として機能させるためのコンピュータプログラム。
  13. 請求項12に記載のコンピュータプログラムを格納した、コンピュータ読み取り可能な記憶媒体。
JP2008321625A 2008-12-17 2008-12-17 画像処理装置、画像処理方法、コンピュータプログラム Expired - Fee Related JP5178490B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008321625A JP5178490B2 (ja) 2008-12-17 2008-12-17 画像処理装置、画像処理方法、コンピュータプログラム
US12/639,891 US8363934B2 (en) 2008-12-17 2009-12-16 Image processing apparatus, image processing method, and computer program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008321625A JP5178490B2 (ja) 2008-12-17 2008-12-17 画像処理装置、画像処理方法、コンピュータプログラム

Publications (2)

Publication Number Publication Date
JP2010146218A JP2010146218A (ja) 2010-07-01
JP5178490B2 true JP5178490B2 (ja) 2013-04-10

Family

ID=42266193

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008321625A Expired - Fee Related JP5178490B2 (ja) 2008-12-17 2008-12-17 画像処理装置、画像処理方法、コンピュータプログラム

Country Status (2)

Country Link
US (1) US8363934B2 (ja)
JP (1) JP5178490B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8743424B2 (en) * 2010-06-18 2014-06-03 Hewlett-Packard Development Company, L.P. Pre-print enhancement of a raster image
JP5843474B2 (ja) 2011-05-09 2016-01-13 キヤノン株式会社 画像処理装置、画像処理方法、及び、プログラム
JP5801598B2 (ja) 2011-05-09 2015-10-28 キヤノン株式会社 画像処理装置、画像処理方法、及び、プログラム
JP6056459B2 (ja) * 2012-12-26 2017-01-11 株式会社Jvcケンウッド 奥行き推定データ生成装置、擬似立体画像生成装置、奥行き推定データ生成方法及び奥行き推定データ生成プログラム
KR102122338B1 (ko) * 2013-12-04 2020-06-12 엘지전자 주식회사 디스플레이 장치 및 그 동작 방법
JP6191505B2 (ja) * 2014-02-28 2017-09-06 ブラザー工業株式会社 画像処理装置、及び、画像処理プログラム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5680479A (en) * 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JPH096946A (ja) * 1995-06-22 1997-01-10 Toshiba Corp 画像処理方法及びその装置
JP4060559B2 (ja) * 2001-09-13 2008-03-12 株式会社東芝 画像処理装置および画像処理方法
US6993185B2 (en) * 2002-08-30 2006-01-31 Matsushita Electric Industrial Co., Ltd. Method of texture-based color document segmentation
JP4251629B2 (ja) 2003-01-31 2009-04-08 キヤノン株式会社 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US7623712B2 (en) * 2005-06-09 2009-11-24 Canon Kabushiki Kaisha Image processing method and apparatus
JP4766661B2 (ja) * 2005-06-09 2011-09-07 キヤノン株式会社 画像処理方法及び画像処理装置
US7831107B2 (en) * 2005-10-17 2010-11-09 Canon Kabushiki Kaisha Image processing apparatus, image processing method, and program
US8154778B2 (en) * 2007-11-15 2012-04-10 Sharp Laboratories Of America, Inc Systems and methods for color correction processing and notification for digital image data generated from a document image

Also Published As

Publication number Publication date
US20100158360A1 (en) 2010-06-24
US8363934B2 (en) 2013-01-29
JP2010146218A (ja) 2010-07-01

Similar Documents

Publication Publication Date Title
US8331671B2 (en) Image processing apparatus and image encoding method related to non-photo image regions
US7623712B2 (en) Image processing method and apparatus
US8023147B2 (en) Image processing method and image processing apparatus
JP5180670B2 (ja) 画像処理装置及び画像処理方法
US8244035B2 (en) Image processing apparatus and control method thereof
JP5137759B2 (ja) 画像処理装置
US8384964B2 (en) Image processing apparatus and image processing method
JP5219706B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP5541672B2 (ja) 装置、方法、プログラム
US7626743B2 (en) Image processing apparatus, image processing method and image processing program for rendering pixels transparent in circumscribed areas
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
JP4579759B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP2009296150A (ja) 画像処理装置、画像変換方法、およびコンピュータプログラム
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP3899872B2 (ja) 画像処理装置、画像処理方法ならびに画像処理プログラムおよびこれを記録したコンピュータ読み取り可能な記録媒体
JP4710672B2 (ja) 文字色判別装置、文字色判別方法、およびコンピュータプログラム
JP2008193234A (ja) 画像処理装置、画像処理装置の制御方法、および画像処理装置の制御プログラム
JP2005204206A (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP7185451B2 (ja) 画像処理装置と画像処理方法、及びプログラム
JP4383187B2 (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP2005328348A (ja) 画像処理装置、プログラム、及び記憶媒体
JP2000270224A (ja) 画像処理装置、画像処理方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US20090316998A1 (en) Outlining method for properly representing curved line and straight line, and image compression method using the same
JP2008152353A (ja) 画像処理装置

Legal Events

Date Code Title Description
RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20100630

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20111201

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120821

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20121019

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20121211

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20130108

R151 Written notification of patent or utility model registration

Ref document number: 5178490

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20160118

Year of fee payment: 3

LAPS Cancellation because of no payment of annual fees