JP5047051B2 - 画像処理装置及び画像符号化方法 - Google Patents

画像処理装置及び画像符号化方法 Download PDF

Info

Publication number
JP5047051B2
JP5047051B2 JP2008120763A JP2008120763A JP5047051B2 JP 5047051 B2 JP5047051 B2 JP 5047051B2 JP 2008120763 A JP2008120763 A JP 2008120763A JP 2008120763 A JP2008120763 A JP 2008120763A JP 5047051 B2 JP5047051 B2 JP 5047051B2
Authority
JP
Japan
Prior art keywords
area
background
image
region
encoding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2008120763A
Other languages
English (en)
Other versions
JP2009272834A5 (ja
JP2009272834A (ja
Inventor
暁艶 戴
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2008120763A priority Critical patent/JP5047051B2/ja
Priority to US12/432,261 priority patent/US8331671B2/en
Publication of JP2009272834A publication Critical patent/JP2009272834A/ja
Publication of JP2009272834A5 publication Critical patent/JP2009272834A5/ja
Application granted granted Critical
Publication of JP5047051B2 publication Critical patent/JP5047051B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables

Description

本発明は、文書画像を圧縮する画像処理装置及び画像符号化方法に関し、特に非写真画像を含む文書画像を圧縮する画像処理装置及び画像符号化方法に関する。
近年、情報の電子化が進み、紙文書をそのまま保存するのではなく、スキャナ等によりスキャンして電子化して保存したり、その電子データを他装置に送信したりするシステムが普及してきている。送信コストを削減するため、電子化された文書に対して高い圧縮性が要求されている。一方、電子化データを部分的に編集できる再利用性と、拡大しても縮小しても画質が落ちない高画質性とが要求されている。
ところが、文書画像に文字領域や写真領域が混在する場合は、文字領域に適した圧縮(例えば可逆圧縮)を文書画像全体に対して行うと復号後の画質が良いが圧縮率が低くなってしまうという問題がある。一方、写真領域に適した圧縮(例えばJPEG等の非可逆圧縮)を文書画像全体に対して行うと圧縮率が高いが復号後の文字が劣化してしまうという問題がある。そこで、文書画像から文字領域を抽出し、当該文字領域の画像に対しては文字用の圧縮(MMR等)を行い、一方、文字領域を抜きだした後の下地部分を塗りつぶして写真等に適した圧縮(JPEG)を行う手法が提案されている。(特許文献1,2参照)。なお、塗り潰し方として、たとえば文字領域をその周囲画素の平均色で塗ったり、文字領域のヒストグラム情報により決めた色で塗ったりする手法が提案されている。
また、電子化された文書画像を文字領域や写真領域に分離し、再利用性と高画質性が重視されている文字領域等をベクトルデータに変換し、ベクトルデータで簡易に再現できない写真領域等をJPEGで圧縮する。そして各領域のベクトル化結果とJPEG圧縮結果を合成して出力することにより、文書画像の高圧縮性、再利用性、高画質性を実現する手法が提案されている(特許文献3参照)。すなわち、文書画像に対して、まず領域分離が行われ、文書画像から文字領域・線画領域が矩形の領域で特定される。そしてベクトル化可能な文字オブジェクトや線画をベクトル化し、得られたベクトルデータをベクトル層におく。また、ベクトル化対象ではない領域、および、ベクトル化された文字領域を塗り潰した画像領域をJPEG圧縮し、得られたJPEGデータをJPEG層におく。それらベクトル層データとJPEG層データとが圧縮後の文書ファイルとして保存される。
また、文書画像の高圧縮性、再利用性、高画質性を向上させるために、ベクトル化処理対象を拡大し、今まで、写真と同様にJPEGで圧縮されていたイラストなどの非写真画像を、ベクトル化する手法が提案されている(特許文献4参照)。非写真画像は「イラスト」あるいは「クリップアート画像」とも呼び、オブジェクトの輪郭が明瞭であり、出現色の色数も限られている等の特徴を有している。(なおここでいう非写真画像は、文字や線画を含むと解釈しても構わない。ただし、文字や線画の領域と分離された画像領域をさらに写真領域と非写真領域とに分離する形態の場合、写真領域と非写真領域の分離処理を行う時点では分離対象の画像領域に文字や線画は含まれていない。)
特開2002−077633号公報 特開2005−012768号公報 特開2004−265384号公報 特開2006−344069号公報
一方、文書画像において、写真領域は矩形状の画像として配置されることが多いが、イラストなどの非写真画像領域は、写真領域に比べて、矩形以外の形状の画像で描かれることが多い。一方、画像に対して領域分離処理を行う場合、文字領域やグラフィックス領域などの領域範囲を外接矩形で定義するので、イラスト領域には、イラスト本体以外に背景などの別の画像も含まれることが多い。
特許文献4の手法を用いて矩形のイラスト領域(クリップアート領域)をベクトル化すると、背景部分もイラストと同様に扱われ、背景部分の平均色を代表色とする1色の領域としてベクトル化される。しかしながら、イラスト領域内において、イラスト本体部分以外の背景部分は、1色ではなく、弱いグラデーションをしているような場合もありうる。(なお、弱いグラデーションとは、色でクラスタリングすると1つの色として判別されるが、実際には少しグラデーションしているようなもののことをいうこととする。)例えば、図22のグラフィックス領域34内には、イラスト画像本体(円形の画像部分)と、弱いグラデーションをしている背景領域とが含まれている。このようなグラフィックス領域34内で、色クラスタリングを行うと、イラスト本体が色ごとにクラスタリングされるとともに、背景部分についても1つの領域として抽出され、イラスト本体と同様に代表色が算出されることになる。すなわち、グラデーションしているような背景部分を1色にした場合、元の画像との差異が大きくなり、違和感が大きくなる。したがって、実際には、背景部分はイラスト本体と同様の処理を行って1色にするのではなく、弱いグラデーションの背景として残しておきたいと考えられる。
また、非写真画像領域を含んだ文書画像は、非写真画像領域(特に図15のような矩形の非写真画像領域33)と、それと重なる写真領域31とを含むこともあり得る。すなわち、イラスト本体以外の背景部分に写真領域が重なっているような場合である。このような画像に対して、まず、その非写真画像領域(イラスト領域)は抽出されて、当該抽出された非写真画像領域に対してベクトル化処理がなされる。一方、非写真領域が抽出された後に残った文書画像については、当該非写真画像領域に対応する領域を塗り潰してJPEG圧縮する。すると、図17のように非写真画像領域と重なる写真領域の一部が非写真画像領域の塗り潰しにより消えてしまい、元の画像を再現できないという問題があった。
本発明は、非写真画像領域を含んだ文書画像の圧縮率を高めると共に、そこに含まれる画像オブジェクトの再現時の品質や再利用性を向上させる画像処理方装置及び画像符号化方法を提供することを目的とする。
上記課題を解決するために、本発明は、非写真画像領域を含む文書画像を符号化する画像処理装置であって、
文書画像を領域分離して非写真画像領域を特定する領域特定手段と、
前記非写真画像領域をベクトル化処理により符号化する第1の符号化手段と、
前記非写真画像領域から背景領域を特定する背景特定手段と、
前記非写真画像領域において、前記背景領域以外の領域を前記背景領域の色で塗り潰す塗り潰し手段と、
前記塗り潰し手段により前記非写真画像領域における前記背景領域以外の領域が塗り潰された後の文書画像を、画像圧縮手順で符号化する第2の符号化手段と
を備え、
前記背景特定手段は、
前記非写真画像領域を、クラスタ毎の基準色との距離が基準値以内の画素をグループ化したクラスタに分割し、
前記非写真画像領域の端部に存在し、かつ当該端部の画素を所定の基準よりも多く含むクラスタを前記背景領域として特定することを特徴とする。
本発明によれば、非写真画像領域を含んだ文書画像の圧縮性も再利用性も向上させ、しかも高品質が文書画像を再現することができる。
以下、図面を参照して、本発明に係る画像処理装置を用いた非写真画像領域の穴埋め処理及び合成文書ファイルの生成処理について、詳細に説明する。
[第1の実施形態]
<装置構成>
図1は、本発明の第1の実施形態に係る非写真画像領域の塗り潰し処理及び合成文書ファイルの生成処理を行う機能を有する画像処理装置の構成を示すブロック図である。合成文書ファイルとは、写真画像の部分はJPEG等で、文字及び非写真画像はベクトル化されて圧縮されている。すなわちこの装置は、画像符号化方法を実行する装置と言い換えることもできる。図1において、ユニット10はスキャンによって紙情報をカラー文書画像として入力する入力部、ユニット11はカラー文書画像から文字領域やグラフィックス領域や線画領域などの複数種類の領域を分離する領域分離部である。領域分離処理により、各領域にはそれぞれの属性が与えられる。本実施形態の領域分離処理では、カラー文書画像を2値化し、2値画像内の黒画素連結要素を抽出し、当該抽出された黒画素連結要素に外接する矩形状の領域に基づいて分離するものとする。このとき、各領域の属性は、矩形領域の大きさ、縦横比、黒画素密度などに基づいて判定されるものとする。なお、領域分離処理は、この手法に限るものではなく、公知の技術を用いることが可能である。ユニット12は分離された複数種類の領域の中からグラフィックス領域(グラフィックス属性が与えられている領域)を抽出するグラフィックス領域抽出部である。本実施形態において、グラフィクス領域には、写真領域(中間調領域)と、イラスト(クリップアートとも呼ぶこととする)などの非写真画像の領域とが含まれるものとする。2値画像から領域抽出を行った場合、写真の領域やクリップアートの領域は、領域サイズが大きく、黒画素密度も高くなることが多く、同じ種類(グラフィックス)の領域として抽出されやすい。したがって、次の処理で、更にグラフィックス領域群の中から、クリップアート(イラスト)領域を判定し抽出する。
ユニット13はグラフィックス領域からクリップアート領域を判定するクリップアート領域判定部である。ユニット14はクリップアート領域内にある各画素を色特徴に基づき領域(クラスタと呼ぶ)に分割するクリップアート領域分割部である。ユニット15は領域分割結果に基づき、クリップアート領域内における背景画素の部分を特定するクリップアート背景特定部である。ユニット16は、カラー文書画像において、クリップアート領域内の背景以外の部分のみを背景色で塗り潰すクリップアート背景以外部分の塗り潰し処理部である。ユニット17は、塗りつぶし処理部16でクリップアート部の塗り潰し処理がなされたカラー文書画像を圧縮する画像圧縮部である。ユニット18は、クリップアートの領域分割結果で、クリップアート領域内の背景以外の画素をベクトルデータに変換する(すなわち、ベクトルデータを生成する)ベクトル変換部である。ユニット19は圧縮データ層の圧縮データとベクトル層のベクトルデータとを合成して多層構成の圧縮文書画像ファイルを出力する(あるいは保存する)文書ファイル合成部である。なお、図1では、クリップアート領域をベクトル化処理する場合について述べたが、別途、文字領域や線画領域もベクトル変換部でベクトルデータに変換して、圧縮文書画像ファイルに格納するようにしてもよい。なお、文字領域や線画領域をベクトル化する際は、それぞれの領域に適したベクトル化手法でベクトル化処理を行うのが望ましい。圧縮文書画像ファイルを再生する際には、圧縮データ層の圧縮画像を再生した画像上に、ベクトル層のベクトルデータを再生した画像を重畳して文書を再生する。
図14は、図1に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP)の主要部構成を示すブロック図である。尚、本実施形態では、画像処理装置として、スキャナ機能やプリンタ機能を有するディジタル複合機(MFP)を用いているが、汎用のスキャナとパーソナルコンピュータとを接続したシステムを当該画像処理装置として用いてもよい。
図14に示すように、MFPは、画像処理装置として機能するコントローラユニット2000を備えている。当該コントローラユニット2000は、画像入力デバイスであるスキャナ2070や画像出力デバイスであるプリンタ2095を接続する。そして、スキャナ2070で原稿画像から読み取られた画像データをプリンタ2095によって印刷出力するコピー機能を実現するための制御を行う。また、コントローラユニット2000は、LAN1006や公衆回線(WAN)1008を介して他装置との間でパターン画像やデバイス情報等の入出力を行うための制御を行う。
コントローラユニット2000は、図14に示すように、CPU2001を有している。CPU2001は、ROM2003に格納されているブートプログラムによりオペレーションシステム(OS)を立ち上げる。そして、このOS上でHDD(ハードディスクドライブ)2004に格納されているアプリケーションプログラムを実行することによって各種処理を実行する。このCPU2001の作業領域として、RAM2002が用いられる。RAM2002はまた、CPU2001の作業領域だけでなく、画像データを一時記憶するための画像メモリ領域をも提供する。HDD2004は、上記アプリケーションプログラムとともに、画像データを格納する。
CPU2001には、システムバス2007を介して、ROM2003やRAM2002が接続している。さらに、CPU2001には、操作部I/F(操作部インタフェース)2006、ネットワークI/F(ネットワークインタフェース)2010、モデム2050及びイメージバスI/F(イメージバスインタフェース)2005が接続されている。
操作部I/F2006は、タッチパネルを有する操作部2012とのインタフェースであり、操作部2012に表示する画像データを操作部2012に対して出力する。また、操作部I/F2006は、操作部2012においてユーザにより入力された情報をCPU2001に送出する。
また、ネットワークI/F2010は、LAN1006に接続され、当該LAN1006を介してLAN1006に接続された各装置との間で情報の入出力を行う。モデム2050は、公衆回線1008に接続し、公衆回線1008を介して他装置との間で情報の入出力を行う。
イメージバスI/F2005は、システムバス2007と画像データを高速で転送する画像バス2008を接続し、データ構造を変換するためのバスブリッジである。画像バス2008は、PCIバス又はIEEE1394から構成される。画像バス2008上には、ラスタイメージプロセッサ(RIP)2060、デバイスI/F2020、スキャナ画像処理部2080、プリンタ画像処理部2090、画像回転部2030、サムネイル作成部2035及び画像圧縮部2040が設けられている。
RIP2060は、PDLコードをビットマップイメージに展開するプロセッサである。デバイスI/F2020には、スキャナ2070及びプリンタ2095が接続され、画像データの同期系/非同期系の変換を行う。スキャナ画像処理部2080は、入力画像データに対して補正、加工、編集処理を行う。プリンタ画像処理部2090は、プリント出力画像データに対してプリンタの補正、解像度変換等を行う。画像回転部2030は、画像データの回転を行う。画像圧縮部2040は、多値画像データをJPEGデータに、ニ値画像データをJBIG、MMR、MH等のデータに圧縮するとともに、その伸長処理も行う。
<クリップアート領域の塗り潰し処理および文書ファイル合成処理の概要>
図2は、本発明の第1の実施形態におけるクリップアート領域の塗り潰し処理及び文書ファイル合成処理についての概略を説明するためのフローチャートである。
まず、入力部10において、スキャナにより紙文書を読み取り、カラー文書画像データを得る(ステップS10)。次に、領域分離部11において、入力されたカラー文書画像を二値データに変換し、この二値画像データを文字、グラフィックス、表等の複数種類の領域に分離する(ステップS11)。尚、この領域分離処理を実現する一例として、米国特許第5,680,478号公報に記載の領域分離技術を用いることができる。尚、当該公報には、「Method and Apparatus for character recognition (Shin-YwanWang et aI./Canon K.K.)」が記載されている。なお、領域分離はオペレータに領域とその属性とを指定させて行っても良い。これはこの後のステップで行うクリップアート領域の特定についても同様である。さらにグラフィックス領域抽出部12において、前工程で分離された領域から属性がグラフィックスである領域を選択する(ステップS12)。さらに、クリップアート領域判定部13において、前工程で抽出された各グラフィックス領域はクリップアートであるかを判定し、クリップアートである領域を特定する(ステップS13)。すなわちクリップアート領域判定部13はクリップアート領域特定部と言い換えることもできる。このクリップアート判定処理を実現する処理の一例として、以下の手順で判定できる。
この手順ではたとえば色数を数え、使用されている色数が基準値以下であればクリップアート(イラストなどの非写真画像)と判定する。そのため、たとえばラスタ順に着目グラフィクス領域の画素に順次着目し、着目画素の色に対応するカウンタをインクリメントして、グラフィクス領域で使用されている色数を数える。着目領域全体について色数を数えても良いが、色数が、クリップアート(すなわち非写真画像)であると判定されるクリップアート基準値を越えたなら、着目領域は写真画像領域であると判定し、着目グラフィクス領域に関する判定を打ちきっても良い。そして着目グラフィクス領域全体について色数を数えた結果、基準値以下であれば、着目グラフィクス領域はクリップアート(すなわち非写真領域)であると判定される。
なお同系色で構成される写真画像は、写真画像であっても色数が少ない場合がある。そのような写真画像を非写真画像と区別するために、単に色を数えるのではなく、たとえば各画素を、類似した色をグループ化したクラスタに分類し、クラスタの数も判定基準とする方法がある。そのために、色数を数えることに加えて次のような処理を行う。まず判定対象の画像データのラスタ走査順で先頭の画素に着目する。そして着目画素と既存のクラスタ間との類似度を求める。そして類似度が最も高い既存のクラスタがあれば、着目画素がそのクラスタに属するものと記録する。類似したクラスタがなければ着目画素の属する新規クラスタを作成し、着目画素がそのクラスタに属するものと記録する。「類似度」としては、たとえば着目画素の色と、クラスタ毎の基準色との距離(色空間における距離)を用いることができる。類似度が最も高いクラスタとは、着目画素との距離が基準値以内であり、しかも最も距離が近いクラスタである。着目画素との距離が基準値以内の既存のクラスタがない場合には、新たなクラスタが生成される。クラスタの基準色とは、クラスタを代表する色であり、たとえばクラスタが生成されて最初に属した画素の色などを採用できる。以上の処理を、処理対象画像を構成する全画素に順次着目して実行する。そして、色数が色数基準値以内であり、かつ、クラスタ数がクラスタ数基準値を越えたなら、そのグラフィクス領域はクリップアート(すなわち非写真画像)であるものとして、例えば領域のIDとその属性(「クリップアート領域」であるという属性)を記録する。それ以外の場合には、着目領域は写真画像であるとして属性が記録される。そして次のグラフィクス領域について、ステップS13の判定を実行する。たとえば色数基準値として64,クラスタ数基準値として色数基準値の2分の1の値などを用いることができる。もちろんこれはクリップアート領域判定の一例に過ぎない。ステップS13では、最終的に、クリップアート領域と判定されたグラフィクス領域の画素の属性として、「クリップアート属性」が書き込まれる。
次に、クリップアート領域分割部14において、クリップアート領域内の各画素を、色特徴に基づきいくつかのクラスタ(領域)に分ける。この領域分割処理の詳細については図4を参照して後述する(ステップS14)。ステップS14の出力は、クリップアート領域の各画素にラベリング結果が書き込まれる。たとえば、クリップアート領域の各画素にラベルとしてクラスタIDが書き込まれる。
そして、ベクトル変換部18において、分割されたクリップアート領域について、領域毎に輪郭線と領域内部色に基づきベクトルデータに変換する(ステップS18)。なお、ステップS11で文字領域が分離されている場合には文字領域についてもベクトル化の対象となる。文字領域のベクトル処理を実現する一例としては、例えば、特許第2885999号公報に記載の、二値画像の輪郭線の追跡を行い、その座標ベクトルを選択することによりベクトル化するものが挙げられる。そして、本実施形態におけるベクトル化処理においても当該技術を利用するものとする。このベクトル化処理の結果はベクトル層に保存される。もちろんベクトル化された画像の文書画像における位置も保存される必要がある。ベクトル化は、画像オブジェクトの輪郭を高精細に再生可能な符号化方法であり、ベクトル変換部18は画像データの符号化手段ということもできる。
一方、クリップアート背景特定部15において、クリップアート領域分割の結果に基づき、クリップアート領域の背景部分を特定する。このクリップアート背景特定の詳細については図5を参照して後述する(ステップS15)。ここではたとえば、画素に関連づけられたクラスタ番号のうち、背景色となるクラスタ番号が特定される。
次に、クリップアートの背景以外部分の塗り潰し処理部16では、カラー文書画像において、クリップアートの背景領域番号(クラスタ番号)以外の領域番号(クラスタ番号)に対応する画素を、背景領域番号を持つ画素の色(すなわち背景色)で塗り潰す(ステップS16)。なおステップS11で文字領域が分離されている場合には文字領域についても、当該文字領域の背景色で塗り潰される。
次に、画像圧縮部17において、クリップアート領域に対応する画素の塗り潰し処理後のカラー文書画像を圧縮し、圧縮データ層に保存する(ステップS17)。圧縮方法の例としてはJPEGやPNG等の非可逆の画像圧縮手順を用いた方法があげられる。なお圧縮対象のカラー文書画像データは、文字領域がベクトル化されるのであれば、その文字領域についても塗りつぶされている。画像圧縮部17は、ベクトル変換部18とともに2種類の画像データの符号化手段を構成している。いずれかを第1の符号化手段と称した場合には他方を第2の符号化手段と称することもある。
次に、文書ファイル合成部19において、ベクトル層と圧縮データ層のデータを合成して多層構成出力データを生成し、外部装置へ出力、或いは記憶装置に保存する(ステップS19)。すなわち、文書ファイル合成部19は、ベクトルデータと圧縮データとを格納した文書ファイルを生成する。こうして、文書画像に含まれる文字及び非写真画像はベクトル化により圧縮され、写真画像はJPEG等の圧縮方式を用いて非可逆圧縮される。なお、本実施形態では、ステップS18でクリップアート領域をベクトル化する場合、矩形のクリップアート領域全体を対象としてベクトル化処理していたので、背景部分もベクトルデータになっていると考えられる。そこで、本実施形態では、クリップアート背景特定部15により特定された背景部分に対応するベクトルデータを削除してから、多層構成出力データのベクトル層に格納することとする。なお、本実施形態では、クリップアート領域全体をベクトルデータに変換してから背景部分に対応するベクトルデータを削除する構成としたが、これに限るものではない。例えば、クリップアートの背景部分を特定した後、クリップアート領域の背景部分以外をベクトル化対象として、ベクトルデータに変換するようにしても構わない。
<クリップアート領域の抽出例>
図3は、本発明の第1の実施形態による画像処理において文書画像からクリップアート領域を選択した一例を示す図である。図3に示す文書画像では、前述した領域分離法により、写真領域31、文字領域32、及びクリップアート領域(非写真画像領域)33がそれぞれ矩形領域として分離されている。
<クリップアート領域分割>
クリップアートの領域分割処理について、図4を参照して説明する。まず、ステップS1401では、処理対象となるクリップアート画像を入力する。そして、ステップS1402では、クラスタリング処理を行う。この処理では、まず、ラスタスキャンしたスタートの画素により、最初のクラスタを生成する。そして、次の画素に対して、全てのクラスタとの類似度を求める。類似度が高いほど、画素とクラスタとの特徴が近いと考えられる。ここでは、類似度の計算にRGB色空間の距離を用いるが、他のカラー空間の情報、或いは、カラー以外の情報を特徴量としても使える。そして、一番高い類似度とこの類似度に対応したクラスタ番号を着目画素に関連づけて記録し、この類似度を事前に設定された閾値とを比較する。類似度が閾値より高ければ、対象画素を記録されたクラスタに属させる。属するクラスタは、画素毎に関連づけて記録される。閾値より低ければ新たなクラスタを生成し、着目画素をその新たなクラスタに属させる。この処理は全ての画素の処理が終わるまで繰り返し実行する。
次に、ステップS1403では、前記クラスタリング処理結果に基づき、クラスタ統合処理を行う。この処理では、まず、分離したい領域数の目標値を入力する。この目標値は、何色くらいに分離するかの目安になる。なお、この目標値は予め設定された値でもよいし、ユーザにより設定される値でもよい。そして、現在のクラスタの数を数える。現在のクラスタの数を領域数の目標値とを比較する。現在のクラスタ数が目標値より多ければ、クラスタの統合を行う。統合処理では、クラスタ間の類似度を計算し、一番類似度の高い二つのクラスタを一つに統合する。領域統合処理は現在のクラスタ数は目標値以下になるまで繰り返し実行する。クラスタが統合されると、画素毎に関連づけて記録されているクラスタ番号(クラスタ識別子とも呼ぶ)が、統合後のクラスタ番号に書き換えられる。
次に、ステップS1404では、クラスタ統合処理の結果に基づき、ノイズ領域の再処理を行う。この処理では、まず、領域分割の結果をラベリングし、そして、各ラベル領域の面積を計算する。なお、クラスタ番号は各画素毎に記録されているので、クラスタ番号でラベリングするものとすれば、ラベリング処理は省力できる。各クラスタに対応する領域(ラベル領域あるいはクラスタ領域と呼ぶことにする。)の面積はその領域が含む画素数である。クラスタ領域の面積がある閾値より小さければ、この領域をノイズ領域と判定する。そして、このノイズ領域に含まれた各画素について、隣接する近傍領域との類似度を計算し、一番類似度の高い領域に統合する、すなわちノイズ領域に属する各画素に関連づけたクラスタ番号を、統合後の領域のクラスタ番号に書き換える。これを新たなノイズ領域判定処理は全てのラベル領域が処理済みになるまで繰り返し実行する。ステップS1405では、クリップアートの領域分割結果を出力する。ここではすでに上記各手順の結果が反映された画素およびそれに関連づけた属性情報が保存されているので、それらの情報が後続の処理に渡される。
<クリップアートの背景特定処理>
クリップアートの背景特定処理(図2のステップS15)について、図5を参照して説明する。
先ず、ステップS1501では、前記のクリップアート領域分割の結果(すなわちラベリングされたクリップアート領域の画像データ)を入力する。そして、ステップS1502では、クリップアート画像領域の辺を取る。具体的には、たとえば矩形のクリップアート画像領域の各辺(あるいは端部又は縁)を構成する画素に着目する。そして、ステップS1503では、前述の辺上にある各画素が属するクラスタ(領域)番号の情報を見て、各クラスタ(領域)の出現頻度の統計をとる。そして、ステップS1504では、各クラスタ(領域)のクリップアート画像領域の辺上に出現する出現頻度に基づいて、出現頻度の高いクラスタ(領域)を背景領域と特定する。なお、取り扱う文書の種類に応じてよく使用されるイラストの種類は異なると考えられるので、背景領域であるかどうかの判定基準は実験的に決めればよい。例えば、辺上の全画素のうちの3分の1以上を含むようなクラスタを背景領域とする。
クリップアート領域内について、こうして特定された背景領域以外の領域が塗りつぶされる。
<クリップアートの背景特定処理例1>
図18は、本発明の第1の実施形態による画像処理において文書画像の例1(図3)から抽出されたクリップアート領域の背景特定処理結果である。図18では、クラスタ1801と1802という2つのクラスタにより領域が分割されている。クリップアート領域の辺を構成する画素群1803を対象として、属するクラスタの統計を取ると、図18の場合、全数がクラスタ1802に属することが分かる。したがって、このクリップアート矩形領域の四辺にある画素群1803が属するクラスタ番号の割合により、クラスタ1802の部分領域は背景領域として特定される。このため、クラスタ1801の領域に対応するカラー文書画像の画素は、ベクトルデータに変換されてベクトル層に格納されるとともに、圧縮データ層に格納される背景となるカラー文書画像上では背景領域1802の色で塗り潰される。
<クリップアートの背景特定処理例2>
図19は、本発明の第1の実施形態による画像処理においてクリップアート領域の例2である。このクリップアート画像は領域分割処理により緑色クラスタ2001、黄色クラスタ2002、青色クラスタ2003、紫色クラスタ2004の四つの領域に分けられる。背景特定処理では、このクリップアート画像の矩形領域の四辺を構成する画素群1901のクラスタ情報(特にクラスタ番号)の出現頻度を数える。その結果、緑色クラスタ2001に属する画素の数が一番多い、即ち、緑色クラスタの出現頻度が所定割合以上で高いので、緑色クラスタが背景領域と特定される。図20は、本発明の第1の実施形態による画像処理においてクリップアート領域(図19)の背景特定処理結果である。図20のグレー領域(2002,2003,2004)はベクトルデータに変換されるとともに、背景画像における塗りつぶし処理の対象となる。一方、それ以外の部分(緑色クラスタ2001に相当)は特定された背景領域であり、塗りつぶし対象にはならない。
<クリップアート領域の塗り潰し処理の例1>
図6は、本発明の第1の実施形態による画像処理において文書画像の一例(図3)にクリップアート領域の塗りつぶし処理を行った結果を示す図である。図3のクリップアート領域33は、図4のクリップアート領域分割処理により、領域中の画素は、色の異なるクラスタに分類される。図4では、背景上にプリンタの絵が描かれているので、背景とプリンタを構成するいくつかの色のクラスタに分割される。そして図5の手順で辺を構成する画素の属するクラスタの統計が集計され、領域の辺に出現する頻度が高いクラスタが背景のクラスタと特定される。そして、圧縮データ層(背景レイヤ)に格納される背景画像(カラー画像)において、背景クラスタ以外のクラスタに属する画素は、背景の色で置換される(すなわち背景色で塗りつぶされる)ことになる。なお図6では文字がそのまま残っているが、これはこの説明がクリップアート領域にのみ着目しているためであり、文字領域は別途ベクトル化され、背景色で塗りつぶされることが望ましい。
<クリップアート領域の塗り潰し処理の例2>
図22は、本発明の第1の実施形態による画像処理において文書画像からクリップアート領域を選択した例2を示す図である。図22に示す文書画像では、弱いグラデーションの背景部分を含むグラフィックス領域(クリップアート領域)34がある。このグラフィックス領域を色ごとにクラスタリングすると、イラスト部分(中央の丸い2つの領域)のクラスタと、それ以外のグラデーションしている部分のクラスタとに分かれるものとする。このとき、グラデーションしている部分のクラスタは、グラフィックス領域の辺の大部分を占めるので、背景領域として特定される。イラスト部分のクラスタはベクトルデータに変換されるが、背景領域のクラスタの部分はベクトルデータにしない。そして、背景となるカラー文書画像(背景画像)上では、ベクトルデータにしたイラスト部分では塗りつぶし処理が行われ、背景領域のクラスタ部分では塗りつぶし処理が行われずに、元のグラデーション画像のまま残すことになる。図24は、背景画像となる文書画像の例2(図22)にクリップアート領域の塗りつぶし処理を行った結果を示す図である。クリップアート画像の背景以外の部分のみを塗り潰し、背景部分は塗りつぶさないので、背景色がグラデーションする部分はそのまま保持することができる。もし本実施形態の処理を行わずにグラフィックス領域34全体をベクトルデータに変換したならば、背景部分のクラスタも1色のベクトルデータに変換されてしまい、図23のように背景のグラデーション部分がなくなってしまう。
以上説明したように、第1の実施例によれば、文書画像から領域分離されたクリップアート領域をクラスタリングし、背景のクラスタとイラスト本体のクラスタとに特定する。カラー文書画像において、背景以外のクラスタの部分のみを背景色で塗り潰し、その塗り潰し処理の結果えられた画像データをJPEG圧縮して圧縮データ層に格納する。また、クリップアート領域の背景以外のクラスタ部分(イラスト本体部分)はベクトル変換され、ベクトルデータとして、文字などのベクトルデータとともにベクトル層に格納する。なお、このような圧縮データ層とベクトル層とからなる文書ファイルは、再生すると、圧縮データ層のJPEGデータを展開した画像の上に、ベクトル層のベクトルデータを展開することになる。
クリップアートのベクトル化により文書画像のベクトル層のさらなる高編集化、高画質化、高圧縮化が可能となり、また、クリップアートの塗り潰し処理、クリップアート塗り潰し画像の圧縮により文書画像の圧縮データ層のさらなる高圧縮性が可能となる。また、クリップアートの背景部分が弱いグラデーションであったとしても、その背景部分は、塗りつぶされず、1色のベクトルデータにも変換されないので、文書ファイルは元の弱いグラデーションを再現することができる。
[第2の実施形態]
ここでは、クリップアート領域の一部が、他の写真などの領域と重なっている場合に、背景領域の特定と塗り潰し処理をどのように行うかについて説明する。
図15は、文書画像からクリップアート領域を選択した例を示す図である。図15に示す文書画像では、写真領域31がクリップアート領域33の上に重なっている。もしクリップアート領域全体に対して塗りつぶし処理を行うと、図17のようにクリップアート領域に重なっている写真領域の一部が塗りつぶされてしまうことになる。そこで、本実施形態では、クリップアート領域を色でクラスタリングした後、第1の実施形態のようにして背景領域のクラスタを特定すると共に、他の写真領域が重なっていないか判定する。他の写真領域が重なっていると判定した場合は、当該重なっている位置に対応するクラスタも背景領域のクラスタとして特定する。図16は、本実施形態による画像処理において、図15の文書画像の例にクリップアート領域の塗りつぶし処理を行った結果を示す図である。写真領域が重なっている部分のクラスタに対しては塗りつぶし処理が行われないので、元の写真領域31がそのまま残ることになる。
このように、クリップアート領域のイラスト本体部分以外が背景領域として特定されるので、塗りつぶし処理が精度よく行われるので、生成される文書ファイルを再生したときに元画像の再現性の精度が高くなる。
[第3の実施形態]
第1実施形態では、クリップアートの背景特定処理の際に、領域の辺にある画素のクラスタ情報を用いた。これに対して第3実施形態では、クリップアート領域の一部領域(角付近、辺の中央付近)にある画素に注目し、これらの画素のクラスタ情報を使い、頻度の高いクラスタを背景クラスタと特定する。
本実施形態では、背景領域の特定のために、クリップアート(非写真画像)領域中において、非写真画像領域の辺(端部)を含むサンプル領域を設定し、サンプル領域中最も多くの画素が属するクラスタを背景領域として特定する。
<クリップアートの背景特定処理例1>
図19は、クリップアート領域の例を示す。このクリップアート画像は領域分割処理により緑色クラスタ2001、黄色クラスタ2002、青色クラスタ2003、紫色クラスタ2004の四つの領域に分けらたものとする。図21は、本実施形態による画像処理において、クリップアート領域(図19)の背景特定処理に使われるサンプル領域2101〜2108(黒い部分)を示す。サンプル領域は、クリップアート領域の角付近、辺の中央付近に設定される。背景特定処理では、このサンプル領域に含まれる画素に注目し、これらの画素の属するクラスタを集計し、出現頻度の高いクラスタを背景のクラスタとする。図21では緑色クラスタ2001に属する画素の数が一番多い、即ち、緑色クラスタの出現頻度が一番高いので、緑色クラスタを背景領域と特定する。
この実施形態では、サンプル領域は図21のような黒い形の部分に設定したが、これに限るものではない。例えば、対象とするクリップアート領域に応じて、設定するサンプル領域の位置を変えても構わない。
[第4の実施形態]
クリップアート領域は背景部分が薄い色を持つ画像が多い。このような画像を第1の実施形態のように処理してもいいが、背景色は色が薄いという特性を利用すれば、クリップアートの塗り潰し処理に際して背景部分の特定ができる。第4実施形態では、クリップアートの背景特定処理に、各クラスタの彩度情報に基づき背景特定を行う。すなわち、本実施形態では、彩度が予め定めた基準彩度よりも小さい色を持ち、かつ予め定めた基準画素数よりも大きなクラスタを背景領域として特定する。
第4実施形態に係るクリップアート領域の塗り潰し処理及び文書ファイルの合成処理を行う機能を有する画像処理装置の構成ブロック図、また、フローチャートは第1実施形態と同じである。ただし、クリップアート背景特定処理(図5)が異なり、図7のような処理となる。
図7は、第4実施形態のクリップアート背景特定処理についての概略を説明するためのフローチャートである。先ず、ステップS1501では、クリップアートの領域分割結果を入力する。そして、ステップS2502では、各クラスタの色情報をRGB情報から彩度情報Sを取り出す。彩度情報の取り出すための一手段としてはRGBカラー空間からHSVカラー空間へ変換する方法があるが、それ以外の彩度情報を求める手法も考えられる。そして、ステップS2503では、各クラスタの基準色の彩度情報を分析する。ここではたとえば、クラスタの基準色の彩度を、彩度しきい値と比較し、大小関係を判定しておく。イラストで作られたクリップアートであってもスキャンノイズのあるクリップアートであっても、背景部分の色が薄い画像の場合は、彩度Sも相当低い。この特性を利用して、ステップS2504では、背景領域を特定する。彩度Sが彩度閾値(たとえば10)より低く、かつ、クラスタがサイズ閾値よりも大きければ、このクラスタを背景領域と判定する。他の処理は第1実施形態と同じである。こうすることでより簡単な処理で背景を特定することができる。
[第5実施形態]
本実施形態では、出現頻度がある定めた誤差範囲内のクラスタが多数ある場合は、さらに第4実施形態のクリップアートの彩度情報により背景領域の判定をする。その時、彩度が低い領域を背景領域と判定する。
すなわち、クリップアート領域のクラスタのうち、最も画素数の多いクラスタと比べて、画素数の差が基準値以内であるような他のクラスタがある場合、彩度を参照して背景色を決定する。たとえば、この様な場合には、それらクラスタ(すなわち最も画素数の多いクラスタと他のクラスタとを含むクラスタ)の中で最も色の彩度が低いクラスタを前記背景領域として特定する。
[第6実施形態]
本実施形態では背景特定のために、非写真画像領域から背景として特定したクラスタの周囲を、予め定めた幅だけ拡張し、拡張された部分を背景領域に含めて背景を特定する。これは以下の理由による。すなわち、スキャンにより文書画像にあるクリップアート領域、特に境界線部分がボケたり、ノイズが多数存在したりする場合は多い。このような場合、領域分割により境界線にある画素は必ずしも同じクラスタ(領域)に属するわけではないので、背景特定後に背景以外の部分のみを塗り潰すと、背景領域に属していない画素は塗り潰し処理の対象外になる。このような画素の元色は背景領域の色に近いものなので、塗り潰し処理対象外であっても、クリップアートの塗り潰し処理の最終結果ではあまり目立つことはない。しかし、画像を綺麗にすれば圧縮率も良くなるし、見た目手も良くなる。そのため、第6の実施形態では、背景特定処理で特定された背景以外領域を周囲何画素分(今回の場合は2画素)の範囲まで膨張して塗り潰す。
<装置構成>
図8は、本発明の第6実施形態に係るクリップアート領域の塗り潰し処理及び合成文書ファイルの生成処理を行う機能を有する画像処理装置の構成を示すブロック図である。図8において、ユニット10は文書画像を入力する入力部、ユニット11は文書画像を文字や写真等の領域に分離する領域分離部である。ユニット12は領域分離の結果から属性がグラフィックスであるグラフィックス領域を抽出するグラフィックス領域の抽出部、ユニット13はグラフィックス領域からクリップアート領域であるかを判定するクリップアート領域判定部である。ユニット14はクリップアート画像にある各画素を色特徴に基づき領域に分割する領域分割部、ユニット15は領域分割結果に基づきクリップアート領域の背景部分を特定する背景特定部である。ユニット30は背景特定処理で特定された背景以外領域を周囲何画素分範囲まで膨張するクリップアート背景以外部分の膨張部、ユニット16は背景以外の部分を背景色で塗り潰すクリップアート背景以外部分の塗り潰し処理部である。ユニット17はクリップアート部の塗り潰し処理の結果を圧縮する画像圧縮部、ユニット18はクリップアートの領域分割結果をベクトルデータに変換するベクトル変換部、である。ユニット19は圧縮データ層とベクトル層のデータを合成して多層構成出力する文書ファイル合成部である。即ち、第1の実施形態に、背景以外の領域の膨張部30が追加されたものが第6の実施形態の画像処理装置になる。
<クリップアート領域の塗り潰し処理および文書ファイル合成処理の概要>
図9は、本発明の第6の実施形態におけるクリップアート領域の塗り潰し処理及び文書ファイル合成処理についての概略を説明するためのフローチャートである。図9は、図2の手順のステップS15とステップS16との間にステップS30を挿入したものである。そこでステップS30における処理についてのみ説明し、その他の説明は省略する。
クリップアート背景以外部分の膨張部30は、ステップS30において、ステップS15で特定された背景領域以外の領域を拡張する。具体的には、背景特定処理で特定された背景領域が背景以外の領域と接する部分について、背景領域の画素に関連づけられたクラスタ番号を、一定の幅にわたって背景以外のクラスタのクラスタ番号に書き換える。書き換え後のクラスタ番号は、クラスタ番号をこの後使用しないならば、背景領域のクラスタ番号以外の値であれば何でも良い。また、もし背景の特定が、画素の「背景」属性をセットすることでされているなら、該当する領域背景属性を解除することで背景領域以外の領域が拡張される。
背景以外の領域を拡張したなら、後の処理は第1実施形態と同様であり、拡張した背景以外の領域が、ステップS16で塗りつぶされる。
<クリップアートの背景以外部分の膨張処理>
クリップアートの背景以外部分の膨張処理について、図10を参照して説明する。図10は、黄色領域1001と水色領域1002と赤色領域1003と白色領域1004とを含むクリップアート画像の例である。背景特定処理により白色領域1004が背景領域と判定され、赤色領域1003と黄色領域1001と水色領域1002は背景以外の部分と判定される。図11は、背景以外部分の膨張処理により拡張されたクリップアートの背景以外部分の結果の例を示す。背景以外の各色領域は、それぞれ背景領域と接する境界部分について拡張部分1001e、1002e、1003eだけ拡張される。そして最終的に背景以外の部分となり、塗り潰し処理の対象となる。
この結果、背景と背景以外のオブジェクトとの境界付近にぼけ等があっても、その領域を含めて背景の色で塗りつぶされるので、再生される画像の品質が向上し、また圧縮率も向上する。
[第7実施形態]
本実施形態では、背景の特定の前に、特定された非写真領域中のから更に文字領域を特定して、特定された文字領域を文字の背景の色で塗りつぶす。
文書画像にある各領域が重なる場合は良くある。たとえば、文書画像にあるクリップアート領域の矩形中に文字領域が入っていることはしばしばある。その場合、クリップアート画像の領域分割処理や塗り潰し処理を行う前に、クリップアート領域の矩形中の文字を塗り潰す必要がある。本実施形態では、クリップアート領域に文字領域が含まれている(あるいは重複している)場合には、文字オブジェクトを先にベクトル化する。そして文字領域を塗りつぶした後、クリップアート領域のベクトル化及び塗り潰し処理を行う。これにより、文字を優先的にベクトル化することができる。
図12は、クリップアート領域と文字領域の一部が重なる文書画像を例である。このような画像に対しては、まず、文字領域の文字オブジェクトがベクトル化された後、文字オブジェクトの塗りつぶし処理が行われる。次に、クリップアート領域を対象として、クリップアート領域の色クラスタリングとベクトル化処理が行われ、クリップアート領域の塗りつぶし処理が行われる。クリップアート領域と文字オブジェクトが塗りつぶされた文書画像のJPEGデータは圧縮データ層に格納され、文字のベクトルデータとクリップアートのベクトルデータはベクトル層に格納されて、文書ファイルが生成される。この文書ファイルを再生した場合、塗りつぶされたカラー文書画像の上に、文字やクリップアートのベクトルデータが再生されることになる。図13は、塗りつぶされたカラー文書画像上に、文字のベクトルデータを再生した場合の図である。
<その他の実施形態>
以上、実施形態例を詳述したが、本発明は、例えば、システム、装置、方法、プログラム若しくは記憶媒体(記録媒体)等としての実施態様をとることが可能である。具体的には、複数の機器から構成されるシステムに適用しても良いし、また、一つの機器からなる装置に適用しても良い。
尚、本発明は、前述した実施形態の機能を実現するソフトウェアのプログラム(実施形態では図に示すフローチャートに対応したプログラム)を、システムあるいは装置に直接あるいは遠隔から供給する。そして、そのシステムあるいは装置のコンピュータが該供給されたプログラムコードを読み出して実行することによっても達成される場合を含む。
従って、本発明の機能処理をコンピュータで実現するために、該コンピュータにインストールされるプログラムコード自体も本発明を実現するものである。つまり、本発明は、本発明の機能処理を実現するためのコンピュータプログラム自体も含まれる。
その場合、プログラムの機能を有していれば、オブジェクトコード、インタプリタにより実行されるプログラム、OSに供給するスクリプトデータ等の形態であっても良い。
プログラムを供給するための記録媒体としては、例えば、以下のようなものがある。フレキシブルディスク、ハードディスク、光ディスク、光磁気ディスク、MO、CD−ROM、CD−R、CD−RW、磁気テープ、不揮発性のメモリカード、ROM、DVD(DVD−ROM,DVD−R)。
その他、プログラムの供給方法としては、クライアントコンピュータのブラウザを用いてインターネットのホームページからハードディスク等の記録媒体にダウンロードすることによっても供給できる。すなわち、ホームページに接続し、該ホームページから本発明のコンピュータプログラムそのもの、もしくは圧縮され自動インストール機能を含むファイルをダウンロードする。また、本発明のプログラムを構成するプログラムコードを複数のファイルに分割し、それぞれのファイルを異なるホームページからダウンロードすることによっても実現可能である。つまり、本発明の機能処理をコンピュータで実現するためのプログラムファイルを複数のユーザに対してダウンロードさせるWWWサーバも、本発明に含まれるものである。
また、本発明のプログラムを暗号化してCD−ROM等の記憶媒体に格納してユーザに配布する。そして、所定の条件をクリアしたユーザに対し、インターネットを介してホームページから暗号化を解く鍵情報をダウンロードさせる。そして、その鍵情報を使用することにより暗号化されたプログラムを実行してコンピュータにインストールさせて実現することも可能である。
また、コンピュータが、読み出したプログラムを実行することによって、前述した実施形態の機能が実現される。その他にも、そのプログラムの指示に基づき、コンピュータ上で稼動しているOSなどが、実際の処理の一部または全部を行い、その処理によっても前述した実施形態の機能が実現され得る。
さらに、記録媒体から読み出されたプログラムが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後にも前述した実施形態の機能が実現される。すなわち、そのプログラムの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPUなどが実際の処理の一部または全部を行うことによっても前述した実施形態の機能が実現される。
本発明の第1の実施形態に係るクリップアート領域の塗り潰し処理及び合成文書ファイルの生成処理を行う機能を有する画像処理装置の構成を示すブロック図である。 本発明の第1の施形態に係るクリップアート領域の塗り潰し処理及び合成文書ファイルの生成処理についての概略を説明するためのフローチャートである。 本発明の第1の実施形態による画像処理において文書画像からクリップアート領域を選択した例1を示す図である。 本発明の第1の実施形態に係るクリップアートの領域分割処理についての概略を説明するためのフローチャートである。 本発明の第1の実施形態に係るクリップアートの背景特定処理についての概略を説明するためのフローチャートである。 本発明の第1の実施形態による画像処理において文書画像の一例にクリップアート領域の穴埋め(塗りつぶし)処理を行った結果を示す図である。 本発明の第4の実施形態に係るクリップアートの背景特定処理についての概略を説明するためのフローチャートである。 本発明の第6の実施形態に係るクリップアート領域の塗り潰し処理及び合成文書ファイルの生成処理を行う機能を有する画像処理装置の構成を示すブロック図である。 本発明の第6の実施形態に係るクリップアート領域の塗り潰し処理及び合成文書ファイルの生成処理についての概略を説明するためのフローチャートである。 本発明の第6の実施形態による画像処理において文書画像にあるクリップアート領域の例を示す図である。 本発明の第6の実施形態による画像処理において文書画像の例にクリップアート領域の背景以外部分の膨張処理を行った結果を示す図である。 本発明の第7の実施形態による画像処理において文書画像にあるクリップアート領域と文字領域が重なる例を示す図である。 本発明の第7の実施形態による画像処理において文書画像の例にクリップアート領域の穴埋め処理を行った結果を示す図である。 図1に示す画像処理装置を実現した一実施形態であるディジタル複合機(MFP)の主要部構成を示すブロック図である。 本発明の第2の実施形態に係る文書画像からクリップアート領域を選択した例を示す図である。 本発明の第2の実施形態による画像処理において文書画像の例にクリップアート領域の穴埋め処理を行った結果を示す図である。 クリップアート領域全体を塗り潰した結果を示す図である。 本発明の第1の実施形態による画像処理において文書画像の例から抽出されたクリップアート領域の背景特定処理結果を示す図である。 本発明の第1の実施形態による画像処理においてクリップアート領域の例を示す図である。 本発明の第1の実施形態による画像処理においてクリップアート領域の例の背景部分を特定した結果を示す図である。 本発明の第3の実施形態による画像処理においてクリップアート領域の例の背景特定処理際の周囲注目領域の取り出し例を示す図である。 文書画像からクリップアート領域を選択した例を示す図である。 クリップアート領域全体にベクトル化処理を行った結果を示す図である。 クリップアート領域のイラスト本体部分を塗り潰した結果を示す図である。
符号の説明
11 入力部
12 領域分離部
13 クリップアート領域抽出部
14 クリップアート領域分割部
15 クリップアート背景特定部
16 クリップアート背景以外部分の塗り潰し処理部
17 JPEG圧縮部
18 ベクトル変換部
19 文書ファイル合成部
30 クリップアート背景領域膨張部

Claims (15)

  1. 非写真画像領域を含む文書画像を符号化する画像処理装置であって、
    文書画像を領域分離して非写真画像領域を特定する領域特定手段と、
    前記非写真画像領域をベクトル化処理により符号化する第1の符号化手段と、
    前記非写真画像領域から背景領域を特定する背景特定手段と、
    前記非写真画像領域において、前記背景領域以外の領域を前記背景領域の色で塗り潰す塗り潰し手段と、
    前記塗り潰し手段により前記非写真画像領域における前記背景領域以外の領域が塗り潰された後の文書画像を、画像圧縮手順で符号化する第2の符号化手段と
    を備え、
    前記背景特定手段は、
    前記非写真画像領域を、クラスタ毎の基準色との距離が基準値以内の画素をグループ化したクラスタに分割し、
    前記非写真画像領域の端部に存在し、かつ当該端部の画素を所定の基準よりも多く含むクラスタを前記背景領域として特定することを特徴とする像処理装置。
  2. 非写真画像領域を含む文書画像を符号化する画像処理装置であって、
    文書画像を領域分離して非写真画像領域を特定する領域特定手段と、
    前記非写真画像領域をベクトル化処理により符号化する第1の符号化手段と、
    前記非写真画像領域から背景領域を特定する背景特定手段と、
    前記非写真画像領域において、前記背景領域以外の領域を前記背景領域の色で塗り潰す塗り潰し手段と、
    前記塗り潰し手段により前記非写真画像領域における前記背景領域以外の領域が塗り潰された後の文書画像を、画像圧縮手順で符号化する第2の符号化手段と
    を備え、
    前記背景特定手段は、前記非写真画像領域に写真画像領域が重なる場合、当該写真画像領域を前記背景領域として特定することを特徴とする像処理装置。
  3. 非写真画像領域を含む文書画像を符号化する画像処理装置であって、
    文書画像を領域分離して非写真画像領域を特定する領域特定手段と、
    前記非写真画像領域をベクトル化処理により符号化する第1の符号化手段と、
    前記非写真画像領域から背景領域を特定する背景特定手段と、
    前記非写真画像領域において、前記背景領域以外の領域を前記背景領域の色で塗り潰す塗り潰し手段と、
    前記塗り潰し手段により前記非写真画像領域における前記背景領域以外の領域が塗り潰された後の文書画像を、画像圧縮手順で符号化する第2の符号化手段と
    を備え、
    前記背景特定手段は、
    前記非写真画像領域を、クラスタ毎の基準色との距離が基準値以内の画素をグループ化したクラスタに分割し、
    前記非写真画像領域の中において、前記非写真画像領域の端部を含むサンプル領域を設定し、当該サンプル領域中の画素を所定の基準よりも多く含むクラスタを前記背景領域として特定することを特徴とする像処理装置。
  4. 非写真画像領域を含む文書画像を符号化する画像処理装置であって、
    文書画像を領域分離して非写真画像領域を特定する領域特定手段と、
    前記非写真画像領域をベクトル化処理により符号化する第1の符号化手段と、
    前記非写真画像領域から背景領域を特定する背景特定手段と、
    前記非写真画像領域において、前記背景領域以外の領域を前記背景領域の色で塗り潰す塗り潰し手段と、
    前記塗り潰し手段により前記非写真画像領域における前記背景領域以外の領域が塗り潰された後の文書画像を、画像圧縮手順で符号化する第2の符号化手段と
    を備え、
    前記背景特定手段は、
    前記非写真画像領域を、クラスタ毎の基準色との距離が基準値以内の画素をグループ化したクラスタに分割し、
    彩度が予め定めた基準彩度よりも小さい色を持ち、かつ予め定めた基準画素数よりも大きなクラスタを前記背景領域として特定することを特徴とする像処理装置。
  5. 非写真画像領域を含む文書画像を符号化する画像処理装置であって、
    文書画像を領域分離して非写真画像領域を特定する領域特定手段と、
    前記非写真画像領域をベクトル化処理により符号化する第1の符号化手段と、
    前記非写真画像領域から背景領域を特定する背景特定手段と、
    前記非写真画像領域において、前記背景領域以外の領域を前記背景領域の色で塗り潰す塗り潰し手段と、
    前記塗り潰し手段により前記非写真画像領域における前記背景領域以外の領域が塗り潰された後の文書画像を、画像圧縮手順で符号化する第2の符号化手段と
    を備え、
    前記背景特定手段は、
    前記非写真画像領域を、クラスタ毎の基準色との距離が基準値以内の画素をグループ化したクラスタに分割し、
    前記クラスタのうち、最も画素数の多いクラスタと比べて、画素数の差が基準値以内であるような他のクラスタがある場合、前記最も画素数の多いクラスタと前記他のクラスタとを含むクラスタの中で最も色の彩度が低いクラスタを前記背景領域として特定することを特徴とする像処理装置。
  6. 前記背景特定手段は、前記非写真画像領域から背景として特定したクラスタの周囲について、予め定めた幅を拡張し、拡張された部分を前記背景領域に含めることを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  7. 前記背景特定手段による背景の特定の前に、前記領域特定手段により特定された非写真領域の中から更に文字領域を特定する文字領域の特定手段と、
    前記文字領域を、当該文字の背景の色で塗りつぶす手段と
    を更に備えることを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  8. 前記第1の符号化手段は、前記非写真画像領域のうちの前記背景領域以外の領域についてのベクトルデータを生成することを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  9. 前記第1の符号化手段で符号化することにより生成されるベクトルデータと前記第2の符号化手段で符号化することにより得られる圧縮データとを格納した文書ファイルを生成する文書ファイルの生成手段を、更に有することを特徴とする請求項1乃至のいずれか1項に記載の画像処理装置。
  10. ンピュータを、請求項1乃至9のいずれか1項に記載の画像処理装置の各手段として機能させることを特徴とするプログラム。
  11. 非写真画像領域を含む文書画像を符号化する画像処理装置による画像符号化方法であって、
    領域特定手段が、文書画像を領域分離して非写真画像領域を特定する領域特定工程と、
    第1の符号化手段が、前記非写真画像領域をベクトル化処理により符号化する第1の符号化工程と、
    背景特定手段が、前記非写真画像領域から背景領域を特定する背景特定工程と、
    塗り潰し手段が、前記非写真画像領域において、前記背景領域以外の領域を前記背景領域の色で塗り潰す塗り潰し工程と、
    第2の符号化手段が、前記塗り潰し工程において前記非写真画像領域における前記背景領域以外の領域が塗り潰された後の文書画像を、画像圧縮手順で符号化する第2の符号化工程と
    を有し、
    前記背景特定工程では、
    前記非写真画像領域を、クラスタ毎の基準色との距離が基準値以内の画素をグループ化したクラスタに分割し、
    前記非写真画像領域の端部に存在し、かつ当該端部の画素を所定の基準よりも多く含むクラスタを前記背景領域として特定することを特徴とする画像符号化方法。
  12. 非写真画像領域を含む文書画像を符号化する画像処理装置による画像符号化方法であって、
    領域特定手段が、文書画像を領域分離して非写真画像領域を特定する領域特定工程と、
    第1の符号化手段が、前記非写真画像領域をベクトル化処理により符号化する第1の符号化工程と、
    背景特定手段が、前記非写真画像領域から背景領域を特定する背景特定工程と、
    塗り潰し手段が、前記非写真画像領域において、前記背景領域以外の領域を前記背景領域の色で塗り潰す塗り潰し工程と、
    第2の符号化手段が、前記塗り潰し工程において前記非写真画像領域における前記背景領域以外の領域が塗り潰された後の文書画像を、画像圧縮手順で符号化する第2の符号化工程と
    を有し、
    前記背景特定工程では、前記非写真画像領域に写真画像領域が重なる場合、当該写真画像領域を前記背景領域として特定することを特徴とする画像符号化方法。
  13. 非写真画像領域を含む文書画像を符号化する画像処理装置による画像符号化方法であって、
    領域特定手段が、文書画像を領域分離して非写真画像領域を特定する領域特定工程と、
    第1の符号化手段が、前記非写真画像領域をベクトル化処理により符号化する第1の符号化工程と、
    背景特定手段が、前記非写真画像領域から背景領域を特定する背景特定工程と、
    塗り潰し手段が、前記非写真画像領域において、前記背景領域以外の領域を前記背景領域の色で塗り潰す塗り潰し工程と、
    第2の符号化手段が、前記塗り潰し工程において前記非写真画像領域における前記背景領域以外の領域が塗り潰された後の文書画像を、画像圧縮手順で符号化する第2の符号化工程と
    を有し、
    前記背景特定工程では、
    前記非写真画像領域を、クラスタ毎の基準色との距離が基準値以内の画素をグループ化したクラスタに分割し、
    前記非写真画像領域の中において、前記非写真画像領域の端部を含むサンプル領域を設定し、当該サンプル領域中の画素を所定の基準よりも多く含むクラスタを前記背景領域として特定することを特徴とする画像符号化方法。
  14. 非写真画像領域を含む文書画像を符号化する画像処理装置による画像符号化方法であって、
    領域特定手段が、文書画像を領域分離して非写真画像領域を特定する領域特定工程と、
    第1の符号化手段が、前記非写真画像領域をベクトル化処理により符号化する第1の符号化工程と、
    背景特定手段が、前記非写真画像領域から背景領域を特定する背景特定工程と、
    塗り潰し手段が、前記非写真画像領域において、前記背景領域以外の領域を前記背景領域の色で塗り潰す塗り潰し工程と、
    第2の符号化手段が、前記塗り潰し工程において前記非写真画像領域における前記背景領域以外の領域が塗り潰された後の文書画像を、画像圧縮手順で符号化する第2の符号化工程と
    を有し、
    前記背景特定工程では、
    前記非写真画像領域を、クラスタ毎の基準色との距離が基準値以内の画素をグループ化したクラスタに分割し、
    彩度が予め定めた基準彩度よりも小さい色を持ち、かつ予め定めた基準画素数よりも大きなクラスタを前記背景領域として特定することを特徴とする画像符号化方法。
  15. 非写真画像領域を含む文書画像を符号化する画像処理装置による画像符号化方法であって、
    領域特定手段が、文書画像を領域分離して非写真画像領域を特定する領域特定工程と、
    第1の符号化手段が、前記非写真画像領域をベクトル化処理により符号化する第1の符号化工程と、
    背景特定手段が、前記非写真画像領域から背景領域を特定する背景特定工程と、
    塗り潰し手段が、前記非写真画像領域において、前記背景領域以外の領域を前記背景領域の色で塗り潰す塗り潰し工程と、
    第2の符号化手段が、前記塗り潰し工程において前記非写真画像領域における前記背景領域以外の領域が塗り潰された後の文書画像を、画像圧縮手順で符号化する第2の符号化工程と
    を有し、
    前記背景特定工程では、
    前記非写真画像領域を、クラスタ毎の基準色との距離が基準値以内の画素をグループ化したクラスタに分割し、
    前記クラスタのうち、最も画素数の多いクラスタと比べて、画素数の差が基準値以内であるような他のクラスタがある場合、前記最も画素数の多いクラスタと前記他のクラスタとを含むクラスタの中で最も色の彩度が低いクラスタを前記背景領域として特定することを特徴とする画像符号化方法。
JP2008120763A 2008-05-02 2008-05-02 画像処理装置及び画像符号化方法 Active JP5047051B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2008120763A JP5047051B2 (ja) 2008-05-02 2008-05-02 画像処理装置及び画像符号化方法
US12/432,261 US8331671B2 (en) 2008-05-02 2009-04-29 Image processing apparatus and image encoding method related to non-photo image regions

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2008120763A JP5047051B2 (ja) 2008-05-02 2008-05-02 画像処理装置及び画像符号化方法

Publications (3)

Publication Number Publication Date
JP2009272834A JP2009272834A (ja) 2009-11-19
JP2009272834A5 JP2009272834A5 (ja) 2011-06-02
JP5047051B2 true JP5047051B2 (ja) 2012-10-10

Family

ID=41257120

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2008120763A Active JP5047051B2 (ja) 2008-05-02 2008-05-02 画像処理装置及び画像符号化方法

Country Status (2)

Country Link
US (1) US8331671B2 (ja)
JP (1) JP5047051B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140099183A (ko) * 2013-02-01 2014-08-11 삼성전자주식회사 이미지 처리 장치, 이미지 처리 방법, 컴퓨터 판독가능 기록매체 및 화상형성장치

Families Citing this family (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7266254B2 (en) * 2002-02-13 2007-09-04 Canon Kabushiki Kaisha Data processing apparatus, image processing apparatus, and method therefor
JP4533327B2 (ja) * 2006-02-23 2010-09-01 キヤノン株式会社 画像処理装置及び方法、コンピュータプログラム及び記憶媒体
JP5153676B2 (ja) * 2009-02-10 2013-02-27 キヤノン株式会社 画像処理装置、画像処理方法、プログラムおよび記憶媒体
JP4780215B2 (ja) * 2009-03-27 2011-09-28 富士ゼロックス株式会社 画像処理装置および画像処理プログラム
JP5208043B2 (ja) * 2009-04-16 2013-06-12 キヤノン株式会社 画像処理装置、画像処理方法及びプログラム
JP2012098935A (ja) * 2010-11-02 2012-05-24 Canon Inc 図形処理装置、図形処理方法、コンピュータプログラム
AU2010257408B2 (en) * 2010-12-23 2013-10-03 Canon Kabushiki Kaisha Colour encoding clustering
JP2012205181A (ja) * 2011-03-28 2012-10-22 Fuji Xerox Co Ltd 画像処理装置およびプログラム
US9846256B2 (en) * 2011-08-09 2017-12-19 Schlumberger Technology Corporation Interactive display of results obtained from the inversion of logging data
US8891870B2 (en) * 2012-11-09 2014-11-18 Ge Aviation Systems Llc Substance subtraction in a scene based on hyperspectral characteristics
DE102013204310A1 (de) 2013-03-13 2014-09-18 Siemens Aktiengesellschaft Betriebsverfahren für einen Rechner zur Bestimmung einer optimierten Messsequenz für eine bildgebende medizintechnische Anlage
JP6108220B2 (ja) * 2013-03-26 2017-04-05 ブラザー工業株式会社 画像処理装置、画像処理プログラム
CN104982026B (zh) 2014-02-03 2018-06-05 株式会社隆创 图像检查装置和图像检查方法
JP6145414B2 (ja) * 2014-02-21 2017-06-14 東芝テック株式会社 文書配布サーバ、及び文書配布サーバのプログラム
US9524440B2 (en) 2014-04-04 2016-12-20 Myscript System and method for superimposed handwriting recognition technology
US9384403B2 (en) 2014-04-04 2016-07-05 Myscript System and method for superimposed handwriting recognition technology
CN104866755B (zh) * 2015-06-11 2018-03-30 北京金山安全软件有限公司 应用程序解锁界面背景图片的设置方法、装置及电子设备
CN104866323B (zh) * 2015-06-11 2018-03-30 北京金山安全软件有限公司 一种解锁界面的生成方法、装置及电子设备
US9798924B2 (en) * 2015-08-17 2017-10-24 Kofax International Switzerland Sarl Content delineation in document images
JP6769045B2 (ja) * 2016-02-29 2020-10-14 ブラザー工業株式会社 画像処理装置、および、コンピュータプログラム
CN109740614B (zh) * 2018-11-20 2024-01-23 广东智媒云图科技股份有限公司 一种获取用于叶雕的叶片背景图的方法及装置
CN110780961B (zh) * 2019-10-15 2022-12-27 深圳创维-Rgb电子有限公司 一种调整应用界面文字颜色的方法、存储介质及终端设备

Family Cites Families (17)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5680479A (en) 1992-04-24 1997-10-21 Canon Kabushiki Kaisha Method and apparatus for character recognition
JP2885999B2 (ja) 1992-07-29 1999-04-26 キヤノン株式会社 画像処理装置及びその方法
DE69332283D1 (de) 1992-06-11 2002-10-17 Canon Kk Verfahren und Einrichtung zur Bildverarbeitung
JP4046465B2 (ja) * 1999-09-17 2008-02-13 株式会社リコー 画像処理装置、画像処理方法、及び画像処理システム
US7133565B2 (en) 2000-08-25 2006-11-07 Canon Kabushiki Kaisha Image processing apparatus and method
JP4366003B2 (ja) 2000-08-25 2009-11-18 キヤノン株式会社 画像処理装置及び画像処理方法
JP4122703B2 (ja) * 2000-11-22 2008-07-23 沖電気工業株式会社 画像処理装置
JP4251629B2 (ja) 2003-01-31 2009-04-08 キヤノン株式会社 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
JP4235583B2 (ja) 2003-05-26 2009-03-11 株式会社リコー 画像処理装置、画像処理用プログラム及び記憶媒体
JP4228905B2 (ja) * 2003-12-18 2009-02-25 富士ゼロックス株式会社 画像処理装置及びプログラム
EP1555804A3 (en) 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium
JP2006262232A (ja) * 2005-03-18 2006-09-28 Ricoh Co Ltd 画像処理装置、画像処理方法、プログラムおよび記録媒体
US7623712B2 (en) * 2005-06-09 2009-11-24 Canon Kabushiki Kaisha Image processing method and apparatus
JP4766661B2 (ja) 2005-06-09 2011-09-07 キヤノン株式会社 画像処理方法及び画像処理装置
JP4764231B2 (ja) * 2006-03-31 2011-08-31 キヤノン株式会社 画像処理装置、制御方法、コンピュータプログラム
JP2007335982A (ja) * 2006-06-12 2007-12-27 Canon Inc 画像処理装置及び方法、並びにプログラム及び記憶媒体
JP2008028717A (ja) * 2006-07-21 2008-02-07 Canon Inc 画像処理装置および方法、プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20140099183A (ko) * 2013-02-01 2014-08-11 삼성전자주식회사 이미지 처리 장치, 이미지 처리 방법, 컴퓨터 판독가능 기록매체 및 화상형성장치
KR101887929B1 (ko) * 2013-02-01 2018-08-13 에이치피프린팅코리아 주식회사 이미지 처리 장치, 이미지 처리 방법, 컴퓨터 판독가능 기록매체 및 화상형성장치

Also Published As

Publication number Publication date
US20090274363A1 (en) 2009-11-05
US8331671B2 (en) 2012-12-11
JP2009272834A (ja) 2009-11-19

Similar Documents

Publication Publication Date Title
JP5047051B2 (ja) 画像処理装置及び画像符号化方法
JP5302768B2 (ja) 画像処理装置及び画像処理方法
JP4766661B2 (ja) 画像処理方法及び画像処理装置
JP4799246B2 (ja) 画像処理方法及び画像処理装置
US7623712B2 (en) Image processing method and apparatus
JP5028337B2 (ja) 画像処理装置、画像処理方法、プログラム、及び記憶媒体
US8244035B2 (en) Image processing apparatus and control method thereof
JP5219706B2 (ja) 画像処理装置、画像処理方法、及び、画像処理プログラム
JP4632443B2 (ja) 画像処理装置及び画像処理方法並びにプログラム
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
JP4739082B2 (ja) 画像処理方法及び画像処理装置
US8810877B2 (en) Image processing apparatus, image processing method, and storage medium for eliminating blurring of scanned image
JP4441300B2 (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP4748789B2 (ja) 画像処理方法及び画像処理装置
JP2007005907A (ja) 画像処理方法、画像処理装置、画像処理プログラム及び記録媒体
JP2007088912A (ja) 画像処理装置およびプログラム
JP2005204206A (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP4383187B2 (ja) 画像処理装置、画像処理用プログラム及び記憶媒体
JP2005341098A (ja) 画像処理装置、プログラム、及び記憶媒体
JP2005303506A (ja) 画像処理装置、画像処理方法、画像処理用プログラム及び記憶媒体

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110420

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20110420

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20120327

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20120330

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20120525

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20120615

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20120717

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20150727

Year of fee payment: 3

R151 Written notification of patent or utility model registration

Ref document number: 5047051

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151