JP2010028819A

JP2010028819A - 画像処理装置、画像処理方法及び画像読取装置

Info

Publication number: JP2010028819A
Application number: JP2009171280A
Authority: JP
Inventors: Atsushi Tabata; 淳田畑; Hiroki Sugano; 浩樹菅野; Shunichi Mekawa; 俊一女川; Masaaki Yasunaga; 真明安永
Original assignee: Toshiba Corp; Toshiba TEC Corp
Current assignee: Toshiba Corp; Toshiba TEC Corp
Priority date: 2008-07-22
Filing date: 2009-07-22
Publication date: 2010-02-04

Abstract

【課題】従来の圧縮技術で構成されていた高圧縮ファイルを低い処理コストで圧縮して生成することのできる画像処理装置、画像処理方法及び画像読取装置を提供する。
【解決手段】入力された画像信号が表わす画像の各画素が特定の種類の画素か否かを識別する識別信号を出力する識別部１００１と、前記画像信号と前記識別信号とを用いて、前記画像における前記文字の画素を含む領域の座標を表す座標情報と、当該文字を含む領域の色を表す文字色情報と、を表わす描画コマンドを生成する色情報算出部１００４と、前記画像信号と前記識別信号とを用いて、前記画像から前記特定の種類の画素を除去した画像を表わす第１の画像信号を出力する画像分離部１００３と、前記第１の画像信号と前記識別信号とを圧縮して圧縮信号を出力する圧縮部１００５と、前記圧縮信号と前記描画コマンドとを１つのファイルとして記憶する記憶部１００８とを備える画像処理装置である。
【選択図】図１

Description

本発明は、画像圧縮技術に関わり、特に文字や写真を識別して圧縮する方式に関わる。

画像情報は大容量となるため、一般に圧縮を行い保存・使用している。特にカラー画像などに対しては離散コサイン変換（DCT: Discrete Cosine Transform）をベースとした圧縮技術であるＪＰＥＧ（Joint Photographic Expert Group）が普及しており、Ｗａｖｅｌｅｔ変換をベースとしたＪＰＥＧ２０００も規格化されている。

しかしながら、これらの技術は何れも写真画像を主要な対象としており、オフィス等における文書画像に対しては必ずしも十分な性能を発揮できていない。文書画像に対処する方式として、文字及び写真を識別して、それぞれ異なる圧縮方式で圧縮し一つのフォーマットとして扱う技術が種々考案されている。

特許文献１に記載された技術では、画像を文字と非文字の領域に分離し、それぞれに適した圧縮を行う。この際、文字領域を周囲の画素値で埋めることによって文字領域を除去している。これによって、非文字領域を１枚の画像として圧縮することができ、圧縮率を高めることができる。

特許文献２に記載された圧縮方法を図１０（Ａ）に示す。まず画像中の文字領域を抽出する。そして、文字領域の各領域毎に文字代表色を算出して、各領域を２値の形状情報と文字代表色とに分離する。次に、文字領域を取り除いた写真領域画像を生成し、形状情報・写真領域画像それぞれに適した圧縮を行なう。

特許文献３に記載された圧縮方法を図１０（Ｂ）に示す。まず画像中の文字領域を抽出する。そして、文字領域を２値の形状情報と文字領域の色を表す情報とに分離する。次に、文字領域を取り除いた写真領域画像を生成し、形状情報、文字領域の色情報、写真領域画像それぞれに適した圧縮を行う。

特許文献４に記載された圧縮方法を図１０（Ｃ）に示す。まず画像中の文字領域を抽出する。そして、文字領域の色毎に２値の形状情報を生成する。次に、文字領域を取り除いた写真領域画像を生成し、各色の２値形状情報、写真領域画像それぞれに適した圧縮を行なう。

非特許文献１，２には、特許文献１乃至４に開示されたような複数の圧縮方式を混在させた、画像の具体的なフォーマット規格及びアプリケーションが記載されている。

ところで、特許文献１乃至４に記載された技術は、非特許文献１、２に示した規格・アプリケーションに従っているものの、文字等のエッジ情報の圧縮にはＭＭＲ等の２値の圧縮、背景画像にはＪＰＥＧ等の多値の圧縮とそれぞれ異なる圧縮技術を用いて実現されている。即ち、従来の技術では、画像毎に適応する圧縮ファイルを実現しようとするために複数の圧縮フォーマット技術を組み合せて実現する必要があった。

一方、画像の表現方法として、ＰＤＦ（Portable Document Format）やＸＰＳ（XML Paper Specification）が知られている。これらの表現方法では、複数の圧縮コード、フォント、ベクトル記述を組み合せて画像を表現することができる。しかし、これらの表現方法では文字と写真に異なる圧縮を用いている。このため、符号化及び復号化処理において、複数の符号化方式に対応する必要が生じコストが増加するという欠点（問題点）がある。

本発明は斯かる事情に鑑みてなされたものであって、従来の圧縮技術で構成されていた高圧縮ファイルを低い処理コストで圧縮して生成することのできる画像処理装置、画像処理方法及び画像読取装置を提供することを目的とする。

上記課題を解決するための本発明は、入力された画像信号が表わす画像の各画素が特定の種類の画素か否かを識別する識別信号を出力する識別部と、前記画像信号と前記識別信号とを用いて、前記画像における前記文字の画素を含む領域の座標を表す座標情報と、当該文字を含む領域の色を表す文字色情報と、を表わす描画コマンドを生成する色情報算出部と、前記画像信号と前記識別信号とを用いて、前記画像から前記特定の種類の画素を除去した画像を表わす第１の画像信号を出力する画像分離部と、前記第１の画像信号と前記識別信号とを圧縮して圧縮信号を出力する圧縮部と、前記圧縮信号と前記描画コマンドとを１つのファイルとして記憶する記憶部とを備える画像処理装置である。

また本発明は、入力された画像信号が表わす画像の各画素が特定の種類の画素か否かを識別し、前記画像における前記文字の画素を含む領域の座標を表す座標情報と、当該文字を含む領域の色を表す文字色情報と、を表わす描画コマンドを生成し、前記画像の各画素が特定の種類の画素か否かを識別した結果を表わす信号と前記画像から前記特定の種類の画素を除去した画像を表わす信号とを圧縮した信号を生成し、この生成した信号と前記描画コマンドとを１つのファイルとして記憶する画像処理方法である。

また本発明は、原稿画像を読取って画像信号に変換する画像入力部と、前記画像信号が表わす画像の各画素が特定の種類の画素か否かを識別する識別信号を出力する識別部と、前記画像信号と前記識別信号とを用いて、前記画像における前記文字の画素を含む領域の座標を表す座標情報と、当該文字を含む領域の色を表す文字色情報と、を表わす描画コマンドを生成する色情報算出部と、前記画像信号と前記識別信号とを用いて、前記画像から前記特定の種類の画素を除去した画像を表わす第１の画像信号を出力する画像分離部と、前記第１の画像信号と前記識別信号とを圧縮して圧縮信号を出力する圧縮部と、前記圧縮信号と前記描画コマンドとを１つのファイルとして記憶する記憶部とを備える画像読取装置である。

本発明によれば、従来の圧縮技術で構成されていた高圧縮ファイルを低い処理コストで圧縮して生成することができる。

第１の実施の形態の画像処理装置の構成を示す図。識別部の構成を示す図。画像分離部の構成を示す図。色情報算出部の構成を示す図。文字領域座標信号の算出方法を説明する図。識別信号、文字色情報、分離画像信号を生成する動作を説明するための図。ＨＤＰｈｏｔｏの圧縮処理の構成を示す図。フォーマット変換部での記述例。画像表現を説明するための図。従来の高圧縮ファイルの生成例を示す図。色情報算出部のバリエーションの構成を示す図。第２の実施の形態の画像処理装置の構成を示す図。色情報算出部の構成を示す図。画像分離部の構成を示す図。第２の実施の形態の画像処理装置による画像処理方法を説明するための図。フォーマット変換部での記述例。第２の実施の形態のバリエーションを示す図。第３の実施の形態の画像処理装置の構成を示す図。クライアントＰＣとファイル変換部の動作を説明するための図。ファイル変換部の構成を示す図。変更前のＸＰＳファイルの内容を表す図。変更後のＸＰＳファイルの内容を表す図。本修正方法が適用できるファイルフォーマットを模式的に示す図。第１の実施の形態の画像処理装置による画像処理方法を説明するための図。第４の実施の形態の画像処理装置の構成を示す図。識別部の構成を示す図。画像分離部の構成を示す図。識別信号、第１の画像信号及び第２の画像信号を生成する動作を説明するための図。ＨＤＰｈｏｔｏの圧縮処理の構成を示す図。 αチャンネルを用いた画像合成方法を説明する図。従来の文字画像と非文字画像とを分離して高圧縮ファイルを生成する方法を説明する図である。ＨＤＰｈｏｔｏのコード体系を示す図。基本処理単位である１６×１６画素の周波数空間における周波数区分を表す図。圧縮部における第１の圧縮信号と第２の圧縮信号を生成する方法を説明するための図。フォーマット変換部が変換したＸＰＳのフォーマット記述を示す図。第１の圧縮信号と第２の圧縮信号を生成する他の方法を説明するための図。第１の圧縮信号と第２の圧縮信号を生成する更に他の方法を説明するための図。第５の実施の形態の画像処理装置の構成を示す図。ＸＰＳファイルの詳細の構成を示す図。ファイル変換部の構成を示す図。ファイル変換部の変換方法を模式的に示す図。第４の実施の形態の画像処理装置の構成を示す図。識別部の構成を示す図。画像分離部の構成を示す図。識別信号、第１の画像信号及び第２の画像信号を生成する動作を説明するための図。ＨＤＰｈｏｔｏの圧縮処理の構成を示す図。 αチャンネルを用いた画像合成方法を説明する図。従来の文字画像と非文字画像とを分離して高圧縮ファイルを生成する方法を説明する図である。フォーマット変換部が変換したＸＰＳのフォーマット記述を示す図。透過信号使用の他のパターンを説明するための図。ＭＦＰ１の外観斜視図。

[第１の実施の形態]
図１は、本発明の第１の実施の形態の画像処理装置の構成を示す図である。第１の実施の形態の画像処理装置は、画像入力部１００１、識別部１００２、画像分離部１００３、色情報算出部１００４、圧縮部１００５、フォーマット変換部１００６、制御部１００７及びＨＤＤ１００８を備えている。

続いて、画像処理装置の動作について説明する。
画像入力部１００１から出力された画像信号１０１０は、識別部１００２において文字／非文字が識別され、文字を「１」、非文字を「０」とする識別信号１０１１に変換される。この識別処理には、既知の識別技術を用いることができる。

画像分離部１００３には、画像信号１０１０と識別信号１０１１とが入力される。画像分離部１００３は、識別信号１０１１を用いて、画像信号１０１０から文字画像を除去した分離画像信号１０１２を生成して出力する。

色情報算出部１００４には、画像信号１０１０と識別信号１０１１とが入力される。色情報算出部１００４は、識別情報１０１１を用いて、画像信号１０１０から文字領域の座標１０１３とその文字色情報１０１４とを生成して出力する。

圧縮部１００５は識別信号１０１１と分離画像信号１０１２を１つの圧縮信号として圧縮して圧縮信号１０１５を出力する。即ち、文字を識別する信号（識別信号１０１１）と例えば写真が表された信号（分離画像信号１０１２）とが１つの圧縮信号１０１５に圧縮される。

フォーマット変換部１００６は、入力される文字領域の座標１０１３とその文字色情報１０１４と圧縮信号１０１５とからＸＰＳファイル１０１６を生成して出力する。生成されるＸＰＳファイル１０１６では、文字色情報１０１４の色と文字領域の座標１０１３の示す範囲とがグラフィック描画コマンドで記述され、更に、圧縮信号１０１５が重ね合わされる。

ＨＤＤ１００８は、ＸＰＳファイル１０１６を格納する。
制御部１００７は、画像処理装置を統括して制御する。

図２４は、第１の実施の形態の画像処理装置による画像処理方法を説明するための図である。
図２４（Ａ）は、画像信号１０１０が表す画像を表現している。この画像の左上には写真画像を表す球体が描かれ、下には赤色の文字（ＡＢ）と黒色の文字（ＣＤ）とが描かれている。図２４（Ｂ）に示す識別信号１０１１は、文字の部分のみが抽出されて、文字が「１」、非文字が「０」で表されている。なお、この識別信号１０１１には色の情報は含まれていない。分離画像信号１０１２には、写真画像のみが抽出されている。

図２４（Ｃ）の右側は、圧縮信号１０１５が表す画像を表現している。即ち、識別信号１０１１と分離画像信号１０１２とが圧縮されて１つの圧縮信号１０１５となっている。この圧縮信号１０１５には、色情報は含まれていない。色情報は、色情報算出部１００４で算出される文字領域座標信号１０１３と文字色情報１０１４とを用いて、図２４（Ｃ）の左側の図で表現される。

フォーマット変換部１００６は、この色情報をグラフィック描画コマンドで記述する。そして、この描画コマンドと圧縮信号１０１５を重ね合わせたＸＰＳファイル１０１６を生成する。図２４（Ｄ）には、生成されたＸＰＳファイル１０１６の表す画像が表現されている。

次に、画像処理装置の各部の構成と動作について詳細に説明する。
図２は、識別部１００２の構成を示す図である。識別部１００２は、画像信号１０１０から文字領域を識別した識別信号１０１１を出力する。

Ｄ−ＦＦ（遅延フリップフロップ）は、画像信号１０１０を保持し１画素走査（１クロック）期間遅延したタイミングで出力する。従って、平均化部１００２−１には、連続した３画素の画像信号が入力される。平均化部１００２−１は、連続する３画素の平均値信号１００２−６を算出する。次に、差分回路１００２−２が３画素平均値と中心の画素値との差分（≒微分）を求める。そして差分回路１００２−２は、差分がプラス、すなわち低濃度→高濃度に変化したときは、判定信号１００２−７に「１」を出力し、差分がマイナスすなわち高濃度→低濃度に変化したときは、判定信号１００２−７に「０」を出力する。

Ｄ−ＦＦ１００２−５には、判定信号１００２−７がクロックとしても入力される。このため、判定信号が変化した時に読み込まれた判定信号の値は、次に変化するまで保持される。すなわち、Ｄ−ＦＦ１００２−５の出力１００２−９は画像信号が低濃度→高濃度に変化して、次に高濃度→低濃度変化するまで「１」を保持し、画像信号が高濃度→低濃度に変化して、再び低濃度→高濃度変化するまで「０」を保持する。

レベル判定回路１００２−３は閾値１００２−８と平均値信号１００２−６とを比較し、平均値信号１００２−６が所定濃度以上であれば、レベル判定信号１００２−１０を「１」とし、それ以外のときはレベル判定信号１００２−１０を「０」とする。合成部１００２−４は出力１００２−９とレベル判定信号１００２−１０のＡＮＤを識別信号１０１１として出力する。

この識別部１００２の動作によれば、文字の領域に入ったことを表す低濃度→高濃度への変化が検出されたときから、文字の領域から出たことを表す高濃度→低濃度への変化が検出されるまでの範囲内であって所定濃度以上のときに文字である（＝「１」）として出力される。

図３は画像分離部１００３の構成を示す図である。画像分離部１００３は、識別信号１０１１を用いて、画像信号１０１０から文字画像を除去した分離画像信号１０１２を出力する。

Ｄ−ＦＦ１００３−０１には、識別信号１０１１の反転信号と同期信号ＣＬＫとのＡＮＤ信号がクロックとして入力される。このため識別信号１０１１が非文字領域「０」を示す時、分離画像信号１０１２には、そのときの画像信号１０１０が取り込まれて出力される。識別信号１０１１が文字領域「１」を示す時、直前の非文字領域（例えば、背景を表す信号）の画素信号がＤ−ＦＦ１００３−０１に更新されずに保持され、そのまま分離画像信号１０１２として出力される。

図４は色情報算出部１００４の構成を示す図である。色情報算出部１００４は、識別情報１０１１を用いて、画像信号１０１０から文字領域の座標信号１０１３とその文字色情報１０１４とを生成して出力する。

連続画素探索部１００４−１は、識別信号１０１１の連続した画素値（「１」＝文字）を示す領域を既知のチェインアルゴリズムを用いて８方向探索して検出する。そして、連続した文字の領域を矩形の左上、右下座標で表現した文字領域座標信号１０１３を出力する。

図５は、文字領域座標信号１０１３の算出方法を説明する図である。
図５（Ａ）に示すように、画素値（「１」＝文字）が連続している識別信号を順次探索すると、ａ，ｂ，ｃ，ｄで示した４点に代表される座標値を得ることが出来る。識別信号の探索中に、Ｘ、Ｙ座標の座標値のｍｉｎ、ｍａｘを保持するようにして探索を実行すれば、ａ，ｂ，ｃ，ｄ等を含む矩形の文字領域を示す最小値の座標（３，３）と最大値の座標（９，２０）を得ることが出来る。このようにして、連続画素探索部１００４−１は、文字領域座標１０１３に（３，３）−（９，２０）を出力する。

領域平均部１００４−２は、文字領域座標１０１３が表す領域内で、かつ識別信号１０１１が「１」（文字）を示す画像信号１０１０の画素値を平均し、その平均値を文字色情報１０１４として出力する。

図６は、識別信号１０１１、文字色情報１０１４、分離画像信号１０１２を生成する動作を説明するための図である。

図６（Ａ）は、識別部１００２による識別信号１０１１の生成を示している。画像信号１０１０で表される入力画像は、識別部１００２で処理されて出力１００２−９を生成する。出力１００２−９は文字、写真についてエッジで囲まれる内部領域を表している。レベル判定信号１００２−１０は、所定濃度以上のレベルの領域を表している。合成部１００２−４がこれらの両信号のＡＮＤ演算を行って、識別信号１０１１を生成する。

図６（Ｂ）は、色情報算出部１００４による文字色情報１０１４の算出内容を示している。色情報算出部１００４は、画像信号１０１０と識別信号１０１１とから文字の領域について処理を行う。即ち、図に示すように各文字の領域を示す文字領域座標１０１３とその内部の文字色情報１０１４（本例では文字濃度値）を出力する。なお、図中の点線は理解のための補助情報である。

図６（Ｃ）は、画像分離部１００３による分離画像信号１０１２の生成を示している。画像分離部１００３は、画像信号１０１０と識別信号１０１１とから、文字領域を直前の非文字領域画素（本例では背景白）で塗り潰し、文字領域を除いた画像として出力する。なお、図中の点線は理解のための補助情報である。

次に圧縮部１００５の動作について説明する。圧縮部１００５は、米Ｍｉｃｒｏｓｏｆｔ（登録商標）から公開されているＨＤＰｈｏｔｏ（登録商標）を利用している。
（ＨＤＰｈｏｔｏＤｅｖｉｃｅＰｏｒｔｉｎｇＫｉｔ１．０：ｈｔｔｐ：／／ｗｗｗ．ｍｉｃｒｏｓｏｆｔ．ｃｏｍ／ｊａｐａｎ／ｗｈｄｃ／ｘｐｓ／ｈｄｐｈｏｔｏｄｐｋ．ｍｓｐｘ）
図７は、ＨＤＰｈｏｔｏの圧縮処理の構成を示す図である。ＨＤＰｈｏｔｏでは、ＪＰＥＧと同じように、色変換、系列変換、量子化、エントロピー符号化等の手順で圧縮処理が実行される。

ＨＤＰｈｏｔｏは、ＪＰＥＧ等の多値圧縮ファイルに置き換わるものとして公開されているが、ＪＰＥＧと異なりＲＧＢやＧｒａｙ信号だけでなく、様々な入力信号・フォーマットに対応している。更に、αチャンネルと言われる透過画像もＧｒａｙ信号などと同様に圧縮・復号することができる。

αチャネルとは、一般の画像信号とは異なり画像と背景の重なりの関係を示す情報で、０→透過、２５５→不透明を表している。αチャネルが０の画素は画像でなく背景を表示し、αチャネルが２５５の画素は画像を表示し、その間の値は値によって背景・画像を合成して表示する。

圧縮部１００５では識別信号１０１１の文字を示す信号「１」を０（透過）、非文字を示す信号「０」を２５５（不透明）としたαチャンネルに変換し、分離画像信号１０１２と共に、一つのＨＤＰｈｏｔｏのオブジェクトとして圧縮した圧縮信号１０１５を生成する。

図８は、フォーマット変換部１００６での記述例である。それぞれの文字領域毎にその文字領域の色を表す文字色情報１０１４と、文字領域座標１０１３に基づく矩形領域とを描画コマンドによって表し、その上に圧縮信号１０１５を描画している。

図９は、上述の画像表現を説明するための図である。
画像を文字画像と非文字画像とに分割する。文字画像は、αチャンネルに変換する。即ち、文字の部分は透過した画像に変換する。そしてこの２つの画像を合成して圧縮する。一方、元の画像の文字の部分については、領域座標と色情報とから描画コマンドを用いて画像を生成する。そして、描画コマンドを用いて生成した画像を背景とし、圧縮された画像を描画することで原画像を表す。

従来の高圧縮ファイルの生成例を図１０に示す。図１０に示されるように、従来は複数の圧縮オブジェクトを組み合せて高圧縮ファイルを生成していた。本実施の形態では１つの圧縮オブジェクトと描画コマンドで高圧縮ファイルが生成されるので、ファイルの圧縮及び復号とも低コストに実現できる。

なお、本実施の形態では描画コマンドを用いて文字領域を矩形で表現したが、描画コマンドや文字領域の形状はこの形態に限定されるものではない。例えば、円、楕円などの文字領域を表す描画コマンドで記述されても良い。
また、本実施の形態では文字領域は領域内の平均値という単色表現で描画コマンドを記述したが、色の表現方法や色や濃度の算出方法もこの形態に限定されるものではない。

また、本実施の形態では各文字領域毎に逐一、領域情報と色情報を算出し描画コマンドを生成した例を示したが、この形態に限定されるものではない。

図１１は、色情報算出部１００４のバリエーションの構成を示す図である。
図１１（Ａ）に示す構成では、文字色が所定濃度以上であったときにのみ濃度比較器１００４−３が「１」を出力する。そのため、所定濃度以上の文字についてのみ文字領域座標１０１３、文字色情報１０１４が生成されるので、フォーマット変換部１００６は所定濃度以上の文字のみ描画コマンドを出力する。

従って、識別部１００２で白抜き文字を文字として出力した場合に、白抜き文字は所定濃度以下（黒が２５５、白が０とした場合）のため、描画コマンドは生成されない。通常描画コマンドの記述の無い領域はデフォルトで白と取り決めることが多いため、この取り決めを採用した場合は、描画コマンドが無くても白抜き文字が再現できる。即ち、より高圧縮な高圧縮ファイルを生成することができる。

また、図１１（Ｂ）に示す構成では、文字色が所定濃度以上であったときにのみ濃度比較器１００４−３が「１」を出力し、文字色が所定彩度以下であったときにのみ彩度比較器１００４−４が「１」を出力する。そのため、両者のＡＮＤ信号の反転信号を生成する事で、黒文字以外は文字領域座標１０１３、文字色情報１０１４が出力される構成とすることができる。この出力に対してフォーマット変換部１００６のＸＰＳファイルの記述を全面黒の描画コマンドの上に、黒以外の文字領域の描画コマンド及び圧縮コードを記述することで、一般的な文書で最も多い、黒文字に関して個別に描画コマンドを生成する必要がなくなる。従って、より高圧縮な高圧縮ファイルを生成することができる。

図１１（Ｃ）に示す構成では、最も指定される回数が多い文字色を色カウンタ１００４−５で算出して、最大色１００４−６として出力する。フォーマット変換部１００６ではＸＰＳファイルに、全面その最大色の描画コマンドを記述し、その上に、その文字色以外の描画コマンドを各領域毎に記述すれば、最も多い色文字に関して個別に描画コマンドを生成する必要がなくなる。従って、動的に高圧縮な高圧縮ファイルを提供することができる。

なお、色情報抽出部１００４の構成を示す図１１において不必要な描画コマンドを記載しない構成を示した。しかし、この形態に限定されず、フォーマット変換部１００６で描画コマンドを発行しないように構成することもできる。

[第２の実施の形態]
図１２は、本発明の第２の実施の形態の画像処理装置の構成を示す図である。第２の実施の形態では、グラデーション等の非単色の文字を扱っている点が第１の実施の形態と異なっている。従って、第１の実施の形態と同じ構成の部位には、同一の符号を付して詳細の説明は省略する。

第２の実施の形態の画像処理装置は、画像入力部１００１、識別部１００２、画像分離部２００３、色情報算出部２００４、圧縮部２００５、フォーマット変換部２００６、制御部２００７及びＨＤＤ１００８を備えている。

続いて、画像処理装置の動作について説明する。
画像入力部１００１から出力された画像信号１０１０は、識別部１００２において文字／非文字が識別され、文字を「２５５」、非文字を「０」とする識別信号１０１１に変換される。この識別処理には、既知の識別技術を用いることができる。

色情報算出部２００４には、画像信号１０１０と識別信号１０１１とが入力される。色情報算出部２００４は、識別情報１０１１を用いて、画像信号１０１０から文字領域の座標２０１３とその文字色情報２０１４とを生成して出力する。

画像分離部２００３には、画像信号１０１０、識別信号１０１１、文字領域座標２０１３及び文字色情報２０１４が入力される。画像分離部１００３は、識別信号１０１１を用いて、画像信号１０１０から非単色文字画像信号２０１２と、文字画像を除去した分離画像信号１０１２とを生成して分離出力する。

圧縮部２００５は識別信号１０１１と分離画像信号１０１２を１つの圧縮信号として圧縮して第１の圧縮信号２０１５を生成する。即ち、文字を識別する信号（識別信号１０１１）と例えば写真が表された信号（分離画像信号１０１２）とが１つの圧縮信号２０１５に圧縮される。更に圧縮部２００５は、非単色文字画像を圧縮した第２の圧縮信号２０１６を生成する。

フォーマット変換部２００６は、入力される文字領域の座標２０１３、その文字色情報２０１４、第１の圧縮信号２０１５及び第２の圧縮信号２０１６とからＸＰＳファイル２０１７を生成して出力する。生成されるＸＰＳファイル２０１７では、文字色情報２０１４の色と、文字領域の座標２０１３の示す範囲とをグラフィック描画コマンドで記述した画像の上に、第２の圧縮信号２０１６及び第１の圧縮信号２０１５が重ね合わされる。

ＨＤＤ１００８は、ＸＰＳファイル２０１７を格納する。
制御部２００７は、画像処理装置を統括して制御する。

図１３は、色情報算出部２００４の構成を示す図である。連続画素探索部２００４−１は、第１の実施の形態と同様、連続した文字の領域情報である文字領域座標２０１３を生成する。領域平均部２００４−２も第１の実施の形態と同様、文字領域内の文字画素に関する平均値２００４−１０を生成する。領域分散部２００４−３は、文字領域内の文字画素に関する濃度分散値２００４−１１を生成する。

比較器２００４−４は濃度分散値２００４−１１を所定の閾値と比較する。濃度分散値が所定の閾値よりも小さければ当該文字領域は単色表現可能と判断し、単色判定信号２００４−１２を「１」とする。それ以外は単色表現不可能として単色判定信号２００４−１２を「０」として出力する。

変換部２００４−５は、単色判定信号２００４−１２が「１」であれば、平均値２００４−１０を文字色情報２０１４として出力し、「０」であれば特殊記号「￥ｚ」を文字色情報２０１４として出力する。

図１４は、画像分離部２００３の構成を示す図である。分離画像信号１０１２は、第１の実施の形態と同様に、文字領域の情報を削除した情報として出力される。画像分割部２００３−０２は、文字色情報２０１４が特殊記号「￥ｚ」の時のみ、入力画像信号１０１０から、文字領域座標２０１３の示す範囲の画像を切り出し、非単色文字画像信号２０１２として出力する。なお、非単色文字画像信号２０１２は、入力画像信号１０１０から切り出される画像であるため、入力画像によっては複数発生する。

圧縮部２００５は、第１の実施の形態と同様に、識別信号１０１１と分離画像信号１０１２とを、一つのＨＤＰｈｏｔｏ圧縮オブジェクトに圧縮して第１の圧縮信号２０１５として出力する。また、非単色文字画像信号２０１２は、各画像毎にＨＤＰｈｏｔｏ圧縮オブジェクトに圧縮され、第２の圧縮信号２０１６として出力される。

フォーマット変換部２００６は、文字色情報２０１４が特殊記号「￥ｚ」でない時のみ、第１の実施の形態と同様、文字色情報２０１４、文字領域情報２０１３を描画コマンドで記述する。文字色情報２０１４が特殊記号「￥ｚ」の時は、第２の圧縮信号２０１６を文字領域情報２０１３に従って記述する。第１の圧縮信号２０１５は第１の実施の形態と同様に記述し、一つのファイルとして扱う。

図１５は、第２の実施の形態の画像処理装置による画像処理方法を説明するための図である。
青のべた文字、グラデーション文字及び非文字画像を含む画像信号１０１０から、識別部１００２が識別信号１０１１を生成する。この識別信号１０１１には、色情報は含まれていないが、青のべた文字とグラデーション文字の形状の情報が含まれている。

色情報算出部２００４は、画像信号１０１０と識別信号１０１１とから、青のべた文字及びグラデーション文字（非単色文字）の文字色情報２０１４、文字領域座標２０１４を算出する。図１５では、青のべた文字については、文字色情報２０１４として青（０，０，２５５）が得られるが、グラデーション文字については、文字色情報２０１４として特殊文字「￥Ｚ」を設定する。

画像分離部２００３は、非文字画像を示す分離画像１０１２と非単色文字画像２０１２を生成する。ここで、非単色文字画像２０１２は、画像毎に２つ得られている。

圧縮部２００５は、αチャンネルに変換した識別信号１０１１と分離画像１０１２とを一つの第１の圧縮信号２０１５としてＨＤｐｈｏｔｏ圧縮する。非単色文字画像２０１２は、それぞれ第２の圧縮信号２０１６としてＨＤｐｈｏｔｏ圧縮される。

図１６は、フォーマット変換部２００６での記述例である。図に示すように、フォーマット変換部２００６は、単色のベクトル記述の文字色情報２０１４、文字領域座標２０１３及び非単色文字画像を圧縮した第２の圧縮信号２０１６の上に第１の圧縮信号２０１５を重ね合せて表現したファイルを生成する。従って、グラデーション文字等を表現することのできる、表現範囲が広い高圧縮ファイルを提供することが出来る。

図１７は、第２の実施の形態のバリエーションを示す図である。
第２の実施形態では、図１７（Ａ）に示すように、透過画像＋画像の圧縮、ベクトル記述及び部品画像の圧縮と３つの処理で構成して高圧縮化と高画質化を図っている。なお、画像としては、最初に記述しているものが、最前面にくる。

グラデーション文字に関しては、図１７（Ｂ）に示すように非文字と同様に扱う構成を取ることができる。また、処理は複雑になるが、図１７（Ｃ）に示すように非単色文字は、その文字の表現パターン（グラデーションやパターン等）を算出して、第１の実施の形態と同様に、ベクトル記述及び透過画像と画像の圧縮オブジェクトのみで構成することもできる。

さらに、図１７（Ｄ）に示すように、非単色文字画像をバラバラにせず、まとめて透過画像と組み合せた一つの圧縮オブジェクトにして、２つの透過画像と画像の圧縮オブジェクトとベクトル記述で構成することも可能である。図１７（Ｄ）では非文字画像の圧縮オブジェクトと非単色文字画像の圧縮オブジェクトが別々であるため、個々に圧縮率を調整することができ、図１７（Ｂ）よりも画質と圧縮率の制御が容易になる。

また、本例では第１の圧縮信号と第２の圧縮信号を同一の圧縮方式で圧縮しているが、第１の圧縮信号は透過を扱える第１の圧縮方式、第２の圧縮信号は透過を扱えないが、第１よりも高圧縮な第２の圧縮方式というように、圧縮方式を使い分ける構成を取ることもできる。

[第３の実施の形態]
図１８は、本発明の第３の実施の形態の画像処理装置の構成を示す図である。第３の実施の形態では、第１の実施の形態の画像処理装置に作成されたＸＰＳファイルを変換する機能を付加している。従って、第１の実施の形態と同じ構成の部位には、同一の符号を付して詳細の説明は省略する。

画像処理装置は、第１の実施の形態の構成に加えクライアントＰＣ３０１０及びファイル変換部３００９を備えている。
クライアントＰＣ３０１０は、ＨＤＤ１００８に格納されているＸＰＳファイル１０１６を変換するための変換指示情報として変換領域座標３０１７、変換色情報３０１８を出力する。ファイル変換部３００９は、変換指示情報３０１７、３０１８に従い、ＨＤＤ１００８に格納されているＸＰＳファイル１０１６を修正ＸＰＳファイル３０１９に修正する。そして、制御部３００７は、画像処理部を統括して制御する。

図１９は、クライアントＰＣ３０１０とファイル変換部３００９の動作を説明するための図である。図１９に示すようにクライアントＰＣ３０１０のディスプレイには、高圧縮ＸＰＳファイル１０１６が表示されている。文字は黒で再現されている。

本第３の実施の形態では、説明を簡便にするため、同一行の文字を同一領域として算出したとして記述しているが、第１の実施の形態のように、各１文字単位で文字領域座標１０１３と文字色情報１０１４が生成されていても良い。

ユーザーが、「＄１００」は金額を表現しているため、黒色ではなく赤色に変更しようとする場合、ユーザーはマウスで画像をドラッグして変更したい文字の範囲を指定し変更したい色を指定する。この操作によって、クライアントＰＣ３０１０は、変換領域座標３０１７を生成し、更に変更したい色である赤を変換色情報３０１８として生成する。

図２１が変更前のＸＰＳファイル１０１６の内容を表し、図２２が変更後のＸＰＳファイル１０１６の内容を表している。
図２２に示すように、ファイル変換部３００９は、図２１のＸＰＳファイルの圧縮画像を記述した位置（２６行目）に、クライアントＰＣ３０１０から受け取った変換領域座標３０１７と変換色情報３０１８に関する描画コマンドを挿入する。

この変換によって、ＸＰＳファイル１０１６のベクトル記述黒色：（０，０）−（６００，１００）の上に、赤色：（０，０）−（６００，１００）が上書き記述されるので、指定領域の文字色が簡単なコマンド記述の追加で修正することができる。

図２０は、ファイル変換部３００９の構成を示す図である。ファイル変換部には、最上位透過画像探索部３００９−１及び記述挿入部３００９−２が設けられている。
最上位透過画像探索部３００９−１は、最上位の圧縮信号１０１５が記述されている行（図２１のＸＰＳファイルでは２６行）を挿入行情報３００９−１０として出力する。記述挿入部３００９−２は、変換領域座標３０１７及び変換色情報３０１８をＸＰＳファイル１０１６の挿入行情報３００９−１０の行に挿入し、修正ＸＰＳファイル３０１９を出力する。

図１０（Ｂ）に示した従来例では、文字色を修正する場合、多値画像の圧縮・復号を伴った修正が必要である。図１０（Ａ）（Ｃ）の場合、色毎にグループ化されているため、変えたい文字だけに再分割する必要が発生し、やはり圧縮・復号処理が必要となる。
これに対し、第３の実施の形態では上述のように、圧縮・復号が不要であり、非常に簡単に文字色を修正することができる。

第３の実施の形態では、たまたま元々の文字領域座標１０１３（０，０）−（６００，１００）と変換領域座標３０１７とが一致したが、このような場合、追記でなく該当する文字色情報１０１４を変換色情報３０１８に変更する構成が実現できるのも明らかである。

また、逆に、ユーザーのドラックで指示した変換領域座標が、例えば（５０，２０）−（６００，９０）の様に、ＸＰＳファイル１０１６の文字領域情報から多少ずれても、ＸＰＳファイルに保持されている文字領域座標１０１３を用いて、修正する構成を取ることも可能である。

また、本修正方法は、図１７（Ａ）だけでなく、図１７（Ｂ）（Ｃ）（Ｄ）に示す様に、透過画像と画像を一つのオブジェクトとして画像の最前面に配置する高圧縮ファイルフォーマットに対して適用することができる。

図２３は、本修正方法が適用できるファイルフォーマットを模式的に示す図である。
図２３（Ａ）に示すように、透過画像と画像とを一つのオブジェクトとして画像の最前面に配置する高圧縮ファイルフォーマットに対しては、そのオブジェクトの後面、即ち、ＸＰＳファイルでは圧縮信号が記述されている行に、修正文字色情報３０１７、３０１８を挿入して追加することで、簡易に文字色を修正することができる。

更に、本実施の形態では圧縮信号１０１５の記述直前に変換領域座標、変換色情報を挿入したが、修正目的を達成できるなら、本位置に限定されるものではない。例えば図２２において、１４行目に挿入する構成を取っても、１４行目に記述した領域座標１０１３と変換領域座標３０１７とはオーバーラップしないため同様の効果を得ることが出来る。

また、本実施の形態ではマウスを用いてユーザーが直接変換領域座標３０１７、変換色情報３０１８を指示する構成を示したが、例えばクライアントＰＣ上で既知のＯＣＲを行い、特定のキーワードの文字領域の情報を変換領域座標３０１７、変換色情報３０１８として自動的に取得して、キーワードの色を変える構成を取ることもできる。

また、ＯＣＲを用いた色修正としてはキーワードだけでなく、ＯＣＲの認識精度が悪い箇所のみ色を着けるのに用いるなどの応用例も構成できる。

更には、本実施の形態では単純に色を変えたが、グラデーションやパターンを指示して、それに合わせて記述挿入部３００９−２でグラデーションやパターンの記述を挿入すればやはり容易に修正できることは明らかである。

また、本実施の形態ではベクトル記述のみ挿入しているが、若干ファイルサイズは増加するものの、画像オブジェクトを挿入することも可能である。

本実施の形態では、ＸＰＳおよびＨＤＰｈｏｔｏを例に説明したが、同様の記述が許されるフォーマット、技術であれば本実施の形態に限定されるものではないし、識別技術や識別対象、具体的な記述方法、指示手段等も本実施の形態に限定されるものではない。

以上説明した第１乃至第３の実施の形態に係る画像処理装置によれば、一つの圧縮技術、圧縮コードだけで、高圧縮ファイルの提供を可能にする。

１つの圧縮コードで高圧縮画像ファイルが生成できるので、低コストで高圧縮な画像ファイルを提供できる。

１つの圧縮技術、圧縮コードで高圧縮画像ファイルが生成できるので、低コストで高圧縮な画像ファイルを提供できる。

図形などの描画コマンドと１つの圧縮コードで高圧縮画像ファイルが生成できるので、低コストで高圧縮な画像ファイルを提供できる。

色毎に座標情報と色の組み合わせが出力されるので簡単な描画コマンドと圧縮コードで低コストで高圧縮な画像ファイルが提供できる。

白抜き文字など、色の指定が不要と判断した描画コマンドが減るので低コストで高圧縮な画像ファイルを提供できる。

一般原稿で多い黒文字の色等を予め背景色として指定しておき、それ以外の色のみ描画コマンドを記述するので、描画コマンドが減るので低コストで高圧縮で、文字の色が一定の高画質な画像ファイルを提供できる。

グラデーション文字等の描画コマンド表現が難しい文字のみ圧縮コードで表現されるので、高画質で高圧縮な画像ファイルを提供できる。

描画コマンドで、簡単に色や座標を指定できるので、簡易な構成で高圧縮ファイルの文字色情報等を変更できる。

ＯＣＲと組み合せて、簡易な方法で色変更情報の生成、修正が行えるので利便性の高い高圧縮な画像ファイルを提供できる。

上述の各実施の形態の構成をとることにより、従来複数の圧縮技術、圧縮ファイルで構成されていた高圧縮ファイルが、一つの圧縮技術、一つの圧縮画像で構成されるので、ファイルサイズが削減されるとともに、処理コストが削減できる。

なお、以上説明した第３の実施の形態で説明したファイル変換部は、次のように表すことができる。

[付記１]（透過圧縮画像を用いた高圧縮ファイルの簡易文字色修正）
第１の画像信号と第１の画像信号の透過率を指定する透過画像から構成される第１の圧縮コードと、少なくとも色図形を描画する第１の描画コマンドもしくは第２の圧縮コードとから構成され、
該第１の描画コマンドもしくは第２の圧縮コードの画像の上に該第１の圧縮コードの画像をオーバーライトする画像ファイルを変換する画像変換装置であって、
該第１の圧縮コードは該第１の画像信号及び該透過画像を同一の圧縮技術で圧縮し、
該画像変換装置は該画像ファイルの色変更指示情報を入力して該色変更指示情報を第２の描画コマンドに変換し、該第１の圧縮コードが表現する画像より下位に、該第２の描画コマンドが表現する画像を挿入する画像ファイルに変換することを特徴とする画像処理装置。

[付記２]（ＯＣＲを用いた簡易文字色修正）
第１の画像信号と第１の画像信号の透過率を指定する透過画像から構成される第１の圧縮コードと、少なくとも色図形を描画する第１の描画コマンドもしくは第２の圧縮コードとから構成され、
該第１の描画コマンドもしくは第２の圧縮コードの画像の上に該第１の圧縮コードの画像をオーバーライトする画像ファイルを変換する画像変換装置であって、
該第１の圧縮コードは該第１の画像信号及び該透過画像を同一の圧縮技術で圧縮し、
該画像変換装置は該画像ファイルの色変更指示情報を入力して該色変更指示情報を第２の描画コマンドに変換し、該第１の圧縮コードが表現する画像より下位に、該第２の描画コマンドが表現する画像を挿入する画像ファイルに変換し、
該色変更指示情報は、ＯＣＲによって生成されることを特徴とする画像変換装置。

[第４の実施の形態]
図２５は、本発明の第４の実施の形態の画像処理装置の構成を示す図である。第４の実施の形態の画像処理装置は、画像入力部４００１、識別部４００２、画像分離部４００３、圧縮部４００４、フォーマット変換部４００５、制御部４００６及びＨＤＤ４００７を備えている。

続いて、画像処理装置の動作について説明する。
画像入力部４００１から出力された画像信号４０１０は、識別部４００２において文字／非文字が識別され、文字を「１」、非文字を「０」とする識別信号４０１１に変換される。この識別処理には、既知の識別技術を用いることができる。

画像分離部４００３には、画像信号４０１０と識別信号４０１１とが入力される。画像分離部４００３は、識別信号４０１１を用いて、画像信号４０１０を第１の画像信号４０１２と第２の画像信号４０１３に分離する。

圧縮部４００４には、識別信号４０１１、第１の画像信号４０１２及び第２の画像信号４０１３が入力される。圧縮部４００４は、識別信号４０１１を透過画像として、識別信号４０１１と第１の画像信号４０１２とを圧縮して第１の圧縮信号４０１４を出力する。更に、第２の画像信号４０１３を圧縮して第２の圧縮信号４０１５を出力する。なお、圧縮部４００４は、透過画像と画像信号を同一圧縮コードに変換できる圧縮技術ＨＤＰｈｏｔｏを備えている。

フォーマット変換部４００５は、入力される第１の圧縮信号４０１４と第２の圧縮信号４０１５とからＸＰＳファイル４０１６を生成して出力する。ＸＰＳファイル４０１６では、第２の圧縮信号４０１５の上に第１の圧縮信号４０１４が重ね合わされる。

ＨＤＤ４００７は、ＸＰＳファイル４０１６を格納する。
制御部４００６は、画像処理装置を統括して制御する。

次に、画像処理装置の各部の構成と動作について詳細に説明する。
図２６は、識別部４００２の構成を示す図である。識別部４００２は、画像信号４０１０から文字領域と非文字領域とを識別した識別信号４０１１を出力する。

Ｄ−ＦＦ（遅延フリップフロップ）は、画像信号４０１０を保持し１画素走査（１クロック）期間遅延したタイミングで出力する。従って、平均化部４００２−１には、連続した３画素の画像信号が入力される。平均化部４００２−１は、連続する３画素の平均値信号４００２−６を算出する。次に、差分回路４００２−２が３画素平均値と中心の画素値との差分（≒微分）を求める。そして差分回路４００２−２は、差分がプラス、すなわち低濃度→高濃度に変化したときは、判定信号４００２−７に「１」を出力し、差分がマイナスすなわち高濃度→低濃度に変化したときは、判定信号４００２−７に「０」を出力する。

Ｄ−ＦＦ４００２−５には、判定信号４００２−７がクロックとしても入力される。このため、判定信号が変化した時に読み込まれた判定信号の値は、次に変化するまで保持される。すなわち、Ｄ−ＦＦ４００２−５の出力４００２−９は画像信号が低濃度→高濃度に変化して、次に高濃度→低濃度変化するまで「１」を保持し、画像信号が高濃度→低濃度に変化して、再び低濃度→高濃度変化するまで「０」を保持する。

レベル判定回路４００２−３は閾値４００２−８と平均値信号４００２−６とを比較し、平均値信号４００２−６が所定濃度以上であれば、レベル判定信号４００２−１０を「１」とし、それ以外のときはレベル判定信号４００２−１０を「０」とする。合成部４００２−４は出力４００２−９とレベル判定信号４００２−１０のＡＮＤを識別信号４０１１として出力する。

この識別部４００２の動作によれば、文字の領域に入ったことを表す低濃度→高濃度への変化が検出されたときから、文字の領域から出たことを表す高濃度→低濃度への変化が検出されるまでの範囲内であって所定濃度以上のときに文字である識別信号（＝「１」）が出力される。

図２７は、画像分離部４００３の構成を示す図である。画像分離部４００３は、画像信号４０１０を識別信号４０１１を用いて第１の画像信号４０１２と第２の画像信号４０１３に分離する。

Ｄ−ＦＦ４００３−０１には識別信号４０１１と同期信号ＣＬＫとのＡＮＤ信号がクロックとして入力される。このため識別信号４０１１が文字領域「１」を示す時、第１の画像信号４０１２には、そのときの画像信号４０１０が取り込まれて出力される。識別信号４０１１が非文字領域「０」を示す時、直前の文字領域（例えば、文字の内部を表す信号）の画素信号がＤ−ＦＦ４００３−０１に更新されずに保持され、そのまま第１の画像信号４０１２として出力される。

Ｄ−ＦＦ４００３−０２には、識別信号４０１１の反転信号と同期信号ＣＬＫとのＡＮＤ信号がクロックとして入力される。このため識別信号４０１１が非文字領域「０」を示す時、第２の画像信号４０１３には、そのときの画像信号４０１０が取り込まれて出力される。識別信号４０１１が文字領域「１」を示す時、直前の非文字領域（例えば、背景を表す信号）の画素信号がＤ−ＦＦ１００３−０２に更新されずに保持され、そのまま第２の画像信号４０１３として出力される。

図２８は、識別信号４０１１、第１の画像信号４０１２及び第２の画像信号４０１３を生成する動作を説明するための図である。

図２８（Ａ）は、識別部４００２による識別信号４０１１の生成を示している。画像信号４０１０で表される入力画像は、識別部４００２で処理されて出力４００２−９を生成する。出力４００２−９は文字、写真についてエッジで囲まれる内部領域を表している。レベル判定信号４００２−１０は、所定濃度以上のレベルの領域を表している。レベル判定信号４００２−１０では、非文字の薄いグラフィック（右下の円）は対象から除外されている。合成部４００２−４がこれらの両信号のＡＮＤ演算を行って、識別信号４０１１を生成する。この識別信号４０１１では、文字領域が抽出されている。

図２８（Ｂ）は、画像分離部４００３による文字信号である第１の画像信号４０１２の生成を示している。画像分離部４００３は、画像信号４０１０と識別信号４０１１とから、文字領域を図の右方向に拡張して塗り潰した新たな領域を生成している。これは、抽出操作が左から右、上から下の方向に走査して行われるためである。また、文字でない、右下の丸の図形は削除されている。なお、図中の点線は理解のための補助情報である。

図２８（Ｃ）は、画像分離部４００３による非文字信号である第２の画像信号４０１３の生成を示している。非文字である背景及び右下の円が抽出されているのが判る。画像分離部４００３は、画像信号４０１０と識別信号４０１１とから、文字領域を直前の非文字領域画素（本例では背景白）で塗り潰し、文字領域を除いた画像として出力する。なお、図中の点線は理解のための補助情報である。

図２９は、ＨＤＰｈｏｔｏの圧縮処理の構成を示す図である。ＨＤＰｈｏｔｏでは、ＪＰＥＧと同じように、色変換、系列変換、量子化、エントロピー符号化等の手順で圧縮処理が実行される。

αチャネルとは、一般の画像信号とは異なり画像と背景の重なりの関係を示す情報で、画素値０→透過、２５５→不透明を表している。αチャネルが０の画素は画像でなく背景を表示し、αチャネルが２５５の画素は画像を表示し、その間の値は値によって背景・画像を合成して表示する。

図３０は、αチャンネルを用いた画像合成方法を説明する図である。第１の画像信号４０１２を画像と定義する。識別信号４０１１の文字を示す信号「１」を２５５（不透明）、非文字を示す信号「０」を０（透過）としたαチャンネルに変換した画像を透過画像と定義する。そして、第２の画像信号４０１３を背景画像と定義する。

画像（第１の画像信号４０１２）の塗りつぶされた領域の内、透過画像の不透明領域に対応する部分を取り出した画像には、文字だけが抽出されている。この画像を不透明画像と定義する。更に、背景画像（第２の画像信号４０１３）の内、透過画像の透明領域に対応する部分を取り出した画像には、文字が除かれている。この画像を透明画像と定義する。そして、不透明画像と透明画像とを合成して原画像を再現することができる。

図３１は、従来の文字画像と非文字画像とを分離して高圧縮ファイルを生成する方法を説明する図である。図３１（Ａ）（Ｃ）に示す方法では、圧縮した背景画像に圧縮した２値画像をオーバーライトしてファイルを生成する。図３１（Ｂ）に示す方法では、２値の文字形状画像をマスクとして、文字の色を示す画像、背景画像を圧縮する。
図３１に示すように、従来の圧縮技術では、文字と非文字それぞれに適した方式の圧縮を行うことで高圧縮ファイルを提供している。

本実施の形態では、図３１（Ｂ）と同様に、透過画像を使って色文字を表す画像と背景画像とを用いる。しかしながら、図３１（Ｂ）に示す方式ではマスク、背景画像、文字色画像を異なる方式で圧縮していたのに対し、本実施の形態では、圧縮部４００４においてＨＤＰｈｏｔｏを利用した一種類の方式で圧縮する。

以下本実施の形態での圧縮方法を説明する。
図３２は、ＨＤＰｈｏｔｏのコード体系を示す図である。

ＨＤＰｈｏｔｏのコード体系は図に示すように、１６×１６画素単位（ＭａｃｒｏＢｌｏｃｋ）の符号を並べるＳｐａｔｉａｌｍｏｄｅ、及び周波数レベル毎に情報を集めるＦｒｅｑｕｅｎｃｙｍｏｄｅのフォーマットをサポートしている。
ただし、これは最終的なコードを微小領域単位の情報毎に集めるか（Ｓｐａｔｉａｌｍｏｄｅ）、周波数単位毎に集めるか（Ｆｒｅｑｕｅｎｃｙｍｏｄｅ）の違いであり、いずれのモードにおいても、周波数を区分した単位で圧縮コードを生成している。

図３３は、基本処理単位である１６×１６画素の周波数空間における周波数区分を表す図である。
圧縮コードを生成するための周波数は、直流成分ＤＣ、低周波成分ＬＯＷＰＡＳＳ、高周波成分ＨＩＧＨＰＡＳＳ、及びＦＬＥＸＢＩＴＳに区分されている。図３３の左には、二次元平面での周波数区分を表し、図３３の右には、ｂｉｔ深度での周波数区分を表している。なお、ＦＬＥＸＢＩＴＳは、（ＤＣを除く周波数成分である）低周波成分と高周波成分との下位ｂｉｔ成分に割り付けられている。

ここで、本実施の形態における圧縮方法の基本的な考え方を説明する。
ＪＰＥＧでは直交変換により周波数を分解して用いるが、基本処理単位である例えば８×８のブロックをそのまま用いて処理を行っている。これに対し、ＨＤｐｈｏｔｏでは、基本処理単位内で定義される周波数区分のデータを分離して取り扱うことが可能である。本実施の形態では、上述のＨＤｐｈｏｔｏが備えている技術的特徴を利用する。

即ち、本実施の形態では圧縮対象によって使用する周波数区分を選択する。その結果、写真であれば階調度が確保されていれば解像度はそれほど重要ではないが、文字の場合は高解像度であることが重要である、といったニーズに対応した圧縮が可能となる。

図３４は、圧縮部４００４における第１の圧縮信号と第２の圧縮信号を生成する方法を説明するための図である。
圧縮部４００４は、第１の画像信号４０１２の全周波数成分と、識別信号４０１１を透過画像（０→０、１→２５５）に変換した画像の全周波数成分とを用いて第１の圧縮信号４０１４を構成する。また、圧縮部４００４は、背景画像に相当する第２の画像信号４０１３の直流成分ＤＣと低周波成分ＬｏｗＰａｓｓを用いて第２の圧縮信号４０１５を構成する。

このように構成することによって、文字等は高解像度化し、背景は階調度を損なわずに低解像度化して圧縮効率を高めた高圧縮ファイルを提供することが出来る。

フォーマット変換部４００５は、圧縮部４００４で生成された第１の圧縮信号４０１４（第１の画像信号４０１２及び識別信号４０１１の圧縮）、第２の圧縮信号４０１５（第２の画像信号４０１３の圧縮）を一つのファイルに変換する。

図３５は、フォーマット変換部４００５が変換したＸＰＳのフォーマット記述を示す図である。ＸＰＳのフォーマットは、第２の圧縮信号４０１５に第１の圧縮信号４０１４をオーバーライトする記述で表現される。

図３６は、第１の圧縮信号４０１４と第２の圧縮信号４０１５を生成する他の方法を説明するための図である。

圧縮部４００４は、第１の画像信号４０１２のＤＣ成分と、識別信号４０１１を透過画像（０→０、１→２５５）に変換した画像の全周波数成分とを用いて第１の圧縮信号４０１４を構成する。また、圧縮部４００４は、背景画像に相当する第２の画像信号４０１３の直流成分ＤＣと低周波成分ＬｏｗＰａｓｓを用いて第２の圧縮信号４０１５を構成する。

図３６に示す方法では、文字の色を示す第１の画像信号４０１２に割り当てる周波数範囲を最も小さくし、文字の形状情報を保持することになる透過画像（識別信号４０１１）に割り当てる周波数範囲を最も大きくする。この方法によれば、画像（第１の画像信号４０１２）、透過画像（識別信号４０１１）、背景画像（第２の画像信号４０１３）のそれぞれに最も適した情報量を用いて圧縮できるので、より高圧縮・高画質な高圧縮ファイルを提供することができる。

図３７は、第１の圧縮信号４０１４と第２の圧縮信号４０１５を生成する更に他の方法を説明するための図である。

図３７では、識別信号４０１１を透過画像（０：非文字→２５５：不透明、１：文字→０：透明）と、上述とは逆の特性に変換する。そして、圧縮部４００４は、第２の画像信号４０１３の直流成分ＤＣと低周波成分ＬｏｗＰａｓｓと、識別信号４０１１を透過画像（０→２５５、１→０）に変換した画像の全周波数成分とを用いて第１の圧縮信号４０１４を構成する。また、圧縮部４００４は、背景画像に相当する第１の画像信号４０１２の直流成分ＤＣを用いて第２の圧縮信号４０１５を構成する。

図３７に示す方法では、図３６に示す方法と同様に、画像（第２の画像信号４０１３）、透過画像（識別信号４０１１）、背景画像（第１の画像信号４０１２）のそれぞれに最も適した情報量を用いて圧縮できるので、より高圧縮・高画質な高圧縮ファイルを提供することができる。

本例ではＦｌｅｘｂｉｔｓを圧縮コードに含めない例を示したが、適宜Ｆｌｅｘｂｉｔｓを圧縮コードに含める構成を取ることもできる。

さらに、各周波数成分毎の圧縮処理には触れていないが、直流成分ＤＣ、低周波成分Ｌｏｗｐａｓｓなど各周波数ごとに画質を制御して高圧縮ファイルを生成できることは明らかである。

また、第１の圧縮信号、第２の圧縮信号は図３２で示したＳｐａｔｉａｌｍｏｄｅ、Ｆｒｅｑｕｅｎｃｙｍｏｄｅどちらのフォーマットを使用した場合でも所望の効果が得られる。

また本実施の形態ではＨＤＰｈｏｔｏ及びＸＰＳを利用した表現方法を例示したが、透過画像と画像信号を一つのオブジェクトとして圧縮でき、周波数単位で取り扱える技術及びそのオブジェクトを頁表現できる技術であれば、本例に限定されるものではなく、透過・不透明の数値の割付や識別方法、分離方法も本例に限定されない。

[第５の実施の形態]
図３８は、本発明の第５の実施の形態の画像処理装置の構成を示す図である。第５の実施の形態では、第４の実施の形態の画像処理装置に作成されたＸＰＳファイルを変換する機能が付加されている。また、圧縮部５００４が図３２で示した、Ｆｒｅｑｕｅｎｃｙｍｏｄｅで動作し、かつ、全ての周波数成分を保持している第１の圧縮コード５０１４、第２の圧縮コード５０１５を出力する点で第４の実施の形態と異なっている。従って、第４の実施の形態と同じ構成の部位には、同一の符号を付して詳細の説明は省略する。

なお、画像処理装置は、第４の実施の形態の構成に加えてファイル変換部５００６を備えており、ファイル変換部５００６は、画像ログサーバー５００８及びクライアントＰＣ５００９と信号の授受を実行する。

以下第５の実施の形態に係る画像処理装置の特徴的な動作を順次説明する。
フォーマット変換部４００５によって作成されたＸＰＳファイル５０１６は、ＨＤＤ５００６に一旦格納される。ファイル変換部５００７はＸＰＳファイル５０１６を順次読み出し、送付先の転送能力に応じたファイルサイズ・画質をもつ変換圧縮コードＡ５０１７、変換圧縮コードＢ５０１８に変換して、それぞれ画像ログサーバー５００８、クライアントＰＣ５００９に送付する。

ここで画像ログサーバー５００８は、一般的に、画像の履歴を保存するために用いられるため、画質よりも圧縮率が優先される。クライアントＰＣ５００９は高圧縮ファイルをユーザーが直接閲覧する環境で使用されるため、実用的な画質とファイルサイズが求められる。

図３９は、ＸＰＳファイル５０１６の詳細の構成を示す図である。ＸＰＳファイル５０１６は、各種オブジェクトと記述を階層管理したファイルとして構成されている。例えば、図３５で示した画像オブジェクトの重ね条件は１．ｆｐａｇｅファイルとして記述、格納されている。そして、具体的な画像ファイルは指定ディレクトリ内に格納されている。ＸＰＳファイル５０１６においては、画像の名前や画像の縦・横サイズ等に変更が無ければ、Ｉｍａｇｅｓの位置に格納されている画像オブジェクトを入れ替えるだけで画像を変更することが可能である。

図４０は、ファイル変換部５００７の構成を示す図である。ファイル変換部５００７は、ＸＰＳファイル５０１６を入力して、変換圧縮コードＡ５０１７、変換圧縮コードＢ５０１８を出力する。ファイル変換部５００７は、この構成による簡易な変換でＸＰＳファイルの画像サイズ・画質を変更することができる。

画像オブジェクト抽出部５００７−１は、ＸＰＳファイル５０１６に記述されている第１の圧縮コード５０１４及び第２の圧縮コード５０１５を、圧縮コード５００７−４として抽出する。

周波数コード削除部１−５００７−２は、ＤＣ成分のみの圧縮コードである第１の変換圧縮コード５００７−５を出力する。周波数コード削除部２−５００７−３は、透過画像は全ての周波数、画像信号はＤＣ成分のみ、背景画像はＤＣ成分とＬｏｗｐａｓｓ成分のみとした第２の変換圧縮コード５００７−６を出力する。

画像ファイル再構成部５００７−７には、ＸＰＳファイル５０１６、第１の変換圧縮コード５００７−５及び第２の変換圧縮コード５００７−６が入力される。画像ファイル再構成部５００７−７は、ＸＰＳファイル５０１６に記述されている第１の圧縮コード５０１４及び第２の圧縮コード５０１５（圧縮コード５００７−４）を第１の変換圧縮コード５００７−５に入れ替えて変換圧縮コードＡ５０１７として出力する。また、ＸＰＳファイル５０１６に記述されている第１の圧縮コード５０１４及び第２の圧縮コード５０１５（圧縮コード５００７−４）を第２の変換圧縮コード５００７−６に入れ替えて変換圧縮コードＢ５０１８として出力する。

図４１は、ファイル変換部の変換方法を模式的に示す図である。
第１及び第２の圧縮コード５０１４，５０１５は、Ｆｒｅｑｕｅｎｃｙｍｏｄｅとして周波数単位でまとめてコード化されているので、不要な周波数成分を取り除く変換を簡易に行うことができる。ＸＰＳファイルでは画像オブジェクトは簡易に差し替えが可能であるため、簡単な構成で、ベースの高圧縮ファイルから、要求に応じて圧縮サイズ、画質を調整した高圧縮ファイルを再生成できるので、高圧縮ファイルの利便性が高まる。

しかもＨＤＤ５００６の格納時点で高圧縮化されているため、非圧縮画像やＪＰＥＧ画像から、要求に応じて高圧縮ファイルを生成するよりも、低コストで実現することが出来る。

なお、本例では全ての周波数情報を保持した高圧縮ファイルをベースとしたが、システムの最高要求画質、例えば第２の変換圧縮コード５００７−６をベースとして、そこから任意の周波数情報を削除して再構成するシステムを構成することもできる。また、その場合ＨＤＤ５００６から直接クライアントＰＣ５００９に送付する構成を取ることもできる。

本例では最も簡易に構成できる方式としてＦｒｅｑｕｅｎｃｙｍｏｄｅで構成したが、復号・再圧縮する必要が無いという意味においては、Ｓｐａｔｉａｌｍｏｄｅで構成することも可能である。

また本例ではＨＤＰｈｏｔｏ及びＸＰＳを利用した表現方法を例に示したが、透過画像と画像信号を一つのオブジェクトとして圧縮でき、周波数単位で取り扱える技術及びそのオブジェクトを頁表現できる技術であれば、本例に限定されるものではなく、透過・不透明の数値の割付や識別方法、分離方法、削減方法も本例に限定されない。

なお、以上説明した第４、第５の実施の形態に係る画像処理装置は、次のように表すことができる。

[付記１]（ＨＤＰｈｏｔｏ等で、背景画像等を高周波成分を除いたフォーマットで高圧縮ファイル化）
第１の画像信号と第２の画像信号と第１もしくは第２の画像信号の透過率を指定する透過画像を生成する画像生成手段と、
第１の画像と透過画像及び第２の画像から第１の圧縮コード及び第２の圧縮コードを出力する圧縮手段と、
第１の圧縮コード及び第２の圧縮コードを重ね合せて画像ファイルを生成する画像ファイル生成手段とを備え、
該圧縮手段は、第１及び第２の圧縮コードを同一の圧縮技術で圧縮し、
該圧縮手段は、直流成分、高周波成分に符号単位を分けて取り扱え、
該第１の画像もしくは第２の画像の内少なくとも一つは、高周波成分を除いた圧縮コードで構成されることを特徴とする画像処理装置。

[付記２]（ＨＤＰｈｏｔｏ等で、透過画像は高周波成分を含んだフォーマットで高圧縮ファイル化）
第１の画像信号と第２の画像信号と第１もしくは第２の画像信号の透過率を指定する透過画像を生成する画像生成手段と、
第１の画像と透過画像及び第２の画像から第１の圧縮コード及び第２の圧縮コードを出力する圧縮手段と、
第１の圧縮コード及び第２の圧縮コードを重ね合せて画像ファイルを生成する画像ファイル生成手段とを備え、
該圧縮手段は、第１及び第２の圧縮コードを同一の圧縮技術で圧縮し、
該圧縮手段は、直流成分、高周波成分に符号単位を分けて取り扱え、
該透過画像は直流成分・高周波成分を含む圧縮コードで構成されることを特徴とする画像処理装置。

[付記３]（具体的な各プレーンのフォーマット、透過画像と文字色を同一オブジェクト化）
第１の画像信号と第２の画像信号と第１もしくは第２の画像信号の透過率を指定する透過画像を生成する画像生成手段と、
第１の画像と透過画像及び第２の画像から第１の圧縮コード及び第２の圧縮コードを出力する圧縮手段と、
第１の圧縮コード及び第２の圧縮コードを重ね合せて画像ファイルを生成する画像ファイル生成手段とを備え、
該圧縮手段は、第１及び第２の圧縮コードを同一の圧縮技術で圧縮し、
該圧縮手段は、直流成分、低周波成分、高周波成分に符号単位を分けて取り扱え、
該第１の画像には文字等の高解像度が必要な情報を格納し、
該第１の画像は直流成分のみ、該第２の画像は直流成分と低周波成分、該透過画像は直流成分と低周波成分と高周波成分の圧縮コードで構成されることを特徴とする画像処理装置。

[付記４]（具体的な各プレーンのフォーマット、透過画像と背景画像を同一オブジェクト化）
第１の画像信号と第２の画像信号と第１もしくは第２の画像信号の透過率を指定する透過画像を生成する画像生成手段と、
第１の画像と透過画像及び第２の画像から第１の圧縮コード及び第２の圧縮コードを出力する圧縮手段と、
第１の圧縮コード及び第２の圧縮コードを重ね合せて画像ファイルを生成する画像ファイル生成手段とを備え、
該圧縮手段は、第１及び第２の圧縮コードを同一の圧縮技術で圧縮し、
該圧縮手段は、直流成分、低周波成分、高周波成分に符号単位を分けて取り扱え、
該第２の画像には文字等の高解像度が必要な情報を格納し、
該第２の画像は直流成分のみ、該第１の画像は直流成分と低周波成分、該透過画像は直流成分と低周波成分と高周波成分の圧縮コードで構成されることを特徴とする画像処理装置。

[付記５]（ＨＤＰｈｏｔｏの周波数Ｔｙｐｅ符号を用いた高圧縮ファイル化）
第１の画像信号と第２の画像信号と第１もしくは第２の画像信号の透過率を指定する透過画像を生成する画像生成手段と、
第１の画像と透過画像及び第２の画像から第１の圧縮コード及び第２の圧縮コードを出力する圧縮手段と、
第１の圧縮コード及び第２の圧縮コードを重ね合せて画像ファイルを生成する画像ファイル生成手段とを備え、
該圧縮手段は、第１及び第２の圧縮コードを同一の圧縮技術で圧縮し、
該圧縮手段は、直流成分、高周波成分に符号単位を分けて取り扱え、
該第１の画像もしくは第２の画像の内少なくとも一つは、高周波成分を除いた圧縮コードで構成され、
該第１及び第２の圧縮コードは周波数単位で情報をまとめた符号フォーマットであることを特徴とする画像処理装置。

[付記６]（ＨＤＰｈｏｔｏの高圧縮ファイルを、任意の圧縮率・画質調整）
第１の画像信号と第１の画像信号の透過率を指定する透過画像から構成される第１の圧縮コードと第２の画像信号から構成される第２の圧縮コードで、第２の圧縮コードの上に第１の圧縮コードを重ね合せて描画する構成となっている画像ファイルを変換する画像変換装置であって、
該第１の圧縮コードと第２の圧縮コードは同一の圧縮技術で圧縮され、
第１及び第２の圧縮コードは周波数単位で情報をまとめた符号フォーマットであり、
該画像変換装置は第１の圧縮コードの第１の画像信号及び透過画像、第２の圧縮コードの第２の画像信号に関して任意の周波数成分だけ取り出し該画像ファイルを再構成することを特徴とする画像変換装置。

なお、上述の各付記に記載した装置の作用効果は以下のとおりである。

[付記１の作用効果]
一種類の圧縮技術で高圧縮ファイルが生成され、かつその圧縮オブジェクトが、圧縮技術の特性を生かしたフォーマットで構成されるので、低コストで圧縮ファイルを実現することができる。

[付記２の作用効果]
一種類の圧縮技術で高圧縮ファイルが生成され、かつその圧縮オブジェクトが、圧縮技術の特性を生かしたフォーマットで構成されるので、低コストで圧縮ファイルを実現することができる。

[付記３の作用効果]
一種類の圧縮技術で高圧縮ファイルが生成され、文字の色情報は最も低解像度な情報で圧縮技術の特徴を生かしたフォーマットで構成されるので、低コストで圧縮ファイルを実現することができる。

[付記４の作用効果]
一種類の圧縮技術で高圧縮ファイルが生成され、文字の色情報は最も低解像度な情報で圧縮技術の特徴を生かしたフォーマットで構成されるので、低コストで圧縮ファイルを実現することができる。

[付記５の作用効果]
周波数単位で情報をまとめてコード表現されているので画像ファイルの表示に自由度がある。

[付記６の作用効果]
周波数単位で情報をまとめてコード表現されているので、一旦高圧縮化したファイルから簡易な変換で圧縮率・画質を再調整した高圧縮ファイルを提供できる。

また、上述の付記と実施の形態との対応関係は次のとおりである。
第４の実施の形態：付記１、２、３、４
第５の実施の形態：付記５、６
[第６の実施の形態]
図４２は、本発明の第６の実施の形態の画像処理装置の構成を示す図である。第６の実施の形態の画像処理装置は、画像入力部６００１、識別部６００２、画像分離部６００３、縮小部６００４、圧縮部６００５、フォーマット変換部６００６、制御部６００７及びＨＤＤ６００８を備えている。

続いて、画像処理装置の動作について説明する。
画像入力部６００１から出力された画像信号６０１０は、識別部６００２において文字／非文字が識別され、文字を「１」、非文字を「０」とする識別信号６０１１に変換される。この識別処理には、既知の識別技術を用いることができる。

画像分離部６００３には、画像信号６０１０と識別信号６０１１とが入力される。画像分離部６００３は、識別信号６０１１を用いて、画像信号６０１０を第１の画像信号６０１２と第２の画像信号６０１３に分離する。

縮小部６００４は、第２の画像信号６０１３を縮小し縮小画像信号６０１４を出力する。

圧縮部６００５には、識別信号６０１１、第１の画像信号６０１２及び縮小画像信号６０１４が入力される。圧縮部６００５は、識別信号６０１１を透過画像として、識別信号６０１１と第１の画像信号６０１２とを圧縮して第１の圧縮信号６０１５を出力する。更に、縮小画像信号６０１４を圧縮して第２の圧縮信号６０１６を出力する。なお、圧縮部６００５は、透過画像と画像信号を同一圧縮コードに変換できる圧縮技術ＨＤＰｈｏｔｏを備えている。

フォーマット変換部６００６は、入力される第１の圧縮信号６０１５と第２の圧縮信号６０１６とからＸＰＳファイル６０１７を生成して出力する。ＸＰＳファイル６０１７では、第２の圧縮信号６０１６の上に第１の圧縮信号６０１５が重ね合わされる。

ＨＤＤ６００８は、ＸＰＳファイル６０１７を格納する。
制御部６００７は、画像処理装置を統括して制御する。

次に、画像処理装置の各部の構成と動作について詳細に説明する。
図４３は、識別部６００２の構成を示す図である。識別部６００２は、画像信号６０１０から文字領域と非文字領域とを識別した識別信号６０１１を出力する。

Ｄ−ＦＦ（遅延フリップフロップ）は、画像信号６０１０を保持し１画素走査（１クロック）期間遅延したタイミングで出力する。従って、平均化部６００２−１には、連続した３画素の画像信号が入力される。平均化部６００２−１は、連続する３画素の平均値信号６００２−６を算出する。次に、差分回路６００２−２が３画素平均値と中心の画素値との差分（≒微分）を求める。そして差分回路６００２−２は、差分がプラス、すなわち低濃度→高濃度に変化したときは、判定信号６００２−７に「１」を出力し、差分がマイナスすなわち高濃度→低濃度に変化したときは、判定信号６００２−７に「０」を出力する。

Ｄ−ＦＦ６００２−５には、判定信号６００２−７がクロックとしても入力される。このため、判定信号が変化した時に読み込まれた判定信号の値は、次に変化するまで保持される。すなわち、Ｄ−ＦＦ６００２−５の出力６００２−９は画像信号が低濃度→高濃度に変化して、次に高濃度→低濃度変化するまで「１」を保持し、画像信号が高濃度→低濃度に変化して、再び低濃度→高濃度変化するまで「０」を保持する。

レベル判定回路６００２−３は閾値６００２−８と平均値信号６００２−６とを比較し、平均値信号６００２−６が所定濃度以上であれば、レベル判定信号６００２−１０を「１」とし、それ以外のときはレベル判定信号６００２−１０を「０」とする。合成部６００２−４は出力６００２−９とレベル判定信号６００２−１０のＡＮＤを識別信号６０１１として出力する。

この識別部６００２の動作によれば、文字の領域に入ったことを表す低濃度→高濃度への変化が検出されたときから、文字の領域から出たことを表す高濃度→低濃度への変化が検出されるまでの範囲内であって所定濃度以上のときに文字である識別信号（＝「１」）が出力される。

図４４は、画像分離部６００３の構成を示す図である。画像分離部６００３は、画像信号６０１０を識別信号６０１１を用いて第１の画像信号６０１２と第２の画像信号６０１３に分離する。

Ｄ−ＦＦ６００３−０１には識別信号６０１１と同期信号ＣＬＫとのＡＮＤ信号がクロックとして入力される。このため識別信号６０１１が文字領域「１」を示す時、第１の画像信号６０１２には、そのときの画像信号６０１０が取り込まれて出力される。識別信号６０１１が非文字領域「０」を示す時、直前の文字領域（例えば、文字の内部を表す信号）の画素信号がＤ−ＦＦ６００３−０１に更新されずに保持され、そのまま第１の画像信号６０１２として出力される。

Ｄ−ＦＦ６００３−０２には、識別信号６０１１の反転信号と同期信号ＣＬＫとのＡＮＤ信号がクロックとして入力される。このため識別信号６０１１が非文字領域「０」を示す時、第２の画像信号６０１３には、そのときの画像信号６０１０が取り込まれて出力される。識別信号６０１１が文字領域「１」を示す時、直前の非文字領域（例えば、背景を表す信号）の画素信号がＤ−ＦＦ１００３−０２に更新されずに保持され、そのまま第２の画像信号６０１３として出力される。

図４５は、識別信号６０１１、第１の画像信号６０１２及び第２の画像信号６０１３を生成する動作を説明するための図である。

図４５（Ａ）は、識別部６００２による識別信号６０１１の生成を示している。画像信号６０１０で表される入力画像は、識別部６００２で処理されて出力６００２−９を生成する。出力６００２−９は文字、写真についてエッジで囲まれる内部領域を表している。レベル判定信号６００２−１０は、所定濃度以上のレベルの領域を表している。レベル判定信号６００２−１０では、非文字の薄いグラフィック（右下の円）は対象から除外されている。合成部６００２−４がこれらの両信号のＡＮＤ演算を行って、識別信号６０１１を生成する。この識別信号６０１１では、文字領域が抽出されている。

図４５（Ｂ）は、画像分離部６００３による文字信号である第１の画像信号６０１２の生成を示している。画像分離部６００３は、画像信号６０１０と識別信号６０１１とから、文字領域を図の右方向に拡張して塗り潰した新たな領域を生成している。これは、抽出操作が左から右、上から下の方向に走査して行われるためである。また、文字でない、右下の丸の図形は削除されている。なお、図中の点線は理解のための補助情報である。

図４５（Ｃ）は、画像分離部６００３による非文字信号である第２の画像信号６０１３の生成を示している。非文字である背景及び右下の円が抽出されているのが判る。画像分離部６００３は、画像信号６０１０と識別信号６０１１とから、文字領域を直前の非文字領域画素（本例では背景白）で塗り潰し、文字領域を除いた画像として出力する。なお、図中の点線は理解のための補助情報である。

図４６は、ＨＤＰｈｏｔｏの圧縮処理の構成を示す図である。ＨＤＰｈｏｔｏでは、ＪＰＥＧと同じように、色変換、系列変換、量子化、エントロピー符号化等の手順で圧縮処理が実行される。

図４７は、αチャンネルを用いた画像合成方法を説明する図である。第１の画像信号６０１２を画像と定義する。識別信号６０１１の文字を示す信号「１」を２５５（不透明）、非文字を示す信号「０」を０（透過）としたαチャンネルに変換した画像を透過画像と定義する。そして、縮小画像信号６０１４を背景画像と定義する。

画像（第１の画像信号６０１２）の塗りつぶされた領域の内、透過画像の不透明領域に対応する部分を取り出した画像には、文字だけが抽出されている。この画像を不透明画像と定義する。更に、背景画像（縮小画像信号６０１４）の内、透過画像の透明領域に対応する部分を取り出した画像には、文字が除かれている。この画像を透明画像と定義する。そして、不透明画像と透明画像とを合成して原画像を再現することができる。

図４８は、従来の文字画像と非文字画像とを分離して高圧縮ファイルを生成する方法を説明する図である。図４８（Ａ）（Ｃ）に示す方法では、圧縮した背景画像に圧縮した２値画像をオーバーライトしてファイルを生成する。図４８（Ｂ）に示す方法では、２値の文字形状画像をマスクとして、文字の色を示す画像、背景画像を圧縮する。
図４８に示すように、従来の圧縮技術では、文字と非文字それぞれに適した方式の圧縮を行うことで高圧縮ファイルを提供している。

本実施の形態では、図４８（Ｂ）と同様に、透過画像を使って色文字を表す画像と背景画像とを用いる。しかしながら、図４８（Ｂ）に示す方式ではマスク、背景画像、文字色画像を異なる方式で圧縮していたのに対し、本実施の形態では、圧縮部６００５においてＨＤＰｈｏｔｏを利用した一種類の方式で圧縮する。

即ち、圧縮部６００５は、第１の画像信号６０１２（文字の色を示す画像に相当）、縮小画像信号６０１４（背景画像に相当）、識別信号６０１１を透過画像（０→０、１→２５５変換）として、全て一つの圧縮方式で圧縮する点が従来と異なる。

フォーマット変換部６００６は、圧縮部６００５で生成された第１の圧縮信号６０１５（第１の画像信号６０１２及び識別信号６０１１の圧縮）、第２の圧縮信号６０１６（縮小画像信号６０１４の圧縮）を一つのファイルに変換する。

図４９は、フォーマット変換部６００６が変換したＸＰＳのフォーマット記述を示す図である。ＸＰＳのフォーマットは、第２の圧縮信号６０１６に第１の圧縮信号６０１５をオーバーライトする記述で表現される。

図４８に示した従来の方式は、何れも文字等は２値の高解像度で圧縮し、背景などは多値の低解像度に変換して圧縮することで高圧縮・高画質を実現している。
本実施の形態では、圧縮部６００５において、図４６に示したＨＤＰｈｏｔｏ圧縮の前に第２の画像信号６０１３を縮小画像信号６０１４に低解像度化してから圧縮することで同様に高圧縮なファイルを提供している。

また、ＨＤＰｈｏｔｏでは、画像信号とαチャネルの圧縮率を別々に設定できるので、画像信号（第１の画像信号６０１２）の圧縮設定を高圧縮に設定し、αチャネル（識別信号６０１１）の圧縮設定を可逆圧縮もしくは高画質に設定することでより効率よく、高圧縮・高画質な圧縮ファイルを提供できる。

本実施の形態では、識別信号６０１１と文字を抽出した第１の画像信号６０１２を１つの第１の圧縮信号６０１５として表現したが、図５０に示すように識別信号の０：非文字→２５５、１：文字→０と透過信号に対する割付を反転して、識別信号６０１１と非文字画像である第２の画像信号６０１３の縮小画像６０１４を一つの第１の圧縮信号６０１５として表現することも可能である。

また、本実施の形態ではＨＤＰｈｏｔｏ及びＸＰＳを利用した表現方法を例に示したが、透過信号と画像信号を一つのオブジェクトとして圧縮できる技術及びそのオブジェクトを頁表現できる技術であれば、本実施の形態に限定されるものではなく、透過・不透明の数値の割付や識別方法、分離方法も本実施の形態に限定されない。

なお、以上説明した第６の実施の形態に係る画像処理装置は、次のように表すことができる。

[付記１]（透過画像＋画像、画像の合成での高圧縮ファイルに着目）
第１の画像信号と第２の画像信号と第１もしくは第２の画像信号の透過率を指定する透過画像を生成する画像生成手段と、
第１の画像と透過画像及び第２の画像から第１の圧縮コード及び第２の圧縮コードを出力する圧縮手段と、
第１の圧縮コード及び第２の圧縮コードを重ね合せて画像ファイルを生成する画像ファイル生成手段とを備え、
該圧縮手段は、第１及び第２の圧縮コードを同一の圧縮技術で圧縮することを特徴とする画像処理装置。

[付記２]（透過画像を識別より生成する点に着目）
画像を入力する画像入力部と、
該画像を少なくとも１画素単位で識別する識別部と、
該画像と該識別信号を元に第１及び第２の画像に分離する画像分離部と、
第１の画像信号と該識別信号からなる第３の画像信号と第２の画像信号を圧縮し、第１及び第２の圧縮信号を出力する圧縮部とを備え、
該識別信号は該第１の圧縮信号では該第１の画像信号に対する透過率を表す信号として圧縮され、第１及び第２の圧縮信号は同一の圧縮技術をベースとした圧縮信号であることを特徴とする画像処理装置。

[付記３]（透過画像を識別より生成し、透過を含まない画像を低解像度化で高圧縮）
画像を入力する画像入力部と、
該画像を少なくとも１画素単位で識別する識別部と、
該画像と該識別信号を元に第１及び第２の画像に分離する画像分離部と、
第１の画像信号と該識別信号からなる第３の画像信号と第２の画像信号を低解像度化して圧縮し、第１及び第２の圧縮信号を出力する圧縮部と
第１及び第２の圧縮信号を重ね合せて画像ファイルを生成する画像ファイル生成手段とを備え、
該識別信号は該第１の圧縮信号では該第１の画像信号に対する透過率を表す信号として圧縮され、第１及び第２の圧縮信号は同一の圧縮技術をベースとした圧縮信号であることを特徴とする画像処理装置。

[付記４]（透過画像を可逆もしくは高画質圧縮で、トータルで高圧縮・高画質な
高圧縮ファイル）
第１の画像信号と第２の画像信号と第１もしくは第２の画像信号の透過率を指定する透過画像を生成する画像生成手段と、
第１の画像と透過画像及び第２の画像から第１の圧縮コード及び第２の圧縮コードを出力する圧縮手段と、
第１の圧縮コード及び第２の圧縮コードを重ね合せて画像ファイルを生成する画像ファイル生成手段とを備え、
該圧縮手段は、第１及び第２の圧縮コードを同一の圧縮技術で圧縮し、
第１の圧縮コードは透過画像より第１の画像の非可逆度合いを大きくすることを特徴とする画像処理装置。

[付記１の作用効果]
１つの圧縮技術で、高圧縮画像ファイルを生成できるので、作成時・表示時とも低コストの高圧縮処理を提供できる。

[付記２の作用効果]
１つの圧縮技術で、高圧縮画像ファイルを生成できるので、作成時・表示時とも低コストの高圧縮処理を提供できる。

[付記３の作用効果]
１つの圧縮技術で、高圧縮画像ファイルを生成できるので、作成時・表示時とも低コストの高圧縮処理を提供できる。

[付記４の作用効果]
１つの圧縮技術で、高圧縮画像ファイルを生成でき、透過画像の画質を高めて圧縮するので、高画質・高圧縮で低コストの高圧縮処理を提供できる。

また、上述の付記と実施の形態との対応関係は次のとおりである。
第６の実施の形態：付記１、２、３、４
なお、上述の各実施の形態の画像処理装置は、デジタル複合機（ＭＦＰ：Multi Function Peripheral）に組み込んで構成することができる。

図５１は、ＭＦＰ１の外観斜視図である。

ＭＦＰ１は、自動原稿搬送部Ｒａと、画像読取部Ｒと、画像形成部Ｐと、排出トレイ８と、ＣＰＵ８０１と、ＭＥＭＯＲＹ８０２と、操作入力部８０３と、表示部８０４と、を備える。

自動原稿搬送部（ＡＤＦ：Auto Document Feeder）Ｒａは、トレイＲｔに載置される複数枚の原稿を、画像読取部Ｒによる所定の原稿読み取り位置へ向けて連続的に自動搬送する機能を有する。

画像読取部Ｒは、ＭＦＰ１本体の上方に配置されており、自動原稿搬送部Ａにより自動搬送されるシート原稿や、不図示の原稿載置台に載置されるシート原稿やブック原稿の画像をスキャンして読み取る機能を有する。

画像形成部Ｐは、画像読取部Ｒにて原稿から読み取られた画像やＭＦＰ１にて外部機器から受信した画像データ等に基づいて、給紙カセットＫから供給されるシートに現像剤像を形成する機能を有する。

画像形成部Ｐにて画像が形成されたシートは、排出トレイ８上に排出される。

ＣＰＵ８０１は、ＭＦＰ１における各種処理を行う役割を有しており、またＭＥＭＯＲＹ８０２に格納されているプログラムを実行することにより種々の機能を実現する役割も有している。ＭＥＭＯＲＹ８０２は、例えば、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）、ＤＲＡＭ（Dynamic Random Access Memory）、ＳＲＡＭ（Static Random Access Memory）、ＶＲＡＭ（Video RAM）等から構成されることができ、ＭＦＰ１において利用される種々の情報やプログラムを格納する役割を有している。

操作入力部８０３は、例えば、キーボード（Keyboard）、マウス（Mouse）、タッチパネル（touch panel）、タッチパッド（touchpad）、ペンタブレット（graphics tablet）等から構成されることができる。

表示部８０４は、例えば、ＬＣＤ（Liquid crystal display）、ＥＬ（Electronic Luminescence）、ＰＤＰ（Plasma Display Panel）、ＣＲＴ（Cathode Ray Tube）等から構成されることができる。

また、いわゆるタッチパネルディスプレイによって、操作入力部８０３と表示部８０４の機能を実現するようにすることもできる。

本発明の実施の形態の画像処理装置の画像入力部は、画像読取部Ｒを用いて実現しても良い。

尚、本発明は、上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。
また、上記実施形態に開示されている複数の構成要素の適宜な組み合せにより種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。更に、異なる実施形態に亘る構成要素を適宜組み合せてもよい。

本発明は、従来の圧縮技術で構成されていた高圧縮ファイルを低い処理コストで圧縮して生成することのできる画像処理装置、画像処理方法及び画像読取装置を提供する産業において利用することができる。

Ｒａ…自動原稿搬送部、１…ＭＦＰ、８０１…ＣＰＵ、８０２…ＭＥＭＯＲＹ、１００１…画像入力部、１００１…識別部、１００３…画像分離部、１００４…色情報算出部、１００５…圧縮部、１００６…フォーマット変換部、１００７…制御部、１００８…ＨＤＤ、１０１１…識別情報、１０１２…分離画像、１０１３…文字領域座標、１０１４…文字色情報、１０１６…ＸＰＳファイル、２００３…画像分離部、２００４…色情報算出部、２００５…圧縮部、２００６…フォーマット変換部、２００７…制御部、２０１２…非単色文字画像、２０１３…文字領域座標、２０１４…文字色情報、２０１７…ＸＰＳファイル、３００７…制御部、３００９…ファイル変換部、３０１０…クライアントＰＣ、３０１７．３０１８…変換指示情報、３０１９…ＸＰＳファイル。

特許第２６１１０１２号公報特開２００２−７７６３１号公報特開２００１−７８０４９号公報特開２００５−２０２２７号公報

ＩＳＯ／ＩＥＣ１６４８５（ＭＲＣ）長谷川他：『高圧縮ＰＤＦ技術』ＲＩＣＯＨＴｅｃｈｎｉｃａｌＲｅｐｏｒｔＮｏ３０Ｐ９３〜９７（Ｄｅｃ，２００４）

Claims

入力された画像信号が表わす画像の各画素が特定の種類の画素か否かを識別する識別信号を出力する識別部と、
前記画像信号と前記識別信号とを用いて、前記画像における前記文字の画素を含む領域の座標を表す座標情報と、当該文字を含む領域の色を表す文字色情報と、を表わす描画コマンドを生成する色情報算出部と、
前記画像信号と前記識別信号とを用いて、前記画像から前記特定の種類の画素を除去した画像を表わす第１の画像信号を出力する画像分離部と、
前記第１の画像信号と前記識別信号とを圧縮して圧縮信号を出力する圧縮部と、
前記圧縮信号と前記描画コマンドとを１つのファイルとして記憶する記憶部と、
を備えることを特徴とする画像処理装置。
前記識別信号は、前記画像信号が表わす画像の画素が文字であるか否かを表わすことを特徴とする請求項１に記載の画像処理装置。
前記圧縮部は、前記第１の画像信号と前記識別信号とを同一の圧縮技術で圧縮することを特徴とする請求項１に記載の画像処理装置。
前記描画コマンドは、前記座標情報が表わす座標に前記文字色情報が表わす色の図形を描画する図形描画コマンドであることを特徴とする請求項１に記載の画像処理装置。
前記文字色情報は、単一色の色情報であることを特徴とする請求項１に記載の画像処理装置。
前記色情報算出部は、表わす色が白である文字色情報の描画コマンドを生成しないことを特徴とする請求項１に記載の画像処理装置。
前記色情報算出部は、
画像全体を白色を除く特定色で描画する描画コマンドを生成し、
表わす色が前記特定色である文字色情報の描画コマンドを生成しないことを特徴とする請求項１に記載の画像処理装置。
前記色情報算出部が生成する前記文字色情報は、当該文字を含む領域の色が単一色であれば当該単一色を表し単一色でなければ単一色でない旨を表し、
前記画像分離部は、前記文字色情報が単一色でない旨を表している前記領域の画像を表わす信号を前記画像信号から抽出して第２の画像信号として出力し、
前記圧縮部は、前記第１の画像信号と前記第２の画像信号と前記識別信号とを圧縮して圧縮信号を出力する、ことを特徴とする請求項１記載の画像処理装置。
入力された画像信号が表わす画像の各画素が特定の種類の画素か否かを識別し、
前記画像における前記文字の画素を含む領域の座標を表す座標情報と、当該文字を含む領域の色を表す文字色情報と、を表わす描画コマンドを生成し、
前記画像の各画素が特定の種類の画素か否かを識別した結果を表わす信号と前記画像から前記特定の種類の画素を除去した画像を表わす信号とを圧縮した信号を生成し、
この生成した信号と前記描画コマンドとを１つのファイルとして記憶することを特徴とする画像処理方法。
原稿画像を読取って画像信号に変換する画像入力部と、
前記画像信号が表わす画像の各画素が特定の種類の画素か否かを識別する識別信号を出力する識別部と、
前記画像信号と前記識別信号とを用いて、前記画像における前記文字の画素を含む領域の座標を表す座標情報と、当該文字を含む領域の色を表す文字色情報と、を表わす描画コマンドを生成する色情報算出部と、
前記画像信号と前記識別信号とを用いて、前記画像から前記特定の種類の画素を除去した画像を表わす第１の画像信号を出力する画像分離部と、
前記第１の画像信号と前記識別信号とを圧縮して圧縮信号を出力する圧縮部と、
前記圧縮信号と前記描画コマンドとを１つのファイルとして記憶する記憶部と、
を備えることを特徴とする画像読取装置。