JP4089905B2

JP4089905B2 - 画像処理装置、画像処理方法、プログラム及び情報記録媒体

Info

Publication number: JP4089905B2
Application number: JP2004183525A
Authority: JP
Inventors: 幸二小林
Original assignee: Ricoh Co Ltd
Current assignee: Ricoh Co Ltd
Priority date: 2004-06-22
Filing date: 2004-06-22
Publication date: 2008-05-28
Anticipated expiration: 2024-06-22
Also published as: JP2006013590A

Description

本発明は、画像データを圧縮して蓄積する機能を持つ画像処理装置に係り、特に、２以上の異なるデータ形式の画像データを処理する画像処理装置に関する。

画像データには様々なデータ形式のものがあるが、スキャナ等から入力されるビットマップ形式の画像データ（以下、スキャンデータとも記す）と、ページ記述言語（ＰＤＬ）形式の画像データ（以下、ＰＤＬデータとも記す）が代表的である。ＰＤＬデータとしては、Ａｄｏｂｅ社が提唱し広く使用されているＰＤＦやＰＳ等のフォーマットが代表的であるが、画像機器メーカ独自のフォーマットのものも多い。

スキャンデータは、ＪＰＥＧに代表されるような、ラスタースキャン（ページの左上から順々に処理される）に向いている圧縮フォーマットで蓄積されるのが一般的である。しかし、ＪＰＥＧ等の圧縮方式は、自然画などに良好な性能をもたらすものの、文字等の高周波成分を多く含む画像を高画質に圧縮しようとすると圧縮率が低くなりファイルサイズが大きくなる、ファイルサイズを小さく（圧縮率を高く）すると画質が落ちて文字の判読性が落ちるなど、オフィス等にて使用頻度の高い文字やＣＧ画像等を含む文書画像に対して必ずしも最適な圧縮方式とはいえない。

スキャンデータの圧縮に関する公知文献としては例えば特許文献２がある。この特許文献２に記載されている画像圧縮装置においては、原稿画像に含まれる文字領域の位置を特定し、文字領域内を所定の色で埋めることで下地画像を生成し、文字領域内の色のパレットを生成し、当該パレットに基づいて文字領域内の画像に基づいた減色画像を生成し、減色画像と下地画像に対し異なる圧縮を行う。

ＰＤＬデータの圧縮に関する公知文献としては例えば特許文献３がある。この特許文献３に記載の画像処理システムにおいては、フロントエンドプロセッサ側で、ＰＤＬデータから１ページ内の文字・図形の要素のみを展開したビットマップ形式の画像データ（文字・図形プレーン）とイメージ要素のみを展開したビットマップ形式の画像データ（イメージプレーン）とを生成し、文字・図形プレーンをＬＺＷ等の可逆圧縮方式で圧縮し、イメージプレーンをＪＰＥＧ等の非可逆圧縮方式で圧縮する。バックエンドプロセッサ側では、フロントエンドプロセッサより渡された各プレーンの圧縮符号を伸長した後に合成処理を行い、合成されたビットマップ形式の画像データをプリントエンジンに出力する。

スキャンデータ及びＰＤＬデータの圧縮に関する公知文献として例えば特許文献１がある。この特許文献１に記載の画像処理装置においては、スキャナから入力されたスキャンデータに対しては、画素毎の像域分離により像域毎の属性を表すフラグデータを生成する。このフラグデータは、例えば、文字属性の画素が１、他の属性の画素が０の２値画像データ、グラフィック領域の画素が１、それ以外の画素が０の２値画像データ、網点領域の画素が１、それ以外の画素が０の２値画像データである。このような属性対応のフラグデータと、入力スキャンデータに像域の属性に応じた画像処理を施した画像データとを、それぞれ異なる圧縮方式で圧縮して記憶装置に記憶する。また、通信回線から入力されたＰＤＬデータに対しては、ビットマップ形式の画像データに展開すると同時にフラグデータを生成し、それぞれを異なる圧縮方式で圧縮して記憶装置に記憶する。記憶装置に記憶された圧縮データの出力時には、フラグデータと画像データを伸長した後、伸長した画像データに対しフラグデータに基づいて像域の属性に応じた画像処理を施してからプリンタに送り出力させる。

画像データの圧縮機能が必須の画像処理装置として複写機がある。近年の複写機は、複写機能、プリンタ機能、スキャナ機能等を集約したＭＰＦ(Multi Function Printer)と呼ばれる複合機の形態をとる割合が高くなっている。また、ハードディスク装置(以下ＨＤＤ)等の大容量の記憶装置を備え、この記憶装置に読み込んだ画像を圧縮して記憶（蓄積）しておくことにより、複数部数の原稿を１度だけ読み込みページ順に複数部数の出力を行う”電子ソート”と呼ばれる機能や、用紙ミスフィード（紙づまり）等のエラー時に複数のプリントがエラーした場合に(高速の複写機等では複数の用紙が同時に機械内部に存在するため)原稿を再読み込みしなくとも再プリントが自動的に行われるような機能を備えている。また、圧縮してＨＤＤ内に蓄積した文書画像データを必要に応じて外部装置にネットワークを経由して転送するような文書配信機能などを備えている。また、近年、スキャナで読み込んだ画像データに加え、外部装置により入力されるＰＤＬデータのプリント等も可能なＭＦＰが増加している。

特開2001-211329号公報特開2002-77631号公報特開2000-198241号公報

スキャンデータに加えＰＤＬデータも処理するＭＦＰのように、２以上の異なったデータ形式の画像データを処理する画像処理装置においては、入力画像データの形式が異なっても、その圧縮データのフォーマットを共通化もしくは実質的に共通化することが望ましい。ここで、フォーマットの実質的な共通化とは、フォーマットの相違が、圧縮データに対する処理系の共通化を妨げないようなものであることを意味する。

スキャンデータとＰＤＬデータとで圧縮データのフォーマットが異なると、圧縮データの管理やデータフロー等の面でシステムが複雑化し、コストアップの原因となったり装置の機能や性能面で制約が生じやすくなる。例えば、異種データをマージ（スキャンデータとＰＤＬデータを１ページ内に集約）して出力するためには、圧縮データのフォーマットを統一する必要が生じるため、スキャンデータ又はＰＤＬデータをそのまま出力する場合のデータフローと、スキャンデータとＰＤＬデータをマージして出力する場合のデータフローが異なったものになる。このようなデータフローの多系統化は、システムの処理系の複雑化、コストアップ、処理速度の低下等の原因となる。また、マージのためのフォーマット変換を行った場合とフォーマット変換を行わない場合とで処理後段の画像処理の内容が異なるときには、フォーマット変換を行わずに出力した画像とフォーマット変換を行って出力した画像とで画質に違いが生じるといった不都合もある。さらに、スキャンデータの圧縮データとＰＤＬデータの圧縮データにフォーマットの共通性がないと、保存した圧縮データを圧縮率などを調整するフォーマット変換を行って外部装置へ配信する場合などに、それぞれのデータ毎にフォーマット変換処理の内容が異なったものとなり、この点でもシステムの複雑化、処理効率の低下を招くことになる。

前記特許文献１に記載の方式によれば、スキャンデータとして入力された画像データもＰＤＬデータとして入力された画像データも圧縮データのフォーマットは同一となるので、圧縮データのフォーマットの共通化という課題は達成される。しかし、この方式では、ビットマップ形式に展開された多値データを圧縮するため、圧縮率を上げると文字の判読性が低下するという問題がある。オフィス等で使用頻度の高い文書の大半は文字を含むため、文字の判読性の低下は極めて好ましくない。また、イメージやグラフィックス等の下地画像と文字画像を含み、それらが一部重なるようなＰＤＬデータの場合、例えば文字画像が下地画像に隠れた状態にビットマップ展開して圧縮し蓄積してしまうと、下地画像に隠れた文字画像の情報は失われてしまう。この場合、蓄積データに対し文字画像と下地画像の上限関係を変更し、文字画像全てを表示させるような編集を行うことは不可能になってしまい、蓄積データの再利用に制約が生じる。

よって、本発明の目的は、スキャンデータやＰＤＬデータのような２以上のデータ形式の画像データが入力されるＭＦＰ等の画像処理装置において、異なったデータ形式の画像データについて圧縮データのフォーマットの共通化もしくは実質的な共通化を図ると同時に、高圧縮率の場合の文字の判読性を向上させること、ＰＤＬデータとして入力された画像データの圧縮データの再利用性を向上させること、さらには高画質の画像再現を可能にすることである。

請求項１の発明は、
ビットマップ形式の画像データを入力する第１の画像入力手段と、
前記第１の画像入力手段による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第１のエンコード処理手段と、
ページ記述言語形式の画像データを入力する第２の画像入力手段と、
前記第２の画像入力手段による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第２のエンコード処理手段と、
前記第１のエンコード処理手段及び前記第２のエンコード処理手段より出力された構造化画像データを記憶する記憶手段とを有し、
前記第１のエンコード処理手段は、
構造化画像データの要素データとして、
入力画像データの文字画像を再現するための２値の文字画像データを生成する手段と、
該入力画像データの文字画像の色を再現するための多値の文字色データを生成する手段と、
該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データを生成する手段と、
該文字画像データ、該文字色データ及び該下地画像データから多値の再現画像データを合成し、該再現画像データと該入力画像データとの差分成分を表す変換データを生成する手段と、
を含む第１の構造化手段と、
該第１の構造化手段により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第１の圧縮符号化処理手段と、
からなり、
前記第２のエンコード処理手段は、
構造化画像データの要素データとして、入力画像データの文字画像を再現するための２値の文字画像データと、該入力画像データの文字画像の色を再現するための多値の文字色データと、該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データとを生成する第２の構造化手段と、
該第２の構造化手段により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第２の圧縮符号化処理手段とからなる、
ことを特徴とする画像処理装置である。

請求項２の発明は、
ビットマップ形式の画像データを入力する第１の画像入力手段と、
前記第１の画像入力手段による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第１のエンコード処理手段と、
ページ記述言語形式の画像データを入力する第２の画像入力手段と、
前記第２の画像入力手段による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第２のエンコード処理手段と、
前記第１のエンコード処理手段及び前記第２のエンコード処理手段より出力された構造化画像データを記憶する記憶手段とを有し、
前記第１のエンコード処理手段は、
構造化画像データの要素データとして、
入力画像データの文字領域の位置及び範囲を示す文字領域データを生成する手段と、
該文字領域データにより示される文字領域の文字画像を再現するための２値の文字画像データを生成する手段と、
該文字領域データにより示される文字領域の文字画像の色を再現するための多値の文字色データを生成する手段と、
該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データを生成する手段と、
該文字領域データ、該文字画像データ、該文字色データ及び該下地画像データから多値の再現画像データを生成し、該再現画像データと該入力画像データとの差分成分を表す変換データを生成する手段と、
を含む第１の構造化手段と、
該第１の構造化手段により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第２の圧縮符号化処理手段と、
からなり、
前記第２のエンコード処理手段は、
構造化画像データの要素データとして、入力画像データの文字領域の位置及び範囲を示す文字領域データと、該文字領域データにより示される文字領域の文字画像を再現するための２値の文字画像データと、該文字領域データにより示される文字領域の文字画像の色を再現するための多値の文字色データと、該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データとを生成する第２の構造化手段と、
該第２の構造化手段により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第２の圧縮符号化処理手段とからなる、
ことを特徴とする画像処理装置である。

請求項３の発明の特徴は、請求項２の発明による画像処理装置において、前記第２のエンコード処理手段の第２の構造化手段が、構造化画像データの要素データとして生成した文字画像データと下地画像データの合成時の上下関係を示すデータを該構造化画像データの要素データとしてさらに生成することである。

請求項４の発明の特徴は、請求項２の発明による画像処理装置において、前記第２のエンコード処理手段の第２の構造化手段が、構造化画像データの要素データとして生成した文字画像データと下地画像データの合成時の透明化処理のための不透明度又は透明度を指定するデータを該構造化画像データの要素データとしてさらに生成することである。

請求項５の発明の特徴は、請求項２の発明による画像処理装置において、前記第２のエンコード処理手段の第２の構造化手段が、構造化画像データの要素データとして生成した文字領域データ、文字画像データ、文字色データ及び下地画像データから合成される多値の再現画像データと入力画像データとの差分成分を表す変換データを該構造化画像データの要素データとしてさらに生成することである。

請求項６の発明は、
ビットマップ形式の画像データを入力する第１の画像入力工程と、
前記第１の画像入力工程による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第１のエンコード処理工程と、
ページ記述言語形式の画像データを入力する第２の画像入力工程と、
前記第２の画像入力工程による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第２のエンコード処理工程と、
前記第１のエンコード処理工程及び前記第２のエンコード処理工程より出力された構造化画像データを記憶手段に記憶する工程とを有し、
前記第１のエンコード処理工程は、
構造化画像データの要素データとして、
入力画像データの文字画像を再現するための２値の文字画像データを生成する工程と、
該入力画像データの文字画像の色を再現するための多値の文字色データを生成する工程と、
該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データを生成する工程と、
該文字画像データ、該文字色データ及び該下地画像データから多値の再現画像データを合成し、該再現画像データと該入力画像データとの差分成分を表す変換データを生成する工程と、
を含む第１の構造化工程と、
該第１の構造化工程により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第１の圧縮符号化処理工程と、
からなり、
前記第２のエンコード処理工程は、
構造化画像データの要素データとして、入力画像データの文字画像を再現するための２値の文字画像データと、該入力画像データの文字画像の色を再現するための多値の文字色データと、該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データとを生成する第２の構造化工程と、
該第２の構造化工程により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第２の圧縮符号化処理工程とからなる、
ことを特徴とする画像処理方法である。

請求項７の発明は、
ビットマップ形式の画像データを入力する第１の画像入力工程と、
前記第１の画像入力工程による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第１のエンコード処理工程と、
ページ記述言語形式の画像データを入力する第２の画像入力工程と、
前記第２の画像入力工程による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第２のエンコード処理工程と、
前記第１のエンコード処理工程及び前記第２のエンコード処理工程より出力された構造化画像データを記憶手段に記憶する工程とを有し、
前記第１のエンコード処理工程は、
構造化画像データの要素データとして、
入力画像データの文字領域の位置及び範囲を示す文字領域データを生成する工程と、
該文字領域データにより示される文字領域の文字画像を再現するための２値の文字画像データを生成する工程と、
該文字領域データにより示される文字領域の文字画像の色を再現するための多値の文字色データを生成する工程と、
該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データを生成する工程と、
該文字領域データ、該文字画像データ、該文字色データ及び該下地画像データから多値の再現画像データを生成し、該再現画像データと該入力画像データとの差分成分を表す変換データを生成する工程と、
を含む第１の構造化工程と、
該第１の構造化工程により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第２の圧縮符号化処理工程と、
からなり、
前記第２のエンコード処理工程は、
構造化画像データの要素データとして、入力画像データの文字領域の位置及び範囲を示す文字領域データと、該文字領域データにより示される文字領域の文字画像を再現するための２値の文字画像データと、該文字領域データにより示される文字領域の文字画像の色を再現するための多値の文字色データと、該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データとを生成する第２の構造化工程と、
該第２の構造化工程により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第２の圧縮符号化処理工程とからなる、
ことを特徴とする画像処理方法である。

請求項８の発明の特徴は、請求項７の発明による画像処理方法において、前記第２のエンコード処理工程の第２の構造化工程は、構造化画像データの要素データとして生成した文字画像データと下地画像データの合成時の上下関係を示すデータを該構造化画像データの要素データとしてさらに生成することである。

請求項９の発明の特徴は、請求項７の発明による画像処理方法において、前記第２のエンコード処理工程の第２の構造化工程が、構造化画像データの要素データとして生成した文字画像データと下地画像データの合成時の透明化処理のための不透明度又は透明度を指定するデータを該構造化画像データの要素データとしてさらに生成することである。

請求項１０の発明の特徴は、請求項７の発明による画像処理方法において、前記第２のエンコード処理工程の第２の構造化工程が、構造化画像データの要素データとして生成した文字領域データ、文字画像データ、文字色データ及び下地画像データから合成される多値の再現画像データと入力画像データとの差分成分を表す変換データを該構造化画像データの要素データとしてさらに生成することである。

請求項１１の発明は、請求項１乃至５のいずれか１項の発明による画像処理装置の各手段としてコンピュータを機能させるプログラムである。

請求項１２の発明は、請求項１乃至５のいずれか１項の発明による画像処理装置の各手段としてコンピュータを機能させるプログラムが記録された、コンピュータが読み取り可能な情報記録媒体である。

請求項１〜１０の発明によれば、ビットマップ形式とページ記述言語形式という異なったデータ形式の画像データを、フォーマットが共通化された圧縮データとして蓄積することができるため、蓄積した圧縮データに対するデコード処理等の処理の内容、データフロー、処理系の構成などの共通化を図ることができ、異なったデータ形式の画像データの圧縮データを一元的に管理することが可能となる。よって、システムの複雑化やコストアップを抑え、かつ処理の効率化を図ることができる。また、構造化画像データの要素データとして２値の文字画像データを含み、これは他の要素データとは別に圧縮符号化されるため、全体の圧縮率が高い場合でも良好な文字判読性を維持でき、さらに、構造化画像データの要素データとして変換データを含むことにより、高品質の文字画像再現が可能であるとともに文字画像の画質のスケーラビリティを持たせることができる。また、構造化画像データの圧縮符号化を要素データ別に行うため、個々の要素データの特性に適した符号化方式を利用することができ、ページ記述言語形式の画像データなども効率的な圧縮が可能である。さらに、請求項３，４，８，９の発明によれば、ページ記述言語形式の画像データの構造化画像データの要素データとして、文字画像データと下地画像データの上下関係や透明化処理のための不透明度もしくは透明度など、両データの合成を制御するためのデータが含まれるため、例えば下地に隠れる文字画像の情報などを圧縮データに保存することができるため、圧縮データに対し下地に隠れた文字画像を下地の上に表すような編集等が可能となり、圧縮データの再利用性を向上させることができる。さらに、請求項２，７の発明によれば、構造化画像データの要素データとして文字領域の位置及び範囲を示す文字領域データが含まれるため、文字領域単位の文字画像データ及び文字色データを生成可能であり、それらのデータ量を削減できる。請求項１１，１２の発明によれば、コンピュータを利用して請求項１〜５の発明を容易に実施することが可能になる等々の効果を得られる。

以下に説明する実施の形態において多値の画像データの圧縮符号化方式としてJPEG2000の基本方式（IS
15444-1）が利用されるため、ここでJPEG2000の概要を説明する。

図３５は、JPEG2000の圧縮符号化処理のアルゴリズムを説明するためのブロック図である。ここでは、入力画像データとしてカラーのRED,GREEN,BLUE(RGB)の画像データを例にして説明する。

入力されたRGBの画像データは、タイリング処理部３０１でタイルと呼ばれる矩形のブロックに分割され、タイル単位で入力される。ラスタ形式の画像データが入力された場合は、タイリング処理部３０１でラスタ/ブロック変換が行われる。JPEG2000では、タイル単位で独立して符号化、復号化が可能である。このことは、ハードウェアにより符号化、復号化を行う場合のハード量の削減を可能にし、また、必要なタイルのみ復号し表示することも可能にするなど、JPEG2000の多機能化の一翼を担っている。なお、JPEG2000ではタイリングはオプションであり、タイリングを行わないことも可能である。

次に、画像データは色変換処理部３０２にて、輝度/色差系の信号に変換される。JPEG2000では離散ウェーブレット変換(以下DWT)に使用するフィルタの種類(５×３と９×７の２通り)によって2通りの色変換が定められており、例えば可逆変換可能な５×３フィルタを使用する場合は、次式によって可逆の色変換を行う。
Ｙ＝|_（Ｒ＋２Ｇ＋Ｂ）／４_|
Ｕ＝Ｒ−Ｇ
Ｖ＝Ｂ−Ｇ・・・・式１

但し、|_Ｘ_| は、Ｘを超えない最大の整数を表す。

なお、上記の色変換に先立ち、ＲＧＢ各信号毎にＤＣレベルシフトが行われる。ＤＣレベルシフトは、例えばＲＧＢ信号が８ｂｉｔの場合は次式により表される。
Ｒ'＝Ｒ−１２８・・・・式２

色変換後の信号は、ＤＷＴ処理部３０３において各々のコンポーネント毎にＤＷＴが行われ、ウェーブレット係数が出力される。ＤＷＴは２次元にて行われるが、通常は、リフティング演算と呼ばれる演算方法により１次元フィルタ演算のコンボリューションにて実施される。１次元の変換式を式３に示す。
Ｌ(k)＝Ｘ(2k)＋（Ｈ(k)＋Ｈ(k+1)）／４
Ｈ(k)＝Ｘ(2k-1)−（Ｘ(2k)＋Ｘ(2k-2)）／２・・・・式３
但し、L(k)は低周波成分、H(k)は高周波成分、X(k)は画素値、kは座標を表す。
ＤＷＴはダウンサンプリングを伴うため、上記L(K)、H(K)は入力画像と比較して1/2の解像度となる。

図３６は、オクターブ分割されたウェーブレット係数を表す図である。ＤＷＴは、１デコンポジション(分解)レベル毎にLL,HL,LH,HHの４つのサブバンドと呼ばれる方向成分が出力され、LLに対してDWTを再帰的に繰り返し、より低解像度へとデコンポジションレベルをあげていく。解像度の最も高いデコンポジションレベル１の係数を1HL,1LH,1HHと表し、以下2HL,2LH・・・NHHと表す。なお、図３６は、３デコンポジションレベルのサブバンド分割を示している。

各デコンポジションレベルにおけるサブバンドをプレシンクトと呼ばれる領域に分割して符号の集合を形成する事が可能である。また、プレシンクトはコードブロックと呼ばれる所定の矩形ブロックに分割され、符号化はコードブロック単位で行われる。

DWT処理部３０３から出力されたウェーブレット係数に対し量子化部３０４でスカラー量子化が行われるが、可逆のＤＷＴが実施される場合にはスカラー量子化は行われないか、量子化ステップ数を１とした量子化が行われる。また、後段のポスト量子化部３０６におけるポスト量子化によっても、スカラー量子化とほぼ同様な効果が得られる。スカラー量子化のパラメータはタイル単位で変更可能である。

量子化処理部３０４から出力された量子化後のウェーブレット係数に対し、エントロピー符号化部３０５にてエントロピー符号化が行われる。JPEG2000におけるエントロピー符号化方式は、サブバンド内をコードブロックに分割し(但し、サブバンドのサイズがコードブロックサイズ以下の場合は分割しない)、コードブロック単位に符号化される。

この符号化において、図３７に模式的に示すように、コードブロック内のウェーブレット係数はビットプレーンに分解され、各ビットプレーンは変換係数の画質への影響度を表す状態に従って３つの符号化パス（SIGNIFICANCE PROPAGATIONパス，MAGNITUDE REFINEMENTパス，CLEAN UPパス）と呼ばれるサブビットプレーンに分割されてＭＱコーダと呼ばれる算術符号化方式により符号化される。ビットプレーンはMSB側ほど、符号化パスはSIGNIFICANCE
PROPAGATION、MAGNITUDE REFINEMENT、CLEAN UPの順に、重要度（画質への寄与度）が高い。また、各パスの終端は、切り捨て点(トランケーションポイント)とも呼ばれ、後段のポスト量子化での符号の切り捨て可能な単位となっている。

エントロピー符号化により生成された符号データに対し、ポスト量子化部３０６にて必要に応じて符号の切り捨て（トランケーション）が行われる。ただし、可逆の符号を出力する必要がある場合にはポスト量子化は実行されない。このような符号化後の符号の切り捨てにより符号量を制御することができ、符号量の制御にフィードバックを必要としない構成（１パスの符号化）となっており、これもJPEG2000の特徴の１つである
符号ストリーム生成処理部３０７において、ポスト量子化後の符号データに対し、所定のプログレッシブ順序(符号データの復号順序)に従って符号の並べ替えとヘッダの付加を行うことにより、当該タイル分の符号ストリームが生成される。

以下、本発明の実施の形態について、いくつかの実施例に関し説明する。各実施例に係る画像処理装置はＭＦＰであるが、これは本発明の好ましい実施の形態の一例にすぎない。本発明は、ＭＦＰに限らず、画像データを処理する各種の画像処理装置、ファイルサーバ等のネットワーク機器に適用し得るものである。また、以下の説明で多くの図面を参照するが、説明の重複を減らすため、複数の図面において同一部分又は対応部分に同一の参照番号が付されている。

図１は、本実施例及び後記各実施例に係るＭＦＰの全体構成を示すブロック図である。このＭＦＰは、原稿を読取るスキャナ部１０１、スキャナ部１０１から入力された画像データに対し公知のγ補正処理や空間フィルタ処理等の画像処理を行うスキャナ画像処理部１０２、ビットマップ形式の画像データを構造化した後に圧縮符号化して符号データを出力するエンコーダＳ１０３、ページ記述言語（ＰＤＬ）形式の画像データを構造化した後に圧縮符号化して符号データを出力するエンコーダＰ１０４、装置全体の動作制御命令や外部装置との通信、バス１１１上のデータの流れなどの制御を司るＣＰＵ１０５、画像データや圧縮符号化された符号データを一時的に記憶するためのワーク領域として使用される揮発性のメモリ１０６、符号データ等を保存、蓄積するためのハードディスク装置(以下ＨＤＤ)１０７、操作者とのインターフェースであり、スタートボタンや動作モードの設定ボタンなどを備える操作部１０８、外部装置に対して構造化及び符号化された画像データを転送する際に画像データのフォーマット変換を行うフォーマット変換処理部１０９、外部転送路を介してパーソナルコンピュータ(以下ＰＣ)等の外部装置から制御コマンドやページ記述言語形式を含む画像データを送受信する外部インターフェース１１０、各構成要素間で双方向にデータを転送可能なバス１１１、構造化・符号化処理された符号データを復号処理して画像データを出力するデコーダ１１２、デコーダ１１２より出力される画像データに対し公知の色補正処理、γ変換処理、擬似階調処理等を行うプリンタ画像処理部１１３、プリンタ画像処理部１１３より出力される画像データを記録紙等の記録媒体へ記録するプリンタ部１１４から構成されている。

ここで、スキャナ部１０１及びスキャナ画像処理部１０２は、ビットマップ形式の画像データの入力手段に相当する。また、外部インターフェース１１０はページ記述言語形式の画像データの入力手段に相当する。また、エンコーダＳ１０３はビットマップ形式の画像データに対するエンコード処理手段に相当し、エンコーダＰ１０４はページ記述言語形式の画像データに対するエンコード処理手段に相当する。これらエンコーダは、後述のように、入力画像データを複数の要素データからなる構造化画像データに変換する構造化手段と、構造化画像データの少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う圧縮符号化処理手段とから構成される。

＜基本的動作＞
まず、ＭＦＰの基本的な動作である原稿読み取り動作および複写動作について説明する。ユーザにより操作部１０８上のスタートボタン（不図示）が押下されると、操作部１０８よりバス１１１を介して信号を受信したＣＰＵ１０５は、複写動作に先立ち必要なパラメータの設定等を行った後、所定の複写動作のための制御を行う。

スキャナ部１０１は、原稿をスキャンして図示しないＣＣＤによって光電変換を行い、得られたアナログ信号をデジタル信号であるＲＧＢの３コンポーネントからなるカラー画像データへと変換して出力する。スキャナ部１０１から出力された画像データは、スキャナ画像処理部１０２で公知の画像処理を施される。スキャナ画像処理部１０２における画像処理は、本発明において特に限定されるものではないが、その例を挙げれば、スキャナ部１０１から読込まれた反射率属性の信号を濃度属性に変換するγ変換やＬＯＧ変換、スキャナ光学系のＭＴＦの劣化の補正やモアレ抑制を目的とした空間フィルタ処理、原稿地肌を除去する地肌除去処理、色空間を例えばＳＲＧＢなどの標準色空間へと変換する色変換処理等が考えられる。スキャナ画像処理部１０２から出力された画像データは、バス１１１を介して一時的にメモリ１０６に記憶される。

メモリ１０６に記憶された画像データは、エンコーダＳ１０３に入力され、後述するエンコード処理（構造化・圧縮符号化処理）が行われる。エンコーダＳ１０３の詳細は後述する。エンコーダＳ１０３からバス１１１に出力された圧縮データは、一旦メモリ１０６に記憶された後、メモリ１０６から読み出されてＨＤＤ１０７に保存され、同時にデコーダ１１２に入力されて復号処理が行われる。

このようなバス１１１上のデータ転送の制御はＣＰＵ１０５によって行われる。通常、このようにバスに接続されたメモリへのデータの書き込みアクセスは、バスに接続された各処理部がＤＭＡ(DIRECT MEMORY ACCESS)方式で数十バイトから数キロバイトの一定の単位で行われるため、バスの接続部はバッファとＤＭＡコントローラで構成されるが、説明の簡略化のためＤＭＡコントローラは図中省略されている。メモリからデータを読み出す場合にも同様にＤＭＡ方式によってアクセスされるため入力バッファメモリが必要となるが、これも省略されている。

なお、ＨＤＤは、ディスクの中心に近い側と遠い側とでは読み出し／書き込み速度が変化し、また、読み出し／書き込みエラー等を生じる可能性があり、半導体メモリと比較すると同期信号の読み出し／書き込みには向かないデバイスであるため、同期信号であるエンコーダＳ１０３の出力データをＨＤＤ１０７に直接書き込むと書き込み動作が安定しない。そこで、エンコーダＳ１０３の出力データのＨＤＤ１０７への書き込みの際にメモリ１０６を介在させている。ＨＤＤ１０７の読み出し時も同様である。なお、１ページ単位でみればＨＤＤ１０７も同期して動作する。

一方、デコーダ１１２は、メモリ１０６から符号データが入力されると所定のデコード処理（復号処理及び合成処理）を行い、画像データをプリンタ画像処理部１１３へ出力する。プリンタ画像処理部１１３における画像処理は、本発明において特に限定されるものではないが、例を上げれば、ＲＧＢ信号をプリンタの色材信号、例えばCYAN(Ｃ),MAGENTA(Ｍ),YELLOW(Ｙ),BLACK(Ｋ)へ変換しカラーマッチングを行う色補正処理、墨生成処理、画像データのγをプリンタ部１１４のγに合わせるγ補正処理、ディザや誤差拡散といったハーフトーンへの変換を行う擬似階調処理等が考えられる。プリンタ画像処理部１１３で以上のような画像処理を行われた後の画像データは、プリンタ部１１４により記録紙などにプリントされ、複写動作が完了する。

以上の複写動作の完了後には、ＨＤＤ１０７内にエンコード処理された画像の圧縮データが保存されている。ＨＤＤ１０７に保存された圧縮データは、複写動作時に紙詰まり等が発生した場合のバックアップ、多ページの原稿を多部数ページ順に出力する電子ソート機能、過去に保存したデータを原稿無しで再度プリントする再プリント複写動作、ＰＣなどの外部機器へのデータ配信などの目的に利用される。なお、原稿をＨＤＤ１０７に電子データとして保存するだけでよい場合には、上に述べたデコーダ１１２以降の処理は行われない。

＜ビットマップ形式画像データのエンコード処理＞
エンコーダＳ１０３の構成と、ビットマップ形式の画像データのエンコード処理（構造化及び圧縮符号化処理）について説明する。

図２は、本実施例に係るエンコーダＳ１０３のブロック図である。このエンコーダＳ１０３は、ビットマップ形式の入力画像データの２値化を行い２値画像を生成する２値画像生成処理部１、２値画像生成処理部１から出力された２値画像データを一時的に記憶するメモリ２、その２値画像データから文字領域を検出する文字領域検出処理部３、２値の文字画像データ、多値の文字色データ及びそれに付随するデータを生成する文字画像生成処理部４、入力画像データから文字画像を除去した下地画像データを生成する下地画像生成処理部５、文字画像領域に対して入力画像データを再現するための変換データを生成する変換データ生成処理部６、２値の文字画像データを可逆圧縮処理するMMR圧縮処理部７、下地画像データをJPEG2000方式で圧縮処理するJPEG2000圧縮処理部８、変換データ中の＋差分データをJPEG2000圧縮処理するJPEG2000圧縮処理部９、変換データ中の−差分データをJPEG2000圧縮処理するJPEG2000圧縮処理部１０、文字色データをJPEG2000圧縮処理するJPEG2000圧縮処理部１１からなる。

このようなエンコーダＳ１０３において、各圧縮符号化処理部７〜１１が構造化画像データを、少なくとも一部の要素データに関し要素データ別に圧縮符号化する圧縮符号化処理手段を構成し、それ以外の部分がビットマップ形式の入力画像データを複数の要素データからなる構造化画像データに変換する（換言すれば構造化画像データの要素データを生成する）構造化手段を構成している。また、本実施例においては、構造化画像データの要素データとして、２値の文字画像データ、多値の文字色データ、多値の下地画像データ、多値の変換データ（＋差分データ及び−差分データ）が生成される。

図３は、エンコーダＳ１０３におけるエンコード処理の概略を示すフローチャートである。図中のｓｔｅｐ１〜ｓｔｅｐ３は、ビットマップ形式の画像データに対する構造化工程に相当し、ｓｔｅｐ４は構造化工程により生成された構造化画像データを要素データ別に圧縮符号化する工程に相当する。以下、本実施例に係るエンコーダＳ１０３の詳細な構成及び動作について、処理の流れに沿って説明する。なお、本実施例における入力画像データは、一般的な多値のＲＧＢカラー画像データとする。

エンコード処理の最初の処理ステップｓｔｅｐ１において、メモリ１０６よりビットマップ形式の入力画像データが所定のブロック単位で読み出され、２値画像生成処理部１へ入力され２値化処理が行われ、生成された２値画像データがメモリ２に記憶される。なお、メモリ１０６の読み出し及び書き込みはＣＰＵ１０５により制御される。

２値画像生成処理部１は、図４に示すように、Ｙ信号変換処理部２３、閾値決定処理部２１及び２値化処理部２２からなる構成である。２値画像生成処理部１においては、所定のブロック単位に入力されたＲＧＢ信号を、Ｙ信号変換処理部２３でＹ（輝度）信号に変換し１チャンネルの信号とする。ＲＧＢ信号からＹ信号への変換の方法は特に限定されないが、例えば、JPEG2000に採用されている変換式
Ｙ＝(Ｒ＋２×Ｇ＋Ｂ＋２)／４
を用いることができる。

変換されたＹ信号に基づいて、閾値決定処理部２１でブロック単位に２値化用閾値が決定される。この閾値の決定方法は特に限定されないが、例えば、特許文献２にも記載されているように、Ｙ信号のヒストグラムをとり、その平均、分散等の統計的性質を利用して閾値を決定する方法を用いることができる。あるいは、より簡易に、ブロック内全画素の輝度値の平均値、又は、平均値に所定の重み演算を行った値を閾値とする方法を用いることもできる。

２値化処理部２２は、閾値決定処理部２１により決定された閾値を用いてＹ信号を２値化した２値画像データを出力する。例えば、図８（ａ）に示すような入力画像データ（原稿）に対し、（ｂ）に示すような２値画像データが生成される。

なお、Ｙ信号変換処理は必ずしも必要ではなく、入力画像データのＲＧＢ各信号に対し２値化用の閾値を決定し、それを用いてＲＧＢ各信号の２値化処理を行ってもよい。ただし、ＲＧＢ３チャネルの２値化信号をそのまま出力した場合、色毎に２値化の結果が異なると再現画像上で文字エッジに色がつく等の不具合が生じ、また、その記憶に必要なメモリ量の増加や処理時間の増加などを招きやすい。したがって、２値画像生成処理部１の最終段で、ＲＧＢ３チャンネルの２値化信号のＯＲ処理などを行って１チャンネルの２値化信号にするのが好ましい。なお、Ｙ信号に対して２値化を行うと黄色の文字などが検出されにくい可能性もある。これを避けるためには、Ｙ信号の生成式を変更するか、あるいは、Ｙ信号と黄色の補色であるＢ信号の２チャンネルで２値化を行い、その結果をＯＲするなどにより１チャンネルの信号に変換する方法が有効である。

エンコード処理の次の処理ステップｓｔｅｐ２は、文字領域検出処理部３による文字領域検出処理である。２値画像生成処理部１で「所定単位」分の２値化が行われ、その２値画像データがメモリ２に記憶されると、文字領域検出処理部３で文字領域を検出する処理が行われる。ここで、「所定単位」はシステム構成に応じて定めればよい。１ページ全体を２値化処理した後で文字領域検出を行ってもよいが、複写動作全体の処理速度を速めるためには、文字領域検出に必要な所定ライン数分の２値画像生成処理が終了後直ちに文字領域検出処理を実行するのが好ましい。この場合、メモリ２はＦＩＦＯ(FIRST-IN FIRST-OUT)の動作をすることになる。

ここでの文字領域検出の方法は特に限定されるものではなく、従来技術を使用してよい。このような２値画像からの文字領域検出は、ＯＣＲ処理などで広く行われる技術であり、種々の方法が提案されている。例えば、特許文献２にも記載されているが、２値画像データの黒画素の輪郭線追跡を行い、全てをラベリングし、縦、横の幅がある閾値以下の黒画素の集まりを文字とすることにより文字領域を検出する方法を使用し得る。なお、このようなＯＣＲ処理をベースにした文字領域検出方法によると、表の罫線等の線画は文字として認識されにくい。これは、ＯＣＲ処理が線画データを必要としないためである。本発明のように再現画像上での文字の判読性向上を目的とする場合には、線画も文字と同様に扱う方が文書画像全体の判読性が向上する。そのため、文字領域の検出と並行して線画領域を検出するように構成してもよい。文字領域は、ある程度の水平方向の長さと高さを有するブロックとして認識されるが、線画はそのどちらかが０に近い値を持つという性質を有している。このような性質を利用すれば、同様の方法で線画も認識可能となる。

図８（ｃ）に文字領域検出結果の例を示す。黒い部分が文字領域である。

エンコード処理の次の処理ステップｓｔｅｐ３で、文字画像データ生成処理、下地画像データ生成処理及び変換データ生成処理が行われる。これらの処理は文字領域検出処理と並行して行われる。

メモリ１０６から入力画像データが、メモリ２から２値画像データが、それぞれ画像の先頭より予め定められたブロック単位で読み出され、文字画像生成処理部４、下地画像生成処理部５及び変換データ生成処理部６にそれぞれ入力される。

まず、文字画像生成処理部４の構成と動作について説明する。文字画像生成処理部４は、図５に示すように、文字画像抽出処理部３１、文字色算出処理部３２及び下地色算出処理部３３からなる構成である。

文字画像抽出処理部３１は、文字領域データと２値画像データが入力し、文字領域(図８（ｃ）の黒部分）内の２値画像データがオンの画素(図８（ｂ）の黒画素の部分）のみオン（黒）の文字画像データを出力する。この文字画像データは２値のビットマップ形式のデータである。図８の（ｄ）に文字画像データの例を示す。

このような文字画像抽出処理と並行して、文字色算出処理部３２において文字色が算出される。文字色算出処理部３２は、所定ブロック単位で入力画像データと文字画像データが入力し、文字画像データがオンの画素位置を参照画素位置とし、入力画像データの参照画素の値に基づいて文字色を算出する。この文字色の算出方法は、例えば特許文献２に記載されているように、入力画像データの参照画素値のＲＧＢの３次元ヒストグラムを求め、その最大値を文字色とする方法を用いることができる。より簡易な方法として、入力画像データの参照画素値の平均値を文字色として用いる方法でもよい。この平均値を用いる方法では、文字エッジ部を参照画素に含めると、下地の色との混色等が発生し本来の文字色とは異なる文字色を算出するおそれがある。これを避けるには、図９に模式的に示すように、文字の芯部のみ文字色算出時の参照画素とするとよい。ここで、例えば、エッジから所定画素数だけ内部の画素を文字の芯部として扱えばよい。細線文字等では文字画素が１ドット又は２ドットしかない場合も存在するが、このような場合にはエッジの中心を芯部として扱えばよい。このように文字画像の芯部のみのデータから文字色を算出することによって、下地色の影響を受けずに正確な文字色の算出が可能となる。

また、下地色算出処理部３３は、入力画像データと文字画像データが所定のブロック単位で入力し、文字画像データのオフの画素位置を参照画素位置として、入力画像データの参照画素の値に基づいて下地色を算出する。この下地色の算出方法は、参照画素の平均値を下地色とする方法を用いることができる。但し、文字色算出と同様に、文字エッジ部を参照画素に含めると文字エッジ部の色の影響を受けて本来の下地色が算出できないおそれがあるので、文字エッジから所定画素数の範囲は参照画素としない方が好ましい。

以上の処理により、所定のブロック単位で、文字画像データ、文字色データ及び下地色データが得られる。

文字色および下地色の算出処理について、図１０によりさらに詳細に説明する。図１０(ａ)は、図８（ａ）に示す入力画像データにおける“カラー複写機”の文字領域を拡大した図である。ここでは、文字領域中の“カラー”を赤色文字、“複写機”を黒文字と仮定している。そして、図１０（ａ）に示す細線の四角形が前述のブロックであり、このような小さなブロック単位で文字色及び下地色の算出が行われる。

図１０（ｂ）は、文字色算出の結果を模式的に示している。図中の斜線が施されたブロックは算出された文字色が”赤”の領域であり、黒く塗りつぶされたブロックは算出された文字色が”黒”の領域である。白抜きのブロックは、文字画像データのオンの画素が含まれないブロックである。

文字色算出処理部３２は、１ブロックにつき１つの文字色を出力する。つまり、文字色データは、各ブロック内が同じ文字色で塗りつぶされた多値の画像データとなる。

一方、下地色算出処理部３３は、文字画像データがオンの画素位置では算出した下地色を下地色データとして出力するが、文字画像データがオフの画素位置では入力画像データそのものを下地色データとして出力する。文字色データの場合と同様なブロック単位に一色の下地色データとすることも可能である。しかし、上に述べたような下地色データとすることにより、”文字領域内の下地色と文字領域の周囲の下地色とが異なる不具合”を抑制することができる。なお、文字周囲数ドットについては、入力画像データではなく、算出した下地色を出力するようにするのが好ましい。このようにすると、文字エッジ部の色の影響を受けにくくなる。

なお、文字色データは、圧縮符号化処理に先だって間引き処理を行いデータ量を削減してもよい。また、文字が存在しないブロックについては、ダミーデータ又は白色データなどを文字色データとして出力してもよいが、その周囲のブロックと同じ文字色データを出力するのが、文字色データの圧縮率が向上し好ましい。また、文字色データは、１ブロックにつき１データとして保持するようにし、その圧縮を行わない構成としてもよい。

次に、下地画像生成処理部５の構成と動作について説明する。下地画像生成処理部５は、図６に示すようなセレクタ４１のみからなる単純な構成である。セレクタ４１は、下地色データと入力画像データがデータとして入力され、制御信号である文字領域データに従ってデータを選択する。すなわち、セレクタ４１は、文字領域データがオンの領域(文字領域)では下地色算出処理部３３で算出された下地色データを選択して出力し、文字領域データがオフの領域（非文字領域）で入力画像データを選択して出力する。図８（ａ）に示す入力画像データを処理した場合、図８（ｅ）に模式的に示す様な下地画像データがセレクタ４１より出力される。この例に見られるように、下地画像データにおいては文字画像が除去されている（文字領域の下地色情報は含まれる）。

次に、変換データ生成処理部６の構成及び動作について説明する。変換データ生成処理部６は、図７に示すように、２値の文字画像データ、多値の文字色データ及び多値の下地画像データの合成処理を行う合成処理部６１、合成処理部６１から出力される合成画像データ（文字画像データ、文字色データ及び下地画像データから合成される再現画像データ）と入力画像データとの差分を演算する差分演算処理部６２、差分演算処理部６２から出力される差分データの正負を判定する正負判定処理部６３、差分データの絶対値を演算する絶対値化処理部６４、差分データとダミーデータを差分データの正負によって選択するセレクタ６５，６６、文字領域データによって差分データとダミーデータを選択するセレクタ６７，６８から構成される。

変換データ生成処理は以下のように行われる。文字画像データ、文字色データ及び下地画像データが合成処理部６１に入力し、合成処理部６１は、文字画像データがオンの画素位置で文字色データを出力し、文字画像データがオフの画素位置で下地画像データを出力する。したがって、合成処理部６１より出力される合成画像データは、下地画像データに文字色データで示された文字色の文字画像が上書きされたものである。

次に、差分演算処理部６２において、合成処理部６１より出力された合成画像データと入力画像データの差分が演算され、
差分データ＝入力画像データ−合成画像データ
で表される差分データが出力される。

この差分データは、正、負両方の値をとり得る。差分データの正負は正負判定処理部６３により判定される。本実施例では、正の差分成分を＋差分データ、負の差分成分を−差分データとして取り扱う。差分データは、絶対値化処理部６４により絶対値化されてセレクタ６５，６６に入力される。セレクタ６５は、正負判定処理部６３で差分データが正と判定されたときに、その差分データを出力し、差分データが負と判定されたときにはダミーデータを出力する。セレクタ６６は、差分データが正と判定されたときにダミーデータを出力し、負と判定されたときには絶対値化処理部６４により絶対値化された差分データを出力する。

セレクタ６７，６８は、文字領域データがオンの画素位置つまり文字領域ではセレクタ６５，６６の出力データをそれぞれ選択して出力し、非文字領域ではダミーデータを出力する。このようにして、セレクタ６７の出力である＋差分データと、セレクタ６８の出力である−差分データとからなる変換データが生成される。

エンコード処理の最後の処理ステップｓｔｅｐ４において、構造化画像データの要素データである文字画像データ、文字色データ、下地画像データ、＋差分データ、−差分データの圧縮符号化処理が行われる。すなわち、文字画像生成処理部４より出力された２値の文字画像データは、MMR圧縮処理部７によりMMR圧縮処理された後、メモリ１０６に格納される。なお、文字画像データの圧縮方式は、MMR方式に限定されるものではなく、例えば、JBIG方式やJBIG2方式等の２値画像を対象とした圧縮方式を用いてもよい。

文字画像生成処理４より出力された多値の文字色データ、下地画像生成処理部５から出力された多値の下地画像データ、変換データ生成処理部６より出力された多値の＋差分データ、−差分データは、対応したJPEG2000圧縮処理部８〜１１によってJPEG2000方式によりそれぞれ圧縮処理された後、メモリ１０６に格納される。これらのデータの圧縮処理は必須ではないが、その記憶のためのメモリ量の削減や転送速度向上等のために圧縮処理を行うのが一般に好ましい。本実施例では４つのJPEG2000圧縮処理部８〜１１を備えるが、JPEG2000圧縮処理部の数を減らし、１つのJPEG2000圧縮処理部で時分割処理により複数のデータの圧縮を行うように構成してもよい。

なお、文字画像データや変換データ（＋差分データ、−差分データ）は、その有効な領域である文字領域についてのみメモリ１０６に記憶するような構成としてもよく、それらのデータ量をさらに削減できる可能性がある。但し、そのようにした場合には、ページ内における文字領域の位置及び範囲を示す文字領域データを、構造化画像データの要素データとしてメモリ１０６に記憶させる必要がある。

また、本実施例では、多値圧縮方式としてJPEG2000を用いているが、JPEGなどの他の多値圧縮方式を利用することも可能である。ただし、下地画像データ及び変換データの圧縮にJPEG2000を用いると、JPEG2000の可逆／非可逆統一符号化、階層符号化といった特徴を利用でき、ＭＦＰの機能向上に有利である。例えば、保存した文字画像データ、下地画像データ、変換データ（符号データ）をＭＦＰに外部転送路を介して接続されたクライアント側へ転送し、クライアント側で画像を閲覧したりプリンタ等で記録する場合に、ＭＦＰ側で、クライアント側からの画質要求に応じて、転送するデータの圧縮率を容易に変更することができる。また、データを分割し、一部を送信した後にクライアント側からの要求に応じて残りのデータを追加送信するなどの処理も容易に行うことができる。

以上、スキャンデータのエンコード処理について説明した。図１１（ａ）に示すような入力画像データ中の「鮮」の文字画像に関して生成される文字画像データ、＋差分データ、−差分データの例を図１１の（ｂ），（ｃ），（ｄ）にそれぞれ示す。

図１２は差分データの説明のための模式図である。図１２において、（ａ）は入力画像データ、（ｂ）は２値の文字画像データ、（ｃ）は＋差分データ、（ｄ）は絶対値化された−差分データをそれぞれ示している。＋差分データは、主に文字の中心部の”２値化と文字色設定によってデータが低くなってしまった部分”と”２値化によって文字エッジ部が白データとなってしまった部分”に発生する。−差分データは、”文字のエッジ部で２値化によってデータが増加した部分”に発生する。図１２の（ｅ）は全てのデータを合成した状態を示しており、入力画像データが過不足なく再現されていることが分かる。

このようにスキャンデータのようなビットマップ形式の入力画像データを構造化した場合においても、入力画像データを過不足無く再現可能となる。なお、±差分データは、２値化処理の手法や閾値の決定方法によって、その出力形態が変わると考えられる。

図８において、（ａ）に示す入力画像データを処理した場合の＋差分データ、−差分データを（ｆ）、（ｇ）にそれぞれ模式的に示す。

＜差分データの変形例＞
以上の説明においては、＋差分データと−差分データをそれぞれ多値画像データとして別々に圧縮して保存した。しかし、同一画素で＋差分データと−差分データの両方が値を持つことはないので、＋差分データと−差分データを統合して１つの差分データとして扱うようにしてもよい。具体的に、例えば次の２つの方法を採り得る。

（ａ）差分の正負符号を２値のデータとして可逆圧縮し、また、＋差分データと−差分データの絶対値を１つの差分データに結合し、それを多値圧縮処理する方法である。

（ｂ）＋差分データと−差分データを正負符号付きで結合し、その差分データをシフト及び正規化して多値画像圧縮する方法である。例えば、結合後の差分データは−255〜＋255の範囲の値をとるが、この差分データに255を加算し、１ビットシフト（２で除算）した後に多値画像圧縮する。圧縮処理側で正負の値や８ｂｉｔ以上の値に対応するようにしてもよく、この場合はシフトや正規化は必要ない。

ただし、上記いずれの方法の場合も、デコーダ１１２における合成処理時に上記変換に対応する必要がある。なお、（ｂ）の方法の場合には、圧縮処理によって差分データの正負符号が反転する可能性がある。具体的には、文字の色味が補色方向へ変化することになり、これは画質劣化を招く恐れがあるため、差分データをどのように扱うかは注意が必要である。

＜プリンタ動作＞
本実施例に係るＭＦＰは、外部転送路を介して接続されたパーソナルコンピュータなどの外部機器からプリンタとして機能させることができる。これを図１３を参照し説明する。図１３において、２０１は本実施例に係るＭＦＰであり、２０３は外部転送路２０２を介してＭＦＰ２０１と接続されたパーソナルコンピュータ（ＰＣ）でありモニタ２０４を有する。外部転送路２０２は、例えばＬＡＮ（Local Area Network）の回線である。

ＭＦＰ２０１においては、ＰＣ２０３からプリント命令等のコマンド及びページ記述言語（ＰＤＬ）形式の画像データを外部インターフェース１１０を通じて受信し、それをメモリ１０６に一時的に記憶した後、エンコーダＰ１０４で、その画像データに対するエンコード処理（構造化及び圧縮符号化処理）を行う。エンコード処理された符号データを、複写動作時と同様にメモリ１０６を経由してＨＤＤ１０７に保存し、同時に、デコーダ１１２により所定の伸長及び合成処理を行い、さらにプリンタ画像処理部１１３で所定の画像処理を行ってからプリンタ部１１４へ送り、不図示の記録紙などに印字出力させる。

以上がプリンタ動作の概略である。以下、エンコーダＰ１０４などについて詳細に説明する。

＜ページ記述言語形式画像データに対するエンコード処理＞
次に、エンコーダＰ１０４の構成と、エンコーダＰ１０４におけるページ記述言語形式の画像データ(ＰＤＬデータ)に対するエンコード処理について説明する。

図１４は、本実施例に係るエンコーダＰ１０４のブロック図である。図示のように、エンコーダＰ１０４は、入力したＰＤＬデータを解釈するインタプリタ５１、その解釈結果に基づいて画像属性に応じた展開処理を行う描画処理部５２、描画処理部５２により展開された画像データ（構造化画像データの要素データ）を一時的に記憶するメモリ５３、メモリ５３上の文字画像データのMMR圧縮処理のためのMMR圧縮処理部５４、メモリ５３上の文字色データのJPEG2000圧縮処理のためのJPEG2000圧縮処理部５５、及び、メモリ５３上の下地画像データのJPEG2000圧縮処理のためのJPEG2000圧縮処理部５６から構成される。

このようなエンコーダＰ１０４の動作は次の通りである。メモリ１０６より入力されたＰＤＬデータは、インタプリタ５１で解釈され、描画処理部５２により画像属性に応じた描画処理が行われる。ここで、入力されるＰＤＬデータは、文字コード、グラフィックスを描画するための描画コード、ビットマップ形式のイメージデータの３種類が代表的なものである。

文字コードが入力された場合、描画処理部５２は指定された文字色と文字領域とから、文字領域を文字色で塗りつぶした多値の文字色データを展開し、それをメモリ５３の文字色データ記憶領域に描画するとともに、文字の形状を２値のビットマップに展開した文字画像データをメモリ５３の文字画像データ領域に描画する。グラフィックスコードが入力された場合、描画処理部５２は所定解像度でグラフィックスデータを展開し、それをメモリ５３の下地画像データ領域に上書きにて描画する。ビットマップ形式のイメージデータが入力された場合、描画処理部５２は、そのイメージデータを所定解像度に変換した後、メモリ５３の下地画像データ領域に上書き描画する。

１ページ分または所定単位分の描画が終了した時点で、文字画像データはMMR圧縮処理部５４により、文字色データはJPEG2000圧縮処理部５５により、下地画像データはJPEG2000圧縮処理部５６によりそれぞれ圧縮符号化されてメモリ１０６に記憶される。

以上のように、本実施例に係るエンコーダＰ１０４において、インタプリタ５１及び描画処理部５２は、ページ記述言語形式の画像データを、２値の文字画像データ、多値の文字色データ及び多値の下地画像データを要素データとする構造化画像データに変換する（換言すれば、そのような要素データを生成する）構造化手段を構成しており、各圧縮処理部５４〜５６は構造化画像データを要素データ別に圧縮符号化処理する圧縮符号化手段を構成している。

図１５において、（ａ）はページ記述言語形式で入力された画像データを示す。この入力画像データは、（ｂ）に示すようなフォーマットで、文字は文字コードにより、“複写機の画像”はビットマップ形式のイメージデータにより、背景はグラフィックスコードにより記述されているものとする。（ｂ）に示すヘッダーには、画像サイズや出力画像解像度、色補正パラメータ等の、画像出力に必要なパラメータが記述されている。ヘッダーに記述された情報はＣＰＵ１０５により認識され、必要なパラメータがＣＰＵ１０５よりエンコーダＰ１０４にセットされる。ヘッダーそのものはエンコーダＰ１０４には入力されない。グラフィックスコードは、描画するグラフィックスのページ内座標、形状、塗りつぶしの色や模様等のデータが所定のコマンド形式により記述されたものである。イメージデータは、ページ内座標とビットマップ形式の１画素毎の画像データが記述されたものである。文字コードは、ページ内座標、フォント名、文字のポイント数(大きさ)、文字色を記述するものである。描画処理部５２による描画はページ記述言語に記述された順番に行われ、後から描画するものは先に描画された画像に上書き処理される。

次に、図１５の例について描画処理を具体的に説明する。まず、グラフィックスコードの解釈によって、入力画像データの背景部分が描画処理部５２によりメモリ５３の下地画像データ記憶領域上に展開される。かくして、メモリ５３の下地画像データ記憶領域には図１５（ｃ）に示すような画像が記憶された状態となる。次に、入力画像データの右下の複写機画像のイメージデータが同様に下地画像データ記憶領域に描画される。かくして、下地画像データ記憶領域に図１５（ｄ）に示すような下地画像データが生成される。

ここで、下地画像データの解像度はプリンタ１１４の出力解像度に設定してもよいが、ページ記述言語形式にて入力されるイメージデータの解像度はプリンタ１１４の出力解像度よりも低い解像度である場合が一般的であるため、プリンタ１１４の出力解像度よりも低い解像度にて下地画像データを描画しても画質的には問題はないので、予め定められた解像度で描画してよい。しかし、入力されたイメージデータの解像度を極端に低下させると画質劣化が生じる。概ね３００〜１５００ｄｐｉ程度あれば、人間の目には、周波数特性的にさほど劣化を知覚できないレベルの画質とすることができる。また、入力されたイメージデータの解像度から下地画像データの解像度を決定するように構成してもよい。ただし、この例ではイメージデータは一つしかないが、複数のイメージデータがあり、それぞれが異なる解像度を有する場合には、最も高い解像度を選択するなどの工夫が必要となる。また、グラフィックスコードから生成されたグラフィックスデータも同一の解像度とする必要がある。上に述べたように下地画像データの解像度を低くすることにより、メモ量の低減やデータ転送速度の向上などの効果を得られる。

次に文字コードが入力されると、描画処理部５２は指定された文字色で文字領域を塗りつぶした多値の文字色データをメモリ５３の文字色データ記憶領域に描画するとともに、文字の形状を２値のビットマップに展開したデータをメモリ５３の文字画像データ領域に描画する。かくして、文字画像データ記憶領域及び文字色データ記憶領域はそれぞれ図１５の（ｅ）及び（ｆ）に示すような内容となる。

以上がＰＤＬデータを入力しプリント動作を行う時のエンコード処理である。複写動作時のスキャンデータ入力時と同様に、ＰＤＬデータを展開しエンコード処理（構造化・圧縮処理）を行ったデータ(以下プリンタデータ)は、ＨＤＤ１０７に保存されるとともに、デコード処理以降の処理が行われてプリンタ１１４でプリントされる。

＜デコード処理＞
次に、デコーダ１１２の構成及びデコード処理について説明する。

図１６は、本実施例に係るデコーダ１１２のブロック図である。図示のように、本実施例に係るデコーダ１１２は、MMR圧縮処理された文字画像データを伸長するMMR伸長処理部７１、JPEG2000圧縮処理された文字色データ、下地画像データ、＋差分データ、−差分データをそれぞれ伸長するJPEG2000伸長処理部７２，７３，７４，７５、２値の文字画像データ、多値の文字色データ及び下地画像データの合成処理を行う合成処理部７６、合成処理部７６から出力された多値の合成画像データと、＋差分データ及び−差分データとの合成処理を行う合成処理部７７、ＣＰＵ１０５により予め設定されたモード信号に従って＋差分データ及び−差分データと０データの選択処理を行うセレクタ７８，７９から構成される。

以下、デコーダ１１２の動作を説明する。デコード処理に先立ち、ＣＰＵ１０５はデコーダ１１２にモード信号を設定する。モード信号は、デコーダ１１２へ入力されるデータが、ビットマップ形式で入力された画像データ（スキャンデータ）の圧縮データであるか、外部からページ記述言語形式で入力された画像データ（プリンタデータ）の圧縮データであるかを識別するための信号である。

次に、入力された文字画像データをMMR伸長処理部７１により伸長処理して、２値のビットマップデータとする。これと並行して、文字色データ、下地画像データをJPEG2000伸張処理部７２，７３により伸長処理する。合成処理部７６は、２値の文字画像データがオンの画素位置では文字色データを出力し、オフの画素位置では下地画像データを出力する。したがって、下地画像データに文字色データで示される色の多値文字画像が上書きされた形の合成画像データが生成されることになる。

また、デコード処理されるデータがスキャンデータの圧縮データである場合は、上記の動作と並行して、JPEG2000圧縮処理がなされた＋差分データ及び−差分データ（以下総称して差分データ）が入力され、JPEG2000伸張処理部７４，７５により伸長処理される。伸長された差分データはセレクタ７８，７９にそれぞれ入力され、モード信号に応じて選択された差分データ又は０(ゼロ)データがセレクタ７８，７９から出力される。モード信号は、デコーダ１１２へ入力されたデータがスキャンデータの圧縮データである場合にはセレクタ７８，７９が差分データを選択するように設定され、プリンタデータの圧縮データである場合にはセレクタ７８，７９が０データを選択するように設定される。なお、プリンタデータの圧縮データを処理する場合には、差分データは存在せずデコーダ１１２に入力されない。

合成処理部７７では、合成処理部７８より入力する文字画像データと下地画像データの合成画像データ(合成データ１とする)と、セレクタ７８，７９より入力する差分データ（プリントデータの場合は０データ）から、
出力画像データ＝合成データ１＋“＋差分データ”−“−差分データ”
の演算により出力画像データを生成する。これがデコーダ１１２の出力画像データである。以上が本実施例におけるデコード処理の動作である。

以上に説明したエンコード方法及びデコード方法によれば、多値画像データ（文字色データ、下地画像データ、差分データ）の圧縮を可逆圧縮とすれば、プリンタデータの場合はもちろんスキャンデータの場合も、画像を文字画像と下地画像に分離した構造化された画像データを圧縮符号化処理した画像データに対しても、可逆の変換を行うことが可能となる。

＜画像配信処理＞
次に、図１３に示すように接続された本実施例に係るＭＦＰ２０１をサーバとして、クライアントであるＰＣ２０３へ画像を配信する処理について説明する。ＭＦＰ２０１は、ＰＣ２０３からのコマンドを受信し、ＰＣ２０３から要求された画像の圧縮データを送信する。ＰＣ２０３は、受信した圧縮データのデコード処理を行いながらモニタ２０４に表示し、あるいは図示しない記憶媒体に保存する等の処理を行う。

このような画像配信時のＭＦＰ２０１の動作を図１を参照して説明する。ＭＦＰ２０１においては、ＰＣ２０３から画像データの送信要求及び画質(又は圧縮率やファイル容量)のパラメータを外部転送路２０２を介し受信すると、ＣＰＵ１０５が必要なパラメータをセットした後、ＨＤＤ１０７より、要求された画像の圧縮データの要素データである文字画像データ、文字色データ、下地画像データ、（スキャンデータの場合は、さらに＋差分データ、−差分データ）のうち、今回の転送に必要とする要素データを読み出し、バス１１１を介してメモリ１０６へ記憶する。

メモリ１０６に記憶された要素データは、メモリ１０６からフォーマット変換処理部１０９へ転送され、ＰＣ２０３へ転送するためのフォーマットに変換される。フォーマット変換後の符号データはメモリ１０６へ一旦記憶された後、外部インターフェース１１０より外部転送路２０２を介しＰＣ２０３へ転送される。なお、ＰＣ２０３より受信した画質パラメータに基づきＣＰＵ１０５で＋差分データ、−差分データの一方又は両方を転送不要と判断した場合には、必要のない一方又は両方の差分データの転送は行われない。

図１７は、本実施例に係るフォーマット変換処理部１０９のブロック図である。図示のように、フォーマット変換処理部１０９は、ＣＰＵ１０５から指定されるパラメータに従って、JPEG2000圧縮処理された文字色データ、下地画像データ、＋差分データ、−差分データの符号の切り捨て(トランケーション)を行って圧縮率を制御するトランケーション処理部８０，８１，８２，８３、これらトランケーション処理部の出力データと、MMR圧縮処理された文字画像データ及びＣＰＵ１０５から転送されるヘッダデータを一時的に保持するとともに、それらデータの結合処理を行って画像ファイルを生成する結合処理部８４から構成される。

このフォーマット変換処理部１０９によるフォーマット変換処理に関する動作は次の通りである。処理に先立ち、ＣＰＵ１０５からヘッダデータがフォーマット変換処理部１０９へ転送され、結合処理部８４に記憶される。

次に、下地画像データがメモリ１０６から転送され、トランケーション処理部８１で下地画像データは予め定められたパラメータに従ったトランケーションにより圧縮率を変更されて結合処理部８４に記憶される。次に、文字色データがメモリ１０６から転送され、トランケーション処理部８０で文字色データは予め定められたパラメータに従ったトランケーションにより圧縮率を変更されて結合処理部８４に記憶される。次に、文字画像データがメモリ１０６から転送され結合処理部８４に記憶される。次に、＋差分データが入力され、トランケーション処理部８２でトランケーションにより圧縮率が変更されて結合処理部８４に記憶される。最後に、−差分データが入力され、トランケーション部８３でトランケーションにより圧縮率が変更されて結合処理部８４に記憶される。そして、結合処理部８４において、それら記憶したデータの結合処理が行われて所要のフォーマットの画像ファイルが生成される。

なお、プリンタデータを配信する場合には、差分データは存在しないためフォーマット変換処理部１０９には入力されず、差分データに対するトランケーション処理も行われない。スキャンデータを配信する場合であっても、画質パラメータによってはＣＰＵ１０５で＋差分データ又は−差分データ、あるいはその両方のデータが必要でないと判断され、その場合には必要のない差分データはフォーマット変換処理部１０９へ入力されず、当然その差分データに対するトランケーション処理も行われない。

次に、トランケーション処理部８０〜８３におけるトランケーションによる符号コードの圧縮率の変更について簡単に説明する。図１８は、JPEG2000の符号ストリームの構造説明図である。符号ストリームは、図中の１段目に示すように、メインヘッダの後に各タイルに対応した符号（タイル符号）を続けた構造である。個々のタイルの符号は、２段目に示すように、タイルヘッダとタイル内符号をレイヤとよばれる符号単位に区切った複数のレイヤ符号により構成されており、レイヤ符号はレイヤ０、レイヤ１・・・というように画質に対して重要度の高いレイヤのものから順番に並んでいる。個々のレイヤ符号は、３段目に示すように、レイヤ用のタイルヘッダと複数のパケットから構成されている。各パケットは、最下段に示すように、パケットヘッダと符号データから構成されている。レイヤは画質を制御する単位であるので、レイヤ単位で符号の切り捨て(トランケーション)を行うことによって容易に圧縮率を変更することができる。

図１９は、フォーマット変換処理部１０９の結合処理部８４で生成される画像ファイル、すなわちクライアント側へ転送される画像ファイルのフォーマットの説明図である。図示のように、画像ファイルは、最初にヘッダデータが格納され、それに続いて下地画像データ、文字色データ、文字画像データ、＋差分データ、−差分データが順番に格納されるフォーマットである。

なお、このフィルフォーマットは一例であり、これのみに限定されない。例えば、文字色データ、下地画像データ、＋差分データ、−差分データについてタイリングを伴ったJPEG2000圧縮を行い、同一アドレスのタイルの下地画像データ、＋差分データ及び−差分データ（いずれも符号データ）を連続して配置する構成としてもよい。なお、差分データが存在しないプリンタデータの場合や、スキャンデータの場合であっても＋差分データ又は−差分データあるいはその両方が必要のない画質パラメータのときには、必要のない差分データは画像ファイルに格納されないことは当然である。

本実施例に係るＭＦＰによるスキャンデータの画像配信においては、例えばＰＣ２０３からの要求が高圧縮率(低画質)である場合、＋差分データ及び−差分データを全く結合させない画像ファイルを転送することが可能である。この場合、配信画像の画質は、特許文献２に記載の構造化圧縮方式とほぼ同様なものとなる。

本実施例に係るＭＦＰでは、このような画像ファイルに差分データを結合することによって、文字画像の表現を２値の状態から多値の状態へと変化させ、文字画像のノッチやジャギーを抑制して滑らかなエッジを再現させることが可能である。この画質向上の効果は、結合させる差分データの圧縮率により変化する。差分データは多値圧縮処理されるので、高圧縮率時にはエッジのなまりが大きいが、圧縮率を低くしていくに従ってエッジ部が鮮鋭化され、差分データの結合による画質向上効果が高くなる。すなわち、高圧縮率で差分データを圧縮した場合には２値文字の判読性は良いが低画質の画像となり、差分データの圧縮率を下げた場合には、文字の判読性が良好でかつ高画質の画像となる。このように、画像ファイルに差分データを結合した場合、差分データの圧縮率の調整により画質プログレッシブな画像の配信が可能になる。この圧縮率の調整は実質的に無段階に行うことができる。

このような差分データの圧縮率の違いによる再現文字画像の画質の変化を図２０に示す。図２０において、（ａ）は差分データが結合されない場合の再現文字画像すなわち２値の文字画像を示し、低画質であるが文字の判読性は良好である。（ｂ）は高圧縮率の差分データが結合された場合の再現文字画像を示し、判読性は良いが画質は低い。（ｃ）は中圧縮率の差分データが結合された場合の中程度の画質の再現文字画像を示し、（ｄ）は低圧縮率の差分データが結合された場合の高画質の再現文字画像を示す。（ｅ）は原文字画像（可逆圧縮時の再現文字画像と等価）をそれぞれ示す。この例から、差分データの圧縮率を下げるに従い、再現文字画像の画質が原文字画像に近づくことが分かる。また、圧縮率にかかわらず文字判読性が良好であることも明らかである。

また、スキャンデータを文字画像と下地画像に分離する場合に、多少の誤分離は避けられないものである。例えば、図８（ａ）に示した入力画像データにおいて、図２１に円で囲んで示す部分で誤分離が生じたとする。文字部が非文字部に誤分離された部分（”写機”の部分)では文字のボケが生じたり、非文字部が文字部に誤分離された部分(複写機の絵のトレイの部分)では絵柄が劣化し違和感を生じさせてしまう。特許文献２に記載の従来方式では、圧縮率を低くすることにより画質が改善されるのは非文字部に誤分離された文字部のみであり(下地の再現性の向上によって文字画質が改善するため)、誤分離された非文字部は圧縮率を下げても画質は改善されない。

これに対し、本実施例によれば、圧縮率を下げるに従い、非文字部に誤分離された文字部のみならず、文字部に誤分離された非文字部でも、その再現画質が入力画像データの画質に近づいていく。すなわち、本実施例によれば、従来方式では低圧縮率としても避けられなかったような画質劣化を減らし、かつ、高圧縮率時での文字判読性を向上させた、圧縮率と画質のスケーラビリティを持つ画像圧縮が可能となる。したがって、クライアント側（ユーザ)の画質や圧縮率の要求に対して柔軟かつ詳細に対応可能であり、この点でユーザビリティが向上する。

なお、プリンタデータの画像配信の場合には、上に述べたような誤分離の問題は生じないことは明らかである。

以上に説明したように、本実施例によれば、ビットマップ形式の画像データと、ページ記述言語形式の画像データが、略共通したフォーマットの圧縮データとして蓄積されるため、圧縮データに対するデコード処理、フォーマット変換処理、配信処理等のための処理内容、処理系の構成並びにデータフローの共通化を図ることができ、システムの複雑化やコストアップを抑え、かつ処理の効率化を図ることができる。本実施例では、ビットマップ形式の画像データの圧縮データのみ変換データ（＋差分データ，−差分データ）を要素データとして持つため、例えば図１６に示したデコーダ１１２又は図１７に示したフォーマット変換処理部１０９の処理内容及び構成は変換データに関して相違する部分があるが、全体的な処理内容及び構成は共通したものとなる。

なお、ビットマップ形式の画像データの圧縮データから変換データを除くように構造化方法を変更するか、あるいは、ページ記述言語形式の画像データの圧縮データに変換データを含めるように構造化方法を変更するならば（後記実施例５参照）、いずれのデータ形式についてもデコーダ１１２及びフォーマット変換処理部１０９の処理内容及び構成を完全に共通にすることができ、また、圧縮データの管理の完全な一元化を達成できる。

また、いずれのデータ形式の画像データの圧縮データについても、要素データとして文字画像データを含むため、全体の圧縮率に関わらず文字の判読性を良好に維持することができる。ビットマップ形式の画像データの圧縮データについては、変換データを要素データとして含むため、図２０に関連したように圧縮率により文字画像の再現画質を高画質から低画質まで制御することができる。また、構造化画像データの圧縮を、要素データ別に適切な圧縮符号化方式及び圧縮率で行うことができる。

本実施例に係るＭＦＰは、請求項１の発明に係る画像処理装置に対応した構成であることは明らかである。

なお、本実施例（及び後記各実施例）においては、文字画像データを２値のデータとしているが、３値又は４値以上のデータとすることも可能である。この場合、エンコーダＳ１０２やデコーダ１１２などの構成を一部変更することになるが、かかる構成の変更は以上の説明（及び後記各実施例についての説明）から容易であるので、その具体例についての説明は省略する。このように文字画像データを３値又は４値以上のデータとした、本実施例（及び後記各実施例）と同様な画像処理装置も本発明に包含される。

前記実施例１は、入力画像データを、２値の文字画像データ、多値の文字色データ、多値の下地画像データという、それぞれが１ページ分のサイズを有する複数の要素データからなる構造化画像データに変換する形態であった。

本実施例は、文字領域に関する構造化の形態（文字の再現方法）が前記実施例１と相違する。本実施例においては、２値の文字画像データと、文字領域内の文字色(文字画像データがオンの画素の画素値)を表す文字色データの生成を、１ページ全体ではなく、個々の文字領域のサイズに区切って行い、これら文字画像データ及び文字色データと各文字領域の位置と範囲を示す文字領域データとによって文字画像を再現する方法をとる。また、文字色データとして色パレットが用いられる。また、文字領域データと、各文字領域に関する文字色データ及び文字画像データの組が文字コードとしてメモリ１０６に記憶される。下地画像データと差分データについては前記実施例１の場合と同様である。

本実施例に係るＭＦＰは、前記実施例１と同様な図１に示すような全体的構成であるので、その説明は割愛する。また、エンコーダＳ１０３、エンコーダＰ１０４及びデコーダ１１２の構成及び動作は前記実施例１の場合と一部相違するが、それ以外の部分の構成及び動作は前記実施例１の場合と同様である。また、本実施例に係るＭＦＰとＰＣなどの外部機器との接続形態は実施例１の場合と同様である。

図２２は、本実施例に係るエンコーダＳ１０３のブロック図である。前記実施例１に係る図２と図２２を対比すれば明らかなように、本実施例に係るエンコーダＳ１０３は、構造化に関わる部分の文字再現用データの生成に関連した構成が前記実施例１と相違するが、下地画像データ及び変換データ（＋差分データ、−差分データ）の生成に関連した構成は前記実施例１と同様である。以下、相違点を中心に説明する。

本実施例に係るエンコーダＳ１０３においては、文字領域検出処理部３より出力される文字領域データが要素データの１つとして、また、”文字コード”を構成するデータの１つとして非圧縮でメモリ１０６に記憶される。メモリ１０６に記憶された文字領域データは、文字画像データ、下地画像データ、変換データの生成時にメモリ１０６から読み出されて文字画像生成処理部４、下地画像生成処理部５及び変換データ生成処理部６にそれぞれ入力される。

文字領域データは、文字領域内がオン、文字領域外がオフの２値画像データ(ビットマップ)の形式でもよいし、各文字領域（矩形領域）の座標データに変換された形式でもよい。文字領域データをビットマップ形式とすると、その保存のためのメモリ量は大きくなるが、任意の形の文字領域に対応でき、また、文字領域データを文字画像データ、下地画像データ及び変換データの生成処理において利用しやすい利点がある。文字領域データを座標形式のデータとすると、その保存のためのメモリ量を減らすことができるが、矩形以外の文字領域に対応しにくく、斜めに配置された文字の領域では４点の座標指定が必要となるが、その際に文字領域の判別がしにくい等の弱点がある。なお、入力画像データの処理中は文字領域データをビットマップ形式で保存しておき、処理終了後に文字領域データを座標データに変換してメモリ１０６を書き換える方法をとることも可能である。文字領域データを最終的にビットマップ形式で保存する場合、文字画像データと同様に文字領域データの２値の可逆圧縮を行うことにより保存のためのメモリ量を削減するようにしてもよい。

文字コード生成処理部１２は、構造化に関わる新たな要素であり、図２３に示すように、メモリ３５、パレット生成処理部３６、セレクタ３７及びMMR圧縮処理部７からなる。この文字コード生成処理部１２には、文字画像生成処理部４から出力される２値の文字画像データ及び多値の文字色データが入力され、また、メモリ１０６より文字領域データが読み出されて入力される。

文字コード生成処理部１２において、２値の文字画像データはバッファ用のメモリ３５に一旦記憶される。メモリ３５へのデータの書き込みは、文字領域データにより示される文字領域の内部でのみ行われる。例えば、文字領域データがビットマップ形式である場合、文字領域データがオンの部分でのみメモリ３５への文字画像データの書き込みが行われる。

文字画像データのメモリ３５への書き込みと並行して、パレット生成処理部３６において文字色データに基づき色パレットが生成される。パレット生成処理部３６は、文字領域データにより示される文字領域の内部でのみ動作する。

文字色データは、図１０（ｂ）に示したようなブロック毎の文字色を示す多値データであるため、生成される色パレットは、ブロック位置と文字色の対応付けを行ったものとなる。色パレットは種々の形態をとり得るが、以下にその一例を示す。

図２４（ａ）は、図８（ａ）に示した入力画像データ中の“カラー複写機“の文字領域の画像とブロック分割の様子を表している。図１０に関連した説明の場合と同様、”カラー“の文字色は赤色、”複写機”の文字色は黒色とする。図２４（ａ）中の細線で区切った小領域がブロックであり、それに付された番号は、文字領域のスキャン順序に従って付与した便宜上のブロック番号である。

パレット生成処理部３６は、このような文字領域の文字色データをブロック単位でブロック番号順にスキャンし、現れた色順に色番号を付していく。図２４（ｂ）は、色番号とＲＧＢ値を対応付けたもので、いわゆる色パレットである。図２４（ｂ）中の色番号０は、文字画像の存在しないブロック用に便宜設定したものである。図２４（ｃ）は、ブロック番号と色番号の対応を表している。

１つの文字領域に対する色パレットの生成が終了すると、この文字領域の文字画像データがメモリ３５から読み出されてセレクタ３７へ入力される。パレット生成処理部３６は、色番号１の文字色を処理すべく、メモリ３５からの文字画像データの出力と同期して、色番号１の文字色のブロックでは文字画像データを選択させ、それ以外の文字色のブロックでは０データを選択させるための選択信号をセレクタ３７へ出力する。したがって、当該文字領域に関し、セレクタ３７より、色番号１(赤色)の文字色のブロックでは文字画像データが出力され、それ以外のブロックでは０データが出力される。この時に、パレット生成処理部３６より、色番号１のＲＧＢ値（パレット）が文字色データとして出力される。セレクタ３７の出力データはMMR圧縮処理部７にて圧縮処理され、文字画像データとして、パレット生成処理部３６から出力された文字色データ及び当該文字領域の文字領域データと対応付けられてメモリ１０６へ記憶される。

色番号１の処理が終了すると、次の色番号２について同様に処理が行われ、色番号２の文字色のブロックのみ文字画像データが、それ以外のブロックでは０データが、セレクタ３７より出力されて圧縮処理され、文字画像データとしてメモリ１０６に記憶され、また、色番号１のＲＧＢ値（パレット）がパレット生成処理部３６より出力され、これは文字色データとして文字画像データ及び文字領域データと対応付けられてメモリ１０６に記憶される。ここに示す文字領域の例では色番号２が最終の色番号であるので、１つの文字領域に対する文字コード生成処理は修了する。なお、このような文字色データは元々データ量が小さいため、非圧縮でメモリ１０６に記憶される。

以上の処理により、図２４（ａ）の文字領域に関して、図２４（ｄ）に示すような色番号１（赤色）に対応したMMR圧縮処理された文字画像データと色番号１の文字色データ（ＲＧＢ値）、図２４（ｅ）に示すような色番号２（黒色）に対応したMMR圧縮処理された文字画像データと色番号２の文字色データ、及び、対応した文字領域データからなる１つの文字コードがメモリ１０６上に生成される。

なお、以上に説明した文字コード生成処理においては、図２４の例に見られるように、２以上の文字色を含む文字領域では、文字画像データ及び文字色データの組が２以上存在し、各文字色の文字画像データにおいて当該文字色以外の文字色のブロックは０データとされている。このままでもデータ量の増加は問題となるほどではないが、さらにデータ量を削減するため、例えばセレクタ３７の後段で、各文字色の文字画像データから０データを削除する処理を行ってもよい。このような処理を行った場合の色番号１の文字画像データを図２４（ｆ）に、色番号２の文字画像データを図２４（ｇ）に模式的に示す。かかる態様も本実施例に包含される。

また、ページ内で同一文字色と認識された複数の文字領域を結合して比較的大きなサイズの文字領域を構築し、その文字領域に対し１つの文字コードを生成するようにしてもよい。例えば、図８(ａ)の入力画像データにおいて、“カラー”以外の文字が全て黒色である場合に、複数の黒色文字領域を囲む矩形領域を１つの文字領域とし、文字画像データ及び文字色データの生成を行うことができる。かかる態様も本実施例に包含される。

次に、本実施例に係るエンコーダＰ１０４の構成及びそのエンコード処理について説明する。図２５は、本実施例に係るエンコーダＰ１０４のブロック図である。前記実施例に係る図１４と対比すれば明らかなように、本実施例の場合は文字色データのためのJPEG2000圧縮処理部は省かれている。これは、文字色データのデータ量が元々極めて小さく圧縮の必要性が乏しいためである。

本実施例に係るエンコーダＰ１０４の基本的な動作は前記実施例１の場合と同様であり、文字画像データと文字色データに関する処理のみ異なる。すなわち、一般的なＰＤＬデータによる文字画像データは、少なくとも文字の座標、キャラクタコード、文字色の情報を持っており、行等のある程度の単位でコード化されている。描画処理部５２は、それらの情報を解釈して、メモリ５３に”行などの特定の文字領域”における、同一文字色の文字画像データとその文字色データ及び文字領域データをメモリ５３上に展開する。したがって、エンコーダＳ１０３における場合と同様、文字画像データは”文字領域”対応に生成され、また、文字画像データに対し１つのＲＧＢ値を示す文字色データが生成される。そして、MMR圧縮処理部５４によりMMR圧縮処理された文字画像データ、非圧縮の文字色データ及び文字領域データは対応つけられ文字コードとしてメモリ１０６に記憶される。

なお、ＰＤＬデータの文字画像データは、それが色毎に分かれていなければ図２４の（ｄ），（ｅ）のようなデータになり、色毎に分かれているならば図２４の（ｆ），（ｇ）のようなデータになる。

このように、本実施例においては、エンコーダＰ１０４においても、エンコーダＳ１０３の場合と同様に、文字領域毎に、文字画像再現のための文字画像データ、文字色データ及び文字領域データからなる文字コードが生成される。

以上のように、本実施例においては、要素データとして文字領域データを含めるため、１ページを文字領域毎に区切って文字画像データ及び文字色データを生成することができるため、それらのデータをページ単位で生成する場合にくらべ、それらのデータ量を削減可能である。

次に、本実施例におけるデコーダ１１２の構成及びそのデコード処理について説明する。図２６は、本実施例に係るデコーダ１１２のブロック図である。前記実施例１に係る図１６と比較すると明らかなように、文字コードのデコード処理に関わる構成が異なる。すなわち、MMR伸長処理７１により伸長処理された文字画像データ、非圧縮の文字色データ及び文字領域データから、多値の文字画像をメモリ９２上に展開する描画処理部９１を備える。メモリ９２は、多値の文字画像の所定ライン数(以下バンド)の倍のメモリ容量を持っている。なお、このように１ページ分のメモリを持つ代わりにバンドの倍の容量のメモリを使用して処理を行う手法は、プリンタ等で一般的に使用される手法であり、メモリ容量の削減、印字開始までの時間の短縮などの効果がある。下地画像データ及び差分データに関する構成は前記実施例１の場合と同様である。

以下、本実施例に係るデコーダ１１２の動作を、前記実施例１と異なる部分を中心に説明する。文字コード中の２値の文字画像データは、MMR伸長処理部７１にて伸長処理されてから描画処理部９１に入力される。文字コード中の文字色データと、文字領域の座標を表す文字領域データはそのまま描画処理部９１に入力する。描画処理部９１は、メモリ９２上に、文字画像データがオンの画素は文字色データを用い、オフの画素はダミーデータを用いて多値の文字画像データを展開する。この展開処理は、”現在処理されているバンドに(一部でも)含まれる文字領域”を有する文字コードの全ての処理が終了するまで繰り返される。なお、文字コードが処理中のバンドに含まれるか否かの判断は、ＣＰＵ１０６によってなされる。

１つのバンド分の描画が終了すると、描画処理部９１は次のバンドの処理を開始する。これと並行して、下地画像データがデコーダ１１２に入力される。この下地画像データはJPEG2000伸長処理部７３で伸長処理されて合成処理部７６へ入力され、これと同期してメモリ９２より直前に処理されたバンドの文字画像データが読み出されて合成処理部７６へ入力され、合成処理が行われる。この合成処理は、下地画像データに文字画像データを上書き処理することによって行われる。なお、文字画像データ中のダミーデータの画素は透過して下地画像データが再現される。この合成処理データと差分データとの合成処理は実施例１の場合と同様である。

文字画像データ中のダミーデータは、合成処理部７６において合成データとして文字画像データと下地画像データのどちらを出力すべきかの判定に用いられる。ダミーデータの値は特に規定しないが、一般的に使用頻度が極めて低い値、例えば、R:G:B=255：254：255(RGBをそれぞれ８ｂｉｔとする)又はR:G:B=0：0：1などの値とすることができる。

なお、R:G:B=255：255：255の白データは、白抜き文字によって使用される頻度が高いのでダミーデータとして使用することは避けた方がよい。仮に、文字色データがダミーデータと同一の値をとる場合には、描画処理部９１において多値の文字画像データ値を問題の生じないような値に変更すればよい。例えば、ダミーデータと文字色データが0：0：1で同一であった場合に、文字画像データ値を0：0：0などに変更するわけである。デコーダ１１２の出力データは最終的にプリンタ１１４により記録紙上に印刷されるため、この程度のデータ値の変更は格別問題とならない。もし、デコード処理の後の処理で文字画像データに対して可逆性(データの完全な再現)を要する場合には、２値の文字画像データもメモリ９２上に展開し、この２値の文字画像データを合成処理部７６で上記判定のための信号として使用する構成にすればよく、かかる態様も本実施例に含まれる。

以上に説明したように、本実施例においても、ビットマップ形式の画像データとページ記述言語形式の画像データの圧縮データのフォーマットは変換データを除いて共通になるため、圧縮データのデコード処理などの内容や処理系の共通化を図ることができる。また、圧縮率にかかわらず文字の判読性の良好な画像圧縮が可能であり、低圧縮率とすることにより高画質の画像再現が可能である。

なお、本実施例に係るＭＦＰは請求項２の発明に係る画像処理装置に対応した構成であることは明らかである。なお、上で言及したように変換データを省くことも可能であり、かかる態様も本発明に包含される。なお、文字画像データを３値又は４値以上のデータとする態様も本発明に包含されることは前記実施例１に関連して述べた通りである。

イメージやグラフィックス等の下地と文字が重なる場合において、図２７（ａ）に示すように文字が上になるときには前記実施例１，２の構成で格別の問題は生じない。しかし、ページ記述言語形式の画像データの場合、図２７（ａ）に示すような文字画像データが図２７（ｂ）に示すように下地の背面に隠れた画像として再現することがある。このような場合、前記実施例１，２に係るエンコーダＰ１０４において、描画処理部５２でメモリ５３上に画像を展開する際に、下地に隠れる部分(図２７（ｃ）の黒く塗りつぶした部分)の文字画像データを削除することにより、プリンタ動作は問題なく行うことができる。しかし、下地に隠れた文字画像の情報が失われてしまうため、その後のデータの再利用に制約が生じる。例えば、ＨＤＤに蓄積された圧縮データを編集して、文字の位置や下地との上下関係等を変更し、隠れた文字を表示させるようなことは不可能である。

本実施例においては、ページ記述言語形式の画像データについて、圧縮データの再利用性を考慮した構造化を行う。本実施例に係るＭＦＰは、エンコーダＰ１０４及びデコーダ１１２の構成及び動作が前記実施例２と一部異なるが、その他の部分及び装置全体の構成及び動作は前記実施例２と同様である。よって、ここでは本実施例に係るエンコーダＰ１０４及びデコーダ１１２に限って説明する。

図２８は、本実施例に係るエンコーダＰ１０４のブロック図である。このエンコーダＰ１０４においては、描画処理部５２による描画処理（構造化処理）の際に、新しい要素データとして、下地によって隠される文字をマスクするための文字マスクデータを作成する点が前記実施例２と異なる。すなわち、描画処理部５２は、文字領域上に下地データが上書きされるか否かを判断して文字マスクデータをメモリ５３上に描画処理する。例えば、図２７（ｂ）に示す画像データが入力された場合に作成される文字マスクデータは、図２７（ｃ）に示すような形状で、黒で塗りつぶした部分がオン(１)の値の画像データとなる。また、描画処理部５２は、下地に隠れる文字画像、文字画像に隠れる下地画像も含めた文字画像データ及び下地画像データを描画する。このような文字画像データ及び下地画像データを描画できるのは、要素データとして文字マスクデータを追加したためである。

メモリ５３に記憶された文字マスクデータは、文字領域毎にMMR圧縮処理部５７でMMR圧縮処理された後、文字コードの一部としてメモリ１０６に記憶される。すなわち、本実施例における文字コードは、文字画像データ、文字色データ、文字領域データ及び文字マスクデータから構成される。なお、MMR圧縮処理部５４，５７を別々に設けているが、その一方を省略し、１つのMMR圧縮処理部を文字画像データと文字マスクデータのMMR圧縮処理に用いてもよい。

図２９は、本実施例に係るデコーダ１１２のブロック図である。このデコーダ１１２は、文字コード中の文字マスクデータのMMR伸長処理部９３とセレクタ９４が描画処理部９１の前段に追加された点が前記実施例２との構成上の違いである。

セレクタ９４は、モード信号に従って、”PDLデータから構造化圧縮符号化された”画像データが入力された場合にはMMR伸長処理部９３により伸長された文字マスクデータを選択して描画処理部９１に入力し、スキャン画像データが入力された場合には常に０データを選択して描画処理部９１に入力する。

描画処理部９１では、文字マスクデータが入力された場合には、文字マスクデータがオン（１）の画素に対応する文字画像データの画素値をダミーデータに変更する処理を行う。よって、描画処理部９１での特定の文字領域内の処理においては、文字画像データの描画終了後に文字マスクデータの処理が行われることになる。これ以降の処理は前記実施例２の場合と同様であり、合成処理部７６で下地画像データに文字画像データが上書きによって合成されることにより、図２７（ｂ）に示すような出力画像を得ることできる。このように、文字マスクデータは、下地画像データと文字画像データの合成時の上下関係を指定するデータであり、より広義には、下地画像データと文字画像データの合成を制御するデータである（この合成を制御するデータの別の例が、後記実施例４における不透明度もしくは透明度を指定するαデータである）。

以上説明したように、本実施例によれば、エンコーダＰ１０４によりエンコード処理の際に、入力されたＰＤＬデータにおいて文字画像が下地に隠れるような場合であっても、下地に隠れる文字画像の情報も文字に隠れる下地画像の情報も圧縮データに保存されているため、その後に蓄積データに対し、下地に隠れた文字を上に表示させ、あるいは、文字に隠れた下地を表示させるような編集、再利用を支障無く行うことが可能となり、蓄積データの編集性、再利用性が向上する。

なお、前記実施例１におけるようなページ単位で文字画像を再現する構造化手法においても同様の文字のマスク処理が可能である。この場合、描画処理部９１でマスク処理を行う代わりに、合成処理部７６で文字マスクデータがオンの画素位置で下地画像データを出力するように構成すればよく、かかる態様も本発明に包含される。付言すれば、スキャン画像については、その入力時に文字と写真等のイメージがビットマップとなっているため、上記のような考慮は必要ない。

本実施例においては、ビットマップ形式とページ記述言語形式とで、変換データ及び文字マスクデータに関し圧縮データのフォーマットの違いがあるが、基本的なフォーマットは共通しているため、デコード処理などの処理内容と処理系の構成をほぼ共通化することができる。

本実施例に係るＭＦＰは請求項３の発明に係る画像処理装置に対応した構成であることは明らかである。なお、上で言及したように変換データを省くことも可能であり、かかる態様も本発明に包含される。また、文字画像データ３値又は４値以上のデータとする態様も本発明に包含されることは、前記実施例１に関連して述べた通りである。

ページ記述言語形式の画像データにおける文字やイメージ等のオブジェクトの重ね合わせには、”透明化処理”と言われる特殊な処理が存在する。透明化処理とは、２つ以上のオブジェクトの重ね合わせ時に、前面のオブジェクト画像から背面のオブジェクト画像が透けて見えるように合成処理を行う手法である。一般的に、不透明度(または透明度)は、下地の画像との混合比率で表される。例えば、背面になっている画像の画素値をＡ、前面になっている画像の画素値をＢ、０〜１の値をとり得る不透明度をαとすると、透明化処理されて合成された画素値Ｃは、
Ｃ＝Ａ×(１−α)＋Ｂ×α
となる。

透明化されるのは前面にくるオブジェクトであるから、具体的には、文字画像が透明化される場合と下地画像が透明化される場合とがある。例えば、図２７（ａ）の画像が入力され、その文字画像が透明化されたときには図２７（ｄ）に示すような画像になり、白地と重なった部分の文字色(画素値)とグラフィックスデータと重なった部分の文字色とは異なった色になる。また、図２７図（ｂ）の画像が入力され、グラフィックスの画像が透明化されたときには図２７図（ｅ）に示すような画像になり、グラフィックスと重なった文字のみ文字色が変化し、また、グラフィック全体の色も変化する。

なお、不透明度100%では背面の画像に上側の画像を上書きすることになり、不透明度0%では重なった部分の上側の画像を消去することになる。また、透明化処理では、オブジェクト単位で不透明度が設定されるのが一般的であるので、以下に説明する本実施例においてもそのように扱うが、画素単位で不透明度が設定されてもよい。

さて、前記実施例２においても、透明化処理後の文字色を文字色データとして扱うことによってＰＤＬ画像に対する透明化処理にある程度は対応可能である。しかし、自然画のようなイメージデータとの透明化処理を行った場合などは、文字色が複雑に変化することになるため、”文字コードに対する圧縮率の低下”という問題が生じる。また、透明化処理された文字画像データは、画像の性質上、さほどの鮮鋭性を必要としないため、下地画像データとして処理してしまう方法もあるが、前記実施例で述べたような蓄積データの編集性、再利用性の問題があり、また、下地画像の圧縮率を高くしたときに文字判読性が低下するなどの問題も生じる。

本実施例においては、そのような透明化処理に関わる問題点、特に蓄積データの編集性、再利用性を考慮してページ記述言語形式の画像データの構造化を行う。本実施例に係るＭＦＰは、エンコーダＰ１０４及びデコーダ１１２の構造及び動作が前記実施例２と異なるが、それ以外の部分及び装置全体の構成及び動作は前記実施例２と同様である。よって、エンコーダＰ１０４及びデコーダ１１２に限って説明する。

図３０は、本実施例に係るエンコーダＰ１０４のブロック図である。本実施例に係るエンコーダＰ１０４と前記実施例２のものとの相違点は、透明化処理対象のデータが入力された場合に、インタプリタ５１によるＰＤＬデータの解釈結果に応じて、描画処理部５２で文字画像に対する不透明度である”αデータ”をメモリ５３上に描画処理することと、αデータのためのJEG2000圧縮処理部５８を有し、メモリ５３に記憶されたαデータは１ページ分がJPEG2000圧縮処理部５８でJPEG2000圧縮処理されてからメモリ１０６に記憶されることである。文字画像データ及び下地画像データは、それらの重なる部分の情報も含めるように描画される。このような描画が可能となるのは、αデータを要素データに加えたためである。

前記実施例３のように文字マスク情報等のオブジェクトの前後情報を保存し、前面にくるオブジェクトに対する不透明度をαデータとすることも可能であるが、本実施例においては、αデータに文字マスクの機能を重複して持たせるため、αデータは文字画像データに対する不透明度とする。具体的には、文字画像データに対して透明化処理を行う場合（例えば図２７（ｄ）の画像が入力された場合）にはαデータはＰＤＬデータにて指定される不透明度となる。下地画像データに対して透明化処理を行う場合（例えば図２７（ｅ）の画像が入力された場合）にはαデータは”１−PDLデータにて指定された不透明度”となる。

αデータの形状であるが、図２７（ｄ）に示す画像データが入力された場合はαデータは文字画像データと同一形状となり、その全ての画素位置で同一のデータ値をとる。図２７（ｅ）に示す画像データが入力された場合は、αデータは四角で示されるグラフィックスデータと同一形状となり、その全ての画素位置で同一のデータ値をとる。また、透明化処理が行われない部分のαデータ値は、文字画像データがオンの画素に対しては文字画像の不透明度100%に対応した１となり、それ以外の画素に対しては不当明度0%に対応した０となる。

なお、イメージデータの上に、ある不透明度を有するグラフィックスデータを描画する場合のように、下地画像データに含まれるオブジェクト同士での透明化処理を描画処理部５２にて行うこともできる。

図３１は、本実施例に係るデコーダ１１２のブロック図である。本実施例に係るデコーダ１１２と前記実施例２のものとの相違は、αデータのためのJEG2000伸長処理部９５が追加され、入力されたαデータはJPEG2000伸長処理部９５にて伸長処理された後、多値の文字画像データ及び下地画像データと同期して合成処理部７６に入力されること、モード信号も合成処理部７６へ入力されること、合成処理部７６が図３２に示す構成とされることである。

図３２に示すように、本実施例に係る合成処理部７６は、モード信号及びメモリ９２からの文字画像データを入力としてセレクタ１２６への選択信号を生成する選択信号生成処理部１２１、JPEG2000伸長処理部９５により伸長されたαデータから下地画像データの不透明度（１−α）を計算する演算処理部１２２、メモリ９２から入力する文字画像データと不透明度αの乗算を行う乗算処理部１２３、JPEG2000伸長処理部７３により伸長された下地画像データとその不透明度（１−α）の乗算を行う乗算処理部１２４、乗算処理部１２３，２４の出力データの加算処理を行う加算処理部１２５、選択信号生成処理部１２１から出力される選択信号に従って文字画像データ、加算処理部１２５の出力データ及び下地画像データのいずれかを選択して出力するセレクタ１２６からなり、その動作は以下の通りである。

入力された文字画像データとαデータの乗算処理が乗算処理部１２３で行われる。この乗算処理においては、文字画像データのRGB各値がαデータと乗算され、したがって乗算処理部１２３の出力データはRGBデータである。下地画像データについても、その不透明度（１−α）との同様の乗算処理が乗算処理部１２４で行われ、その結果はRGBデータである。

乗算処理部１２３，１２４の出力データが加算処理部１２５によって加算処理される。この加算処理もRGB各値について行われる。この加算処理部１２５の出力データが透明化処理データであり、
透明化処理データ＝下地画像データ×(１−α)＋文字画像データ×α
で表される。

なお、文字画像データの存在しない部分では、α＝0としているので、加算処理部１２５から下地画像データそのものが出力される。透明化処理が行われない文字画像データの部分では、α＝１としているので、加算処理部１２５から文字画像データそのものが出力されることになる。

加算処理部１２５の出力データ（透明化処理データ）と、透明化処理が行われない文字画像データ及び下地画像データがセレクタ１２６に入力され、選択信号生成処理部１２１からの選択信号に従って、いずれかのデータが選択されて合成データとしてセレクタ１２６より出力される。

選択信号生成処理部１２１では、モード信号が、ＰＤＬデータから構造化圧縮符号化された画像データ(以下プリンタデータ)が入力されたことを示す場合には、加算処理部１２５の出力データをセレクタ１２６に選択させる選択信号を出力する。モード信号が、スキャンデータが入力されたことを示す場合には、選択信号生成処理部１２１は、文字画像データの値を判定し、ダミーデータの画素では下地画像データをセレクタ１２６に選択させる選択信号を、ダミーデータでない画素では文字画像データをセレクタ１２６に選択させる選択信号を出力する。つまり、プリンタデータが入力された場合は、透明化処理データを出力させ、スキャンデータが入力された場合は透明化処理をしない前記実施例２と同様の合成データを出力させる。

以上の説明から明らかなように、本実施例によれば、エンコード処理の際に、入力されたＰＤＬデータにおいて透明化処理を行うデータであっても文字画像及び下地画像の情報が圧縮データに保存されるため、その後の編集性、再利用性が良い。また、αデータ及び変換データに関してデータ形式により圧縮データのフォーマットに違いがあるが、その基本的なフォーマットは共通であるため、圧縮データのデコード処理などの内容及び処理系の構成をほとんど共通化することができる。

本実施例に係るＭＦＰは請求項４の発明に係る画像処理装置に対応した構成であることは明らかである。なお、上で言及したように変換データを省くことも可能であり、かかる態様も本発明に包含される。また、構造化の要素データとして、不透明度に代えて透明度を指定するデータを生成することも可能であることは明らかであり、かかる態様も本発明に包含される。なお、文字画像データを３値又は４値以上のデータとすることも可能であることは、前記実施例１に関連して述べた通りである。

本実施例においては、ＰＤＬデータについても、スキャンデータと同様に、構造化の際に要素データとして差分データ（変換データ）を生成する。本実施例に係るＭＦＰは、エンコーダＰ１０４及びデコーダ１１２以外の部分の構成及び装置全体の構成は前記実施例２の場合と同様であるので、エンコーダＰ１０４及びデコーダ１１２の構成及び動作のみ以下に説明する。

図３３は、本実施例に係るエンコーダＰ１０４のブロック図である。同図中、５９はエンコーダＳ１０３内の変換データ生成処理部６（図２２）と同様の機能を有する変換データ生成処理部である。１５１及び１５２はそれぞれ変換データとしての＋差分データ及び−差分データをJPEG2000圧縮処理するJPEG2000圧縮処理部である。

本実施例に係るエンコーダＰ１０４において、描画処理部５２は、前記実施例２の場合と同様に、文字データ、文字色データ、文字領域データ、下地画像データをメモリ５３上に描画すると同時に、入力されたＰＤＬデータ全てのコードにより再現されるビットマップ形式の画像データである“全画像再現データ”を描画する。この全画像再現データは、透過処理等も含んだ形となり、デコーダ１１２の出力画像と同じものとなる。また、描画処理部５２は、透明化処理等を含まない、文字コードのみから再現されるビットマップ形式の画像データである“文字画像再現データ”を描画する。この文字画像再現データは、前記実施例２のデコーダ１１２（図２６）においてメモリ９２から出力される文字画像データと同じものとなる。つまり、文字コードのみによって再現される多値の文字画像データと等価である。なお、全画像再現データ及び文字画像再現データは構造化のために一時的に生成されるものであって、構造化画像データの要素データではない。

バンド等の所定範囲の全画像再現データ、文字画像再現データ、下地画像データの描画が完了すると、これらのデータは同期して変換データ生成処理部５９へ入力され、スキャンデータの場合と同様に、＋差分データと−差分データが算出される。差分データの算出は、スキャンデータの入力画像データの変わりに全画像再現データを使用し、文字画像再現データと下地画像データの合成データの差分を演算することによって行われ、次式
差分データ＝
全画像再現データ−(文字画像再現データと下地画像データの合成データ)
で表される。このような変換データ生成処理部５９の内部構成は、図７と大きな差がないため図示しない。

変換データ生成処理部５９より出力される＋差分データ及び−差分データはJPEG2000圧縮処理部１５１，１５２により圧縮処理されてメモリ１０６に記憶される。

このような構成によって、例えば、透明化処理によって画像が変化する場合や、文字がグラフィックスの後ろに隠れるような特殊な場合でも、下地画像の前に文字画像が存在する通常の合成処理の状態からの変化分を差分データに保持させることが可能となるので、ＰＤＬデータの機能を損なうことなく構造化が可能である。

図３４は、本実施例に係るデコーダ１１２のブロック図である。本実施例においては、圧縮データのフォーマットはスキャンデータとプリンタデータとで全く違いがない。したがって、本実施例に係るデコーダ１１２においては、モード信号は存在せず、図２６中のセレクタ７８，７９に相当するものは省かれ、JPEG2000伸長処理部７３，７４により伸長された差分データはそのまま合成処理部７７に入力される。すなわち、プリンタデータもスキャンデータと同様の処理が行われ、その処理系の構成も完全に共通化される。

以上説明したように、本実施例によれば、ビットマップ形式で入力されるスキャンデータとＰＤＬデータの形式で入力されるプリンタデータの両方について、画質やＰＤＬデータにおける透明化処理等の付加的な機能を落とすことなく、圧縮データのフォーマットを完全に共通化することができる。また、文字画像や下地画像の情報は消去することなく保存できるので、圧縮データの再利用性も確保できる。なお、圧縮データの編集等で画像を透明化処理する場合には、差分データを変化させればよい。

本実施例に係るＭＦＰは請求項５の発明に係る画像処理装置に対応した構成であることは明らかである。なお、文字画像データを３値又は４値以上のデータとすることも可能であることは、前記実施例１に関連して述べた通りである。

以上説明した本発明に係る画像処理装置の各手段としてコンピュータを機能させるプログラムを用いることにより、本発明に係る画像処理装置をコンピュータ上で実現することも可能であることは明らかである。また、そのようなプログラム、及び、同プログラムが記録された磁気ディスク、光ディスク、光磁気ディスク、半導体記憶素子などのコンピュータが読み取り可能な各種情報記録（記憶）媒体も本発明に含まれる。

また、前記各実施例に係るＭＦＰにおける画像入力、入力画像データに対する構造化と圧縮符号化（エンコード処理）の手順は、本発明に係る画像処理方法の手順でもあることは明らかであるので、画像処理方法についての説明は繰り返さない。このような画像処理方法の各工程をコンピュータを利用して実行することも当然に可能である。そのためのプログラム、及び、同プログラムが記録された各種情報記録（記憶）媒体も本発明に含まれる。

各実施例に係るＭＦＰの全体構成を示すブロック図である。実施例１に係るエンコーダＳ１０２のブロック図である。実施例１に係るエンコーダＳ１０２のフローチャートである。実施例１に係るエンコーダＳ１０２内の２値画像生成処理部１のブロック図である。実施例１に係るエンコーダＳ１０２内の文字画像生成処理部４のブロック図である。実施例１に係るエンコーダＳ１０２内の下地画像生成処理部５のブロック図である。実施例１に係るエンコーダＳ１０２内の変換データ生成処理部６のブロック図である。実施例１に係るエンコーダＳ１０２におけるデコード処理を説明するための模式図である。文字の芯部の説明図である。文字領域における文字色算出処理の説明のための模式図である。１値の文字画像データと差分データを説明するための模式図である。差分データの説明図である。ＭＦＰをプリンタとして使用する場合のＭＦＰと外部装置との接続環境の説明図である。実施例１に係るエンコーダＰ１０４のブロック図である。実施例１に係るエンコーダＰ１０４におけるエンコード処理を説明するための模式図である。実施例１に係るデコーダ１１２のブロック図である。実施例１に係るフォーマット変換処理部１０９のブロック図である。 JPEG2000の符号ストリームの説明図である。実施例１に係るフォーマット変換処理部１０９により生成される画像ファイルのフォーマットの説明図である。差分データの圧縮率の違いと再現文字画像の画質の関係を説明するための模式図である。文字画像と下地画像の誤分離とその影響を説明するための模式図である。実施例２に係るエンコーダＳ１０３のブロック図である。実施例２に係るエンコーダＳ１０３内の文字コード生成処理部１２のブロック図である。実施例２に係るエンコーダＳ１０３内の文字コード生成処理部１２による文字画像データ及び文字色データの生成を説明するための模式図である。実施例２に係るエンコーダＰ１０４のブロック図である。実施例２に係るデコーダ１１２のブロック図である。下地画像と重なる文字画像のマスク処理及び透明化処理を説明するための模式図である。実施例３に係るエンコーダＰ１０４のブロック図である。実施例３に係るデコーダ１１２のブロック図である。実施例４に係るエンコーダＰ１０４のブロック図である。実施例４に係るデコーダ１１２のブロック図である。実施例４に係るデコーダ１１２内の合成処理部７６のブロック図である。実施例５に係るエンコーダＰ１０４のブロック図である。実施例５に係るデコーダ１１２のブロック図である。 JPEG2000の圧縮符号化処理を説明するためのブロック図である。２次元離散ウェーブレット変換によるサブバンド分割例を示す図である。 JPEG2000のビットプレーン分解及びサブビットプレーン分解の説明図である。

符号の説明

１０１スキャナ部
１０３エンコーダＳ
１０４エンコーダＰ
１０５ＣＰＵ
１０６メモリ
１０７ハードディスク装置（ＨＤＤ）

１０９フォーマット変換処理部
１１０外部インターフェース
１１２デコーダ
１１４プリンタ
１２値画像生成処理部
３文字領域検出処理部
４文字画像生成処理部
５下地画像生成処理部
６変換データ生成処理部
１２文字コード生成処理部
５１インタプリタ
５２描画処理部
５９変換データ生成処理部

Claims

ビットマップ形式の画像データを入力する第１の画像入力手段と、
前記第１の画像入力手段による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第１のエンコード処理手段と、
ページ記述言語形式の画像データを入力する第２の画像入力手段と、
前記第２の画像入力手段による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第２のエンコード処理手段と、
前記第１のエンコード処理手段及び前記第２のエンコード処理手段より出力された構造化画像データを記憶する記憶手段とを有し、
前記第１のエンコード処理手段は、
構造化画像データの要素データとして、
入力画像データの文字画像を再現するための２値の文字画像データを生成する手段と、
該入力画像データの文字画像の色を再現するための多値の文字色データを生成する手段と、
該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データを生成する手段と、
該文字画像データ、該文字色データ及び該下地画像データから多値の再現画像データを合成し、該再現画像データと該入力画像データとの差分成分を表す変換データを生成する手段と、
を含む第１の構造化手段と、
該第１の構造化手段により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第１の圧縮符号化処理手段と、
からなり、
前記第２のエンコード処理手段は、
構造化画像データの要素データとして、入力画像データの文字画像を再現するための２値の文字画像データと、該入力画像データの文字画像の色を再現するための多値の文字色データと、該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データとを生成する第２の構造化手段と、
該第２の構造化手段により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第２の圧縮符号化処理手段とからなる、
ことを特徴とする画像処理装置。
ビットマップ形式の画像データを入力する第１の画像入力手段と、
前記第１の画像入力手段による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第１のエンコード処理手段と、
ページ記述言語形式の画像データを入力する第２の画像入力手段と、
前記第２の画像入力手段による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第２のエンコード処理手段と、
前記第１のエンコード処理手段及び前記第２のエンコード処理手段より出力された構造化画像データを記憶する記憶手段とを有し、
前記第１のエンコード処理手段は、
構造化画像データの要素データとして、
入力画像データの文字領域の位置及び範囲を示す文字領域データを生成する手段と、
該文字領域データにより示される文字領域の文字画像を再現するための２値の文字画像データを生成する手段と、
該文字領域データにより示される文字領域の文字画像の色を再現するための多値の文字色データを生成する手段と、
該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データを生成する手段と、
該文字領域データ、該文字画像データ、該文字色データ及び該下地画像データから多値の再現画像データを生成し、該再現画像データと該入力画像データとの差分成分を表す変換データを生成する手段と、
を含む第１の構造化手段と、
該第１の構造化手段により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第２の圧縮符号化処理手段と、
からなり、
前記第２のエンコード処理手段は、
構造化画像データの要素データとして、入力画像データの文字領域の位置及び範囲を示す文字領域データと、該文字領域データにより示される文字領域の文字画像を再現するための２値の文字画像データと、該文字領域データにより示される文字領域の文字画像の色を再現するための多値の文字色データと、該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データとを生成する第２の構造化手段と、
該第２の構造化手段により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第２の圧縮符号化処理手段とからなる、
ことを特徴とする画像処理装置。
前記第２のエンコード処理手段の第２の構造化手段は、構造化画像データの要素データとして生成した文字画像データと下地画像データの合成時の上下関係を示すデータを該構造化画像データの要素データとしてさらに生成することを特徴とする請求項２に記載の画像処理装置。
前記第２のエンコード処理手段の第２の構造化手段は、構造化画像データの要素データとして生成した文字画像データと下地画像データの合成時の透明化処理のための不透明度又は透明度を指定するデータを該構造化画像データの要素データとしてさらに生成することを特徴とする請求項２に記載の画像処理装置。
前記第２のエンコード処理手段の第２の構造化手段は、構造化画像データの要素データとして生成した文字領域データ、文字画像データ、文字色データ及び下地画像データから合成される多値の再現画像データと入力画像データとの差分成分を表す変換データを該構造化画像データの要素データとしてさらに生成することを特徴とする請求項２に記載の画像処理装置。
ビットマップ形式の画像データを入力する第１の画像入力工程と、
前記第１の画像入力工程による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第１のエンコード処理工程と、
ページ記述言語形式の画像データを入力する第２の画像入力工程と、
前記第２の画像入力工程による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第２のエンコード処理工程と、
前記第１のエンコード処理工程及び前記第２のエンコード処理工程より出力された構造化画像データを記憶手段に記憶する工程とを有し、
前記第１のエンコード処理工程は、
構造化画像データの要素データとして、
入力画像データの文字画像を再現するための２値の文字画像データを生成する工程と、
該入力画像データの文字画像の色を再現するための多値の文字色データを生成する工程と、
該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データを生成する工程と、
該文字画像データ、該文字色データ及び該下地画像データから多値の再現画像データを合成し、該再現画像データと該入力画像データとの差分成分を表す変換データを生成する工程と、
を含む第１の構造化工程と、
該第１の構造化工程により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第１の圧縮符号化処理工程と、
からなり、
前記第２のエンコード処理工程は、
構造化画像データの要素データとして、入力画像データの文字画像を再現するための２値の文字画像データと、該入力画像データの文字画像の色を再現するための多値の文字色データと、該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データとを生成する第２の構造化工程と、
該第２の構造化工程により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第２の圧縮符号化処理工程とからなる、
ことを特徴とする画像処理方法。
ビットマップ形式の画像データを入力する第１の画像入力工程と、
前記第１の画像入力工程による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第１のエンコード処理工程と、
ページ記述言語形式の画像データを入力する第２の画像入力工程と、
前記第２の画像入力工程による入力画像データを複数の要素データからなる構造化画像データに変換し、変換した構造化画像データを、少なくともその一部の要素データに関し要素データ別に圧縮符号化してから出力する第２のエンコード処理工程と、
前記第１のエンコード処理工程及び前記第２のエンコード処理工程より出力された構造化画像データを記憶手段に記憶する工程とを有し、
前記第１のエンコード処理工程は、
構造化画像データの要素データとして、
入力画像データの文字領域の位置及び範囲を示す文字領域データを生成する工程と、
該文字領域データにより示される文字領域の文字画像を再現するための２値の文字画像データを生成する工程と、
該文字領域データにより示される文字領域の文字画像の色を再現するための多値の文字色データを生成する工程と、
該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データを生成する工程と、
該文字領域データ、該文字画像データ、該文字色データ及び該下地画像データから多値の再現画像データを生成し、該再現画像データと該入力画像データとの差分成分を表す変換データを生成する工程と、
を含む第１の構造化工程と、
該第１の構造化工程により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第２の圧縮符号化処理工程と、
からなり、
前記第２のエンコード処理工程は、
構造化画像データの要素データとして、入力画像データの文字領域の位置及び範囲を示す文字領域データと、該文字領域データにより示される文字領域の文字画像を再現するための２値の文字画像データと、該文字領域データにより示される文字領域の文字画像の色を再現するための多値の文字色データと、該入力画像データの文字画像が除かれた下地画像を再現するための多値の下地画像データとを生成する第２の構造化工程と、
該第２の構造化工程により生成された少なくとも一部の要素データに対し要素データ別に圧縮符号化処理を行う第２の圧縮符号化処理工程とからなる、
ことを特徴とする画像処理方法。
前記第２のエンコード処理工程の第２の構造化工程は、構造化画像データの要素データとして生成した文字画像データと下地画像データの合成時の上下関係を示すデータを該構造化画像データの要素データとしてさらに生成することを特徴とする請求項７に記載の画像処理方法。
前記第２のエンコード処理工程の第２の構造化工程は、構造化画像データの要素データとして生成した文字画像データと下地画像データの合成時の透明化処理のための不透明度又は透明度を指定するデータを該構造化画像データの要素データとしてさらに生成することを特徴とする請求項７に記載の画像処理方法。
前記第２のエンコード処理工程の第２の構造化工程は、構造化画像データの要素データとして生成した文字領域データ、文字画像データ、文字色データ及び下地画像データから合成される多値の再現画像データと入力画像データとの差分成分を表す変換データを該構造化画像データの要素データとしてさらに生成することを特徴とする請求項７に記載の画像処理方法。
請求項１乃至５のいずれか１項に記載の画像処理装置の各手段としてコンピュータを機能させるプログラム。
請求項１乃至５のいずれか１項に記載の画像処理装置の各手段としてコンピュータを機能させるプログラムが記録された、コンピュータが読み取り可能な情報記録媒体。