JP2003018412A - 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体 - Google Patents

画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体

Info

Publication number
JP2003018412A
JP2003018412A JP2001202451A JP2001202451A JP2003018412A JP 2003018412 A JP2003018412 A JP 2003018412A JP 2001202451 A JP2001202451 A JP 2001202451A JP 2001202451 A JP2001202451 A JP 2001202451A JP 2003018412 A JP2003018412 A JP 2003018412A
Authority
JP
Japan
Prior art keywords
image
color
text area
inclusion
text
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001202451A
Other languages
English (en)
Inventor
Tetsuomi Tanaka
哲臣 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001202451A priority Critical patent/JP2003018412A/ja
Priority to US09/931,890 priority patent/US7133565B2/en
Publication of JP2003018412A publication Critical patent/JP2003018412A/ja
Withdrawn legal-status Critical Current

Links

Landscapes

  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Analysis (AREA)
  • Image Processing (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

(57)【要約】 【課題】 複数の色を有するテキスト領域を含むカラー
文書画像に対して圧縮を行う場合、その圧縮データのサ
イズをより小さくすること。 【解決手段】 テキスト部色抽出部204でカラー文書
画像201の各テキスト領域毎に用いられている色を抽
出し、複数色テキスト領域分割部205aで複数の色を
含むテキスト領域を同じ色のテキストを含むサブ領域に
分割する。画像結合部205は同色が用いられていると
判断されたテキスト領域及び/又はサブ領域を包含する
領域の画像(包含画像)を生成し、2値画像圧縮部20
6で包含画像に対して圧縮を施す。一方、文字部塗りつ
ぶし部207では、カラー文書画像201において、領
域解析部203で解析されたテキスト領域を所定の色で
塗りつぶした画像(下地画像)を生成する。そして下地
画像圧縮部208は文字部塗りつぶし部207で生成さ
れた下地画像を圧縮する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、カラー文書画像を
圧縮する画像圧縮装置及び画像圧縮方法並びにプログラ
ムコード、記憶媒体に関するものである。
【0002】
【従来の技術】近年、スキャナの普及により文書の電子
化が進んでいる。電子化された文書をフルカラーで所有
すると300dpiでA4サイズの場合約24Mバイト
になり、保有するにもメモリを逼迫するし、メイル添付
などで他人に送信できるサイズではない。フルカラー画
像圧縮にはJPEGが知られている。JPEGは写真な
どの自然画像を圧縮するには非常に効果も高く、画質も
良いが、文字領域(テキスト領域)などの高周波部分を
JPEG圧縮するとモスキートノイズと呼ばれる画像劣
化が発生し、圧縮率も悪い。そこで領域分割を行い、テ
キスト領域を抜いた下地部分のJPEG圧縮と、色情報
付きテキスト領域のMMR圧縮を作成し、伸長時は白部
分はJPEG画像を透過し、黒部分は代表文字色を載せ
て表現する方法があった。
【0003】しかし、上記方法では例えば、黒文字の文
章中の赤で示した強調文字の情報が欠落してしまう等、
2色以上を用いた文字部を含む画像を上記圧縮方法で圧
縮し、この圧縮した画像を伸長した場合、伸長後の画像
に含まれる文字部は1色とされてしまう。
【0004】それに対しカラー文書画像を画質劣化少な
く高圧縮する方式として、以下の方法があった。まず、
カラー文書画像に対して2値化処理を行い、2値画像を
得る。そして2値画像からテキスト領域を検出する。具
体的には、2値画像中の黒画素の輪郭線追跡を行い、す
べての黒領域に対してラベル付けする。そしてラベル付
けされた黒領域を検索し、黒領域中の文字らしい領域を
判定する。そして2値画像の黒の領域に該当する原画像
中の領域を黒の領域の周囲の色で塗りつぶし、画像Aを
作成する。そして画像Aを縮小した画像BをJPEG圧
縮する。そして、2値画像の黒の領域に該当する原画像
(カラー文書画像)の領域の色を算出し、複数のパレッ
トを作成する。またパレットに従って原画像に対して減
色処理を行い、減色画像を生成する。減色画像が1ビッ
トであるときには、減色画像をMMR圧縮する。減色画
像が2ビット以上であるときには、減色画像を可逆圧縮
する。
【0005】
【発明が解決しようとする課題】しかし、一般にテキス
ト領域における色の分布は離散的ではなく、局所的であ
るために、テキスト領域の画像を多ビットで保持するこ
とは効率が悪いので、その圧縮データも効率の悪いもの
となってしまう。また、上述の圧縮方法では、テキスト
領域が複数のビットである場合には、このテキスト領域
に対して可逆圧縮を行っていたが、この圧縮方法はMM
R圧縮に比べて圧縮効率は低い。
【0006】本発明は以上の問題に鑑みて成されたもの
であり、複数の色を有するテキスト領域を含むカラー文
書画像に対して圧縮を行う場合、その圧縮データのサイ
ズをより小さくすることを目的とする。
【0007】
【解決するための手段】本発明の目的を達成するため
に、例えば本発明の画像圧縮装置は以下の構成を備え
る。
【0008】すなわち、カラー文書画像を圧縮する画像
圧縮装置であって、前記カラー文書画像に含まれるテキ
スト領域の色を抽出する抽出手段と、前記抽出手段によ
り前記テキスト領域から抽出された色の数が複数である
場合、前記テキスト領域において同じ色を有する領域を
包含する第1の包含画像と、当該第1の包含画像に関す
る情報を生成する第1の生成手段と、所定の色範囲内で
同一色を有すると見なされるテキスト領域及び/又は前
記第1の包含画像を包含する第2の包含画像と、当該第
2の包含画像に関する情報とを生成する第2の生成手段
と、前記第1の包含画像及び/又は前記テキスト領域及
び/又は前記第2の包含画像に対して圧縮を行う圧縮手
段とを備える。
【0009】更に、前記カラー文書画像に対して2値化
処理を行い、2値画像を生成する2値化手段を備え、前
記抽出手段は前記2値画像からテキスト領域を特定し、
前記カラー文書画像において、前記テキスト領域に該当
する領域に含まれる色を抽出する。
【0010】また、前記第2の生成手段は更に、所定の
色範囲内で同一色を有すると見なされるテキスト領域及
び/又は第1の包含画像のうち、第1の画像に結合する
第2の画像を決定する決定手段を備え、前記第1の画像
と、前記決定手段が決定した第2の画像とを包含する包
含画像と、当該包含画像に関する情報を生成する。
【0011】更に、前記カラー文書画像において、テキ
スト領域を所定の色で塗りつぶした下地画像を生成する
下地画像生成手段と、前記下地画像を圧縮する下地画像
圧縮手段とを備える。
【0012】
【発明の実施の形態】以下添付図面を参照して、本発明
を好適な実施形態に従って詳細に説明する。
【0013】[第1の実施形態]図1に本実施形態にお
ける画像圧縮装置の基本構成を示す。101はCPU
で、RAM102やROM103に格納されたプログラ
ムやデータを用いて本装置全体の制御を行うと共に、後
述の画像圧縮処理を行う。102はRAMで、外部記憶
装置104や記憶媒体ドライブ109からロードされた
プログラムやデータ、画像入力装置108から入力され
た画像データなどを一時的に記憶するエリアを備えると
共に、CPU101が各種の処理を実行する際に用いる
ワークエリアも備える。103はROMで、本装置全体
の制御プログラムやブートプログラム、本装置の設定デ
ータ等を格納する。104はハードディスクなどの外部
記憶装置で、記憶媒体ドライブ109からロードされた
プログラムやデータなどを保存することができる。ま
た、ワークエリアのサイズがRAM102のサイズを越
えた場合、越えた分のエリアをファイルとして提供する
こともできる。105,106は夫々キーボード、マウ
スで、ポインティングデバイスとして機能し、各種の指
示を本装置に入力することができる。
【0014】107は表示装置で、CRTや液晶画面な
どにより構成されており、画像情報や文字情報を表示す
ることができる。108は画像入力装置で、スキャナや
ディジタルカメラなどにより構成されており、画像をデ
ータとして入力することができる。尚、画像入力装置1
08は本装置と接続するためのインターフェースを含
む。109は記憶媒体ドライブで、CD−ROMドライ
ブ、DVD−ROMドライブ、フロッピー(登録商標)
ディスク(FD)ドライブ等により構成されており、C
D−ROMやDVD−ROMやFD等の記憶媒体からプ
ログラムやデータなどを読み込むことができる。110
は上述の各部を繋ぐバスである。
【0015】図2に本実施形態における画像圧縮装置の
機能構成を示す。201はカラーの文書画像で、画像2
01に含まれる文字部(テキスト部)には、複数の色が
用いられている。202は2値化部で、カラー文書画像
201を2値化処理し、2値画像を生成する。203は
領域解析部で、2値画像におけるテキスト領域を特定
し、2値画像におけるテキスト領域の位置やサイズなど
の情報(テキスト情報)を生成する。テキスト領域の特
定方法として、例えば、2値画像中の黒画素の輪郭線追
跡を行い、すべての黒領域に対してラベル付けし、ラベ
ル付けされた黒領域を検索し、黒領域中の文字らしい領
域(すなわち、テキスト領域と思われる領域)を特定す
る方法が挙げられるが、これに限定されるものではな
い。
【0016】204はテキスト部色抽出部で、各テキス
ト領域毎に、用いられている色を抽出する。205は画
像結合部で、同色が用いられていると判断されたテキス
ト領域(後述のサブ領域を含む)を包含する領域の画像
(以下、包含画像)を生成する。また、画像結合部20
5は複数色テキスト領域分割部205aを含む。複数色
テキスト領域分割部205aは、複数の色を含むテキス
ト領域を同じ色のテキストを含むサブ領域に分割する。
206は2値画像圧縮部で、画像結合部205で生成さ
れた包含画像、及び/又はテキスト領域、及び/又はサ
ブ領域に対して圧縮を施す。207は文字部塗りつぶし
部で、カラー文書画像201において、領域解析部20
3で解析されたテキスト領域を所定の色で塗りつぶした
画像(以下、下地画像)を生成する。この所定の色は予
め決められた色でも良いし、テキスト領域の周辺の画素
の平均値でも良い。208は下地画像圧縮部で、文字部
塗りつぶし部207で生成された下地画像を圧縮する。
【0017】尚、図2に示した機能構成に従ったプログ
ラムコードを記憶媒体に格納し、この記憶媒体を記憶媒
体ドライブ109を介して図1に示した画像圧縮装置に
(記憶媒体ドライブ108を介して)読み込ませてもよ
い。この場合、読み込んだプログラムをCPU101が
実行することで、図1に示した構成を備える画像圧縮装
置は図2に示した機能構成を有する装置として動作す
る。
【0018】図2の機能構成図を用いて本実施形態にお
けるカラー文書画像の圧縮方法について説明する。
【0019】まず、外部記憶装置104もしくは、画像
入力装置108もしくは、記憶媒体ドライブ109のい
ずれかから、カラー文書画像201をRAM102に読
み込む。本実施形態ではこのカラー文書画像201とし
て図3Aに示す画像を用いる。
【0020】次に、RAM102に読み込まれたカラー
文書画像201に基づいて、2値化部202は2値画像
を生成する。2値画像を生成する方法は特に限定される
ものではないが、本実施形態では以下の方法を用いる。
まず、カラー文書画像201における輝度データのヒス
トグラムを取り、2値化閾値Tを算出する。この算出方
法はここでは特には限定しないが、例えばヒストグラム
の中間値となる輝度値をこの閾値Tとしてもよい。そし
て2値化閾値Tを用いてカラー文書画像201を2値化
し、2値画像を作成する。生成された2値画像はRAM
102内において、カラー文書画像201が記憶されて
いるエリアとは別のエリアに記憶される。
【0021】次に、領域解析部203は上述の2値画像
を参照して上述の方法で、テキスト領域を特定する。そ
の際に上述のテキスト情報を生成する。領域解析部20
3によって領域解析される対象を図3Aに示した画像と
した場合、その結果を図3Bに示す。同図ではテキスト
領域としてTEXT1〜TEXT5が特定されており、
夫々の領域に対してテキスト情報が生成される。このテ
キスト情報はテキスト部色抽出部204と、文字部塗り
つぶし部207に出力される。
【0022】テキスト部色抽出部204は、テキスト情
報を参照してカラー文書画像201におけるテキスト領
域を特定し、特定したテキスト領域における色、つま
り、テキスト領域内の文字の色を抽出する。図3Bにお
いて、本実施形態ではTEXT1とTEXT3の領域は
赤の文字、TEXT2の領域は黒、赤、青の3色から成
る文字、TEXT4の領域は黒の文字、TEXT5は青
の文字とする。テキスト部色抽出部204により抽出さ
れた各テキスト領域の色はパレット情報として生成され
る。
【0023】画像結合部205は、テキスト部色抽出部
204により抽出された各テキスト領域TEXT1〜T
EXT5における色を前述のパレット情報を参照して、
同じ色を用いているテキスト領域を結合する。
【0024】ここでTEXT2は3色の色を有している
ので、複数色テキスト領域分割部205aは、TEXT
2を同じ色の文字を含む領域(サブ領域)に分割する。
このサブ領域を図3Cに示す。TEXT2において黒の
文字を含む領域はTEXT6で示されている。TEXT
2において赤の文字を含む領域はTEXT7で示されて
いる。TEXT2において青の文字を含む領域はTEX
T8で示されている。よって、TEXT2のパレット情
報も分割され、各サブ領域TEXT6,TEXT7、T
EXT8が有する色が夫々黒、赤、青であることを示す
パレット情報が生成される。また、複数色テキスト領域
分割部205aはこのサブ領域の位置、サイズを含むサ
ブ領域情報を生成する。
【0025】複数色テキスト領域分割部205aによる
上述のサブ領域分割処理が終了すると、同じ色を用いて
いるテキスト領域(サブ領域も含む)を結合し、包含画
像を生成する。
【0026】上述の説明により、TEXT1、TEXT
3、TEXT7は同じ色(赤)を用いた文字を含んでい
るので、これらの領域を包含する領域の画像(包含画
像)を生成する。ここで、TEXT1、TEXT3、T
EXT7を包含する領域の画像(包含画像)を生成する
ことを、「TEXT1、TEXT3、TEXT7とを結
合する」と呼ぶことにする。この包含画像を図3Dにお
いて、TEXT1’で示す。尚、この包含画像内の画素
は、文字の部分以外は単色の画素値を有する。
【0027】同様に、黒を有するテキスト領域を包含す
るTEXT2’も生成される。TEXT2’はTEXT
4,TEXT6を包含する。同様に青を有するテキスト
領域を包含するTEXT3’も生成される。TEXT
3’はTEXT5,TEXT8を包含する。
【0028】以上の処理により生成された夫々の包含画
像TEXT1’、TEXT2’、TEXT3’の2値画
像における配置を図3Dに示す。また、包含画像TEX
T1’、TEXT2’、TEXT3’の詳細を図3Eに
示す。また、画像結合部205は各包含画像の(2値画
像もしくはカラー文書画像201における)位置、サイ
ズを含む包含画像情報を生成する。
【0029】ここで、画像結合部205において同じ色
を用いているテキスト領域を特定する方法について説明
する。
【0030】テキスト領域内におけるテキストの色がR
GB各8ビットであった場合、RGB各2ビット、もし
くは3ビットといったように、予め決められた色範囲に
減色する。そして各テキスト領域をこのように減色して
おいて、同一色になるかどうかを判断する。どの程度ま
で減色するかは圧縮した画像にどの程度階調性を持たせ
たいかによって決まる。例えば人の目の青色に対する感
度が低いことを利用してRGBを夫々2ビット、2ビッ
ト、1ビットとしてもよいし、RGBを夫々3ビット、
3ビット、2ビットとしてもよい。
【0031】又、この方法は複数の色を有しているテキ
スト領域をサブ領域に分割する方法にも適用できる。そ
の場合、テキスト領域内を上述のように減色し、減色し
た結果を用いて、同じ色を有する領域を包含するサブ領
域に分割する。
【0032】また、より正確に同色の判定を行いたい場
合はRGB形式ではなく、より色差を比較しやすいLA
B形式やYCrCb形式に変換して、2ビットや3ビッ
トに丸めて用いると良い。説明するとRGB形式では黒
色を灰及び暗い青色とそれぞれ比較した場合には距離的
に暗い青色が近くなるが、LABやYCrCb形式では
輝度成分と色成分が分かれているため黒色と暗い青色の
分離が可能となる。
【0033】またスキャンされた文字の色と多少異なる
が、黒文字などの輝度の低い色の場合は同色のテキスト
領域内の最も輝度の低い色を採用し、逆に白文字などの
輝度の高い色の場合は同色のテキスト領域内の最も輝度
の高い色を採用すると入力画像の再現性は多少低くなる
が見た目が良くなる。
【0034】しかし、本実施形態では画像結合部205
は同じ色を有するテキスト領域(以下特に断らない限
り、サブ領域を含む)を結合するのではなく、後述の処
理により結合するテキスト領域を選択する。これは、同
一色を有してはいるが、離れた小さなテキスト領域を包
含画像に含ませる場合に、逆に圧縮後のサイズが大きく
なる場合があるからである。
【0035】結合するテキスト領域を選択する処理は画
像結合部205で行われる。よって以下では、画像結合
部205の処理を図4を用いて説明する。
【0036】図4は本実施形態の画像結合部205にお
ける具体的な処理のフローチャートである。
【0037】まず、画像結合部205で、同一色である
と判定されたテキスト領域群の中から基準となる一つの
テキスト領域(以下、基準テキスト領域)を選択する
(ステップS401)。もしテキスト領域がなければ、
もしくは全テキスト領域に対して後述の処理を終えたの
であれば(ステップS402)、本処理を終了する。一
方、未処理のテキスト領域が有れば、処理をステップS
403に進める。
【0038】基準テキスト領域の近傍のテキスト領域で
あって、同一色のテキスト領域を検索し(ステップS4
03)、この条件に合致する適する領域が有れば、処理
をステップS404に進め、この条件に合致するテキス
ト領域であって、基準テキスト領域に最も近いテキスト
領域(以下、近傍テキスト領域)を選択する(ステップ
S404)。一方、上述の条件に合致したテキスト領域
が存在しなければ、処理をステップS409に進め、後
述のステップS408で基準テキスト領域と結合したと
見なされたテキスト領域を包含する包含画像を作成する
(ステップS409)。
【0039】次に、基準テキスト領域と近傍テキスト領
域とを包含する包含画像矩形を決定する(ステップS4
05)。そして、基準テキスト領域、近傍テキスト領域
の夫々を圧縮した場合に、夫々の圧縮データの合計サイ
ズと、包含画像を圧縮した場合の圧縮サイズを推定する
(ステップS406)。ここで実際に圧縮を施して正確
なサイズを出す方法もあるが、以下の方法で簡易的に算
出すれば圧縮サイズの精度は落ちるが処理時間を軽減で
きる。予め測定していたテキスト領域の圧縮率Aを用い
て、2つの領域(基準テキスト領域と近傍テキスト領
域)を夫々圧縮した場合に、その合計サイズは、以下の
式で推定することができる。
【0040】圧縮サイズ1=(基準テキスト領域の面積
+近傍テキスト領域の面積)×A+2×ヘッダサイズ 一方、包含画像を圧縮する場合、包含画像に含まれる2
つの領域、基準テキスト領域と近傍テキスト領域には必
ず隙間部分が生じる。この部分は単一の画素値を表すデ
ータで埋められており、テキスト領域を圧縮した場合に
比べではるかに高圧縮率で圧縮できる。この圧縮率をB
とすると 圧縮サイズ2=(テキスト領域の面積)×A+(隙間部
分の面積)×B+ヘッダサイズ となる。
【0041】そして、上述の推定結果を用いて圧縮サイ
ズ1と圧縮サイズ2の比較を行い、圧縮サイズ2の方が
小さい、つまり、包含画像を圧縮した方が、各領域を別
々に圧縮するよりも、発生する圧縮データのサイズが小
さくなる場合(ステップS407)、処理をステップS
408に進め、結合リストに基準テキスト領域と近傍テ
キスト領域とを同じ包含画像に含める(結合する)こと
を示すデータを追加する(ステップS408)。
【0042】図5に結合リストの例を示す。同図では、
基準テキスト領域をTEXT2とした場合の結合リスト
の構成例を示したものであり、TEXT2と、各テキス
ト領域TEXT1〜TEXT5との対応が示されてい
る。同図において、0は結合していないことを示す符号
で、1は結合していることを示している符号、999が
無効(自身とは結合できない)を示す符号である。結合
リストには最初全て結合していないことを示す符号(同
図では0)がセットされており、ステップS408にお
ける処理を実行したときのみ、結合していることを示す
符号(同図では1)に変更される。
【0043】一方、圧縮サイズ2の方が大きい、つま
り、包含画像を圧縮した方が、各領域を別々に圧縮する
よりも、発生する圧縮データのサイズが大きくなる場合
(ステップS407)、処理をステップS403に戻
し、次の近傍テキスト領域を検索する。
【0044】以上の処理が一巡し、基準テキスト領域と
近傍テキスト領域が結合された場合、再び行われるステ
ップS403以降の処理では、一度選択されたテキスト
領域以外であって、基準テキスト領域と同一色であっ
て、基準テキスト領域に最も近いテキスト領域を新たな
近傍テキスト領域とする(ステップS403,ステップ
S404)。そして、基準テキスト領域と前回の近傍テ
キスト領域、そして今回の近傍テキスト領域とを含む包
含画像矩形を決定し(ステップS405)、この包含画
像と今回の近傍テキスト領域について、上述の式を用い
て圧縮サイズ1,圧縮サイズ2を推定する(ステップS
406)。具体的には以下のような式になる。
【0045】圧縮サイズ1=(包含画像の面積+近傍テ
キスト領域の面積)×A+2×ヘッダサイズ 圧縮サイズ2=(テキスト領域の面積)×A+(隙間部
分の面積)×B+ヘッダサイズ そして上述のステップS407以降の処理を行う。この
ようにすることで、最も多くのテキスト領域を含み、且
つ圧縮後のサイズが最も小さい包含画像の作成を行うこ
とができる。
【0046】2値画像圧縮部206は、各包含画像及び
/又はテキスト領域及び/又はサブ領域を圧縮する。各
包含画像、テキスト領域、サブ領域はすべて1ビットの
画像(1つの色を有する)であるため、MMR圧縮を用
いる。その結果、従来複数の色を有するテキスト領域を
圧縮する際に用いていた可逆符号化よりも圧縮効率は高
くなる。
【0047】また、包含画像を圧縮した際にはこの包含
画像に対応するヘッダが生成され、このヘッダにはこの
包含画像に対するパレット情報と包含画像情報とが含ま
れる。また、テキスト領域を圧縮した際にはこのテキス
ト領域に対応するヘッダが生成され、このヘッダにはこ
のテキスト領域に対するパレット情報とテキスト情報が
含まれる。また、サブ領域を圧縮した際にはこのサブ領
域に対応するヘッダが生成され、このヘッダはこのサブ
領域に対するパレット情報とサブ領域情報が含まれる。
【0048】尚、パレット情報は各テキスト領域(サブ
領域を含む)毎に存在するが、包含画像内のテキスト領
域(サブ領域を含む)は全て同じパレット情報を有す
る。よって、包含画像のパレット情報として、包含画像
内のテキスト領域(サブ領域を含む)のいずれか1つの
パレット情報を用いればよい。
【0049】このようにすることで、各テキスト領域
(サブ領域を含む)を圧縮すると7つのヘッダ(TEX
T1、TEXT3、TEXT4、TEXT5、TEXT
6、TEXT7、TEXT8に対するヘッダ)が作成さ
れるのに対して、本実施形態では3つのヘッダ(TEX
T1’、TEXT2’、TEXT3’に対するヘッダ)
が作成されることになる。その結果、ヘッダの数を減ら
すことができ、結果として圧縮後のデータのサイズが減
ることになる。
【0050】一方、文字部塗りつぶし部207は、テキ
スト情報を用いてカラー文書画像201におけるテキス
ト領域を特定して、特定したテキスト領域を所定の色で
塗りつぶした画像(下地画像)を生成する。この下地画
像を図3Fに示す。この所定の色は予め決められた色で
も良いし、カラー文書画像201におけるテキスト領域
の周辺の画素の平均値でも良い。
【0051】そして下地画像圧縮部208は、文字部塗
りつぶし部207で生成された画像(下地画像)に対し
てJPEG圧縮を行う。
【0052】以上の説明の通り、本実施形態の画像圧縮
装置及び画像圧縮方法によって、テキスト領域を多く含
むカラー文書画像を圧縮する場合でも、同じ色を有する
テキスト領域を包含する画像を生成し、この画像を圧縮
するので、圧縮後の画像に添付されるヘッダの数を減ら
すことができる。又、同時に、圧縮後のデータのサイズ
を減らすことができる。
【0053】また、複数の色を有するテキスト領域を同
じ色を有する領域(サブ領域)に分割することで、MM
R圧縮を用いることができるので、従来の可逆符号化に
比べて、より圧縮効率の高い圧縮を行うことができる。
【0054】[第2の実施形態]第1の実施形態では多
色のテキスト領域が文字単位で異なる場合で示したが、
1文字が複数色で構成される場合も同様に処理される。
例えば縁取りのある文字で縁部分と文字本体部分が異な
る色で表現されるような場合である。
【0055】また、第1の実施形態では多色のテキスト
領域を色毎に分解し、近似色判定(減色結果を用いて同
色か否かの判定)によりテキスト領域の結合処理を行っ
たが、後で結合を行うためにはテキスト領域に含まれる
画像を保持しなければならない。よってメモリ(RAM
102)に余裕がない場合には、テキスト領域をすぐに
単独で圧縮してしまってもかまわない。
【0056】[他の実施形態]また、本発明は上記実施
形態を実現する為の装置及び方法のみに限定されるもの
ではなく、上記システム又は装置内のコンピュータ(C
PUあるいはMPU)に、上記実施形態を実現する為の
ソフトウェアのプログラムコードを供給し、このプログ
ラムコードに従って上記システムあるいは装置のコンピ
ュータが上記各種デバイスを動作させることにより上記
実施形態を実現する場合も本発明の範疇に含まれる。
【0057】またこの場合、ソフトウェアのプログラム
コード自体が上記実施形態の機能を実現することにな
り、そのプログラムコード自体、及びそのプログラムコ
ードをコンピュータに供給する為の手段、具体的には上
記プログラムコードを格納した記憶媒体は本発明の範疇
に含まれる。
【0058】この様なプログラムコードを格納する記憶
媒体としては、例えばフロッピーディスク、ハードディ
スク、光ディスク、光磁気ディスク、CD−ROM、磁
気テープ、不揮発性のメモリカード、ROM等を用いる
ことができる。
【0059】また、上記コンピュータが、供給されたプ
ログラムコードのみに従って各種デバイスを制御するこ
とにより、上記実施形態の機能が実現される場合だけで
はなく、上記プログラムコードがコンピュータ上で稼働
しているOS(オペレーティングシステム)、あるいは
他のアプリケーションソフト等と共同して上記実施形態
が実現される場合にもかかるプログラムコードは本発明
の範疇に含まれる。
【0060】更に、この供給されたプログラムコード
が、コンピュータの機能拡張ボードやコンピュータに接
続された機能拡張ユニットに備わるメモリに格納された
後、そのプログラムコードの指示に基づいてその機能拡
張ボードや機能格納ユニットに備わるCPU等が実際の
処理の一部又は全部を行い、その処理によって上記実施
形態が実現される場合も本発明の範疇に含まれる。
【0061】
【発明の効果】以上の説明により、本発明によって、複
数の色を有するテキスト領域を含むカラー文書画像に対
して圧縮を行う場合、その圧縮データのサイズをより小
さくすることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における画像圧縮装置
の基本構成を示す図である。
【図2】本発明の第1の実施形態における画像圧縮装置
の機能構成を示す図である。
【図3A】カラー文書画像201を示す図である。
【図3B】カラー文書画像201に対して領域解析を行
った結果を示す図である。
【図3C】TEXT2をサブ領域に分割した場合の各サ
ブ領域を示す図である。
【図3D】包含画像TEXT1’、TEXT2’、TE
XT3’の2値画像における配置を示す図である。
【図3E】包含画像TEXT1’、TEXT2’、TE
XT3’の詳細を示す図である。
【図3F】下地画像を示す図である。
【図4】画像結合部205における具体的な処理のフロ
ーチャートである。
【図5】結合リストを示す図である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/40 H04N 1/413 D 5L096 1/413 7/13 Z 7/24 1/40 F Fターム(参考) 5B057 AA11 BA30 CA01 CA08 CA12 CA16 CB01 CB06 CB08 CB12 CB16 CC03 CE12 CE17 CG02 CG03 CG04 DA08 DA17 DB02 DB06 DB08 DC25 5C059 MA00 MA45 PP01 PP14 PP20 PP24 SS12 SS20 UA02 5C077 LL18 MP06 MP08 PP27 PP35 PP36 PP43 PP58 PQ08 PQ18 RR02 RR21 5C078 AA04 BA27 BA57 CA02 DA01 DB06 5J064 AA02 BA08 BB05 BC01 BC25 BC26 BD03 5L096 AA02 AA06 BA17 EA43 FA15 FA44 FA78 GA38 GA40

Claims (23)

    【特許請求の範囲】
  1. 【請求項1】 カラー文書画像を圧縮する画像圧縮装置
    であって、 前記カラー文書画像に含まれるテキスト領域の色を抽出
    する抽出手段と、 前記抽出手段により前記テキスト領域から抽出された色
    の数が複数である場合、前記テキスト領域において同じ
    色を有する領域を包含する第1の包含画像と、当該第1
    の包含画像に関する情報を生成する第1の生成手段と、 所定の色範囲内で同一色を有すると見なされるテキスト
    領域及び/又は前記第1の包含画像を包含する第2の包
    含画像と、当該第2の包含画像に関する情報とを生成す
    る第2の生成手段と、 前記第1の包含画像及び/又は前記テキスト領域及び/
    又は前記第2の包含画像に対して圧縮を行う圧縮手段と
    を備えることを特徴とする画像圧縮装置。
  2. 【請求項2】 更に、前記カラー文書画像に対して2値
    化処理を行い、2値画像を生成する2値化手段を備え、 前記抽出手段は前記2値画像からテキスト領域を特定
    し、前記カラー文書画像において、前記テキスト領域に
    該当する領域に含まれる色を抽出することを特徴とする
    請求項1に記載の画像圧縮装置。
  3. 【請求項3】 前記抽出手段は、前記2値画像における
    テキスト領域の位置、テキスト領域のサイズを含むテキ
    スト情報を生成することを特徴とする請求項2に記載の
    画像圧縮装置。
  4. 【請求項4】 前記抽出手段は、テキスト領域から抽出
    した色を当該テキスト領域のパレット情報として生成す
    ることを特徴とする請求項2に記載の画像圧縮装置。
  5. 【請求項5】 前記抽出手段によりテキスト領域から抽
    出された色の数が複数の場合、 前記第1の生成手段は、前記テキスト領域内の色に対し
    て減色処理を施し、減色処理した色において同一色を有
    すると見なされる領域を包含する第1の包含画像と、当
    該第1の包含画像に関する情報を生成することを特徴と
    する請求項1に記載の画像圧縮装置。
  6. 【請求項6】 前記第1の包含画像に関する情報は、前
    記第1の包含画像の位置、前記第1の包含画像のサイズ
    を含むことを特徴とする請求項5に記載の画像圧縮装
    置。
  7. 【請求項7】 前記抽出手段によりテキスト領域から抽
    出された色の数が複数の場合、 前記第1の生成手段は、前記第1の包含画像の色をパレ
    ット情報として生成することを特徴とする請求項1乃至
    6のいずれか1項に記載の画像圧縮装置。
  8. 【請求項8】 前記第2の生成手段は、テキスト領域内
    の色に対して減色処理を施し、減色処理した色において
    同一色を有すると見なされるテキスト領域及び/又は第
    1の包含画像を包含する第2の包含画像と、当該第2の
    包含画像に関する情報とを生成することを特徴とする請
    求項1に記載の画像圧縮装置。
  9. 【請求項9】 前記第2の包含画像に関する情報は、前
    記第2の包含画像の位置、前記第2の包含画像のサイズ
    を含むことを特徴とする請求項8に記載の画像圧縮装
    置。
  10. 【請求項10】 前記第2の生成手段は更に、所定の色
    範囲内で同一色を有すると見なされるテキスト領域及び
    /又は第1の包含画像のうち、第1の画像に結合する第
    2の画像を決定する決定手段を備え、 前記第1の画像と、前記決定手段が決定した第2の画像
    とを包含する包含画像と、当該包含画像に関する情報を
    生成することを特徴とする請求項1乃至9のいずれか1
    項に記載の画像圧縮装置。
  11. 【請求項11】 前記決定手段は、 前記第1の画像、もしくは前記第1の画像を含む包含画
    像を圧縮した際に推定される圧縮サイズと、前記第2の
    画像を圧縮した際に推定される圧縮サイズとの合計によ
    り得られる第1の圧縮サイズと、 前記第1の画像、もしくは前記第1の画像を含む包含画
    像と前記第2の画像とを包含する包含画像を圧縮した際
    に推定される第2の圧縮サイズとを求め、 前記第2の圧縮サイズが前記第1の圧縮サイズよりも小
    さい場合、前記第2の画像を前記第1の画像に結合する
    ことを特徴とする請求項10に記載の画像圧縮装置。
  12. 【請求項12】 前記第2の生成手段は、所定の色範囲
    内で同一色を有すると見なされるテキスト領域及び/又
    は第1の包含画像のうち、第1の画像に結合する第2の
    画像を示す結合リストを生成し、当該結合リストを参照
    することで、前記第1の画像と、前記決定手段が決定し
    た第2の画像とを包含する包含画像と、当該包含画像に
    関する情報を生成することを特徴とする請求項1乃至1
    1のいずれか1項に記載の画像圧縮装置。
  13. 【請求項13】 前記圧縮手段は包含画像及び/又はテ
    キスト領域及び/又は第1の包含画像に対してMMR圧
    縮を行うことを特徴とする請求項1に記載の画像圧縮装
    置。
  14. 【請求項14】 更に、前記カラー文書画像において、
    テキスト領域を所定の色で塗りつぶした下地画像を生成
    する下地画像生成手段と、 前記下地画像を圧縮する下地画像圧縮手段とを備えるこ
    とを特徴とする請求項1乃至13のいずれか1項に記載
    の画像圧縮装置。
  15. 【請求項15】 前記下地画像生成手段は、前記テキス
    ト領域を前記テキスト情報を参照することで特定するこ
    とを特徴とする請求項14に記載の画像圧縮装置。
  16. 【請求項16】 前記下地画像生成手段は、前記テキス
    ト領域を前記カラー文書画像の前記テキスト領域周辺の
    画素の平均値で塗りつぶすことを特徴とする請求項14
    に記載の画像圧縮装置。
  17. 【請求項17】 前記下地画像圧縮手段は、前記下地画
    像に対してJPEG圧縮を行うことを特徴とする請求項
    14に記載の画像圧縮装置。
  18. 【請求項18】 カラー文書画像を圧縮する画像圧縮方
    法であって、 前記カラー文書画像に含まれるテキスト領域の色を抽出
    する抽出工程と、 前記抽出工程で前記テキスト領域から抽出された色の数
    が複数である場合、前記テキスト領域において同じ色を
    有する領域を包含する第1の包含画像と、当該第1の包
    含画像に関する情報を生成する第1の生成工程と、 所定の色範囲内で同一色を有すると見なされるテキスト
    領域及び/又は前記第1の包含画像を包含する第2の包
    含画像と、当該第2の包含画像に関する情報とを生成す
    る第2の生成工程と、 前記第1の包含画像及び/又は前記テキスト領域及び/
    又は前記第2の包含画像に対して圧縮を行う圧縮工程と
    を備えることを特徴とする画像圧縮方法。
  19. 【請求項19】 更に、前記カラー文書画像に対して2
    値化処理を行い、2値画像を生成する2値化工程を備
    え、 前記抽出工程では前記2値画像からテキスト領域を特定
    し、前記カラー文書画像において、前記テキスト領域に
    該当する領域に含まれる色を抽出することを特徴とする
    請求項18に記載の画像圧縮方法。
  20. 【請求項20】 前記第2の生成工程は更に、所定の色
    範囲内で同一色を有すると見なされるテキスト領域及び
    /又は第1の包含画像のうち、第1の画像に結合する第
    2の画像を決定する決定工程を備え、 前記第1の画像と、前記決定工程で決定した第2の画像
    とを包含する包含画像と、当該包含画像に関する情報を
    生成することを特徴とする請求項18又は19に記載の
    画像圧縮方法。
  21. 【請求項21】 更に、前記カラー文書画像において、
    テキスト領域を所定の色で塗りつぶした下地画像を生成
    する下地画像生成工程と、 前記下地画像を圧縮する下地画像圧縮工程とを備えるこ
    とを特徴とする請求項18乃至20のいずれか1項に記
    載の画像圧縮方法。
  22. 【請求項22】 請求項18乃至21のいずれか1項に
    記載の画像圧縮方法を実行するプログラムコード。
  23. 【請求項23】 請求項22に記載のプログラムコード
    を格納し、コンピュータが読み取り可能な記憶媒体。
JP2001202451A 2000-08-25 2001-07-03 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体 Withdrawn JP2003018412A (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001202451A JP2003018412A (ja) 2001-07-03 2001-07-03 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
US09/931,890 US7133565B2 (en) 2000-08-25 2001-08-20 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001202451A JP2003018412A (ja) 2001-07-03 2001-07-03 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体

Publications (1)

Publication Number Publication Date
JP2003018412A true JP2003018412A (ja) 2003-01-17

Family

ID=19039253

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001202451A Withdrawn JP2003018412A (ja) 2000-08-25 2001-07-03 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体

Country Status (1)

Country Link
JP (1) JP2003018412A (ja)

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005175643A (ja) * 2003-12-08 2005-06-30 Fuji Xerox Co Ltd 画像処理装置
JP2005269269A (ja) * 2004-03-18 2005-09-29 Fuji Xerox Co Ltd 画像処理装置
EP1555804A3 (en) * 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium
JP2007142885A (ja) * 2005-11-18 2007-06-07 Ricoh Co Ltd 画像処理装置及び画像読取装置
JP2007336226A (ja) * 2006-06-14 2007-12-27 Canon Inc 情報処理装置、制御方法、およびコンピュータプログラム
US7692669B2 (en) 2006-05-26 2010-04-06 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method and image processing program
US7747089B2 (en) 2006-06-12 2010-06-29 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method, and image processing program
CN101945203A (zh) * 2009-07-01 2011-01-12 夏普株式会社 图像压缩方法、图像压缩装置以及图像形成装置
US7884977B2 (en) 2006-08-02 2011-02-08 Konica Minolta Business Technologies, Inc. Method, device and computer program for processing input data concerning generation of electronic files
US8014620B2 (en) 2006-08-24 2011-09-06 Fuji Xerox Co., Ltd. Image processing system, image compression system, image editing system, computer readable medium, computer data signal and image processing apparatus
JP2011211712A (ja) * 2010-03-29 2011-10-20 Toshiba Corp 画像形成装置およびその制御方法
US9230341B2 (en) 2006-04-28 2016-01-05 Cinova Media Compressed domain system and method for compression gains in encoded data
US10015507B2 (en) 2013-05-20 2018-07-03 Cinova Media Transform system and method in video and image compression
US10460700B1 (en) 2015-10-12 2019-10-29 Cinova Media Method and apparatus for improving quality of experience and bandwidth in virtual reality streaming systems
US10462477B2 (en) 2015-02-25 2019-10-29 Cinova Media Partial evaluator system and method
US10944971B1 (en) 2017-05-22 2021-03-09 Cinova Media Method and apparatus for frame accurate field of view switching for virtual reality

Cited By (24)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005175643A (ja) * 2003-12-08 2005-06-30 Fuji Xerox Co Ltd 画像処理装置
EP1555804A3 (en) * 2004-01-19 2006-08-16 Ricoh Company, Ltd. Image processing apparatus, image processing program and storage medium
CN100356768C (zh) * 2004-01-19 2007-12-19 株式会社理光 图像处理设备和图像处理方法
JP4507656B2 (ja) * 2004-03-18 2010-07-21 富士ゼロックス株式会社 画像処理装置
JP2005269269A (ja) * 2004-03-18 2005-09-29 Fuji Xerox Co Ltd 画像処理装置
JP2007142885A (ja) * 2005-11-18 2007-06-07 Ricoh Co Ltd 画像処理装置及び画像読取装置
JP4571066B2 (ja) * 2005-11-18 2010-10-27 株式会社リコー 画像処理装置及び画像読取装置
US9230341B2 (en) 2006-04-28 2016-01-05 Cinova Media Compressed domain system and method for compression gains in encoded data
US7692669B2 (en) 2006-05-26 2010-04-06 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method and image processing program
US7747089B2 (en) 2006-06-12 2010-06-29 Konica Minolta Business Technologies, Inc. Image processing apparatus, image processing method, and image processing program
US8077986B2 (en) 2006-06-14 2011-12-13 Canon Kabushiki Kaisha Information processing apparatus, method of controlling same and computer program
JP2007336226A (ja) * 2006-06-14 2007-12-27 Canon Inc 情報処理装置、制御方法、およびコンピュータプログラム
JP4732250B2 (ja) * 2006-06-14 2011-07-27 キヤノン株式会社 情報処理装置、制御方法、およびコンピュータプログラム
US7884977B2 (en) 2006-08-02 2011-02-08 Konica Minolta Business Technologies, Inc. Method, device and computer program for processing input data concerning generation of electronic files
US8014620B2 (en) 2006-08-24 2011-09-06 Fuji Xerox Co., Ltd. Image processing system, image compression system, image editing system, computer readable medium, computer data signal and image processing apparatus
CN101945203A (zh) * 2009-07-01 2011-01-12 夏普株式会社 图像压缩方法、图像压缩装置以及图像形成装置
CN101945203B (zh) * 2009-07-01 2012-10-03 夏普株式会社 图像压缩方法、图像压缩装置以及图像形成装置
US8390888B2 (en) 2009-07-01 2013-03-05 Sharp Kabushiki Kaisha Image compressing method, image compressing apparatus and image forming apparatus
JP2011211712A (ja) * 2010-03-29 2011-10-20 Toshiba Corp 画像形成装置およびその制御方法
US10015507B2 (en) 2013-05-20 2018-07-03 Cinova Media Transform system and method in video and image compression
US10015506B2 (en) 2013-05-20 2018-07-03 Cinova Media Frequency reduction and restoration system and method in video and image compression
US10462477B2 (en) 2015-02-25 2019-10-29 Cinova Media Partial evaluator system and method
US10460700B1 (en) 2015-10-12 2019-10-29 Cinova Media Method and apparatus for improving quality of experience and bandwidth in virtual reality streaming systems
US10944971B1 (en) 2017-05-22 2021-03-09 Cinova Media Method and apparatus for frame accurate field of view switching for virtual reality

Similar Documents

Publication Publication Date Title
US7133565B2 (en) Image processing apparatus and method
US7158669B2 (en) Image compression method and apparatus, and image coding method and apparatus
US6999619B2 (en) Processing for accurate reproduction of symbols and other high-frequency areas in a color image
JP4366011B2 (ja) 文書処理装置及び方法
US7386168B2 (en) Image processing apparatus
JP2003018412A (ja) 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
JP4366003B2 (ja) 画像処理装置及び画像処理方法
JP2007336226A (ja) 情報処理装置、制御方法、およびコンピュータプログラム
US7626743B2 (en) Image processing apparatus, image processing method and image processing program for rendering pixels transparent in circumscribed areas
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
US7075681B1 (en) System and method for reducing the data volume of images
JP4693289B2 (ja) 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
JP2002165105A (ja) 画像処理装置及びその方法並びに記憶媒体
JP2003244447A (ja) 画像処理装置及び画像処理方法
JP6370080B2 (ja) 画像処理装置、画像処理方法及びプログラム。
JP6892625B2 (ja) データ処理装置、および、コンピュータプログラム
JP2003338935A (ja) 画像処理装置および方法
JP4250316B2 (ja) 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体
JP4228905B2 (ja) 画像処理装置及びプログラム
JPH11317855A (ja) 文書走査システム
JP2003338934A (ja) 画像処理装置および方法
JP2003309727A (ja) 画像符号化装置、画像符号化方法
JP2004242075A (ja) 画像処理装置および方法
JPH11136514A (ja) 画像処理装置、画像処理方法および画像処理制御プログラムを記録した媒体
JP2007174523A (ja) 画像処理装置、画像処理方法、プログラムコード及び記憶媒体

Legal Events

Date Code Title Description
A300 Application deemed to be withdrawn because no request for examination was validly filed

Free format text: JAPANESE INTERMEDIATE CODE: A300

Effective date: 20081007