JP2003018413A - 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体 - Google Patents

画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体

Info

Publication number
JP2003018413A
JP2003018413A JP2001202450A JP2001202450A JP2003018413A JP 2003018413 A JP2003018413 A JP 2003018413A JP 2001202450 A JP2001202450 A JP 2001202450A JP 2001202450 A JP2001202450 A JP 2001202450A JP 2003018413 A JP2003018413 A JP 2003018413A
Authority
JP
Japan
Prior art keywords
image
text area
color
text
compression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001202450A
Other languages
English (en)
Other versions
JP2003018413A5 (ja
JP4693289B2 (ja
Inventor
Tetsuomi Tanaka
哲臣 田中
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2001202450A priority Critical patent/JP4693289B2/ja
Priority to US09/931,890 priority patent/US7133565B2/en
Publication of JP2003018413A publication Critical patent/JP2003018413A/ja
Publication of JP2003018413A5 publication Critical patent/JP2003018413A5/ja
Application granted granted Critical
Publication of JP4693289B2 publication Critical patent/JP4693289B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Facsimile Image Signal Circuits (AREA)
  • Color Image Communication Systems (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Image Analysis (AREA)

Abstract

(57)【要約】 【課題】 テキスト領域を含むカラー文書画像を圧縮す
る事で得られる圧縮データのサイズを抑えること。 【解決手段】 テキスト部色抽出部204でカラー文書
画像201の各テキスト領域毎に用いられている色を抽
出し、画像結合部205で同色が用いられていると判断
されたテキスト領域を包含する領域の画像(包含画像)
を生成し、2値画像圧縮部206で、包含画像に対して
圧縮を施す。一方、文字部塗りつぶし部207では、カ
ラー文書画像201において、領域解析部203で解析
されたテキスト領域を所定の色で塗りつぶした画像(下
地画像)を生成する。そして下地画像圧縮部208は文
字部塗りつぶし部207で生成された下地画像を圧縮す
る。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、カラー文書画像を
圧縮する画像圧縮装置及び画像圧縮方法並びにプログラ
ムコード、記憶媒体に関するものである。
【0002】
【従来の技術】近年、スキャナの普及により文書の電子
化が進んでいる。電子化された文書をフルカラーで所有
すると300dpiでA4サイズの場合、約24Mバイ
トになり、保有するにもメモリを逼迫するし、メール添
付などで他人に送信できるサイズではない。フルカラー
画像圧縮にはJPEGが知られている。JPEGは写真
などの自然画像を圧縮するには非常に効果も高く、画質
も良いが、文字部などの高周波部分をJPEG圧縮する
とモスキートノイズと呼ばれる画像劣化が発生し、圧縮
率も悪い。そこで原画像に対して領域分割を行い、文字
領域を抜いた下地部分のJPEG圧縮画像と、色情報付
き文字領域部分のMMR圧縮画像を作成する。
【0003】しかし、上記方法では例えば、黒文字の文
章中の赤で示した強調文字の情報が欠落してしまう等、
2色以上を用いた文字部を含む画像を上記圧縮方法で圧
縮し、この圧縮した画像を伸長した場合、伸長後の画像
に含まれる文字部は1色とされてしまう。
【0004】それに対しカラー文書画像を画質劣化少な
く高圧縮する方式として、以下の方法があった。まず、
カラー文書画像に対して2値化処理を行い、2値画像を
得る。そして2値画像から文字領域を検出する。具体的
には、2値画像中の黒画素の輪郭線追跡を行い、すべて
の黒領域に対してラベル付けする。そしてラベル付けさ
れた黒領域を検索し、黒領域中の文字らしい領域を判定
する。そして2値画像の黒の領域に該当する原画像中の
領域を黒の領域の周囲の色で塗りつぶし、画像Aを作成
する。そして画像Aを縮小した画像BをJPEG圧縮す
る。そして、2値画像の黒の領域に該当する原画像(カ
ラー文書画像)の領域の色を算出し、複数のパレットを
作成する。またパレットに従って原画像に対して減色処
理を行い、減色画像を生成する。減色画像が1ビットで
あるときには、減色画像をMMR圧縮する。減色画像が
2ビット以上であるときには、減色画像を可逆圧縮す
る。
【発明が解決しようとする課題】しかしながら従来の方
式では画像中に多くのテキスト部が存在した場合にテキ
スト領域の部分的圧縮サイズは小さいがその部分画像の
位置座標や色情報(パレット)等のヘッダ情報がそれぞ
れに付随して加わるため、結果的に圧縮サイズが大きく
なるという欠点があった。例えば全面に表が配置された
画像の場合には表の各セルがテキスト領域として処理さ
れるため圧縮後のファイルサイズが大きくなってしま
う。
【0005】本発明は以上の問題に鑑みてなされたもの
であり、テキスト領域を含むカラー文書画像を圧縮する
事で得られる圧縮データのサイズを抑えることを目的と
する。
【0006】
【課題を解決するための手段】本発明の目的を達成する
ために、例えば本発明の画像圧縮装置は以下の構成を備
える。
【0007】すなわち、カラー文書画像を圧縮する画像
圧縮装置であって、前記カラー文書画像に含まれるテキ
スト領域の色を抽出する抽出手段と、前記テキスト領域
において、所定の色範囲内で同一色を有すると見なされ
るテキスト領域を包含する包含画像と、当該包含画像に
関する情報とを生成する生成手段と、前記包含画像及び
/又は前記テキスト領域に対して圧縮を行う圧縮手段と
を備える。
【0008】更に、前記カラー文書画像に対して2値化
処理を行い、2値画像を生成する2値化手段を備え、前
記抽出手段は前記2値画像からテキスト領域を特定し、
前記カラー文書画像において、前記テキスト領域に該当
する領域に含まれる色を抽出する。
【0009】また、前記生成手段は更に、所定の色範囲
内で同一色を有すると見なされるテキスト領域のうち、
注目テキスト領域に結合するテキスト領域を決定する決
定手段を備え、前記注目テキスト領域と、前記決定手段
が決定したテキスト領域とを包含する包含画像と、当該
包含画像に関する情報を生成する。
【0010】更に、前記カラー文書画像において、テキ
スト領域を所定の色で塗りつぶした下地画像を生成する
下地画像生成手段と、前記下地画像を圧縮する下地画像
圧縮手段とを備える。
【0011】
【発明の実施の形態】以下添付図面を参照して、本発明
を好適な実施形態に従って詳細に説明する。
【0012】[第1の実施形態]図1に本実施形態にお
ける画像圧縮装置の基本構成を示す。101はCPU
で、RAM102やROM103に格納されたプログラ
ムやデータを用いて本装置全体の制御を行うと共に、後
述の画像圧縮処理を行う。102はRAMで、外部記憶
装置104や記憶媒体ドライブ109からロードされた
プログラムやデータ、画像入力装置108から入力され
た画像データなどを一時的に記憶するエリアを備えると
共に、CPU101が各種の処理を実行する際に用いる
ワークエリアも備える。103はROMで、本装置全体
の制御プログラムやブートプログラム、本装置の設定デ
ータ等を格納する。104はハードディスクなどの外部
記憶装置で、記憶媒体ドライブ109からロードされた
プログラムやデータなどを保存することができる。ま
た、ワークエリアのサイズがRAM102のサイズを越
えた場合、越えた分のエリアをファイルとして提供する
こともできる。105,106は夫々キーボード、マウ
スで、ポインティングデバイスとして機能し、各種の指
示を本装置に入力することができる。
【0013】107は表示装置で、CRTや液晶画面な
どにより構成されており、画像情報や文字情報を表示す
ることができる。108は画像入力装置で、スキャナや
ディジタルカメラなどにより構成されており、画像をデ
ータとして入力することができる。尚、画像入力装置1
08は本装置と接続するためのインターフェースを含
む。109は記憶媒体ドライブで、CD−ROMドライ
ブ、DVD−ROMドライブ、フロッピー(登録商標)
ディスク(FD)ドライブ等により構成されており、C
D−ROMやDVD−ROMやFD等の記憶媒体からプ
ログラムやデータなどを読み込むことができる。110
は上述の各部を繋ぐバスである。
【0014】図2に本実施形態における画像圧縮装置の
機能構成を示す。201はカラーの文書画像で、画像2
01に含まれる文字部(テキスト部)には、複数の色が
用いられている。202は2値化部で、カラー文書画像
201を2値化処理し、2値画像を生成する。203は
領域解析部で、2値画像におけるテキスト領域を特定
し、2値画像におけるテキスト領域の位置やサイズなど
の情報(テキスト情報)を生成する。テキスト領域の特
定方法として、例えば、2値画像中の黒画素の輪郭線追
跡を行い、すべての黒領域に対してラベル付けし、ラベ
ル付けされた黒領域を検索し、黒領域中の文字らしい領
域(すなわち、テキスト領域と思われる領域)を特定す
る方法が挙げられるが、これに限定されるものではな
い。
【0015】204はテキスト部色抽出部で、各テキス
ト領域毎に、用いられている色を抽出する。205は画
像結合部で、同色が用いられていると判断されたテキス
ト領域を包含する領域の画像(以下、包含画像)を生成
する。206は2値画像圧縮部で、画像結合部205で
生成された包含画像、及び/又はテキスト領域に対して
圧縮を施す。207は文字部塗りつぶし部で、カラー文
書画像201において、領域解析部203で解析された
テキスト領域を所定の色で塗りつぶした画像(以下、下
地画像)を生成する。この所定の色は予め決められた色
でも良いし、テキスト領域の周辺の画素の平均値でも良
い。208は下地画像圧縮部で、文字部塗りつぶし部2
07で生成された下地画像を圧縮する。
【0016】尚、図2に示した機能構成に従ったプログ
ラムコードを記憶媒体に格納し、この記憶媒体を記憶媒
体ドライブ109を介して図1に示した画像圧縮装置に
(記憶媒体ドライブ108を介して)読み込ませてもよ
い。この場合、読み込んだプログラムをCPU101が
実行することで、図1に示した構成を備える画像圧縮装
置は図2に示した機能構成を有する装置として動作す
る。
【0017】図2の機能構成図を用いて本実施形態にお
けるカラー文書画像の圧縮方法について説明する。
【0018】まず、外部記憶装置104もしくは、画像
入力装置108もしくは、記憶媒体ドライブ109のい
ずれかから、カラー文書画像201をRAM102に読
み込む。本実施形態ではこのカラー文書画像201とし
て図3Aに示す画像を用いる。
【0019】次に、RAM102に読み込まれたカラー
文書画像201に基づいて、2値化部202は2値画像
を生成する。2値画像を生成する方法は特に限定される
ものではないが、本実施形態では以下の方法を用いる。
まず、カラー文書画像201における輝度データのヒス
トグラムを取り、2値化閾値Tを算出する。この算出方
法はここでは特には限定しないが、例えばヒストグラム
の中間値となる輝度値をこの閾値Tとしてもよい。そし
て2値化閾値Tを用いてカラー文書画像201を2値化
し、2値画像を作成する。生成された2値画像はRAM
102内において、カラー文書画像201が記憶されて
いるエリアとは別のエリアに記憶される。
【0020】次に、領域解析部203は上述の2値画像
を参照して上述の方法で、テキスト領域を特定する。そ
の際に上述のテキスト情報を生成する。領域解析部20
3によって領域解析される対象を図3Aに示した画像と
した場合、その結果を図3Bに示す。同図ではテキスト
領域としてTEXT1〜TEXT5が特定されており、
夫々の領域に対してテキスト情報が生成される。このテ
キスト情報はテキスト部色抽出部204と、文字部塗り
つぶし部207に出力される。
【0021】テキスト部色抽出部204は、テキスト情
報を参照してカラー文書画像201におけるテキスト領
域を特定し、特定したテキスト領域における色、つま
り、テキスト領域内の文字の色を抽出する。図3Bにお
いて、本実施形態ではTEXT1とTEXT3の領域は
赤の文字、TEXT2とTEXT4の領域は黒の文字、
TEXT5は青の文字とする。テキスト部色抽出部20
4により抽出された各テキスト領域の色はパレット情報
として生成される。
【0022】画像結合部205は、テキスト部色抽出部
204により抽出された各テキスト領域TEXT1〜T
EXT5における色を前述のパレット情報を参照して、
同じ色を用いているテキスト領域を結合する。この場
合、TEXT1とTEXT3は同じ色を用いた文字を含
んでいるので、これらの領域を包含する領域の画像(包
含画像)を生成する。ここで、TEXT1とTEXT3
とを包含する領域の画像(包含画像)を生成すること
を、「TEXT1とTEXT3とを結合する」と呼ぶこ
とにする。この包含画像を図3Cにおいて、TEXT
1’で示す。尚、この包含画像内の画素は、文字の部分
以外は単色の画素値を有する。TEXT2とTEXT4
についても同様である。なお、TEXT2とTEXT4
とを包含する包含画像は図3Cにおいて、TEXT2’
で示す。また、包含画像TEXT1’、TEXT2’の
詳細を夫々図3Dに示す。また、画像結合部205は各
包含画像の(2値画像もしくはカラー文書画像201に
おける)位置、サイズを含む包含画像情報を生成する。
【0023】また、画像結合部205において同じ色を
用いているテキスト領域を特定する方法について説明す
る。テキスト領域内におけるテキストの色がRGB各8
ビットであった場合、RGB各2ビット、もしくは3ビ
ットといったように、予め決められた色範囲に減色す
る。そして各テキスト領域をこのように減色しておい
て、同一色になるかどうかを判断する。どの程度まで減
色するかは圧縮した画像にどの程度階調性を持たせたい
かによって決まる。例えば人の目の青色に対する感度が
低いことを利用してRGBを夫々2ビット、2ビット、
1ビットとしてもよいし、RGBを夫々3ビット、3ビ
ット、2ビットとしてもよい。
【0024】また、より正確に同色の判定を行いたい場
合はRGB形式ではなく、より色差を比較しやすいLA
B形式やYCrCb形式に変換して、2ビットや3ビッ
トに丸めて用いると良い。説明するとRGB形式では黒
色を灰及び暗い青色とそれぞれ比較した場合には距離的
に暗い青色が近くなるが、LABやYCrCb形式では
輝度成分と色成分が分かれているため黒色と暗い青色の
分離が可能となる。
【0025】またスキャンされた文字の色と多少異なる
が、黒文字などの輝度の低い色の場合は同色のテキスト
領域内の最も輝度の低い色を採用し、逆に白文字などの
輝度の高い色の場合は同色のテキスト領域内の最も輝度
の高い色を採用すると入力画像の再現性は多少低くなる
が見た目が良くなる。
【0026】2値画像圧縮部206は、各包含画像及び
/又はテキスト領域を圧縮するが、複数色を有するテキ
スト領域も存在する可能性がある。よってテキスト領域
に対して圧縮を行う場合、このテキスト領域が1つの色
を有するか複数の色を有するかに応じて圧縮方法を変更
する。これはテキスト領域のパレット情報を参照するこ
とで決定する。このパレット情報を参照した結果、注目
テキスト領域が1つの色のみを有している場合、この注
目テキスト領域に対してMMR圧縮を行い、注目テキス
ト領域が複数の色を有する場合、この注目テキスト領域
に対して可逆圧縮を行う。また、圧縮結果には上述のパ
レット情報とテキスト情報をヘッダとして添付する。
【0027】一方、包含画像を圧縮する際には、MMR
圧縮を用いる。またこの圧縮結果には、この包含画像の
パレット情報と包含画像情報をヘッダとして添付する。
尚、パレット情報は各テキスト領域毎に存在するが、包
含画像内のテキスト領域は全て同じパレット情報を有す
る。よって、包含画像のパレット情報として、包含画像
内のテキスト領域のいずれか1つのパレット情報を用い
ればよい。
【0028】このようにすることで、各テキスト領域を
圧縮すると5つのヘッダ(TEXT1〜TEXT5に対
するヘッダ)が作成されるのに対して、本実施形態では
3つのヘッダ(TEXT1’、TEXT2’、TEXT
5に対するヘッダ)が作成されることになる。その結
果、ヘッダの数を減らすことができ、結果として圧縮後
のデータのサイズが減ることになる。
【0029】一方、文字部塗りつぶし部207は、テキ
スト情報を用いてカラー文書画像201におけるテキス
ト領域を特定して、特定したテキスト領域を所定の色で
塗りつぶした画像(下地画像)を生成する。この下地画
像を図3Eに示す。この所定の色は予め決められた色で
も良いし、カラー文書画像201におけるテキスト領域
の周辺の画素の平均値でも良い。
【0030】そして下地画像圧縮部208は、文字部塗
りつぶし部207で生成された画像(下地画像)に対し
てJPEG圧縮を行う。
【0031】以上の説明の通り、本実施形態の画像圧縮
装置及び画像圧縮方法によって、テキスト領域を多く含
むカラー文書画像を圧縮する場合でも、同じ色を有する
テキスト領域を包含する画像を生成し、この画像を圧縮
するので、圧縮後の画像に添付されるヘッダの数を減ら
すことができる。又、同時に、圧縮後のデータのサイズ
を減らすことができる。
【0032】[第2の実施形態]第1の実施形態では、
同一色を有するテキスト領域は同じ包含画像に含まれ、
MMR圧縮される。しかし同一色を有してはいるが、離
れた小さなテキスト領域をこの包含画像に含ませる場合
に、逆に圧縮後のサイズが大きくなる場合がある。本実
施形態ではこのような場合の画像圧縮方法について、以
下説明する。
【0033】本実施形態における画像圧縮装置の機能構
成は、図2に示した機能構成図において画像結合部20
5における処理が第1の実施形態とは異なる。よって、
本実施形態における画像結合部205の処理を図4を用
いて説明する。
【0034】図4は本実施形態の画像結合部205にお
ける具体的な処理のフローチャートである。
【0035】まず、画像結合部205で、同一色である
と判定されたテキスト領域群の中から基準となる一つの
テキスト領域(以下、基準テキスト領域)を選択する
(ステップS401)。もしテキスト領域がなければ、
もしくは全テキスト領域に対して後述の処理を終えたの
であれば(ステップS402)、本処理を終了する。一
方、未処理のテキスト領域が有れば、処理をステップS
403に進める。
【0036】基準テキスト領域の近傍のテキスト領域で
あって、同一色のテキスト領域を検索し(ステップS4
03)、この条件に合致する適する領域が有れば、処理
をステップS404に進め、この条件に合致するテキス
ト領域であって、基準テキスト領域に最も近いテキスト
領域(以下、近傍テキスト領域)を選択する(ステップ
S404)。一方、上述の条件に合致したテキスト領域
が存在しなければ、処理をステップS409に進め、後
述のステップS408で基準テキスト領域と結合したと
見なされたテキスト領域を包含する包含画像を作成する
(ステップS409)。
【0037】次に、基準テキスト領域と近傍テキスト領
域とを包含する包含画像矩形を決定する(ステップS4
05)。そして、基準テキスト領域、近傍テキスト領域
の夫々を圧縮した場合に、夫々の圧縮データの合計サイ
ズと、包含画像を圧縮した場合の圧縮サイズを推定する
(ステップS406)。ここで実際に圧縮を施して正確
なサイズを出す方法もあるが、以下の方法で簡易的に算
出すれば圧縮サイズの精度は落ちるが処理時間を軽減で
きる。予め測定していたテキスト領域の圧縮率Aを用い
て、2つの領域(基準テキスト領域と近傍テキスト領
域)を夫々圧縮した場合に、その合計サイズは、以下の
式で推定することができる。
【0038】圧縮サイズ1=(基準テキスト領域の面積
+近傍テキスト領域の面積)×A+2×ヘッダサイズ 一方、包含画像を圧縮する場合、包含画像に含まれる2
つの領域、基準テキスト領域と近傍テキスト領域には必
ず隙間部分が生じる。この部分は単一の画素値を表すデ
ータで埋められており、テキスト領域を圧縮した場合に
比べではるかに高圧縮率で圧縮できる。この圧縮率をB
とすると 圧縮サイズ2=(テキスト領域の面積)×A+(隙間部
分の面積)×B+ヘッダサイズ となる。
【0039】そして、上述の推定結果を用いて圧縮サイ
ズ1と圧縮サイズ2の比較を行い、圧縮サイズ2の方が
小さい、つまり、包含画像を圧縮した方が、各領域を別
々に圧縮するよりも、発生する圧縮データのサイズが小
さくなる場合(ステップS407)、処理をステップS
408に進め、結合リストに基準テキスト領域と近傍テ
キスト領域とを同じ包含画像に含める(結合する)こと
を示すデータを追加する(ステップS408)。
【0040】図5に結合リストの例を示す。同図では、
基準テキスト領域をTEXT2とした場合の結合リスト
の構成例を示したものであり、TEXT2と、各テキス
ト領域TEXT1〜TEXT5との対応が示されてい
る。同図において、0は結合していないことを示す符号
で、1は結合していることを示している符号、999が
無効(自身とは結合できない)を示す符号である。結合
リストには最初全て結合していないことを示す符号(同
図では0)がセットされており、ステップS408にお
ける処理を実行したときのみ、結合していることを示す
符号(同図では1)に変更される。
【0041】一方、圧縮サイズ2の方が大きい、つま
り、包含画像を圧縮した方が、各領域を別々に圧縮する
よりも、発生する圧縮データのサイズが大きくなる場合
(ステップS407)、処理をステップS403に戻
し、次の近傍テキスト領域を検索する。
【0042】以上の処理が一巡し、基準テキスト領域と
近傍テキスト領域が結合された場合、再び行われるステ
ップS403以降の処理では、一度選択されたテキスト
領域以外であって、基準テキスト領域と同一色であっ
て、基準テキスト領域に最も近いテキスト領域を新たな
近傍テキスト領域とする(ステップS403,ステップ
S404)。そして、基準テキスト領域と前回の近傍テ
キスト領域、そして今回の近傍テキスト領域とを含む包
含画像(第2の包含画像)矩形を決定し(ステップS4
05)、第2の包含画像と今回の近傍テキスト領域につ
いて、上述の式を用いて圧縮サイズ1,圧縮サイズ2を
推定する(ステップS406)。具体的には以下のよう
な式になる。
【0043】圧縮サイズ1=(第2の包含画像の面積+
近傍テキスト領域の面積)×A+2×ヘッダサイズ 圧縮サイズ2=(テキスト領域の面積)×A+(隙間部
分の面積)×B+ヘッダサイズ そして上述のステップS407以降の処理を行う。この
ようにすることで、最も多くのテキスト領域を含み、且
つ圧縮後のサイズが最も小さい包含画像の作成を行うこ
とができる。
【0044】[他の実施形態]また、本発明は上記実施
形態を実現する為の装置及び方法のみに限定されるもの
ではなく、上記システム又は装置内のコンピュータ(C
PUあるいはMPU)に、上記実施形態を実現する為の
ソフトウェアのプログラムコードを供給し、このプログ
ラムコードに従って上記システムあるいは装置のコンピ
ュータが上記各種デバイスを動作させることにより上記
実施形態を実現する場合も本発明の範疇に含まれる。
【0045】またこの場合、ソフトウェアのプログラム
コード自体が上記実施形態の機能を実現することにな
り、そのプログラムコード自体、及びそのプログラムコ
ードをコンピュータに供給する為の手段、具体的には上
記プログラムコードを格納した記憶媒体は本発明の範疇
に含まれる。
【0046】この様なプログラムコードを格納する記憶
媒体としては、例えばフロッピーディスク、ハードディ
スク、光ディスク、光磁気ディスク、CD−ROM、磁
気テープ、不揮発性のメモリカード、ROM等を用いる
ことができる。
【0047】また、上記コンピュータが、供給されたプ
ログラムコードのみに従って各種デバイスを制御するこ
とにより、上記実施形態の機能が実現される場合だけで
はなく、上記プログラムコードがコンピュータ上で稼働
しているOS(オペレーティングシステム)、あるいは
他のアプリケーションソフト等と共同して上記実施形態
が実現される場合にもかかるプログラムコードは本発明
の範疇に含まれる。
【0048】更に、この供給されたプログラムコード
が、コンピュータの機能拡張ボードやコンピュータに接
続された機能拡張ユニットに備わるメモリに格納された
後、そのプログラムコードの指示に基づいてその機能拡
張ボードや機能格納ユニットに備わるCPU等が実際の
処理の一部又は全部を行い、その処理によって上記実施
形態が実現される場合も本発明の範疇に含まれる。
【0049】
【発明の効果】以上の説明により、本発明によって、所
定の色範囲内で同じ色を有するテキスト領域を包含する
包含画像、及びこの包含画像のヘッダを生成すること
で、テキスト領域毎に設けられたヘッダの数を包含画像
のヘッダの数に減らすことができる。その結果、テキス
ト領域を含むカラー文書画像を圧縮する事で得られる圧
縮データのサイズを抑えることができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における画像圧縮装置
の基本構成を示す図である。
【図2】本発明の第1の実施形態における画像圧縮装置
の機能構成を示す図である。
【図3A】カラー文書画像201を示す図である。
【図3B】領域解析部203により特定したカラー文書
画像201のテキスト領域を示す図である。
【図3C】包含画像を示す図である。
【図3D】TEXT1’、TEXT2’の詳細を示す図
である。
【図3E】下地画像を示す図である。
【図4】本発明の第2の実施形態の画像結合部205に
おける具体的な処理のフローチャートである。
【図5】結合リストの例を示す図である。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/40 H04N 1/46 Z 1/46 1/40 F Fターム(参考) 5C077 LL20 MP08 PP27 PP28 PP32 PP34 PP36 RR02 5C078 AA09 BA22 BA57 CA03 DA01 DB00 5C079 HB01 HB04 HB08 LA02 LA06 LA10 LA27 LA31 LA34 NA10 NA11 5J064 AA02 BA08 BB12 BC25 BD04 5L096 AA02 AA06 FA15 FA44

Claims (21)

    【特許請求の範囲】
  1. 【請求項1】 カラー文書画像を圧縮する画像圧縮装置
    であって、 前記カラー文書画像に含まれるテキスト領域の色を抽出
    する抽出手段と、 前記テキスト領域において、所定の色範囲内で同一色を
    有すると見なされるテキスト領域を包含する包含画像
    と、当該包含画像に関する情報とを生成する生成手段
    と、 前記包含画像及び/又は前記テキスト領域に対して圧縮
    を行う圧縮手段とを備えることを特徴とする画像圧縮装
    置。
  2. 【請求項2】 更に、前記カラー文書画像に対して2値
    化処理を行い、2値画像を生成する2値化手段を備え、 前記抽出手段は前記2値画像からテキスト領域を特定
    し、前記カラー文書画像において、前記テキスト領域に
    該当する領域に含まれる色を抽出することを特徴とする
    請求項1に記載の画像圧縮装置。
  3. 【請求項3】 前記抽出手段は、前記2値画像における
    テキスト領域の位置、テキスト領域のサイズを含むテキ
    スト情報を生成することを特徴とする請求項2に記載の
    画像圧縮装置。
  4. 【請求項4】 前記抽出手段は、テキスト領域から抽出
    した色を当該テキスト領域のパレット情報として生成す
    ることを特徴とする請求項2に記載の画像圧縮装置。
  5. 【請求項5】 前記生成手段は、テキスト領域内の色に
    対して減色処理を施し、減色処理した色において同一色
    を有すると見なされるテキスト領域を包含する包含画像
    と、当該包含画像に関する情報とを生成することを特徴
    とする請求項1に記載の画像圧縮装置。
  6. 【請求項6】 前記包含画像に関する情報は、前記カラ
    ー文書画像における前記包含画像の位置、前記包含画像
    のサイズを含むことを特徴とする請求項5に記載の画像
    圧縮装置。
  7. 【請求項7】 前記生成手段は更に、所定の色範囲内で
    同一色を有すると見なされるテキスト領域のうち、注目
    テキスト領域に結合するテキスト領域を決定する決定手
    段を備え、 前記注目テキスト領域と、前記決定手段が決定したテキ
    スト領域とを包含する包含画像と、当該包含画像に関す
    る情報を生成することを特徴とする請求項1乃至6のい
    ずれか1項に記載の画像圧縮装置。
  8. 【請求項8】 前記決定手段は、 前記注目テキスト領域、もしくは前記注目テキスト領域
    を含む包含画像を圧縮した際に推定される圧縮サイズ
    と、前記テキスト領域を圧縮した際に推定される圧縮サ
    イズとの合計により得られる第1の圧縮サイズと、 前記注目テキスト領域、もしくは前記注目テキスト領域
    を含む包含画像と前記テキスト領域とを包含する包含画
    像を圧縮した際に推定される第2の圧縮サイズとを求
    め、 前記第2の圧縮サイズが前記第1の圧縮サイズよりも小
    さい場合、前記テキスト領域を前記注目テキスト領域に
    結合することを特徴とする請求項7に記載の画像圧縮装
    置。
  9. 【請求項9】 前記生成手段は、所定の色範囲内で同一
    色を有すると見なされるテキスト領域のうち、注目テキ
    スト領域に結合するテキスト領域を示す結合リストを生
    成し、当該結合リストを参照することで、前記注目テキ
    スト領域と、前記決定手段が決定したテキスト領域とを
    包含する包含画像と、当該包含画像に関する情報を生成
    することを特徴とする請求項1乃至8のいずれか1項に
    記載の画像圧縮装置。
  10. 【請求項10】 前記圧縮手段は包含画像及び/又は1
    つの色を有するテキスト領域に対してMMR圧縮を行う
    ことを特徴とする請求項1に記載の画像圧縮装置。
  11. 【請求項11】 前記圧縮手段は複数の色を有するテキ
    スト領域に対して可逆圧縮を行うことを特徴とする請求
    項1に記載の画像圧縮装置。
  12. 【請求項12】 更に、前記カラー文書画像において、
    テキスト領域を所定の色で塗りつぶした下地画像を生成
    する下地画像生成手段と、 前記下地画像を圧縮する下地画像圧縮手段とを備えるこ
    とを特徴とする請求項1乃至11のいずれか1項に記載
    の画像圧縮装置。
  13. 【請求項13】 前記下地画像生成手段は、前記テキス
    ト領域を前記テキスト情報を参照することで特定するこ
    とを特徴とする請求項12に記載の画像圧縮装置。
  14. 【請求項14】 前記下地画像生成手段は、前記テキス
    ト領域を前記カラー文書画像の前記テキスト領域周辺の
    画素の平均値で塗りつぶすことを特徴とする請求項12
    に記載の画像圧縮装置。
  15. 【請求項15】 前記下地画像圧縮手段は、前記下地画
    像に対してJPEG圧縮を行うことを特徴とする請求項
    12に記載の画像圧縮装置。
  16. 【請求項16】 カラー文書画像を圧縮する画像圧縮方
    法であって、 前記カラー文書画像に含まれるテキスト領域の色を抽出
    する抽出工程と、 前記テキスト領域において、所定の色範囲内で同一色を
    有すると見なされるテキスト領域を包含する包含画像
    と、当該包含画像に関する情報とを生成する生成工程
    と、 前記包含画像及び/又は前記テキスト領域に対して圧縮
    を行う圧縮工程とを備えることを特徴とする画像圧縮方
    法。
  17. 【請求項17】 更に、前記カラー文書画像に対して2
    値化処理を行い、2値画像を生成する2値化工程を備
    え、 前記抽出工程では前記2値画像からテキスト領域を特定
    し、前記カラー文書画像において、前記テキスト領域に
    該当する領域に含まれる色を抽出することを特徴とする
    請求項16に記載の画像圧縮方法。
  18. 【請求項18】 前記生成工程は更に、所定の色範囲内
    で同一色を有すると見なされるテキスト領域のうち、注
    目テキスト領域に結合するテキスト領域を決定する決定
    工程を備え、 前記注目テキスト領域と、前記決定工程で決定したテキ
    スト領域とを包含する包含画像と、当該包含画像に関す
    る情報を生成することを特徴とする請求項16又は17
    に記載の画像圧縮方法。
  19. 【請求項19】 更に、前記カラー文書画像において、
    テキスト領域を所定の色で塗りつぶした下地画像を生成
    する下地画像生成工程と、 前記下地画像を圧縮する下地画像圧縮工程とを備えるこ
    とを特徴とする請求項16乃至18のいずれか1項に記
    載の画像圧縮方法。
  20. 【請求項20】 請求項16乃至19のいずれか1項に
    記載の画像圧縮方法を実行するプログラムコード。
  21. 【請求項21】 請求項20に記載のプログラムコード
    を格納し、コンピュータが読み取り可能な記憶媒体。
JP2001202450A 2000-08-25 2001-07-03 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体 Expired - Fee Related JP4693289B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2001202450A JP4693289B2 (ja) 2001-07-03 2001-07-03 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
US09/931,890 US7133565B2 (en) 2000-08-25 2001-08-20 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001202450A JP4693289B2 (ja) 2001-07-03 2001-07-03 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体

Publications (3)

Publication Number Publication Date
JP2003018413A true JP2003018413A (ja) 2003-01-17
JP2003018413A5 JP2003018413A5 (ja) 2008-08-21
JP4693289B2 JP4693289B2 (ja) 2011-06-01

Family

ID=19039252

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001202450A Expired - Fee Related JP4693289B2 (ja) 2000-08-25 2001-07-03 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体

Country Status (1)

Country Link
JP (1) JP4693289B2 (ja)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006050548A (ja) * 2004-07-05 2006-02-16 Matsushita Electric Ind Co Ltd 画像処理装置及び画像処理方法
JP2006270260A (ja) * 2005-03-22 2006-10-05 Fuji Xerox Co Ltd 画像処理装置
US7184589B2 (en) 2003-06-25 2007-02-27 Pfu Limited Image compression apparatus
US8014620B2 (en) 2006-08-24 2011-09-06 Fuji Xerox Co., Ltd. Image processing system, image compression system, image editing system, computer readable medium, computer data signal and image processing apparatus
JP2011211712A (ja) * 2010-03-29 2011-10-20 Toshiba Corp 画像形成装置およびその制御方法
US8422778B2 (en) 2009-05-21 2013-04-16 Sharp Kabushiki Kaisha Image compressing method, image compressing apparatus, image forming apparatus, computer program and computer readable medium
US8463032B2 (en) 2010-01-18 2013-06-11 Sharp Kabushiki Kaisha Image compressing apparatus, compressed image outputting apparatus, image compression method, and recording medium
US8515186B2 (en) 2005-12-26 2013-08-20 Canon Kabushiki Kaisha Image processor, image processing method and storage medium
US8792735B2 (en) 2010-04-15 2014-07-29 Sharp Kabushiki Kaisha Image compressing apparatus which extracts black text edge pixels from an image and compresses a layer with black text edge pixels extracted
USD969880S1 (en) 2019-09-25 2022-11-15 Raymond E. Bergeron Clamshell dredging bucket

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06223172A (ja) * 1993-01-22 1994-08-12 Canon Inc 画像処理方法および画像処理装置
JPH11261833A (ja) * 1998-03-11 1999-09-24 Fuji Xerox Co Ltd 画像処理装置、画像送信装置
JPH11308463A (ja) * 1998-04-17 1999-11-05 Sanyo Electric Co Ltd 画像処理装置及び画像処理方法
JP2000125111A (ja) * 1998-10-20 2000-04-28 Fujitsu Ltd 画像圧縮方法、画像復元方法、画像圧縮装置、画像読取装置、画像圧縮プログラム記憶媒体、および画像復元プログラム記憶媒体
JP2000350040A (ja) * 1999-06-07 2000-12-15 Minolta Co Ltd 画像処理装置および画像処理方法ならびに画像処理プログラムを記録した記録媒体

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH06223172A (ja) * 1993-01-22 1994-08-12 Canon Inc 画像処理方法および画像処理装置
JPH11261833A (ja) * 1998-03-11 1999-09-24 Fuji Xerox Co Ltd 画像処理装置、画像送信装置
JPH11308463A (ja) * 1998-04-17 1999-11-05 Sanyo Electric Co Ltd 画像処理装置及び画像処理方法
JP2000125111A (ja) * 1998-10-20 2000-04-28 Fujitsu Ltd 画像圧縮方法、画像復元方法、画像圧縮装置、画像読取装置、画像圧縮プログラム記憶媒体、および画像復元プログラム記憶媒体
JP2000350040A (ja) * 1999-06-07 2000-12-15 Minolta Co Ltd 画像処理装置および画像処理方法ならびに画像処理プログラムを記録した記録媒体

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7184589B2 (en) 2003-06-25 2007-02-27 Pfu Limited Image compression apparatus
JP2006050548A (ja) * 2004-07-05 2006-02-16 Matsushita Electric Ind Co Ltd 画像処理装置及び画像処理方法
JP4695914B2 (ja) * 2004-07-05 2011-06-08 パナソニック株式会社 画像処理装置及び画像処理方法
JP2006270260A (ja) * 2005-03-22 2006-10-05 Fuji Xerox Co Ltd 画像処理装置
JP4736489B2 (ja) * 2005-03-22 2011-07-27 富士ゼロックス株式会社 画像処理装置
US8515186B2 (en) 2005-12-26 2013-08-20 Canon Kabushiki Kaisha Image processor, image processing method and storage medium
US8014620B2 (en) 2006-08-24 2011-09-06 Fuji Xerox Co., Ltd. Image processing system, image compression system, image editing system, computer readable medium, computer data signal and image processing apparatus
US8422778B2 (en) 2009-05-21 2013-04-16 Sharp Kabushiki Kaisha Image compressing method, image compressing apparatus, image forming apparatus, computer program and computer readable medium
US8463032B2 (en) 2010-01-18 2013-06-11 Sharp Kabushiki Kaisha Image compressing apparatus, compressed image outputting apparatus, image compression method, and recording medium
JP2011211712A (ja) * 2010-03-29 2011-10-20 Toshiba Corp 画像形成装置およびその制御方法
US8792735B2 (en) 2010-04-15 2014-07-29 Sharp Kabushiki Kaisha Image compressing apparatus which extracts black text edge pixels from an image and compresses a layer with black text edge pixels extracted
USD969880S1 (en) 2019-09-25 2022-11-15 Raymond E. Bergeron Clamshell dredging bucket
USD969882S1 (en) 2019-09-25 2022-11-15 Raymond E. Bergeron Clamshell dredging bucket
USD969881S1 (en) 2019-09-25 2022-11-15 Raymond E. Bergeron Clamshell dredging bucket

Also Published As

Publication number Publication date
JP4693289B2 (ja) 2011-06-01

Similar Documents

Publication Publication Date Title
US7133565B2 (en) Image processing apparatus and method
JP4732250B2 (ja) 情報処理装置、制御方法、およびコンピュータプログラム
JP4016342B2 (ja) コード認識のための装置及びその方法
US6999619B2 (en) Processing for accurate reproduction of symbols and other high-frequency areas in a color image
US7386168B2 (en) Image processing apparatus
JP4366011B2 (ja) 文書処理装置及び方法
JP2008527852A (ja) ディジタル・カメラの画像のホワイト・バランス補正
US6377703B1 (en) Apparatus and method for determining an area encompassing an image for scanning the image
JP2003018412A (ja) 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
JPH10198802A (ja) 画像処理装置、画像処理方法および画像処理プログラムを記録した媒体
JP4693289B2 (ja) 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
JP2010056827A (ja) 画像処理装置および画像処理プログラム
US8971647B2 (en) Image compression apparatus, image compression method, and storage medium
JP2003244447A (ja) 画像処理装置及び画像処理方法
JP3673092B2 (ja) 画質調整装置及び画質調整方法、並びに画像調整用プログラムを記録した記録媒体
JP6892625B2 (ja) データ処理装置、および、コンピュータプログラム
JP6370080B2 (ja) 画像処理装置、画像処理方法及びプログラム。
JP2005346474A (ja) 画像処理方法及び装置及びプログラム及び記憶媒体
JP2003338935A (ja) 画像処理装置および方法
JP2006237657A (ja) 画像処理装置、画像補正プログラムおよび記録媒体
JP2000013596A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JP4659354B2 (ja) 画像処理方法および装置
JP2001045303A (ja) 画像2値化方法
JP2000013612A (ja) 画像処理装置および方法ならびに画像処理プログラムを記録した記録媒体
JP4228905B2 (ja) 画像処理装置及びプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20080703

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20080703

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20101129

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20101206

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20110128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20110218

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20110222

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140304

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4693289

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees