JP2002077631A - 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体 - Google Patents

画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体

Info

Publication number
JP2002077631A
JP2002077631A JP2000256133A JP2000256133A JP2002077631A JP 2002077631 A JP2002077631 A JP 2002077631A JP 2000256133 A JP2000256133 A JP 2000256133A JP 2000256133 A JP2000256133 A JP 2000256133A JP 2002077631 A JP2002077631 A JP 2002077631A
Authority
JP
Japan
Prior art keywords
image
character area
color
compression
character
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2000256133A
Other languages
English (en)
Other versions
JP4250316B2 (ja
JP2002077631A5 (ja
Inventor
Yukari Toda
ゆかり 戸田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2000256133A priority Critical patent/JP4250316B2/ja
Priority to US09/931,890 priority patent/US7133565B2/en
Publication of JP2002077631A publication Critical patent/JP2002077631A/ja
Publication of JP2002077631A5 publication Critical patent/JP2002077631A5/ja
Application granted granted Critical
Publication of JP4250316B2 publication Critical patent/JP4250316B2/ja
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Color Image Communication Systems (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Image Analysis (AREA)
  • Facsimile Image Signal Circuits (AREA)
  • Image Processing (AREA)
  • Editing Of Facsimile Originals (AREA)

Abstract

(57)【要約】 【課題】 画像中の文字領域内の色を損なうことなく圧
縮、伸長を行うこと。 【解決手段】 2値画像103から文字領域を検出し、
文字領域座標112を作成する。そして2値画像103
の黒の領域に該当する原画像中の領域を黒の領域の周囲
の色で塗りつぶし、画像Aを作成する。そして画像Aを
縮小した画像BをJPEG圧縮する。そして、2値画像
の黒の領域に該当する原画像の領域の色を算出し、複数
のパレット114を作成する。また減色部1082はパ
レット114に従って原画像に対して減色処理を行い、
減色画像を生成する。減色画像109が1ビットである
ときには、減色画像109をMMR圧縮する。減色画像
109が2ビット以上であるときには、減色画像109
を可逆圧縮する。

Description

【発明の詳細な説明】
【0001】
【発明の属する技術分野】本発明は、原画像に対して圧
縮処理を行う画像圧縮装置、当該画像圧縮装置が生成し
た圧縮データを伸長することで、当該圧縮データに含ま
れる下地画像と減色画像を復元する画像伸長装置、及び
その方法、並びに記憶媒体に関するものである。
【0002】
【従来の技術】近年、スキャナの普及により文書の電子
化が進んでいる。電子化された文書をフルカラーで所有
すると300dpiでA4サイズの場合約24Mバイト
になり、保有するにもメモリを逼迫するし、メイル添付
などで他人に送信できるサイズではない。フルカラー画
像圧縮にはJPEGが知られている。JPEGは写真な
どの自然画像を圧縮するには非常に効果も高く、画質も
良いが、文字部などの高周波部分をJPEG圧縮すると
モスキートノイズと呼ばれる画像劣化が発生し、圧縮率
も悪い。そこで領域分割を行い、文字領域を抜いた下地
部分のJPEG圧縮と、色情報付き文字領域部分のMM
R圧縮を作成し、伸長時は白部分はJPEG画像を透過
し、黒部分は代表文字色を載せて表現する方法があっ
た。
【0003】
【発明が解決しようとする課題】しかし、上記方法では
例えば、黒文字の文章中の赤で示した強調文字の情報が
欠落してしまう等、2色以上を用いた文字部を含む画像
を上記圧縮方法で圧縮し、この圧縮した画像を伸長した
場合、伸長後の画像に含まれる文字部は1色とされてし
まう。
【0004】本発明は上述の問題点に対して鑑みてなさ
れたものであり、画像中の文字領域内の色を損なうこと
なく圧縮、伸長を行うことを目的とする。
【0005】
【発明を解決するための手段】本発明の目的を達成する
ために、例えば本発明の画像圧縮装置は以下の構成を備
える。すなわち、原画像に対して圧縮処理を行う画像圧
縮装置であって、原画像に含まれる文字領域の位置を特
定する文字領域特定手段と、前記原画像において、当該
文字領域特定手段により特定された位置の文字領域内を
所定の色で埋めることで下地画像を生成する下地画像生
成手段と、前記文字領域特定手段により特定された位置
の文字領域内の色のパレットを生成するパレット生成手
段と、当該パレットに基づいて、文字領域内の画像に基
づいた減色画像を生成する減色画像生成手段とを備え、
前記減色画像と、前記下地画像とに対して異なる圧縮を
行う。
【0006】本発明の目的を達成するために、例えば本
発明の画像伸長装置は以下の構成を備える。すなわち、
上記画像圧縮装置が生成した圧縮データを伸長すること
で、当該圧縮データに含まれる下地画像と減色画像を復
元する画像伸長装置であって、前記圧縮データに含まれ
る、前記下地画像上における文字領域のパレットの数に
基づいて、当該文字領域内の画像を復元する画像復元手
段と、前記圧縮データに含まれる前記下地画像上の文字
領域の位置に、前記画像復元手段により復元された前記
画像を合成する合成手段とを備える。
【0007】
【発明の実施の形態】以下添付図面に従って、本発明を
好適な実施形態に従って詳細に説明する。
【0008】[第1の実施形態]以下、複数の色を有す
る文字領域を含む画像に対して圧縮を行う画像圧縮装
置、この圧縮された画像に対して伸長処理を行う画像伸
長装置について説明する。
【0009】まず始めに本実施形態における画像圧縮装
置について、当該画像圧縮装置の概略構成を示す図1を
用いて説明する。
【0010】101は原画像である。102は原画像を
入力し、画像の最適2値化を行う画像2値化部である。
103は画像2値化部により2値化された2値画像であ
る。104は2値画像103を入力して文字領域を検出
し、文字領域座標112を作成する文字領域検出部であ
る。
【0011】105は文字領域座標112を入力し、2
値画像103の黒の領域を特定すると共に、2値画像1
03の黒の領域に該当する原画像中の領域を抜いて、抜
いた領域を黒の領域の周囲の色で塗りつぶし、画像Aを
作成する文字部塗りつぶし部である。106は画像Aを
入力し、縮小して画像Bを作成する縮小部である。10
7は画像Bを入力し、JPEG圧縮して圧縮コードX1
13を作成するJPEG圧縮部である。
【0012】108は文字領域座標112を入力し、そ
の座標の原画像と2値画像103を参照しながら、2値
画像の黒の領域に該当する原画像の領域の色を算出し、
複数のパレット114を作成する文字色抽出部108で
ある。また文字色抽出部108は、更に内部に減色部1
082を有し、当該減色部1082は、前記パレット1
14に従って、原画像に対して減色処理を行う。109
は文字色抽出部108が有する減色部1082により減
色された、原画像101が有する複数の文字領域の減色
画像である。110は減色画像109が1ビットである
ときに、減色画像109を入力し、MMR圧縮して夫々
の減色画像109に応じた複数の圧縮コードY115を
作成するMMR圧縮部である。111は減色画像109
が2ビット以上であるときに、減色画像109を入力
し、可逆圧縮(例えばZIP圧縮)して夫々の減色画像
109に応じた複数の圧縮コードZ116を作成する可
逆圧縮部である。
【0013】以上の各部により生成される1Aでまとめ
た112から116までのデータが結合して、これが圧
縮データとなる。なお、文字領域が全て1ビットで表現
されている場合、圧縮コードZ116は生成されない。
また文字領域そのものが存在しない場合、圧縮データ1
Aに含まれるデータは圧縮コードX113のみとなる。
【0014】画像2値化部102に原画像101が入力
され、文字領域検出部104が文字領域座標112を出
力するまでの各処理のフローチャートを図3に示す。な
お本フローチャートに従ったプログラムコードは、本実
施形態における画像圧縮装置内の不図示のROMやRA
Mなどのメモリ内に格納され、不図示のCPUにより読
み出され実行されるものとする。
【0015】ステップS301にて原画像101(カラ
ー画像)を入力し、間引いて解像度を落しながら輝度変
換を行い、輝度画像Jを作成する。たとえば原画像がR
GB24ビット300dpiだとすると、縦方向、横方
向とも4画素ごとにY=0.299R+0.587G+
0.114Bの演算を行い、その結果生成された輝度画
像JはY8ビット75dpiの画像となる。
【0016】ステップS302にて輝度データのヒスト
グラムを取り、2値化閾値Tを算出する。この算出方法
はここでは特には限定しないが、例えばヒストグラムの
中間値となる輝度値をこの閾値Tとしてもよい。
【0017】ステップS303にて2値化閾値Tを用い
て輝度画像Jを2値化し、2値画像103を作成する。
【0018】ステップS304にて2値画像中の黒画素
の輪郭線追跡を行い、すべての黒領域に対してラベル付
けする。
【0019】ステップS305にてステップS304で
ラベル付けされた黒領域を検索し、黒領域中の文字らし
い領域を判定する。
【0020】ステップS306にて形や位置から結合す
るものを結合する。
【0021】ここで図3に示したフローチャートに従っ
た処理の一例を示す。たとえば図4に示すカラー原稿
(原画像101)を入力し、間引いて輝度変換したもの
のヒストグラムを取ると図5のようになる。このヒスト
グラムから平均、分散、などのデータを利用して閾値T
=150を算出し、算出された閾値Tを用いて図4に示
したカラー原稿(原画像101)を2値化した画像(2
値画像103)は図6のようになる。図6の黒画素の輪
郭線追跡を行い、すべてをラベリングして、たとえば、
横幅が閾値以下、または高さが閾値以下の黒画素の集ま
りのみ文字として許すと図7に示す黒画素の集まりが文
字領域となる。これらの文字領域の座標データが文字領
域座標112として不図示のRAMに格納される。
【0022】必要ならばこれらの黒画素の集まりを位置
の近さや横幅、高さの一致からグループ化していくと、
図8に示すような16個の文字領域が検出できる。この
文字領域も必要ならば不図示のRAMに格納しても良
い。
【0023】次に、2値画像103を利用した文字部塗
りつぶし部104の処理の一例を図10に示した原画像
例を用いて、図11に示した同処理のフローチャートを
用いて説明する。なお本フローチャートに従ったプログ
ラムコードは、本実施形態における画像圧縮装置内の不
図示のROMやRAMなどのメモリ内に格納され、不図
示のCPUにより読み出され実行されるものとする。
【0024】図10(a)は原画像である。この原画像
から図10(b)のような1つの文字領域の2値画像を
得たとする。本実施形態では原画像101を32×32
毎の領域(以下、パーツ)に分割し(ステップS110
1)、パーツごとに処理をおこなう。図10(c)にパ
ーツごとに分けた様子を示す。00から10までの6つ
のパーツはステップS1103の分岐により文字領域が
ないのでなにも処理が行われない。11のパーツにて、
ステップS1103の分岐によりステップS1104に
すすみ、2値画像103において11のパーツに対応す
る箇所を参照し、当該箇所の白部分(白画素)に対応す
る原画像101のRGB値(またはYUVでもなんでも
良い)の平均値ave_colorを算出する(ステッ
プS1104)。
【0025】ステップS1105にて、今度は2値画像
103において11のパーツに対応する箇所を参照し、
当該箇所中の黒部分(黒画素)に対応する原画像101
の部分のカラー値を、上記ave_colorとする。
【0026】以上の処理を文字領域の存在するパーツ1
2,13,21,22,23に対して繰り返し行う。他
のパーツは文字領域がないので何も処理が行われない。
このようにして、文字の存在した部分に当該文字の周囲
の画素の平均値を埋めることが出来る。本フローチャー
トの処理により、文字塗りつぶし部105は画像Aを生
成する。
【0027】次に、この画像Aは縮小部106において
縮小される。本実施形態ではこの縮小処理方法として単
純間引きとする。ちなみに、この縮小と文字部塗りつぶ
し処理は順番を逆にしても構わない。その場合2値画像
103と原画像101の位置のずれに気を付ける必要が
ある。
【0028】一方、減色部1082を含む文字色抽出部
108における処理のフローチャートを図12に示す。
【0029】ステップS1201では、抽出された色数
を表すカウンタnumを0にリセットする。抽出された
すべての文字領域ごとに処理を行うので、ステップS1
202では、未処理の文字座標があるかどうかチェック
し、あったらステップS1202にすすみ、無かったら
本処理を終了する。
【0030】ステップS1203では、2値画像103
において未処理の文字座標に位置する部分の細線化処理
を行い、スキャナ読み込み時の下地から文字部への変化
部にあたる黒を減らしていき、新しい2値画像newb
iを作成する。
【0031】次にステップS1204にてnewbiの
黒画素に対応する原画像のRGBの3次元ヒストグラム
を取る。この際、普通にヒストグラムをとると、たとえ
ば入力画像がRGB各8ビットだとすると、256×2
56×256のヒストグラムが必要になる。文字部に必
要なのは解像度であり、階調は必要ないこと、また、ス
キャナによる読み込み時のばらつきを押さえながら代表
色を算出するには多少の画素値の違いは無視した方が良
いこと、などを鑑みると、これほどの細かなヒストグラ
ムは必要ない。これらのことから本実施形態ではRGB
8ビット中上位5ビットのRGB3次元ヒストグラムを
とる。このヒストグラムをとる際は、その文字領域に存
在する黒画素の総数pixelnumも算出する。
【0032】また、本実施形態ではRGB空間を利用し
たが、YUVなど他の色空間でも構わない。また本実施
形態では3次元ヒストグラムをとったが、各色それぞれ
の1次元ヒストグラムを3つとってもかまわない。
【0033】次にステップS1205では、RGB3次
元ヒストグラムから最大値を算出する。本実施形態では
すでに上位5ビットのみのRGB3次元ヒストグラムを
取り、スキャナのばらつきによるノイズを押さえたが、
さらに、ヒストグラムの隣り合った値の合計の最大値を
とることにより、図13に示すような2つのヒストグラ
ムにまたがる本来の最大値を検出することが可能とな
る。具体的にいうと、3次元ヒストグラムなので、注目
点と、R方向で隣り合った2つ、G方向で隣り合った2
つ、B方向で隣り合った2つの計7つのヒストグラム値
の合計値の最大値を検出するなどが考えられる。このよ
うに検出された最大値をcolR[num],colG
[num],colB[num]に代入する。
【0034】ステップS1206では、ステップS12
05にて検出された最大値を中心に、例えば3ステップ
ずつ広げた正方形内を設定し、後述する処理の後この正
方形内に位置するヒストグラム値を0にする。正方形の
説明を図15に図示する。図15はRGB3次元ヒスト
グラムの様子で、黒点で示したものがcolR[nu
m],colG[num],colB[num]とす
る。その点を中心に3ステップずつ広げた合計7×7×
7が前述の正方形である。ここで3ステップというと、
上位5ビットのヒストグラムなので元のRGBの8ビッ
ト(256階調)で24ステップに値する。そしてこの
正方形内のヒストグラム値をpixelnumから引い
たあと、この正方形内のヒストグラム値に0を代入す
る。
【0035】ステップS1207ではnumを1つイン
クリメントする。
【0036】ステップS1208では、pixelnu
mがあらかじめ決められたthre1以上かどうかチェ
ックし、thre1以上であればステップS1205に
進み、未満であれば1202に進む。
【0037】以上の処理をすべての文字座標に繰り返す
ことにより、すべての文字領域のパレット114が作成
される。なお、このパレットのデータ中にはそのパレッ
トがどの文字領域のパレットであるかを特定するコード
が記載されている。
【0038】そして減色部1082は、この領域のパレ
ット数が1であったらば、入力された2値画像103の
文字領域部分を切り抜き、1部分2値画像を作成する。
それがその文字領域の減色画像となる。
【0039】一方、この領域のパレット数が2以上であ
る場合、減色部1082は原画像と2値画像から、文字
領域内の2値画像が黒である画素に対応する原画像の画
素値をパレットの値に振り分け、減色画像を作成する。
割り振られるビット数は、2値画像の白の部分として透
過を示すデータが必要となるので、パレット数が3のと
きは透過データの分を1つプラスして4となるので2ビ
ット。パレット数が4のときは透過データの分を1つプ
ラスして5となるので3ビットとなる。このビット数は
最終的に適応される画像フォーマットで表現出来るビッ
ト数に準じる。
【0040】この際たとえばパレット数が著しく多く、
多色化による画質向上、圧縮率向上の効果が見られない
と判断できる場合には多色化はやめ、下地画像として保
存することも考えられる。その場合は文字領域座標11
2からその文字領域を削除しなくてはならない。また、
文字部塗りつぶし部105の処理が行われる前に文字領
域座標112から削除しなければならない。
【0041】次に上述の各フローチャート(図3,1
1,12)に従った処理以降の処理である、圧縮データ
1Aを生成するフローチャートを図20に示す。なお本
フローチャートに従ったプログラムコードは、本実施形
態における画像圧縮装置内の不図示のROMやRAMな
どのメモリ内に格納され、不図示のCPUにより読み出
され実行されるものとする。
【0042】上述の通り作成された減色画像109が1
ビットの場合はこの減色画像109を文字色抽出部10
8からMMR圧縮部110に出力し(ステップS200
1)、このMMR圧縮部110においてMMR圧縮し、
圧縮コードY115を作成する(ステップS200
3)。また、減色画像109が2ビット以上の場合は可
逆圧縮部111にて可逆圧縮し、圧縮コードZ116を
作成する。
【0043】一方、JPEG圧縮部107は縮小画像B
105に対してJPEG圧縮を行い、圧縮コードX11
3を作成する(ステップS2004)。なお、ステップ
S2001〜S2003の処理と、ステップS2004
の処理は順番は逆でも良い。
【0044】そして、文字領域座標112、パレット1
14、圧縮コードX113、圧縮コードY115、圧縮
コードZ116のうち少なくとも一つ以上をまとめたフ
ォーマットを作成し、圧縮データ1Aを作成する(ステ
ップS2005)。この圧縮データ1Aのフォーマット
はここでは特には限定せず、単純に連結したデータ列を
まとめて圧縮データ1Aとしてもよい。
【0045】以上の説明により、本実施形態の画像圧縮
装置及びその方法は、複数の色を有する文字領域を含む
画像に対して圧縮を行った際、当該文字領域に複数の色
を許容して、圧縮データを生成することができる。
【0046】次に本実施形態における画像伸長装置につ
いて、本実施形態における画像圧縮装置により上述の通
り作成された圧縮データを伸長する前記画像伸長装置の
概略構成を、図2を用いて説明する。又、同時に本実施
形態における画像伸長装置が行う画像伸長処理のフロー
チャートを図16に示す。なお本フローチャートに従っ
たプログラムコードは、本実施形態における画像伸長装
置内の不図示のROMやRAMなどのメモリ内に格納さ
れ、不図示のCPUにより読み出され実行されるものと
する。
【0047】201は圧縮コードX113を入力し、J
PEG伸長処理を行い、(多値)画像Eを作成する(ス
テップS2101)JPEG伸長部である。202は画
像Eを入力し、拡大処理を行うことで、画像F203を
生成する(ステップS2102)拡大部である。203
は拡大部202により拡大された画像Fである。
【0048】204は圧縮コードY115を入力し、M
MR伸長処理を行い、2値画像G205を作成する(ス
テップS2103)MMR伸長部である。206は圧縮
コードZ116を入力し、(多色)画像H207を作成
する(ステップS2104)伸長部である。208は文
字領域座標112とそれに対応するパレット114およ
び2値画像G205または多色画像H207を入力し、
2値画像または多色画像の画素データが透過をあらわす
場合は画像F203の画素の色を、それ以外のときは対
応するパレット色を選択し最終的な画像である画像I2
09を作成する合体部である。
【0049】図14に合体部208における処理例を示
す。まず図14(a)にJPEG伸長部201による圧
縮コードX113のJPEG伸長結果を示す。なお、本
実施形態では文字領域は図14(b)のように、2値画
像1ビットで表現されていて、そのパレットはR=2
0、G=30、B=225とする。図14(b)の2値
画像を参照して、黒画素に対応する画像(図14
(a))上にパレット色(20、30、255)を有す
るデータをのせることで、最終的に図14(c)のよう
な画像が出来上がる(ステップS2105,ステップS
2107)。これが伸長画像I209となる。
【0050】一方、文字領域が多色画像の場合はパレッ
ト数が変わり(ステップS2105)、たとえば2ビッ
トなら00,01,10,11の4つの画素値に割り当
てられたパレットを選択し、当てはめていく(ステップ
S2106)。そのうち1つは透過を示し、たとえば0
0とすると、00の値をもつ画素は画像(図14
(a))の画素を選択する。
【0051】以上の説明により、本実施形態の画像伸長
装置及びその方法は、本実施形態の画像符号装置が圧縮
した圧縮データを伸長し画像を復元すると共に、当該画
像に含まれる文字領域が元々複数の色を有していた場
合、当該文字領域に対して複数の色を与えることができ
る。
【0052】[第2の実施形態]第1の実施形態では文
字領域検出部112においてカラー画像の2値化を行っ
たがその他にも、原画像に微分フィルタをかけ、すべて
の画素の近隣の画素とのエッジ量を算出し、そのエッジ
量を2値化することにより得られた2値画像を同様に輪
郭線追跡をして文字領域を検出する方法がある。この場
合、画像圧縮装置の概略構成は図17のようになる。
【0053】本実施形態では、2値画像は文字部塗りつ
ぶし部1707、文字色抽出部1710では使用できな
いので、文字領域ごとに2値画像を作成する。この2値
画像は例えば文字領域検出部1704にて算出した(第
1の実施形態と同様の)閾値Tにて第1の実施形態と同
様にして2値化しても良いし、文字領域ごとにヒストグ
ラムを取ってその文字領域により最適な2値化閾値を算
出しても良い。図5に示した全面のヒストグラムと比較
して、文字領域一部分の輝度ヒストグラムは図9のよう
なシンプルな形が期待できるので、閾値の決定は容易で
ある。901は下地色の集合であり、902は文字色の
集合である。
【0054】また、第1の実施形態では輝度の低い下地
に含まれる輝度の高い文字(反転文字)の処理が不可能で
あるが、この微分処理により文字領域を検出する領域分
割は反転文字領域の検出も可能となる。1702は微分
処理部であり、図18に示しような微分フィルタを注目
画素を中心にかけ、その絶対値が閾値を超えたら黒、超
えなかったら白というように2値化していく。図18
(a)は1次微分フィルタであり、上は横線を検出する
ことが出来、下は縦線を検出することが出来る。2つの
フィルタの絶対値の合計を利用すると斜め線を検出する
ことが出来る。また、斜め線用フィルタを利用しても良
い。図18(b)は二次微分フィルタで全方向に対応し
た物である。二次微分フィルタも横方向、縦方向、と作
成することも可能である。このようなフィルタを全画素
にかけ、微分2値画像1703を作成する。間引きなが
らフィルタをかけることによって同時に解像度を落すこ
とも可能である。以上のように作成された2値画像に図
3のステップS304以降の処理を行えば、反転文字も
含んだ文字領域座標を検出することが出来る。
【0055】また、2値化部1705も反転文字に対応
しなければならない。また図9のヒストグラムを有する
パターン以外にも、反転文字領域も文字領域として抽出
出来る本実施形態における画像圧縮装置の場合、図19
の3パターンのヒストグラムを有するパターンが主に入
ってくることになる。(b)は(a)に対する反転画像
(反転文字を有する)のヒストグラムであり、(c)が
グレー下地上に黒文字と白文字の2色が存在する場合の
画像のヒストグラムである。これらの3パタンを考えて
2値化部1705ではA点とB点を検出し、AとBに挟
まれた領域は白、その他は黒の二値化処理を行うと良
い。または、(c)のケースは考えずに、下地と文字部
を分ける1つの閾値を検出し、反転パタンであれば反転
する処理を行えば良い。
【0056】このように反転文字領域も対応すればJP
EG圧縮される画像上には第1の実施形態では残ってし
まっていた反転文字領域も文字部塗りつぶしによりスム
ージングされるので、圧縮効率も良く、またその反転文
字部も解像度やモスキートノイズの劣化なしに圧縮する
ことが可能となる。
【0057】また第1の実施形態及び本実施形態では文
字領域抽出処理は2値画像を利用して行ったがその限り
でなく、多値画像自体の画素値を参照して文字領域を推
測してもよい。
【0058】また、第1の実施形態では縮小部106に
おける画像Aの縮小の程度はどの画像も一定とした。し
かしその限りでなく、たとえば縮小パラメータ(たとえ
ば、2分の1、4分の1など)を決定する縮小パラメー
タ決定手段を設けても良い。この実現方法としては、例
えば画像A全体に対して8×8毎に直交変換を行い、直
交変換結果の高周波部の係数が大きい領域が閾値以上存
在したら、縮小は2分の1、閾値以下であったら縮小は
4分の1など調整することが可能となる。このパラメー
タは2段階とは限らず、たとえば3段階(縮小しない、
2分の1、4分の1)にすることも可能である。これに
より、高周波部分の極端な縮小が避けられ、画質劣化を
防ぐ効果がある。この縮小パラメータ決定には、画像に
微分フィルタをかけ、その絶対値の総和から切り替える
方法も考えられる。たとえば、隣り合った画素値の差の
総和が閾値m以上であれば、縮小しない、n以上であれ
ば、2分の1、n未満なら4分の1などにすることが考
えられる。
【0059】[その他の実施形態]さらに、本発明は上
記実施の形態を実現するための装置及び方法のみに限定
されるものではなく、上記システム又は装置内のコンピ
ュータ(CPUあるいはMPU)に、上記実施の形態を実現す
るためのソフトウエアのプログラムコードを供給し、こ
のプログラムコードに従って上記システムあるいは装置
のコンピュータが上記各種デバイスを動作させることに
より上記実施の形態を実現する場合も本発明の範疇に含
まれる。
【0060】またこの場合、前記ソフトウエアのプログ
ラムコード自体が上記実施の形態の機能を実現すること
になり、そのプログラムコード自体、及びそのプログラ
ムコードをコンピュータに供給するための手段、具体的
には上記プログラムコードを格納した記憶媒体は本発明
の範疇に含まれる。
【0061】この様なプログラムコードを格納する記憶
媒体としては、例えばフロッピー(登録商標)ディス
ク、ハードディスク、光ディスク、光磁気ディスク、CD
-ROM、磁気テープ、不揮発性のメモリカード、ROM等を
用いることができる。
【0062】また、上記コンピュータが、供給されたプ
ログラムコードのみに従って各種デバイスを制御するこ
とにより、上記実施の形態の機能が実現される場合だけ
ではなく、上記プログラムコードがコンピュータ上で稼
働しているOS(オペレーティングシステム)、あるいは他
のアプリケーションソフト等と共同して上記実施の形態
が実現される場合にもかかるプログラムコードは本発明
の範疇に含まれる。更に、この供給されたプログラムコ
ードが、コンピュータの機能拡張ボードやコンピュータ
に接続された機能拡張ユニットに備わるメモリに格納さ
れた後、そのプログラムコードの指示に基づいてその機
能拡張ボードや機能格納ユニットに備わるCPU等が実際
の処理の一部または全部を行い、その処理によって上記
実施の形態が実現される場合も本発明の範疇に含まれ
る。
【0063】本発明を上記記憶媒体に適用する場合、そ
の記憶媒体には、先に説明した(図3、及び/又は図1
1,及び/又は図12,及び又は図16、及び又は図2
0に示す)フローチャートに対応するプログラムコード
が格納されることになる。
【0064】
【発明の効果】以上説明したように本発明によれば、画
像中の文字領域内の色を損なうことなく圧縮、伸長を行
うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における画像圧縮装置
の概略構成を示すブロック図である。
【図2】本発明の第1の実施形態における画像伸長装置
の概略構成を示すブロック図である。
【図3】画像2値化部102に原画像101が入力さ
れ、文字領域検出部104が文字領域座標112を出力
するまでの各処理のフローチャートである。
【図4】カラー画像(原画像101)を示す図である。
【図5】図4に示す原画像101を間引いて高度変換し
たもののヒストグラムを示す図である。
【図6】図4に示した原画像101を閾値Tを用いて2
値化した際の画像を示す図である。
【図7】図6に示した画像の黒画素の輪郭線追跡を行
い、すべてをラベリングしたときに、横幅が閾値以下、
または高さが閾値以下の黒画素の集まりのみ文字として
許した場合の文字領域を示す図である。
【図8】検出される文字領域を示す図である。
【図9】文字領域一部分の輝度ヒストグラムを示す図で
ある。
【図10】(a)は2値画像103を利用した文字部塗
りつぶし部104の処理の一例を説明する為に用意され
た原画像でを示す図で、(b)は1つの文字領域の2値
画像を示す図で、(c)は(a)に示した画像をパーツ
に分けた様子を示す図である。
【図11】2値画像103を利用した文字部塗りつぶし
部104の処理のフローチャートである。
【図12】減色部1082を含む文字色抽出部108に
おける処理のフローチャートである。
【図13】2つのヒストグラムにまたがる本来の最大値
を示す図である。
【図14】(a)はJPEG伸長部201における圧縮
コードX113のJPEG伸長結果を示す図で、(b)
は文字領域の画像を示す図で、(c)は最終的に合成部
208から出力される伸長画像I209を示す図であ
る。
【図15】ステップS1205似て検出された最大値を
中心として各方向に3ステップ広げた際に生成される正
方形を示す図である。
【図16】本発明の第1の実施形態における画像伸長装
置が行う画像伸長処理のフローチャートである。
【図17】本発明の第2の実施形態における画像圧縮装
置の概略構成を示すブロック図である。
【図18】(a)は1次微分フィルタを示す図で、
(b)は2次微分フィルタを示す図である。
【図19】本発明の第2の実施形態における画像圧縮装
置に主に入力される3パターンの画像のヒストグラムを
示す図である。
【図20】圧縮データ1Aを生成する処理のフローチャ
ートである。
───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl.7 識別記号 FI テーマコート゛(参考) H04N 1/413 H04N 1/40 D 5C079 1/46 1/46 Z 5L096 7/30 7/133 Z Fターム(参考) 5B057 CA01 CA08 CA12 CA16 CB01 CB08 CB12 CB16 CC02 CD05 CE03 CE12 CE17 CG01 CH01 CH18 DA08 DB02 DB06 DB09 DC14 DC16 DC23 DC25 5C059 MA00 PP02 PP14 5C076 AA22 AA26 BA06 BB06 5C077 MP08 PP20 PP27 PP28 PP46 PP47 PP52 PP68 PQ08 PQ19 RR02 RR21 5C078 AA09 BA27 BA57 CA00 DA01 DA02 DA16 DB06 5C079 LA01 LA02 LA06 LA15 LA26 LA34 LA37 LA39 LA40 LB01 LB12 MA11 NA03 5L096 AA02 AA06 EA35 EA43 FA32 FA33 FA37 FA44 JA11

Claims (17)

    【特許請求の範囲】
  1. 【請求項1】 原画像に対して圧縮処理を行う画像圧縮
    装置であって、 原画像に含まれる文字領域の位置を特定する文字領域特
    定手段と、 前記原画像において、当該文字領域特定手段により特定
    された位置の文字領域内を所定の色で埋めることで下地
    画像を生成する下地画像生成手段と、 前記文字領域特定手段により特定された位置の文字領域
    内の色のパレットを生成するパレット生成手段と、 当該パレットに基づいて、文字領域内の画像に基づいた
    減色画像を生成する減色画像生成手段とを備え、 前記減色画像と、前記下地画像とに対して異なる圧縮を
    行うことを特徴とする画像圧縮装置。
  2. 【請求項2】 前記文字領域特定手段は、前記原画像を
    2値化し、2値画像を生成する2値画像生成手段を更に
    有し、 当該2値画像内で所定の値をとる画素の集合を文字領域
    とみなすことで、当該文字領域の位置を特定することを
    特徴とする請求項1に記載の画像圧縮装置。
  3. 【請求項3】 前記2値化画像生成手段は、前記原画像
    の各画素の値が所定の値を超えているか否かで、前記原
    画像を2値化することを特徴とする請求項2に記載の画
    像圧縮装置。
  4. 【請求項4】 前記2値化画像生成手段は、前記原画像
    に対して微分フィルタを掛け、前記原画像を構成する全
    ての画素に対して近隣の画素とのエッジ量を算出し、算
    出された当該エッジ量を2値化することを特徴とする請
    求項2に記載の画像圧縮装置。
  5. 【請求項5】 前記文字領域特定手段により特定された
    位置の文字領域のうち、注目文字領域内において前記パ
    レット生成手段が生成したパレット数が単数の場合、前
    記減色画像生成手段は前記注目文字領域内の減色画像と
    して前記注目文字領域内の2値画像を用い、 注目文字領域内において前記パレット生成手段が生成し
    たパレット数が複数の場合、前記減色画像生成手段は前
    記注目文字領域内の2値画像が所定の値である画素に対
    応する原画像の画素の値をパレットを特定する値に振り
    分け、前記注目文字領域内の減色画像を生成することを
    特徴とする請求項1乃至4のいずれか1項に記載の画像
    圧縮装置。
  6. 【請求項6】 前記下地画像生成手段は更に、前記原画
    像を所定のサイズを有するブロックに分割する分割手段
    と、 当該分割手段により分割されたブロック内に文字領域が
    存在するか否かを判断する判断手段とを有し、 当該判断手段により注目ブロック内に文字領域が存在し
    た場合、当該注目ブロック内で文字領域外の領域の色の
    平均を算出し、算出した平均の色を前記所定の色として
    用いることを特徴とする請求項1乃至5のいずれか1項
    に記載の画像圧縮装置。
  7. 【請求項7】 圧縮された前記減色画像と、圧縮された
    前記下地画像とに加えて更に、前記文字領域特定手段に
    より特定された文字領域の位置と、前記パレット生成手
    段により生成されたパレットを含む圧縮データを生成す
    ることを特徴とする請求項1乃至6のいずれか1項に記
    載の画像圧縮装置。
  8. 【請求項8】 前記下地画像を縮小する縮小手段を更に
    有し、当該縮小手段による前記下地画像の縮小画像に対
    して圧縮を行うことで、前記下地画像の圧縮画像を生成
    することを特徴とする請求項1乃至7のいずれか1項に
    記載の画像圧縮装置。
  9. 【請求項9】 前記縮小手段は、前記下地画像に対して
    所定のサイズを有するブロック毎に直交変換を行うこと
    で前記下地画像に含まれる周波数成分量を求め、求めた
    当該周波数成分量に応じた縮小率で前記下地画像に対し
    て縮小処理を行うことを特徴とする請求項8に記載の画
    像圧縮装置。
  10. 【請求項10】 前記縮小画像に対する圧縮はJPEG
    圧縮であることを特徴とする請求項8又は9に記載の画
    像圧縮装置。
  11. 【請求項11】 前記減色画像生成手段が生成した減色
    画像は、注目文字領域内において前記パレット生成手段
    が生成したパレット数が単数の場合、MMR圧縮され、
    注目文字領域内において前記パレット生成手段が生成し
    たパレット数が複数の場合、可逆圧縮されることを特徴
    とする請求項1乃至10のいずれか1項に記載の画像圧
    縮装置。
  12. 【請求項12】 請求項1に記載の画像圧縮装置が生成
    した圧縮データを伸長することで、当該圧縮データに含
    まれる下地画像と減色画像を復元する画像伸長装置であ
    って、 前記圧縮データに含まれる、前記下地画像上における文
    字領域のパレットの数に基づいて、当該文字領域内の画
    像を復元する画像復元手段と、 前記圧縮データに含まれる前記下地画像上の文字領域の
    位置に、前記画像復元手段により復元された前記画像を
    合成する合成手段とを備えることを特徴とする画像伸長
    装置。
  13. 【請求項13】 前記画像復元手段は、前記下地画像内
    の文字領域のパレットの数が単数であった場合、当該文
    字領域内で所定の値をとる画素に対して前記パレットを
    用い、 前記下地画像内の文字領域のパレットの数が複数であっ
    た場合、当該文字領域内の各画素値に応じたパレットを
    用いることで前記文字領域内の画像を復元することを特
    徴とする請求項12に記載の画像伸長装置。
  14. 【請求項14】 原画像に対して圧縮処理を行う画像圧
    縮方法であって、 原画像に含まれる文字領域の位置を特定する文字領域特
    定工程と、 前記原画像において、当該文字領域特定工程により特定
    された位置の文字領域内を所定の色で埋めることで下地
    画像を生成する下地画像生成工程と、 前記文字領域特定工程により特定された位置の文字領域
    内の色のパレットを生成するパレット生成工程と、 当該パレットに基づいて、文字領域内の画像に基づいた
    減色画像を生成する減色画像生成工程とを備え、 前記減色画像と、前記下地画像とに対して異なる圧縮を
    行うことを特徴とする画像圧縮方法。
  15. 【請求項15】 請求項14に記載の画像圧縮方法で生
    成した圧縮データを伸長することで、当該圧縮データに
    含まれる下地画像と減色画像を復元する画像伸長方法で
    あって、 前記圧縮データに含まれる、前記下地画像上における文
    字領域のパレットの数に基づいて、当該文字領域内の画
    像を復元する画像復元工程と、 前記圧縮データに含まれる前記下地画像上の文字領域の
    位置に、前記画像復元工程により復元された前記画像を
    合成する合成工程とを備えることを特徴とする画像伸長
    方法。
  16. 【請求項16】 原画像に対する圧縮処理のプログラム
    コードを格納する記憶媒体であって、 原画像に含まれる文字領域の位置を特定する文字領域特
    定工程のプログラムコードと、 前記原画像において、当該文字領域特定工程により特定
    された位置の文字領域内を所定の色で埋めることで下地
    画像を生成する下地画像生成工程のプログラムコード
    と、 前記文字領域特定工程により特定された位置の文字領域
    内の色のパレットを生成するパレット生成工程のプログ
    ラムコードと、 当該パレットに基づいて、文字領域内の画像に基づいた
    減色画像を生成する減色画像生成工程のプログラムコー
    ドとを備え、 前記減色画像と、前記下地画像とに対して異なる圧縮を
    行うことを特徴とする記憶媒体。
  17. 【請求項17】 請求項16に記載の記憶媒体に格納さ
    れたプログラムコードにより生成された圧縮データを伸
    長することで、当該圧縮データに含まれる下地画像と減
    色画像を復元する画像伸長処理のプログラムコードを格
    納する記憶媒体であって、 前記圧縮データに含まれる、前記下地画像上における文
    字領域のパレットの数に基づいて、当該文字領域内の画
    像を復元する画像復元工程のプログラムコードと、 前記圧縮データに含まれる前記下地画像上の文字領域の
    位置に、前記画像復元工程により復元された前記画像を
    合成する合成工程のプログラムコードとを備えることを
    特徴とする記憶媒体。
JP2000256133A 2000-08-25 2000-08-25 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体 Expired - Lifetime JP4250316B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2000256133A JP4250316B2 (ja) 2000-08-25 2000-08-25 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体
US09/931,890 US7133565B2 (en) 2000-08-25 2001-08-20 Image processing apparatus and method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000256133A JP4250316B2 (ja) 2000-08-25 2000-08-25 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体

Publications (3)

Publication Number Publication Date
JP2002077631A true JP2002077631A (ja) 2002-03-15
JP2002077631A5 JP2002077631A5 (ja) 2007-09-06
JP4250316B2 JP4250316B2 (ja) 2009-04-08

Family

ID=18744792

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000256133A Expired - Lifetime JP4250316B2 (ja) 2000-08-25 2000-08-25 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体

Country Status (1)

Country Link
JP (1) JP4250316B2 (ja)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1355484A2 (en) 2002-04-17 2003-10-22 Canon Kabushiki Kaisha Image compression method and apparatus, and image coding method and apparatus
JP2010028797A (ja) * 2008-07-22 2010-02-04 Toshiba Corp 画像形成装置、画像変換装置および画像形成方法
US7903888B2 (en) 2006-08-08 2011-03-08 Canon Kabushiki Kaisha Image encoding apparatus and image decoding apparatus
US7949725B2 (en) 2007-03-26 2011-05-24 Ricoh Company, Ltd. System including a server and at least a client
JP2012070185A (ja) * 2010-09-22 2012-04-05 Fuji Xerox Co Ltd 画像処理装置、画像形成装置、画像処理プログラム

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP1355484A2 (en) 2002-04-17 2003-10-22 Canon Kabushiki Kaisha Image compression method and apparatus, and image coding method and apparatus
US7158669B2 (en) 2002-04-17 2007-01-02 Canon Kabushiki Kaisha Image compression method and apparatus, and image coding method and apparatus
US7903888B2 (en) 2006-08-08 2011-03-08 Canon Kabushiki Kaisha Image encoding apparatus and image decoding apparatus
US7949725B2 (en) 2007-03-26 2011-05-24 Ricoh Company, Ltd. System including a server and at least a client
JP2010028797A (ja) * 2008-07-22 2010-02-04 Toshiba Corp 画像形成装置、画像変換装置および画像形成方法
JP2012070185A (ja) * 2010-09-22 2012-04-05 Fuji Xerox Co Ltd 画像処理装置、画像形成装置、画像処理プログラム

Also Published As

Publication number Publication date
JP4250316B2 (ja) 2009-04-08

Similar Documents

Publication Publication Date Title
US7133565B2 (en) Image processing apparatus and method
JP4366003B2 (ja) 画像処理装置及び画像処理方法
US7376267B2 (en) Image processing apparatus, image processing method, and program and storage medium therefor
JP5132530B2 (ja) 画像符号化装置及び画像処理装置及びそれらの制御方法
JP2004260327A (ja) 画像圧縮装置
JP3715905B2 (ja) 画像処理装置、画像処理方法、プログラム並びに記憶媒体
JP2002165105A (ja) 画像処理装置及びその方法並びに記憶媒体
KR20020064350A (ko) 이미지 데이터 압축방법 및 복원방법
JP2003244447A (ja) 画像処理装置及び画像処理方法
JP2003338935A (ja) 画像処理装置および方法
JP4693289B2 (ja) 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体
JP2002077631A (ja) 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体
JP4182891B2 (ja) 画像処理装置
JP4370950B2 (ja) 画像処理装置
JP2005275854A (ja) 画像処理装置、画像処理方法、画像処理プログラムおよびこのプログラムを記憶した記録媒体
JP2003338934A (ja) 画像処理装置および方法
JP2005175641A (ja) 画像処理装置
JP4228905B2 (ja) 画像処理装置及びプログラム
JP2004128881A (ja) 画像圧縮装置、画像伸長装置及びそれらの方法、プログラム
JP4193687B2 (ja) 画像処理装置及びプログラム
JP2004242075A (ja) 画像処理装置および方法
JPH04236574A (ja) 画像符号化方式
JP2007335983A (ja) 画像処理装置
JP4311183B2 (ja) 画像処理装置及びプログラム
JP4182873B2 (ja) 画像処理装置及びプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20070719

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20070719

RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20070719

RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20080820

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20081126

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20081201

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20081210

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20090109

A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20090119

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 3

R150 Certificate of patent or registration of utility model

Ref document number: 4250316

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140123

Year of fee payment: 5

EXPY Cancellation because of completion of term