JP4250316B2 - 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体 - Google Patents
画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体 Download PDFInfo
- Publication number
- JP4250316B2 JP4250316B2 JP2000256133A JP2000256133A JP4250316B2 JP 4250316 B2 JP4250316 B2 JP 4250316B2 JP 2000256133 A JP2000256133 A JP 2000256133A JP 2000256133 A JP2000256133 A JP 2000256133A JP 4250316 B2 JP4250316 B2 JP 4250316B2
- Authority
- JP
- Japan
- Prior art keywords
- image
- character area
- character
- color
- palette
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
Images
Landscapes
- Color Image Communication Systems (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Image Analysis (AREA)
- Image Processing (AREA)
- Editing Of Facsimile Originals (AREA)
- Facsimile Image Signal Circuits (AREA)
Description
【発明の属する技術分野】
本発明は、原画像に対して圧縮処理を行う画像圧縮装置、当該画像圧縮装置が生成した圧縮データを伸長することで、当該圧縮データに含まれる下地画像と減色画像を復元する画像伸長装置、及びその方法、並びに記憶媒体に関するものである。
【0002】
【従来の技術】
近年、スキャナの普及により文書の電子化が進んでいる。電子化された文書をフルカラーで所有すると300dpiでA4サイズの場合約24Mバイトになり、保有するにもメモリを逼迫するし、メイル添付などで他人に送信できるサイズではない。フルカラー画像圧縮にはJPEGが知られている。JPEGは写真などの自然画像を圧縮するには非常に効果も高く、画質も良いが、文字部などの高周波部分をJPEG圧縮するとモスキートノイズと呼ばれる画像劣化が発生し、圧縮率も悪い。そこで領域分割を行い、文字領域を抜いた下地部分のJPEG圧縮と、色情報付き文字領域部分のMMR圧縮を作成し、伸長時は白部分はJPEG画像を透過し、黒部分は代表文字色を載せて表現する方法があった。
【0003】
【発明が解決しようとする課題】
しかし、上記方法では例えば、黒文字の文章中の赤で示した強調文字の情報が欠落してしまう等、2色以上を用いた文字部を含む画像を上記圧縮方法で圧縮し、この圧縮した画像を伸長した場合、伸長後の画像に含まれる文字部は1色とされてしまう。
【0004】
本発明は上述の問題点に対して鑑みてなされたものであり、画像中の文字領域内の色を損なうことなく圧縮、伸長を行うことを目的とする。
【0005】
【発明を解決するための手段】
本発明の目的を達成するために、例えば、本発明の画像圧縮装置は以下の構成を備える。
即ち、原画像に対して圧縮処理を行う画像圧縮装置であって、
原画像に含まれる文字領域の位置を特定する文字領域特定手段と、
前記文字領域特定手段により特定された位置の文字領域内を予め定められた色で埋めることで下地画像を生成する下地画像生成手段と、
前記文字領域特定手段により特定された位置の文字領域内の色のパレットを生成するパレット生成手段と、
前記文字領域特定手段により特定された位置の文字領域のうち、注目文字領域内において前記パレット生成手段が生成したパレット数が単数の場合、前記注目文字領域内の2値画像を前記注目文字領域内の減色画像として生成し、
前記注目文字領域内において前記パレット生成手段が生成したパレット数が複数の場合、前記注目文字領域内の2値画像内の予め定められた値を有する画素に対応する前記原画像内の画素の値を、パレットを特定する値に振り分けることで、前記注目文字領域内の減色画像を生成する前記減色画像生成手段とを備え、
前記減色画像と、前記下地画像とに対して異なる圧縮を行うことを特徴とする。
【0006】
本発明の目的を達成するために、例えば、本発明の画像伸長装置は以下の構成を備える。
即ち、上記画像圧縮装置が生成した圧縮データを伸長することで、当該圧縮データに含まれる下地画像と減色画像を復元する画像伸長装置であって、
前記圧縮データに含まれる、前記下地画像上における文字領域のパレットの数に基づいて、当該文字領域内の画像を復元する画像復元手段と、
前記圧縮データに含まれる前記下地画像上の文字領域の位置に、前記画像復元手段により復元された前記画像を合成する合成手段と
を備えることを特徴とする。
【0007】
【発明の実施の形態】
以下添付図面に従って、本発明を好適な実施形態に従って詳細に説明する。
【0008】
[第1の実施形態]
以下、複数の色を有する文字領域を含む画像に対して圧縮を行う画像圧縮装置、この圧縮された画像に対して伸長処理を行う画像伸長装置について説明する。
【0009】
まず始めに本実施形態における画像圧縮装置について、当該画像圧縮装置の概略構成を示す図1を用いて説明する。
【0010】
101は原画像である。102は原画像を入力し、画像の最適2値化を行う画像2値化部である。103は画像2値化部により2値化された2値画像である。104は2値画像103を入力して文字領域を検出し、文字領域座標112を作成する文字領域検出部である。
【0011】
105は文字領域座標112を入力し、2値画像103の黒の領域を特定すると共に、2値画像103の黒の領域に該当する原画像中の領域を抜いて、抜いた領域を黒の領域の周囲の色で塗りつぶし、画像Aを作成する文字部塗りつぶし部である。106は画像Aを入力し、縮小して画像Bを作成する縮小部である。107は画像Bを入力し、JPEG圧縮して圧縮コードX113を作成するJPEG圧縮部である。
【0012】
108は文字領域座標112を入力し、その座標の原画像と2値画像103を参照しながら、2値画像の黒の領域に該当する原画像の領域の色を算出し、複数のパレット114を作成する文字色抽出部108である。また文字色抽出部108は、更に内部に減色部1082を有し、当該減色部1082は、前記パレット114に従って、原画像に対して減色処理を行う。109は文字色抽出部108が有する減色部1082により減色された、原画像101が有する複数の文字領域の減色画像である。110は減色画像109が1ビットであるときに、減色画像109を入力し、MMR圧縮して夫々の減色画像109に応じた複数の圧縮コードY115を作成するMMR圧縮部である。111は減色画像109が2ビット以上であるときに、減色画像109を入力し、可逆圧縮(例えばZIP圧縮)して夫々の減色画像109に応じた複数の圧縮コードZ116を作成する可逆圧縮部である。
【0013】
以上の各部により生成される1Aでまとめた112から116までのデータが結合して、これが圧縮データとなる。なお、文字領域が全て1ビットで表現されている場合、圧縮コードZ116は生成されない。また文字領域そのものが存在しない場合、圧縮データ1Aに含まれるデータは圧縮コードX113のみとなる。
【0014】
画像2値化部102に原画像101が入力され、文字領域検出部104が文字領域座標112を出力するまでの各処理のフローチャートを図3に示す。なお本フローチャートに従ったプログラムコードは、本実施形態における画像圧縮装置内の不図示のROMやRAMなどのメモリ内に格納され、不図示のCPUにより読み出され実行されるものとする。
【0015】
ステップS301にて原画像101(カラー画像)を入力し、間引いて解像度を落しながら輝度変換を行い、輝度画像Jを作成する。たとえば原画像がRGB24ビット300dpiだとすると、縦方向、横方向とも4画素ごとに
Y=0.299R+0.587G+0.114B
の演算を行い、その結果生成された輝度画像JはY8ビット75dpiの画像となる。
【0016】
ステップS302にて輝度データのヒストグラムを取り、2値化閾値Tを算出する。この算出方法はここでは特には限定しないが、例えばヒストグラムの中間値となる輝度値をこの閾値Tとしてもよい。
【0017】
ステップS303にて2値化閾値Tを用いて輝度画像Jを2値化し、2値画像103を作成する。
【0018】
ステップS304にて2値画像中の黒画素の輪郭線追跡を行い、すべての黒領域に対してラベル付けする。
【0019】
ステップS305にてステップS304でラベル付けされた黒領域を検索し、黒領域中の文字らしい領域を判定する。
【0020】
ステップS306にて形や位置から結合するものを結合する。
【0021】
ここで図3に示したフローチャートに従った処理の一例を示す。たとえば図4に示すカラー原稿(原画像101)を入力し、間引いて輝度変換したもののヒストグラムを取ると図5のようになる。このヒストグラムから平均、分散、などのデータを利用して閾値T=150を算出し、算出された閾値Tを用いて図4に示したカラー原稿(原画像101)を2値化した画像(2値画像103)は図6のようになる。図6の黒画素の輪郭線追跡を行い、すべてをラベリングして、たとえば、横幅が閾値以下、または高さが閾値以下の黒画素の集まりのみ文字として許すと図7に示す黒画素の集まりが文字領域となる。これらの文字領域の座標データが文字領域座標112として不図示のRAMに格納される。
【0022】
必要ならばこれらの黒画素の集まりを位置の近さや横幅、高さの一致からグループ化していくと、図8に示すような16個の文字領域が検出できる。この文字領域も必要ならば不図示のRAMに格納しても良い。
【0023】
次に、2値画像103を利用した文字部塗りつぶし部104の処理の一例を図10に示した原画像例を用いて、図11に示した同処理のフローチャートを用いて説明する。なお本フローチャートに従ったプログラムコードは、本実施形態における画像圧縮装置内の不図示のROMやRAMなどのメモリ内に格納され、不図示のCPUにより読み出され実行されるものとする。
【0024】
図10(a)は原画像である。この原画像から図10(b)のような1つの文字領域の2値画像を得たとする。本実施形態では原画像101を32×32毎の領域(以下、パーツ)に分割し(ステップS1101)、パーツごとに処理をおこなう。図10(c)にパーツごとに分けた様子を示す。00から10までの6つのパーツはステップS1103の分岐により文字領域がないのでなにも処理が行われない。11のパーツにて、ステップS1103の分岐によりステップS1104にすすみ、2値画像103において11のパーツに対応する箇所を参照し、当該箇所の白部分(白画素)に対応する原画像101のRGB値(またはYUVでもなんでも良い)の平均値ave_colorを算出する(ステップS1104)。
【0025】
ステップS1105にて、今度は2値画像103において11のパーツに対応する箇所を参照し、当該箇所中の黒部分(黒画素)に対応する原画像101の部分のカラー値を、上記ave_colorとする。
【0026】
以上の処理を文字領域の存在するパーツ12,13,21,22,23に対して繰り返し行う。他のパーツは文字領域がないので何も処理が行われない。このようにして、文字の存在した部分に当該文字の周囲の画素の平均値を埋めることが出来る。本フローチャートの処理により、文字塗りつぶし部105は画像Aを生成する。
【0027】
次に、この画像Aは縮小部106において縮小される。本実施形態ではこの縮小処理方法として単純間引きとする。ちなみに、この縮小と文字部塗りつぶし処理は順番を逆にしても構わない。その場合2値画像103と原画像101の位置のずれに気を付ける必要がある。
【0028】
一方、減色部1082を含む文字色抽出部108における処理のフローチャートを図12に示す。
【0029】
ステップS1201では、抽出された色数を表すカウンタnumを0にリセットする。抽出されたすべての文字領域ごとに処理を行うので、
ステップS1202では、未処理の文字座標があるかどうかチェックし、あったらステップS1202にすすみ、無かったら本処理を終了する。
【0030】
ステップS1203では、2値画像103において未処理の文字座標に位置する部分の細線化処理を行い、スキャナ読み込み時の下地から文字部への変化部にあたる黒を減らしていき、新しい2値画像newbiを作成する。
【0031】
次にステップS1204にてnewbiの黒画素に対応する原画像のRGBの3次元ヒストグラムを取る。この際、普通にヒストグラムをとると、たとえば入力画像がRGB各8ビットだとすると、256×256×256のヒストグラムが必要になる。文字部に必要なのは解像度であり、階調は必要ないこと、また、スキャナによる読み込み時のばらつきを押さえながら代表色を算出するには多少の画素値の違いは無視した方が良いこと、などを鑑みると、これほどの細かなヒストグラムは必要ない。これらのことから本実施形態ではRGB8ビット中上位5ビットのRGB3次元ヒストグラムをとる。このヒストグラムをとる際は、その文字領域に存在する黒画素の総数pixelnumも算出する。
【0032】
また、本実施形態ではRGB空間を利用したが、YUVなど他の色空間でも構わない。また本実施形態では3次元ヒストグラムをとったが、各色それぞれの1次元ヒストグラムを3つとってもかまわない。
【0033】
次にステップS1205では、RGB3次元ヒストグラムから最大値を算出する。本実施形態ではすでに上位5ビットのみのRGB3次元ヒストグラムを取り、スキャナのばらつきによるノイズを押さえたが、さらに、ヒストグラムの隣り合った値の合計の最大値をとることにより、図13に示すような2つのヒストグラムにまたがる本来の最大値を検出することが可能となる。具体的にいうと、3次元ヒストグラムなので、注目点と、R方向で隣り合った2つ、G方向で隣り合った2つ、B方向で隣り合った2つの計7つのヒストグラム値の合計値の最大値を検出するなどが考えられる。このように検出された最大値をcolR[num],colG[num],colB[num]に代入する。
【0034】
ステップS1206では、ステップS1205にて検出された最大値を中心に、例えば3ステップずつ広げた正方形内を設定し、後述する処理の後この正方形内に位置するヒストグラム値を0にする。正方形の説明を図15に図示する。図15はRGB3次元ヒストグラムの様子で、黒点で示したものがcolR[num],colG[num],colB[num]とする。その点を中心に3ステップずつ広げた合計7×7×7が前述の正方形である。ここで3ステップというと、上位5ビットのヒストグラムなので元のRGBの8ビット(256階調)で24ステップに値する。そしてこの正方形内のヒストグラム値をpixelnumから引いたあと、この正方形内のヒストグラム値に0を代入する。
【0035】
ステップS1207ではnumを1つインクリメントする。
【0036】
ステップS1208では、pixelnumがあらかじめ決められたthre1以上かどうかチェックし、thre1以上であればステップS1205に進み、未満であれば1202に進む。
【0037】
以上の処理をすべての文字座標に繰り返すことにより、すべての文字領域のパレット114が作成される。なお、このパレットのデータ中にはそのパレットがどの文字領域のパレットであるかを特定するコードが記載されている。
【0038】
そして減色部1082は、この領域のパレット数が1であったらば、入力された2値画像103の文字領域部分を切り抜き、1部分2値画像を作成する。それがその文字領域の減色画像となる。
【0039】
一方、この領域のパレット数が2以上である場合、減色部1082は原画像と2値画像から、文字領域内の2値画像が黒である画素に対応する原画像の画素値をパレットの値に振り分け、減色画像を作成する。割り振られるビット数は、2値画像の白の部分として透過を示すデータが必要となるので、パレット数が3のときは透過データの分を1つプラスして4となるので2ビット。パレット数が4のときは透過データの分を1つプラスして5となるので3ビットとなる。このビット数は最終的に適応される画像フォーマットで表現出来るビット数に準じる。
【0040】
この際たとえばパレット数が著しく多く、多色化による画質向上、圧縮率向上の効果が見られないと判断できる場合には多色化はやめ、下地画像として保存することも考えられる。その場合は文字領域座標112からその文字領域を削除しなくてはならない。また、文字部塗りつぶし部105の処理が行われる前に文字領域座標112から削除しなければならない。
【0041】
次に上述の各フローチャート(図3,11,12)に従った処理以降の処理である、圧縮データ1Aを生成するフローチャートを図20に示す。なお本フローチャートに従ったプログラムコードは、本実施形態における画像圧縮装置内の不図示のROMやRAMなどのメモリ内に格納され、不図示のCPUにより読み出され実行されるものとする。
【0042】
上述の通り作成された減色画像109が1ビットの場合はこの減色画像109を文字色抽出部108からMMR圧縮部110に出力し(ステップS2001)、このMMR圧縮部110においてMMR圧縮し、圧縮コードY115を作成する(ステップS2003)。また、減色画像109が2ビット以上の場合は可逆圧縮部111にて可逆圧縮し、圧縮コードZ116を作成する。
【0043】
一方、JPEG圧縮部107は縮小画像B105に対してJPEG圧縮を行い、圧縮コードX113を作成する(ステップS2004)。なお、ステップS2001〜S2003の処理と、ステップS2004の処理は順番は逆でも良い。
【0044】
そして、文字領域座標112、パレット114、圧縮コードX113、圧縮コードY115、圧縮コードZ116のうち少なくとも一つ以上をまとめたフォーマットを作成し、圧縮データ1Aを作成する(ステップS2005)。この圧縮データ1Aのフォーマットはここでは特には限定せず、単純に連結したデータ列をまとめて圧縮データ1Aとしてもよい。
【0045】
以上の説明により、本実施形態の画像圧縮装置及びその方法は、複数の色を有する文字領域を含む画像に対して圧縮を行った際、当該文字領域に複数の色を許容して、圧縮データを生成することができる。
【0046】
次に本実施形態における画像伸長装置について、本実施形態における画像圧縮装置により上述の通り作成された圧縮データを伸長する前記画像伸長装置の概略構成を、図2を用いて説明する。又、同時に本実施形態における画像伸長装置が行う画像伸長処理のフローチャートを図16に示す。なお本フローチャートに従ったプログラムコードは、本実施形態における画像伸長装置内の不図示のROMやRAMなどのメモリ内に格納され、不図示のCPUにより読み出され実行されるものとする。
【0047】
201は圧縮コードX113を入力し、JPEG伸長処理を行い、(多値)画像Eを作成する(ステップS2101)JPEG伸長部である。202は画像Eを入力し、拡大処理を行うことで、画像F203を生成する(ステップS2102)拡大部である。203は拡大部202により拡大された画像Fである。
【0048】
204は圧縮コードY115を入力し、MMR伸長処理を行い、2値画像G205を作成する(ステップS2103)MMR伸長部である。206は圧縮コードZ116を入力し、(多色)画像H207を作成する(ステップS2104)伸長部である。208は文字領域座標112とそれに対応するパレット114および2値画像G205または多色画像H207を入力し、2値画像または多色画像の画素データが透過をあらわす場合は画像F203の画素の色を、それ以外のときは対応するパレット色を選択し最終的な画像である画像I209を作成する合体部である。
【0049】
図14に合体部208における処理例を示す。まず図14(a)にJPEG伸長部201による圧縮コードX113のJPEG伸長結果を示す。なお、本実施形態では文字領域は図14(b)のように、2値画像1ビットで表現されていて、そのパレットはR=20、G=30、B=225とする。図14(b)の2値画像を参照して、黒画素に対応する画像(図14(a))上にパレット色(20、30、255)を有するデータをのせることで、最終的に図14(c)のような画像が出来上がる(ステップS2105,ステップS2107)。これが伸長画像I209となる。
【0050】
一方、文字領域が多色画像の場合はパレット数が変わり(ステップS2105)、たとえば2ビットなら00,01,10,11の4つの画素値に割り当てられたパレットを選択し、当てはめていく(ステップS2106)。そのうち1つは透過を示し、たとえば00とすると、00の値をもつ画素は画像(図14(a))の画素を選択する。
【0051】
以上の説明により、本実施形態の画像伸長装置及びその方法は、本実施形態の画像符号装置が圧縮した圧縮データを伸長し画像を復元すると共に、当該画像に含まれる文字領域が元々複数の色を有していた場合、当該文字領域に対して複数の色を与えることができる。
【0052】
[第2の実施形態]
第1の実施形態では文字領域検出部112においてカラー画像の2値化を行ったがその他にも、原画像に微分フィルタをかけ、すべての画素の近隣の画素とのエッジ量を算出し、そのエッジ量を2値化することにより得られた2値画像を同様に輪郭線追跡をして文字領域を検出する方法がある。この場合、画像圧縮装置の概略構成は図17のようになる。
【0053】
本実施形態では、2値画像は文字部塗りつぶし部1707、文字色抽出部1710では使用できないので、文字領域ごとに2値画像を作成する。この2値画像は例えば文字領域検出部1704にて算出した(第1の実施形態と同様の)閾値Tにて第1の実施形態と同様にして2値化しても良いし、文字領域ごとにヒストグラムを取ってその文字領域により最適な2値化閾値を算出しても良い。図5に示した全面のヒストグラムと比較して、文字領域一部分の輝度ヒストグラムは図9のようなシンプルな形が期待できるので、閾値の決定は容易である。901は下地色の集合であり、902は文字色の集合である。
【0054】
また、第1の実施形態では輝度の低い下地に含まれる輝度の高い文字(反転文字)の処理が不可能であるが、この微分処理により文字領域を検出する領域分割は反転文字領域の検出も可能となる。1702は微分処理部であり、図18に示しような微分フィルタを注目画素を中心にかけ、その絶対値が閾値を超えたら黒、超えなかったら白というように2値化していく。図18(a)は1次微分フィルタであり、上は横線を検出することが出来、下は縦線を検出することが出来る。2つのフィルタの絶対値の合計を利用すると斜め線を検出することが出来る。また、斜め線用フィルタを利用しても良い。図18(b)は二次微分フィルタで全方向に対応した物である。二次微分フィルタも横方向、縦方向、と作成することも可能である。このようなフィルタを全画素にかけ、微分2値画像1703を作成する。間引きながらフィルタをかけることによって同時に解像度を落すことも可能である。以上のように作成された2値画像に図3のステップS304以降の処理を行えば、反転文字も含んだ文字領域座標を検出することが出来る。
【0055】
また、2値化部1705も反転文字に対応しなければならない。また図9のヒストグラムを有するパターン以外にも、反転文字領域も文字領域として抽出出来る本実施形態における画像圧縮装置の場合、図19の3パターンのヒストグラムを有するパターンが主に入ってくることになる。(b)は(a)に対する反転画像(反転文字を有する)のヒストグラムであり、(c)がグレー下地上に黒文字と白文字の2色が存在する場合の画像のヒストグラムである。これらの3パタンを考えて2値化部1705ではA点とB点を検出し、AとBに挟まれた領域は白、その他は黒の二値化処理を行うと良い。または、(c)のケースは考えずに、下地と文字部を分ける1つの閾値を検出し、反転パタンであれば反転する処理を行えば良い。
【0056】
このように反転文字領域も対応すればJPEG圧縮される画像上には第1の実施形態では残ってしまっていた反転文字領域も文字部塗りつぶしによりスムージングされるので、圧縮効率も良く、またその反転文字部も解像度やモスキートノイズの劣化なしに圧縮することが可能となる。
【0057】
また第1の実施形態及び本実施形態では文字領域抽出処理は2値画像を利用して行ったがその限りでなく、多値画像自体の画素値を参照して文字領域を推測してもよい。
【0058】
また、第1の実施形態では縮小部106における画像Aの縮小の程度はどの画像も一定とした。しかしその限りでなく、たとえば縮小パラメータ(たとえば、2分の1、4分の1など)を決定する縮小パラメータ決定手段を設けても良い。この実現方法としては、例えば画像A全体に対して8×8毎に直交変換を行い、直交変換結果の高周波部の係数が大きい領域が閾値以上存在したら、縮小は2分の1、閾値以下であったら縮小は4分の1など調整することが可能となる。このパラメータは2段階とは限らず、たとえば3段階(縮小しない、2分の1、4分の1)にすることも可能である。これにより、高周波部分の極端な縮小が避けられ、画質劣化を防ぐ効果がある。この縮小パラメータ決定には、画像に微分フィルタをかけ、その絶対値の総和から切り替える方法も考えられる。たとえば、隣り合った画素値の差の総和が閾値m以上であれば、縮小しない、n以上であれば、2分の1、n未満なら4分の1などにすることが考えられる。
【0059】
[その他の実施形態]
さらに、本発明は上記実施の形態を実現するための装置及び方法のみに限定されるものではなく、上記システム又は装置内のコンピュータ(CPUあるいはMPU)に、上記実施の形態を実現するためのソフトウエアのプログラムコードを供給し、このプログラムコードに従って上記システムあるいは装置のコンピュータが上記各種デバイスを動作させることにより上記実施の形態を実現する場合も本発明の範疇に含まれる。
【0060】
またこの場合、前記ソフトウエアのプログラムコード自体が上記実施の形態の機能を実現することになり、そのプログラムコード自体、及びそのプログラムコードをコンピュータに供給するための手段、具体的には上記プログラムコードを格納した記憶媒体は本発明の範疇に含まれる。
【0061】
この様なプログラムコードを格納する記憶媒体としては、例えばフロッピーディスク、ハードディスク、光ディスク、光磁気ディスク、CD-ROM、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。
【0062】
また、上記コンピュータが、供給されたプログラムコードのみに従って各種デバイスを制御することにより、上記実施の形態の機能が実現される場合だけではなく、上記プログラムコードがコンピュータ上で稼働しているOS(オペレーティングシステム)、あるいは他のアプリケーションソフト等と共同して上記実施の形態が実現される場合にもかかるプログラムコードは本発明の範疇に含まれる。
更に、この供給されたプログラムコードが、コンピュータの機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに格納された後、そのプログラムコードの指示に基づいてその機能拡張ボードや機能格納ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって上記実施の形態が実現される場合も本発明の範疇に含まれる。
【0063】
本発明を上記記憶媒体に適用する場合、その記憶媒体には、先に説明した(図3、及び/又は図11,及び/又は図12,及び又は図16、及び又は図20に示す)フローチャートに対応するプログラムコードが格納されることになる。
【0064】
【発明の効果】
以上説明したように本発明によれば、画像中の文字領域内の色を損なうことなく圧縮、伸長を行うことができる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態における画像圧縮装置の概略構成を示すブロック図である。
【図2】本発明の第1の実施形態における画像伸長装置の概略構成を示すブロック図である。
【図3】画像2値化部102に原画像101が入力され、文字領域検出部104が文字領域座標112を出力するまでの各処理のフローチャートである。
【図4】カラー画像(原画像101)を示す図である。
【図5】図4に示す原画像101を間引いて高度変換したもののヒストグラムを示す図である。
【図6】図4に示した原画像101を閾値Tを用いて2値化した際の画像を示す図である。
【図7】図6に示した画像の黒画素の輪郭線追跡を行い、すべてをラベリングしたときに、横幅が閾値以下、または高さが閾値以下の黒画素の集まりのみ文字として許した場合の文字領域を示す図である。
【図8】検出される文字領域を示す図である。
【図9】文字領域一部分の輝度ヒストグラムを示す図である。
【図10】(a)は2値画像103を利用した文字部塗りつぶし部104の処理の一例を説明する為に用意された原画像でを示す図で、(b)は1つの文字領域の2値画像を示す図で、(c)は(a)に示した画像をパーツに分けた様子を示す図である。
【図11】2値画像103を利用した文字部塗りつぶし部104の処理のフローチャートである。
【図12】減色部1082を含む文字色抽出部108における処理のフローチャートである。
【図13】2つのヒストグラムにまたがる本来の最大値を示す図である。
【図14】(a)はJPEG伸長部201における圧縮コードX113のJPEG伸長結果を示す図で、(b)は文字領域の画像を示す図で、(c)は最終的に合成部208から出力される伸長画像I209を示す図である。
【図15】ステップS1205似て検出された最大値を中心として各方向に3ステップ広げた際に生成される正方形を示す図である。
【図16】本発明の第1の実施形態における画像伸長装置が行う画像伸長処理のフローチャートである。
【図17】本発明の第2の実施形態における画像圧縮装置の概略構成を示すブロック図である。
【図18】(a)は1次微分フィルタを示す図で、(b)は2次微分フィルタを示す図である。
【図19】本発明の第2の実施形態における画像圧縮装置に主に入力される3パターンの画像のヒストグラムを示す図である。
【図20】圧縮データ1Aを生成する処理のフローチャートである。
Claims (16)
- 原画像に対して圧縮処理を行う画像圧縮装置であって、
原画像に含まれる文字領域の位置を特定する文字領域特定手段と、
前記文字領域特定手段により特定された位置の文字領域内を予め定められた色で埋めることで下地画像を生成する下地画像生成手段と、
前記文字領域特定手段により特定された位置の文字領域内の色のパレットを生成するパレット生成手段と、
前記文字領域特定手段により特定された位置の文字領域のうち、注目文字領域内において前記パレット生成手段が生成したパレット数が単数の場合、前記注目文字領域内の2値画像を前記注目文字領域内の減色画像として生成し、
前記注目文字領域内において前記パレット生成手段が生成したパレット数が複数の場合、前記注目文字領域内の2値画像内の予め定められた値を有する画素に対応する前記原画像内の画素の値を、パレットを特定する値に振り分けることで、前記注目文字領域内の減色画像を生成する前記減色画像生成手段とを備え、
前記減色画像と、前記下地画像とに対して異なる圧縮を行うことを特徴とする画像圧縮装置。 - 前記文字領域特定手段は、前記原画像を2値化することで2値画像を生成する2値画像生成手段を有し、
前記2値画像内で予め定められた値をとる画素の集合を文字領域とみなすことで、当該文字領域の位置を特定することを特徴とする請求項1に記載の画像圧縮装置。 - 前記2値画像生成手段は、前記原画像の各画素の値が予め定められた値を超えているか否かに応じて、前記原画像を2値化することを特徴とする請求項2に記載の画像圧縮装置。
- 前記2値画像生成手段は、前記原画像に対して微分フィルタを掛け、前記原画像を構成する全ての画素に対して近隣の画素とのエッジ量を算出し、算出された当該エッジ量を2値化することを特徴とする請求項2に記載の画像圧縮装置。
- 前記下地画像生成手段は、前記原画像を予め定められたサイズを有するブロックに分割する分割手段と、
前記分割手段により分割されたブロック内に文字領域が存在するか否かを判断する判断手段とを有し、
前記判断手段により注目ブロック内に文字領域が存在すると判断された場合、当該注目ブロック内で文字領域外の領域の色の平均を算出し、算出した平均の色を前記予め定められた色として用いることを特徴とする請求項1乃至4のいずれか1項に記載の画像圧縮装置。 - 圧縮された前記減色画像と、圧縮された前記下地画像とに加えて更に、前記文字領域特定手段により特定された文字領域の位置と、前記パレット生成手段により生成されたパレットを含む圧縮データを生成することを特徴とする請求項1乃至5のいずれか1項に記載の画像圧縮装置。
- 前記下地画像を縮小する縮小手段を更に有し、当該縮小手段による前記下地画像の縮小画像に対して圧縮を行うことで、前記下地画像の圧縮画像を生成することを特徴とする請求項1乃至6のいずれか1項に記載の画像圧縮装置。
- 前記縮小手段は、前記下地画像に対して、予め定められたサイズを有するブロック毎に直交変換を行うことで、前記下地画像に含まれる周波数成分量を求め、求めた当該周波数成分量に応じた縮小率で前記下地画像に対して縮小処理を行うことを特徴とする請求項7に記載の画像圧縮装置。
- 前記縮小画像に対する圧縮はJPEG圧縮であることを特徴とする請求項7又は8に記載の画像圧縮装置。
- 前記減色画像生成手段が生成した減色画像は、注目文字領域内において前記パレット生成手段が生成したパレット数が単数の場合、MMR圧縮され、注目文字領域内において前記パレット生成手段が生成したパレット数が複数の場合、可逆圧縮されることを特徴とする請求項1乃至9のいずれか1項に記載の画像圧縮装置。
- 請求項1に記載の画像圧縮装置が生成した圧縮データを伸長することで、当該圧縮データに含まれる下地画像と減色画像を復元する画像伸長装置であって、
前記圧縮データに含まれる、前記下地画像上における文字領域のパレットの数に基づいて、当該文字領域内の画像を復元する画像復元手段と、
前記圧縮データに含まれる前記下地画像上の文字領域の位置に、前記画像復元手段により復元された前記画像を合成する合成手段と
を備えることを特徴とする画像伸長装置。 - 前記画像復元手段は、前記下地画像内の文字領域のパレットの数が単数であった場合、当該文字領域内で予め定められた値をとる画素に対して前記パレットを用い、
前記下地画像内の文字領域のパレットの数が複数であった場合、当該文字領域内の各画素値に応じたパレットを用いることで前記文字領域内の画像を復元することを特徴とする請求項11に記載の画像伸長装置。 - 原画像に対して圧縮処理を行う画像圧縮方法であって、
原画像に含まれる文字領域の位置を特定する文字領域特定工程と、
前記文字領域特定工程で特定された位置の文字領域内を予め定められた色で埋めることで下地画像を生成する下地画像生成工程と、
前記文字領域特定工程で特定された位置の文字領域内の色のパレットを生成するパレット生成工程と、
前記文字領域特定工程で特定された位置の文字領域のうち、注目文字領域内において前記パレット生成工程で生成したパレット数が単数の場合、前記注目文字領域内の2値画像を前記注目文字領域内の減色画像として生成し、
前記注目文字領域内において前記パレット生成工程で生成したパレット数が複数の場合、前記注目文字領域内の2値画像内の予め定められた値を有する画素に対応する前記原画像内の画素の値を、パレットを特定する値に振り分けることで、前記注目文字領域内の減色画像を生成する前記減色画像生成工程とを備え、
前記減色画像と、前記下地画像とに対して異なる圧縮を行うことを特徴とする画像圧縮方法。 - 請求項13に記載の画像圧縮方法によって生成した圧縮データを伸長することで、当該圧縮データに含まれる下地画像と減色画像を復元する画像伸長方法であって、
前記圧縮データに含まれる、前記下地画像上における文字領域のパレットの数に基づいて、当該文字領域内の画像を復元する画像復元工程と、
前記圧縮データに含まれる前記下地画像上の文字領域の位置に、前記画像復元工程で復元された前記画像を合成する合成工程と
を備えることを特徴とする画像伸長方法。 - コンピュータに請求項13に記載の画像圧縮方法を実行させるためのプログラム、を格納したコンピュータ読み取り可能な記憶媒体。
- コンピュータに請求項14に記載の画像伸長方法を実行させるためのプログラム、を格納したコンピュータ読み取り可能な記憶媒体。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000256133A JP4250316B2 (ja) | 2000-08-25 | 2000-08-25 | 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体 |
US09/931,890 US7133565B2 (en) | 2000-08-25 | 2001-08-20 | Image processing apparatus and method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2000256133A JP4250316B2 (ja) | 2000-08-25 | 2000-08-25 | 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体 |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002077631A JP2002077631A (ja) | 2002-03-15 |
JP2002077631A5 JP2002077631A5 (ja) | 2007-09-06 |
JP4250316B2 true JP4250316B2 (ja) | 2009-04-08 |
Family
ID=18744792
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000256133A Expired - Lifetime JP4250316B2 (ja) | 2000-08-25 | 2000-08-25 | 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP4250316B2 (ja) |
Families Citing this family (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1355484B1 (en) | 2002-04-17 | 2017-03-01 | Canon Kabushiki Kaisha | Image compression method and apparatus, and image coding method and apparatus |
US7903888B2 (en) | 2006-08-08 | 2011-03-08 | Canon Kabushiki Kaisha | Image encoding apparatus and image decoding apparatus |
JP4898513B2 (ja) | 2007-03-26 | 2012-03-14 | 株式会社リコー | クライアント・サーバシステム |
JP2010028797A (ja) * | 2008-07-22 | 2010-02-04 | Toshiba Corp | 画像形成装置、画像変換装置および画像形成方法 |
JP5741792B2 (ja) * | 2010-09-22 | 2015-07-01 | 富士ゼロックス株式会社 | 画像処理装置、画像処理プログラム |
-
2000
- 2000-08-25 JP JP2000256133A patent/JP4250316B2/ja not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
JP2002077631A (ja) | 2002-03-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7133565B2 (en) | Image processing apparatus and method | |
JP5875637B2 (ja) | 画像処理装置、画像処理方法 | |
JP5132530B2 (ja) | 画像符号化装置及び画像処理装置及びそれらの制御方法 | |
US7376267B2 (en) | Image processing apparatus, image processing method, and program and storage medium therefor | |
JP4366003B2 (ja) | 画像処理装置及び画像処理方法 | |
JP4732250B2 (ja) | 情報処理装置、制御方法、およびコンピュータプログラム | |
EP2645697B1 (en) | Image processing apparatus and method | |
JP6743092B2 (ja) | 画像処理装置、画像処理の制御方法、及びプログラム | |
JP3715905B2 (ja) | 画像処理装置、画像処理方法、プログラム並びに記憶媒体 | |
JP2002165105A (ja) | 画像処理装置及びその方法並びに記憶媒体 | |
JP4250316B2 (ja) | 画像圧縮装置、画像伸長装置、及びその方法並びに記憶媒体 | |
JP2003244447A (ja) | 画像処理装置及び画像処理方法 | |
JP6370080B2 (ja) | 画像処理装置、画像処理方法及びプログラム。 | |
JP4693289B2 (ja) | 画像圧縮装置及び画像圧縮方法並びにプログラムコード、記憶媒体 | |
JP2003338935A (ja) | 画像処理装置および方法 | |
JP2004199622A (ja) | 画像処理装置、画像処理方法、記録媒体およびプログラム | |
JP4370950B2 (ja) | 画像処理装置 | |
JP4182891B2 (ja) | 画像処理装置 | |
JP2003338934A (ja) | 画像処理装置および方法 | |
JPH09204525A (ja) | 画像像域分離装置及びその方法 | |
JP4228905B2 (ja) | 画像処理装置及びプログラム | |
JP2004242075A (ja) | 画像処理装置および方法 | |
JP2005338902A (ja) | 文書データ構造、文書変換装置、文書復元装置、文書変換方法、文書復元方法、文書変換プログラム、文書復元プログラムおよび記録媒体 | |
JP4182873B2 (ja) | 画像処理装置及びプログラム | |
JP2024097205A (ja) | 画像処理装置、画像処理装置の制御方法、及びプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070719 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070719 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20070719 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20080820 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081126 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20081201 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20081210 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20090109 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20090119 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120123 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4250316 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130123 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140123 Year of fee payment: 5 |
|
EXPY | Cancellation because of completion of term |