JP2004032772A - 画像処理装置 - Google Patents
画像処理装置 Download PDFInfo
- Publication number
- JP2004032772A JP2004032772A JP2003177919A JP2003177919A JP2004032772A JP 2004032772 A JP2004032772 A JP 2004032772A JP 2003177919 A JP2003177919 A JP 2003177919A JP 2003177919 A JP2003177919 A JP 2003177919A JP 2004032772 A JP2004032772 A JP 2004032772A
- Authority
- JP
- Japan
- Prior art keywords
- bits
- data
- image
- sub
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Image Processing (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
Abstract
【解決手段】バッファ201に蓄積された2×2画素の画像データは、2値化画像・差分データ作成部202により2値化画像データと差分データに変換され、2値化データはエントロピー符号化部204aによりエントロピー符号化されてメモリ205に格納される。差分データはサブバンド変換部203によりサブバンド変換され、次いで低周波成分LLは低周波成分量子化部206により量子化され、高周波成分HL、LH、HHは高周波成分ベクトル量子化部207によりベクトル量子化される。これらの各量子化値はそれぞれエントロピー符号化部204b、204cによりエントロピー符号化されてメモリ205に格納される。
【選択図】 図8
Description
【発明の属する技術分野】
本発明は、デジタル複写機、ファクシミリ装置、デジタルプリンタ、デジタルカメラ、デジタルビデオ等の画像処理装置や、CD−ROMやフロッピディスク等の画像記録装置において画像データを圧縮、伸長する画像処理装置に関する。
【0002】
【従来の技術】
近年、この種の画像圧縮技術としては、DCT(離散コサイン変換)やHarr Wavelet変換などのサブバンド変換による画像圧縮方法が自然階調の画像を効果的に圧縮する方法として注目されてい。また、他の従来例としては、例えば特開平2−305272号公報には文字領域と中間調領域に分離し、それぞれに適した符号化方法で符号化する方法が知られている。
【0003】
【発明が解決しようとする課題】
しかしながら、DCTやHarr Wavelet変換などのサブバンド変換による画像圧縮方法は、自然階調の画像を効果的に圧縮することができるが、完全2値画像を圧縮する場合には圧縮率が低いという不具合がある。
【0004】
また、デジタル複写機等においては原画像が完全2値データであっても、スキャニング時の揺らぎのために、読み込みデータが完全2値データでなくなり、このためにエントロピー符号化時に圧縮しづらいという不具合がある。
【0005】
さらに、コピーの回転、ソート機能を実現する方法として、固定長符号化の1つであるBTC(ブロックトランケーション)符号化がよく用いられている。しかし、この方式はサブバンド変換方法に比べて、エントロピー符号化時の圧縮率が低く、また、演算が複雑であるという不具合がある。
【0006】
本発明は上記従来の問題点に鑑み、サブバンド変換方法、固定長符号化方法により画像を高画質、簡易、安価に加工、編集することができる画像処理装置を提供することを目的とする。
【0007】
【課題を解決するための手段】
第1の手段は、画像データをn×m画素のブロック毎に分割する分割手段と、前記分割手段によりブロック毎に分割されたn×m画素の画像データをサブバンド変換して変換係数を算出するサブバンド変換手段と、前記サブバンド変換手段により算出された各変換係数の下位ビットを間引いて固定長で量子化する量子化手段とを備えたことを特徴とする。
【0008】
第2の手段は、画像データをn×m画素のブロック毎に分割する分割手段と、前記分割手段によりブロック毎に分割されたn×m画素の画像データをサブバンド変換して変換係数を算出するサブバンド変換手段と、前記サブバンド変換手段により算出された変換係数の絶対値が閾値を超えるか否かに基づいてそのブロックの画像種を判断する領域判断手段と、前記サブバンド変換手段により算出された各変換係数の下位ビットを、前記領域判断手段により判断された画像種に応じて異なるビット数だけ間引き、画像種を示すフラグと共に固定長で量子化する量子化手段とを備えたことを特徴とする。
【0009】
第3の手段は、第2の手段において前記量子化手段が、前記サブバンド変換手段により算出された低周波成分の下位ビットをエッジ領域では多く間引き、非エッジ領域では少なく間引くことを特徴とする。
【0010】
第4の手段は、第2または第3の手段において前記量子化手段が、前記サブバンド変換手段により算出された高周波成分をベクトル量子化することを特徴とする。
【0011】
第5の手段は、第2ないし第4の手段において前記量子化手段が、フラグ情報を量子化テーブルに埋め込むことを特徴とする。
【0012】
第6の手段は、第2ないし第5の手段において前記量子化手段が、画像種が異なるブロック間の固定長符号の相関が向上するようにビット配列を変更することを特徴とする。
【0013】
【発明の実施の形態】
以下、図面を参照して本発明の実施の形態について説明する。
【0014】
<第1の実施形態>
図1は本発明の第1の実施形態に係る画像処理装置を示すブロック図、図2は図1のサブバンド変換部の処理を示す説明図、図3は図1の画像処理装置による圧縮、伸長処理を示す説明図、図4は完全2値画像が揺らいだ場合の図1の画像処理装置による圧縮、伸長処理を示す説明図、図5、図6は図1の画像処理装置による下位ビット間引き処理を示す説明図である。
【0015】
この実施形態では一例として、画像データの深さが8ビット(256階調)データをプリンタに適用した場合を示している。図1において、バッファ201に蓄積された2×2画素の画像データは、2値化画像・差分データ作成部202により2値化画像データと差分データに変換される。ここで、2値化とは、濃度値が「0」〜「255」の画像データに対して濃度値が閾値「128」以上のデータを最大値「255」に変換し、それ以外を最小値「0」に変換することを言う。なお、符号は2値化データ「255」、「0」をそれぞれ「1」、「0」で表す。
【0016】
また、差分データとは2値化データ「255」または「0」と原画像データの差の絶対値を言い、閾値「128」以上のデータ(2値化データ=255の場合)については、
差分データ=2値化データ「255」−濃度値
により演算され、それ以外のデータ(2値化データ=0の場合)については、
差分データ=濃度値−2値化データ「0」
により演算される。また、逆変換を行う場合にも2値化データ=255の場合には、
逆変換値=2値化データ「255」−差分データ
により演算され、2値化データ=0の場合には、
逆変換値=差分データ−2値化データ「0」
により演算される。
【0017】
2値化データ「255」、「0」はエントロピー符号化部204aによりエントロピー符号化されてメモリ205に格納され、これに対し、差分データはサブバンド変換部203により例えばHarr Wavelet変換法によりサブバンド変換され、次いでエントロピー符号化部204bによりエントロピー符号化されてメモリ205に格納される。
【0018】
サブバンド変換部203は例えば図2(a)に示す画素位置a〜dの差分データに対して図2(b)のようにHarr Wavelet変換し、低周波成分LLと高周波成分HL、LH、HHに分解する。小数点以下は切り捨てる。
【0019】
LL={(a+b)/2+(c+d)/2}/2
HL={(a−b)+(c−d)}/2
LH={(a+b)−(c+d)}/2
HH=(a−b)−(c−d) …(1)
ここで、2値化データ「255」または「0」と原画像データの差分データは「0」から「127」までの階調値をとることになり、LL成分は「0」から「「127」までの値をとるので7ビット、HL、LH成分は「−127」から「「127」までの値をとるので8ビット、HH成分は「−255」から「255」までの値をとるので9ビットである。また、逆サブバンド変換する場合には、LL、HL、LH、HHと式(1)に基づいて画素位置a〜dの原画像データを復元する。
【0020】
図3を参照して処理の一例を説明する。例えば画素位置a〜dとして
a=175
b=0
c=175
d=20
の原画像データ301が入力した場合、画素位置a〜dの2値化データ302は、閾値「128」に基づいて
a=255=「1」
b=0=「0」
c=255=「1」
d=0=「0」
となる。
【0021】
また、画素位置a〜dの差分データ302は、
a=255−175=80
b=0−0=0
c=255−175
d=20−0
となり、この差分データ302を式(1)によりサブバンド変換したデータ303は、
LL=45
HL=70
LH=−10
HH=20
となる。
【0022】
このデータ303をメモリ304に一旦格納した後に読み出して、差分データを式(1)に基づいて逆サブバンド変換すると元の差分データ302となる。また、この差分データ302は2値化データ=0または1に基づいて
a=255−80=175
b=0−0=0
c=255−80
d=20−0=20
となり、したがって、原画像データ301が復元される。
【0023】
ここで、自然階調画像を圧縮する場合において2値データを圧縮したり、2値データを圧縮する場合のサブバンド変換係数データの圧縮後の情報量は無視できる程度に小さい。その理由は前者が単純2値画像であり、自然画像の圧縮においては非常に小さい値に圧縮できるからである。また、後者は内容が全て「0」であるからである。
【0024】
次に、デジタル複写機を例にして、画像の加工、編集(90°回転等)のために画像1枚分の情報を固定長で圧縮してメモリ(以下、ページメモリ)に格納する場合について説明する。ここで、量子化については図4に示すように、LL成分は4の倍数、HL、LH成分は16の倍数を、HH成分は64の倍数を各量子化代表点とする。量子化方法についてはLL成分は4で割り、HL、LH成分は16で割り、HH成分は64で割る(下位ビットを間引く)ことにする。この量子化により、LL成分(0〜255)は6ビット、HL、LH成分(−255〜255)は5ビット、HH成分(−510〜510)は4ビットの合計20ビットで表すことができる。
【0025】
ここで、複写機では原稿をスキャニングして読み込むので、2値画像であっても読み込みデータは、完全2値画像データ(最小値「0」と最大値「255」のみから成るデータ)にならずに濃度値で微妙な揺らぎが発生する。図4は、
a=250≠255
b=0
c=254≠255
d=2≠0
のように完全2値画像データでない原画像データ401を圧縮、伸長する処理を示している。
【0026】
2値化データ402は閾値「128」に基づいて
a=255=「1」
b=0=「0」
c=255=「1」
d=0=「0」
となり、また、差分データ402は、
a=255−250=5
b=0−0=0
c=255−254=1
d=2−0=2
となる。
【0027】
差分データ402をサブバンド変換したデータ403は、
LL=1
HL=2
LH=1
HH=6
となり、この下位ビットを間引いてLL成分を6ビット、HL、LH成分を5ビット、HH成分を4ビットで表した量子化データ404は、
LL=HL=LH=HH=0
となる。
【0028】
この量子化データ405をメモリ304に一旦格納した後に読み出して、差分データを元のビット数に逆量子化し、次いで式(1)に基づいて逆サブバンド変換するとした差分データ402は、
a=b=c=d=0
となる。次いでこの差分データ402を2値化データ=255または0に基づいて逆変換したデータ408は、
a=255
b=0
c=255
d=0
となる。
【0029】
ここで、復元されたデータ408は完全2値画像データになっているが、その理由は差分データ402をサブバンド変換した後にLL成分を6ビット、HL、LH成分を5ビット、HH成分を4ビットで量子化したからである。したがって、このような量子化方法によれば、少ない符号量に固定長符号化するので、2値画像を読み込んだ際の揺らぎを除去して完全2値画像に補正することができる。また、この量子化データをエントロピー符号化することを考えると、サブバンド変換係数LL、HL、LH、HHは全て「0」であるので高圧縮することができ、したがって、画像を単純2値化した場合とほぼ等しい圧縮率を実現することができる。
【0030】
次に、図5、図6を参照して特有の画像劣化(階調変化が急激なブロック内における平均濃度の変化)が発生した画像を圧縮する場合について説明する。ここでは説明を簡単にするために、1次元変換を例にし、図5に示すように1次元上の2つの連続するデータ(x0,x1)=(96,191)を次のように変換することを考える。
【0031】
(1)閾値「128」に基づいて2値化する→(0,255)
(2)2値化データ「255」または「0」と原画像データの差分を求め
→96−0=96
255−191=64
次いでこれをHarr Wavelet変換する
→L=(96+64)/2=80
H=64−96=−32
(3)L、Hを量子化する(下位ビットを間引く)。
【0032】
ここで、画像情報としては低周波成分Lの方が重要であるので、高周波成分Hを粗く量子化し(下位ビットを多く間引き)、低周波成分Lを細かく量子化する(下位ビットを少なく間引く)。また、ここでは説明を更に簡単にするために、低周波成分Lは量子化せず(下位ビットを間引かず)、高周波成分Hは64の倍数で量子化することを考えると、
L=80,H=0
となる。
【0033】
これをサブバンド逆変換して差分データ503に戻し、この差分データ503から画素値504を復元すると、画素値504は元の画素値(96,191)から(80,175)に変化し、2つの画素値(80,175)は共に濃度値が低下する。この現象は2値化データ(0,255)との差分をサブバンド変換する場合において、同じブロック内に2値化した際に「255」になるデータと「0」になるデータが混在する場合に特有な劣化となる現象であり、2次元の画像データに対しても同じ現象が発生するので、復元画像と原画像と異なるという問題が発生する。
【0034】
そこで、この問題を防止するために、同じブロック内に2値化した際に「255」になるデータと「0」になるデータが混在する場合には、高周波成分を細かく量子化する(下位ビットを少なく間引く)ことにする。図6を参照して説明すると、1次元上の2つの連続するデータ(96,191)に対して、2値化データ「255」、「0」との差分データ(96,64)を求め、この差分データ((96,64)をHarr Wavelet変換して係数L=80、H=−32を求める。
【0035】
この係数を量子化する場合、高周波成分Hを他の成分より細かく、低周波成分Lを他の成分より粗く量子化する。例えば高周波成分Hを64の倍数で、低周波成分Lを32の倍数で量子化すると、サブバンド係数は、
L=64、H=−32
となる。これをサブバンド逆変換して差分データ603に戻し、この差分データ603に基づいて画素値604を復元すると、画素値604は元の画素値(96,191)から(80,207)に変化するものの、2つのデータの濃度の和は等しいので、全体としての濃度値は変化しない。
【0036】
一般に、2値化した際に2値データが混在するブロックにおいては、低周波成分Lを劣化させてもブロック全体の濃度は変化しないが、高周波成分Hを劣化させるとブロック全体の濃度は変化する。したがって、このような領域では高周波成分Hを細かく量子化することにより、色の全体的な変化をある程度防止することができる。
【0037】
<第2の実施形態>
この実施形態に示すタイプのサブバンド変換では、複数の高周波成分の各々をサンプリングするのではなく、幾つかの高周波成分を一まとめにし、各成分の組み合わせに対してサンプリングを行うことにより、効率的にサンプリングすることができる。例えば縦エッジを表すHL成分と、横エッジを表すLH成分が共に大きな値をとるようなブロックは、一般には画像中には現れにくい。これに対し、HL成分とLH成分の一方のみが大きく、他方とHH成分が小さい絶対値をとるような場合には縦線や横線に対応するので画像中によく現れ、また、全ての高周波成分が小さな絶対値をとるようなブロックは、べたやなだらか階調の領域であるので出現頻度が高い。そこで、高周波成分の組み合わせに対して符号を割り振って量子化を行うことにより、効率的に量子化することができる。ここではこれをベクトル量子化と呼ぶ。
【0038】
図7は第2の実施形態において、出現頻度が高いHL、LH、HH成分の組み合わせに対して符号「0」〜「15」を割り当てることを示し、これにより高周波成分HL、LHを4ビットに圧縮することができる。量子化の具体的方法は、各成分毎に変換係数と各ベクトル量子化値の差Pをとり、この差Pが最も小さな量子化符号を用いる。
【0039】
P=|HL−HLqi|+|LH−LHqi|+|HH−HHqi|
但し、HLqi、LHqi、HHqiは量子化テーブルにおける符号値iに対応する量子化値
図8は第2の実施形態の画像処理装置を示し、図9はその係数変換例を示している。図8においてバッファ201に蓄積された2×2画素の画像データは、2値化画像・差分データ作成部202により2値化画像データと差分データに変換され、2値化データはエントロピー符号化部204aによりエントロピー符号化されてメモリ205に格納される。これに対し、差分データはサブバンド変換部203により例えばHarr Wavelet変換法によりサブバンド変換され、次いで低周波成分LLは低周波成分量子化部206により量子化され、高周波成分HL、LH、HHは高周波成分ベクトル量子化部207によりベクトル量子化される。これらの各量子化値はそれぞれエントロピー符号化部204b、204cによりエントロピー符号化されてメモリ205に格納される。
【0040】
図9は図3に示す原画像データ301と同じデータ901
a=175
b=0
c=175
d=20
を圧縮、伸長する場合を示している。2値化データ902は閾値「128」に基づいて、
a=255=「1」
b=0=「0」
c=255=「1」
d=0=「0」
となり、また、差分データ902は、
a=255−175=80
b=0−0=0
c=255−175=70
d=20−0=0
となり、この差分データ902を式(1)によりサブバンド変換したデータ903は、
LL=45
HL=70
LH=−10
HH=20
となる。
【0041】
そして、LL成分は4の倍数を量子化代表点として線形量子化すると、
LL=44
となり、また、HL、LH、HH成分(70,−10,20)については図7を参照して最も近い
(HL,LH,HH)=(64,0,0)
を選択し、量子化代表ベクトルを表す符号「5」をベクトル量子化値H=5とする。
【0042】
復号化を行う場合には係数907である
(LL,HL,LH,HH)=(44,64,0,0)
と、式(1)に基づいて復元した差分データ908は、
a=76
b=12
c=76
d=12
となり、この差分データ908は2値化データa=255、b=0、c=255、d=0に基づいて
a=255−76=179
b=12−0=12
c=255−76=179
d=12−0=12
に復元される。
【0043】
このように第2の実施形態によれば、高周波成分HL、LH、HHをベクトル量子化するので全体で4ビットで表すことができる。ここでLL成分は元々7ビットのデータを4の倍数で量子化すると5ビットになるので2値化画像は4ビットで表すことができ、係数全体として13ビットで2×2画素のブロック内のデータを表すことができるので、ベクトル量子化しない場合に比べて非常に効率が高い固定長符号化を実現することができる。
【0044】
<第3の実施形態>
次に、デジタル複写機を例にして、画像の加工、編集(90°回転等)のために画像1枚分の情報を固定長で圧縮してページメモリに格納したり、また、ソート機能を実現するために、固定長符号化された画像データをエントロピー符号化し、別のメモリ(以下、蓄積メモリ)に格納する場合を考える。具体的には前者は第3〜第7の実施形態に関し、後者は第8の実施形態に関する。
【0045】
図10および図11は第3の実施形態を示すもので、サブバンド変換部203は2×2バッファ201からの画像データ(図2に示す画素位置a〜d)を式(1)に基づいてHarr Wavelet変換し、低周波成分LLと高周波成分HL、LH、HHに分解する。少数点以下は切り捨てる。また、逆サブバンド変換する場合には、LL、HL、LH、HHと式(1)に基づいて画素位置a〜dの原画像データを復元する。
【0046】
ここで、LL成分は「0」から「255」までの値をとるので8ビット、HL、LH成分は「−255」から「255」までの値をとるので9ビット、HH成分は「−510」から「510」までの値をとるので10ビット(合計36ビット)であるが、サブバンド変換係数LL、HL、LH、HHの重要度は異なり、高周波成分HL、LH、HHの下位ビットはかなり削減することができる。
【0047】
そこで、続くLL成分量子化部1203はLL成分を4の倍数に量子化し、HL成分量子化部1204とHH成分量子化部1205はそれぞれHL成分とHH成分を共に16の倍数に量子化する。HH成分は全て「0」、すなわち破棄する。具体的にはLL成分を4で割ることにより8→6ビット化し、HL成分とHH成分は共に16で割ることにより9→5ビット化し、HH成分は破棄することにより10→0ビット化する。これにより2×2画素の係数の合計ビット数が36→16ビットに圧縮、量子化される。そして、この量子化部1201〜1203による量子化値がページメモリ1206に送られる。
【0048】
図11を参照して具体例を説明する。例えば図2に示す画素位置a〜dの画像データ1301として
a=200
b=202
c=204
d=208
をHarr Wavelet変換した係数1302は、
LL=203
HL=−3
LH=−5
HH=2
となる。
【0049】
この係数1302を上記のように下位ビット削減を行うと、
LL=50
HL=0
LH=0
HH=0
のような量子化データ1303となり、このデータ1303をページメモリ1206を介して伝送した後、削減ビットに「0」を付加すると、
LL=200
HL=0
LH=0
HH=0
のような係数1304となる。
【0050】
次いでこれを逆Harr Wavelet変換すると
a=200
b=200
c=200
d=200
に復元される。したがって、ビット数を大幅に削減したにもかかわらず、復号後の画像データ1305は原画像データ1301と概ね合っていることが分かる。また、このようにサブバンド変換を利用した固定長符号化は、式(1)に示すような加減算、ビットシフト等の単純な演算のみで実現することができ、また、復号後の画質が高い。
【0051】
<第4の実施形態>
次に、図12〜図14を参照して第4の実施形態について説明する。図12では図10に示すバッファ201、サブバンド変換部203およびページメモリ126が同一であり、サブバンド変換係数量子化部1404および領域判断部1403が異なる。領域判断部1403はサブバンド変換部203により変換された係数HL、LHに基づいて、画像を階調変化が激しいエッジ領域とそれ以外の非エッジ領域(イメージ領域)に分ける。領域判断方法は、例えば図13に示すようにHL、LH成分の内、少なくとも一方の絶対値が閾値「64」以上であればエッジ領域と判断し、閾値「64」以上でなければ非エッジ領域と判断し、フラグ情報としてエッジ領域=1、非エッジ領域=0をサブバンド変換係数量子化部1404とページメモリ126に送る。
【0052】
サブバンド変換係数量子化部1404は図13に示すように、エッジ領域についてはLL成分を4の倍数で量子化する(4で割る)ことにより8→6ビット化し、HL、LH成分を64の倍数で量子化する(64で割る)ことにより9→3ビット化する。非エッジ領域(イメージ領域)についてはLL成分を4の倍数で量子化する(4で割る)ことにより8→6ビット化し、HL、LH成分を絶対値が0、16、32、48になるような量子化代表点に量子化する(16で割る)ことにより9→3ビット化する。HH成分はエッジ領域、非エッジ領域共に全て「0」、すなわち破棄することにより10→0ビット化する。
【0053】
図14(a)、(b)を参照して具体例を説明する。図14(a)に示すように非エッジ領域の画像データ1501として例えば、
a=200
b=202
c=204
d=208
をHarr Wavelet変換した係数1502は、
LL=203
HL=−3
LH=−5
HH=2
となる。
【0054】
ここで、HL、LH成分共に、絶対値が閾値「63」以下であるので、このブロックは非エッジ領域と判断され、LL成分を4の倍数で量子化し、HL、LH成分を16で割り、HH成分を破棄すると、
LL=50(6ビット)
HL=0 (3ビット)
LH=0 (3ビット)
HH=0 (0ビット)
フラグ=0(1ビット)
合計=13ビット
となる。
【0055】
このデータ1503をページメモリ1206を介して伝送した後、削減ビットに「0」を付加すると、
LL=200
HL=0
LH=0
HH=0
のような係数1504となり、これを逆Harr Wavelet変換すると、
a=200
b=200
c=200
d=200
に復元される。したがって、ビット数を大幅に削減したにもかかわらず、復号後の画像データ1505は原画像データ1501と概ね合っていることが分かる。
次に、図14(b)に示すようにエッジ領域の画像データ1511として例えば、
a=20
b=30
c=120
d=150
をHarr Wavelet変換した係数1512は、
LL=80
HL=−20
LH=−110
HH=20
となる。
【0056】
ここで、LH成分の絶対値が閾値「63」以下でないので、このブロックはエッジ領域と判断され、LL成分を4の倍数で量子化し、HL、LH成分を64の倍数で量子化し、HH成分を破棄すると
LL=20(6ビット)
HL=0 (3ビット)
LH=−1(3ビット)
HH=0 (0ビット)
フラグ=1(1ビット)
合計=13ビット
となる。
【0057】
このデータ1513をページメモリ1206を介して伝送した後、削減ビットに「0」を付加すると、
LL=80
HL=0
LH=−64
HH=0
のような係数1514となり、これを逆Harr Wavelet変換すると、
a=24
b=24
c=112
d=112
に復元される。したがって、ビット数を大幅に削減したにもかかわらず、復号後の画像データ1515にエッジが残っていることが分かる。
【0058】
ここで、HL、LH成分は、第3の実施形態ではエッジ、非エッジ領域に依らず16の倍数で量子化するのに対し、第4の実施形態では絶対値が閾値「64」以上の場合に「64」で量子化するので、例えば「96」や「160」などの量子化代表点がなくなっている。この理由により、第4の実施形態の固定長符号化による量子化ビット数が第3の実施形態より少なくなる。しかし、階調変化が急峻なエッジ領域では、高周波成分の値を粗くサンプリングしても視覚上、気になる劣化は生じにくいので、これらの情報は間引いても画質をある程度保つことができ、したがって、上記のような像域分離により効率的に固定長符号化することができる。
【0059】
<第5の実施形態>
次に、図15〜図18を参照して第5の実施形態について説明する。図15に示す第5の実施形態では、領域判断部1403aとサブバンド変換係数量子化・符号化部1404aの処理が第4の実施形態と異なっている。領域判断部1403aは図16に示すように、サブバンド変換部203により変換された係数HL、LHに基づいて、画像を階調変化が激しいエッジ領域とそれ以外の非エッジ領域(イメージ領域)に分けるために、HL、LH成分の内、少なくとも一方の絶対値が閾値「16」以上であればエッジ領域と判断し、「16」以上でなければ非エッジ領域と判断し、フラグ情報としてエッジ領域=1、非エッジ領域=0をサブバンド変換係数量子化・符号化部1404aとページメモリ1206に送る。
【0060】
サブバンド変換係数量子化・符号化部1404aは、エッジ領域か非エッジ領域かに応じて固定長符号化する場合のビット配分を変更する。例えば非エッジ領域では階調性が視覚上重要であるのでLL成分に6ビットを配分し、HL、LH成分の各々には3ビットを配分する。また、エッジ領域ではエッジの大きさが視覚上重要であるのでLL成分に4ビットを配分し、HL、LH成分の各々にも同様に4ビットを配分する。
【0061】
すなわち、サブバンド変換係数量子化・符号化部1404aは図16、図17に示すように、エッジ領域についてはLL成分を16の倍数で量子化する(16で割る)ことにより8→4ビット化し、HL、LH成分を32の倍数で量子化する(32で割る)ことにより9→4ビット化する。非エッジ領域についてはLL成分を4の倍数で量子化する(4で割る)ことにより8→6ビット化し、HL、LH成分を4の倍数で量子化する(4で割る)ことにより9→3ビット化する。HH成分はエッジ、非エッジ領域共に全て「0」、すなわち破棄することにより10→0ビット化する。
【0062】
図18(a)、(b)を参照して具体例を説明する。図18(a)に示すように非エッジ領域の画像データ1801として例えば、
a=200
b=202
c=204
d=208
をHarr Wavelet変換した係数1802は、
LL=203
HL=−3
LH=−5
HH=2
となる。
【0063】
ここで、HL、LH成分成分共に、絶対値が閾値「16」より小さいので、このブロックは非エッジ領域と判断され、LL成分を4の倍数で量子化し、HL、LH成分を4の倍数で量子化し、HH成分を破棄すると、
LL=50(6ビット)
HL=0 (3ビット)
LH=−1(3ビット)
HH=0 (0ビット)
フラグ=0(1ビット)
合計=13ビットとなる。
【0064】
このデータ1803をページメモリ1206を介して伝送した後、フラグ=0に基づいて削減ビットに「0」を付加すると、
LL=200
HL=0
LH=−4
HH=0
のような係数1804となり、これを逆Harr Wavelet変換すると、
a=198
b=198
c=202
d=202
に復元される。
【0065】
また、図18(b)に示すようにエッジ領域の画像データ1811として例えば、
a=20
b=30
c=120
d=150
をHarr Wavelet変換した係数1812は、
LL=80
HL=−20
LH=−110
HH=20
となる。
【0066】
ここで、HL、LH成分の絶対値が共に閾値「15」を超えるので、このブロックはエッジ領域と判断され、LL成分を4の倍数で量子化し、HL、LH成分を32の倍数で量子化し、HH成分を破棄すると、
LL=5 (4ビット)
HL=0 (4ビット)
LH=−3(4ビット)
HH=0 (0ビット)
フラグ=1(1ビット)
合計=13ビット
となる。
【0067】
このデータ1813をページメモリ1206を介して伝送した後、フラグ=1に基づいて削減ビットに「0」を付加すると、
LL=80
HL=0
LH=−96
HH=0
のような係数1814となり、これを逆Harr Wavelet変換すると、
a=32
b=32
c=128
d=128
に復元される。
【0068】
ここで、HL、LH成分は、第3の実施形態ではエッジ、非エッジ領域に依らず同じ配分ビット数で係数を符号化するのに対し、第5の実施形態ではエッジ、非エッジ領域に応じて異なる配分ビット数で係数を符号化し、階調性が視覚上重要である非エッジ領域ではLL成分を細かくサンプリングし、逆に濃度変化が視覚上重要であるエッジ領域では、濃度変化を表すHL、LHを細かくサンプリングするので、画像の特徴を保ったまま効率的に固定長符号化することができる。
<第6の実施形態>
次に、図19、図20を参照して第6の実施形態について説明する。図19では、第2の実施形態(図7、図8参照)に対応して、サブバンド変換部203により画素値a〜d(図8のような差分でない)をHarr Wavelet変換し、低周波成分LLは低周波成分量子化部206により量子化され、高周波成分HL、LH、HHは高周波成分ベクトル量子化部207により図7に示すテーブルに基づいてベクトル量子化される。
【0069】
図20を参照して具体例を説明すると、
a=20
b=30
c=120
d=150
のような原画像データ1101に対してHarr Wavelet変換すると、係数1102は、
となる。
【0070】
そして、LL成分を6ビットで表すと、
LL=20(6ビット)
となる。また、HL、LH、HH成分(−20,−110,20)については図7に示すテーブルを参照して最も近い
(HL,LH,HH)=(0,−128,0)
を選択し、量子化代表ベクトルを表す符号「12」を量子化値「12」(4ビットとすることにより合計10ビットに圧縮する。
【0071】
復号化では、LL=20(6ビット)に2ビットの「0」を付加し、また、ベクトル量子化値「12」に基づいて
(LL,HL,LH,HH)=(80,0,−128,0)
を復元し、これを逆Harr Wavelet変換すると、
a=16
b=16
c=144
d=144
のような画像データ1105が復元される。
【0072】
<第7の実施形態>
図21〜図23は第7の実施形態として、第5の実施形態におけるビット配分と第6の実施形態における高周波成分ベクトル量子化を組み合わせた場合を示している。先ず、領域判断については、第5の実施形態と同様に、図21に示すようにHL、LH成分の内、少なくとも一方の絶対値が閾値「16」以上であればエッジ領域と判断し、閾値「16」以上でなければ非エッジ領域と判断する。このとき、エッジ領域では図21、図22(a)に示すようにLL成分に上位4ビットを割り当て、高周波成分HL、LH、HHに下位4ビットを割り当てる。また、非エッジ領域では図21、図22(b)に示すようにLL成分に上位6ビットを割り当て、高周波成分HL、LH、HHに下位2ビットを割り当てる。また、図22(c)に示すように下位2ビットをフラグ情報として用い、非エッジ領域では「00」とし、エッジ領域では「00」としない。
【0073】
量子化については図21、図22(d)に示すように、エッジ領域ではLL成分を16で割って4ビット化し、高周波成分を4ビットでベクトル量子化する。但し、フラグを伝送するために、0=0000、4=0100、8=1000、12=1100は用いない。非エッジ領域ではLL成分を4で割って6ビット化し、高周波成分は「00」しか用いない。
【0074】
例えば図23に示すようにエッジ領域の画像データ1311として、
a=20
b=30
c=120
d=150
をHarr Wavelet変換した係数1312は、
LL=80
HL=−20
LH=−110
HH=20
となる。
【0075】
ここで、HL、LH成分の絶対値が共に閾値「15」を超えるので、このブロックはエッジ領域と判断され、LL成分を16で割ると、
LL=20=1010(4ビット)
となる。また、HL、LH、HH成分(−20,−110,20)については図23(d)を参照して最も近い (HL,LH,HH)=(0,−128,0)を選択し、量子化代表ベクトルを表す符号「13」を量子化値「13」=0111(4ビット)とすることにより合計8ビットに圧縮する。
【0076】
復号化では、下位2ビットが「00」でないのでエッジ領域と判断され、
LL=80
HL=0
LH=−128
HH=0
が復元され、次いで逆Harr Wavelet変換により、
a=16
b=16
c=144
d=144
が復元される。
【0077】
したがって、この第7の実施形態によれば、第5の実施形態に比べてフラグ情報のためにビットを独立して配分する必要がないので、固定長符号化ビット数が少ない場合に画像データを有効に符号化することができる。
【0078】
<第8の実施形態>
次に、図24を参照して第8の実施形態について説明する。ここで、第7の実施形態(図22参照)のように固定長符号化であって、像域に応じて周波数成分LL、HL、LH、HHのビット配分を変えると、異なる領域間のデータの相関性が悪くなることがあり、これをそのままエントロピー符号化すると高い圧縮率が得られない。
【0079】
図24(1)(a)は第7の実施形態におけるエッジ領域の8ビットデータを示し、LL成分の上位4ビットと高周波成分のベクトル量子化値の下位4ビットより成る。ここで、一般に、エッジの大きなブロックは画像中に現れにくいので、図22(d)に示す量子化テーブルを用いるとベクトル量子化値は小さな値をとることが多くなり、このため、下位4ビットのMSB側2ビットのプレーンは「「0」が多く、LSB側2ビットのプレーンは「0」、「1」のどちらが現れるか予測がつかないランダムなデータになる。
【0080】
図24(1)(b)は第7の実施形態における非エッジ領域の8ビットデータを示し、LL成分の上位6ビットとフラグ情報の下位2ビットより成る。ここで、LL成分の上位6ビットの下位2ビットのプレーンはランダムなデータであり、フラグ情報の下位2ビットは常に「00」である。
【0081】
このようなビット配分では、エッジ領域と非エッジ領域の各MSB側4ビットは共に、LL成分のMSB側4ビットを意味しており、異なる領域間でも相関が良い。ところが、MSBから5、6番目のビットデータは、エッジ領域では「0」が多いが、非エッジ領域ではランダムデータに近いので、エッジ領域における相関の良さが、非エッジ領域における相関の悪さのために失われている。また、7、8番目のビットデータは、非エッジ領域では全て「00」のため領域間の相関が良いが、エッジ領域ではランダムなデータのため領域間の相関の良さが失われている。
【0082】
そこで、第8の実施形態では例えば図24(2),(b)に示すように、非エッジ領域のMSBから5番目と7番目、6番目と8番目のビットデータと入れ替えることにより、ビット配分を調整する。この調整により、8ビットの固定長符号のMSB側4ビットはエッジ、非エッジ領域共に、LL成分のMSB4ビットを意味して相関がよく、5、6番目のビットはエッジ、非エッジ領域共に「0」が多く、7、8番目のビットはエッジ、非エッジ領域共にランダムなデータとなり、したがって、相関が良い固定長符号を実現することができる。その結果、ページメモリ内のデータをソート機能等のために蓄積メモリに保存する場合、エントロピー符号化する場合に効率的に圧縮することができる。
【0083】
【発明の効果】
以上説明したように請求項1記載の発明によれば、画像データをサブバンド変換した各変換係数の下位ビットを間引いて固定長で量子化するので、画像の回転等の各種編集、加工を簡単に行うことができる。
【0084】
請求項2記載の発明によれば、画像データをサブバンド変換した各変換係数の下位ビットを、画像種に応じて異なるビット数だけ間引き、画像種を示すフラグと共に固定長で量子化するので、エッジ領域と非エッジ領域などに関係なく高画質で且つ効率的に圧縮することができる。また、復号化側ではフラグに基づいて簡単に原画像データを復元することができる。
【0085】
請求項3記載の発明によれば、画像データをサブバンド変換した低周波成分の下位ビットをエッジ領域では多く間引き、非エッジ領域では少なく間引くので、階調性が視覚上重要な非エッジ領域とエッジの大きさが視覚上重要なエッジ領域を高画質で且つ効率的に圧縮することができる。また、復号化側ではフラグに基づいて簡単に原画像データを復元することができる。
【0086】
請求項4記載の発明によれば、画像データをサブバンド変換した高周波成分をベクトル量子化するので、更に効率的に圧縮することができる。
【0087】
請求項5記載の発明によれば、フラグ情報を量子化テーブルに埋め込むので、フラグ情報にビットを割り当てずに済み、したがって、更に効率的に圧縮することができる。
【0088】
請求項6記載の発明によれば、画像種が異なる間の固定長符号の相関が向上するようにビット配列を変更するので、これをエントロピー符号化する場合に更に効率的に圧縮することができる。
【図面の簡単な説明】
【図1】本発明に係る画像処理装置の一実施形態を示すブロック図である。
【図2】図1のサブバンド変換部の処理を示す説明図である。
【図3】図1の画像処理装置による圧縮、伸長処理を示す説明図である。
【図4】完全2値画像が揺らいだ場合の図1の画像処理装置による圧縮、伸長処理を示す説明図である。
【図5】図1の画像処理装置による下位ビット間引き処理を示す説明図である。
【図6】図1の画像処理装置による下位ビット間引き処理を示す説明図である。
【図7】第2、第6の実施形態におけるベクトル量子化テーブルを示す説明図である。
【図8】第2の実施形態の画像処理装置を示すブロック図である。
【図9】第2の実施形態における圧縮、伸長処理を示す説明図である。
【図10】第3の実施形態の画像処理装置を示すブロック図である。
【図11】第3の実施形態における圧縮、伸長処理を示す説明図である。
【図12】第4の実施形態の画像処理装置を示すブロック図である。
【図13】第4の実施形態における領域判断と量子化の各処理を示す説明図である。
【図14】第4の実施形態における非エッジ領域とエッジ領域の各圧縮、伸長処理を示す説明図である。
【図15】第5の実施形態の画像処理装置を示すブロック図である。
【図16】第5の実施形態における領域判断と量子化の各処理を示す説明図である。
【図17】第5の実施形態における非エッジ領域とエッジ領域の各ビット割り当てを示す説明図である。
【図18】第5の実施形態における非エッジ領域とエッジ領域の各圧縮、伸長処理を示す説明図である。
【図19】第6の実施形態の画像処理装置を示すブロック図である。
【図20】第6の実施形態における圧縮、伸長処理を示す説明図である。
【図21】第7の実施形態における領域判断と量子化の各処理を示す説明図である。
【図22】第7の実施形態における非エッジ領域とエッジ領域の各ビット割り当てと、ベクトル量子化テーブルを示す説明図である。
【図23】第7の実施形態における圧縮、伸長処理を示す説明図である。
【図24】第8の実施形態におけるビット配列を示す説明図である。
【符号の説明】
202 2値化画像・差分データ作成部
203 サブバンド変換部
204,204a,204b,204c エントロピー符号化部
205 メモリ
206 低周波(LL)成分量子化部
207 高周波成分ベクトル量子化部
1203 LL成分量子化部
1204 HL成分量子化部
1205 LH成分量子化部
1206 ページメモリ
1403,1403a 領域判断部
1404,1404a サブバンド変換係数量子化部
Claims (6)
- 画像データをn×m画素のブロック毎に分割する分割手段と、
前記分割手段によりブロック毎に分割されたn×m画素の画像データをサブバンド変換して変換係数を算出するサブバンド変換手段と、
前記サブバンド変換手段により算出された各変換係数の下位ビットを間引いて固定長で量子化する量子化手段と、
を備えた画像処理装置。 - 画像データをn×m画素のブロック毎に分割する分割手段と、
前記分割手段によりブロック毎に分割されたn×m画素の画像データをサブバンド変換して変換係数を算出するサブバンド変換手段と、
前記サブバンド変換手段により算出された変換係数の絶対値が閾値を超えるか否かに基づいてそのブロックの画像種を判断する領域判断手段と、
前記サブバンド変換手段により算出された各変換係数の下位ビットを、前記領域判断手段により判断された画像種に応じて異なるビット数だけ間引き、画像種を示すフラグと共に固定長で量子化する量子化手段と、
を備えた画像処理装置。 - 前記量子化手段は、前記サブバンド変換手段により算出された低周波成分の下位ビットをエッジ領域では多く間引き、非エッジ領域では少なく間引くことを特徴とする請求項2記載の画像処理装置。
- 前記量子化手段は、前記サブバンド変換手段により算出された高周波成分をベクトル量子化することを特徴とする請求項2または3記載の画像処理装置。
- 前記量子化手段は、フラグ情報を量子化テーブルに埋め込むことを特徴とする請求項2ないし4のいずれか1項に記載の画像処理装置。
- 前記量子化手段は、画像種が異なるブロック間の固定長符号の相関が向上するようにビット配列を変更することを特徴とする請求項2ないし5のいずれか1項に記載の画像処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003177919A JP2004032772A (ja) | 2003-06-23 | 2003-06-23 | 画像処理装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003177919A JP2004032772A (ja) | 2003-06-23 | 2003-06-23 | 画像処理装置 |
Related Parent Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11820797A Division JP3457840B2 (ja) | 1997-05-08 | 1997-05-08 | 画像処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2004032772A true JP2004032772A (ja) | 2004-01-29 |
Family
ID=31185432
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003177919A Pending JP2004032772A (ja) | 2003-06-23 | 2003-06-23 | 画像処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2004032772A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008506987A (ja) * | 2004-07-14 | 2008-03-06 | エージェンシー フォー サイエンス,テクノロジー アンド リサーチ | 信号の状況(コンテキスト)ベース符号化及び復号化 |
US7676097B2 (en) | 2004-08-12 | 2010-03-09 | Seiko Epson Corporation | Bit shift processing in wavelet-based image codecs |
US10652540B2 (en) | 2017-03-03 | 2020-05-12 | Ricoh Company, Ltd. | Image processing device, image processing method, and recording medium storing image processing program |
-
2003
- 2003-06-23 JP JP2003177919A patent/JP2004032772A/ja active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008506987A (ja) * | 2004-07-14 | 2008-03-06 | エージェンシー フォー サイエンス,テクノロジー アンド リサーチ | 信号の状況(コンテキスト)ベース符号化及び復号化 |
JP4842265B2 (ja) * | 2004-07-14 | 2011-12-21 | エージェンシー フォー サイエンス,テクノロジー アンド リサーチ | 信号の状況(コンテキスト)ベース符号化及び復号化 |
US7676097B2 (en) | 2004-08-12 | 2010-03-09 | Seiko Epson Corporation | Bit shift processing in wavelet-based image codecs |
US10652540B2 (en) | 2017-03-03 | 2020-05-12 | Ricoh Company, Ltd. | Image processing device, image processing method, and recording medium storing image processing program |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6459816B2 (en) | Image processing system for compressing image data including binary image data and continuous tone image data by a sub-band transform method with a high-compression rate | |
JP4365957B2 (ja) | 画像処理方法及びその装置及び記憶媒体 | |
US7016545B1 (en) | Reversible embedded wavelet system implementation | |
US6263109B1 (en) | Context-based ordering and coding of transform coefficient bit-planes for embedded bitstreams | |
US20030138153A1 (en) | Printing system application using J2K | |
US6985634B2 (en) | Image processing system for compressing image data including binary image data and continuous tone image data by a sub-band transform method with a high-compression rate | |
JPH11284516A (ja) | デ―タ処理装置、デ―タ処理方法及び記憶媒体 | |
WO1999017257A2 (en) | System and method for compressing images using multi-threshold wavelet coding | |
JPH11168633A (ja) | 再構成実行方法、再構成実行装置、記録媒体、逆変換実行方法、逆変換実行装置、好適再構成生成方法、好適再構成生成装置、符号化データ処理方法、符号化データ処理装置、データ処理方法、データ処理装置、符号化データのタイル処理方法、符号化データのタイル処理装置、データ復号化方法、データ復号化装置、再構成方法、及び、2値データモデル化方法 | |
JP2005236895A (ja) | 画像符号化装置及び方法、並びに画像復号装置及び方法 | |
US8559742B2 (en) | Image encoding methods and apparatus providing improved visual results | |
JP2007267384A (ja) | 圧縮装置及び圧縮方法 | |
JP2006502604A (ja) | 任意形状オブジェクトの画像圧縮方法 | |
US20080095455A1 (en) | Image encoding apparatus and control method thereof | |
US20010051003A1 (en) | Method for compressing and decompressing digital having text | |
US6853318B1 (en) | Digital image compression utilizing shrinkage of subband coefficients | |
JP2000059782A (ja) | 空間領域デジタル画像の圧縮方法 | |
JP2004032772A (ja) | 画像処理装置 | |
JP3457840B2 (ja) | 画像処理装置 | |
JPH08116450A (ja) | 画像圧縮装置および画像伸長装置 | |
JP2002290743A (ja) | 画像情報符号化方法、符号化装置、ディジタル複写機、ディジタルファクシミリ装置、及び、ディジタルファイリング装置 | |
US20050141774A1 (en) | Image compression utilizing discarding of bitplanes | |
JPH11136519A (ja) | 画像処理装置 | |
JP3833585B2 (ja) | 画像符号化装置および画像符号化方法、コンピュータプログラム | |
JPH11164150A (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20050817 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050920 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051121 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060110 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060310 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060411 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060612 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20060711 |