JP3774933B2 - Image coding apparatus and image coding method - Google Patents
Image coding apparatus and image coding method Download PDFInfo
- Publication number
- JP3774933B2 JP3774933B2 JP9555396A JP9555396A JP3774933B2 JP 3774933 B2 JP3774933 B2 JP 3774933B2 JP 9555396 A JP9555396 A JP 9555396A JP 9555396 A JP9555396 A JP 9555396A JP 3774933 B2 JP3774933 B2 JP 3774933B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- spatial frequency
- image signal
- input image
- transform coefficient
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【発明の属する技術分野】
この発明は、画像の伝送・蓄積に際して画像の情報量を削減する機能を備えた画像コーデックに関するものである。
【0002】
【従来の技術】
図9は例えば、ISO DIS 10918ー1 Recommendation−T.81(JPEG)に記載された従来の画像コーデック(エンコーダ)の構成を示すブロック図である。図において、20はDCT(DiscreteCosine Transform)変換器、30はDCT変換器20に接続された量子化器、40は量子化器30に接続された可変長符号化器である。図10は従来の画像コーデツク(デコーダ)の構成を示すブロック図である。図において、70は可変長復号器、80は可変長復号器70に接続された逆量子化器、90は逆量子化器80に接続されたDCT逆変換器である。
【0003】
次に動作について説明する。DCT変換器20は、入力信号を8×8の2次元ブロックに分割し、式1に従って、入力画像信号f(x、y)(x、y=0、1、…、7)を変換係数F(u、v)(u、v=0、1、…、7)に直交変換する。
【0004】
【数1】
【0005】
また、DCT逆変換器90は、式2に従って変換係数F(u、v)を直交変換し、もとの画像信号f(x、y)を復元する。この時、変換係数の量子化がなければ、逆変換後の信号は、変換前の信号と正確に一致する。
【0006】
【数2】
【0007】
式1、式2において、u、vはそれぞれ、画像の水平周波数と垂直周波数に対応し、変換係数F(u、v)は、二次元周波数領域(u、v)における画像信号のスペクトルに対応する。DCT変換器20は信号を周波数成分に分解するアナライザ、DCT逆変換器90は、周波数成分をもとの信号に合成するシンセサイザである。このため、DCT変換・逆変換の動作は、信号を複数の帯域に分割し、各帯域をナイキストレートで伝送するサブバンド符号化とみなすことができる。図11は、このような観点から見た一次元DCTの動作を示す概念的なブロック図である。図において、370〜377は変換側のデジタルフィルタ(分解フィルタ)、380〜387は8:1のデシメータ、390〜397は1:8のインタポレータ、400〜407は逆変換側のデジタルフィルタ(合成フィルタ)、309は加算器である。
【0008】
図9において、入力信号は、まず分解フィルタ370〜377により、8個の周波数帯域に分解される。分解フィルタの係数は、DCT変換の定義式によって与えられる。次に、分解フィルタの出力は、デシメータ380〜387において、1/8にリサンプリングされる。リサンプリング後の信号レートはもとの信号レートの1/8になるが、並列に8個の信号を出力するため、全体の信号レートは変わらない。デシメータ380〜387の出力は変換されたDCT係数である。インタポレータ390〜397は、それぞれ、1/8のレートで伝送されたDCT係数の信号系列に0を補間して、信号レートをもとに戻す。合成フィルタ400〜407は補間された信号系列に逆変換用のフィルタをかける。このフィルタ係数は、DCT逆変換の定義より与えられる。この合成フィルタにより、各帯域の信号はもとの信号レートで再生される。これらの信号は加算器309で加算され、もとの画像信号に戻る。
【0009】
図11において、分解フィルタの特性は理想的でありえないから、DCT係数にはリサンプリングによる折返し成分が含まれている。この折返し成分は、合成フィルタ400〜407の出力まで残留し、加算器309において互いに打ち消されて0になる。ここで、フィルタ特性が理想的であるとは、信号がサンプリング周波数の1/2以下に厳密に帯域制限されるという意味において用いた。
【0010】
以上、一次元DCTの場合を説明したが、二次元DCTの場合は、分解フィルタ、合成フィルタが二次元フィルタとなり、デシメータ、インターポレータが二次元空間における操作になるだけであり、折り返し成分の混入キャンセルについては、全く同様の議論が成り立つ。
【0011】
このように、全ての係数が伝送される場合には、係数に含まれる折り返し歪みは互いにキャンセルされて問題とならないが、後述のように、係数の一部が事実上打ち切られると、折り返し成分は再生画像に残留することになる。
【0012】
DCT係数のうち、F(0、0)は最も低域の周波数に対応しDC係数と呼ばれ、その他の係数はAC係数と呼ばれる。また、一般的な画像信号の性質から、変換後の信号電力は、低域周波数の変換係数に集中する。
【0013】
次に、量子化器30は、DCT係数の値を、決められた代表値にマッピングし、この代表値に割り当てられた量子化インデックスを出力する。逆量子化器80は量子化インデックスから代表値を復元する。量子化・逆量子化の動作は、多対一の写像であるから、もとの信号が完全に復元されることはない。量子化において、多数の信号値を少数の代表値に置き換えることにより、信号の情報量(エントロピー)が減少し、他方、真の信号値とその代表値との差は、符号化歪みとして再生画像中に現れる。
【0014】
ここで、量子化の粗さは、信号レートと符号化歪みのトレードオフで決定される。また、量子化の粗さはDCT係数毎に最適化され、人間の視覚特性を考慮して、通常、低域の係数は細かく、高域の係数は粗く量子化される。
【0015】
量子化器30から出力された量子化インデックスは、可変長符号化器40において、その生起確率に基づいてエントロピー符号化される。DC係数は、空間的な冗長性の除去のため、ブロック間の差分を演算し、この差分をハフマン符号等により可変長符号化する。AC係数は、まず、低域係数から高域係数にかけて二次元的なスキャン(ジグザグスキャン)を行って一次元の信号系列に変換し、ラン(有意信号に先行する0の数)とアンプリチュード(有意信号の値)の組み合わせをハフマン符号等により可変長符号化する。可変長符号はさらに同期信号を付加されて、符号化されたビットストリームとなる。可変長復号器70は、ビットストリームから同期を回復し、符号化側と反対の操作を行って、もとの量子化インデックスを復元する。可変長符号・復号は可逆符号化であり、伝送エラー以外の誤差は導入されない。
【0016】
このように、(1)DCT変換後の信号電力は低域の変換係数に集中することと、(2)高域の変換係数ほど相対的に粗く量子化されることの二点から、量子化インデックスの分布は、高域の変換係数ほど0に集中する。一定期間(例えば画像の1フレーム期間)常に0に量子化される変換係数を以下無意係数、その他の係数を有意係数と呼ぶことにする。図12は従来のDCT変換における有意係数と無意係数を説明するための図である。ここでは、64個の変換係数のうち、27個は無意係数となっている。
【0017】
無意係数は、デコーダにおいて一定値(0)に復号される。無意係数のエントロピーは0であり、何ら符号量が割り当てられていない。しかし、実際には無意係数の電力は0ではなく、この電力は符号化により打ち切られ、伝送されなかったものと考えられる。量子化が十分細かい場合には、無意係数の電力は小さいため、この係数を打ち切ることによる再生画像への影響は少ない。しかし、量子化が粗い場合には、無意係数の電力は無視できなくなり、再生画像に係数の打ち切りによる折り返し歪みが現れる。すなわち、図11において、各合成フィルタの出力に含まれる折り返し成分が加算器309でキャンセルされずに、そのまま出力画像に残留する。
【0018】
【発明が解決しようとする課題】
従来の画像コーデックは以上のように構成されているので、符号化レートが低い場合や、符号化レートは高くても符号化すべき画像が高域周波数成分を多く含む場合などに、無視できない信号電力が無意係数として打ち切られ、折り返し歪みが発生していた。この折り返し歪みは、再生画像において、ブロック歪みやモスキートノイズとよばれる妨害を引き起こしていた。
【0019】
この発明は上記のような問題点を解消するためになされたもので、高域係数の打ち切りに起因する折り返し歪みを軽減し、視覚的な妨害が少ない画像コーデックを提供することを目的とする。
【0020】
【課題を解決するための手段】
この発明に係る画像符号化装置においては、
量子化特性を出力する量子化制御器と、
前記量子化特性により設定されるフィルタ特性に基づいて、入力画像信号を構成する空間周波数から所定の空間周波数を減衰処理する前置きフィルタと、
当該減衰処理された入力画像信号を、当該減衰処理された入力画像信号を構成する空間周波数に対応する変換係数群に変換する変換手段と、
前記量子化特性に基づいて前記変換係数群を量子化処理する量子化手段と、
当該量子化処理された変換係数群を符号化処理し、ビットストリームを出力する符号化手段と
を備え、
前記フィルタ特性は、
前記入力画像信号を構成する空間周波数に対応する変換係数群を、前記量子化特性に基づいて量子化処理した場合に、エントロピーが0となる変換係数に対応する空間周波数を、前記入力画像信号を構成する空間周波数から減衰処理するように設定される
ものである。
【0024】
【発明の実施の形態】
この発明に係るスペクトル制御手段においては、量子化手段によって量子化された係数群を有意係数と無位係数に分類し、前置フィルタを制御して、有意係数に対応する周波数成分を保存し、無位係数に対応する周波数成分を減衰させるように働く。
【0025】
また、この発明に係るスペクトル制御手段においては、量子化手段によって量子化された係数群を有意係数と無意係数に分類し、前記前置フィルタを制御して、有意係数に対応する全ての周波数成分を保存する低域通過特性を用いて、無意係数に対応する周波数成分を減衰させるように働く。
【0026】
さらに、この発明に係るスペクトル制御手段においては、量子化して伝送された係数群を有意係数と無意係数に分類し、前記後置フィルタを制御して、有意係数に対応する周波数成分を保存し、無意係数に対応する周波数成分を減衰させるように働く。
【0027】
また、この発明に係るスペクトル制御手段においては、量子化して伝送された係数群を有意係数と無意係数に分類し、前記後置フィルタを制御して、有意係数に対応する全ての周波数成分を保存する低域通過特性を用いて、無意係数に対応する周波数成分を減衰させるように働く。
【0028】
以下、この発明をその実施の形態を示す図面に基づいて具体的に説明する。
実施の形態1.
図1はこの発明の実施の形態1である画像コーデックの構成図である。図において、110は遅延器、10は遅延器110に接続された前置フィルタ、20は前置フィルタ10に接続された第一の変換器、30は変換器20に接続された量子化器、40は量子化器30に接続された可変長符号化器、21は第二の変換器、50は第二の変換器21に接続された量子化制御器、60は量子化制御器50に接続されたスペクトル制御器である。スペクトル制御器60の出力は前置フィルタ10に接続され、量子化制御器50の他の出力は量子化器30に接続される。
【0029】
次に動作について説明する。第一の変換器20、量子化器30、可変長符号化器40の動作は従来例の場合と同じである。符号化されたビットストリームは可変長符号化器40から出力される。量子化器30はN個(Nは整数)の量子化特性を持ち、各変換係数に使用する量子化特性の組み合わせは量子化制御器50によって制御される。
【0030】
量子化制御器50は、可変長符号器40から出力される信号のビット量が予め決められた目標値と一致し、かつ量子化歪みが最小となるように、量子化器30における量子化特性の組み合わせを決定する。例えば、各変換係数のレート歪み関数が既知のとき、与えられた符号量のもとで、全体の量子化歪みを最小とする量子化特性の組み合わせの求め方が知られている。これは、まず、全ての変換係数を0に量子化した状態から始めて、最も量子化歪みが減少する係数の量子化特性を一ステップ細かくし、全体のビットレートが目標値となるまでこの操作を繰り返すものである。レート歪み関数は、第二の変換器21から得られる変換係数の電力とあらかじめ設定された変換係数の確率密度モデルから求められる。
【0031】
上記した量子化制御の結果、量子化特性が初期状態から変化しない係数は、0(または一定値)に量子化され無意係数となる。スペクトル制御器60は前置フィルタ10を制御して、入力信号から無意係数に対応する周波数帯域を減衰させる。なお、遅延器110は変換器21、量子化制御器50、スペクトル制御器60における信号の処理時間を補償するためのものである。
【0032】
図2はこの発明の実施の形態1である画像コーデックにおける前置フィルタの構成図である。図において、130〜137は垂直フィルタ、140〜217は垂直フィルタ130〜137にカスケード接続された水平フィルタ、220〜297はそれぞれ、水平フィルタ140〜217に接続されたオンオフスイッチ、300〜307はオンオフスイッチ220〜297に接続された加算器、308はこの加算器300〜307に接続された他の加算器、111は入力信号に接続された遅延器、310は遅延器111と加算器308に接続された減算器である。
【0033】
垂直フィルタ130〜137は、それぞれ、垂直方向の変換係数に対応する各周波数帯域を選択的に通過させる垂直フィルタであり、130はローパスフィルタ(LPF)、131〜137はBPFの特性を持つ。次に、これらの垂直フィルタによって抽出された各周波数成分は、水平フィルタ140〜217によって、さらに水平方向に帯域制限される。ここで、水平フィルタの特性は、水平方向の変換係数に対応する各周波数帯域を取り出すよう設定されている。従って、ツリー状に構成された二次元フィルタの各枝には、全ての変換係数に対応する二次元の周波数帯域が抽出される。次に、各枝に接続されたオンオフスイッチ220〜297は、スペクトル制御器60からの指示に基づいて、無意係数に対応する帯域のフィルタをオンし、有意係数に対応する帯域のフィルタをオフにする。この結果は、加算器300〜308により全て加算される。したがって、加算器308の出力には無意係数に対応する全ての周波数成分が抽出されている。この信号は減算器310のよりもとの信号から減算されるので、前置フィルタの出力は、結局、原信号から無意係数の周波数帯域を取り除いたものとなる。遅延器111は、上記のフィルタ処理にかかる遅延時間を補償するためのものである。
【0034】
図3はこの発明の実施の形態1および3である画像コーデックの動作を示す説明図であり、スペクトル制御の具体例を示している。図において、斜線を施した周波数領域は無意係数に対応するものであり、この周波数成分が前置フィルタ10で減衰する。
【0035】
図1では、量子化制御は入力信号とそのレート歪み関数をもとに行われたが、有意係数と無意係数が判定できる機構があればどのようなものでもよい。図4はこの発明の実施の形態1である他の画像コーデックの構成図であり、詳しくは、エンコーダの出力端に送信バッファを設け、そのバッファ残量によって量子化特性を制御するフィードバック型の量子化制御機能をもつ画像エンコーダである。図において、110は遅延器、10は遅延器110に接続された前置フィルタ、20は前置フィルタ10に接続された変換器、30は変換器20に接続された量子化器、40は量子化器30に接続された可変長符号化器、120は可変長符号化器40に接続された送信バッファ、21は第二の変換器、50は第二の変換器21と送信バッファ120に接続された量子化制御器、60は量子化制御器50に接続されたスペクトル制御器である。スペクトル制御器60の出力は前置フィルタ10に接続され、量子化制御器50の他の出力は量子化器30に接続される。
【0036】
図4において、遅延器110、前置フィルタ10、変換器20、量子化器30、可変長符号化器40、第二の変換器21、スペクトル制御器60の構成と動作は図1の場合と同様である。送信バッファ120は可変長符号化器40の出力をバッファに書き込み、これを一定レートで読み出す。このバッファの書き込み側は変動レートであり、読み出し側は一定レートであるため、バッファに蓄積されるデータ量(バッファ残量)は時間とともに変化する。量子化制御器50はバッファ残量をモニタして、バッファが空き状態の時は量子化を細かく、バッファが満ちると量子化を粗くし、バッファ残量が適正な範囲に入るよう量子化を制御する。
【0037】
量子化制御器50はまた、第二の変換器21から変換係数を入力し、その大きさの分布と量子化の粗さから有意係数と無意係数を判定し、その情報をスペクトル制御器60に送る。スペクトル制御器60は図1の場合と同様にして、前置フィルタ10を制御し、無意係数に対応する周波数成分を減衰させる。
【0038】
なお、上記実施の形態においては、いずれも、量子化器は複数の量子化特性を持ち、出力のビットストリームが一定レートとなるように量子化制御が行われたが、有意係数と無意係数が判別できるものであれば、どのような量子化方法であってもよく、一定の量子化特性を固定的に用いる可変レート型の量子化器でもよい。
【0039】
実施の形態2.
実施の形態1においては、前置フィルタ10は各変換係数の空間周波数に対応して任意の周波数帯域を減衰できるように構成した。しかし、構成の簡単のため、有効係数の最高周波数のみを検出し、これを通過帯域幅とするLPFにより入力信号を帯域制限するようにしても、相当の効果が得られる。
【0040】
図5はこの発明の実施の形態2である画像コーデックにおける前置フィルタの構成図である。図において、112は遅延器、330〜337は水平LPF、320は遅延器112と水平LPF330〜337に接続されたセレクタ、113はセレクタ320に接続された第二の遅延器、340〜347はセレクタ320に接続された垂直LPF、321は第二の遅延器113と垂直LPF340〜347に接続された第二のセレクタ、114は第二のセレクタ321に接続された第三の遅延器、350〜365は第二のセレクタ321に接続された二次元LPF、322は第三の遅延器114と二次元LPF350〜365に接続された第三のセレクタである。
【0041】
水平フィルタ330〜337は、DCT係数に対応して、順に水平周波数の通過帯域が狭くなるように構成されている。スペクトル制御器60は有意係数の最高周波数を検出して、これを通過させる最も帯域の狭いフィルタが選択されるようセレクタ320を制御する。遅延器112は水平フィルタ330〜337における信号遅延を補償するために挿入されている。第二の遅延器113、垂直フィルタ340〜347および第二のセレクタ321は、垂直方向に対して同様の処理を行う。第三の遅延器114、2次元LPF350〜365および第三のセレクタ322は、斜め方向に対して同様の処理を行う。
【0042】
図6はこの発明の実施の形態2および4である画像コーデックの動作を示す説明図であり、スペクトル制御処理の例を示している。図において、斜線を施した部分は前置フィルタによって減衰する周波数領域を表す。
【0043】
実施の形態3.
変換係数の一部を打ち切ることによって生じる折り返し歪みは、一方では、図11における分解フィルタ370〜377の不完全性によって、他方では合成フィルタ400〜407の不完全性によって生じる。ここで、不完全とは、現実的なフィルタは信号をサンプリング周波数の1/2以下に厳密には帯域制限できないという意味で用いた。分解フィルタに起因する折り返し歪みは、実施の形態1または2に示したように、符号器側に前置フィルタを挿入することにより軽減される。しかし、合成フィルタに起因する折り返し歪みは、復号器側に後置フィルタを挿入しなければ軽減することができない。
【0044】
図7はこの発明の実施の形態3である画像コーデックの構成図である。図において、70は可変長復号器、80は可変長復号器70に接続された逆量子化器、90は逆量子化器80に接続された逆変換器、100は逆変換器90に接続された後置フィルタ、60はスペクトル制御器である。スペクトル制御器60の出力は後置フィルタ100に接続される。
【0045】
次に動作について説明する。可変長復号器70は、伝送されたビットストリームから変換係数の量子化インデックスを復元する。逆量子化器80は量子化インデックスを量子化代表値に写像する。逆変換器90は、量子化代表値を逆変換してもとの画像信号を復元する。後置フィルタ100は、逆変換器90から出力される画像信号の周波数スペクトルを整形し、その特性は、スペクトル制御器60によって制御され、伝送されない不要な周波数成分を取り除くように決められる。また、その構成は例えば図2で与えられる。
【0046】
スペクトル制御器60は伝送された変換係数から有意係数と無意係数を判別し、無意係数に対応する周波数成分を減衰させるよう後置フィルタ100に制御信号を与える。図7において、有意係数と無意係数を判別するための情報はビットストリームに含まれるとした。ビットストリーム中にこの情報がないときには、図8に示すように、可変長復号された変換係数をモニタして無意係数を判定するようにすればよい。図8において、遅延器115はこの判定に要する時間遅れを補償するために挿入されている。
【0047】
実施の形態4.
実施の形態3では、後置フィルタにおいて、無効係数に対応する周波数成分を全て減衰させるようにしたが、有効係数の最高周波数を検出し、この周波数帯を通過帯域とするLPFを用いて、不要な周波数成分を除去するようにしても相当の効果がある。この時、後置フィルタの構成は、例えば、図5で与えられる。
【0048】
なお、上記全ての実施形態において、変換器20、21および逆変換器90はDCT変換を行うものとしたが、サブバンドフィルタバンクまたはウェーブレット変換でも同様の効果を奏する。
【0049】
また、請求項3および4の画像コーデックは、請求項1または請求項2の画像コーデックと組合わせて用いることによって、より厳密に視覚的な劣化を除去する効果がある。
【0050】
【発明の効果】
この発明は、以上説明したように構成されているので、以下に示すような効果を奏する。
【0051】
入力画像信号から無意係数に対応する周波数成分を減衰させるようにしたので、不要な信号成分を軽減することができ、視覚的な劣化の少ない画像符号化装置が得られる。
【図面の簡単な説明】
【図1】 この発明の実施の形態1である画像コーデックの構成図である。
【図2】 この発明の実施の形態1である画像コーデックにおける前置フィルタの構成図である。
【図3】 この発明の実施の形態1および3による画像コーデックの動作を示す説明図である。
【図4】 この発明の実施の形態1である他の画像コーデックの構成図である。
【図5】 この発明の実施の形態2である画像コーデックにおける前置フィルタの構成図である。
【図6】 この発明の実施の形態2および4による画像コーデックの動作を示す説明図である。
【図7】 この発明の実施の形態3である画像コーデックの構成図である。
【図8】 この発明の実施の形態3である他の画像コーデックの構成図である。
【図9】 従来の画像コーデック(エンコーダ)の構成を示すブロック図である。
【図10】 従来の画像コーデック(デコーダ)の構成を示すブロック図である。
【図11】 従来のDCT変換器の動作を示す概念的なブロック図である。
【図12】 従来のDCT変換における有意係数と無意係数を説明するための図である。
【符号の説明】
10 前置フィルタ、20,21 変換器、30 量子化器、40 可変長符号化器、50 量子化制御器、60 スペクトル制御器、70 可変長復号器、80 逆量子化器、90 逆変換器、100 後置フィルタ、110〜115 遅延器、120 バッファ、130〜217,330〜365,400〜407フィルタ、220〜297 スイッチ、300〜309 加算器、310 減算器、320〜322 セレクタ、380〜387 デシメータ、390〜397 インタポレータ。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an image codec having a function of reducing the amount of image information when transmitting and storing images.
[0002]
[Prior art]
FIG. 9 shows, for example, ISO DIS 10918-1 Recommendation-T. It is a block diagram which shows the structure of the conventional image codec (encoder) described in 81 (JPEG). In the figure, 20 is a DCT (Discrete Cosine Transform) converter, 30 is a quantizer connected to the
[0003]
Next, the operation will be described. The
[0004]
[Expression 1]
[0005]
Also, the DCT
[0006]
[Expression 2]
[0007]
In
[0008]
In FIG. 9, the input signal is first decomposed into eight frequency bands by the
[0009]
In FIG. 11, since the characteristics of the decomposition filter cannot be ideal, the DCT coefficient includes an aliasing component due to resampling. The aliasing components remain up to the outputs of the
[0010]
As described above, the case of the one-dimensional DCT has been described. However, in the case of the two-dimensional DCT, the decomposition filter and the synthesis filter are two-dimensional filters, and the decimator and the interpolator are only operations in the two-dimensional space. The same argument holds for mixing cancellation.
[0011]
In this way, when all the coefficients are transmitted, the aliasing distortions included in the coefficients are canceled each other, which is not a problem. However, as described later, when a part of the coefficients is effectively truncated, the aliasing component is It remains in the reproduced image.
[0012]
Of the DCT coefficients, F (0, 0) corresponds to the lowest frequency and is called a DC coefficient, and the other coefficients are called AC coefficients. Also, due to the nature of general image signals, the signal power after conversion is concentrated on the low-frequency conversion coefficients.
[0013]
Next, the
[0014]
Here, the roughness of quantization is determined by a trade-off between the signal rate and coding distortion. In addition, the roughness of quantization is optimized for each DCT coefficient, and in consideration of human visual characteristics, the low frequency coefficient is usually fine and the high frequency coefficient is quantized coarsely.
[0015]
The quantization index output from the
[0016]
As described above, quantization is performed from two points: (1) the signal power after DCT conversion concentrates on the low-frequency transform coefficients and (2) the higher-frequency transform coefficients are relatively coarsely quantized. The distribution of the index is concentrated at 0 as the conversion coefficient in the high band. A transform coefficient that is always quantized to 0 for a certain period (for example, one frame period of an image) is hereinafter referred to as a random coefficient, and other coefficients are referred to as significant coefficients. FIG. 12 is a diagram for explaining a significant coefficient and an insignificant coefficient in the conventional DCT transform. Here, 27 of the 64 transform coefficients are insignificant coefficients.
[0017]
The random coefficient is decoded to a constant value (0) in the decoder. The entropy of the random coefficient is 0, and no code amount is assigned. However, in reality, the power of the insignificant coefficient is not 0, and it is considered that this power was cut off by encoding and was not transmitted. When the quantization is sufficiently fine, the power of the insignificant coefficient is small, so that the effect on the reproduced image by truncating this coefficient is small. However, when the quantization is rough, the power of the insignificant coefficient cannot be ignored, and aliasing distortion due to the truncation of the coefficient appears in the reproduced image. That is, in FIG. 11, the aliasing component included in the output of each synthesis filter remains in the output image as it is without being canceled by the
[0018]
[Problems to be solved by the invention]
Since the conventional image codec is configured as described above, signal power that cannot be ignored when the encoding rate is low or when the image to be encoded contains many high-frequency components even if the encoding rate is high. Was censored as a random coefficient, and aliasing distortion occurred. This aliasing distortion has caused interference called block distortion or mosquito noise in the reproduced image.
[0019]
The present invention has been made to solve the above-described problems, and an object of the present invention is to provide an image codec that reduces aliasing distortion caused by truncation of a high frequency coefficient and has less visual interference.
[0020]
[Means for Solving the Problems]
In the image encoding device according to the present invention,
A quantization controller that outputs quantization characteristics;
Based on the filter characteristic set by the quantization characteristic, a pre-filter that attenuates a predetermined spatial frequency from the spatial frequency constituting the input image signal;
Converting means for converting the attenuated input image signal into a conversion coefficient group corresponding to a spatial frequency constituting the attenuated input image signal;
Quantization means for quantizing the transform coefficient group based on the quantization characteristics;
Encoding means for encoding the quantized transform coefficient group and outputting a bit stream;
With
The filter characteristics are:
When the transform coefficient group corresponding to the spatial frequency constituting the input image signal is quantized based on the quantization characteristic, the spatial frequency corresponding to the transform coefficient having an entropy of 0 is determined as the input image signal. It is set so as to perform attenuation processing from the constituent spatial frequency .
[0024]
DETAILED DESCRIPTION OF THE INVENTION
In the spectrum control means according to the present invention, the coefficient group quantized by the quantization means is classified into a significant coefficient and an incoherent coefficient, the prefilter is controlled, and the frequency component corresponding to the significant coefficient is stored, It works to attenuate the frequency component corresponding to the infinite coefficient.
[0025]
Further, in the spectrum control means according to the present invention, the coefficient group quantized by the quantization means is classified into a significant coefficient and an insignificant coefficient, all the frequency components corresponding to the significant coefficient are controlled by controlling the prefilter. The low-pass characteristic that preserves the frequency component is used to attenuate the frequency component corresponding to the insignificant coefficient.
[0026]
Furthermore, in the spectrum control means according to the present invention, the quantized coefficient group is classified into a significant coefficient and an insignificant coefficient, the post filter is controlled, and the frequency component corresponding to the significant coefficient is stored, It works to attenuate the frequency component corresponding to the random coefficient.
[0027]
In the spectrum control means according to the present invention, the quantized coefficient group is classified into a significant coefficient and an insignificant coefficient, and the post filter is controlled to store all frequency components corresponding to the significant coefficient. The low-pass characteristic is used to attenuate the frequency component corresponding to the random coefficient.
[0028]
Hereinafter, the present invention will be specifically described with reference to the drawings showing embodiments thereof.
FIG. 1 is a configuration diagram of an image codec according to the first embodiment of the present invention. In the figure, 110 is a delay device, 10 is a pre-filter connected to the
[0029]
Next, the operation will be described. The operations of the
[0030]
The
[0031]
As a result of the above-described quantization control, a coefficient whose quantization characteristic does not change from the initial state is quantized to 0 (or a constant value) and becomes a random coefficient. The
[0032]
FIG. 2 is a configuration diagram of a prefilter in the image codec according to the first embodiment of the present invention. In the figure, 130 to 137 are vertical filters, 140 to 217 are horizontal filters cascaded to the
[0033]
The
[0034]
FIG. 3 is an explanatory diagram showing the operation of the image codec according to the first and third embodiments of the present invention, and shows a specific example of spectrum control. In the figure, the hatched frequency region corresponds to a random coefficient, and this frequency component is attenuated by the pre-filter 10.
[0035]
In FIG. 1, the quantization control is performed based on the input signal and its rate distortion function. However, any mechanism may be used as long as it has a mechanism capable of determining the significant coefficient and the insignificant coefficient. FIG. 4 is a configuration diagram of another image codec according to the first embodiment of the present invention. Specifically, a feedback buffer is provided in which a transmission buffer is provided at the output end of the encoder and the quantization characteristic is controlled by the remaining amount of the buffer. This is an image encoder having a control function. In the figure, 110 is a delay unit, 10 is a prefilter connected to the
[0036]
4, the configurations and operations of the
[0037]
The
[0038]
In each of the above embodiments, the quantizer has a plurality of quantization characteristics and the quantization control is performed so that the output bit stream has a constant rate. Any quantization method can be used as long as it can be discriminated, and a variable rate type quantizer using fixed quantization characteristics fixedly may be used.
[0039]
In the first embodiment, the
[0040]
FIG. 5 is a configuration diagram of a prefilter in the image codec according to the second embodiment of the present invention. In the figure, 112 is a delay unit, 330 to 337 are horizontal LPFs, 320 is a selector connected to the
[0041]
The
[0042]
FIG. 6 is an explanatory diagram showing the operation of the image codec according to the second and fourth embodiments of the present invention, and shows an example of spectrum control processing. In the figure, the hatched portion represents a frequency region that is attenuated by the prefilter.
[0043]
The aliasing caused by truncating a part of the transform coefficient is caused on the one hand by imperfections of the decomposition filters 370 to 377 in FIG. 11 and on the other hand by imperfections of the synthesis filters 400 to 407. Here, incomplete is used in the sense that a realistic filter cannot strictly limit the band of a signal to 1/2 or less of the sampling frequency. As shown in the first or second embodiment, the aliasing distortion caused by the decomposition filter is reduced by inserting a pre-filter on the encoder side. However, aliasing distortion caused by the synthesis filter cannot be reduced unless a post filter is inserted on the decoder side.
[0044]
FIG. 7 is a configuration diagram of an image codec according to the third embodiment of the present invention. In the figure, 70 is a variable length decoder, 80 is an inverse quantizer connected to the
[0045]
Next, the operation will be described. The
[0046]
The
[0047]
Embodiment 4 FIG.
In the third embodiment, in the post filter, all frequency components corresponding to the invalid coefficient are attenuated, but the highest frequency of the effective coefficient is detected, and it is not necessary to use an LPF having this frequency band as a pass band. Even if such a frequency component is removed, there is a considerable effect. At this time, the configuration of the post filter is given, for example, in FIG.
[0048]
In all the above embodiments, the
[0049]
In addition, the image codec according to
[0050]
【The invention's effect】
Since the present invention is configured as described above, the following effects can be obtained.
[0051]
Having the input image signal so as to attenuate frequency components corresponding to the insignificant coefficients, it is possible to reduce unnecessary signal components, visual degradation less image encoding device can be obtained.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of an image codec according to a first embodiment of the present invention.
FIG. 2 is a configuration diagram of a prefilter in the image codec according to the first embodiment of the present invention.
FIG. 3 is an explanatory diagram showing an operation of the image codec according to the first and third embodiments of the present invention.
FIG. 4 is a configuration diagram of another image codec according to the first embodiment of the present invention.
FIG. 5 is a configuration diagram of a pre-filter in an image codec that is
FIG. 6 is an explanatory diagram showing an operation of the image codec according to the second and fourth embodiments of the present invention.
FIG. 7 is a configuration diagram of an image codec according to a third embodiment of the present invention.
FIG. 8 is a configuration diagram of another image codec according to the third embodiment of the present invention.
FIG. 9 is a block diagram illustrating a configuration of a conventional image codec (encoder).
FIG. 10 is a block diagram showing a configuration of a conventional image codec (decoder).
FIG. 11 is a conceptual block diagram illustrating the operation of a conventional DCT converter.
FIG. 12 is a diagram for explaining a significant coefficient and an insignificant coefficient in the conventional DCT transform.
[Explanation of symbols]
10 Prefilter, 20, 21 Converter, 30 Quantizer, 40 Variable Length Encoder, 50 Quantization Controller, 60 Spectrum Controller, 70 Variable Length Decoder, 80 Inverse Quantizer, 90 Inverse Converter , 100 post filter, 110 to 115 delay device, 120 buffer, 130 to 217, 330 to 365, 400 to 407 filter, 220 to 297 switch, 300 to 309 adder, 310 subtractor, 320 to 322 selector, 380 to 380 387 decimator, 390-397 interpolator.
Claims (6)
前記量子化特性により設定されるフィルタ特性に基づいて、入力画像信号を構成する空間周波数から所定の空間周波数を減衰処理する前置きフィルタと、
当該減衰処理された入力画像信号を、当該減衰処理された入力画像信号を構成する空間周波数に対応する変換係数群に変換する変換手段と、
前記量子化特性に基づいて前記変換係数群を量子化処理する量子化手段と、
当該量子化処理された変換係数群を符号化処理し、ビットストリームを出力する符号化手段と
を備え、
前記フィルタ特性は、
前記入力画像信号を構成する空間周波数に対応する変換係数群を、前記量子化特性に基づいて量子化処理した場合に、エントロピーが0となる変換係数に対応する空間周波数を、前記入力画像信号を構成する空間周波数から減衰処理するように設定される
画像符号化装置。 A quantization controller that outputs quantization characteristics;
Based on the filter characteristic set by the quantization characteristic, a pre-filter that attenuates a predetermined spatial frequency from the spatial frequency constituting the input image signal;
Converting means for converting the attenuated input image signal into a conversion coefficient group corresponding to a spatial frequency constituting the attenuated input image signal;
Quantization means for quantizing the transform coefficient group based on the quantization characteristics;
Encoding means for encoding the quantized transform coefficient group and outputting a bit stream;
With
The filter characteristics are:
When the transform coefficient group corresponding to the spatial frequency constituting the input image signal is quantized based on the quantization characteristic, the spatial frequency corresponding to the transform coefficient having an entropy of 0 is determined as the input image signal. An image encoding device that is set so as to perform attenuation processing from a spatial frequency to be configured .
前記量子化特性により設定されるフィルタ特性に基づいて、入力画像信号を構成する空間周波数から所定の空間周波数を減衰処理する前置きフィルタと、
当該減衰処理された入力画像信号を、当該減衰処理された入力画像信号を構成する空間周波数に対応する変換係数群に変換する変換手段と、
前記量子化特性に基づいて前記変換係数群を量子化処理する量子化手段と、
当該量子化処理された変換係数群を符号化処理し、ビットストリームを出力する符号化手段と
を備え、
前記フィルタ特性は、
前記入力画像信号を構成する空間周波数に対応する変換係数群を、前記量子化特性に基づいて量子化処理した場合に、エントロピーが0以外である変換係数を検出し、
当該検出された変換係数のうち、最も高次な空間周波数に対応する変換係数に基づいて通過帯域が設定され、
当該通過帯域よりも高次の空間周波数が、前記入力画像信号を構成する空間周波数から減衰するように設定される
画像符号化装置。 A quantization controller that outputs quantization characteristics;
Based on the filter characteristic set by the quantization characteristic, a pre-filter that attenuates a predetermined spatial frequency from the spatial frequency constituting the input image signal;
Converting means for converting the attenuated input image signal into a conversion coefficient group corresponding to a spatial frequency constituting the attenuated input image signal;
Quantization means for quantizing the transform coefficient group based on the quantization characteristics;
Encoding means for encoding the quantized transform coefficient group and outputting a bit stream;
With
The filter characteristics are:
When a transform coefficient group corresponding to a spatial frequency constituting the input image signal is quantized based on the quantization characteristic, a transform coefficient having an entropy other than 0 is detected,
Among the detected conversion coefficients, the passband is set based on the conversion coefficient corresponding to the highest spatial frequency,
The image encoding device , wherein a spatial frequency higher than the passband is set to attenuate from a spatial frequency constituting the input image signal .
前記量子化特性は、前記送信バッファのバッファ残量に基づいて制御される
請求項1又は2に記載の画像符号化装置。A transmission buffer for storing the bit stream,
The quantization characteristic, the image encoding apparatus according braking to <br/> claim 1 or 2 is your based on remaining buffer capacity of the transmission buffer.
前記量子化特性により設定されるフィルタ特性に基づいて、入力画像信号を構成する空間周波数から所定の空間周波数を減衰処理するフィルタリングステップと、A filtering step for attenuating a predetermined spatial frequency from a spatial frequency constituting the input image signal based on a filter characteristic set by the quantization characteristic;
当該減衰処理された入力画像信号を、当該減衰処理された入力画像信号を構成する空間周波数に対応する変換係数群に変換する変換ステップと、A conversion step of converting the attenuated input image signal into a conversion coefficient group corresponding to a spatial frequency constituting the attenuated input image signal;
前記量子化特性に基づいて前記変換係数群を量子化処理する量子化ステップと、A quantization step of quantizing the transform coefficient group based on the quantization characteristics;
当該量子化処理された変換係数群を符号化処理し、ビットストリームを出力する符号化ステップとAn encoding step of encoding the quantized transform coefficient group and outputting a bit stream;
を備え、With
前記フィルタ特性は、The filter characteristics are:
前記入力画像信号を構成する空間周波数に対応する変換係数群を、前記量子化特性に基づいて量子化処理した場合に、エントロピーが0となる変換係数に対応する空間周波数を、前記入力画像信号を構成する空間周波数から減衰処理するように設定されるWhen the transform coefficient group corresponding to the spatial frequency constituting the input image signal is quantized based on the quantization characteristic, the spatial frequency corresponding to the transform coefficient having an entropy of 0 is determined as the input image signal. Set to attenuate from the spatial frequency
画像符号化方法。Image coding method.
前記量子化特性により設定されるフィルタ特性に基づいて、入力画像信号を構成する空間周波数から所定の空間周波数を減衰処理するフィルタリングステップと、A filtering step for attenuating a predetermined spatial frequency from a spatial frequency constituting the input image signal based on a filter characteristic set by the quantization characteristic;
当該減衰処理された入力画像信号を、当該減衰処理された入力画像信号を構成する空間周波数に対応する変換係数群に変換する変換ステップと、A conversion step of converting the attenuated input image signal into a conversion coefficient group corresponding to a spatial frequency constituting the attenuated input image signal;
前記量子化特性に基づいて前記変換係数群を量子化処理する量子化ステップと、A quantization step of quantizing the transform coefficient group based on the quantization characteristics;
当該量子化処理された変換係数群を符号化処理し、ビットストリームを出力する符号化ステップとAn encoding step of encoding the quantized transform coefficient group and outputting a bit stream;
を備え、With
前記フィルタ特性は、The filter characteristics are:
前記入力画像信号を構成する空間周波数に対応する変換係数群を、前記量子化特性に基づいて量子化処理した場合に、エントロピーが0以外である変換係数を検出し、When a transform coefficient group corresponding to a spatial frequency constituting the input image signal is quantized based on the quantization characteristic, a transform coefficient having an entropy other than 0 is detected,
当該検出された変換係数のうち、最も高次な空間周波数に対応する変換係数に基づいて通過帯域が設定され、Among the detected conversion coefficients, the passband is set based on the conversion coefficient corresponding to the highest spatial frequency,
当該通過帯域よりも高次の空間周波数が、前記入力画像信号を構成する空間周波数から減衰するように設定されるA spatial frequency higher than the passband is set to attenuate from the spatial frequency constituting the input image signal.
画像符号化方法。Image coding method.
前記量子化特性は、前記蓄積ステップにおける前記ビットストリームの蓄積量に基づいて制御されるThe quantization characteristic is controlled based on an accumulation amount of the bitstream in the accumulation step.
請求項4又は5に記載の画像符号化方法。The image encoding method according to claim 4 or 5.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9555396A JP3774933B2 (en) | 1996-04-17 | 1996-04-17 | Image coding apparatus and image coding method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP9555396A JP3774933B2 (en) | 1996-04-17 | 1996-04-17 | Image coding apparatus and image coding method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09284766A JPH09284766A (en) | 1997-10-31 |
JP3774933B2 true JP3774933B2 (en) | 2006-05-17 |
Family
ID=14140778
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP9555396A Expired - Fee Related JP3774933B2 (en) | 1996-04-17 | 1996-04-17 | Image coding apparatus and image coding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3774933B2 (en) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP3611461B2 (en) * | 1998-10-06 | 2005-01-19 | 松下電器産業株式会社 | Video signal encoding device |
-
1996
- 1996-04-17 JP JP9555396A patent/JP3774933B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH09284766A (en) | 1997-10-31 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7167592B2 (en) | Method and apparatus for compression using reversible wavelet transforms and an embedded codestream | |
US5497435A (en) | Apparatus and method for encoding and decoding digital signals | |
US6195465B1 (en) | Method and apparatus for compression using reversible wavelet transforms and an embedded codestream | |
US6560369B1 (en) | Conversion of wavelet coded formats depending on input and output buffer capacities | |
US7933460B2 (en) | Resolution conversion upon hierarchical coding and decoding | |
US20060222254A1 (en) | Method and apparatus for compression using reversible wavelet transforms and an embedded codestream | |
JPH0722962A (en) | Method and apparatus for encoding/decoding for suppression of blocking artifact | |
GB2303031A (en) | Reversible wavelet transform and embedded codestream manipulation | |
JPH088685B2 (en) | Hierarchical burst communication method | |
US5719961A (en) | Adaptive technique for encoder and decoder signal transformation | |
CA2298687A1 (en) | Signal coding and decoding | |
WO2000072602A1 (en) | Multi-dimensional data compression | |
JPH08294119A (en) | Image coder/decoder | |
JP3774933B2 (en) | Image coding apparatus and image coding method | |
Chrysafis et al. | An algorithm for low memory wavelet image compression | |
JP2901656B2 (en) | Image coding device | |
JPH05236428A (en) | Image data recording and transmitting device | |
JP3853708B2 (en) | Digital image encoding apparatus, encoding method, and program | |
JPH0549021A (en) | High efficient coder | |
KR100287214B1 (en) | Method and system for encoding motion pictures | |
JP2012151562A (en) | Video processing method | |
JPH1188183A (en) | Wavelet converter, its method, wavelet inverse converter, its method, image coder, its method, image decoder and its method | |
JP2001223593A (en) | Data coding method and system, and recording medium | |
JP2008124969A (en) | Lossless image coding method and lossless image coding apparatus | |
Oktem et al. | Adaptive filter banks for lossless image compression |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD01 | Notification of change of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7421 Effective date: 20040625 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050315 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050428 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20051011 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051205 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20060131 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20060213 |
|
LAPS | Cancellation because of no payment of annual fees |