JP3629826B2 - Information signal encoding apparatus, encoding method, and information signal decoding method - Google Patents
Information signal encoding apparatus, encoding method, and information signal decoding method Download PDFInfo
- Publication number
- JP3629826B2 JP3629826B2 JP19965996A JP19965996A JP3629826B2 JP 3629826 B2 JP3629826 B2 JP 3629826B2 JP 19965996 A JP19965996 A JP 19965996A JP 19965996 A JP19965996 A JP 19965996A JP 3629826 B2 JP3629826 B2 JP 3629826B2
- Authority
- JP
- Japan
- Prior art keywords
- quantization
- bits
- signal
- data
- mode
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Landscapes
- Compression Or Coding Systems Of Tv Signals (AREA)
- Compression Of Band Width Or Redundancy In Fax (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
【0001】
【発明の属する技術分野】
この発明は、例えばディジタルオーディオ信号、ディジタル画像信号等のディジタル情報信号の発生データ量を低減するようにした情報信号符号化装置、符号化方法、および情報信号復号方法に関する。
【0002】
【従来の技術】
ディジタルオーディオ信号、ディジタル画像信号等の伝送情報量を低減するために、予測符号化が知られている。例えば1次元DPCMは、時間または空間方向において、入力サンプル値と予測値との差分(残差)を形成し、2次元DPCMは、空間方向において入力サンプル値と予測値との残差を形成する。ディジタル情報信号は、時間方向、空間方向の相関を有しているので、残差信号のレベルがサンプル値よりも小さいものとなる。従って、残差信号を元の量子化ビット数より少ないビット数により再量子化することが可能で、それによって、情報量を圧縮できる。
【0003】
残差信号を対象とする量子化装置としては、0付近の量子化ステップ幅を細かくし、レベルが大きいほど、量子化ステップ幅を粗くする非線形量子化装置が周知である。この非線形量子化を含めて従来の量子化装置は、発生しうる残差信号の全てのレベルを量子化対象としている。例えばディジタル画像信号の1サンプル(1画素)が8ビットに量子化されている場合、残差信号としては、(−255〜+255)の値が存在しうる。従来の量子化装置は、この全範囲を量子化の対象としている。
【0004】
【発明が解決しようとする課題】
従来の量子化装置は、発生しうる残差信号の全範囲を量子化の対象とするので、量子化ビット数を少なくした場合には、量子化精度が低下し、量子化ビット数を多くすると発生データ量が多くなる問題があった。その結果、復号した時に、充分な品質のオーディオ信号、画像信号が得られない問題があった。
【0005】
従って、この発明の目的は、残差信号を量子化する時に、さらに、量子化出力のデータ量の削減が可能な情報信号符号化装置、符号化方法、並びに復号方法を提供することにある。すなわち、残差信号をブロック化し、ブロック毎の残差信号のレベル範囲がある条件を満たしている場合では、量子化ビット数をより少なくするように、量子化モードを切り替えるものである。
【0006】
【課題を解決するための手段】
請求項1の発明は、入力ディジタル情報信号を発生データ量を少なくするように符号化する情報信号符号化装置において、
入力ディジタル情報信号と入力ディジタル情報信号の予測値との残差信号を生成する手段と、
残差信号をブロック化する手段と、
ブロック毎に、最大値および最小値を検出する手段と、
最大値および最小値からブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定手段と、
第1の量子化モードでは、元のビット数より少ない所定のビット数で、残差信号を量子化し、第2の量子化モードでは、元のビット数より少ないビット数で残差信号を量子化するとともに、コード変換によりビット数をより少なくするようになされた量子化手段と、
第1および第2の量子化モードを識別する情報と、
量子化手段の出力とを伝送する伝送手段と
からなることを特徴とする情報信号符号化装置である。
【0007】
請求項3の発明は、入力ディジタル情報信号を発生データ量を少なくするように符号化する情報信号符号化方法において、
入力ディジタル情報信号と上記入力ディジタル情報信号の予測値との残差信号を生成するステップと、
残差信号をブロック化するステップと、
ブロック毎に、最大値および最小値を検出するステップと、
最大値および最小値からブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定のステップと、
第1の量子化モードでは、元のビット数より少ない所定のビット数で、残差信号を量子化し、第2の量子化モードでは、元のビット数より少ないビット数で残差信号を量子化するとともに、コード変換によりビット数をより少なくする量子化のステップと、
第1および第2の量子化モードを識別する情報と、
量子化手段の出力とを伝送するステップと
からなることを特徴とする情報信号符号化方法である。
【0008】
請求項4の発明は、入力ディジタル情報信号から少なくとも第1および第2の階層データを形成し、第1および第2の階層データを符号化して伝送するようにした情報信号符号化装置において、
第1の階層データより解像度がより低い第2の階層データを形成する手段と、
第2の階層データから第1の階層データを予測する手段と、
予測されたデータと第1の階層データとの残差信号を形成する手段と、
残差信号をブロック化する手段と、
ブロック毎に、最大値および最小値を検出する手段と、
最大値および最小値からブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定手段と、
第1の量子化モードでは、元のビット数より少ない所定のビット数で、残差信号を量子化し、第2の量子化モードでは、元のビット数より少ないビット数で残差信号を量子化するとともに、コード変換によりビット数をより少なくするようになされた量子化手段と、
第1および第2の量子化モードを識別する情報と、
量子化手段の出力とを伝送する伝送手段と
からなることを特徴とする情報信号符号化装置である。
【0009】
請求項5の発明は、入力ディジタル情報信号から少なくとも第1および第2の階層データを形成し、第1および第2の階層データを符号化して伝送するようにした情報信号符号化方法において、
第1の階層データより解像度がより低い第2の階層データを形成するステップと、
第2の階層データから第1の階層データを予測するステップと、
予測されたデータと第1の階層データとの残差信号を形成するステップと、
残差信号をブロック化するステップと、
ブロック毎に、最大値および最小値を検出するステップと、
最大値および最小値からブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定のステップと、
第1の量子化モードでは、元のビット数より少ない所定のビット数で、残差信号を量子化し、第2の量子化モードでは、元のビット数より少ないビット数で残差信号を量子化するとともに、コード変換によりビット数をより少なくする量子化のステップと、
第1および第2の量子化モードを識別する情報と、
量子化出力とを伝送する伝送のステップと
からなることを特徴とする情報信号符号化方法である。
【0010】
請求項6の発明は、入力ディジタル情報信号と入力ディジタル情報信号の予測値との残差信号を生成され、残差信号をブロック化され、ブロック毎に、最大値および最小値が検出され、最大値および最小値からブロック毎の残差信号の存在範囲が0を跨ぐものかどうかが決定され、存在範囲が0を跨ぐ場合に第1の量子化モードが指示され、存在範囲が0を跨がない場合に第2の量子化モードが指示され、第1の量子化モードでは、残差信号が元のビット数より少ないビット数で量子化され、第2の量子化モードでは、残差信号が元のビット数より少ないビット数で量子化されるとともに、コード変換によりビット数をより少なくするように符号化され、第1および第2の量子化モードを識別する情報と、残差信号の情報とが伝送される情報信号符号化方法に対する復号方法において、
識別情報に基づいて、第1の量子化モードでは、データを逆量子化し、第2の量子化モードでは、データをコード変換するとともに、逆量子化する逆量子化のステップと、
逆量子化された残差信号をブロック分解し、元の順序へ変換するステップとからなることを特徴とする情報信号復号方法である。
【0011】
残差信号のレベル分布の集中度を高めることによって、残差信号を元の量子化ビット数より少ないビット数で再量子化することができる。また、残差信号の分布がある条件を満足する時には、残差信号をより少ないビット数で量子化するが可能となる。
【0012】
【発明の実施の形態】
以下、この発明の一実施例について図面を参照して説明する。この一実施例では、ビデオ信号が所定のサンプリング周波数でサンプリングされ、各サンプルが所定の量子化ビット数へ変換されたディジタル画像信号に対して、この発明が適用される。図1は、この発明の一実施例のシステムの構成を全体的に示す。
【0013】
図1において、121で示す入力端子にディジタルビデオ信号が供給される。入力信号が減算器123に供給され、減算器123の出力(残差信号)がブロック化回路124および予測器122に供給され、予測器122で生成された予測信号が減算器123に供給される。減算器123は、入力信号から予測信号を減算し、予測残差を発生する。この残差信号がブロック化回路124に供給され、ラスター走査の順序からブロックの順序のデータへ変換される。ブロック化された残差信号が符号化ユニット125に供給される。
【0014】
符号化ユニット125中の量子化回路は、後述するように、ブロック化された残差信号の度数分布に応じて、第1の量子化モードと第2の量子化モードとが切り替えられるものである。例えば残差信号のビット数が8ビットの場合、第1の量子化モードが選択される時には、符号化ユニット125から3ビットの量子化出力が発生する。第2の量子化モードが選択される時には、符号化ユニット125内のコード変換テーブルによって、2ビットに変換された量子化出力が発生する。
【0015】
符号化ユニット125の符号化出力がエラー訂正符号エンコーダ126に供給され、エラー訂正符号の冗長コードが付加される。エラー訂正符号エンコーダ126の出力が変調部127に供給される。変調部127は、記録、伝送等に適した形態にディジタル信号を変調する。変調部127からの出力信号が記録ユニット128に供給され、記録ユニット128によって記録信号が情報信号記録媒体129に記録される。また、伝送路130を介してデータを伝送することも可能で、その場合では、記録ユニット128の代わりに伝送ユニットが使用される。量子化モードを指示するモード信号も符号化残差信号とともに、記録、あるいは伝送される。情報信号記録媒体129は、磁気、光磁気、相変化等を利用したディスク状、あるいはテープ状の記録媒体である。半導体メモリも一種の記録媒体である。
【0016】
記録媒体129からデータを再生ユニット131が再生し、または伝送路130を介して伝送されたデータが受信される。再生ユニット131により再生されたデータが復調部132により復調され、復調出力がエラー訂正符号のデコーダ133に供給される。このデコーダ133は、冗長コードを利用してエラーを訂正し、また、訂正できないで残ったエラーを目立たないように修整する。
【0017】
エラー訂正デコーダ133の出力が復号化ユニット134に供給される。復号化ユニット134は、後述するように、符号化ユニット125と逆に量子化出力を代表値(量子化復元値)に変換する、逆量子化の処理を行う。復号化ユニット134中の逆量子化回路は、モード信号により指示される量子化モードに従って逆量子化の処理を行う。復号化ユニット134から復号された残差信号が発生する。この復号残差信号がブロック分解回路135に供給される。ブロック分解回路135では、ブロック構造がラスター走査の順序に戻される。
【0018】
復号残差信号が加算回路136に供給される。加算回路136により復号画像信号が形成され、出力端子137に取り出される。また、この復号画像信号が予測器138に供給され、予測信号が生成される。予測信号が加算回路136に供給される。
【0019】
図2は、符号化ユニット125の一例を示す。ブロック化回路124からのブロック化された残差信号が入力端子1に供給される。図3は、残差信号の形成を概略的に示すものである。図3における一つの矩形の領域が1つの画素と対応している。a〜hのそれぞれは、局部復号された画素値を示し、A〜Pは、符号化される前の画素値を示す。画素値Aに対しての予測値A’は、近傍の局部復号画素値を使用して予測器122により生成される。例えば予測値A’は、A’=4c−3(b−f)、A’=f+c−b等の予測式に従って形成される。画素値B、C、・・・に対する予測値も同様の予測式によって計算される。一般式で表すと、予測値は、(αa+βb+γf、但し、α、β、γは定数)により生成される。
【0020】
減算器123では、画素値(例えばA)から予測値(例えばA’)が減算され、残差信号Δaが生成される。同様に、残差信号Δb、Δc、・・・が生成される。ブロック化回路124では、生成された残差信号がブロック構造に変換される。例えばブロック化回路124によって、図3Aの太線の枠で示すように、(4×4)のブロックと対応する残差信号Δa〜Δpのブロックのデータが形成される。なお、ディジタルオーディオ信号を扱う場合には、時間方向の予測値が形成され、1次元の残差信号のブロックが形成される。
【0021】
残差信号のレベル範囲は、ブロック化することによって、集中度を高めることが可能である。1画素が8ビットのデータの場合では、1画面の全体の残差信号の発生度数の分布は、0を中心として(−255〜+255)の範囲のものであり、残差が0の度数が最大となる。しかしながら、ブロックに分割した場合には、残差の度数分布がもとの分布に比してより集中したものとなる。
【0022】
これは、1画面と比較して小空間のブロック内の残差は、大きな値となるものが確率的に少なく、また、ブロック内では残差の相関が強いことに因る。従って、ブロック化された残差信号を元の量子化ビット数より少ないビット数でもって再量子化することができる。また、ブロック化された残差信号の分布において、必ずしも0の値の度数が最大とならない。例えば、ブロック内で輝度のレベルが例えば対角線方向に除々に変化する場合等では、0の値の度数が最大とならない分布が生じる。なお、残差信号の分布の集中度を高める方法は、ブロック化が一例であって、これ以外の方法も可能である。
【0023】
図2に戻って、符号化ユニット125について説明する。入力端子1からの残差信号が最大値検出回路2、最小値検出回路3、遅延回路4に供給される。最大値検出回路2では、ブロック毎の最大値MAXが検出され、最小値検出回路3では、ブロック毎の最小値MINが検出される。検出された最大値MAXおよび最小値MINがモード決定回路5へ供給される。
【0024】
モード決定回路5には、ブロック化された残差信号、最大値MAXおよび最小値MINが供給され、そのブロックの残差信号のレベル範囲に基づいて、量子化モードが決定され、モードを指示する信号MODE(例えば1ビット)が生成される。モード信号MODEが量子化回路6に供給され、また、量子化回路6に対して、入力端子1からの残差信号が位相合わせのための遅延回路4を介して供給される。量子化回路6では、残差信号が元の量子化ビット数(例えば8ビット)より少ない量子化ビット数により再量子化される。量子化回路6では、第1および第2の量子化モードがモード信号MODEに従って選択される。
【0025】
第1の量子化モードは、8ビットの残差信号を再量子化して、より少ない量子化ビット数例えば3ビットの量子化出力を発生する、通常のものである。第2の量子化モードは、ブロック化された残差信号のレベル範囲が0を跨がない場合に適用される。この一実施例では、残差信号の最小値MINが(Δ/2)よりも大きい場合には、第2の量子化モードが適用される。ここで、Δは、再量子化ビット数をnとするときに、DR/2n で計算される量子化ステップである。DRは、ダイナミックレンジで、(MAX−MIN)により計算できる。
【0026】
第2の量子化モードでは、第1の量子化モードと同様に再量子化で発生したコード信号(例えば3ビット)が所定の規則に従って変換され、より少ないビット数例えば2ビットの量子化出力に変換される。3ビットのコードを2ビットの量子化出力に変換するコード変換の規則を下記に示す。
100 − 00
101 − 01
110 − 10
111 − 11
【0027】
量子化処理について図4を参照して説明する。上述したように予測符号化により発生した残差信号は、1フレーム全体で見ると、0の値の度数が最大となるが、ブロック化したものは、図4Aに示すように、そのブロックによってさまざまな偏りを持っている。図4Aは、負側に偏った残差信号の分布、最大度数が0の値と一致した残差信号の分布、正側に偏った残差信号の分布を示す。
【0028】
図4Bは、0の値を跨がるような残差信号の度数分布を示している。残差信号を量子化する場合では、例えばMAXおよびMINの間が23 =8等分され、その範囲に属する残差信号に同一のコードが割り当てられる。そのコードは、復元されると、範囲の中央の代表値へ変換される。一般的には、コードのビット数がnの場合、2n の個数の範囲にMAXおよびMINの間が分割される。このような量子化が第1の量子化モードである。
【0029】
図4Cは、ブロック化された残差信号の度数分布の例を示す。すなわち、図4Cには、最小値MINがΔ/2に等しいような分布30a、図4Bのものと同様に、0を跨がる分布30b(破線で示す)、最大値MAXが−Δ/2に等しい分布30c(破線で示す)が示されている。この一実施例では、度数分布30aのように、(MIN≧Δ/2)の条件を満たす場合では、第2の量子化モードが適用され、第2の量子化モードにおいて、上述したようなコード変換がなされる。復号側においては、2ビットから3ビットへの逆方向のコード変換がなされ、そして、3ビットのコードが逆量子化される。
【0030】
例えば図4Cにおける度数分布30aを有する残差信号を第2の量子化モードで量子化すると、MIN〜MAXの範囲の100〜111の量子化出力が00〜11の量子化出力に変換される。復号側では、逆に00〜11の量子化出力が100〜111のコードに変換される。この変換された3ビットのコードを第1の量子化モードで発生した3ビットの量子化出力と同様に、代表値に変換することによっで、逆量子化を行うことができる。
【0031】
この発明の一実施例と異なり、ブロックの残差信号の最大値MAXが−Δ/2より小さい場合(例えば図4Cにおける度数分布30c)に、第2の量子化モードを適用するようにしても良い。さらに、最小値MINが(MIN≧0)の場合、あるいは最大値MAXが(MAX≦0)の場合に、第2の量子化モードを適用するようにしても良い。
【0032】
量子化回路6の一例を図5に示す。15で示す入力端子に対して、ブロック化された残差信号が遅延回路4から供給される。モード信号MODEによって切り替えられるスイッチング回路16の入力端子に入力残差信号が供給される。スイッチング回路16の出力端子aおよびbには、例えば3ビットの出力を発生する量子化器17aおよび17bがそれぞれ接続される。量子化器17bに対してコード変換回路18が接続される。コード変換回路18は、上述したような3ビットを2ビットに変換する回路である。量子化器17aまたは17bの出力が出力端子19に取り出される。
【0033】
モード決定回路5によって、そのブロックの残差信号に関して、(MIN≧Δ/2)である場合には、モード信号MODEが第2の量子化モードを指示し、一方、それ以外の場合には、モード信号MODEが第1の量子化モードを指示する。第1の量子化モードでは、スイッチング回路16の出力端子aが選択され、第2の量子化モードでは、スイッチング回路16の出力端子bが選択される。従って、第1の量子化モードでは、3ビットの量子化出力が出力端子19に発生し、第2の量子化モードでは、2ビットの量子化出力が出力端子19に発生する。なお、量子化器17a、17bを共通としても良い。
【0034】
図2に戻って説明すると、量子化回路6の出力がビットプレーン符号化回路7に供給される。ビットプレーン符号化回路7は、nビット例えば2ビットのコードqをMSB(最上位ビット)プレーンとLSB(最下位ビット)プレーンに分割する。MSBプレーンは、供給される2ビット量子化値のMSBの集合であり、LSBプレーンは、LSBの集合である。図6Aは、簡単のため、1画面が(4×3=12ブロック)で構成され、各ブロックに(4×4)の残差信号のコードqが含まれる場合を示している。
【0035】
図6Aにおいて、例として示されるコードqの値の0,1,2,3は、それぞれ2ビットで(00),(01),(10),(11)を意味する。図6Aの例では、ビットプレーン符号化回路7が図6Bに示すように、例えば1画面のコードqをMSBプレーンおよびLSBプレーンへ分割する。量子化ビット数が3ビットの場合では、さらに、中間のビットのプレーンが形成される。この発明の一実施例では、二つの量子化モードによって2ビットあるいは3ビットの量子化出力が発生する。ビットプレーンを形成する場合では、量子化出力のビット数が分かっている必要がある。そのため、モード信号MODEがビットプレーン符号化回路7に供給されている。
【0036】
ビットプレーン符号化回路7で生成された各ビットプレーンが可変長符号化回路8に供給され、各ビットプレーンが可変長符号化される。可変長符号化回路8では、ビットプレーン毎にランレングス符号化、例えばMMR(Modefied MR )が行われる。可変長符号化回路8の出力がフレーミング回路9に供給される。フレーミング回路9には、上述したモード信号MODEも供給される。フレーミング回路9の出力端子10には、これらのモード信号MODEと可変長符号化されたコードが所定のフレーム構造のデータとして出力される。
【0037】
次に、図7を参照して、図1中の復号化ユニット134の一例について説明する。エラー訂正デコーダ133からの再生、あるいは受信データが復号化ユニット134の入力端子31に供給される。フレーム分解回路32によって、可変長符号化された残差信号のコードと、モード信号MODEとが分離される。分離された残差信号のコードが可変長復号化回路33により復号される。可変長復号化回路33は、可変長符号化回路13と対応している。可変長復号化回路33の復号出力がビットプレーン復号化回路34に供給され、ビットプレーンが合成される。この場合、分離されたモード信号MODEによって、ビットプレーンが正しく合成される。
【0038】
ビットプレーン復号化回路34の出力がスイッチング回路35の入力端子に供給される。スイッチング回路35は、モード信号MODEにより制御される。モード信号MODEが第1の量子化モードを指示する場合では、スイッチング回路35の出力端子aが選択され、これが第2の量子化モードを指示する場合では、スイッチング回路35の出力端子bが選択される。出力端子aには、3ビットの量子化コードを逆量子化して、量子化復元値を発生する逆量子化器36aが接続されている。出力端子bには、2ビットの量子化出力を3ビットのコードに変換するコード変換回路37が接続され、コード変換回路37に対して逆量子化器36bが接続されている。逆量子化器36bは、逆量子化器36aと同様に、3ビットのコードを復元値へ変換するものである。
【0039】
逆量子化器36a、36bにより生成された復元値、すなわち、ブロック化された復号残差信号が出力端子38に取り出される。出力端子38に取り出された復号残差信号がブロック分解回路135に供給される(図1参照)。なお、逆量子化器36a、36bを共通としても良い。
【0040】
次に、この発明を階層符号化に対して適用した他の実施例について説明する。ここで説明する階層符号化装置は、階層間で予測を行ない、また、階層間データに対し単純な算術式を用いることで、符号化対象画素数の増加を防止することができるものである。
【0041】
図8を参照してこの階層符号化方法について説明する。図8は、一例として第1階層を最下位階層(原画)とし、第4階層を最上位階層とする4階層からなる階層間の模式図を示している。例えば、上位階層データ生成法として、空間的に対応する4画素の下位階層データの平均値を採用する場合、伝送画素数が増加しないようにできる。
【0042】
すなわち、上位階層データをM、下位階層画素値をx0 、x1 、x2 、x3 とすると、
M=1/4・(x0 +x1 +x2 +x3 )
によりデータMが形成される。そして、データMと、4個のデータの内の例えばx3 以外の3個のデータを伝送する。受信あるいは再生側では、
x3 =4・M−(x0 +x1 +x2 )
という単純な算術式により非伝送画素x3 を容易に復元することができる。図8において、斜線の矩形は、非伝送画素を示している。
【0043】
図9は、上述した平均化を使用する例えば5階層の階層符号化の構成を示す。第1階層が入力画像の解像度レベルであるとする。この第1階層のブロックサイズは、(1×1)である。第2階層データは、第1階層データの4画素平均により生成される。この例では、第1階層データX1 (0)〜X1 (3)の平均値により、第2階層データX2 (0)が生成される。X2 (0)に隣接する第2階層データX2 (1)〜X2 (3)も同様に第1階層データの4画素平均により生成される。この第2階層のブロックサイズは、(1/2×1/2)である。
【0044】
さらに、第3階層データは、空間的に対応する第2階層データの4画素平均により生成される。この第3階層のブロックサイズは、(1/4×1/4)である。また、第4階層のデータも同様に第3階層のデータから生成される。この第4階層のブロックサイズは、(1/8×1/8)である。最後に、最上位階層である第5階層データX5 (0)が第4階層データX4 (0)〜X4 (3)の平均値により生成される。この第5階層のブロックサイズは、(1/16×1/16)である。
【0045】
上述した符号化対象画素数の増加を防止した階層構造データに対し、上位階層データにクラス分類適応予測を適用することで、下位階層データを予測し、下位階層データとその予測値との差分(すなわち、残差信号)を生成することで伝送データ量の削減を図ることができる。図10は、そのような符号化ユニットを示す。入力端子41を介して第1階層データd0が入力画像データd0として平均化回路42および減算器46へ供給される。第1階層データが元の解像度の画像データである。
【0046】
入力画素データd0は、平均化回路42において、1/4平均処理が実行され、階層データd1が生成される。この階層データd1は、図9に示す第2階層データに対応する。生成された階層データd1は、平均化回路43および減算器47へ供給される。
【0047】
階層データd1に対して、平均化回路43では、平均化回路42と同様な処理が施され、階層データd2が生成される。この階層データd2は、第3階層データに対応する。生成された階層データd2は、平均化回路44および減算器48へ供給される。また、平均化回路44でも同様に階層データd2に対して1/4平均処理がなされ、階層データd3が生成される。この階層データd3は、第4階層データに対応する。生成された階層データd3は、平均化回路45および減算器49へ供給される。さらに、平均化回路45でも同様に階層データd3に対して1/4平均処理がなされ、階層データd4が生成される。この階層データd4は、第5階層データに対応する。生成された階層データd4は、量子化器54へ供給される。
【0048】
そして、これら5つの階層データについて階層間で予測が行われる。先ず、第5階層においてなされる圧縮のための量子化処理は、量子化器54によりなされる。この量子化器54の出力データd21が可変長符号のエンコーダ71に供給されると共に、逆量子化器58へも供給される。エンコーダ71の出力が出力端子76に第5階層のデータとして取り出される。符号化データd21が供給された逆量子化器58の出力データd16がクラス分類適応予測回路62へ供給される。
【0049】
クラス分類適応予測回路62では、データd16を使用して予測処理がなされ、第4階層データの予測値d12が生成され、この予測値d12が減算器49へ供給される。この減算器49では、平均化回路44から供給される階層データd3と予測値d12との差分値が求められ、その差分値d8が量子化器53へ供給される。
【0050】
差分値d8が供給された量子化器53では、量子化器54と同様に量子化ビット数を低減するように、再量子化がなされる。この量子化器53の出力データが演算器66および逆量子化器57へ供給される。この演算器66では、4画素から1画素を間引く処理が行われる。演算器66から出力されるデータd20が可変長符号のエンコーダ70で符号化され、エンコーダ70の出力が出力端子75に第4階層の出力データとして取り出される。
【0051】
クラス分類適応予測回路62により予測された第4階層データd12と、逆量子化器57の出力データ(復号残差信号)d15がクラス分類適応予測回路61へ供給される。クラス分類適応予測回路61では、データd12に対してデータd15を加算することによって、第4階層のローカル復号データを形成し、このローカル復号データを使用して予測処理がなされ、第3階層データの予測値d11が生成され、この予測値d11が減算器48へ供給される。この減算器48では、平均化回路43から供給されるデータd2と予測値d11との差分値が求められ、その差分値d7が量子化器52へ供給される。
【0052】
差分値d7が供給された量子化器52の出力データが演算器65および逆量子化器56へ供給される。この演算器65では、4画素から1画素を間引く処理が行われる。演算器65から出力される第3階層データd19が可変長符号のエンコーダ69に供給され、エンコーダ69の出力が出力端子74に第3階層のデータとして取り出される。
【0053】
クラス分類適応予測回路61により予測された第3階層データd11と、量子化器52から符号化データが供給された逆量子化器56の出力データd14がクラス分類適応予測回路60へ供給される。クラス分類適応予測回路60では、データd11に対してデータd14を加算することによって、第3階層のローカル復号データを形成し、このローカル復号データを使用して予測処理がなされ、第2階層データの予測値d10が生成され、予測値d10が減算器47へ供給される。この減算器47では、平均化回路42から供給されるデータd1と予測値d10との差分値が求められ、その差分値d6が量子化器51へ供給される。
【0054】
量子化器51の出力データは、演算器64および逆量子化器55へ供給される。この演算器64では、4画素から1画素を間引く処理が行われる。演算器64から出力される第2階層データd18が可変長符号のエンコーダ68に供給され、エンコーダ68の出力が出力端子73に第2階層のデータとして取り出される。
【0055】
クラス分類適応予測回路60により予測された第2階層データd10と、量子化器51から符号化データが供給された逆量子化器55の出力データd13がクラス分類適応予測回路59へ供給される。クラス分類適応予測回路59では、データd10に対してデータd13を加算することによって、第2階層のローカル復号データを形成し、このローカル復号データを使用して予測処理がなされ、第1階層データの予測値d9が生成され、予測値d9が減算器46へ供給される。この減算器46では、入力端子41から供給される入力画素データd0と予測値d9との差分値が求められ、その差分値d5が量子化器50へ供給される。
【0056】
差分値d5が供給された量子化器50の出力データは、演算器63へ供給される。この演算器63では、4画素から1画素を間引く処理が行われる。演算器63から出力される第1階層データd17が可変長符号のエンコーダ67に供給され、エンコーダ67の出力が出力端子72に第1階層のデータとして取り出される。
【0057】
クラス分類適応予測回路59、60、61、62のそれぞれは、予測しようとする下位階層の画素をその空間的に近傍の複数の画素(上位階層に含まれる)のレベル分布に基づいて予測するものである。図12は、クラス分類適応予測回路の一例を示す。入力端子141からのローカル復号データが周辺コード値形成部142に供給される。周辺コード値形成部142は、予測しようとする下位階層の画素の近傍に位置する複数のデータx1 、x2 、・・・・、xn を同時化する。周辺コード値がクラス分類部143および遅延部145に供給される。クラス分類部143は、周辺コード値x1 〜xn のレベル分布のパターンと対応したクラスコードを出力する。クラスコードとしては、周辺コード値それ自体を使用しても良いが、クラス数が膨大となるので、周辺コードのそれぞれのビット数をADRC等により例えば1ビットに圧縮したものが使用される。クラス分類部143から発生したクラスコードが予測係数メモリ144に対してアドレス信号として供給される。
【0058】
予測係数メモリ144には、予め学習により獲得された予測係数w1 〜wn がアドレス毎に格納されている。すなわち、教師信号(例えば第4階層のデータ)と、入力信号(第4階層のデータから平均化処理で形成された第5階層のデータ)とを使用し、入力信号の複数のデータと係数との線形1次結合により予測値を求め、この予測値と教師信号の真値との誤差の自乗和を最小とするような係数がクラス毎に最小自乗法により求められる。クラスコードに対応して予測係数メモリ144から読出された予測係数w1〜wn と遅延部145からの周辺コード値x1 〜xn とが予測演算部146に供給される。
【0059】
予測演算部146では、下記の線形1次結合式によって、予測値yが計算される。
y=w1 x1 +w2 x2 +・・・・・+wn xn
予測演算部146により求められた予測値yが出力端子147に取り出される。なお、クラス分類のために使用される周辺コード値と、予測演算のために使用される周辺コード値とが異なったものでも良い。
【0060】
上述した一実施例における符号化ユニット125(図2参照)と同様の構成が階層符号化のエンコーダ側にも設けられている。つまり、量子化回路6迄の前段の構成と同様の構成を量子化器50、51、52、53、54がそれぞれ有し、ビットプレーン符号化回路7より後段の構成と同様の構成を可変長エンコーダ67、68、69、70、71がそれぞれ有する。
【0061】
次に、上述のエンコーダと対応する階層符号化のデコーダ側の構成例を図11に示す。エンコーダ側で生成された各階層データは、d30〜d34として入力端子81、82、83、84、85にそれぞれ供給される。そして、可変長符号のデコーダ86、87、88、89、90にて可変長符号の復号がなされる。これらのデコーダに対して、逆量子化器91、92、93、94、95がそれぞれ接続される。
【0062】
先ず、第5階層入力データd34は、逆量子化器95において、エンコーダで施された量子化に対応する復号処理が行われ、画像データd39となり、クラス分類適応予測回路107および演算器103へ供給される。また画像データd39は、第5階層の画像出力として、出力端子112から取り出される。
【0063】
クラス分類適応予測回路107では、第4階層の画像データに対してクラス分類適応予測が施され、第4階層データの予測値d47が生成される。逆量子化器94からのデータd38(すなわち、差分値)と予測値d47とが加算器99で加算される。加算器99から画像データd43が演算器103へ供給され、演算器103では、非伝送画素の値を求めるために、上述した演算が実行され、逆量子化器95から供給された画像データd39と画像データd43から第4階層の全画素値が復元される。この演算器103において、復元された全画素値は、画像データd51として、クラス分類適応予測回路106および演算器102へ供給される。また画像データd51は、第4階層の出力として、出力端子111から取り出される。
【0064】
クラス分類適応予測回路106では、第3階層の画像データに対してクラス分類適応予測が施され、第3階層データの予測値d46が生成される。逆量子化器93からのデータd37と予測値d46とが加算器98で加算される。加算器98から画像データd42が演算器102へ供給され、演算器102により非伝送画素の値が求められ、演算器103から供給された画像データd51と画像データd42から第3階層の全画素値が復元される。この演算器102において、復元された全画素値は、画像データd50として、クラス分類適応予測回路105および演算器101へ供給される。また画像データd50は、第3階層の出力として、出力端子110から取り出される。
【0065】
また、クラス分類適応予測回路105では、第2階層の画像データに対してクラス分類適応予測が施され、第2階層データの予測値d45が生成される。逆量子化器92からのデータd36と予測値d45とが加算器97で加算される。加算器97から画像データd41が演算器101へ供給され、演算器101により非伝送画素の値が求められ、演算器102から供給された画像データd50と画像データd41から第2階層の全画素値が復元される。この演算器101において、復元された全画素値は、画像データd49として、クラス分類適応予測回路104および演算器100へ供給される。また画像データd49は、第2階層の出力として、出力端子109から取り出される。
【0066】
さらに、クラス分類適応予測回路104では、第1階層の画像データに対してクラス分類適応予測が施され、第1階層データの予測値d44が生成される。逆量子化器91からのデータd35と予測値d44とが加算器96で加算される。加算器96から画像データd40が演算器100へ供給され、演算器100により非伝送画素の値が求められ、演算器101から供給された画像データd49と画像データd40から第1階層の全画素値が復元される。この演算器100において、復元された全画素値は、画像データd48として、第1階層の出力として、出力端子108から取り出される。クラス分類適応予測回路104、105、106、107のそれぞれは、図12に示し、上述した具体的構成を有している。こうして、符号化対象画素数の増加を防止した階層符号化において、クラス分類適応予測を導入することで符号化効率の向上を図ることが可能となる。
【0067】
上述した一実施例の復号化ユニット134と同様の構成を可変長符号のデコーダ86、87、88、89、90と、逆量子化器91、92、93、94、95がそれぞれ有する。従って、上述した階層符号化に対してこの発明を適用した他の実施例によっても、上述した一実施例と同様に、ブロック化された残差信号のレベル範囲が所定の条件を満たす場合に、量子化ビット数をより少なくすることができる。
【0068】
この発明において発生した、モード信号MODEと符号化残差信号との伝送方法としては、種々のものが可能である。例えば1フレーム分のモード信号を先にまとめて伝送し、その後に符号化残差信号を伝送することができる。また、この発明は、3以上の量子化モードを設定することができる。例えばブロックの残差信号のレベル範囲のみならず、そのダイナミックレンジDRも考慮して、ダイナミックレンジDRが小さい時には、第2の量子化モードにおけるビット数より少ないビット数の第3の量子化モードが設定されるようにしても良い。さらに、第1の量子化モードの量子化出力のレベル範囲に基づいて、量子化モードを決定するようにしても良い。
【0069】
よりさらに、この発明は、上述した予測符号化以外の予測符号化で発生した残差信号の量子化に対しても適用できる。また、この発明は、量子化ステップ幅を制御することによって、発生データ量を制御するバッファリングの構成を有するシステムに対しても適用することができる。
【0070】
【発明の効果】
この発明に依れば、ブロック化された残差信号の度数分布が0を跨がない場合を検出し、その場合では、量子化ビット数をより少なくし、伝送データ量を一層低減することができる。
【図面の簡単な説明】
【図1】この発明を適用できる記録/再生、あるいは伝送システムの一例のブロック図である。
【図2】この発明の一実施例のブロック図である。
【図3】この発明の一実施例中の残差信号の生成と、そのブロック化の説明に用いる略線図である。
【図4】この発明の一実施例における量子化処理の説明に用いる略線図である。
【図5】この発明の一実施例中の量子化回路の一例のブロック図である。
【図6】この発明の一実施例中のビットプレーンの説明に用いる略線図である。
【図7】この発明の一実施例における復号化ユニットのブロック図である。
【図8】階層符号化の一例の説明に用いる略線図である。
【図9】階層符号化の一例の説明に用いる略線図である。
【図10】階層符号化に対してこの発明を適用した他の実施例のエンコード側の構成の一例を示すブロック図である。
【図11】この発明の他の実施例のデコード側の構成の一例を示すブロック図である。
【図12】この発明の他の実施例のクラス分類適応予測回路の構成の一例を示すブロック図である。
【符号の説明】
2・・・最大値検出回路,3・・・最小値検出回路,5・・・モード決定回路
6・・・量子化回路[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information signal encoding device, an encoding method, and an information signal decoding method that reduce the amount of generated data of digital information signals such as digital audio signals and digital image signals.
[0002]
[Prior art]
Predictive coding is known to reduce the amount of transmission information such as digital audio signals and digital image signals. For example, a one-dimensional DPCM forms a difference (residual) between an input sample value and a predicted value in the time or spatial direction, and a two-dimensional DPCM forms a residual between the input sample value and a predicted value in the spatial direction. . Since the digital information signal has a correlation in the time direction and the spatial direction, the level of the residual signal is smaller than the sample value. Therefore, the residual signal can be requantized with a smaller number of bits than the original number of quantization bits, thereby reducing the amount of information.
[0003]
As a quantization device for a residual signal, a nonlinear quantization device is known in which the quantization step width near 0 is made finer and the quantization step width becomes coarser as the level increases. In the conventional quantization apparatus including this nonlinear quantization, all levels of the residual signal that can be generated are targeted for quantization. For example, when one sample (one pixel) of a digital image signal is quantized to 8 bits, a value of (−255 to +255) may exist as a residual signal. The conventional quantization apparatus uses the entire range as the object of quantization.
[0004]
[Problems to be solved by the invention]
Since the conventional quantization apparatus targets the entire range of residual signals that can be generated, if the number of quantization bits is reduced, the quantization accuracy decreases, and the number of quantization bits increases. There was a problem that the amount of generated data increased. As a result, there has been a problem that audio signals and image signals with sufficient quality cannot be obtained when decoding.
[0005]
Accordingly, an object of the present invention is to provide an information signal encoding apparatus, encoding method, and decoding method capable of further reducing the data amount of the quantized output when the residual signal is quantized. In other words, when the residual signal is blocked and the level range of the residual signal for each block satisfies a certain condition, the quantization mode is switched so as to reduce the number of quantization bits.
[0006]
[Means for Solving the Problems]
The invention of
Input digital information signalAnd the predicted value of the input digital information signalMeans for generating a residual signal of
Means for blocking the residual signal;
Means for detecting the maximum and minimum values for each block;
The residual signal for each block from the maximum and minimum valuesExistenceDetermine if the range is crossing zero,ExistenceInstruct the first quantization mode when the range crosses 0,ExistenceMode determining means for instructing the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual signal is quantized with a number of bits smaller than the original number of bits. And quantization means adapted to reduce the number of bits by code conversion,
Information identifying first and second quantization modes;
Transmission means for transmitting the output of the quantization means;
An information signal encoding device characterized by comprising:
[0007]
According to a third aspect of the present invention, there is provided an information signal encoding method for encoding an input digital information signal so as to reduce the amount of generated data.
Input digital information signalAnd the predicted value of the input digital information signalGenerating a residual signal of
Blocking the residual signal;
Detecting the maximum and minimum values for each block;
The residual signal for each block from the maximum and minimum valuesExistenceDetermine if the range is crossing zero,ExistenceInstruct the first quantization mode when the range crosses 0,ExistenceA mode determining step for indicating the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual signal is quantized with a number of bits smaller than the original number of bits. And a quantization step to reduce the number of bits by code conversion,
Information identifying first and second quantization modes;
Transmitting the output of the quantizing means;
An information signal encoding method characterized by comprising:
[0008]
According to a fourth aspect of the present invention, there is provided an information signal encoding apparatus in which at least first and second hierarchical data are formed from an input digital information signal, and the first and second hierarchical data are encoded and transmitted.
Means for forming second hierarchical data having a lower resolution than the first hierarchical data;
Means for predicting the first hierarchical data from the second hierarchical data;
Means for forming a residual signal between the predicted data and the first tier data;
Means for blocking the residual signal;
Means for detecting the maximum and minimum values for each block;
The residual signal for each block from the maximum and minimum valuesExistenceDetermine if the range is crossing zero,ExistenceInstruct the first quantization mode when the range crosses 0,ExistenceMode determining means for instructing the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual signal is quantized with a number of bits smaller than the original number of bits. And quantization means adapted to reduce the number of bits by code conversion,
Information identifying first and second quantization modes;
Transmission means for transmitting the output of the quantization means;
An information signal encoding device characterized by comprising:
[0009]
According to a fifth aspect of the present invention, there is provided an information signal encoding method in which at least first and second hierarchical data are formed from an input digital information signal, and the first and second hierarchical data are encoded and transmitted.
Forming second hierarchical data having a lower resolution than the first hierarchical data;
Predicting first hierarchical data from second hierarchical data;
Forming a residual signal between the predicted data and the first tier data;
Blocking the residual signal;
Detecting the maximum and minimum values for each block;
The residual signal for each block from the maximum and minimum valuesExistenceDetermine if the range is crossing zero,ExistenceInstruct the first quantization mode when the range crosses 0,ExistenceA mode determining step for indicating the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual signal is quantized with a number of bits smaller than the original number of bits. And a quantization step to reduce the number of bits by code conversion,
Information identifying first and second quantization modes;
A transmission step for transmitting the quantized output and
An information signal encoding method characterized by comprising:
[0010]
The invention of claim 6A residual signal between the input digital information signal and the predicted value of the input digital information signal is generated, the residual signal is blocked, the maximum and minimum values are detected for each block, and the maximum and minimum values are detected for each block. It is determined whether or not the existence range of the residual signal is crossing 0, the first quantization mode is instructed when the existence range crosses 0, and the second quantum when the existence range does not cross 0 Mode is instructed,In the first quantization mode, the residual signal is quantized with a smaller number of bits than the original number of bits, and in the second quantization mode, the residual signal is quantized with a smaller number of bits than the original number of bits. At the same time, it is encoded to reduce the number of bits by code conversion.And an information signal encoding method in which information for identifying the first and second quantization modes and information on the residual signal are transmitted.In the decryption method,
Based on the identification information, in the first quantization mode, the data is inversely quantized, and in the second quantization mode, the data is transcoded and inversely quantized,
An information signal decoding method comprising the steps of: decomposing a dequantized residual signal into blocks and converting the residual signal into an original order.
[0011]
By increasing the degree of concentration of the level distribution of the residual signal, the residual signal can be requantized with a smaller number of bits than the original number of quantization bits. Also, when the residual signal distribution satisfies a certain condition, the residual signal can be quantized with a smaller number of bits.
[0012]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. In this embodiment, the present invention is applied to a digital image signal obtained by sampling a video signal at a predetermined sampling frequency and converting each sample into a predetermined number of quantization bits. FIG. 1 shows the overall configuration of a system according to an embodiment of the present invention.
[0013]
In FIG. 1, a digital video signal is supplied to an input terminal indicated by 121. The input signal is supplied to the subtractor 123, the output (residual signal) of the subtractor 123 is supplied to the
[0014]
As will be described later, the quantization circuit in the
[0015]
The encoded output of the
[0016]
Data is reproduced from the
[0017]
The output of the error correction decoder 133 is supplied to the decoding unit 134. As will be described later, the decoding unit 134 performs inverse quantization processing for converting the quantized output into a representative value (quantized restoration value), contrary to the
[0018]
The decoded residual signal is supplied to the
[0019]
FIG. 2 shows an example of the
[0020]
The subtractor 123 subtracts the predicted value (for example, A ′) from the pixel value (for example, A) to generate a residual signal Δa. Similarly, residual signals Δb, Δc,... Are generated. In the
[0021]
By concentrating the level range of the residual signal, the degree of concentration can be increased. When one pixel is 8-bit data, the distribution of the occurrence frequency of the residual signal of one screen is in the range of (−255 to +255) around 0, and the frequency of the residual is 0. Maximum. However, when divided into blocks, the frequency distribution of residuals is more concentrated than the original distribution.
[0022]
This is due to the fact that the residuals in the blocks in the small space are relatively large in comparison with one screen, and the residuals are strongly correlated in the blocks. Therefore, the block residual signal can be requantized with a smaller number of bits than the original number of quantization bits. Further, in the distribution of the residual signals that are blocked, the frequency of the value of 0 is not necessarily the maximum. For example, when the luminance level gradually changes in the diagonal direction in the block, for example, a distribution in which the frequency of the value of 0 does not become maximum occurs. Note that the method of increasing the degree of concentration of the residual signal distribution is an example of blocking, and other methods are also possible.
[0023]
Returning to FIG. 2, the
[0024]
The
[0025]
The first quantization mode is a normal one that re-quantizes the 8-bit residual signal to generate a smaller number of quantization bits, eg, 3 bits. The second quantization mode is applied when the level range of the blocked residual signal does not cross zero. In this embodiment, when the minimum value MIN of the residual signal is larger than (Δ / 2), the second quantization mode is applied. Here, Δ is DR / 2 when the number of requantization bits is n.nIs a quantization step calculated by DR is a dynamic range and can be calculated by (MAX-MIN).
[0026]
In the second quantization mode, a code signal (for example, 3 bits) generated by re-quantization is converted according to a predetermined rule in the same manner as in the first quantization mode, and a quantized output having a smaller number of bits, for example, 2 bits Converted. Code conversion rules for converting a 3-bit code into a 2-bit quantized output are shown below.
100-00
101-01
110-10
111-11
[0027]
The quantization process will be described with reference to FIG. As described above, the residual signal generated by the predictive coding has the maximum frequency of 0 when viewed in the whole frame. However, the residual signal varies depending on the block as shown in FIG. 4A. Have a bias. FIG. 4A shows a distribution of residual signals biased to the negative side, a distribution of residual signals that coincided with a value having a maximum frequency of 0, and a distribution of residual signals biased to the positive side.
[0028]
FIG. 4B shows the frequency distribution of the residual signal that crosses the value of 0. In the case of quantizing the residual signal, for example, the interval between MAX and MIN is 23= 8, and the same code is assigned to the residual signals belonging to the range. When the code is restored, it is converted to a representative value in the middle of the range. In general, if the code has n bits, 2nThe range between MAX and MIN is divided into a number range. Such quantization is the first quantization mode.
[0029]
FIG. 4C shows an example of the frequency distribution of the blocked residual signal. That is, FIG. 4C shows a
[0030]
For example, if the residual signal having the
[0031]
Unlike the embodiment of the present invention, the second quantization mode may be applied when the maximum value MAX of the residual signal of the block is smaller than −Δ / 2 (for example, the
[0032]
An example of the
[0033]
The mode signal MODE indicates the second quantization mode when (MIN ≧ Δ / 2) with respect to the residual signal of the block by the
[0034]
Returning to FIG. 2, the output of the
[0035]
In FIG. 6A, 0, 1, 2, 3 of the value of the code q shown as an example means (00), (01), (10), (11) with 2 bits, respectively. In the example of FIG. 6A, as shown in FIG. 6B, the bit
[0036]
Each bit plane generated by the bit
[0037]
Next, referring to FIG.1An example of the decoding unit 134 in the middle will be described. Reproduced or received data from the error correction decoder 133 is supplied to the
[0038]
The output of the bit
[0039]
The restored values generated by the inverse quantizers 36a and 36b, that is, the decoded decoded residual signals are taken out to the
[0040]
Next, another embodiment in which the present invention is applied to hierarchical coding will be described. The hierarchical encoding device described here can prevent an increase in the number of encoding target pixels by performing prediction between hierarchies and using a simple arithmetic expression for the inter-layer data.
[0041]
The hierarchical encoding method will be described with reference to FIG. FIG. 8 shows, as an example, a schematic diagram between four hierarchies having the first hierarchy as the lowest hierarchy (original picture) and the fourth hierarchy as the highest hierarchy. For example, when the average value of the lower layer data of four pixels corresponding spatially is adopted as the upper layer data generation method, the number of transmission pixels can be prevented from increasing.
[0042]
That is, the upper layer data is M and the lower layer pixel value is x.0 , X1 , X2 , X3 Then,
M = 1/4 · (x0 + X1 + X2 + X3)
As a result, data M is formed. And, for example, x of the data M and the four data3The other three data are transmitted. On the receiving or playback side,
x3 = 4 · M- (x0 + X1 + X2 )
Non-transmission pixel x by a simple arithmetic expression3 Can be easily restored. In FIG. 8, hatched rectangles indicate non-transmission pixels.
[0043]
FIG. 9 shows a configuration of hierarchical encoding of, for example, five layers using the above-described averaging. Assume that the first hierarchy is the resolution level of the input image. The block size of this first layer is (1 × 1). The second layer data is generated by averaging four pixels of the first layer data. In this example, the first hierarchy data X1 (0) to X1 Based on the average value of (3), the second hierarchical data X2 (0) is generated. X2 Second layer data X adjacent to (0)2 (1) to X2 Similarly, (3) is generated by averaging four pixels of the first layer data. The block size of the second hierarchy is (1/2 × 1/2).
[0044]
Further, the third layer data is generated by averaging four pixels of the second layer data corresponding spatially. The block size of the third hierarchy is (1/4 × 1/4). Similarly, the fourth layer data is generated from the third layer data. The block size of the fourth layer is (1/8 × 1/8). Finally, the fifth hierarchy data X which is the highest hierarchy5 (0) is the fourth layer data X4 (0) to X4 It is generated by the average value of (3). The block size of the fifth layer is (1/16 × 1/16).
[0045]
By applying the class classification adaptive prediction to the upper layer data for the hierarchical structure data in which the increase in the number of encoding target pixels is prevented, the lower layer data is predicted, and the difference between the lower layer data and the predicted value ( That is, it is possible to reduce the amount of transmission data by generating a residual signal. FIG. 10 shows such a coding unit. The first hierarchy data d0 is supplied as input image data d0 to the averaging circuit 42 and the
[0046]
The input pixel data d0 is subjected to ¼ averaging processing in the averaging circuit 42 to generate hierarchical data d1. This hierarchical data d1 corresponds to the second hierarchical data shown in FIG. The generated hierarchical data d1 is supplied to the averaging
[0047]
The averaging
[0048]
And about these five hierarchical data, prediction is performed between hierarchies. First, the quantization processing for compression performed in the fifth layer is performed by the
[0049]
In the class classification adaptive prediction circuit 62, prediction processing is performed using the data d16, a predicted value d12 of the fourth layer data is generated, and the predicted value d12 is supplied to the
[0050]
In the
[0051]
The fourth layer data d12 predicted by the class classification adaptive prediction circuit 62 and the output data (decoded residual signal) d15 of the
[0052]
The output data of the
[0053]
The third layer data d11 predicted by the class classification adaptive prediction circuit 61 and the output data d14 of the
[0054]
The output data of the
[0055]
The second hierarchy data d10 predicted by the class classification
[0056]
The output data of the quantizer 50 supplied with the difference value d5 is supplied to the
[0057]
Each of the class classification
[0058]
The prediction coefficient memory 144 stores the prediction coefficient w acquired in advance by learning.1~ WnIs stored for each address. That is, using a teacher signal (for example, fourth layer data) and an input signal (fifth layer data formed by averaging from the fourth layer data), a plurality of input signal data and coefficients A predicted value is obtained by linear linear combination of the above, and a coefficient that minimizes the square sum of errors between the predicted value and the true value of the teacher signal is obtained for each class by the method of least squares. Prediction coefficients w1 to w read from the prediction coefficient memory 144 corresponding to the class code.nAnd the peripheral code value x from the
[0059]
In the
y = w1x1+ W2x2+ ... + wnxn
The predicted value y obtained by the
[0060]
A configuration similar to that of the encoding unit 125 (see FIG. 2) in the above-described embodiment is also provided on the encoder side of the hierarchical encoding. That is, each of the
[0061]
Next, FIG. 11 shows a configuration example on the decoder side of the hierarchical encoding corresponding to the encoder described above. Each hierarchical data generated on the encoder side is supplied to input
[0062]
First, the fifth hierarchy input data d34 is subjected to decoding processing corresponding to the quantization performed by the encoder in the
[0063]
In the class classification adaptive prediction circuit 107, class classification adaptive prediction is performed on the image data of the fourth layer, and the predicted value d47 of the fourth layer data is generated. The
[0064]
In the class classification adaptive prediction circuit 106, class classification adaptive prediction is performed on the image data of the third hierarchy, and the predicted value d46 of the third hierarchy data is generated. The
[0065]
Also, the class classification adaptive prediction circuit 105 performs class classification adaptive prediction on the second layer image data, and generates a predicted value d45 of the second layer data. The
[0066]
Further, the class classification adaptive prediction circuit 104 performs class classification adaptive prediction on the first layer image data, and generates a predicted value d44 of the first layer data. The
[0067]
The variable
[0068]
Various methods for transmitting the mode signal MODE and the encoded residual signal generated in the present invention are possible. For example, the mode signals for one frame can be transmitted together and the encoded residual signal can be transmitted thereafter. Further, in the present invention, three or more quantization modes can be set. For example, considering not only the level range of the residual signal of the block but also its dynamic range DR, when the dynamic range DR is small, the third quantization mode having a smaller number of bits than the number of bits in the second quantization mode is obtained. It may be set. Furthermore, the quantization mode may be determined based on the level range of the quantization output of the first quantization mode.
[0069]
Furthermore, the present invention can be applied to quantization of a residual signal generated by predictive encoding other than the predictive encoding described above. The present invention can also be applied to a system having a buffering configuration for controlling the amount of generated data by controlling the quantization step width.
[0070]
【The invention's effect】
According to the present invention, it is possible to detect a case where the frequency distribution of the blocked residual signal does not cross 0, in which case the number of quantization bits can be further reduced and the amount of transmission data can be further reduced. it can.
[Brief description of the drawings]
FIG. 1 is a block diagram of an example of a recording / reproducing or transmission system to which the present invention can be applied.
FIG. 2 is a block diagram of an embodiment of the present invention.
FIG. 3 is a schematic diagram used for explaining generation of a residual signal and its blocking in one embodiment of the present invention.
FIG. 4 is a schematic diagram used for explaining quantization processing in one embodiment of the present invention;
FIG. 5 is a block diagram of an example of a quantization circuit in one embodiment of the present invention.
FIG. 6 is a schematic diagram used for explaining a bit plane in one embodiment of the present invention;
FIG. 7 is a block diagram of a decoding unit in one embodiment of the present invention.
FIG. 8 is a schematic diagram used to describe an example of hierarchical encoding.
FIG. 9 is a schematic diagram used to describe an example of hierarchical encoding.
FIG. 10 is a block diagram showing an example of a configuration on the encoding side of another embodiment in which the present invention is applied to hierarchical encoding.
FIG. 11 is a block diagram showing an example of a configuration on the decoding side according to another embodiment of the present invention.
FIG. 12 is a block diagram showing an example of the configuration of a class classification adaptive prediction circuit according to another embodiment of the present invention.
[Explanation of symbols]
2 ... Maximum value detection circuit, 3 ... Minimum value detection circuit, 5 ... Mode decision circuit
6 ... Quantization circuit
Claims (6)
上記入力ディジタル情報信号と上記入力ディジタル情報信号の予測値との残差信号を生成する手段と、
上記残差信号をブロック化する手段と、
上記ブロック毎に、最大値および最小値を検出する手段と、
上記最大値および上記最小値から上記ブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、上記存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、上記存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定手段と、
上記第1の量子化モードでは、元のビット数より少ない所定のビット数で、上記残差信号を量子化し、上記第2の量子化モードでは、元のビット数より少ないビット数で上記残差信号を量子化するとともに、コード変換によりビット数をより少なくするようになされた量子化手段と、
上記第1および第2の量子化モードを識別する情報と、
上記量子化手段の出力とを伝送する伝送手段と
からなることを特徴とする情報信号符号化装置。In an information signal encoding apparatus for encoding an input digital information signal so as to reduce the amount of generated data,
Means for generating a residual signal between the input digital information signal and a predicted value of the input digital information signal ;
Means for blocking the residual signal;
Means for detecting the maximum and minimum values for each block;
It is determined from the maximum value and the minimum value whether or not the existence range of the residual signal for each block crosses 0, and when the existence range crosses 0, the first quantization mode is indicated and the presence Mode determining means for instructing the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual is calculated with a number of bits less than the original number of bits. Quantization means adapted to quantize the signal and reduce the number of bits by code conversion;
Information identifying the first and second quantization modes;
An information signal encoding apparatus comprising transmission means for transmitting the output of the quantization means.
上記モード決定手段は、
上記最小値が0以上の場合、または上記最大値が0以下の場合に、第2の量子化モードを指示することを特徴とする情報信号符号化装置。In the information signal encoding device according to claim 1,
The mode determining means includes
An information signal encoding apparatus characterized by instructing a second quantization mode when the minimum value is 0 or more, or when the maximum value is 0 or less.
上記入力ディジタル情報信号と上記入力ディジタル情報信号の予測値との残差信号を生成するステップと、
上記残差信号をブロック化するステップと、
上記ブロック毎に、最大値および最小値を検出するステップと、
上記最大値および上記最小値から上記ブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、上記存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、上記存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定のステップと、
上記第1の量子化モードでは、元のビット数より少ない所定のビット数で、上記残差信号を量子化し、上記第2の量子化モードでは、元のビット数より少ないビット数で上記残差信号を量子化するとともに、コード変換によりビット数をより少なくする量子化のステップと、
上記第1および第2の量子化モードを識別する情報と、
上記量子化手段の出力とを伝送するステップと
からなることを特徴とする情報信号符号化方法。In an information signal encoding method for encoding an input digital information signal so as to reduce the amount of generated data,
Generating a residual signal between the input digital information signal and a predicted value of the input digital information signal ;
Blocking the residual signal;
Detecting a maximum value and a minimum value for each of the blocks;
It is determined from the maximum value and the minimum value whether or not the existence range of the residual signal for each block crosses 0, and when the existence range crosses 0, the first quantization mode is indicated and the presence A mode determining step for indicating the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual is calculated with a number of bits less than the original number of bits. Quantization of the signal, and a quantization step for reducing the number of bits by code conversion,
Information identifying the first and second quantization modes;
An information signal encoding method comprising the step of transmitting the output of the quantization means.
上記第1の階層データより解像度がより低い上記第2の階層データを形成する手段と、
上記第2の階層データから上記第1の階層データを予測する手段と、
上記予測されたデータと上記第1の階層データとの残差信号を形成する手段と、
上記残差信号をブロック化する手段と、
上記ブロック毎に、最大値および最小値を検出する手段と、
上記最大値および上記最小値から上記ブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、上記存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、上記存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定手段と、
上記第1の量子化モードでは、元のビット数より少ない所定のビット数で、上記残差信号を量子化し、上記第2の量子化モードでは、元のビット数より少ないビット数で上記残差信号を量子化するとともに、コード変換によりビット数をより少なくするようになされた量子化手段と、
上記第1および第2の量子化モードを識別する情報と、
上記量子化手段の出力とを伝送する伝送手段と
からなることを特徴とする情報信号符号化装置。In an information signal encoding apparatus for forming at least first and second layer data from an input digital information signal and encoding and transmitting the first and second layer data,
Means for forming the second hierarchical data having a lower resolution than the first hierarchical data;
Means for predicting the first hierarchical data from the second hierarchical data;
Means for forming a residual signal between the predicted data and the first hierarchical data;
Means for blocking the residual signal;
Means for detecting the maximum and minimum values for each block;
It is determined from the maximum value and the minimum value whether or not the existence range of the residual signal for each block crosses 0, and when the existence range crosses 0, the first quantization mode is indicated and the presence Mode determining means for instructing the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual is calculated with a number of bits less than the original number of bits. Quantization means adapted to quantize the signal and reduce the number of bits by code conversion;
Information identifying the first and second quantization modes;
An information signal encoding apparatus comprising transmission means for transmitting the output of the quantization means.
上記第1の階層データより解像度がより低い上記第2の階層データを形成するステップと、
上記第2の階層データから上記第1の階層データを予測するステップと、
上記予測されたデータと上記第1の階層データとの残差信号を形成するステップと、
上記残差信号をブロック化するステップと、
上記ブロック毎に、最大値および最小値を検出するステップと、
上記最大値および上記最小値から上記ブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、上記存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、上記存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定のステップと、
上記第1の量子化モードでは、元のビット数より少ない所定のビット数で、上記残差信号を量子化し、上記第2の量子化モードでは、元のビット数より少ないビット数で上記残差信号を量子化するとともに、コード変換によりビット数をより少なくする量子化のステップと、
上記第1および第2の量子化モードを識別する情報と、
上記量子化出力とを伝送する伝送のステップと
からなることを特徴とする情報信号符号化方法。In an information signal encoding method for forming at least first and second layer data from an input digital information signal, and encoding and transmitting the first and second layer data,
Forming the second hierarchical data having a lower resolution than the first hierarchical data;
Predicting the first hierarchical data from the second hierarchical data;
Forming a residual signal between the predicted data and the first hierarchical data;
Blocking the residual signal;
Detecting a maximum value and a minimum value for each of the blocks;
It is determined from the maximum value and the minimum value whether or not the existence range of the residual signal for each block crosses 0, and when the existence range crosses 0, the first quantization mode is indicated and the presence A mode determining step for indicating the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual is calculated with a number of bits less than the original number of bits. Quantization of the signal, and a quantization step for reducing the number of bits by code conversion,
Information identifying the first and second quantization modes;
An information signal encoding method comprising: a transmission step for transmitting the quantized output.
上記識別情報に基づいて、上記第1の量子化モードでは、データを逆量子化し、上記第2の量子化モードでは、データをコード変換するとともに、逆量子化する逆量子化のステップと、
上記逆量子化された残差信号をブロック分解し、元の順序へ変換するステップとからなることを特徴とする情報信号復号方法。 A residual signal between an input digital information signal and a predicted value of the input digital information signal is generated, the residual signal is blocked, and a maximum value and a minimum value are detected for each block, and the maximum value and the minimum value are detected. It is determined from the value whether or not the existence range of the residual signal for each block crosses 0, and when the existence range crosses 0, the first quantization mode is indicated, and the existence range crosses 0. If not, the second quantization mode is instructed . In the first quantization mode, the residual signal is quantized with a smaller number of bits than the original number of bits, and in the second quantization mode, the residual is The signal is quantized with a smaller number of bits than the original number of bits and encoded to reduce the number of bits by code conversion, and information identifying the first and second quantization modes, and a residual Signal In the decoding method for the information signal encoding method in which the broadcast is transmitted,
Based on the identification information, in the first quantization mode, the data is inversely quantized, and in the second quantization mode, the data is transcoded and inversely quantized,
An information signal decoding method comprising the steps of: block-decomposing the inversely quantized residual signal and converting it to the original order.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP19965996A JP3629826B2 (en) | 1995-07-28 | 1996-07-10 | Information signal encoding apparatus, encoding method, and information signal decoding method |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP21268495 | 1995-07-28 | ||
JP7-212684 | 1995-07-28 | ||
JP19965996A JP3629826B2 (en) | 1995-07-28 | 1996-07-10 | Information signal encoding apparatus, encoding method, and information signal decoding method |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH09102743A JPH09102743A (en) | 1997-04-15 |
JP3629826B2 true JP3629826B2 (en) | 2005-03-16 |
Family
ID=26511666
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP19965996A Expired - Fee Related JP3629826B2 (en) | 1995-07-28 | 1996-07-10 | Information signal encoding apparatus, encoding method, and information signal decoding method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3629826B2 (en) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
KR100908114B1 (en) * | 2002-03-09 | 2009-07-16 | 삼성전자주식회사 | Scalable lossless audio encoding / decoding apparatus and method thereof |
JP4733939B2 (en) | 2004-01-08 | 2011-07-27 | パナソニック株式会社 | Signal decoding apparatus and signal decoding method |
CN114490480B (en) * | 2022-03-31 | 2022-07-08 | 苏州浪潮智能科技有限公司 | Coding method and system of chip internal signal and electronic equipment |
-
1996
- 1996-07-10 JP JP19965996A patent/JP3629826B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JPH09102743A (en) | 1997-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US7327786B2 (en) | Method for improving rate-distortion performance of a video compression system through parallel coefficient cancellation in the transform | |
US6721359B1 (en) | Method and apparatus for motion compensated video coding | |
US6370276B2 (en) | Image predictive decoding method, image predictive decoding apparatus, image predictive coding method, image predictive coding apparatus, and data storage media | |
US5703652A (en) | Information signal encoding system and method for adaptively encoding an information signal | |
US8406314B2 (en) | Two-dimensional DPCM with PCM escape mode | |
US6078694A (en) | Image signal padding method, image signal coding apparatus, image signal decoding apparatus | |
JPH0583696A (en) | Picture encoding device | |
US20060098881A1 (en) | Method and apparatus for encoding and decoding image data | |
JPH09238366A (en) | Image coder, image encoder, and coding decoding system | |
US5825313A (en) | Information signal encoding apparatus, encoding method thereof, information signal decoding method, and information signal record medium thereof | |
EP0820196A2 (en) | Hierarchic image encoding | |
JP2007521740A (en) | How to find zeros in the transformation domain early | |
US6408101B1 (en) | Apparatus and method for employing M-ary pyramids to enhance feature-based classification and motion estimation | |
US6072837A (en) | Quantizing apparatus and quantizing method | |
KR100423226B1 (en) | Quantization Device and Quantization Method | |
US6473465B1 (en) | Method and apparatus for video coding at high efficiency | |
JP3629826B2 (en) | Information signal encoding apparatus, encoding method, and information signal decoding method | |
JP3834880B2 (en) | Information signal encoding apparatus, encoding method, and information signal decoding method | |
US5841375A (en) | Information signal encoding apparatus, encoding method thereof, information signal decoding method, and information signal medium thereof | |
JP2004511978A (en) | Motion vector compression | |
JP3496402B2 (en) | Information signal encoding apparatus, encoding method, and information signal decoding method | |
JP3968799B2 (en) | Information signal encoding apparatus, encoding method, and information signal decoding method | |
JP3309639B2 (en) | Quantization device and quantization method | |
JPH0388488A (en) | Picture coding system | |
JP3341528B2 (en) | Quantization device and quantization method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20040827 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20040831 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20041101 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20041124 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20041207 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071224 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081224 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091224 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091224 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101224 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101224 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111224 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111224 Year of fee payment: 7 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121224 Year of fee payment: 8 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131224 Year of fee payment: 9 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |