JP3629826B2 - Information signal encoding apparatus, encoding method, and information signal decoding method - Google Patents

Information signal encoding apparatus, encoding method, and information signal decoding method Download PDF

Info

Publication number
JP3629826B2
JP3629826B2 JP19965996A JP19965996A JP3629826B2 JP 3629826 B2 JP3629826 B2 JP 3629826B2 JP 19965996 A JP19965996 A JP 19965996A JP 19965996 A JP19965996 A JP 19965996A JP 3629826 B2 JP3629826 B2 JP 3629826B2
Authority
JP
Japan
Prior art keywords
quantization
bits
signal
data
mode
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP19965996A
Other languages
Japanese (ja)
Other versions
JPH09102743A (en
Inventor
哲二郎 近藤
泰弘 藤森
健治 高橋
邦雄 川口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP19965996A priority Critical patent/JP3629826B2/en
Publication of JPH09102743A publication Critical patent/JPH09102743A/en
Application granted granted Critical
Publication of JP3629826B2 publication Critical patent/JP3629826B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Compression Or Coding Systems Of Tv Signals (AREA)
  • Compression Of Band Width Or Redundancy In Fax (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)

Description

【0001】
【発明の属する技術分野】
この発明は、例えばディジタルオーディオ信号、ディジタル画像信号等のディジタル情報信号の発生データ量を低減するようにした情報信号符号化装置、符号化方法、および情報信号復号方法に関する。
【0002】
【従来の技術】
ディジタルオーディオ信号、ディジタル画像信号等の伝送情報量を低減するために、予測符号化が知られている。例えば1次元DPCMは、時間または空間方向において、入力サンプル値と予測値との差分(残差)を形成し、2次元DPCMは、空間方向において入力サンプル値と予測値との残差を形成する。ディジタル情報信号は、時間方向、空間方向の相関を有しているので、残差信号のレベルがサンプル値よりも小さいものとなる。従って、残差信号を元の量子化ビット数より少ないビット数により再量子化することが可能で、それによって、情報量を圧縮できる。
【0003】
残差信号を対象とする量子化装置としては、0付近の量子化ステップ幅を細かくし、レベルが大きいほど、量子化ステップ幅を粗くする非線形量子化装置が周知である。この非線形量子化を含めて従来の量子化装置は、発生しうる残差信号の全てのレベルを量子化対象としている。例えばディジタル画像信号の1サンプル(1画素)が8ビットに量子化されている場合、残差信号としては、(−255〜+255)の値が存在しうる。従来の量子化装置は、この全範囲を量子化の対象としている。
【0004】
【発明が解決しようとする課題】
従来の量子化装置は、発生しうる残差信号の全範囲を量子化の対象とするので、量子化ビット数を少なくした場合には、量子化精度が低下し、量子化ビット数を多くすると発生データ量が多くなる問題があった。その結果、復号した時に、充分な品質のオーディオ信号、画像信号が得られない問題があった。
【0005】
従って、この発明の目的は、残差信号を量子化する時に、さらに、量子化出力のデータ量の削減が可能な情報信号符号化装置、符号化方法、並びに復号方法を提供することにある。すなわち、残差信号をブロック化し、ブロック毎の残差信号のレベル範囲がある条件を満たしている場合では、量子化ビット数をより少なくするように、量子化モードを切り替えるものである。
【0006】
【課題を解決するための手段】
請求項1の発明は、入力ディジタル情報信号を発生データ量を少なくするように符号化する情報信号符号化装置において、
入力ディジタル情報信号と入力ディジタル情報信号の予測値との残差信号を生成する手段と、
残差信号をブロック化する手段と、
ブロック毎に、最大値および最小値を検出する手段と、
最大値および最小値からブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定手段と、
第1の量子化モードでは、元のビット数より少ない所定のビット数で、残差信号を量子化し、第2の量子化モードでは、元のビット数より少ないビット数で残差信号を量子化するとともに、コード変換によりビット数をより少なくするようになされた量子化手段と、
第1および第2の量子化モードを識別する情報と、
量子化手段の出力とを伝送する伝送手段と
からなることを特徴とする情報信号符号化装置である。
【0007】
請求項3の発明は、入力ディジタル情報信号を発生データ量を少なくするように符号化する情報信号符号化方法において、
入力ディジタル情報信号と上記入力ディジタル情報信号の予測値との残差信号を生成するステップと、
残差信号をブロック化するステップと、
ブロック毎に、最大値および最小値を検出するステップと、
最大値および最小値からブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定のステップと、
第1の量子化モードでは、元のビット数より少ない所定のビット数で、残差信号を量子化し、第2の量子化モードでは、元のビット数より少ないビット数で残差信号を量子化するとともに、コード変換によりビット数をより少なくする量子化のステップと、
第1および第2の量子化モードを識別する情報と、
量子化手段の出力とを伝送するステップと
からなることを特徴とする情報信号符号化方法である。
【0008】
請求項4の発明は、入力ディジタル情報信号から少なくとも第1および第2の階層データを形成し、第1および第2の階層データを符号化して伝送するようにした情報信号符号化装置において、
第1の階層データより解像度がより低い第2の階層データを形成する手段と、
第2の階層データから第1の階層データを予測する手段と、
予測されたデータと第1の階層データとの残差信号を形成する手段と、
残差信号をブロック化する手段と、
ブロック毎に、最大値および最小値を検出する手段と、
最大値および最小値からブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定手段と、
第1の量子化モードでは、元のビット数より少ない所定のビット数で、残差信号を量子化し、第2の量子化モードでは、元のビット数より少ないビット数で残差信号を量子化するとともに、コード変換によりビット数をより少なくするようになされた量子化手段と、
第1および第2の量子化モードを識別する情報と、
量子化手段の出力とを伝送する伝送手段と
からなることを特徴とする情報信号符号化装置である。
【0009】
請求項5の発明は、入力ディジタル情報信号から少なくとも第1および第2の階層データを形成し、第1および第2の階層データを符号化して伝送するようにした情報信号符号化方法において、
第1の階層データより解像度がより低い第2の階層データを形成するステップと、
第2の階層データから第1の階層データを予測するステップと、
予測されたデータと第1の階層データとの残差信号を形成するステップと、
残差信号をブロック化するステップと、
ブロック毎に、最大値および最小値を検出するステップと、
最大値および最小値からブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定のステップと、
第1の量子化モードでは、元のビット数より少ない所定のビット数で、残差信号を量子化し、第2の量子化モードでは、元のビット数より少ないビット数で残差信号を量子化するとともに、コード変換によりビット数をより少なくする量子化のステップと、
第1および第2の量子化モードを識別する情報と、
量子化出力とを伝送する伝送のステップと
からなることを特徴とする情報信号符号化方法である。
【0010】
請求項6の発明は、入力ディジタル情報信号と入力ディジタル情報信号の予測値との残差信号を生成され、残差信号をブロック化され、ブロック毎に、最大値および最小値が検出され、最大値および最小値からブロック毎の残差信号の存在範囲が0を跨ぐものかどうかが決定され、存在範囲が0を跨ぐ場合に第1の量子化モードが指示され、存在範囲が0を跨がない場合に第2の量子化モードが指示され、第1の量子化モードでは、残差信号が元のビット数より少ないビット数で量子化され、第2の量子化モードでは、残差信号が元のビット数より少ないビット数で量子化されるとともに、コード変換によりビット数をより少なくするように符号化され、第1および第2の量子化モードを識別する情報と、残差信号の情報とが伝送される情報信号符号化方法に対する復号方法において、
識別情報に基づいて、第1の量子化モードでは、データを逆量子化し、第2の量子化モードでは、データをコード変換するとともに、逆量子化する逆量子化のステップと、
逆量子化された残差信号をブロック分解し、元の順序へ変換するステップとからなることを特徴とする情報信号復号方法である。
【0011】
残差信号のレベル分布の集中度を高めることによって、残差信号を元の量子化ビット数より少ないビット数で再量子化することができる。また、残差信号の分布がある条件を満足する時には、残差信号をより少ないビット数で量子化するが可能となる。
【0012】
【発明の実施の形態】
以下、この発明の一実施例について図面を参照して説明する。この一実施例では、ビデオ信号が所定のサンプリング周波数でサンプリングされ、各サンプルが所定の量子化ビット数へ変換されたディジタル画像信号に対して、この発明が適用される。図1は、この発明の一実施例のシステムの構成を全体的に示す。
【0013】
図1において、121で示す入力端子にディジタルビデオ信号が供給される。入力信号が減算器123に供給され、減算器123の出力(残差信号)がブロック化回路124および予測器122に供給され、予測器122で生成された予測信号が減算器123に供給される。減算器123は、入力信号から予測信号を減算し、予測残差を発生する。この残差信号がブロック化回路124に供給され、ラスター走査の順序からブロックの順序のデータへ変換される。ブロック化された残差信号が符号化ユニット125に供給される。
【0014】
符号化ユニット125中の量子化回路は、後述するように、ブロック化された残差信号の度数分布に応じて、第1の量子化モードと第2の量子化モードとが切り替えられるものである。例えば残差信号のビット数が8ビットの場合、第1の量子化モードが選択される時には、符号化ユニット125から3ビットの量子化出力が発生する。第2の量子化モードが選択される時には、符号化ユニット125内のコード変換テーブルによって、2ビットに変換された量子化出力が発生する。
【0015】
符号化ユニット125の符号化出力がエラー訂正符号エンコーダ126に供給され、エラー訂正符号の冗長コードが付加される。エラー訂正符号エンコーダ126の出力が変調部127に供給される。変調部127は、記録、伝送等に適した形態にディジタル信号を変調する。変調部127からの出力信号が記録ユニット128に供給され、記録ユニット128によって記録信号が情報信号記録媒体129に記録される。また、伝送路130を介してデータを伝送することも可能で、その場合では、記録ユニット128の代わりに伝送ユニットが使用される。量子化モードを指示するモード信号も符号化残差信号とともに、記録、あるいは伝送される。情報信号記録媒体129は、磁気、光磁気、相変化等を利用したディスク状、あるいはテープ状の記録媒体である。半導体メモリも一種の記録媒体である。
【0016】
記録媒体129からデータを再生ユニット131が再生し、または伝送路130を介して伝送されたデータが受信される。再生ユニット131により再生されたデータが復調部132により復調され、復調出力がエラー訂正符号のデコーダ133に供給される。このデコーダ133は、冗長コードを利用してエラーを訂正し、また、訂正できないで残ったエラーを目立たないように修整する。
【0017】
エラー訂正デコーダ133の出力が復号化ユニット134に供給される。復号化ユニット134は、後述するように、符号化ユニット125と逆に量子化出力を代表値(量子化復元値)に変換する、逆量子化の処理を行う。復号化ユニット134中の逆量子化回路は、モード信号により指示される量子化モードに従って逆量子化の処理を行う。復号化ユニット134から復号された残差信号が発生する。この復号残差信号がブロック分解回路135に供給される。ブロック分解回路135では、ブロック構造がラスター走査の順序に戻される。
【0018】
復号残差信号が加算回路136に供給される。加算回路136により復号画像信号が形成され、出力端子137に取り出される。また、この復号画像信号が予測器138に供給され、予測信号が生成される。予測信号が加算回路136に供給される。
【0019】
図2は、符号化ユニット125の一例を示す。ブロック化回路124からのブロック化された残差信号が入力端子1に供給される。図3は、残差信号の形成を概略的に示すものである。図3における一つの矩形の領域が1つの画素と対応している。a〜hのそれぞれは、局部復号された画素値を示し、A〜Pは、符号化される前の画素値を示す。画素値Aに対しての予測値A’は、近傍の局部復号画素値を使用して予測器122により生成される。例えば予測値A’は、A’=4c−3(b−f)、A’=f+c−b等の予測式に従って形成される。画素値B、C、・・・に対する予測値も同様の予測式によって計算される。一般式で表すと、予測値は、(αa+βb+γf、但し、α、β、γは定数)により生成される。
【0020】
減算器123では、画素値(例えばA)から予測値(例えばA’)が減算され、残差信号Δaが生成される。同様に、残差信号Δb、Δc、・・・が生成される。ブロック化回路124では、生成された残差信号がブロック構造に変換される。例えばブロック化回路124によって、図3Aの太線の枠で示すように、(4×4)のブロックと対応する残差信号Δa〜Δpのブロックのデータが形成される。なお、ディジタルオーディオ信号を扱う場合には、時間方向の予測値が形成され、1次元の残差信号のブロックが形成される。
【0021】
残差信号のレベル範囲は、ブロック化することによって、集中度を高めることが可能である。1画素が8ビットのデータの場合では、1画面の全体の残差信号の発生度数の分布は、0を中心として(−255〜+255)の範囲のものであり、残差が0の度数が最大となる。しかしながら、ブロックに分割した場合には、残差の度数分布がもとの分布に比してより集中したものとなる。
【0022】
これは、1画面と比較して小空間のブロック内の残差は、大きな値となるものが確率的に少なく、また、ブロック内では残差の相関が強いことに因る。従って、ブロック化された残差信号を元の量子化ビット数より少ないビット数でもって再量子化することができる。また、ブロック化された残差信号の分布において、必ずしも0の値の度数が最大とならない。例えば、ブロック内で輝度のレベルが例えば対角線方向に除々に変化する場合等では、0の値の度数が最大とならない分布が生じる。なお、残差信号の分布の集中度を高める方法は、ブロック化が一例であって、これ以外の方法も可能である。
【0023】
図2に戻って、符号化ユニット125について説明する。入力端子1からの残差信号が最大値検出回路2、最小値検出回路3、遅延回路4に供給される。最大値検出回路2では、ブロック毎の最大値MAXが検出され、最小値検出回路3では、ブロック毎の最小値MINが検出される。検出された最大値MAXおよび最小値MINがモード決定回路5へ供給される。
【0024】
モード決定回路5には、ブロック化された残差信号、最大値MAXおよび最小値MINが供給され、そのブロックの残差信号のレベル範囲に基づいて、量子化モードが決定され、モードを指示する信号MODE(例えば1ビット)が生成される。モード信号MODEが量子化回路6に供給され、また、量子化回路6に対して、入力端子1からの残差信号が位相合わせのための遅延回路4を介して供給される。量子化回路6では、残差信号が元の量子化ビット数(例えば8ビット)より少ない量子化ビット数により再量子化される。量子化回路6では、第1および第2の量子化モードがモード信号MODEに従って選択される。
【0025】
第1の量子化モードは、8ビットの残差信号を再量子化して、より少ない量子化ビット数例えば3ビットの量子化出力を発生する、通常のものである。第2の量子化モードは、ブロック化された残差信号のレベル範囲が0を跨がない場合に適用される。この一実施例では、残差信号の最小値MINが(Δ/2)よりも大きい場合には、第2の量子化モードが適用される。ここで、Δは、再量子化ビット数をnとするときに、DR/2で計算される量子化ステップである。DRは、ダイナミックレンジで、(MAX−MIN)により計算できる。
【0026】
第2の量子化モードでは、第1の量子化モードと同様に再量子化で発生したコード信号(例えば3ビット)が所定の規則に従って変換され、より少ないビット数例えば2ビットの量子化出力に変換される。3ビットのコードを2ビットの量子化出力に変換するコード変換の規則を下記に示す。
100 − 00
101 − 01
110 − 10
111 − 11
【0027】
量子化処理について図4を参照して説明する。上述したように予測符号化により発生した残差信号は、1フレーム全体で見ると、0の値の度数が最大となるが、ブロック化したものは、図4Aに示すように、そのブロックによってさまざまな偏りを持っている。図4Aは、負側に偏った残差信号の分布、最大度数が0の値と一致した残差信号の分布、正側に偏った残差信号の分布を示す。
【0028】
図4Bは、0の値を跨がるような残差信号の度数分布を示している。残差信号を量子化する場合では、例えばMAXおよびMINの間が2=8等分され、その範囲に属する残差信号に同一のコードが割り当てられる。そのコードは、復元されると、範囲の中央の代表値へ変換される。一般的には、コードのビット数がnの場合、2の個数の範囲にMAXおよびMINの間が分割される。このような量子化が第1の量子化モードである。
【0029】
図4Cは、ブロック化された残差信号の度数分布の例を示す。すなわち、図4Cには、最小値MINがΔ/2に等しいような分布30a、図4Bのものと同様に、0を跨がる分布30b(破線で示す)、最大値MAXが−Δ/2に等しい分布30c(破線で示す)が示されている。この一実施例では、度数分布30aのように、(MIN≧Δ/2)の条件を満たす場合では、第2の量子化モードが適用され、第2の量子化モードにおいて、上述したようなコード変換がなされる。復号側においては、2ビットから3ビットへの逆方向のコード変換がなされ、そして、3ビットのコードが逆量子化される。
【0030】
例えば図4Cにおける度数分布30aを有する残差信号を第2の量子化モードで量子化すると、MIN〜MAXの範囲の100〜111の量子化出力が00〜11の量子化出力に変換される。復号側では、逆に00〜11の量子化出力が100〜111のコードに変換される。この変換された3ビットのコードを第1の量子化モードで発生した3ビットの量子化出力と同様に、代表値に変換することによっで、逆量子化を行うことができる。
【0031】
この発明の一実施例と異なり、ブロックの残差信号の最大値MAXが−Δ/2より小さい場合(例えば図4Cにおける度数分布30c)に、第2の量子化モードを適用するようにしても良い。さらに、最小値MINが(MIN≧0)の場合、あるいは最大値MAXが(MAX≦0)の場合に、第2の量子化モードを適用するようにしても良い。
【0032】
量子化回路6の一例を図5に示す。15で示す入力端子に対して、ブロック化された残差信号が遅延回路4から供給される。モード信号MODEによって切り替えられるスイッチング回路16の入力端子に入力残差信号が供給される。スイッチング回路16の出力端子aおよびbには、例えば3ビットの出力を発生する量子化器17aおよび17bがそれぞれ接続される。量子化器17bに対してコード変換回路18が接続される。コード変換回路18は、上述したような3ビットを2ビットに変換する回路である。量子化器17aまたは17bの出力が出力端子19に取り出される。
【0033】
モード決定回路5によって、そのブロックの残差信号に関して、(MIN≧Δ/2)である場合には、モード信号MODEが第2の量子化モードを指示し、一方、それ以外の場合には、モード信号MODEが第1の量子化モードを指示する。第1の量子化モードでは、スイッチング回路16の出力端子aが選択され、第2の量子化モードでは、スイッチング回路16の出力端子bが選択される。従って、第1の量子化モードでは、3ビットの量子化出力が出力端子19に発生し、第2の量子化モードでは、2ビットの量子化出力が出力端子19に発生する。なお、量子化器17a、17bを共通としても良い。
【0034】
図2に戻って説明すると、量子化回路6の出力がビットプレーン符号化回路7に供給される。ビットプレーン符号化回路7は、nビット例えば2ビットのコードqをMSB(最上位ビット)プレーンとLSB(最下位ビット)プレーンに分割する。MSBプレーンは、供給される2ビット量子化値のMSBの集合であり、LSBプレーンは、LSBの集合である。図6Aは、簡単のため、1画面が(4×3=12ブロック)で構成され、各ブロックに(4×4)の残差信号のコードqが含まれる場合を示している。
【0035】
図6Aにおいて、例として示されるコードqの値の0,1,2,3は、それぞれ2ビットで(00),(01),(10),(11)を意味する。図6Aの例では、ビットプレーン符号化回路7が図6Bに示すように、例えば1画面のコードqをMSBプレーンおよびLSBプレーンへ分割する。量子化ビット数が3ビットの場合では、さらに、中間のビットのプレーンが形成される。この発明の一実施例では、二つの量子化モードによって2ビットあるいは3ビットの量子化出力が発生する。ビットプレーンを形成する場合では、量子化出力のビット数が分かっている必要がある。そのため、モード信号MODEがビットプレーン符号化回路7に供給されている。
【0036】
ビットプレーン符号化回路7で生成された各ビットプレーンが可変長符号化回路8に供給され、各ビットプレーンが可変長符号化される。可変長符号化回路8では、ビットプレーン毎にランレングス符号化、例えばMMR(Modefied MR )が行われる。可変長符号化回路8の出力がフレーミング回路9に供給される。フレーミング回路9には、上述したモード信号MODEも供給される。フレーミング回路9の出力端子10には、これらのモード信号MODEと可変長符号化されたコードが所定のフレーム構造のデータとして出力される。
【0037】
次に、図7を参照して、図中の復号化ユニット134の一例について説明する。エラー訂正デコーダ133からの再生、あるいは受信データが復号化ユニット134の入力端子31に供給される。フレーム分解回路32によって、可変長符号化された残差信号のコードと、モード信号MODEとが分離される。分離された残差信号のコードが可変長復号化回路33により復号される。可変長復号化回路33は、可変長符号化回路13と対応している。可変長復号化回路33の復号出力がビットプレーン復号化回路34に供給され、ビットプレーンが合成される。この場合、分離されたモード信号MODEによって、ビットプレーンが正しく合成される。
【0038】
ビットプレーン復号化回路34の出力がスイッチング回路35の入力端子に供給される。スイッチング回路35は、モード信号MODEにより制御される。モード信号MODEが第1の量子化モードを指示する場合では、スイッチング回路35の出力端子aが選択され、これが第2の量子化モードを指示する場合では、スイッチング回路35の出力端子bが選択される。出力端子aには、3ビットの量子化コードを逆量子化して、量子化復元値を発生する逆量子化器36aが接続されている。出力端子bには、2ビットの量子化出力を3ビットのコードに変換するコード変換回路37が接続され、コード変換回路37に対して逆量子化器36bが接続されている。逆量子化器36bは、逆量子化器36aと同様に、3ビットのコードを復元値へ変換するものである。
【0039】
逆量子化器36a、36bにより生成された復元値、すなわち、ブロック化された復号残差信号が出力端子38に取り出される。出力端子38に取り出された復号残差信号がブロック分解回路135に供給される(図1参照)。なお、逆量子化器36a、36bを共通としても良い。
【0040】
次に、この発明を階層符号化に対して適用した他の実施例について説明する。ここで説明する階層符号化装置は、階層間で予測を行ない、また、階層間データに対し単純な算術式を用いることで、符号化対象画素数の増加を防止することができるものである。
【0041】
図8を参照してこの階層符号化方法について説明する。図8は、一例として第1階層を最下位階層(原画)とし、第4階層を最上位階層とする4階層からなる階層間の模式図を示している。例えば、上位階層データ生成法として、空間的に対応する4画素の下位階層データの平均値を採用する場合、伝送画素数が増加しないようにできる。
【0042】
すなわち、上位階層データをM、下位階層画素値をx 、x 、x 、x とすると、
M=1/4・(x +x +x +x
によりデータMが形成される。そして、データMと、4個のデータの内の例えばx以外の3個のデータを伝送する。受信あるいは再生側では、
=4・M−(x +x +x
という単純な算術式により非伝送画素x を容易に復元することができる。図8において、斜線の矩形は、非伝送画素を示している。
【0043】
図9は、上述した平均化を使用する例えば5階層の階層符号化の構成を示す。第1階層が入力画像の解像度レベルであるとする。この第1階層のブロックサイズは、(1×1)である。第2階層データは、第1階層データの4画素平均により生成される。この例では、第1階層データX (0)〜X (3)の平均値により、第2階層データX (0)が生成される。X (0)に隣接する第2階層データX (1)〜X (3)も同様に第1階層データの4画素平均により生成される。この第2階層のブロックサイズは、(1/2×1/2)である。
【0044】
さらに、第3階層データは、空間的に対応する第2階層データの4画素平均により生成される。この第3階層のブロックサイズは、(1/4×1/4)である。また、第4階層のデータも同様に第3階層のデータから生成される。この第4階層のブロックサイズは、(1/8×1/8)である。最後に、最上位階層である第5階層データX (0)が第4階層データX (0)〜X (3)の平均値により生成される。この第5階層のブロックサイズは、(1/16×1/16)である。
【0045】
上述した符号化対象画素数の増加を防止した階層構造データに対し、上位階層データにクラス分類適応予測を適用することで、下位階層データを予測し、下位階層データとその予測値との差分(すなわち、残差信号)を生成することで伝送データ量の削減を図ることができる。図10は、そのような符号化ユニットを示す。入力端子41を介して第1階層データd0が入力画像データd0として平均化回路42および減算器46へ供給される。第1階層データが元の解像度の画像データである。
【0046】
入力画素データd0は、平均化回路42において、1/4平均処理が実行され、階層データd1が生成される。この階層データd1は、図9に示す第2階層データに対応する。生成された階層データd1は、平均化回路43および減算器47へ供給される。
【0047】
階層データd1に対して、平均化回路43では、平均化回路42と同様な処理が施され、階層データd2が生成される。この階層データd2は、第3階層データに対応する。生成された階層データd2は、平均化回路44および減算器48へ供給される。また、平均化回路44でも同様に階層データd2に対して1/4平均処理がなされ、階層データd3が生成される。この階層データd3は、第4階層データに対応する。生成された階層データd3は、平均化回路45および減算器49へ供給される。さらに、平均化回路45でも同様に階層データd3に対して1/4平均処理がなされ、階層データd4が生成される。この階層データd4は、第5階層データに対応する。生成された階層データd4は、量子化器54へ供給される。
【0048】
そして、これら5つの階層データについて階層間で予測が行われる。先ず、第5階層においてなされる圧縮のための量子化処理は、量子化器54によりなされる。この量子化器54の出力データd21が可変長符号のエンコーダ71に供給されると共に、逆量子化器58へも供給される。エンコーダ71の出力が出力端子76に第5階層のデータとして取り出される。符号化データd21が供給された逆量子化器58の出力データd16がクラス分類適応予測回路62へ供給される。
【0049】
クラス分類適応予測回路62では、データd16を使用して予測処理がなされ、第4階層データの予測値d12が生成され、この予測値d12が減算器49へ供給される。この減算器49では、平均化回路44から供給される階層データd3と予測値d12との差分値が求められ、その差分値d8が量子化器53へ供給される。
【0050】
差分値d8が供給された量子化器53では、量子化器54と同様に量子化ビット数を低減するように、再量子化がなされる。この量子化器53の出力データが演算器66および逆量子化器57へ供給される。この演算器66では、4画素から1画素を間引く処理が行われる。演算器66から出力されるデータd20が可変長符号のエンコーダ70で符号化され、エンコーダ70の出力が出力端子75に第4階層の出力データとして取り出される。
【0051】
クラス分類適応予測回路62により予測された第4階層データd12と、逆量子化器57の出力データ(復号残差信号)d15がクラス分類適応予測回路61へ供給される。クラス分類適応予測回路61では、データd12に対してデータd15を加算することによって、第4階層のローカル復号データを形成し、このローカル復号データを使用して予測処理がなされ、第3階層データの予測値d11が生成され、この予測値d11が減算器48へ供給される。この減算器48では、平均化回路43から供給されるデータd2と予測値d11との差分値が求められ、その差分値d7が量子化器52へ供給される。
【0052】
差分値d7が供給された量子化器52の出力データが演算器65および逆量子化器56へ供給される。この演算器65では、4画素から1画素を間引く処理が行われる。演算器65から出力される第3階層データd19が可変長符号のエンコーダ69に供給され、エンコーダ69の出力が出力端子74に第3階層のデータとして取り出される。
【0053】
クラス分類適応予測回路61により予測された第3階層データd11と、量子化器52から符号化データが供給された逆量子化器56の出力データd14がクラス分類適応予測回路60へ供給される。クラス分類適応予測回路60では、データd11に対してデータd14を加算することによって、第3階層のローカル復号データを形成し、このローカル復号データを使用して予測処理がなされ、第2階層データの予測値d10が生成され、予測値d10が減算器47へ供給される。この減算器47では、平均化回路42から供給されるデータd1と予測値d10との差分値が求められ、その差分値d6が量子化器51へ供給される。
【0054】
量子化器51の出力データは、演算器64および逆量子化器55へ供給される。この演算器64では、4画素から1画素を間引く処理が行われる。演算器64から出力される第2階層データd18が可変長符号のエンコーダ68に供給され、エンコーダ68の出力が出力端子73に第2階層のデータとして取り出される。
【0055】
クラス分類適応予測回路60により予測された第2階層データd10と、量子化器51から符号化データが供給された逆量子化器55の出力データd13がクラス分類適応予測回路59へ供給される。クラス分類適応予測回路59では、データd10に対してデータd13を加算することによって、第2階層のローカル復号データを形成し、このローカル復号データを使用して予測処理がなされ、第1階層データの予測値d9が生成され、予測値d9が減算器46へ供給される。この減算器46では、入力端子41から供給される入力画素データd0と予測値d9との差分値が求められ、その差分値d5が量子化器50へ供給される。
【0056】
差分値d5が供給された量子化器50の出力データは、演算器63へ供給される。この演算器63では、4画素から1画素を間引く処理が行われる。演算器63から出力される第1階層データd17が可変長符号のエンコーダ67に供給され、エンコーダ67の出力が出力端子72に第1階層のデータとして取り出される。
【0057】
クラス分類適応予測回路59、60、61、62のそれぞれは、予測しようとする下位階層の画素をその空間的に近傍の複数の画素(上位階層に含まれる)のレベル分布に基づいて予測するものである。図12は、クラス分類適応予測回路の一例を示す。入力端子141からのローカル復号データが周辺コード値形成部142に供給される。周辺コード値形成部142は、予測しようとする下位階層の画素の近傍に位置する複数のデータx、x、・・・・、xを同時化する。周辺コード値がクラス分類部143および遅延部145に供給される。クラス分類部143は、周辺コード値x〜xのレベル分布のパターンと対応したクラスコードを出力する。クラスコードとしては、周辺コード値それ自体を使用しても良いが、クラス数が膨大となるので、周辺コードのそれぞれのビット数をADRC等により例えば1ビットに圧縮したものが使用される。クラス分類部143から発生したクラスコードが予測係数メモリ144に対してアドレス信号として供給される。
【0058】
予測係数メモリ144には、予め学習により獲得された予測係数w〜wがアドレス毎に格納されている。すなわち、教師信号(例えば第4階層のデータ)と、入力信号(第4階層のデータから平均化処理で形成された第5階層のデータ)とを使用し、入力信号の複数のデータと係数との線形1次結合により予測値を求め、この予測値と教師信号の真値との誤差の自乗和を最小とするような係数がクラス毎に最小自乗法により求められる。クラスコードに対応して予測係数メモリ144から読出された予測係数w1〜wと遅延部145からの周辺コード値x〜xとが予測演算部146に供給される。
【0059】
予測演算部146では、下記の線形1次結合式によって、予測値yが計算される。
y=w+w+・・・・・+w
予測演算部146により求められた予測値yが出力端子147に取り出される。なお、クラス分類のために使用される周辺コード値と、予測演算のために使用される周辺コード値とが異なったものでも良い。
【0060】
上述した一実施例における符号化ユニット125(図2参照)と同様の構成が階層符号化のエンコーダ側にも設けられている。つまり、量子化回路6迄の前段の構成と同様の構成を量子化器50、51、52、53、54がそれぞれ有し、ビットプレーン符号化回路7より後段の構成と同様の構成を可変長エンコーダ67、68、69、70、71がそれぞれ有する。
【0061】
次に、上述のエンコーダと対応する階層符号化のデコーダ側の構成例を図11に示す。エンコーダ側で生成された各階層データは、d30〜d34として入力端子81、82、83、84、85にそれぞれ供給される。そして、可変長符号のデコーダ86、87、88、89、90にて可変長符号の復号がなされる。これらのデコーダに対して、逆量子化器91、92、93、94、95がそれぞれ接続される。
【0062】
先ず、第5階層入力データd34は、逆量子化器95において、エンコーダで施された量子化に対応する復号処理が行われ、画像データd39となり、クラス分類適応予測回路107および演算器103へ供給される。また画像データd39は、第5階層の画像出力として、出力端子112から取り出される。
【0063】
クラス分類適応予測回路107では、第4階層の画像データに対してクラス分類適応予測が施され、第4階層データの予測値d47が生成される。逆量子化器94からのデータd38(すなわち、差分値)と予測値d47とが加算器99で加算される。加算器99から画像データd43が演算器103へ供給され、演算器103では、非伝送画素の値を求めるために、上述した演算が実行され、逆量子化器95から供給された画像データd39と画像データd43から第4階層の全画素値が復元される。この演算器103において、復元された全画素値は、画像データd51として、クラス分類適応予測回路106および演算器102へ供給される。また画像データd51は、第4階層の出力として、出力端子111から取り出される。
【0064】
クラス分類適応予測回路106では、第3階層の画像データに対してクラス分類適応予測が施され、第3階層データの予測値d46が生成される。逆量子化器93からのデータd37と予測値d46とが加算器98で加算される。加算器98から画像データd42が演算器102へ供給され、演算器102により非伝送画素の値が求められ、演算器103から供給された画像データd51と画像データd42から第3階層の全画素値が復元される。この演算器102において、復元された全画素値は、画像データd50として、クラス分類適応予測回路105および演算器101へ供給される。また画像データd50は、第3階層の出力として、出力端子110から取り出される。
【0065】
また、クラス分類適応予測回路105では、第2階層の画像データに対してクラス分類適応予測が施され、第2階層データの予測値d45が生成される。逆量子化器92からのデータd36と予測値d45とが加算器97で加算される。加算器97から画像データd41が演算器101へ供給され、演算器101により非伝送画素の値が求められ、演算器102から供給された画像データd50と画像データd41から第2階層の全画素値が復元される。この演算器101において、復元された全画素値は、画像データd49として、クラス分類適応予測回路104および演算器100へ供給される。また画像データd49は、第2階層の出力として、出力端子109から取り出される。
【0066】
さらに、クラス分類適応予測回路104では、第1階層の画像データに対してクラス分類適応予測が施され、第1階層データの予測値d44が生成される。逆量子化器91からのデータd35と予測値d44とが加算器96で加算される。加算器96から画像データd40が演算器100へ供給され、演算器100により非伝送画素の値が求められ、演算器101から供給された画像データd49と画像データd40から第1階層の全画素値が復元される。この演算器100において、復元された全画素値は、画像データd48として、第1階層の出力として、出力端子108から取り出される。クラス分類適応予測回路104、105、106、107のそれぞれは、図12に示し、上述した具体的構成を有している。こうして、符号化対象画素数の増加を防止した階層符号化において、クラス分類適応予測を導入することで符号化効率の向上を図ることが可能となる。
【0067】
上述した一実施例の復号化ユニット134と同様の構成を可変長符号のデコーダ86、87、88、89、90と、逆量子化器91、92、93、94、95がそれぞれ有する。従って、上述した階層符号化に対してこの発明を適用した他の実施例によっても、上述した一実施例と同様に、ブロック化された残差信号のレベル範囲が所定の条件を満たす場合に、量子化ビット数をより少なくすることができる。
【0068】
この発明において発生した、モード信号MODEと符号化残差信号との伝送方法としては、種々のものが可能である。例えば1フレーム分のモード信号を先にまとめて伝送し、その後に符号化残差信号を伝送することができる。また、この発明は、3以上の量子化モードを設定することができる。例えばブロックの残差信号のレベル範囲のみならず、そのダイナミックレンジDRも考慮して、ダイナミックレンジDRが小さい時には、第2の量子化モードにおけるビット数より少ないビット数の第3の量子化モードが設定されるようにしても良い。さらに、第1の量子化モードの量子化出力のレベル範囲に基づいて、量子化モードを決定するようにしても良い。
【0069】
よりさらに、この発明は、上述した予測符号化以外の予測符号化で発生した残差信号の量子化に対しても適用できる。また、この発明は、量子化ステップ幅を制御することによって、発生データ量を制御するバッファリングの構成を有するシステムに対しても適用することができる。
【0070】
【発明の効果】
この発明に依れば、ブロック化された残差信号の度数分布が0を跨がない場合を検出し、その場合では、量子化ビット数をより少なくし、伝送データ量を一層低減することができる。
【図面の簡単な説明】
【図1】この発明を適用できる記録/再生、あるいは伝送システムの一例のブロック図である。
【図2】この発明の一実施例のブロック図である。
【図3】この発明の一実施例中の残差信号の生成と、そのブロック化の説明に用いる略線図である。
【図4】この発明の一実施例における量子化処理の説明に用いる略線図である。
【図5】この発明の一実施例中の量子化回路の一例のブロック図である。
【図6】この発明の一実施例中のビットプレーンの説明に用いる略線図である。
【図7】この発明の一実施例における復号化ユニットのブロック図である。
【図8】階層符号化の一例の説明に用いる略線図である。
【図9】階層符号化の一例の説明に用いる略線図である。
【図10】階層符号化に対してこの発明を適用した他の実施例のエンコード側の構成の一例を示すブロック図である。
【図11】この発明の他の実施例のデコード側の構成の一例を示すブロック図である。
【図12】この発明の他の実施例のクラス分類適応予測回路の構成の一例を示すブロック図である。
【符号の説明】
2・・・最大値検出回路,3・・・最小値検出回路,5・・・モード決定回路
6・・・量子化回路
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an information signal encoding device, an encoding method, and an information signal decoding method that reduce the amount of generated data of digital information signals such as digital audio signals and digital image signals.
[0002]
[Prior art]
Predictive coding is known to reduce the amount of transmission information such as digital audio signals and digital image signals. For example, a one-dimensional DPCM forms a difference (residual) between an input sample value and a predicted value in the time or spatial direction, and a two-dimensional DPCM forms a residual between the input sample value and a predicted value in the spatial direction. . Since the digital information signal has a correlation in the time direction and the spatial direction, the level of the residual signal is smaller than the sample value. Therefore, the residual signal can be requantized with a smaller number of bits than the original number of quantization bits, thereby reducing the amount of information.
[0003]
As a quantization device for a residual signal, a nonlinear quantization device is known in which the quantization step width near 0 is made finer and the quantization step width becomes coarser as the level increases. In the conventional quantization apparatus including this nonlinear quantization, all levels of the residual signal that can be generated are targeted for quantization. For example, when one sample (one pixel) of a digital image signal is quantized to 8 bits, a value of (−255 to +255) may exist as a residual signal. The conventional quantization apparatus uses the entire range as the object of quantization.
[0004]
[Problems to be solved by the invention]
Since the conventional quantization apparatus targets the entire range of residual signals that can be generated, if the number of quantization bits is reduced, the quantization accuracy decreases, and the number of quantization bits increases. There was a problem that the amount of generated data increased. As a result, there has been a problem that audio signals and image signals with sufficient quality cannot be obtained when decoding.
[0005]
Accordingly, an object of the present invention is to provide an information signal encoding apparatus, encoding method, and decoding method capable of further reducing the data amount of the quantized output when the residual signal is quantized. In other words, when the residual signal is blocked and the level range of the residual signal for each block satisfies a certain condition, the quantization mode is switched so as to reduce the number of quantization bits.
[0006]
[Means for Solving the Problems]
The invention of claim 1 is an information signal encoding apparatus for encoding an input digital information signal so as to reduce the amount of generated data.
Input digital information signalAnd the predicted value of the input digital information signalMeans for generating a residual signal of
Means for blocking the residual signal;
Means for detecting the maximum and minimum values for each block;
The residual signal for each block from the maximum and minimum valuesExistenceDetermine if the range is crossing zero,ExistenceInstruct the first quantization mode when the range crosses 0,ExistenceMode determining means for instructing the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual signal is quantized with a number of bits smaller than the original number of bits. And quantization means adapted to reduce the number of bits by code conversion,
Information identifying first and second quantization modes;
Transmission means for transmitting the output of the quantization means;
An information signal encoding device characterized by comprising:
[0007]
According to a third aspect of the present invention, there is provided an information signal encoding method for encoding an input digital information signal so as to reduce the amount of generated data.
Input digital information signalAnd the predicted value of the input digital information signalGenerating a residual signal of
Blocking the residual signal;
Detecting the maximum and minimum values for each block;
The residual signal for each block from the maximum and minimum valuesExistenceDetermine if the range is crossing zero,ExistenceInstruct the first quantization mode when the range crosses 0,ExistenceA mode determining step for indicating the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual signal is quantized with a number of bits smaller than the original number of bits. And a quantization step to reduce the number of bits by code conversion,
Information identifying first and second quantization modes;
Transmitting the output of the quantizing means;
An information signal encoding method characterized by comprising:
[0008]
According to a fourth aspect of the present invention, there is provided an information signal encoding apparatus in which at least first and second hierarchical data are formed from an input digital information signal, and the first and second hierarchical data are encoded and transmitted.
Means for forming second hierarchical data having a lower resolution than the first hierarchical data;
Means for predicting the first hierarchical data from the second hierarchical data;
Means for forming a residual signal between the predicted data and the first tier data;
Means for blocking the residual signal;
Means for detecting the maximum and minimum values for each block;
The residual signal for each block from the maximum and minimum valuesExistenceDetermine if the range is crossing zero,ExistenceInstruct the first quantization mode when the range crosses 0,ExistenceMode determining means for instructing the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual signal is quantized with a number of bits smaller than the original number of bits. And quantization means adapted to reduce the number of bits by code conversion,
Information identifying first and second quantization modes;
Transmission means for transmitting the output of the quantization means;
An information signal encoding device characterized by comprising:
[0009]
According to a fifth aspect of the present invention, there is provided an information signal encoding method in which at least first and second hierarchical data are formed from an input digital information signal, and the first and second hierarchical data are encoded and transmitted.
Forming second hierarchical data having a lower resolution than the first hierarchical data;
Predicting first hierarchical data from second hierarchical data;
Forming a residual signal between the predicted data and the first tier data;
Blocking the residual signal;
Detecting the maximum and minimum values for each block;
The residual signal for each block from the maximum and minimum valuesExistenceDetermine if the range is crossing zero,ExistenceInstruct the first quantization mode when the range crosses 0,ExistenceA mode determining step for indicating the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual signal is quantized with a number of bits smaller than the original number of bits. And a quantization step to reduce the number of bits by code conversion,
Information identifying first and second quantization modes;
A transmission step for transmitting the quantized output and
An information signal encoding method characterized by comprising:
[0010]
The invention of claim 6A residual signal between the input digital information signal and the predicted value of the input digital information signal is generated, the residual signal is blocked, the maximum and minimum values are detected for each block, and the maximum and minimum values are detected for each block. It is determined whether or not the existence range of the residual signal is crossing 0, the first quantization mode is instructed when the existence range crosses 0, and the second quantum when the existence range does not cross 0 Mode is instructed,In the first quantization mode, the residual signal is quantized with a smaller number of bits than the original number of bits, and in the second quantization mode, the residual signal is quantized with a smaller number of bits than the original number of bits. At the same time, it is encoded to reduce the number of bits by code conversion.And an information signal encoding method in which information for identifying the first and second quantization modes and information on the residual signal are transmitted.In the decryption method,
Based on the identification information, in the first quantization mode, the data is inversely quantized, and in the second quantization mode, the data is transcoded and inversely quantized,
An information signal decoding method comprising the steps of: decomposing a dequantized residual signal into blocks and converting the residual signal into an original order.
[0011]
By increasing the degree of concentration of the level distribution of the residual signal, the residual signal can be requantized with a smaller number of bits than the original number of quantization bits. Also, when the residual signal distribution satisfies a certain condition, the residual signal can be quantized with a smaller number of bits.
[0012]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, an embodiment of the present invention will be described with reference to the drawings. In this embodiment, the present invention is applied to a digital image signal obtained by sampling a video signal at a predetermined sampling frequency and converting each sample into a predetermined number of quantization bits. FIG. 1 shows the overall configuration of a system according to an embodiment of the present invention.
[0013]
In FIG. 1, a digital video signal is supplied to an input terminal indicated by 121. The input signal is supplied to the subtractor 123, the output (residual signal) of the subtractor 123 is supplied to the blocking circuit 124 and the predictor 122, and the prediction signal generated by the predictor 122 is supplied to the subtractor 123. . The subtractor 123 subtracts the prediction signal from the input signal to generate a prediction residual. This residual signal is supplied to the block forming circuit 124 and converted from raster scan order to block order data. The blocked residual signal is supplied to the encoding unit 125.
[0014]
As will be described later, the quantization circuit in the encoding unit 125 is switched between the first quantization mode and the second quantization mode in accordance with the frequency distribution of the blocked residual signal. . For example, when the number of bits of the residual signal is 8 bits, when the first quantization mode is selected, a 3-bit quantization output is generated from the encoding unit 125. When the second quantization mode is selected, a quantized output converted into 2 bits is generated by the code conversion table in the encoding unit 125.
[0015]
The encoded output of the encoding unit 125 is supplied to the error correction code encoder 126, and a redundant code of the error correction code is added. The output of the error correction code encoder 126 is supplied to the modulation unit 127. The modulation unit 127 modulates the digital signal into a form suitable for recording, transmission, and the like. An output signal from the modulation unit 127 is supplied to the recording unit 128, and the recording signal is recorded on the information signal recording medium 129 by the recording unit 128. It is also possible to transmit data via the transmission path 130. In this case, a transmission unit is used instead of the recording unit 128. A mode signal indicating the quantization mode is also recorded or transmitted together with the encoded residual signal. The information signal recording medium 129 is a disk-like or tape-like recording medium using magnetism, magneto-optical, phase change or the like. A semiconductor memory is also a kind of recording medium.
[0016]
Data is reproduced from the recording medium 129 by the reproduction unit 131 or data transmitted via the transmission path 130 is received. The data reproduced by the reproduction unit 131 is demodulated by the demodulator 132, and the demodulated output is supplied to the error correction code decoder 133. The decoder 133 corrects the error by using the redundant code, and corrects the remaining error that cannot be corrected to be inconspicuous.
[0017]
The output of the error correction decoder 133 is supplied to the decoding unit 134. As will be described later, the decoding unit 134 performs inverse quantization processing for converting the quantized output into a representative value (quantized restoration value), contrary to the encoding unit 125. The inverse quantization circuit in the decoding unit 134 performs inverse quantization processing according to the quantization mode indicated by the mode signal. A decoded residual signal is generated from the decoding unit 134. This decoded residual signal is supplied to the block decomposition circuit 135. In the block decomposition circuit 135, the block structure is returned to the order of raster scanning.
[0018]
The decoded residual signal is supplied to the adder circuit 136. A decoding image signal is formed by the adding circuit 136 and taken out to the output terminal 137. Further, the decoded image signal is supplied to the predictor 138, and a prediction signal is generated. The prediction signal is supplied to the addition circuit 136.
[0019]
FIG. 2 shows an example of the encoding unit 125. The blocked residual signal from the blocking circuit 124 is supplied to the input terminal 1. FIG. 3 schematically shows the formation of the residual signal. One rectangular area in FIG. 3 corresponds to one pixel. Each of a to h represents a locally decoded pixel value, and AP represents a pixel value before being encoded. A predicted value A ′ for pixel value A is generated by the predictor 122 using neighboring local decoded pixel values. For example, the predicted value A ′ is formed according to a prediction formula such as A ′ = 4c−3 (b−f), A ′ = f + c−b, or the like. The predicted values for the pixel values B, C,... Are calculated by the same prediction formula. When represented by a general formula, a predicted value is generated by (αa + βb + γf, where α, β, and γ are constants).
[0020]
The subtractor 123 subtracts the predicted value (for example, A ′) from the pixel value (for example, A) to generate a residual signal Δa. Similarly, residual signals Δb, Δc,... Are generated. In the blocking circuit 124, the generated residual signal is converted into a block structure. For example, the block forming circuit 124 forms data of blocks of residual signals Δa to Δp corresponding to the (4 × 4) block, as shown by the thick line frame in FIG. 3A. When a digital audio signal is handled, a prediction value in the time direction is formed, and a one-dimensional residual signal block is formed.
[0021]
By concentrating the level range of the residual signal, the degree of concentration can be increased. When one pixel is 8-bit data, the distribution of the occurrence frequency of the residual signal of one screen is in the range of (−255 to +255) around 0, and the frequency of the residual is 0. Maximum. However, when divided into blocks, the frequency distribution of residuals is more concentrated than the original distribution.
[0022]
This is due to the fact that the residuals in the blocks in the small space are relatively large in comparison with one screen, and the residuals are strongly correlated in the blocks. Therefore, the block residual signal can be requantized with a smaller number of bits than the original number of quantization bits. Further, in the distribution of the residual signals that are blocked, the frequency of the value of 0 is not necessarily the maximum. For example, when the luminance level gradually changes in the diagonal direction in the block, for example, a distribution in which the frequency of the value of 0 does not become maximum occurs. Note that the method of increasing the degree of concentration of the residual signal distribution is an example of blocking, and other methods are also possible.
[0023]
Returning to FIG. 2, the encoding unit 125 will be described. The residual signal from the input terminal 1 is supplied to the maximum value detection circuit 2, the minimum value detection circuit 3, and the delay circuit 4. The maximum value detection circuit 2 detects the maximum value MAX for each block, and the minimum value detection circuit 3 detects the minimum value MIN for each block. The detected maximum value MAX and minimum value MIN are supplied to the mode determination circuit 5.
[0024]
The mode determination circuit 5 is supplied with the block residual signal, the maximum value MAX, and the minimum value MIN, and the quantization mode is determined based on the level range of the residual signal of the block to indicate the mode. A signal MODE (for example, 1 bit) is generated. The mode signal MODE is supplied to the quantization circuit 6, and the residual signal from the input terminal 1 is supplied to the quantization circuit 6 through the delay circuit 4 for phase matching. In the quantization circuit 6, the residual signal is requantized with a smaller number of quantization bits than the original number of quantization bits (for example, 8 bits). In the quantization circuit 6, the first and second quantization modes are selected according to the mode signal MODE.
[0025]
The first quantization mode is a normal one that re-quantizes the 8-bit residual signal to generate a smaller number of quantization bits, eg, 3 bits. The second quantization mode is applied when the level range of the blocked residual signal does not cross zero. In this embodiment, when the minimum value MIN of the residual signal is larger than (Δ / 2), the second quantization mode is applied. Here, Δ is DR / 2 when the number of requantization bits is n.nIs a quantization step calculated by DR is a dynamic range and can be calculated by (MAX-MIN).
[0026]
In the second quantization mode, a code signal (for example, 3 bits) generated by re-quantization is converted according to a predetermined rule in the same manner as in the first quantization mode, and a quantized output having a smaller number of bits, for example, 2 bits Converted. Code conversion rules for converting a 3-bit code into a 2-bit quantized output are shown below.
100-00
101-01
110-10
111-11
[0027]
The quantization process will be described with reference to FIG. As described above, the residual signal generated by the predictive coding has the maximum frequency of 0 when viewed in the whole frame. However, the residual signal varies depending on the block as shown in FIG. 4A. Have a bias. FIG. 4A shows a distribution of residual signals biased to the negative side, a distribution of residual signals that coincided with a value having a maximum frequency of 0, and a distribution of residual signals biased to the positive side.
[0028]
FIG. 4B shows the frequency distribution of the residual signal that crosses the value of 0. In the case of quantizing the residual signal, for example, the interval between MAX and MIN is 23= 8, and the same code is assigned to the residual signals belonging to the range. When the code is restored, it is converted to a representative value in the middle of the range. In general, if the code has n bits, 2nThe range between MAX and MIN is divided into a number range. Such quantization is the first quantization mode.
[0029]
FIG. 4C shows an example of the frequency distribution of the blocked residual signal. That is, FIG. 4C shows a distribution 30a in which the minimum value MIN is equal to Δ / 2, a distribution 30b (shown by a broken line) that crosses 0 similarly to that in FIG. 4B, and a maximum value MAX is −Δ / 2. A distribution 30c (indicated by a broken line) equal to is shown. In this embodiment, when the condition of (MIN ≧ Δ / 2) is satisfied as in the frequency distribution 30a, the second quantization mode is applied. In the second quantization mode, the code as described above is used. Conversion is done. On the decoding side, code conversion in the reverse direction from 2 bits to 3 bits is performed, and the 3 bits code is inversely quantized.
[0030]
For example, if the residual signal having the frequency distribution 30a in FIG. 4C is quantized in the second quantization mode, 100 to 111 quantized outputs in the range of MIN to MAX are converted to 00 to 11 quantized outputs. On the other hand, on the decoding side, the quantized output of 00 to 11 is converted into the code of 100 to 111. Inverse quantization can be performed by converting the converted 3-bit code into a representative value in the same manner as the 3-bit quantization output generated in the first quantization mode.
[0031]
Unlike the embodiment of the present invention, the second quantization mode may be applied when the maximum value MAX of the residual signal of the block is smaller than −Δ / 2 (for example, the frequency distribution 30c in FIG. 4C). good. Further, the second quantization mode may be applied when the minimum value MIN is (MIN ≧ 0) or when the maximum value MAX is (MAX ≦ 0).
[0032]
An example of the quantization circuit 6 is shown in FIG. A delayed residual signal is supplied from the delay circuit 4 to the input terminal indicated by 15. An input residual signal is supplied to the input terminal of the switching circuit 16 switched by the mode signal MODE. For example, quantizers 17a and 17b that generate a 3-bit output are connected to output terminals a and b of switching circuit 16, respectively. A code conversion circuit 18 is connected to the quantizer 17b. The code conversion circuit 18 is a circuit that converts 3 bits into 2 bits as described above. The output of the quantizer 17a or 17b is taken out to the output terminal 19.
[0033]
The mode signal MODE indicates the second quantization mode when (MIN ≧ Δ / 2) with respect to the residual signal of the block by the mode determination circuit 5, while in other cases, A mode signal MODE indicates the first quantization mode. In the first quantization mode, the output terminal a of the switching circuit 16 is selected, and in the second quantization mode, the output terminal b of the switching circuit 16 is selected. Therefore, in the first quantization mode, a 3-bit quantization output is generated at the output terminal 19, and in the second quantization mode, a 2-bit quantization output is generated at the output terminal 19. The quantizers 17a and 17b may be shared.
[0034]
Returning to FIG. 2, the output of the quantization circuit 6 is supplied to the bit plane encoding circuit 7. The bit plane encoding circuit 7 divides n bits, for example, a 2-bit code q into an MSB (most significant bit) plane and an LSB (least significant bit) plane. The MSB plane is a set of MSBs of supplied 2-bit quantized values, and the LSB plane is a set of LSBs. For simplicity, FIG. 6A shows a case where one screen is composed of (4 × 3 = 12 blocks) and each block includes a code q of (4 × 4) residual signals.
[0035]
In FIG. 6A, 0, 1, 2, 3 of the value of the code q shown as an example means (00), (01), (10), (11) with 2 bits, respectively. In the example of FIG. 6A, as shown in FIG. 6B, the bit plane encoding circuit 7 divides, for example, the code q of one screen into an MSB plane and an LSB plane. When the number of quantization bits is 3 bits, an intermediate bit plane is further formed. In one embodiment of the present invention, a two-bit or three-bit quantized output is generated by two quantization modes. In the case of forming a bit plane, it is necessary to know the number of bits of the quantized output. For this reason, the mode signal MODE is supplied to the bit plane encoding circuit 7.
[0036]
Each bit plane generated by the bit plane encoding circuit 7 is supplied to the variable length encoding circuit 8, and each bit plane is variable length encoded. The variable length coding circuit 8 performs run length coding, for example, MMR (Modified MR), for each bit plane. The output of the variable length coding circuit 8 is supplied to the framing circuit 9. The above-described mode signal MODE is also supplied to the framing circuit 9. The mode signal MODE and the variable-length encoded code are output to the output terminal 10 of the framing circuit 9 as data having a predetermined frame structure.
[0037]
Next, referring to FIG.1An example of the decoding unit 134 in the middle will be described. Reproduced or received data from the error correction decoder 133 is supplied to the input terminal 31 of the decoding unit 134. The frame decomposition circuit 32 separates the variable-length encoded residual signal code from the mode signal MODE. The code of the separated residual signal is decoded by the variable length decoding circuit 33. The variable length decoding circuit 33 corresponds to the variable length encoding circuit 13. The decoded output of the variable length decoding circuit 33 is supplied to the bit plane decoding circuit 34 to synthesize the bit plane. In this case, the bit plane is correctly synthesized by the separated mode signal MODE.
[0038]
The output of the bit plane decoding circuit 34 is supplied to the input terminal of the switching circuit 35. The switching circuit 35 is controlled by a mode signal MODE. When the mode signal MODE indicates the first quantization mode, the output terminal a of the switching circuit 35 is selected, and when this indicates the second quantization mode, the output terminal b of the switching circuit 35 is selected. The The output terminal a is connected to an inverse quantizer 36a that dequantizes a 3-bit quantization code and generates a quantized restoration value. A code conversion circuit 37 that converts a 2-bit quantized output into a 3-bit code is connected to the output terminal b, and an inverse quantizer 36 b is connected to the code conversion circuit 37. The inverse quantizer 36b converts a 3-bit code into a restored value, similarly to the inverse quantizer 36a.
[0039]
The restored values generated by the inverse quantizers 36a and 36b, that is, the decoded decoded residual signals are taken out to the output terminal 38. The decoded residual signal taken out to the output terminal 38 is supplied to the block decomposition circuit 135 (see FIG. 1). The inverse quantizers 36a and 36b may be shared.
[0040]
Next, another embodiment in which the present invention is applied to hierarchical coding will be described. The hierarchical encoding device described here can prevent an increase in the number of encoding target pixels by performing prediction between hierarchies and using a simple arithmetic expression for the inter-layer data.
[0041]
The hierarchical encoding method will be described with reference to FIG. FIG. 8 shows, as an example, a schematic diagram between four hierarchies having the first hierarchy as the lowest hierarchy (original picture) and the fourth hierarchy as the highest hierarchy. For example, when the average value of the lower layer data of four pixels corresponding spatially is adopted as the upper layer data generation method, the number of transmission pixels can be prevented from increasing.
[0042]
That is, the upper layer data is M and the lower layer pixel value is x.0  , X1  , X2  , X3  Then,
M = 1/4 · (x0  + X1  + X2  + X3)
As a result, data M is formed. And, for example, x of the data M and the four data3The other three data are transmitted. On the receiving or playback side,
x3  = 4 · M- (x0  + X1  + X2  )
Non-transmission pixel x by a simple arithmetic expression3  Can be easily restored. In FIG. 8, hatched rectangles indicate non-transmission pixels.
[0043]
FIG. 9 shows a configuration of hierarchical encoding of, for example, five layers using the above-described averaging. Assume that the first hierarchy is the resolution level of the input image. The block size of this first layer is (1 × 1). The second layer data is generated by averaging four pixels of the first layer data. In this example, the first hierarchy data X1  (0) to X1  Based on the average value of (3), the second hierarchical data X2  (0) is generated. X2  Second layer data X adjacent to (0)2  (1) to X2  Similarly, (3) is generated by averaging four pixels of the first layer data. The block size of the second hierarchy is (1/2 × 1/2).
[0044]
Further, the third layer data is generated by averaging four pixels of the second layer data corresponding spatially. The block size of the third hierarchy is (1/4 × 1/4). Similarly, the fourth layer data is generated from the third layer data. The block size of the fourth layer is (1/8 × 1/8). Finally, the fifth hierarchy data X which is the highest hierarchy5  (0) is the fourth layer data X4  (0) to X4  It is generated by the average value of (3). The block size of the fifth layer is (1/16 × 1/16).
[0045]
By applying the class classification adaptive prediction to the upper layer data for the hierarchical structure data in which the increase in the number of encoding target pixels is prevented, the lower layer data is predicted, and the difference between the lower layer data and the predicted value ( That is, it is possible to reduce the amount of transmission data by generating a residual signal. FIG. 10 shows such a coding unit. The first hierarchy data d0 is supplied as input image data d0 to the averaging circuit 42 and the subtractor 46 via the input terminal 41. The first layer data is image data of the original resolution.
[0046]
The input pixel data d0 is subjected to ¼ averaging processing in the averaging circuit 42 to generate hierarchical data d1. This hierarchical data d1 corresponds to the second hierarchical data shown in FIG. The generated hierarchical data d1 is supplied to the averaging circuit 43 and the subtractor 47.
[0047]
The averaging circuit 43 performs the same processing as the averaging circuit 42 on the hierarchical data d1, and generates hierarchical data d2. This hierarchical data d2 corresponds to the third hierarchical data. The generated hierarchical data d2 is supplied to the averaging circuit 44 and the subtracter 48. Similarly, the averaging circuit 44 performs ¼ averaging processing on the hierarchical data d2 to generate hierarchical data d3. This hierarchical data d3 corresponds to the fourth hierarchical data. The generated hierarchical data d3 is supplied to the averaging circuit 45 and the subtracter 49. Further, the averaging circuit 45 similarly performs a 1/4 averaging process on the hierarchical data d3 to generate hierarchical data d4. This hierarchical data d4 corresponds to the fifth hierarchical data. The generated hierarchical data d4 is supplied to the quantizer 54.
[0048]
And about these five hierarchical data, prediction is performed between hierarchies. First, the quantization processing for compression performed in the fifth layer is performed by the quantizer 54. The output data d21 of the quantizer 54 is supplied to the variable length code encoder 71 and also to the inverse quantizer 58. The output of the encoder 71 is taken out to the output terminal 76 as fifth-layer data. The output data d16 of the inverse quantizer 58 supplied with the encoded data d21 is supplied to the class classification adaptive prediction circuit 62.
[0049]
In the class classification adaptive prediction circuit 62, prediction processing is performed using the data d16, a predicted value d12 of the fourth layer data is generated, and the predicted value d12 is supplied to the subtractor 49. In the subtractor 49, a difference value between the hierarchical data d3 supplied from the averaging circuit 44 and the predicted value d12 is obtained, and the difference value d8 is supplied to the quantizer 53.
[0050]
In the quantizer 53 to which the difference value d8 is supplied, requantization is performed so as to reduce the number of quantization bits as in the quantizer 54. The output data of the quantizer 53 is supplied to the arithmetic unit 66 and the inverse quantizer 57. In this calculator 66, a process of thinning out one pixel from four pixels is performed. Data d20 output from the arithmetic unit 66 is encoded by the variable-length code encoder 70, and the output of the encoder 70 is taken out as output data of the fourth layer to the output terminal 75.
[0051]
The fourth layer data d12 predicted by the class classification adaptive prediction circuit 62 and the output data (decoded residual signal) d15 of the inverse quantizer 57 are supplied to the class classification adaptive prediction circuit 61. In the class classification adaptive prediction circuit 61, the data d15 is added to the data d12 to form local decoded data of the fourth layer, and prediction processing is performed using the local decoded data. A predicted value d11 is generated, and this predicted value d11 is supplied to the subtractor 48. In the subtracter 48, a difference value between the data d2 supplied from the averaging circuit 43 and the predicted value d11 is obtained, and the difference value d7 is supplied to the quantizer 52.
[0052]
The output data of the quantizer 52 supplied with the difference value d7 is supplied to the arithmetic unit 65 and the inverse quantizer 56. In this calculator 65, a process of thinning out one pixel from four pixels is performed. The third layer data d19 output from the arithmetic unit 65 is supplied to the variable length code encoder 69, and the output of the encoder 69 is taken out to the output terminal 74 as third layer data.
[0053]
The third layer data d11 predicted by the class classification adaptive prediction circuit 61 and the output data d14 of the inverse quantizer 56 supplied with the encoded data from the quantizer 52 are supplied to the class classification adaptive prediction circuit 60. In the class classification adaptive prediction circuit 60, the data d14 is added to the data d11 to form third-layer local decoded data, and the local decoded data is used to perform prediction processing. A predicted value d10 is generated, and the predicted value d10 is supplied to the subtractor 47. In the subtractor 47, a difference value between the data d1 supplied from the averaging circuit 42 and the predicted value d10 is obtained, and the difference value d6 is supplied to the quantizer 51.
[0054]
The output data of the quantizer 51 is supplied to the arithmetic unit 64 and the inverse quantizer 55. The calculator 64 performs a process of thinning out one pixel from four pixels. The second layer data d18 output from the computing unit 64 is supplied to the variable length code encoder 68, and the output of the encoder 68 is taken out to the output terminal 73 as second layer data.
[0055]
The second hierarchy data d10 predicted by the class classification adaptive prediction circuit 60 and the output data d13 of the inverse quantizer 55 supplied with the encoded data from the quantizer 51 are supplied to the class classification adaptive prediction circuit 59. In the class classification adaptive prediction circuit 59, the data d13 is added to the data d10 to form second-level local decoded data, and prediction processing is performed using the local decoded data. A predicted value d9 is generated, and the predicted value d9 is supplied to the subtractor 46. In the subtractor 46, a difference value between the input pixel data d0 supplied from the input terminal 41 and the predicted value d9 is obtained, and the difference value d5 is supplied to the quantizer 50.
[0056]
The output data of the quantizer 50 supplied with the difference value d5 is supplied to the calculator 63. The calculator 63 performs a process of thinning out one pixel from four pixels. The first layer data d17 output from the computing unit 63 is supplied to the variable length code encoder 67, and the output of the encoder 67 is taken out to the output terminal 72 as the first layer data.
[0057]
Each of the class classification adaptive prediction circuits 59, 60, 61, and 62 predicts a lower layer pixel to be predicted based on a level distribution of a plurality of spatially neighboring pixels (included in the upper layer). It is. FIG. 12 shows an example of a class classification adaptive prediction circuit. Local decoded data from the input terminal 141 is supplied to the peripheral code value forming unit 142. The peripheral code value forming unit 142 includes a plurality of pieces of data x located in the vicinity of the lower layer pixel to be predicted.1, X2, ..., xnAre synchronized. The peripheral code value is supplied to the class classification unit 143 and the delay unit 145. The class classification unit 143 calculates the peripheral code value x1~ XnThe class code corresponding to the level distribution pattern is output. As the class code, the peripheral code value itself may be used. However, since the number of classes becomes enormous, a code obtained by compressing each bit number of the peripheral code to 1 bit by ADRC or the like is used. The class code generated from the class classification unit 143 is supplied to the prediction coefficient memory 144 as an address signal.
[0058]
The prediction coefficient memory 144 stores the prediction coefficient w acquired in advance by learning.1~ WnIs stored for each address. That is, using a teacher signal (for example, fourth layer data) and an input signal (fifth layer data formed by averaging from the fourth layer data), a plurality of input signal data and coefficients A predicted value is obtained by linear linear combination of the above, and a coefficient that minimizes the square sum of errors between the predicted value and the true value of the teacher signal is obtained for each class by the method of least squares. Prediction coefficients w1 to w read from the prediction coefficient memory 144 corresponding to the class code.nAnd the peripheral code value x from the delay unit 1451~ XnAre supplied to the prediction calculation unit 146.
[0059]
In the prediction calculation unit 146, the predicted value y is calculated by the following linear linear combination formula.
y = w1x1+ W2x2+ ... + wnxn
The predicted value y obtained by the prediction calculation unit 146 is taken out to the output terminal 147. Note that the peripheral code value used for classification and the peripheral code value used for prediction calculation may be different.
[0060]
A configuration similar to that of the encoding unit 125 (see FIG. 2) in the above-described embodiment is also provided on the encoder side of the hierarchical encoding. That is, each of the quantizers 50, 51, 52, 53, and 54 has the same configuration as the configuration of the preceding stage up to the quantization circuit 6, and the configuration similar to the configuration of the subsequent stage from the bit plane encoding circuit 7 has a variable length. Each of the encoders 67, 68, 69, 70, 71 has.
[0061]
Next, FIG. 11 shows a configuration example on the decoder side of the hierarchical encoding corresponding to the encoder described above. Each hierarchical data generated on the encoder side is supplied to input terminals 81, 82, 83, 84, 85 as d30 to d34, respectively. The variable length code decoders 86, 87, 88, 89, 90 decode the variable length code. Inverse decoders 91, 92, 93, 94, and 95 are connected to these decoders, respectively.
[0062]
First, the fifth hierarchy input data d34 is subjected to decoding processing corresponding to the quantization performed by the encoder in the inverse quantizer 95, and becomes image data d39, which is supplied to the class classification adaptive prediction circuit 107 and the arithmetic unit 103. Is done. Further, the image data d39 is taken out from the output terminal 112 as the image output of the fifth hierarchy.
[0063]
In the class classification adaptive prediction circuit 107, class classification adaptive prediction is performed on the image data of the fourth layer, and the predicted value d47 of the fourth layer data is generated. The adder 99 adds the data d38 (that is, the difference value) from the inverse quantizer 94 and the predicted value d47. The image data d43 is supplied from the adder 99 to the calculator 103, and the calculator 103 performs the above-described calculation to obtain the value of the non-transmission pixel, and the image data d39 supplied from the inverse quantizer 95 and All pixel values in the fourth layer are restored from the image data d43. In this calculator 103, all the restored pixel values are supplied as image data d51 to the class classification adaptive prediction circuit 106 and the calculator 102. The image data d51 is taken out from the output terminal 111 as the output of the fourth hierarchy.
[0064]
In the class classification adaptive prediction circuit 106, class classification adaptive prediction is performed on the image data of the third hierarchy, and the predicted value d46 of the third hierarchy data is generated. The adder 98 adds the data d37 from the inverse quantizer 93 and the predicted value d46. The image data d42 is supplied from the adder 98 to the computing unit 102, the value of the non-transmission pixel is obtained by the computing unit 102, and all the pixel values of the third hierarchy are obtained from the image data d51 and the image data d42 supplied from the computing unit 103. Is restored. In this computing unit 102, all the restored pixel values are supplied as image data d50 to the class classification adaptive prediction circuit 105 and the computing unit 101. The image data d50 is taken out from the output terminal 110 as the output of the third hierarchy.
[0065]
Also, the class classification adaptive prediction circuit 105 performs class classification adaptive prediction on the second layer image data, and generates a predicted value d45 of the second layer data. The adder 97 adds the data d36 from the inverse quantizer 92 and the predicted value d45. The image data d41 is supplied from the adder 97 to the computing unit 101, the value of the non-transmission pixel is obtained by the computing unit 101, and all the pixel values of the second hierarchy are obtained from the image data d50 and the image data d41 supplied from the computing unit 102. Is restored. In this computing unit 101, all the restored pixel values are supplied as image data d49 to the class classification adaptive prediction circuit 104 and the computing unit 100. Further, the image data d49 is taken out from the output terminal 109 as the output of the second hierarchy.
[0066]
Further, the class classification adaptive prediction circuit 104 performs class classification adaptive prediction on the first layer image data, and generates a predicted value d44 of the first layer data. The adder 96 adds the data d35 from the inverse quantizer 91 and the predicted value d44. The image data d40 is supplied from the adder 96 to the computing unit 100, the value of the non-transmission pixel is obtained by the computing unit 100, and all the pixel values of the first layer are obtained from the image data d49 and the image data d40 supplied from the computing unit 101. Is restored. In this computing unit 100, all restored pixel values are taken out from the output terminal 108 as image data d48 as the output of the first layer. Each of the class classification adaptive prediction circuits 104, 105, 106, and 107 has the specific configuration shown in FIG. In this way, it is possible to improve coding efficiency by introducing class classification adaptive prediction in hierarchical coding in which an increase in the number of pixels to be coded is prevented.
[0067]
The variable length code decoders 86, 87, 88, 89, 90 and the inverse quantizers 91, 92, 93, 94, 95 have the same configuration as that of the decoding unit 134 of the above-described embodiment. Therefore, according to another embodiment in which the present invention is applied to the above-described hierarchical coding, as in the case of the above-described one embodiment, when the level range of the blocked residual signal satisfies a predetermined condition, The number of quantization bits can be reduced.
[0068]
Various methods for transmitting the mode signal MODE and the encoded residual signal generated in the present invention are possible. For example, the mode signals for one frame can be transmitted together and the encoded residual signal can be transmitted thereafter. Further, in the present invention, three or more quantization modes can be set. For example, considering not only the level range of the residual signal of the block but also its dynamic range DR, when the dynamic range DR is small, the third quantization mode having a smaller number of bits than the number of bits in the second quantization mode is obtained. It may be set. Furthermore, the quantization mode may be determined based on the level range of the quantization output of the first quantization mode.
[0069]
Furthermore, the present invention can be applied to quantization of a residual signal generated by predictive encoding other than the predictive encoding described above. The present invention can also be applied to a system having a buffering configuration for controlling the amount of generated data by controlling the quantization step width.
[0070]
【The invention's effect】
According to the present invention, it is possible to detect a case where the frequency distribution of the blocked residual signal does not cross 0, in which case the number of quantization bits can be further reduced and the amount of transmission data can be further reduced. it can.
[Brief description of the drawings]
FIG. 1 is a block diagram of an example of a recording / reproducing or transmission system to which the present invention can be applied.
FIG. 2 is a block diagram of an embodiment of the present invention.
FIG. 3 is a schematic diagram used for explaining generation of a residual signal and its blocking in one embodiment of the present invention.
FIG. 4 is a schematic diagram used for explaining quantization processing in one embodiment of the present invention;
FIG. 5 is a block diagram of an example of a quantization circuit in one embodiment of the present invention.
FIG. 6 is a schematic diagram used for explaining a bit plane in one embodiment of the present invention;
FIG. 7 is a block diagram of a decoding unit in one embodiment of the present invention.
FIG. 8 is a schematic diagram used to describe an example of hierarchical encoding.
FIG. 9 is a schematic diagram used to describe an example of hierarchical encoding.
FIG. 10 is a block diagram showing an example of a configuration on the encoding side of another embodiment in which the present invention is applied to hierarchical encoding.
FIG. 11 is a block diagram showing an example of a configuration on the decoding side according to another embodiment of the present invention.
FIG. 12 is a block diagram showing an example of the configuration of a class classification adaptive prediction circuit according to another embodiment of the present invention.
[Explanation of symbols]
2 ... Maximum value detection circuit, 3 ... Minimum value detection circuit, 5 ... Mode decision circuit
6 ... Quantization circuit

Claims (6)

入力ディジタル情報信号を発生データ量を少なくするように符号化する情報信号符号化装置において、
上記入力ディジタル情報信号と上記入力ディジタル情報信号の予測値との残差信号を生成する手段と、
上記残差信号をブロック化する手段と、
上記ブロック毎に、最大値および最小値を検出する手段と、
上記最大値および上記最小値から上記ブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、上記存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、上記存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定手段と、
上記第1の量子化モードでは、元のビット数より少ない所定のビット数で、上記残差信号を量子化し、上記第2の量子化モードでは、元のビット数より少ないビット数で上記残差信号を量子化するとともに、コード変換によりビット数をより少なくするようになされた量子化手段と、
上記第1および第2の量子化モードを識別する情報と、
上記量子化手段の出力とを伝送する伝送手段と
からなることを特徴とする情報信号符号化装置。
In an information signal encoding apparatus for encoding an input digital information signal so as to reduce the amount of generated data,
Means for generating a residual signal between the input digital information signal and a predicted value of the input digital information signal ;
Means for blocking the residual signal;
Means for detecting the maximum and minimum values for each block;
It is determined from the maximum value and the minimum value whether or not the existence range of the residual signal for each block crosses 0, and when the existence range crosses 0, the first quantization mode is indicated and the presence Mode determining means for instructing the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual is calculated with a number of bits less than the original number of bits. Quantization means adapted to quantize the signal and reduce the number of bits by code conversion;
Information identifying the first and second quantization modes;
An information signal encoding apparatus comprising transmission means for transmitting the output of the quantization means.
請求項1に記載の情報信号符号化装置において、
上記モード決定手段は、
上記最小値が0以上の場合、または上記最大値が0以下の場合に、第2の量子化モードを指示することを特徴とする情報信号符号化装置。
In the information signal encoding device according to claim 1,
The mode determining means includes
An information signal encoding apparatus characterized by instructing a second quantization mode when the minimum value is 0 or more, or when the maximum value is 0 or less.
入力ディジタル情報信号を発生データ量を少なくするように符号化する情報信号符号化方法において、
上記入力ディジタル情報信号と上記入力ディジタル情報信号の予測値との残差信号を生成するステップと、
上記残差信号をブロック化するステップと、
上記ブロック毎に、最大値および最小値を検出するステップと、
上記最大値および上記最小値から上記ブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、上記存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、上記存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定のステップと、
上記第1の量子化モードでは、元のビット数より少ない所定のビット数で、上記残差信号を量子化し、上記第2の量子化モードでは、元のビット数より少ないビット数で上記残差信号を量子化するとともに、コード変換によりビット数をより少なくする量子化のステップと、
上記第1および第2の量子化モードを識別する情報と、
上記量子化手段の出力とを伝送するステップと
からなることを特徴とする情報信号符号化方法。
In an information signal encoding method for encoding an input digital information signal so as to reduce the amount of generated data,
Generating a residual signal between the input digital information signal and a predicted value of the input digital information signal ;
Blocking the residual signal;
Detecting a maximum value and a minimum value for each of the blocks;
It is determined from the maximum value and the minimum value whether or not the existence range of the residual signal for each block crosses 0, and when the existence range crosses 0, the first quantization mode is indicated and the presence A mode determining step for indicating the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual is calculated with a number of bits less than the original number of bits. Quantization of the signal, and a quantization step for reducing the number of bits by code conversion,
Information identifying the first and second quantization modes;
An information signal encoding method comprising the step of transmitting the output of the quantization means.
入力ディジタル情報信号から少なくとも第1および第2の階層データを形成し、上記第1および第2の階層データを符号化して伝送するようにした情報信号符号化装置において、
上記第1の階層データより解像度がより低い上記第2の階層データを形成する手段と、
上記第2の階層データから上記第1の階層データを予測する手段と、
上記予測されたデータと上記第1の階層データとの残差信号を形成する手段と、
上記残差信号をブロック化する手段と、
上記ブロック毎に、最大値および最小値を検出する手段と、
上記最大値および上記最小値から上記ブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、上記存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、上記存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定手段と、
上記第1の量子化モードでは、元のビット数より少ない所定のビット数で、上記残差信号を量子化し、上記第2の量子化モードでは、元のビット数より少ないビット数で上記残差信号を量子化するとともに、コード変換によりビット数をより少なくするようになされた量子化手段と、
上記第1および第2の量子化モードを識別する情報と、
上記量子化手段の出力とを伝送する伝送手段と
からなることを特徴とする情報信号符号化装置。
In an information signal encoding apparatus for forming at least first and second layer data from an input digital information signal and encoding and transmitting the first and second layer data,
Means for forming the second hierarchical data having a lower resolution than the first hierarchical data;
Means for predicting the first hierarchical data from the second hierarchical data;
Means for forming a residual signal between the predicted data and the first hierarchical data;
Means for blocking the residual signal;
Means for detecting the maximum and minimum values for each block;
It is determined from the maximum value and the minimum value whether or not the existence range of the residual signal for each block crosses 0, and when the existence range crosses 0, the first quantization mode is indicated and the presence Mode determining means for instructing the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual is calculated with a number of bits less than the original number of bits. Quantization means adapted to quantize the signal and reduce the number of bits by code conversion;
Information identifying the first and second quantization modes;
An information signal encoding apparatus comprising transmission means for transmitting the output of the quantization means.
入力ディジタル情報信号から少なくとも第1および第2の階層データを形成し、上記第1および第2の階層データを符号化して伝送するようにした情報信号符号化方法において、
上記第1の階層データより解像度がより低い上記第2の階層データを形成するステップと、
上記第2の階層データから上記第1の階層データを予測するステップと、
上記予測されたデータと上記第1の階層データとの残差信号を形成するステップと、
上記残差信号をブロック化するステップと、
上記ブロック毎に、最大値および最小値を検出するステップと、
上記最大値および上記最小値から上記ブロック毎の残差信号の存在範囲が0を跨ぐものかどうかを決定し、上記存在範囲が0を跨ぐ場合に第1の量子化モードを指示し、上記存在範囲が0を跨がない場合に第2の量子化モードを指示するモード決定のステップと、
上記第1の量子化モードでは、元のビット数より少ない所定のビット数で、上記残差信号を量子化し、上記第2の量子化モードでは、元のビット数より少ないビット数で上記残差信号を量子化するとともに、コード変換によりビット数をより少なくする量子化のステップと、
上記第1および第2の量子化モードを識別する情報と、
上記量子化出力とを伝送する伝送のステップと
からなることを特徴とする情報信号符号化方法。
In an information signal encoding method for forming at least first and second layer data from an input digital information signal, and encoding and transmitting the first and second layer data,
Forming the second hierarchical data having a lower resolution than the first hierarchical data;
Predicting the first hierarchical data from the second hierarchical data;
Forming a residual signal between the predicted data and the first hierarchical data;
Blocking the residual signal;
Detecting a maximum value and a minimum value for each of the blocks;
It is determined from the maximum value and the minimum value whether or not the existence range of the residual signal for each block crosses 0, and when the existence range crosses 0, the first quantization mode is indicated and the presence A mode determining step for indicating the second quantization mode when the range does not cross 0;
In the first quantization mode, the residual signal is quantized with a predetermined number of bits less than the original number of bits, and in the second quantization mode, the residual is calculated with a number of bits less than the original number of bits. Quantization of the signal, and a quantization step for reducing the number of bits by code conversion,
Information identifying the first and second quantization modes;
An information signal encoding method comprising: a transmission step for transmitting the quantized output.
入力ディジタル情報信号と上記入力ディジタル情報信号の予測値との残差信号を生成され、上記残差信号をブロック化され、ブロック毎に、最大値および最小値が検出され、上記最大値および上記最小値から上記ブロック毎の残差信号の存在範囲が0を跨ぐものかどうかが決定され、上記存在範囲が0を跨ぐ場合に第1の量子化モードが指示され、上記存在範囲が0を跨がない場合に第2の量子化モードが指示され、上記第1の量子化モードでは、残差信号が元のビット数より少ないビット数で量子化され、上記第2の量子化モードでは、残差信号が元のビット数より少ないビット数で量子化されるとともに、コード変換によりビット数をより少なくするように符号化され、上記第1および第2の量子化モードを識別する情報と、残差信号の情報とが伝送される情報信号符号化方法に対する復号方法において、
上記識別情報に基づいて、上記第1の量子化モードでは、データを逆量子化し、上記第2の量子化モードでは、データをコード変換するとともに、逆量子化する逆量子化のステップと、
上記逆量子化された残差信号をブロック分解し、元の順序へ変換するステップとからなることを特徴とする情報信号復号方法。
A residual signal between an input digital information signal and a predicted value of the input digital information signal is generated, the residual signal is blocked, and a maximum value and a minimum value are detected for each block, and the maximum value and the minimum value are detected. It is determined from the value whether or not the existence range of the residual signal for each block crosses 0, and when the existence range crosses 0, the first quantization mode is indicated, and the existence range crosses 0. If not, the second quantization mode is instructed . In the first quantization mode, the residual signal is quantized with a smaller number of bits than the original number of bits, and in the second quantization mode, the residual is The signal is quantized with a smaller number of bits than the original number of bits and encoded to reduce the number of bits by code conversion, and information identifying the first and second quantization modes, and a residual Signal In the decoding method for the information signal encoding method in which the broadcast is transmitted,
Based on the identification information, in the first quantization mode, the data is inversely quantized, and in the second quantization mode, the data is transcoded and inversely quantized,
An information signal decoding method comprising the steps of: block-decomposing the inversely quantized residual signal and converting it to the original order.
JP19965996A 1995-07-28 1996-07-10 Information signal encoding apparatus, encoding method, and information signal decoding method Expired - Fee Related JP3629826B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP19965996A JP3629826B2 (en) 1995-07-28 1996-07-10 Information signal encoding apparatus, encoding method, and information signal decoding method

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP21268495 1995-07-28
JP7-212684 1995-07-28
JP19965996A JP3629826B2 (en) 1995-07-28 1996-07-10 Information signal encoding apparatus, encoding method, and information signal decoding method

Publications (2)

Publication Number Publication Date
JPH09102743A JPH09102743A (en) 1997-04-15
JP3629826B2 true JP3629826B2 (en) 2005-03-16

Family

ID=26511666

Family Applications (1)

Application Number Title Priority Date Filing Date
JP19965996A Expired - Fee Related JP3629826B2 (en) 1995-07-28 1996-07-10 Information signal encoding apparatus, encoding method, and information signal decoding method

Country Status (1)

Country Link
JP (1) JP3629826B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100908114B1 (en) * 2002-03-09 2009-07-16 삼성전자주식회사 Scalable lossless audio encoding / decoding apparatus and method thereof
JP4733939B2 (en) 2004-01-08 2011-07-27 パナソニック株式会社 Signal decoding apparatus and signal decoding method
CN114490480B (en) * 2022-03-31 2022-07-08 苏州浪潮智能科技有限公司 Coding method and system of chip internal signal and electronic equipment

Also Published As

Publication number Publication date
JPH09102743A (en) 1997-04-15

Similar Documents

Publication Publication Date Title
US7327786B2 (en) Method for improving rate-distortion performance of a video compression system through parallel coefficient cancellation in the transform
US6721359B1 (en) Method and apparatus for motion compensated video coding
US6370276B2 (en) Image predictive decoding method, image predictive decoding apparatus, image predictive coding method, image predictive coding apparatus, and data storage media
US5703652A (en) Information signal encoding system and method for adaptively encoding an information signal
US8406314B2 (en) Two-dimensional DPCM with PCM escape mode
US6078694A (en) Image signal padding method, image signal coding apparatus, image signal decoding apparatus
JPH0583696A (en) Picture encoding device
US20060098881A1 (en) Method and apparatus for encoding and decoding image data
JPH09238366A (en) Image coder, image encoder, and coding decoding system
US5825313A (en) Information signal encoding apparatus, encoding method thereof, information signal decoding method, and information signal record medium thereof
EP0820196A2 (en) Hierarchic image encoding
JP2007521740A (en) How to find zeros in the transformation domain early
US6408101B1 (en) Apparatus and method for employing M-ary pyramids to enhance feature-based classification and motion estimation
US6072837A (en) Quantizing apparatus and quantizing method
KR100423226B1 (en) Quantization Device and Quantization Method
US6473465B1 (en) Method and apparatus for video coding at high efficiency
JP3629826B2 (en) Information signal encoding apparatus, encoding method, and information signal decoding method
JP3834880B2 (en) Information signal encoding apparatus, encoding method, and information signal decoding method
US5841375A (en) Information signal encoding apparatus, encoding method thereof, information signal decoding method, and information signal medium thereof
JP2004511978A (en) Motion vector compression
JP3496402B2 (en) Information signal encoding apparatus, encoding method, and information signal decoding method
JP3968799B2 (en) Information signal encoding apparatus, encoding method, and information signal decoding method
JP3309639B2 (en) Quantization device and quantization method
JPH0388488A (en) Picture coding system
JP3341528B2 (en) Quantization device and quantization method

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20040827

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040831

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20041101

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20041124

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20041207

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20071224

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081224

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091224

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091224

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101224

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101224

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111224

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111224

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121224

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131224

Year of fee payment: 9

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250

LAPS Cancellation because of no payment of annual fees