JP3960932B2 - Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program - Google Patents
Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program Download PDFInfo
- Publication number
- JP3960932B2 JP3960932B2 JP2003064092A JP2003064092A JP3960932B2 JP 3960932 B2 JP3960932 B2 JP 3960932B2 JP 2003064092 A JP2003064092 A JP 2003064092A JP 2003064092 A JP2003064092 A JP 2003064092A JP 3960932 B2 JP3960932 B2 JP 3960932B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- error
- sampling frequency
- digital
- signals
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
Images
Abstract
Description
【0001】
【発明の属する技術分野】
この発明は音声、音楽、画像などのディジタル信号をより低い情報量に圧縮された符号に変換する符号化方法、その復号化方法、符号化装置、復号化装置、これらのプログラムに関する。
【0002】
【従来の技術】
音声、画像などの情報を圧縮する方法として歪を許す非可逆な符号化と、歪を許さない可逆な符号化がある。非可逆な圧縮としてはITU-T(International Telecommunications Union-Telecom Standardization)やISO/IEC MPEG (International Organization for Standardization/International Electrotechnical Commission Moving Picture Experts Group)の標準として種々の方法が知られている。これらの非可逆圧縮方法を使うとわずかの歪に押さえつつ、もとのディジタル信号を1/10以下までに圧縮することが可能である。しかし、その歪は符号化条件や入力信号に依存し、用途によっては再生信号の劣化が問題となる場合がある。
【0003】
一方、もとの信号を完全に再現できる可逆な圧縮方法として、コンピュータのファイルやテキストの圧縮によく使われているユニバーサルな圧縮符号化が知られている。これはどのような信号に対しても圧縮が可能で、テキストなどには1/2程度まで圧縮できるが、音声や画像のデータに直接適用しても圧縮効果は2割程度にとどまる。
圧縮率の高い非可逆の符号化を行い、その再生信号と原信号の誤差を可逆に圧縮することを組み合わせることで高い圧縮率で可逆な圧縮が可能となる。この組み合わせ圧縮方法が特許文献1に提案されている。この方法は前記文献に詳細に示されているが、以下に簡単に説明する。
【0004】
符号器では、ディジタル入力信号(以下、入力信号サンプル系列とも呼ぶ)が、フレーム分割部で、その入力信号サンプル系列が、例えば1024個の入力信号サンプルからなるフレーム単位に、順次分割され、このフレーム単位ごとにディジタル信号が非可逆圧縮符号化される。この符号化は、復号化時に元のディジタル入力信号をある程度再現できる方式であれば、入力信号に適した如何なる方式でもよい。例えば、上記ディジタル入力信号が音声であればITU-TのG.729標準として勧告されている音声符号化などが利用でき、音楽であればMPEG-4で採用されているTwin VQ (Transform-Domain Weighted Interleaved Vector Quantization)符号化などが利用でき、その他、前記文献で示す非可逆符号化法を用いることもできる。この非可逆圧縮符号は局部復号され、この局部信号と元のディジタル信号との誤差信号が生成される。なお、実際的には、局部復号はする必要なく、非可逆圧縮符号を生成する際に得られる量子化信号と元のディジタル信号との誤差を求めればよい。この誤差信号の振幅は通常は元のディジタル信号の振幅よりもかなり小さい。よって、もとのディジタル信号を可逆圧縮符号化するよりも、誤差信号を可逆圧縮符号化する方が情報量を小さくできる。
【0005】
この可逆圧縮符号化の効率を上げるために、この誤差信号の符号絶対値表現(極性と絶対値の2進数)されたサンプル列のフレーム内の全サンプルに対しそれらの各ビット位置、つまりMSB,第2MSB,…,LSB毎に、サンプル系列方向(時間方向)にビットを連結したビット列を生成する。即ち、ビット配列の変換が行われる。この各連結した同じビット位置の1024個のビットからなるビット列をここでは便宜上「等位ビット列」と呼ぶことにする。これに対し、各サンプルの極性も含む振幅値を表す1ワードのビット列を便宜上「振幅ビット列」と呼ぶことにする。誤差信号は振幅が小さいので、各サンプルの最上位から1つ又は連続する複数のビットは全て"0"となることが多い。そこで、それらのビット位置で連結して生成した等位ビット列を予め決めた符号で表すことによって、誤差信号の可逆圧縮符号化効率を上げることができる。
【0006】
これら等位ビット列が可逆圧縮符号化される。可逆圧縮符号化としては、例えば、同一符号(1又は0)が連続する系列がある場合や頻繁に出現する系列がある場合を利用した、ハフマン符号化や算術符号化などのエントロピィ符号化などを用いることができる。
復号化側では、可逆圧縮符号が復号化され、その復号信号に対し、ビット配列の逆変換が行われ、即ち、フレーム毎に等位ビット列を振幅ビット列に変換し、得られた誤差信号が順次再生される。また、非可逆圧縮符号が復号化され、この復号信号と再生された誤差信号とが加算され、最後に、フレームごとの各加算信号が順次連結されて、元のディジタル信号系列が再生される。
【0007】
【特許文献1】
特許出願公開2001-44847号公報
【0008】
【発明が解決しようとする課題】
この発明の目的はディジタル信号を歪なく情報圧縮することと、階層化されたサンプルレートの選択を可能とする符号化方法、復号化方法、符号化装置、復号化装置、そのプログラムを提供することにある。
【0009】
【課題を解決するための手段】
この発明によれば、ディジタル信号の属性であるサンプリング周波数の段階的な階層と量子化精度の段階的な階層の少なくとも一方が予め決められたディジタル信号を符号化するディジタル信号符号化方法は、周波数の高いほうを上位、低いほうを下位とし、量子化精度の高いほうを上位、低いほうを下位とすると、
(a) 符号化する信号と、その信号より属性の階層が下位の信号又はその変形信号との差分信号を生成するステップと、
(b) 上記差分信号を可逆符号化するステップと、
を含む。
この発明によれば、ディジタル信号の属性であるサンプリング周波数の段階的な階層と量子化精度の段階的な階層の少なくとも一方が予め決められたディジタル信号を符号化するディジタル信号の符号化装置は、周波数の高いほうを上位、低いほうを下位とし、量子化精度の高いほうを上位、低いほうを下位とすると、
符号化する信号と、その信号より属性の階層が下位の信号又はその変形信号との差分信号を生成する差分信号生成手段と、
上記差分信号を可逆符号化する差分信号可逆符号化手段、
とを含む。
【0010】
この発明によれば、ディジタル信号の属性であるサンプリング周波数の段階的な階層と量子化精度の段階的な階層の少なくとも一方が予め決められたディジタル信号の符号を復号化する復号化方法は、周波数の高いほうを上位、低いほうを下位とし、量子化精度の高いほうを上位、低いほうを下位とすると、
(a) 入力符号を復号化して差分信号を生成するステップと、
(b) 上記差分信号と、その差分信号より属性の階層が下位の復号信号又はその変形信号とを合成して復号化された信号を生成するステップ、
とを含む。
この発明によれば、ディジタル信号の属性であるサンプリング周波数の段階的な階層と量子化精度の段階的な階層の少なくとも一方が予め決められたディジタル信号の復号化装置は、周波数の高いほうを上位、低いほうを下位とし、量子化精度の高いほうを上位、低いほうを下位とすると、
入力符号を復号して差分信号を生成する差分信号復号化手段と、
上記差分信号と、その差分信号より属性の階層が下位の復号化信号又はその変形信号とを合成して復号化信号を生成する信号合成手段、
とを含む。
【0011】
この発明によれば、ディジタル信号の属性であるサンプリング周波数の段階的な階層と量子化精度の段階的な階層の少なくとも一方が予め決められたディジタル信号の符号化処理手順を記述したコンピュータで実行可能な符号化プログラムであり、上記処理手順は、周波数の高いほうを上位、低いほうを下位とし、量子化精度の高いほうを上位、低いほうを下位とすると、
(a) 符号化する信号と、その信号より属性の階層が下位の信号又はその変形信号との差分信号を生成するステップと、
(b) 上記差分信号を可逆符号化するステップと、
を含む。
この発明によれば、ディジタル信号の属性であるサンプリング周波数の段階的な階層と量子化精度の段階的な階層の少なくとも一方が予め決められたディジタル信号の符号を復号化する復号化処理手順を記述したコンピュータで実行可能なプログラムであり、上記処理手順は、周波数の高いほうを上位、低いほうを下位とし、量子化精度の高いほうを上位、低いほうを下位とすると、
(a) 入力符号を復号化して差分信号を生成するステップと、
(b) 上記差分信号と、その差分信号より属性の階層が下位の復号信号又はその変形信号とを合成して復号化された信号を生成するステップ、
とを含む。
【0012】
【発明の実施の形態】
第1実施例
この発明の第1実施例を図1を参照して説明する。図中には信号のサンプリングレート(周波数)も記号で示している。入力端子11よりのディジタル信号はフレーム分割部12でフレーム単位、例えば1024サンプルごとに分割され、フレームごとのディジタル信号はダウンサンプリング部13で第1サンプリング周波数F1のディジタル信号からこれよりも低い第2サンプリング周波数F2のディジタル信号に変換される。この場合、その第2サンプリング周波数F2のサンプリングにより折り返し信号が生じないように低域通過フィルタ処理により高くとも周波数F2/2以上の高域成分が除去される。
【0013】
第2サンプリング周波数F2のディジタル信号は、符号化部14で非可逆又は可逆の圧縮符号化が行われ、主符号Imとして出力される。符号化部14で非可逆の圧縮符号化を行う場合は、例えばこの主符号Imは局部復号部15で復号され、復号された局部信号はアップサンプリング部16で第2サンプリング周波数F2の局部信号から第1サンプリング周波数F1の局部信号に変換される。あるいは符号化部14で量子化誤差が最小となるように非可逆符号化を行う場合は、そのとき得られる量子化信号が局部復号部15の出力信号と同じなので、その量子化信号を一点鎖線で示すようにアップサンプリング部16に与えてもよく、その場合は局部復号部15は不要である。また、符号化部14で可逆符号化を行う場合は、局部復号部15の出力は符号化部14の入力信号と同じになるので、局部復号部15を省略し、図に二点鎖線で示すように符号化部14の入力信号をアップサンプリング部16に与えてもよい。いずれの場合も、アップサンプリング部16に与える信号は主符号Imに対応したものであり、以下の実施例の説明においても便宜上局部信号と呼ぶことにするが、このように局部復号部を使用しないでもよいことは他の実施例についても当てはまる。
【0014】
誤差算出部17はこの第1サンプリング周波数F1の局部信号と、フレーム分割部12よりの分岐された第1サンプリング周波数のディジタル信号との差分を誤差信号として算出し、配列変換・符号化部18へ供給する。配列変換・符号化部18の処理は後で述べるが、ビット配列変換部と可逆符号化部を備え、誤差信号を正しく、つまり可逆に復元することができる誤差符号Peに符号化する。この配列変換・符号化部18よりの誤差符号Peと主符号Imは出力部19で必要な形式にフォーマットされ、出力端子21に出力される。
【0015】
この発明による符号化装置10から出力される符号系列信号は、伝送路を通して復号装置40に送信してもよいし、あるいは一旦記録媒体に蓄積し、後に記録媒体から読み出された符号系列信号が復号化装置40に与えられてもよい。伝送路を通して符号系列信号を送信する場合は、例えば出力部19は主符号Imと誤差符号Peをそれぞれ所定の長さ(例えば1乃至複数フレーム分の長さ)ごとに必要に応じて優先度を付けてパケット化し、順次出力する。符号系列を記録媒体に蓄積する場合は、例えばフレームごとに主符号Imと誤差符号Peを結合して一連の結合符号列を形成し、接続されている装置のインタフェースに応じて複数並列ビットとして出力するか、シングルビット列として出力する。以下の説明では、主符号Imと誤差符号Peをパケットとして出力する場合を例に説明する。
【0016】
復号化装置40においては入力端子41よりの受信パケットは入力部42において主符号Imと誤差符号Peとに分離され、主符号Imは復号部43で符号化装置10の符号化部14と対応した復号処理により非可逆又は可逆復号されて第2サンプリング周波数F2の復号信号が得られる。この第2サンプリング周波数の復号信号はアップサンプリング部44でアップサンプリングされて第1サンプリング周波数F1の復号信号に変換される。この際、サンプリング周波数をF2より高くするために補間処理が行われ局部信号が得られる。
【0017】
分離された誤差符号Peは復号・配列逆変換部45で誤差信号を再生する処理が行われる。この復号・配列逆変換部45の具体的構成及び処理については後で述べる。再生された誤差信号のサンプリング周波数は第1のサンプリング周波数F1であり、この誤差信号とアップサンプリング部44からの局部信号とが加算部46で加算され、再生ディジタル信号としてフレーム合成部47へ供給される。フレーム合成部47では各再生されたフレームごとのディジタル信号が順次結合されて出力端子48に供給される。より現実的な構成では、破線で示すように誤差符号Peのパケットの欠落を検出する欠落検出部49と、そのパケット欠落検出に基づいて復号誤差信号サンプルを補正する欠落補正部58が復号・配列逆変換部45の出力側に設けられているが、これらについては後で図6、7及び8を参照して詳細に説明する。
【0018】
この構成によれば、主符号Imと誤差符号Peの両方を使用して原ディジタル信号と同一サンプリング周波数の高品質の信号を再生することができる。またパケットで符号化出力する場合に、主符号Imのパケットに高い優先度を与えることにより、誤差符号Peのパケットが失われた場合でも比較的品質の高い信号を再生することができる。また利用者によってはそれ程高品質のデータ信号を要望しない場合は、サンプリング周波数が原ディジタル信号より低い信号に基づく主符号Imのみを提供することにより少ない情報で、その割合に高い品質の信号を提供することができる。例えばネットワークでディジタル信号を送信する場合に、即ち、送信側においてはネットワークの条件(経路の通信容量やトラヒック)に応じて、あるいは受信側の要求に応じて主符号Imのみ又は主符号Imと誤差符号Peの両方を送るか選択の自由度がある。
符号化部14として可逆符号化を行う場合は後で具体的に述べるが、配列変換・符号化部18で行う処理と同様の処理を行ってもよい。その場合は復号部43においても復号・配列逆変換部45と同様な手法で復号処理を行う。
【0019】
第2実施例
この発明の第2実施例は、データ信号のサンプリング周波数を多段階に階層化し、より多くの種類の品質の信号を選択的に提供することを可能としたものである。
図2に図1と対応する部分に同一参照符号を付けて示すように、この第2実施例では誤差算出部17よりの第1サンプリング周波数F1の誤差信号はダウンサンプリング部22でダウンサンプリングされて、第1サンプリング周波数F1より低いが第2サンプリング周波数より高い第3サンプリング周波数F3の誤差信号に変換される。例えばダウンサンプリング部13では入力信号のサンプリング周波数F1を4分の1に下げてサンプリング周波数F2の信号を得る。ダウンサンプリング部22では誤差信号のサンプリング周波数F1を2分の1に下げてサンプリング周波数F3の誤差信号を得る。即ち、サンプリング周波数をF1=4F2及びF1=2F3の関係に決める。
【0020】
ダウンサンプリング部22よりの第3サンプリング周波数F3の誤差信号は符号化部23で非可逆又は可逆圧縮符号化され、従符号Ieとして出力される。この従符号Ieは局部復号部24で復号され、第3サンプリング周波数F3の局部信号が出力され、この第3サンプリング周波数の局部信号はアップサンプリング部25でアップサンプリングされ、第1サンプリング周波数F1の局部信号に変換される。この第1サンプリング周波数の局部信号と誤差算出部17よりの第1サンプリング周波数の誤差信号との誤差が誤差算出部26で誤差信号として算出され、この誤差信号は配列変換・符号化部18へ供給され、後述の配列変換・符号化部により誤差符号Peが生成される。局部復号部24も局部復号部15と同様に省略することができ、例えば、符号化部23で非可逆符号化を行う場合は、誤差が最小となるように符号化部23の入力信号を量子化する処理で得られる量子化信号をアップサンプリング部25に与えればよい。または、符号化部23で可逆符号化を行う場合は、その符号化部23の入力信号をアップサンプリング部25に与えればよい。以下の他の実施例においても同様に、局部復号部15、24を省略した構成が可能な場合はそれらのブロックを破線で示す。出力部19は主符号Imと従符号Ieと誤差符号Peをパケット化し、必要に応じて情報データに優先度をつけて出力する。
【0021】
復号化装置40においては入力部42で受信パケットから主符号Imと従符号Ieと誤差符号Peを分離し、主符号Imは復号部43に供給され、誤差符号Peは復号・配列逆変換部45へ供給され、それぞれ図1に示した復号部43及び復号・配列逆変換部45における主符号Imと誤差符号Peに対する処理と同様な処理が行われ、サンプリング周波数F2の主信号とサンプリング周波数F1の誤差信号が得られる。
従符号Ieは復号部27で復号され、第3サンプリング周波数F3の復号従信号が再生される。この復号部27は符号化装置10の符号化部23の符号化方法と対応した復号処理を行うものである。第3サンプリング周波数F3の復号信号はアップサンプリング部52で第1サンプリング周波数F1の復号信号に変換され、この第1サンプリング周波数の復号信号とアップサンプリング部44よりの第1サンプリング周波数の復号信号とが加算部43で加算され、この加算された第1サンプリング周波数F1の復号信号と復号・配列逆変換部45よりの第1サンプリング周波数F1の誤差信号とが加算部46で加算されて、再生ディジタル信号としてフレーム合成部47へ供給される。
【0022】
アップサンプリング部44では前記符号化装置でのサンプリング周波数の関係の場合、サンプリング周波数F2を4倍にしてサンプリング周波数F1にし、アップサンプリング部52ではサンプリング周波数F3を2倍に変換してサンプリング周波数F1にする。
この構成によればすべての情報、つまりIm,Ie,Peが正しく得られれば高いサンプリング周波数F1の原ディジタル信号を得ることができる。再生誤差信号を得ることができない場合においては、図中破線で示すように復号部43よりの第2サンプリング周波数F2の復号信号をアップサンプリング部54で第3サンプリング周波数F3の復号信号に変換し、この信号と復号部27よりの復号信号とを加算部55で加算して再生ディジタル信号としてフレーム合成部47へ供給することにより原ディジタル信号よりは、わずか品質が低下するが、サンプリング周波数F3の品質のディジタル信号を高能率圧縮符号化した符号から得ることができる。
【0023】
更に符号化効率を上げる場合は主符号Imの復号信号、つまり復号部43からの第2サンプリング周波数F2の復号信号のみを再生ディジタル信号としてフレーム合成部47へ供給することができる。
例えば原ディジタル信号として第1サンプリング周波数F1が192kHzの音楽信号とし、第3サンプリング周波数F3を96kHzとし、第2サンプリング周波数F2を48kHzとすると、一般にはサンプリング周波数48kHzの再生ディジタル信号でもコンパクトディスク(CD)並の高い品質が得られ、これで良いとする利用者の復号化装置40には主符号Imのみを用いて、つまり少ない情報量で高品質の情報を提供することができ、サンプリング周波数がより高い96kHzの再生ディジタル信号を望む利用者には主符号Imと従符号Ieを用いることにより高い圧縮率でCDより高品質の信号を提供することができる。更に高いサンプリング周波数の信号が欲しい利用者の復号化装置40にはImとIeとPeを用いることにより192kHzの原ディジタル信号を再生することができる。
【0024】
第2実施例の変形
サンプリング周波数を多段に変更する第2実施例の変形例を図3を参照して説明する。図3において図2と対応する部分に同一参照符号をつけてある。符号化装置10においてこの例ではフレームごとのディジタル信号は複数段のダウンサンプリング部を経て符号化部14へ供給する。図ではダウンサンプリング部13とダウンサンプリング部27を用いた2段構成とした場合で、第1サンプリング周波数F1の信号が入力されるダウンサンプリング部13の出力信号のサンプリング周波数は前記例の第3サンプリング周波数F3であり、その第3サンプリング周波数F3の信号が入力されるダウンサンプリング部27の出力信号のサンプリング周波数は第2サンプリング周波数F2である。符号化部14よりの主符号Imを復号して得た局部信号のサンプリング周波数F2がアップサンプリング部16で符号化部14の直前のダウンサンプリング部27の入力信号のサンプリング周波数つまり第3サンプリング周波数F3の局部信号に変換される。前記サンプリング周波数の関係の場合はダウンサンプリング部13及び27でそれぞれサンプリング周波数を2分の1に変換する。この第3サンプリング周波数F3の局部信号とダウンサンプリング部27の入力信号との誤差が誤差算出部52で誤差信号として算出され、この誤差信号は符号化部23で非可逆又は可逆の好ましくは高圧縮符号化により符号化されて従符号Ieとして出力される。
【0025】
この従符号Ieは局部復号部24で復号され第3サンプリング周波数F3の局部信号が得られる。この局部信号とダウンサンプリング部27の入力信号とが加算部29で加算され、この加算された第3サンプリング周波数の局部信号はアップサンプリング部25で第1サンプリング周波数の加算局部信号に変換される。この加算局部信号とフレーム分割部12からの出力より分岐されたディジタル信号との誤差が誤差算出部17で誤差信号として算出され、この誤差信号が配列変換・符号化部18へ供給され誤差符号Peが生成される。誤差符号Peと主符号Imと従符号Ieが出力部19で結合されて出力される。
【0026】
なお、この図3に示した変形実施例の符号化装置10においても、図1及び2の符号化装置の場合と同様に局部復号部15及び24を使用しないで、それぞれ符号化部14、23における量子化信号をアップサンプリング部16、加算部29に与える(符号化部14、23が非可逆符号化を行う場合)か、または符号化部14、24の入力信号をそれぞれアップサンプリング部16、加算部29に与える(符号化部14、23が可逆符号化を行う場合)ように構成してもよい。
【0027】
復号化装置40においては入力部42で端子41からの入力パケットは主符号Im、従符号Ie、誤差符号Peに分離され、それぞれ復号部43、復号部51、復号・配列逆変換部45で各局部信号と誤差信号が再生されることは図2に示した場合と同様である。復号部43よりの第2サンプリング周波数F2の復号信号はアップサンプリング部44でこの例では第3サンプリング周波数F3の復号信号に変換され復号部51よりの第3サンプリング周波数F3の復号信号と加算部53で加算される。この加算復号信号はアップサンプリング部52で第1サンプリング周波数の復号信号に変換され、この復号信号と復号・配列逆変換部45よりの第1サンプリング周波数F1の誤差信号と加算部46で加算され再生ディジタル信号としてフレーム合成部47へ供給される。
【0028】
なお誤差信号を再生するに十分な情報が得られない場合、あるいは誤差符号Peが入力されない場合は加算部53よりの第3サンプリング周波数F3の加算復号信号が再生ディジタル信号としてフレーム合成部47へ供給される。さらに主符号Imのみしか得られない場合は復号部43よりの第2サンプリング周波数F2の復号信号が再生ディジタル信号としてフレーム合成部47へ供給される。
図2及び図3に示した第2実施例では2段階にサンプリング周波数を変換したが更に3段階以上サンプリング周波数を変換して同様な符号化及び復号化をすることもできる。
【0029】
配列変換・符号化部
上述の図1、2及び3に示した各符号化装置の実施例中の配列変換・符号化部18の具体例を図4を参照して説明する。誤差算出部17(図2では26)よりの誤差信号は補助情報生成部18Eへ供給される。補助情報生成部18E内の有効桁数検出部18E5でフレームごとに、そのフレーム内の誤差信号サンプルの絶対値の最大値を表現する桁数が有効桁数Feとして検出される。また各誤差信号サンプルはその有効桁数以内の部分のみがビット配列変換部18Aによりそれぞれのサンプルにおける同一ビット位置のビットが、等位ビット列として取り出される。
【0030】
ビット配列変換部18Aよりの等位ビット列は伝送記録単位分割部18Bで伝送単位あるいは記録単位のデータに分割される。これら各分割された伝送記録単位データは必要に応じて、可逆圧縮符号化部18Cにより可逆圧縮符号化され、誤差データ符号Ineとして補助符号付加部18Dに与えられる。補助符号付加部18Dは後述の補助情報符号化部18Fからの補助符号Inxを誤差データ符号Ineに付加して誤差符号Peとして出力する。
ビット配列変換の例を図5Aに示す。極性符号と絶対値表現された各誤差信号サンプルの振幅ビット列は図5A中の左側の各縦の列で示されており、それらの振幅ビット列の1フレーム分がサンプル方向に順次配列されている。1つの振幅ビット列の様子を理解し易いように、振幅を跨いだ振幅ビット列DV(k)を太線で囲んで示す、kはフレーム内の時刻を表わし、例えばk=1, 2, …, 1024である。この例では各振幅ビット列DV(k)の極性符号を絶対値のMSBと隣接させ、図ではMSB(Most Significant Bit:最上位ビット)の直上に極性符号を位置させている。
【0031】
極性絶対値表現された誤差信号が有効桁数検出部18E5へ供給され、その誤差信号の振幅ビット列の1フレーム内で最もMSBに近い桁に"1"がある所を検出、LSB(Least Significant Bit:最下位ビット)からその桁までの桁数が有効桁数Feとして求まる。この1フレームの誤差信号中のこの有効桁数以内の部分LBPのみと極性符号とを等位ビット列に変換する。つまり有効桁数より上の桁からMSBまでの部分HBPは等位ビット列に変換する必要はない。
このようなサンプル配列データを、図5Aの右側に示すようにこの例ではまず各サンプル(振幅ビット列)の振幅の数値の極性ビット(符号)のみをフレーム内で時間方向に連結したビット列を等位ビット列として抽出する。次に有効桁数Fe以内の最も上位の桁のみをフレーム内で連結した等位ビット列を抽出し、同様にして、順次、各桁(対応ビット位置)ごとに時間方向に連結した等位ビット列を抽出し、最後にLSBのみをフレーム内で連結した等位ビット列を抽出する。これら抽出した等位ビット列の1つの例を図5A中右側の水平配列において太枠でDH(i)として示す。iは等位ビット列を構成するビットの、配列変換前の振幅ビット列におけるビット位置を示す。以上のビット配列変換ではビット列を構成する各ビットの内容は全く変らない。
【0032】
なお各誤差信号サンプルが2の補数で正負の整数で表現されている場合のサンプル列のビット配列変換を行う場合は、例えば図5Bに1フレーム分の振幅ビット列を示すように、サンプルの絶対値の最大値を表現する桁より上位の桁の部分(図5B中の部分HBPで示す)は、振幅ビット列が正の値であれば、全て"0"となり、負の値であれば全て"1"となる。それ以外の部分LBPの桁数が有効桁数Feとして図4の有効桁数検出部18E5で検出される。この有効桁部分LBPとこれと隣接したビット位置(桁)、つまり極性符号についてのみ、等位ビット列への変換を行えばよい。
【0033】
伝送記録単位分割部18Bで、各等位ビット列DH(i)ごとに又は互いに隣接する複数の等位ビット列DH(i)ごとに伝送記録単位データに分割する。この場合、1フレーム中において、伝送記録単位データとして1つの等位ビット列で構成されるものと複数の等位ビット列で構成されるものとが混在してもよい。このように分割された各伝送記録単位データは可逆圧縮部18Cで可逆圧縮符号化され、誤差データ符号Ineとして補助符号付加部18Dに与える。
出力部19は、例えば図5Cに示すようにその伝送記録単位データの誤差符号をペイロードPYLに格納し、そのペイロードPYLにヘッダHDを付加する。ヘッダHDは例えばフレーム番号とフレーム内の伝送記録単位データの番号(出力順の番号)よりなるパケット番号PKTNと、必要に応じてそのパケットの優先度PRIO及びデータ長DTLが設けられ、復号側で各フレームごとに誤差信号サンプル列を再構成できるようにされる。
【0034】
データ長DTLは伝送記録単位データ(ペイロード)PYLのデータ長が固定であれば必要ないが、可逆圧縮部18Cで圧縮された場合などはデータ長がパケットにより異なるため必要となる。更に一般にはパケット全体に誤りが生じているか否かを検出するためのCRC符号などの誤り検出符号EDが最後に付加されて1つのパケットPKTが構成される。主符号Im及び従符号Ieについても同様にしてパケット化を行い、これら誤差符号Pe、主符号Im及び従符号IeのパケットPKTは順次出力端子21に出力される。
パケットPKTに優先順位がつけられる場合は、MSB側に近い対応伝送記録単位データを含むもの程高い優先度を与える。優先度は例えば2〜5段階程度に設定される。極性符号の等位ビット列に最も高い優先度を与え、次に主符号Imを表すビット列、従符号Ieを表わすビット列の順に優先度を与える。
【0035】
図4の説明に戻って、有効桁数検出部18E5で検出した有効桁数Feが補助情報符号化部18Fで符号化されて送出される。図4の例では更に、フレームごとに誤差信号のサンプル列からスペクトル包絡算出部18E4でスペクトル包絡を表現するパラメータ列LPCが、例えば線形予測分析により線形予測係数として求められ、またパワー算出部18E1でフレームごとの誤差信号の平均パワーPWが算出される。あるいはスペクトル包絡算出部18E4で求めた線形予測係数列に基づき構成した逆フィルタ18E2に誤差信号を入力してそのスペクトル包絡で正規化することにより平坦化処理し、その平坦化された信号の平均パワーがパワー算出部18E3で求められる。これら線形予測係数LPC及び平均パワーPWも補助情報符号化部18Fにより、例えば30〜50ビット/秒程度の低ビットで量子化し、それらの量子化値を代表する符号を補助符号Inxとして出力する。この有効桁数Fe、スペクトル包絡のパラメータ列LPC、平均パワーPWを符号化した補助符号Inxは出力部19へ供給され、各フレームの代表パケット、例えば極性符号を含む伝送記録単位データが格納されたパケット内に付加され、あるいは独立したパケットとして出力される。
【0036】
上述の配列変換・符号化部は、フレームごとにサンプルの最大有効桁数を検出して、その有効桁内のビットを配列変換する場合を説明したが、それよりも多少は効率が劣るが、有効桁を検出せず、サンプル列の最下位ビットから最上位ビットまでの全ビットをビット配列変換処理して符号化してもよい。
【0037】
復号・配列逆変換部
前述の配列変換・符号化部18と対応する復号・配列逆変換部45の具体例を欠落補正部58の具体例とともに図6に示す。復号・配列逆変換部45は、分離部45Aと、可逆伸張部45Bと、伝送記録単位統合部45Cと、ビット配列逆変換部45Dとから構成されている。また、欠落補正部58は補助情報復号部58Dと、スイッチ58Aと、欠落情報補正部58Bと、桁合わせ部58Cとから構成されている。
【0038】
入力部42で分離された誤差符号Peのパケットは分離部45Aにおいて誤差データ符号Ineと、補助符号Inxとに分離される。誤差データ符号Ineは可逆伸張部45Bへ供給され、補助符号Inxは欠落補正部58の補助情報復号部58Dへ供給される。補助情報復号部58Dは当該フレームの有効桁数Fe、スペクトル包絡を表すパラメータ列LPC及び平均パワーPWを示す符号を復号し、有効桁数Feを桁合せ部58Cへ供給し、スペクトル包絡パラメータ列LPC及び平均パワーPWを欠落情報補正部58Bへ供給する。
【0039】
誤差データ符号Ineは可逆伸張部45Bで可逆復号され、得られた伝送記録単位の誤差データは伝送記録単位統合部45Cでそのパケット番号に基づき、複数のパケットから1フレーム分の誤差データが、例えば図5Aの右側の等位ビット列の配列に示すように統合される。この統合された等位ビット列はビット配列逆変換部45Dで振幅ビット列、つまりサンプル列(波形)に変換される。この際、各サンプルが極性符号と絶対値で表現したものから伝送記録単位データが作られたものである場合はビット配列逆変換部45Dで、図5Aで説明したビット配列変換と逆に図5の右側に示す等位ビット列を図5Aの左側に示すように振幅ビット列に配列変換して誤差信号サンプル列として出力する。この配列逆変換は、伝送記憶単位統合部45Cからのそれぞれの誤差データ等位ビット列中の、符号化装置10における同一サンプルに属するビットを抽出して一サンプルの振幅ビット列を構成することである。
【0040】
なお、伝送記録単位データが、2の補数表現された振幅ビット列から等位ビット列に直接配列変換したものに基づくものである場合は、図5Bにおいて右側に示す等位ビット列の配列を左側に示す振幅ビット列の配列に変換するが、その処理は上述の極性値と絶対値から構成されたサンプルの場合の配列逆変換と同じである。ビット配列逆変換部45Dからの誤差信号サンプルは桁合わせ部58Cに与えられる。桁合せ部58Cでは各振幅ビット列に対し、復号有効桁数Feに応じた桁合せをする。つまり本来の振幅ビット列のビット数(桁数)になるように、その振幅ビット列の上位に図5Aの桁部分HBPに対応して"0"を加える。サンプルが2の補数で表現されている場合は、例えば図5Bにおける桁部分HBPに対し、極性符号が正であれば"0"を、負であれば"1"を付け加える。このようにして桁合せされた振幅ビット列は、再生誤差信号サンプル列(即ち復号誤差信号サンプル列)として出力される。
【0041】
パケット欠落が生じている場合は、受信されたパケットのパケット番号から欠落パケット番号が欠落検出部49で検出され、これによりスイッチ58Aが切替えられてビット配列逆変換部45Dよりの振幅ビット列は桁合せ部58Cへ直接供給されることなく、欠落情報補正部58Bへ供給され、欠落情報に対する補正が振幅ビット列(サンプル)に対し行われて、その後、桁合せ部58Cへ供給される。
【0042】
欠落情報補正部58Bにおける補正は既知の情報から欠落した情報を推定して行う。一部のパケット、通常優先度の低いLSB側のビットのパケットが欠落した場合、その欠落部分に対応する数値が確定できないので小さい数値、例えば0か、その欠落部分のとり得る最小値と最大値の中央値を使って波形を再生せざるを得ない。この場合MSB側の確定したビット数の精度は保てるが、聴覚的ひずみは大きい。この理由は原音のスペクトルは低域にエネルギーが偏る場合が多く、これに対してビットの欠落によるひずみ成分は平坦に近いスペクトル形状となるので、その高域成分が原音より大きく、再生すると受聴者は雑音として聞こえてしまう。そこで不確定の成分のスペクトルが平均的なスペクトルまたはフレーム毎に確定したスペクトルに近似するように不確定な波形の値を補正する。これにより、補正後の歪み成分のスペクトルは高域成分が小さくなり、ひずみが原音にマスクされて品質が改善される。
【0043】
つまり、過去の数フレームの平均的スペクトル、又は後で述べるように補助情報の復号結果として得られたそのフレームにおける確定したスペクトルに、当該フレームの欠落情報以外の情報から得られるスペクトルが近似するように、欠落情報に対する補正を行う。この補正の好ましい手法は後で述べる。簡単な補正法としては、欠落情報補正部58Bでその入力再生サンプル列を低域通過フィルタに通して平滑化して高域の雑音成分を除去すればよい。その低域通過フィルタの遮断特性は、原信号のスペクトル形状(包絡)が予め知られていれば、その特性に応じてカットオフ周波数より高域成分を減衰させるように選定する。あるいは、前述のように平均的なスペクトルを求め又はフレームごとの確定したスペクトルの形状に合せて遮断特性を適応的に変更してもよい。
【0044】
このように復号・配列逆変換部45でパケット欠落にもとづく情報欠落を補正できるため、必要に応じてLSB側パケットを意図的に送らず、符号化圧縮効率を大としても、復号・配列逆変換部45で可逆復号が可能となる、あるいは聴感上問題にならない程度の誤差を持った再生を行うことができる。
あるいは欠落情報(ビット)のとり得る値の総ての組み合せを、各サンプル値に加算し、補正サンプル列(波形)の候補を作り、これら候補のスペクトル包絡を求め、そのスペクトル包絡が補助情報の復号スペクトル包絡と最も近いものと対応する補正サンプル列(波形)候補を、補正サンプル列として桁合せ部58Cへ出力する。なお図4、図6において可逆圧縮部18C、可逆伸張部45Bを省略してもよい。
上述の復号・配列逆変換部の説明は、符号化装置10側でサンプルの有効桁を検出して有効桁内のビットを配列変換した場合に対応した処理について説明したが、符号化装置10で有効桁を検出せず、サンプル列の全ビットを配列変換する場合は、復号化装置40において桁合わせは不要となる。
【0045】
補助情報による補正
欠落情報のとり得る値の総ての組み合せを用いて補正サンプル列の候補を作る場合、欠落情報(ビット)が多くなると、補正サンプル列(波形)候補が著しく多くなることにより処理量が増大し、非現実的になるおそれがある。このような問題がないようにする欠落情報補正部58Bの処理、及びその機能構成について以下に説明する。
【0046】
図7にその処理手順の一例を、図8に機能構成の一例をそれぞれ示す。まず暫定波形生成部58B1に配列変換部45Dから入力された確定しているビットのみを使ってフレーム内の暫定波形(暫定的なサンプル列)を再生する(S1)。この暫定波形の再生は欠落しているビットは例えば0に固定するか、欠落ビットが取り得る最小値と最大値の中間値とする。例えば下位4ビットが欠落しているとすると、0〜15までのレベルのどれかが正しい値であるが、仮に8または7に設定する。
【0047】
次にこの暫定波形のスペクトル包絡をスペクトル包絡算出部58B2で計算する(S2)。例えば音声分析で使われている全極型の線形予測分析を暫定波形に対し行えばスペクトル包絡を推定できる。誤差計算部58B3で、この推定したスペクトル包絡と補助情報として送られた原音のスペクトル包絡、つまり補助情報復号部58Dで復号されたスペクトル包絡とを比較して誤差が予め決めた許容範囲内であればスイッチSW1を制御して暫定波形を補正された再生誤差信号として出力する(S3)。
【0048】
ステップS3において、推定スペクトル包絡形状と復号スペクトル包絡波形状との誤差が許容範囲より大きいときには、まず推定したスペクトル包絡の逆特性を暫定波形に与える(S4)。具体的にはステップS2で求めたスペクトル包絡を表すパラメータを例えば全極型の線形予測の逆フィルタ(全零型)58B4に設定し、暫定波形生成部58B1からスイッチSW2を通して与えられた暫定波形を逆フィルタ58B4に通すことで暫定波形のスペクトルを平坦化して平坦化信号を得る。この平坦化信号の平均パワーをパワー計算部58B5で計算し、この平均パワーと、補助情報復号部58Dからの復号された平均パワーPW(図4における平坦化パワー算出部18E1の出力)とから補正量を補正量計算部58B6で計算し、例えば両者の比又は差をとり、その補正量により、パワー補正部58B7で逆フィルタ58B4の出力パワー値に対し振幅補正を行う。つまり、逆フィルタ58B4の出力に対し補正量を乗算又は加算して、パワー補正部58B7の出力パワー値を復号パワー値に合せる(S5)。
【0049】
次にこの振幅補正された平坦化信号に対して補助情報のスペクトル包絡の特性を与えてスペクトル包絡を補正する(S6)。すなわち補助情報の復号スペクトル包絡を表わすパラメータLPCを用いた全極型の合成フィルタ58B8にパワー補正部58B7の出力を通してスペクトル補正波形を作る。この結果の波形のスペクトル包絡は原誤差信号に近いものになる。
ただしこのスペクトル補正波形はすでに確定している桁のビットと矛盾する可能性があるので、正しい値に修正部58B9で修正する(S7)。例えば16ビット精度の振幅の値のうち、下位4ビットが不明である場合、各サンプルのとりうる値には16の範囲の不確定があるが、スペクトル補正波形と最も近い値に修正する。つまり各サンプルにおいて補正したサンプル値がとり得る範囲から外れた場合はとり得る範囲の限界値に修正する。たとえば上位12ビットの補正サンプル値が正しい12ビットのサンプル値より大きければ、補正サンプル値の上位12ビットを正しいサンプル値に修正して補正サンプル値の下位4ビットを全て"1"(上限)にし、小さければ全て"0"(下限)にする。この修正で振幅値の確定しているビットはすべて一致して同時にスペクトル包絡も原誤差信号に近い波形が再生できる。
【0050】
この修正波形をステップS1の暫定波形としてステップS2以後の処理を繰り返すことができる。なお復号有効桁数がフレーム毎に異なる場合で、スペクトル包絡算出部58B2の線形予測分析、逆フィルタ58B4、合成フィルタ58B8の各処理の対象となるサンプルが現在のフレームと過去のフレームにまたがる場合がある。この場合には処理の対象は現在のフレームであっても、一つ過去のフレームの有効桁数を現在のフレームの有効桁数をそろえたうえで分析やフィルタ処理を行う必要がある。一つ過去のフレームの有効桁数が現在のフレームの有効桁数よりN桁小さい場合には、一つ過去のフレームのサンプルを例えばN桁下位にシフトさせて振幅値を縮小させてその有効桁数を現在のフレームの有効桁数に合わせる。逆に一つ過去のフレームの有効桁数が現在のフレームの有効桁数よりM桁大きい場合には、過去のフレームのサンプルを例えば浮動小数点表示などで一時的にM桁上位にシフトして振幅値を拡大させてその有効桁数を現在のフレームの有効桁数に合わせる。この場合、上位シフトによりレジスタから溢れ出て情報の欠落が大きいときにはその過去のフレームのサンプルの振幅値の精度が落ちているので、過去のフレームのサンプルを使わない、あるいは現在のフレームのサンプルに対する補正処理を省略してもよい。
【0051】
このような有効桁数の補正は図7中に破線で示すように、ステップS2の分析処理に必要な場合はその前に、前述した有効桁数補正を行い(S2′)、ステップS4の逆フィルタ処理に必要な場合は、その前に有効桁数補正を行い(S4′)、ステップS6の合成フィルタ処理に必要な場合は、その前に有効桁数補正を行う(S6′)。また図8において、スペクトル包絡算出部58B2、逆フィルタ58B4、合成フィルタ58B8中の過去のフレームのサンプルを必要とするものに対しては破線で示すように補助情報復号部58Dから復号された有効桁数Feも供給され、これらスペクトル包絡算出部58B2、逆フィルタ58B4、合成フィルタ58B8において、過去のフレームのサンプルに対する有効桁数を現在フレームの有効桁数に合せる処理を行った後、その本来の処理を行うようにされる。
【0052】
なお波形(サンプル値)は整数値が前提であるが、フィルタ計算では実数扱いとなり、フィルタの出力値の整数化が必要になる。合成フィルタの場合にはサンプルごとに整数化するか、フレーム毎にあとで一括して整数化するかで結果は異なるが、どちらも可能である。
図7及び図8中に破線で示すように、ステップS4で暫定波形を平坦化した後、まずこの平坦化された暫定波形(平坦化信号)を合成フィルタ58B8へ通して、スペクトル包絡補正した再構成サンプル系列(波形)を得(S5′)、そのスペクトル包絡補正された波形に対しパワー補正部58B7'で振幅補正をして(S7′)ステップS7に移るようにしてもよい。この場合は、合成フィルタ58B8よりのスペクトル包絡補正された波形の平均パワーがパワー計算部58B5'で計算され、この平均パワーと、補助情報の復号パワーPW(図4中のパワー計算部18Eの出力に対応)とにより補正量計算部58B6'で補正量が求められ、その補正量により合成フィルタ58B8の出力に対してパワー補正部58B7'で振幅補正が行われる。
【0053】
図7に示した処理中のステップS3の後、ステップS2において推定したスペクトル包絡の逆フィルタ58B4と、補助情報の復号スペクトル包絡の合成フィルタ58B8とを組み合わせたひとつの合成フィルタ58B8'のフィルタ係数を合成スペクトル包絡計算部58B10で計算し、その係数を設定した合成フィルタ58B8'に暫定波形を通してスペクトル包絡を補正した波形を合成し、そのスペクトル包絡が補正された波形に対し振幅補正を行ってもよい。また符号化装置10におけるビット配列変換部18Aが図5A及び5Bで示した有効桁数Feを検出せず、全振幅ビット列を等位ビット列に配列変換する場合は、有効桁数検出部18E5と、それに関連する復号化装置40における桁合せ部58Cを省略してもよい。更に必ずしも伝送記録単位に分割しなくてもよく、パケット化しなくてもよい。パケット化する場合は第1〜第3実施例における主符号Im、従符号Ie、その他の符号もパケット化する。
【0054】
なおこの明細書においては情報量を調整するために意図的に1フレーム中のパケットを除去したために、復号化器において1フレーム中のパケットが全て入力されない場合、あるいは通信網のトラヒック輻輳による交換局などで一部パケットを送出しないために基づく、又は伝送路障害、記録再生装置の異常などに基づくパケット欠落の場合、あるいは入力されたパケット中に誤りがあり、その伝送記録単位データを解読できず、使用することができない場合、またあるパケットが異常に遅延した場合などを総称してパケット欠落と記す。
以上説明した第1及び第2実施例によれば原ディジタル信号をそのサンプリング周波数を変換して符号化し、誤差信号は原信号のサンプリング周波数として少くとも等位ビット列として出力するため各種要求に応じた品質の信号を再生することができる。
【0055】
第3実施例
前述の図1、2及び3の実施例では、配列変換・符号化部18において誤差算出部17又は26からの誤差信号を配列変換・符号化した例を説明したが、誤差信号の予測誤差を配列変換・符号化してもよい。その例を図1の符号化装置10に適用した構成と、それに対応する復号化装置40の構成を図9に示す。
この構成は図1の符号化装置10における誤差算出部17と配列変換・符号化部18との間に予測誤差生成部31を設け、復号化装置40における復号・配列逆変換部45と加算部46との間に予測合成部56を設けた構成であり、その他の部分の構成は図1の場合と同様である。
【0056】
予測誤差生成部31は例えば図10Aに示すように、予測分析部31Aと、サンプルレジスタ31Bと、線形予測部31Cと、整数化部31Dと、減算部31Eとから構成されている。例えば誤差算出部17よりの直前の過去の誤差信号の複数サンプルがサンプルレジスタ31Bより線形予測部31Cへ供給され、これらサンプルに対し、予測分析部31Aよりのスペクトル包絡パラメータ列に基づく線形予測係数LPCが畳み込み演算されて線形予測値が求められる。この線形予測値は整数化部31Dで整数値とされ、整数の予測値と誤差算出部17からの誤差信号の現サンプルとの差が減算部31Eで求められて、予測誤差信号Speが得られ、この予測誤差信号Speは配列変換・符号化部18に入力される。
【0057】
あるいは図10Bに示すように、予測誤差生成部31を予測分析部31Aと線形予測部31Cと、整数化部31Dと、減算部31Eとにより構成し、誤差算出部17からの誤差信号を予測分析部31Aで線形予測分析してその予測係数LPCを求め、線形予測部31Cでその予測係数LPCと誤差信号の対応するサンプルを畳み込み演算して予測信号を得る。その予測信号を整数化部31Dで整数化し、減算器31Eにより整数化予測信号と入力誤差信号との差を予測誤差信号Speとして求める。得られた予測誤差信号Speは配列変換・符号化部18に与えられる。また、予測分析部31Aで求められた予測係数LPCの量子化値に対応する係数符号Icを図9の破線で示すように出力部19に与える。
【0058】
上述した各実施例において符号化装置10、復号化装置40はそれぞれコンピュータにより符号化プログラム、復号化プログラムを実行させて機能させることもできる。これらの場合は、そのコンピュータのプログラムメモリに、可逆符号化プログラム、可逆復号化プログラムを、CD−ROM、可撓性磁気ディスクなどから、又は通信回線を通じてダウンロードして利用することになる。
このようにして得られた予測誤差信号Speは配列変換・符号化部18において前述したと同様にビットの配列変換を行い、符号化して誤差符号Peを生成し、出力部19に与える。出力部19は誤差符号Peを主符号Im及び必要に応じて係数符号Icをパケット化し、出力端子21より出力する。
【0059】
復号化装置40においては入力部42よりの分離された誤差符号Peは復号・配列逆変換部45で復号化され、等位ビット列が得られ、それら等位ビット列の1フレーム分が振幅ビット列に配列変換され、予測誤差信号が再生される。この予測誤差信号から予測合成部56で予測合成により誤差信号が再生される。この予測合成部56は符号化装置10の予測誤差生成部31の構成と対応したものとされる。すなわち予測誤差生成部31が図10Aに示した構成をとる場合の復号化装置40における予測合成部56は、例えば図11Aに示すように、線形予測部56Aと、加算部56Bと、予測分析部56Cと、整数化部56Dとから構成されている。
【0060】
線形予測部56Aで生成した予測信号と加算部56Bよりの再生誤差信号との誤差のパワーが最小になるように予測分析部56Cにより予測係数が決定され、その予測係数が線形予測部56Aで加算部56Bよりの過去の複数の再生誤差信号サンプルに対し畳み込み演算されて予測信号が予測信号生成部56Aより出力される。この予測信号は整数化部56Dで整数値とされ、この整数値の予測信号と復号・配列逆変換部45よりの予測誤差信号とが加算部56Bで加算されて誤差信号が再生出力される。
符号化装置10の予測誤差生成部31が図10Bに示した構成の場合の復号化装置40における予測誤差生成部56は、例えば図11Bに示すように、予測信号生成部56Aと、加算部56Bと、整数化部56Dと、係数復号部56Eとから構成されている。
【0061】
入力部42で分離された係数符号Icが係数復号部56Eで復号され、この復号により得られた線形予測係数が予測信号生成部56Aにおいて復号・配列逆変換部45よりの予測誤差信号に対し畳み込み演算されることにより予測信号を生成し、得られた予測信号は整数化部56Dで整数値とされこの整数値の予測信号と復号・配列逆変換部45よりの予測誤差信号とが加算部56Bで加算されて誤差信号が出力される。
このようにして再生した誤差信号のサンプリング周波数は第1サンプリング周波数F1であり、この誤差信号とアップサンプリング部44よりの第1サンプリング周波数F1の復号信号とが加算部46で加算されてディジタル信号が再生され、フレーム合成部47へ供給される。フレーム合成部47では順次フレームごとに再生されたディジタル信号をつなぎ合わせて出力端子48へ出力する。
【0062】
この構成によれば例えば入力端子11に入力されるディジタル信号のサンプリング周波数F1が96kHzの音楽信号の場合、復号化装置40に主符号Im、パケットPe、場合によっては係数符号Pcのすべての情報が入力される場合はサンプリング周波数が96kHzのディジタル信号として原信号に忠実なものを再生することができる。利用者によっては例えばサンプリング周波数が48kHzの信号で十分とする場合はダウンサンプリング部13においてサンプリング周波数を2分の1とし、その時の主符号Imを提供すれば高い圧縮率の符号として供給することができる。つまり符号化効率を高くすることができる。この場合、復号化装置40では復号部43よりの第2サンプリング周波数の復号信号を再生ディジタル信号としてフレーム合成部47へ供給すればよい。
【0063】
このように利用者の要求に応じた品質の符号化信号を提供できる。しかしダウンサンプリング部13で高域成分が除去されており、従って誤差算出部17よりの誤差信号は比較的大きなものであり、この誤差信号をそのまま配列変換・符号化部18へ供給して符号化するとその情報量が多いものとなる。しかし図9に示した第3実施例では誤差信号の予測誤差信号を生成し、これを配列変換・符号化部18へ供給しているため、かなり少ない情報量で誤差信号の成分を出力することができる。
【0064】
誤差算出部17よりのサンプリング周波数F1の誤差信号は、入力信号をダウンサンプリング部13でダウンサンプリングして周波数F1/4よりも高い成分を除去した信号を、アップサンプリング部16でもとのサンプリング周波数F1にアップサンプリングし、原入力信号から減算して生成される。その結果、低域成分が除去され、高域成分が残り、例えば図12Aに示すような高域成分が大きなスペクトル形状となる。なお、サンプリング周波数F1の誤差信号の帯域はF1/2としている。そこで図9中に破線で示すように誤差算出部17の出力側に周波数軸反転部32を挿入して周波数F1/4を中心に周波数軸を反転して、例えば図12Bに示すように低域成分が大きな誤差となるようにする。この周波数軸反転を時間領域で行うには、誤差信号のサンプルに、+1,−1と交互に極性反転する系列をかければよい。このように周波数軸反転された誤差信号を予測誤差生成部31へ供給する。
【0065】
上記周波数軸反転においては反転対象となる誤差信号e(t)の各サンプル振幅値に対して(-1)n(nはサンプル番号を示す整数値)を乗ずる。そのために、1サンプルごとの振幅値の正負符号を反転すればよい。その場合、周波数領域係数E(f)(fは周波数)が周波数軸上で反転してE(F1/2−f)となる。ここで、F1は入力信号のサンプリング周波数である。ダウンサンプル後のサンプリング周波数がF1/2であり、非可逆符号化の対象とする周波数帯域が0からF1/4までであれば、誤差信号の高域(F1/4からF1/2)は非可逆圧縮の影響を受けないため、周波数軸反転を受けた誤差信号成分は低域(0からF1/4)が主となる。そのため、高域成分がランダム性に寄与しにくい低域成分に変換される。これを線形予測した予測誤差を可逆圧縮することにより圧縮効率が向上する。ここで可逆圧縮符号化による可逆圧縮符号を出力する。線形予測による線形予測係数は量子化して、対応する予測係数符号を出力する。
【0066】
復号化装置40においては破線で示すように予測合成部56の後段に周波数軸反転部57を挿入して上述の周波数軸反転部32と同じ手法で周波数軸の反転を時間領域で行い、例えば図12Bに示した誤差信号スペクトルを図12Aに示す誤差信号スペクトルに変換し、つまり符号化装置10の誤差算出部17よりの誤差信号と同様な誤差信号として加算部46へ供給する。
【0067】
即ち、復号側においては入力した可逆圧縮符号Peを復号・配列逆変換部45で可逆復号して予測誤差Speを復号し、入力部42で分離した予測係数符号Icを係数復号部56Eで対応する予測係数LPCを再生する。予測誤差を再生した予測係数LPCで線形予測して予測信号を求め、この予測信号を時間軸反転部57で反転して誤差信号を再生する。周波数軸反転においては、やはり反転対象となる予測信号p(t)の各サンプル振幅値に対して(-1)n(nはサンプル番号を示す整数値)を乗ずる。そのために、1サンプルごとに振幅値の正負符号を反転すればよい。周波数領域係数P(f)(fは周波数)が周波数軸上で反転してP(F1/2−f)となる。その場合、予測信号は低域(0からF1/4)が主となるため、周波数軸反転によって得られた誤差信号は高域(F1/4からF1/2)が主となる。
このようにサンプリング周波数を高くした誤差信号を周波数軸反転して予測誤差信号を生成する場合は周波数軸反転を行わない場合よりも性能がよくなることが実験的に確認された。
【0068】
第4実施例
図13にこの発明の第4実施例を示し、図9と対応する部分には同一参照番号を付けてある。図9と異なる点は符号化装置10においては予測誤差生成部31に供給する誤差信号をダウンサンプリング部33で第3サンプリング周波数F3の誤差信号に変換し、つまりサンプリング周波数を低くして予測誤差生成部31に供給する点である。この第3サンプリング周波数F3は第2サンプリング周波数F2と等しくすることが望ましい。この場合ダウンサンプリング部33に供給する誤差信号は周波数軸反転部32で周波数軸反転して供給する。
【0069】
予測誤差生成部31においては例えば図10Bに示したように入力されたダウンサンプリング部33よりの誤差信号を予測分析部31Aで線形予測分析し、その線形予測係数を用いてダウンサンプリング部33よりの誤差信号を線形予測部31Cで処理して得られた予測信号を整数化部31Dで整数値とする。この場合はさらにその整数とされた予測信号をアップサンプリング部31Fで第1サンプリング周波数F1の予測信号に変換し、その第1サンプリング周波数F1の予測信号と周波数軸反転部32からの誤差信号との差が減算部31Eでとられて、予測誤差信号として配列変換・符号化部18へ供給される。
【0070】
復号化装置40においては予測合成部56の構成が変更され、復号・配列逆変換部45よりの第1サンプリング周波数F1の再生予測誤差信号はダウンサンプリング部56Fで第3サンプリング周波数F3の予測誤差信号に変換され、この信号は係数復号部56Eで復号された線形予測係数と予測信号生成部56Aで畳み込み演算されて予測信号が生成され、これが整数化部56Dで整数値とされる。この整数の予測信号はアップサンプリング部56Gで第1サンプリング周波数F1の予測信号に変換され、加算部56Bで復号・配列逆変換部45よりの再生予測誤差と加算されて誤差信号とされる。この誤差信号は周波数軸反転部57で周波数軸反転されて加算部46へ供給される。
【0071】
符号化装置10の予測誤差生成部31としては図10Aに示したものを用いてもよく、その場合は、アップサンプリング部31Fが整数化部31Dの出力側に設けられることは当然のことである。またこの変更を行った場合は復号化装置40の予測合成部56は図11Aに示す構成を用い、かつこれにダウンサンプリング部56Fが予測信号生成部56Aの信号入力側に設けられ、アップサンプリング部56Gが整数化部56Dの出力側に設けられることになる。
このように予測誤差信号の生成を誤差信号のサンプリング周波数を低くして行うことにより、誤差信号は低域成分つまり図12Bに示した誤差信号中の主としてレベルの大きな成分のみとなり、この帯域の狭い信号の予測誤差信号を作るため、それだけ演算処理量が少なくあるいは求めた予測信号の精度は高いものとなる。
【0072】
上述した各実施例において符号化装置10、復号化装置40はそれぞれコンピュータにより符号化プログラム、復号化プログラムを実行させて機能させることもできる。これらの場合は、そのコンピュータのプログラムメモリに、可逆符号化プログラム、可逆復号化プログラムを、CD−ROM、可撓性磁気ディスクなどから、又は通信回線を通じてダウンロードして利用することになる。
以上述べたようにこの発明の第3及び第4実施例によれば、主符号Imを正しく復号できかつ正しく誤差信号を再生できればサンプリング周波数の高い高帯域の高品質な信号を再生することができ、誤差信号が得られなかったり、良好に再生することができない場合でも、主符号の復号により、比較的高い品質の信号を再生することが出来る。利用者によってはそれほど高品質の信号を要求しない場合は主符号Imのみを提供することによって符号化効率を向上させることができる。しかも超高品質の信号を要求する利用者には誤差信号をも提供することにより、要求を満たすことができるが、その際に誤差信号を予測誤差信号として提供することにより符号化効率を高くすることができる。
【0073】
第5実施例
2次元階層化
前述した第1から第4実施例では、入力ディジタル信号をそれより低いサンプリング周波数にダウンサンプリングした信号の符号(主符号Im)と、その符号化による原音信号との誤差を表す、原音信号と同じサンプリング周波数の誤差符号Peを出力し、利用者は必要とする品質に応じて主符号Imのみを復号に使用するか、主符号Imと誤差符号Peの両方を復号に使用するかを選択可能にした例を示した。即ち、これらの実施例は、符号化する信号としては2階層化されたサンプリング周波数の信号を使用した場合を示す。
【0074】
以下この第5実施例では、信号を、そのサンプルのM種類の振幅分解能(振幅語長あるいは量子化精度とも呼び、ビット数で表す)と、N種類のサンプリング周波数(サンプリングレート)との組み合せでM×Nの2次元階層化し、全ての階層のディジタル信号の符号化及び生成を可能とする。このディジタル信号の2次元的階層符号化の場合の符号化ディジタル信号の組み合せ例を図14Aに示す。この例ではM=3種類の振幅語長16ビット、20ビット、24ビットと、N=3種類のサンプリング周波数48kHz, 96kHz, 192kHzにより3×3階層化した場合を示す。図14Aにおいてサンプルワードの最上位ビットMSBを基準として下方向に振幅語長(ビット数)を示し、横方向にサンプリング周波数を示している。
【0075】
図14Bに示すように振幅語長が24ビットのディジタル信号中の下位8ビットを除いた上位16ビットについて、サンプリング周波数が48kHzで符号化した符号Aと、符号Aにより符号化された成分以上の周波数成分についてサンプリング周波数96kHzで符号化した符号Bと、更に符号Bにより符号化された成分以上の周波数成分についてサンプリング周波数192kHzで符号化した符号Cとに階層化される。
16ビット語長に対し更に下位4ビットが付加された20ビット語長の信号については、その下位4ビットの成分、つまり20ビット語長信号から16ビット語長成分を差し引いた残差成分について、サンプリング周波数48kHz、96kHzと192kHzの残差信号をそれぞれ符号化した符号D,E,Fに階層化する。20ビット語長に対し更に下位4ビットが付加された24ビット語長信号については、その下位4ビットの成分、つまり24ビット語長信号から20ビット語長成分を差し引いた残差成分について、サンプリング周波数48kHz、96kHz、192kHzの残差信号をそれぞれ符号化した符号G,HとIに階層化する。つまり16ビット以上の語長の信号に対し、符号の階層化は各サンプリング周波数ごとに行う。
【0076】
このように振幅語長(振幅分解能,量子化精度)とサンプリング周波数との二次元階層的9種類の符号化条件により符号化された符号A〜Iを用いることにより、3種類の振幅語長と3種類のサンプリング周波数の組み合せの全てである9種類のディジタル信号を出力することができる。一般に、M種類の振幅語長とN種類のサンプリング周波数の組み合わせによりM×N種類に階層化されたディジタル信号を生成することができる。つまり各サンプリング周波数と振幅語長との各組み合せについて図15に示す符号を用いればよい。例えば、サンプリング周波数96kHz、振幅語長24ビットの場合、符号AとBとEとHを用いればよい。
【0077】
次にこれら符号A〜Iを作る符号化方法を図16に示す機能構成を参照して説明する。以下の実施例の説明においては、M種類の振幅分解能に対し、分解能が低いものから順に第1、第2、…、第M振幅分解能と呼び、それらのうちの任意の1つを第m振幅分解能と呼ぶ。mは1≦m≦Mの範囲の整数である。同様に、N種類のサンプリング周波数に対し、周波数が低いものから順に第1、第2、…、第Nサンプリング周波数と呼ぶ。nは1≦n≦Nの範囲の整数である。更に、第m振幅分解能で、第nサンプリング周波数のディジタル信号を第m,nディジタル信号と呼ぶ。
【0078】
符号A〜Iを作るに必要とするサンプリング周波数と振幅語長の組み合せのそれぞれ原音の第m,nディジタル信号Sm,nが第m,n音源60m,n に格納されているとするm=1, 2, 3であり、第m振幅語長(量子化精度)と対応し、この例ではm=1は16ビット、m=2は20ビット、m=3は24ビットの場合であり、n=1, 2, 3であり、第nサンプリング周波数(サンプリングレート)と対応し、この例ではn=1は48kHz、n=2は96kHz、n=3は192kHzである。
ある条件のディジタル信号が用意されていない場合は、その上位のディジタル信号から作成する。少くとも第3,3ディジタル信号S3,3、つまり振幅語長が24ビット、サンプリング周波数が192kHzのディジタル信号音源603,3 が用意され、この第3,3ディジタル信号S3,3から、ダウンサンプリングや下位ビット(この例では下位4ビット又は8ビット)の切り捨てなどにより、他の音源60m,n (m≠3、n≠3)のディジタル信号を生成する。
【0079】
第1,1音源601,1 よりの第1,1ディジタル信号S1,1は第1,1圧縮部611,1 により圧縮符号化され、第1,1符号Aが生成出力される。また第1,1ディジタル信号S1,1は精度変換部621,1 でその第1量子化精度がこれよりも高い第2量子化精度に精度変換される。例えば第1,1ディジタル信号S1,1が符号絶対値表現の場合その下位に0が所定ビット数、この例では4ビット付加され、第2,1音源602,1 の第2,1ディジタル信号S2,1と同一量子化精度(同一振幅語長)の第2,1精度変換信号とされる。第2,1音源602,1 よりの第2,1ディジタル信号S2,1は第2,1減算部632,1 でこの第2,1精度変換信号が減算され、第2,1誤差信号Δ2,1が生成され、この第2,1誤差信号Δ2,1が第2,1圧縮部612,1 で圧縮符号化されて第2,1符号Dが生成出力される。
【0080】
また第1,1ディジタル信号S1,1は第1,1アップサンプリング部641,1 により、そのサンプリング周波数が第1サンプリング周波数より高い第2サンプリング周波数の第1,2アップサンプリング信号に変換生成される。この例ではサンプリング周波数が48kHzから96kHzに変換される場合であり、例えば図17Aに示すように第1,1ディジタル信号S1,1の実線で示すサンプル列における各隣接サンプル間の真中に破線で示すサンプルが挿入される。これら破線で示すサンプルが、原信号を第2サンプリング周波数でサンプリングし、第1振幅語長のディジタル信号とした場合のサンプルになるべく近いものとなるようにする。例えば図17Bに示すように、第1,1ディジタル信号S1,1をそのサンプリング周期で遅延部D1,D2により順次遅延し、これらの各入力サンプルと遅延部D2の出力サンプルにそれぞれ乗算部641, 642, 643で重みW1,W2,W3を乗算し、これら乗算結果を加算部644で加算して挿入するサンプルUS1を得る。つまり第1,1ディジタル信号S1,1に対し、例えば図17Bに示す補間フィルタにより線形補間を行って第1,2アップサンプリング信号US1を生成する。
【0081】
第1,2音源601,2 よりの第1,2ディジタル信号S1,2は第1,2減算部631,2 において第1,2アップサンプリング信号US1が差し引かれ、第1,2誤差信号Δ1,2が生成される。この第1,2誤差信号Δ1,2は第1,2圧縮部611,2 により圧縮符号化され、第1,2符号Bが生成、出力される。
符号Eは、第1,2音源601,2からの第1,2ディジタル信号S1,2の下位に4ビットの"0"を第1,2精度変換部621,2により付加することで振幅語長が20ビットの第2,2精度変換信号を生成し、その第2,2精度変換信号を第2,2減算器632,2において第2,2音源602,2からの第2,2ディジタル信号S2,2から減算して第2,2誤差信号Δ2,2を生成し、その第2,2誤差信号Δ2,2を第2,2圧縮部612,2により圧縮符号化することにより得られる。
【0082】
符号Hは、第3,2音源603,2からの第3,2ディジタル信号S3,2と、第2,2音源602,2からの第2,2ディジタル信号S2,2を精度変換した信号との誤差信号Δ3,2を圧縮符号化して得られる。符号Cは、第1,3音源601,3からの第1,3ディジタル信号S3,1と、第1,2音源601,2からの第1,2ディジタル信号S1,2をアップサンプリングした信号US2との誤差である第1,3誤差信号Δ1,3を圧縮符号化して得られる。符号Fは第2,3音源602,3からの第2,3ディジタル信号S2,3と、第1,3音源601,3からの第1,3ディジタル信号S1,3を精度変換した信号との誤差信号Δ2,3を圧縮符号化して得られる。符号Iは、同様に第3,3音源603,3からの第3,3ディジタル信号S3,3と、第2,3音源602,3からの第2,3ディジタル信号S2,3を精度変換した信号との誤差信号Δ3,3を圧縮符号化して得られる。
【0083】
これら符号A〜Iの生成を一般的に述べる。m=1とn=1の組み合せについてのみ、第1,1音源601,1 から第1,1ディジタル信号S1,1を第1,1圧縮部611,1で圧縮符号化して、第1,1符号Aを生成する。1≦m≦M-1,1≦n≦Nの範囲のm,nの組み合わせについて、第m,nディジタル信号Sm,nを第m量子化精度より高い第m+1量子化精度の第m+1,n精度変換信号に第m,n精度変換部62m,nで変換生成し、第m+1,n音源60m+1,n よりの第m+1,nディジタル信号Sm+1,nから第m+1,n精度変換信号を第m+1,n減算部63m+1,n で減算してその残りを第m+1,n誤差信号Δm+1,nとし、その第m+1,n誤差信号Δm+1,nを第m+1,n圧縮部61m+1,n で圧縮符号化して第m+1,n符号を生成する。
【0084】
またm=1, 1≦n≦N-1の範囲のm,nの組み合わせについて、第m,nディジタル信号を第nサンプリング周波数より高い第n+1サンプリング周波数に第m,nアップサンプリング部64m,n でアップサンプリングして第m,n+1アップサンプリング信号を生成し、第m,n+1音源60m,n+1 よりの第m,n+1ディジタル信号から第m,n+1アップサンプリング信号を第m,n+1減算部63m,n+1 で減算し、その残りを第m,n+1誤差信号Δm,n+1として得、この第m,n+1誤差信号Δm,n+1を第m,n+1圧縮部61m,n+1 で圧縮符号化して、第m,n+1符号を生成する。
第1,1ディジタル信号S1,1はエネルギーの偏りが大きいので、第1,1圧縮部611,1 としては予測符号化や変換符号化、あるいは高圧縮の符号化と組み合せた圧縮符号化が可能である。その具体的例として、変圧縮が可能な可逆圧縮符号化器の例を図18Aに示す。この技術は例えば日本国特許出願公開2001-144847に示されている。
【0085】
図18Aに示すように、符号化器61では、入力ディジタル信号の時系列が、フレーム分割部61Aで、例えば1024個のディジタル信号(即ち、1024点のサンプル)からなるフレーム単位に順次分割され、このフレーム単位ごとにディジタル信号が非可逆量子化部61Bで非可逆圧縮符号化される。この符号化は、復号化時に元のディジタル入力信号をある程度再現できる方式であれば、入力信号に適した如何なる方式でもよい。例えば、前述のように上記ディジタル入力信号が音声であればITU-Tの音声符号化などが利用でき、音楽であればMPEG-4 AUDIOのオプションであるTwinVQなどが利用でき、その他、各種非可逆符号化法を用いることもできる。この非可逆圧縮符号I(n)は逆量子化部61Cで局部復号され、この局部信号と元のディジタル信号との誤差信号が差回路61Dで生成される。ただし、例えば図1の局部復号部15について説明したと同様に、非可逆量子化部61Bにおいて非可逆量子化を行うことにより得られる量子化信号を用いて誤差信号を得ることができるので、逆量子化部61Cは省略できる。この誤差信号は非可逆量子化部61Bによる量子化誤差を表しており、その振幅は通常は元のディジタル信号の振幅よりもかなり小さい。よって、ディジタル信号を可逆圧縮符号化するよりも、量子化誤差信号を可逆圧縮符号化する方が情報量を小さくできる。
【0086】
この可逆圧縮符号化の効率を更に上げるために、誤差信号即ち、ディジタルのサンプル列を配列変換部61Eで配列変換する。この配列変換部61Eの処理は図5で説明したものと同様である。ただし、ここではサンプルの有効桁を検出せず、全ビットの配列変換を行う場合について示している。差回路61Dからの量子化誤差信号のそれぞれのサンプルの同じビット位置毎に、つまりMSB,第2MSB,…,LSBそれぞれについて毎に、サンプルを跨いだ、フレーム内のビットを抽出して等位ビット列とし、可逆符号化部61Fで可逆圧縮符号化して符号I(e)を、非可逆量子化部61Bによる量子化符号I(n)と共に出力する。
【0087】
第1,2圧縮部611,2 、第1,3圧縮部611,3 としては、第1,2誤差信号Δ1,2、第1,3誤差信号Δ1,3は周波数帯域の上半分にしかエネルギーがないので信号を予測したり、図18A中の配列変換部61Eでの処理のような変換を行った後、圧縮符号化してもよい。圧縮部612,1 ,613,1 ,612,2 ,613,2 ,612,3 及び613,3 は例えば図18A中の符号化器から非可逆量子化部61B、逆量子化部61C及び差回路61Dを除いた符号化器、つまり図19Aに示す可逆符号化器61を用いることができる。これら圧縮部612,1 ,613,1 ,…,612,3 ,613,3 に入力される誤差信号が十分小さい場合は、雑音に近くなり、大きな圧縮は期待できないので、このフレームにおいては0のみを表わす符号に圧縮符号化してもよい。
【0088】
第1,1アップサンプリング部641,1 、第1,2アップサンプリング部641,2 において用いる補間フィルタのタップ数(図17B中の乗算部の数、図17Bの例では3)が復号化側で予め知られていない場合は、そのタップ数を表わす補助情報を、図16中に破線で示すように補助情報符号化部651,2 ,651,3 で第1,2補助符号、第1,3補助符号として、それぞれ第1,2符号、第1,3符号と関連付けて出力する。この補間フィルタのタップ数と補助符号の例を図20Aに示す。補間フィルタのタップ数は、復号側において高精度の復号を行う場合には大きな値を選択し、それほど高精度の復号を要求してない場合は小さな値を選択する。タップ係数は固定でもよく、その場合補助符号を送る必要はない。
【0089】
次に図16の符号化装置と対応する復号化装置を図21を参照して説明する。第1,1符号A、第2,1符号D、第3,1符号G、第1,2符号B、第2,2符号E、第3,2符号H、第1,3符号C、第2,3符号F及び第3,3符号Iはそれぞれ第1,1伸張部801,1 、第2,1伸張部802,1 、第3,1伸張部803,1 、第1,2伸張部801,2 、第2,2伸張部802,2 、第3,2伸張部803,2 、第1,3伸張部801,3 、第2,3伸張部802,3 及び第3,3伸張部803,3 に入力されて、それぞれ伸張復号が行われる。それにより第1,1ディジタル信号S1,1及び誤差信号Δ2,1、Δ3,1、Δ1,2、Δ2,2、Δ3,2,、Δ1,3、Δ2,3、Δ3,3が得られる。なおm=1,n=1以外の第m,n伸張部80m,n においては第m量子化精度、第nサンプリング周波数の第m,n誤差信号Δm,nが伸張復号化される。これら第m,n伸張部80m,n は対応する第m,n圧縮部61m,n で圧縮符号化された第m,n符号を伸張復号化する構成とされている。
【0090】
1≦m≦M-1、1≦n≦Nの範囲のm,nの組について、第m,n伸張部80m,n により伸張復号された第m量子化精度、第nサンプリング周波数の第m,nディジタル信号Sm, nは、第m,n精度変換部81m,n でその量子化精度(振幅語長)が第m+1量子化精度の第m+1,n精度変換信号に変換生成され、この第m+1,n精度変換信号が、第m+1,n伸張部80m+1,n よりの伸張復号化された第m+1,n誤差信号Δm+1,nに第m+1,n加算部82m+1,n で加算されて第m+1量子化精度(振幅語長)、第nサンプリング周波数の第m+1,nディジタル信号Sm+1,nが再生される。
例えば、第1,1伸張部801,1 よりの伸張復号化された第1,1ディジタル信号S1,1は第1,1精度変換部811,1 で下位に0が4ビット付加され、振幅語長が20ビットとされた第2,1精度変換信号が生成される。この第2,1精度変換信号は、第2,1伸張部802,1 よりの伸張復号化された第2,1誤差信号Δ2,1と第2,1加算部822,1 で加算されて第2,1ディジタル信号S2,1が再生される。
【0091】
またm=1, 1≦n≦N-1の範囲のm,nの組について、第1,n伸張部801,n よりの第1,nディジタル信号S1,nは第1,nアップサンプリング部831,n で第n+1サンプリング周波数の第1,n+1アップサンプリング信号に変換生成され、この第1,n+1アップサンプリング信号は第1,n+1伸張部801,n+1 よりの第1量子化精度、第n+1サンプリング周波数の第1,n+1誤差信号Δ1,n+1に第1,n+1加算部821,n+1 で加算されて、第1量子化精度、第n+1サンプリング周波数の第1,n+1ディジタル信号S1,n+1が再生される。
例えば、第1,1伸張部801,1 からの伸張復号化された第1,1ディジタル信号S1,1は第1,1アップサンプリング部831,1 でその第1サンプリング周波数が第2サンプリング周波数に変換された第1,2アップサンプリング信号に変換される。この第1,2アップサンプリング信号は第1,2伸張部801,2 よりの伸張復号化された第1,2誤差信号Δ1,2に、第1,2加算部821,2 で加算されて、第1,2ディジタル信号S1,2が再生される。
【0092】
アップサンプリング部831,1 ,831,2 に用いる補間フィルタのタップ数が予め知られていない場合は、それぞれ第1,2符号B、第1,3符号Cと関連付けて入力される第1,2補助符号、第1,3補助符号がそれぞれ補助符号復号化部851,2 ,851,3 により補助情報としてのタップ数が復号され、各タップ数が対応するアップサンプル部831,1 ,831,2 に設定される。
第1,1伸張部801,1 は図16の符号化装置における第1,1圧縮部611,1 と対応したものが用いられ、例えば圧縮部611,1 として図18Aに示す符号化器61が用いられた場合は、伸張部801,1 として図18Bに示す復号化器80が用いられる。
【0093】
復号化器80では、可逆復号化部80Aで可逆圧縮符号I(e)が復号化され、その復号信号に対し、配列逆変換部80Bで符号化器61における配列変換部61Eと逆の処理(例えば図5A、5Bで説明した処理と逆の等位ビット列から振幅ビット列に配列変換する処理)が行われ、量子化誤差信号がフレーム単位で順次再生される。また、逆量子化部80Bで、非可逆圧縮符号I(n)が復号化され、この復号信号と再生された量子化誤差信号とが加算部80Dで加算され、最後に、フレーム合成部80Fでフレームごとの各加算信号が順次連結されて、元のディジタル信号系列が再生される。
【0094】
つまり第1,1符号A中の可逆圧縮符号I(e)を可逆復号し、その復号ビット列からフレーム中の対応ビット位置よりなるビット列の符号絶対値表現した複数のサンプルを、そのフレームの量子化誤差信号として再生し、第1,1符号A中の非可逆圧縮符号I(n)を非可逆復号して局部再生信号を生成し、この再生信号と前記量子化誤差信号を加算して第1,1ディジタル信号S1,1を再生する。
伸張部801,2 ,801,3 はそれぞれ圧縮部611,2 ,611,3 の符号化方法と対応した復号化方法を使用し、予測復号化法又は変換復号化法などを用いることができる。他の伸張部も対応する圧縮部で用いる符号化方法に対する復号化方法を用いる。圧縮部が図19Aに示した構成の場合、その伸張部としては図18Bの復号化器80から逆量子化部80C、加算部80Dを除去した構成、つまり図19Bに示す構成のものとする。
【0095】
図16に示した符号化装置の構成によれば、各種の振幅分解能(振幅語長)と各種のサンプリング周波数(サンプリングレート)の組み合せをもつ各種のディジタル信号を、2次元階層として統一的に符号化することができ、しかも全体として高い能率で圧縮符号化でき、利用者の要求する各種組み合せのディジタル信号を、少ないデータ量で提供することができる。
図21に示した復号化装置の構成によれば、図16に示した符号化装置により符号化された符号から、量子化精度とサンプリング周波数の各種組み合せのディジタル信号中の所望とするものを統一的に復号化することができる。
【0096】
なお利用者によっては必ずしも図16中に示す全ての組み合せの第m,nディジタル信号Sm,nを必要としない。図21に示した復号化装置中の符号AとBを復号するための第1,1伸張部801,1 、第1,1アップサンプリング部831,1 、第1,2伸張部801,2 、第1,2加算部821,2と、符号D又はE又はCとFを復号するための第1,1精度変換部811,1 、第2,1伸張部802,1 及び第2,1加算部822,1 又は第1,2精度変換部811,2 、第2,2伸張部802,2 及び第2,2加算部822,2 又は第1,2アップサンプリング部831,2 、第1,3伸張部801,3 、第1,3加算部821,3 、第1,3精度変換部811,3 、第2,3伸張部802,3 及び第2,3加算部822,3 とを少くとも備えたものでもよい。
【0097】
図16及び21に示した各実施例において、量子化精度の種類の数M、サンプリング周波数の種類の数Nは各3に限らず、Mの数を増減して、階層化の数を増やしても、減らしてもよい。同様にNについても階層化の数を増やしても、減らしてもよい。
第6実施例
図16中の量子化精度とサンプリング周波数の各種組み合せの第m,nディジタル信号Sm,nの音源60m,nは先に述べたように予め用意されたものであり、各音源のディジタル信号は第m,nディジタル信号を単純にダウンサンプリングと下位ビット切り捨てを行ったものと異なり、その作成者の好みによって、雑音(固定ディザ信号)を加えたりすることがあり、また振幅やサンプリング(標本点位置)のずれなどの種々の変換や調整が行われている可能性がある。この変換や調整はどのようなものであるか、一般的には事前に知られていない。
【0098】
そこでこの第6実施例では図16の符号化装置において、下位の振幅分解能または下位のサンプリング周波数のディジタル信号を精度変換部62m,nまたはアップサンプリング部64m,nにより上位の振幅分解能(量子化精度、振幅語長)または上位のサンプリング周波数のディジタル信号に変換して減算部63m+1,n(または63m,n+1)に与える際に、減算部63m+1,n(または63m,n+1)の出力誤差信号Δm+1,n(またはΔm,n+1)ができるだけ小さくなるように調整部66が設けられる。
例えば図22に示すように、音源60m,nからの第m,nディジタル信号は精度変換部62m,n において前述したように、第m量子化精度(振幅語長、振幅分解能)が第m+1量子化精度に変換され、この第m+1,n精度変換信号は、この例では調整部66の利得調整部66Aによりレベル調整され、更にそのレベル(利得)調整された第m+1,n精度変換信号はタイミング調整部66Bでサンプル位置が調整され、そのサンプル位置調整された第m+1,n精度変換信号により第m+1,nディジタル信号に対し減算部63で減算が行われる。
【0099】
この減算部63よりの減算結果である第m+1,n誤差信号Δm+1,nは誤差最小化部66Cへ分岐入力され、誤差最小化部66Cは第m+1,n誤差信号Δm+1,nの圧縮後の情報量が最小となるように利得調整部66Aにけるレベル調整量、タイミング調整部66Bにおけるサンプル位置調整量を制御する。そのためには、誤差信号を圧縮符号化し、得られた誤差符号の情報量を比較すればよい。情報量の比較を近似する簡単な1つの方法として誤差信号のパワーを比較し、パワーが最小となるように利得とサンプル位置を決めてもよい。以下の実施例においても誤差信号のパワーを最小とする例で説明する。例えば、レベル調整量及びサンプル位置調整量はそれぞれ複数の予め決めた値を誤差最小化部66C内の図示してない記憶部に例えば図20B,20Cに示すようにそれらの値を示す補助符号と対応して表として格納しておき、これらの値から誤差信号Δm+1,nのパワーが最小となるものをそれぞれ1つずつ選択する。選択したレベル調整量及びサンプル位置調整量を表す補助符号が出力される。予め決めたレベル調整量とサンプル位置調整量は別々の表としてでなく、これらの値の組を1つの表としてそれぞれの組を補助符号に対応させて格納してもよい。
【0100】
この誤差信号のパワー最小化が達成されると、第m+1,n圧縮部61m+1,n に対し圧縮指示信号を出力して、第m+1,n圧縮部61m+1,n は第m+1,n誤差信号Δm+1,nの圧縮符号化を行う。また誤差最小化部66Cはその時のレベル調整量とサンプル位置調整量表す補助符号を補助符号生成部69へ供給し、補助符号生成部69は入力されたレベル調整量とサンプル位置調整量の補助符号を連結して、第m+1,n補助符号として第m+1,n符号と関連づけて出力する。
同様に、図22中に破線で示し、かつ括弧書きで示すように、第m,nディジタル信号をアップサンプリング部64m,n でそのサンプリング周波数を第n+1サンプリング周波数にアップサンプリングし、これにより生成された第m,n+1アップサンプリング信号が先の場合と同様に利得調整部66Aでレベル調整され、更にタイミング調整部66Bでサンプル位置が調整されて、減算部63へ供給され、減算部63で第m,n+1ディジタル信号Sm,n+1より第m,n+1アップサンプリング信号が減算され、その第m,n+1誤差信号Δm,n+1のパワーが最小となるように、誤差最小化部66Cにより利得調整部66A、タイミング調整部66Bがそれぞれ調整される。その最小化された第m,n+1誤差信号Δm,n+1が第m,n+1圧縮部61m,n+1 で圧縮され、その時の選択された利得と調整サンプルに位置量に対応する補助符号が補助符号生成部65で符号化され、第m,n+1補助符号として第m,n+1符号と関連付けて出力される。第m,nアップサンプリング部64m,n の補間フィルタのタップ数を出力する場合は、補助情報符号化部65で補間フィルタのタップ数も第m,n+1補助符号として符号化される。
【0101】
補助符号と調整利得との対応例を図20Bに、補助符号と調整サンプル位置量(サンプル点移動量)との対応例を図20Cにそれぞれ示す。これら補助符号は例えば図20Dに示すように、補助情報の有無を示す有無符号C11、利得符号C12、移動量符号C13、タップ数符号C14の順に配列され、第m,n+1補助符号とされる。図22において利得調整部66Aとタイミング調整部66Bとを入れ替えてもよい。つまり利得調整と時間ずれ調整の順は何れを先に行ってもよい。あるいは、利得調整部66A、タイミング調整部66Bのいずれか一方を省略してもよい。また、誤差最小化部66Cにおけるこのような補助符号の生成はフレームごとに行ってもよい。なお例えば第m,nディジタル信号に固定ディザ信号が付加され、これが予め知られている時は、その固定ディザ信号を第m+1,n精度変換信号又は第m,n+1アップサンプリング信号から引き算して減算部63m,n+1(又は63m,n+1)へ供給し、またその固定ディザ信号を符号化して第m+1,n補助符号として出力する。
【0102】
上述したように符号化装置において、下位ディジタル信号、具体的には例えば第m+1,n精度変換信号を調整した場合、復号化装置において調整部を設け、補助符号を復号したその補助情報に基づいて同様に精度変換信号を調整する必要がある。その場合の例を、図23に示す。これは、第m,nディジタル信号に対する精度変換信号を調整部87により調整する場合で、第m+1,n符号と関連付けられた第m+1,n補助符号が補助情報復号部88で復号され、得られた補助情報、この例では調整利得とサンプル位置量が生成され、これが調整部87の変形制御部87Cへ供給される。
【0103】
一方伸張復号化された第m,nディジタル信号が第m,n精度変換部81m,n で第m+1量子化精度の第m+1,n精度変換信号に変換生成されるが、この第m+1,n精度変換信号は調整部87の利得調整部87A、タイミング調整部87Bを順次経て加算部82m+1,nへ供給されるように構成される。利得調整部87Aに復号された利得が変形制御部87Cにより設定され、またタイミング調整部87Bに、復号されたサンプル位置量に応じた遅延時間が変形制御部87Cにより設定される。従って第m+1,n精度変換信号は、符号化装置における対応する利得調整部66A、タイミング調整部66B(図22)でそれぞれ調整されたレベル、調整されたサンプル位置とそれぞれ同一レベル、同一サンプル位置とされ、つまり符号化側と同一の変形が行われる。このようにレベル及びサンプル位置が調整された第m+1,n精度変換信号が第m+1,n伸張部80m+1,n よりの復号された第m+1,n誤差信号Δm+1,nに加算部82m+1,nで加算される。従って加算部82m+1,nからの再生第m+1,nディジタル信号Sm+1,nは、符号化装置における第m+1,n音源60m+1,n の第m+1,nディジタル信号Sm+1,nと同一のものとなる。
【0104】
再生された第m,nディジタル信号をアップサンプリングしたものを利用して第m,n+1ディジタル信号を再生する場合も、第m,n+1符号と関連する第m,n+1補助符号が入力される場合は図23中に破線、及び括弧書きで示すように再生第m,nディジタル信号がアップサンプリング部83m,n で第n+1サンプリング周波数の第m,n+1アップサンプリング信号に変換生成されるが、この第m,n+1アップサンプリング信号は利得調整部87A、タイミング調整部87Bを順次通されて加算部82m,n+1へ供給される。第m,n+1補助符号が補助情報復号部88で復号され、その復号された調整利得、サンプル位置量に応じた利得、遅延時間が変形制御部87Cにより利得調整部87A、タイミング調整部87Bにそれぞれ設定される。従ってレベル調整、サンプル位置調整された第m,n+1アップサンプリング信号が伸張復号化された第m,n+1誤差信号Δm,n+1に加算部82m,n+1で加算され、第m,n+1ディジタル信号Sm,n+1が再生される。
【0105】
利得調整部87Aとタイミング調整部87Bとを入れ替えてもよい。利得調整部87A、タイミング調整部87Bの一方は省略されることもある。補助符号の復号された情報として固定ディザ信号があれば、これを第m+1,n精度変換信号又は第m,n+1アップサンプリング信号から引き算する。
図22に示した符号化装置、また符号化方法、図23に示した復号化装置、また復号化方法はそれ自体、発明の実施例を構成し、これにより、予め用意されている量子化精度とサンプリング周波数の各種組み合せの少くとも二つの音源のディジタル信号に対する効率がよくかつ精度が高い可逆圧縮符号化が可能であり、またその符号を高い精度で可逆復号化することができる。
【0106】
図22に示した符号化装置、符号化方法を図16に示した符号化装置、符号化方法のように、量子化精度とサンプリング周波数の二次元の多階層的構成とすることもできる。同様に図23に示した復号化装置、復号化方法を図21に示したように二次元の多階層的構成とすることもできる。
図16、図22にそれぞれ示した符号化装置、また図21、図23にそれぞれ示した復号化装置を、それぞれコンピュータにプログラムを実行させて機能させる構成としてもよい。この場合は、例えば復号化装置について云えば、CD−ROM、磁気ディスクなどの記録媒体から、又は通信回線を通して復号化プログラムをコンピュータ内にダウンロードさせ、その復号化プログラムをコンピュータに実行させればよい。
【0107】
この発明の効果の説明のため、例えば図24に示す3種類の楽音配信形態について比較する。つまり、サンプリング周波数や量子化精度(振幅分解能)の異なる要求に対応するために、サーバで、
A.この発明を適用したスケーラブル符号化により音楽信号を符号化して蓄積しておく。即ち、例えば図14Aに示した符号系列A〜Iを用意しておく。クライアント端末からの要求に応じてこれら符号を選択して組み合せてクライアント端末へ伝送する、
B.複数のサンプリング周波数及び複数の量子化精度の組み合せの各信号、例えば図16中の9種類の音源の信号に対するクライアント端末からの要求に応じた組み合わせの符号化系列を予め用意し、クライアント端末からの要求に応じてその1つを選択してクライアント端末へ伝送する、
C.最高のサンプリング周波数と最高の量子化精度の信号の圧縮符号のみを蓄積しておき、クライアント端末からの要求に応じて復号、サンプリング周波数変換、量子化精度変換、再符号化してクライアント端末へ伝送する。
【0108】
クライアント端末側では受信した符号系列を復号し、この発明を使用した形態Aでは、アップサンプリングや精度変換を行ってディジタル信号を再構成する。形態B及びCでは復号された信号を直ちに再構成する。
形態Bではサーバにおける圧縮符号列の容量が相当大きくなり、形態Cでは演算量が大きくなってしまう。この発明を使用した形態Aでは、例えば図15に示したように最高サンプリング周波数と最高振幅分解能の圧縮符号が、低いサンプリング周波数や低い振幅分解能の圧縮符号を含むので、さまざまな要求仕様に簡単に対応でき、総容量も小さくできる。
【0109】
上述においてはこの発明を音楽ディジタル信号に適用したが画像のディジタル信号に適用することもできる。
このように、第5及び第6実施例によれば、振幅の精度とサンプリングレートの要求の異なる符号化、特に可逆な符号化が統一的に実行でき、システム全体として圧縮率を高めることができる。
第7実施例
以下この発明の第7実施例を説明する。この実施例においても、例えばM種類の量子化精度として16ビット、20ビット、24ビットの3種類と、N種類のサンプリング周波数として48kHz、96kHz、192kHzの3種類の任意の量子化精度とサンプリング周波数の組み合せのディジタル信号の生成を可能とする、ディジタル信号の2次元的階層符号化を例に説明する。
【0110】
第7実施例における2次元的階層符号化のための24ビット192kHzのディジタル信号の各階層の信号への分解とその各符号の例を図25に示す。振幅語長が24ビットのディジタル信号中の下位8ビットを除いた上位16ビットについて、サンプリング周波数を48kHzとして符号化した符号Aと、符号Aにより符号化された成分より高い周波数成分についてサンプリング周波数を96kHzとして符号化した符号Bと、更に符号Bにより符号化された成分より高い周波数成分についてサンプリング周波数を192kHzとして符号化した符号Cとにサンプリング周波数方向に階層化される。
【0111】
16ビット語長に対し下位4ビットを付加した20ビット語長の信号については、その下位4ビットの成分、つまり20ビット語長信号から16ビット語長成分を差し引いた残差成分について、同様にサンプリング周波数を48kHzとして符号化した符号D、その符号Dの符号化成分より高い周波数成分についてサンプリング周波数を96kHzとして符号化した符号Eと、更に符号Eで符号化された成分より高い周波数成分についてサンプリング周波数を192kHzとして符号化した符号Fとに階層化する。20ビット語長に対し下位4ビットを含む24ビット語長信号については、その下位4ビットの成分、つまり24ビット語長信号から20ビット語長成分を差し引いた残差成分について、同様にサンプリング周波数を48kHzとして符号化した符号G、その符号Gにより符号化された成分より高い周波数成分についてサンプリング周波数を96kHzとして符号化した符号Hと、符号Hで符号化された成分より高い周波数成分についてサンプリング周波数を192kHzとして符号化した符号Iとに階層化する。
【0112】
このように振幅語長(振幅分解能,量子化精度)とサンプリング周波数との二次元階層的M×N種類の符号化条件により符号化された符号A〜Iを用いることにより、M種類の量子化精度とN種類のサンプリング周波数の組み合せの全てであるM×N種類のディジタル信号を出力することができる。つまり各サンプリング周波数と振幅語長との各組み合せについて図26に示す使用符号(1)を用いればよい。例えば、サンプリング周波数96kHz、量子化精度24ビットのディジタル信号を符号化するには、符号A,B,D,E,G,Hを用いればよい。
このようにこの実施例では量子化精度16ビット、サンプリング周波数48kHzのディジタル信号を基本に符号化し、それより階層が上位の信号については、下位の量子化精度または下位のサンプリング周波数の信号との差分信号成分を符号化しているので、第m量子化精度、第nサンプリング周波数の信号は、図26の使用符号例(1)のように単純な符号の組み合わせで表現することが可能である。
【0113】
この図25及び26に示した2次元階層符号化を行う符号化装置の機能機構を図27に示す。なお図27中の各圧縮部61m,nの入力信号は1つの原音(この例では振幅語長が24ビット、サンプリング周波数が192kHzのディジタル信号)を複数種類の量子化精度と複数種類のサンプリング周波数信号に階層的に分解した階層化信号である。
音源60よりの振幅語長が24ビットサンプリング周波数が192kHzのディジタル信号はまず、ビット分割部71で各サンプルの24ビットの振幅語長は上位16ビットと、その下位の4ビットと、更に下位の4ビットのように複数のビット区間に分割される。上位16ビットはダウンサンプル部721,3 でサンプリング周波数が96kHzにダウンサンプリングされ、その出力が、更にダウンサンプル部721,2 でサンプリング周波数が48kHzにダウンサンプリングされて、圧縮部611,1 に供給されて、可逆圧縮符号化され、符号Aが出力される。16ビットの信号として利用するときには20ビットの下4桁を単純に除くのではなく、まるめやディザという微小雑音を加える場合がある。この場合、作られた16ビット信号と20ビットの信号の誤差成分信号を分離する。振幅は4ビットではなく、5〜6ビットになることもあるが、増加したままのビット数で使用する。その他の処理は同様で以下の実施例も同様である。
【0114】
ダウンサンプル部721,2 からの出力はアップサンプル部731,1 によりサンプリング周波数が96kHzにアップサンプリングされ、そのアップサンプリング出力と、ダウンサンプル部721,3 からの出力との差分が誤差信号Δ1,2として減算部741,2 でとられ、その差分信号Δ1,2が圧縮部611,2 で可逆圧縮符号化され、符号Bが出力される。
ダウンサンプル部721,3 からの出力はアップサンプル部731,2 でサンプリング周波数が192kHzにアップサンプリングされ、このアップサンプル部731,2 の出力とビット分割部71よりの分割された16ビットの信号との差分が誤差信号Δ1,3として減算部741,3 で生成され、その誤差信号Δ1,3が圧縮部611,3 で可逆圧縮符号化されて符号Cが出力される。
【0115】
分割部71よりの信号の上位16ビットの直下位4ビットの信号はダウンサンプル部722,3 ,722,2 によりサンプリング周波数が48kHzの信号とされ、圧縮部612,1 により可逆圧縮符号化されて符号Dが出力され、ダウンサンプル部722,3 の出力と、ダウンサンプル部722,2 の出力のアップサンプル部732,1 によるアップサンプリング出力との減算部742,2 での差分を誤差信号Δ2,2として得て、その誤差信号Δ2,2を圧縮部612,2 で可逆圧縮符号化することにより符号Eを出力し、ダウンサンプリング部722,3 の出力のアップサンプリング部732,2 によるアップサンプリング出力と、ビット分割部71よりの4ビット信号の差分を減算部742,3 で誤差信号Δ2,3としてとり、その誤差信号Δ2,3を圧縮部612,3 で可逆圧縮符号化して符号Fを出力する。
【0116】
上述と同様にして、ビット分割部71からの信号のうち最下位4ビットが、ダウンサンプリング部723,3 ,723,2 、アップサンプル部733,1 ,733,2 、減算部743,2 ,743,3 、圧縮部613,1 ,613,2 ,613,3 により符号G,H,Iを生成出力する。
なお図27において各アップサンプル部は、その入力信号に対し、例えば図17A、17Bで説明した補間フィルタ処理を行う。このとき、対応する減算部74m,n+1の出力誤差信号Δm,n+1のパワーが最小となるように係数W1,W2,W3が決められる。
【0117】
例えば減算部741,3 からの出力誤差信号Δ1,3は振幅語長が16ビット、サンプリング周波数が192kHzの信号であり、帯域は96kHzであるが、振幅が小さく、特に0〜48kHzの成分はほとんど0である。このため圧縮部611,3 としては例えば図28に示す予測符号化器61を使って減算部741,3からの誤差信号を線形予測部61Aで線形予測分析し、得られた線形予測係数を量子化し、量子化値に対応する符号Icを出力するとともに、その予測係数を使って入力誤差信号の予測信号を生成する。その予測信号を整数化部61Bで整数化して減算部61Cで入力誤差信号との差分を予測誤差信号として得て、その予測誤差信号を可逆圧縮部61Dで可逆圧縮符号化することによって効率よく圧縮することができる。その他の圧縮部も同様に予測符号化などを用いて効率的に圧縮できる。
【0118】
符号化の手順として、上述ではまず量子化精度が24ビット、サンプリング周波数が192kHzの信号の各サンプルを16ビット、4ビット、4ビットの3つの信号に分割して階層化し、次にそれら各分割されたビットを量子化精度とする信号を、サンプリング周波数48kHz, 96kHz, 192kHzで階層化したが、先ずサンプリング周波数で入力ディジタル信号を階層化し、その後、各階層の誤差信号について、サンプルの振幅語長を分割してもよい。即ち例えば図29に示すように音源60よりの振幅語長が24ビット、サンプリング周波数が192kHzのディジタル信号をまずダウンサンプル部723 でサンプリング周波数96kHzにダウンサンプリングし、そのダウンサンプリングされた信号をアップサンプル部732 でサンプリング周波数192kHzにアップサンプリングする。このアップサンプリングされた信号と、音源60より原信号との差分を誤差信号Δ1として減算部741 で生成する。
【0119】
またダウンサンプル部723 からの出力をダウンサンプル部722 によりサンプリング周波数48kHzにダウンサンプリングし、このダウンサンプリングされた信号をアップサンプル部731 でサンプリング周波数96kHzにアップサンプリングする。このアップサンプリングされた信号とダウンサンプル部723 からの出力信号との差分を誤差信号Δ2として減算部742 で生成する。減算部741 ,742 からの各誤差信号、ダウンサンプル部722 の出力信号をそれぞれビット分割部711 ,712 ,713 でそれぞれ各サンプルを上位の16ビット、そのすぐ下位の4ビット、更に下位の4ビットに分割し、これら分割された信号を圧縮部で可逆圧縮符号化する。図29中の各圧縮部の図27中の圧縮部と対応するものに同一参照番号を付けてある。
【0120】
なお図29中の各圧縮部61m,nへの入力信号は1つの原音(この例では振幅語長が24ビット、サンプリング周波数が192kHzのディジタル信号)を複数種類の振幅分解能(量子化精度)と複数種類のサンプリング周波数信号に階層的に分解した階層化信号である。
第7実施例の復号化装置
図30に、第7実施例の復号化装置の機能構成を示す。これは、図27又は図29に示した符号化装置により符号化された、M種類の量子化精度、N種類のサンプリング周波数を組み合せたM×N=9種類のディジタル信号を復号化するようにした場合である。
【0121】
符号A,B,…,Iは伸張部801,1 ,801,2 ,801,3 ,802,1 ,802,2 ,802, 3 ,803,1 ,803,2 ,803,3 でそれぞれ可逆伸張復号化され、符号器の各圧縮部の入力階層化信号が得られる。各伸張部80m,nでの復号化法は、前述の図18Bに示した復号化器80の可逆復号化部80A、配列逆変換部80Bと同様の手法で行うことができる。
伸張部801,1 よりの復号信号は振幅語長が16ビット、サンプリング周波数が48kHzのディジタル信号(以下、16b,48kHzディジタル信号と書く)の再生信号S1,1として出力されると共にアップサンプル部831,1 でサンプリング周波数が96kHzにアップサンプリングされる。このアップサンプリングされた信号は伸張部801,2 よりの復号された誤差信号Δ1,2と加算部821,2 で加算されて再生16b,96kHzディジタル信号S1,2として出力される。この16b,96kHzディジタル信号S1,2はアップサンプル部831,2 でサンプリング周波数が192kHzにアップサンプリングされて、伸張部801,3 よりの復号された誤差信号Δ1,3と加算部821,3 で加算され、再生16b,192kHzディジタル信号S1,3として出力される。再生16b,48kHzディジタル信号は伸張部802,1 より復号された誤差信号Δ2,1と加算部822,1 で加算されて、再生20b,48kHzディジタル信号S2,1として出力される。
【0122】
以下、上述と同様に復号された階層化信号を組み合せて各ディジタル信号S2,2, S2,3, S3,1, S3,2, S3,3が再生される。加算部82m,nで加算する2つのサンプリング周波数が異なる場合は、低いほうのサンプリング周波数の信号をアップサンプリングによりサンプリング周波数を合せて加算する。アップサンプル部を表す参照記号83m,nの添字の右側のnは第nサンプリング周波数を第n+1サンプリング周波数にアップサンプリングすることを意味する。例えば、右側添え字n=1はサンプリング周波数を48kHzから96kHzにアップサンプリングすることを、添え字n=2はサンプリング周波数を96kHzから192kHzにアップサンプリングすることを示す。要するに、階層化された部分信号をアップサンプリングと、振幅方向のビットの連結により精度の高い信号を再構成する。
【0123】
復号側において必要とする復号信号の品質が高品質(例えば量子化精度24ビット、サンプリング周波数192kHzのディジタル信号)を必要としない場合は、必要とする品質(量子化精度とサンプリング周波数)のディジタル信号より量子化精度及びサンプリング周波数が上位の信号を省略できる。例えば最大量子化ビット数24に対し、最下位4ビットの成分の階層化信号、またはサンプリング周波数が高い信号の再生にのみ用いる階層化信号は省略できる。
例えばネットワークで伝送する場合は、各符号A,…,Iごとに別のパケットを割り当てて、階層の低い(即ちより下位の)符号に対しより高い優先度の情報を与えて出力すれば、ネットワーク資源を有効に使うことができる。例えば通常の状態ではすべての情報を伝送できるが、ネットワークの障害や混雑時には最低限符号Aだけを優先的に伝送すればよい。
【0124】
第8実施例
この発明の第8実施例は図31に示すように、16ビットの量子化精度の信号により第7実施例と同様にサンプリング周波数の階層化を実現するが、16ビット以上の量子化精度に対する階層化は各サンプリング周波数ごとに行う。つまり量子化精度20ビットの信号についてはこれから量子化精度16ビットの信号成分を差し引いた残差成分についてのサンプリング周波数48kHz,96kHz,192kHzの信号をそれぞれ符号化して符号D,E,Fを生成し、量子化精度24ビットの信号についてはこれから量子化精度20ビットの信号成分を差し引いた残差成分についてのサンプリング周波数48kHz,96kHz,192kHzの信号をそれぞれ符号化して符号G,H,Iを生成する。
【0125】
これらの符号A,…,Iを用いて、各種の振幅分解能(量子化精度)、各種のサンプリング周波数のディジタル信号を再生できる。各ディジタル信号の再生に用いる符号を図26中に使用符号(2)として示す。例えば、サンプリング周波数192kHz、量子化精度20ビットの信号は、サンプリング周波数48kHz、量子化精度16ビットの信号を符号化した符号Aと、サンプリング周波数96kHz、量子化精度16ビットの信号を符号化した符号Bと、サンプリング周波数192kHz、量子化精度16ビットの信号を符号化した符号Cとにより表す。
図31に示す第8実施例の符号化装置における音源60(603,3)からの24b,192kHzディジタル信号S3,3から図26に示す各種サンプリング周波数、振幅語長のディジタル信号を作って、符号化する場合を例として説明する。
【0126】
24b,192kHzディジタル信号S3,3はビット分割部713,3 で各サンプルごとに下位4ビットと、上位20ビットに分割され、下位4ビットの信号に圧縮部613,3 で符号Iに生成され、上位20ビットの信号はビット分割部712,3 で下位4ビットと上位16ビットに再分割され、その下位4ビットの信号は圧縮部612,3 で符号Fに生成され、上位16ビット区間の信号の減算部631,3へ供給される。
24b,192kHzディジタル信号S3,3はダウンサンプル部723,3 でサンプリング周波数96kHzの信号にダウンサンプリングされ、このダウンサンプリングされた信号はビット分割部713,2 ,712,2 で同様に順次ビット区間に分割され、最下位4ビットの信号と、次の下位4ビットの信号と上位16ビットの信号に分割され、前2者の各4ビット信号は圧縮部613,2 ,612,2 でそれぞれ符号H,Eに生成され、後者の16ビットの信号は減算部631,2 へ供給される。
【0127】
ダウンサンプル部723,2 でサンプリング周波数96kHzとされた24b,96kHzディジタル信号はダウンサンプル部723,2 で更にサンプリング周波数48kHzの信号にダウンサンプリングされ、この24b,48kHzディジタル信号はビット分割部713,1 ,712,1 で同様に順次ビット区間に分割され、最下位4ビットの信号と、次の下位4ビットの信号と、上位16ビットの信号とされ、これら2つの4ビットの信号と、16ビットの信号は圧縮部613,1 ,612,1 ,611,1 でそれぞれ符号G,D,Aに生成される。
更に16b,48kHzディジタル信号はアップサンプル部731,1 でサンプリング周波数96kHzの信号にアップサンプリングされ、このアップサンプリングされた信号と、ビット分割部712,2 の16ビットの信号との差分が誤差信号Δ1,2として減算部631,2で生成され、その誤差信号を圧縮部611,2で圧縮して符号Bが生成される。ビット分割部712,2からの16ビットの信号はアップサンプル部731,2 でサンプリング周波数192kHzの信号にアップサンプリングされ、このアップサンプリングされた信号と、ビット分割部712,3よりの16ビットの信号との差分が減算部631,3で生成され、誤差信号Δ1,3として圧縮部611,3で符号Cに符号化される。図31中の各圧縮部は、図27に示した各圧縮部と同様の手法で圧縮符号化すればよい。
【0128】
24b,192kHzの原音ディジタル信号からダウンサンプルにより生成された16b,48kHzディジタル信号S1,1は例えば音声信号や音楽信号の場合低い周波数帯にエネルギーが偏っているので、圧縮部611,1 としては予測符号化や変換符号化、あるいは高圧縮の符号化と組み合せた圧縮符号化が可能である。具体的には例えば図18Aで示した符号化器61を使用することができる。
圧縮部611,2、圧縮部611,3としてはその入力の誤差信号Δ1,2及びΔ1,3は周波数帯域0〜48kHz及び0〜96kHzの上半分24kHz〜48kHz及び48kHz〜96kHzにしかエネルギーがないので図9の実施例で説明したように、誤差信号の周波数軸を反転して予測誤差を求め、その予測誤差を圧縮符号化してもよい。あるいは、図18A中の配列変換部61Eでの処理のような変換を行った後、圧縮符号化してもよい。圧縮部612,1,613,1,612,2 ,613,2,612,3 及び613,3 は例えば図18Aの符号化器61から非可逆量子化部61B、逆量子化部61C及び差回路61Dを除いた符号化器、つまり図19Aに示す可逆符号化器61を用いることができる。これら圧縮部612,1, 613,1,…, 612,3,613,3 に入力される誤差信号が十分小さい場合は、雑音に近くなり、大きな圧縮は期待できないので、このフレームにおいては0のみを表わす符号に圧縮符号化してもよい。
【0129】
アップサンプル部731,1 、アップサンプル部731,2 において用いる補間フィルタのタップ数が復号化側で予め知られていない場合は、そのタップ数を表わす補助情報を、図31中に破線で示すように補助情報符号化部651,2,651,3でそれぞれ符号化して第1,2補助符号、第1,3補助符号として、それぞれ第1,2符号B、第1,3符号Cと関連付けて出力する。この補間フィルタのタップ数と補助符号の例は図20Aと同様である。
なお符号化すべき各ディジタル信号の音源は図31に破線ブロック602,3, 601,3,…, 601,1で示すように、それぞれ独立に存在していてもよい。その場合は、各ディジタル信号は対応するビット分割部713,3,712,3,713,2,712,2,712,1,712,1 又は減算部631,3,631,2、或いは圧縮部611,1 に供給すればよい。ディジタル信号S1,1〜S2,3のうち、音源が存在するものは、その存在音源からのディジタル信号を利用し、音源が存在しないものは、その上位のディジタル信号からビット分割部、ダウンサンプル部を使って作る。つまり図31中に破線で示すように選択部752,3 ,751,3 ,753,2 ,752,2 ,751,2 ,753,1 ,752,1 ,751,1 が設けられ、各選択部は対応するディジタル信号音源が存在すれば、そのディジタル信号を選択し、なければそのすぐ上位のビット分割部又はダウンサンプル部の信号を選択する。例えば選択部752,3 は20b,192kHzディジタル信号の音源があればそのディジタル信号を選択し、存在しなければ、ビット分割部713,3 からの上位20ビットの信号を選択してビット分割部712,3 へ供給する。選択部753,2 の場合は24b,96kHzのディジタル信号音源が存在すればその信号を選択し、存在しなければダウンサンプル部723,3 よりのダウンサンプリングされた信号を選択してビット分割部713,2 へ供給する。その他も同様である。
【0130】
なお、この符号化方法を前述と同様にM種類の量子化精度とN種類のサンプリング周波数により階層化した符号化法に一般化して説明すると、以下のようになる。
少なくとも第M量子化精度で第Nサンプリング周波数の第M,Nディジタル信号SM,Nが音源60M,Nから得られるものとする。
m=1, 2≦n≦Nの範囲のm,nの組について、入力ディジタル信号Sm,n又はディジタル信号Sm+1,nから分割して生成されたディジタル信号Sm,nと、第m,n-1ディジタル信号Sm,n-1をアップサンプルして生成した信号Sm,nとの差分を減算部63m,nで第m,n誤差信号Δm,nとして生成し、圧縮部61m,nで圧縮符号化して第m,n符号を生成する。
【0131】
m=M, 2≦n≦Nの範囲のm,nの組について、第m,nディジタル信号Sm,nをダウンサンプルして第m,n-1ディジタル信号Sm,n-1を生成する。2≦m≦M, 1≦n≦Nの範囲のm,nの組について、量子化精度m、サンプリング周波数nの第m,nディジタル信号を、量子化精度がmより低いm-1、サンプリング周波数nの第m-1,nディジタル信号Sm-1,nと、第m-1,nディジタル信号と第m,nディジタル信号との誤差である第m,n誤差信号Δm,nとに分割し、その第m,n誤差信号Δm,nを第m,n圧縮部61m,nにより可逆圧縮符号化して第m,n符号を生成する。
m=1, n=1の組について、第m+1,nディジタル信号から分割された第m量子化精度の第m,nディジタル信号Sm,n、又は入力された第m,nディジタル信号Sm,nを圧縮符号化して、第m,n符号を生成する。
【0132】
この符号化方法は符号化対象の最上位の階層の信号SM,Nの振幅分解能Mを保ったまま、まず、サンプリング周波数が第N-1, 第N-2, …, と順次下がるディジタル信号をダウンサンプルにより生成し、次にそれぞれのサンプリング周波数毎に量子化精度を階層化している。
次に図31に示した符号化装置と対応する復号化装置を図32を参照して説明する。符号A、符号D、符号G、符号B、符号E、符号H、符号C、符号F及び符号Iはそれぞれ伸張部801,1、802,1、803,1、801,2、802,2、803,2、801,3、802,3及び803,3に入力されて、それぞれ伸張復号が行われる。これら伸張部80m,nは対応する圧縮部61m,nで圧縮符号化された第m,n符号を伸張復号化する構成とされている。
【0133】
前述の実施例と同様に、例えば量子化精度24ビット、サンプリング周波数192kHzのディジタル信号を24b,192kHzディジタル信号と表記する。伸張部801,1よりの伸張復号化された16b,48kHzディジタル信号S1,1はそのまま出力されると共に精度変換部811,1で下位に0が4ビット付加され、振幅語長が20ビットとされた20b,48kHz精度変換信号が生成される。この精度変換信号は、伸張部802,1よりの伸張復号化された20b,48kHz誤差信号Δ2,1と加算部822,1で加算されて20b,48kHzディジタル信号S2,1が再生される。
伸張部801,1からの伸張復号化された16b,48kHzディジタル信号S1,1はアップサンプル部831,1でそのサンプリング周波数が96kHzに変換され、この16b,96kHzアップサンプル信号は伸張部801,2よりの伸張復号化された16b,96kHz誤差信号に、加算部821,2で加算されて、16b,96kHzディジタル信号S1,2が再生される。
【0134】
一般化して表現すると、1≦m≦M-1, 1≦n≦Nの範囲のm,nの組について、伸張部80m,nにより伸張復号された第m量子化精度、第nサンプリング周波数の第m,nディジタル信号は、精度変換部81m,nでその量子化精度(振幅語長)が第m+1量子化精度の第m+1,n精度変換信号に変換生成され、この第m+1,n精度変換信号が、伸張部80m+1,n よりの伸張復号化された第m+1,n残差信号に加算部82m+1,nで加算されて量子化精度(振幅語長)m+1、第nサンプリング周波数の第m+1,nディジタル信号Sm+1,nが再生される。
またm=1, 1≦n≦N-1の範囲のm,nの組について、伸張部80m,nよりの第m,nディジタル信号はアップサンプル部83m,nで第n+1サンプリング周波数の第m,n+1アップサンプル信号に変換生成され、この第m,n+1アップサンプル信号は伸張部80m,n+1よりの第m量子化精度、第n+1サンプリング周波数の第m,n+1誤差信号に加算部82m,n+1で加算されて、第m量子化精度、第n+1サンプリング周波数の第m,n+1ディジタル信号Sm,n+1が再生される。なおm=1,n=1以外の伸張部80m,nにおいては第m量子化精度、第nサンプリング周波数の第m,n誤差信号が伸張復号化される。
【0135】
アップサンプル部831,1,831,2に用いる補間フィルタのタップ数が予め知られていない場合は、それぞれ符号B、符号Cとそれぞれ関連付けて入力される第1,2補助符号、第1,3補助符号がそれぞれ補助符号復号化部851,2,851,3により補助情報としてのタップ数が復号され、各タップ数が対応するアップサンプル部831,1,831,2に設定される。
伸張部801,1は圧縮部611,1と対応したものが用いられ、例えば圧縮部611,1として図18Aの符号化器61が用いられた場合は、伸張部801,1として図18Bの復号化器80が用いられる。
【0136】
伸張部801,2,801,3はそれぞれ圧縮部611,2,611,3 の符号化方法と対応した復号化方法を使用し、予測復号化法又は変換復号化法などを用いることができる。他の伸張部も対応する圧縮部で用いる符号化方法に対応する復号化方法を用いる。圧縮部が図19Aに示した構成の場合、その伸張部としては図19Bに示す構成を使用する。
図31に示した構成によれば、各種の量子化精度(振幅分解能、振幅語長)と各種のサンプリング周波数(サンプリングレート)の組み合せをもつ各種のディジタル信号を、2次元階層として統一的に符号化することができ、しかも全体として高い能率で圧縮符号化でき、利用者の要求する各種組み合せのディジタル信号を、少ないデータ量で提供することができる。
【0137】
図32に示した構成によれば、図31に示した符号化装置により符号化された符号から、量子化精度とサンプリング周波数の各種組み合せのディジタル信号中の所望とするものを統一的に復号化することができる。
なお利用者によっては必ずしも図31中に示した全ての組み合せの第m,nディジタル信号を必要としない。図32に示した復号化装置において
伸張部801,1、アップサンプル部831,1、伸張部801,2、加算部821,2と、
{精度変換部811,1、伸張部802,1及び加算部822,1}及び{精度変換部811,2、伸張部802,2 及び加算部822,2}及び{アップサンプル部831,2、伸張部801,3、加算部821,3、精度変換部811,3、伸張部802,3及び加算部822,3 }の少なくとも1つの組を備えたものでもよい。
【0138】
第9実施例
この第9実施例はM種の振幅語長(量子化精度)、N種のサンプリング周波数(サンプリングレート)が組み合せられた第m,nディジタル信号を出力する音源が存在することを前提とする。ただし、いずれかの音源が存在しない場合は、図31に示した符号化装置の場合と同様に上位の階層のディジタル信号から作成してもよい。
【0139】
図33に示すように最も短かい振幅語長、この例では16ビットのディジタル信号についてはサンプリング周波数の階層化は下位のサンプリングレート、つまり低いサンプリング周波数のディジタル信号を、当該ディジタル信号と同一サンプリング周波数になるようにアップサンプリングした後、そのアップサンプリングした信号との誤差信号を符号化して符号B,Cを求め、また最もサンプリング周波数が低い、この例では48kHzのディジタル信号は例えば16ビット信号と20ビット信号の誤差信号、20ビット信号と24ビット信号の誤差信号を順次用いて符号D,Gを構成する。
【0140】
当該ディジタル信号に対し、サンプリング周波数方向でも、振幅分解能方向でも下位の信号、つまりサンプリング周波数が低い、又は振幅語長が短かい信号が存在する場合は、2種類の選択の余地がある。つまり、当該ディジタル信号と、下位のサンプリング周波数のディジタル信号との誤差及び下位の振幅語長(振幅分解能)のディジタル信号との誤差の両誤差信号を比較し、誤差信号のパワーが小さい属性の誤差信号を選択して符号化し、それとともにその選択された属性を指定する補助情報を符号化する。例えば、20b,96kHzディジタル信号S2,2に対しては精度変換部621,2で16b,96kHzディジタル信号S1,2の各サンプルの下位に0を4ビット付加した信号との誤差信号、または20b,48kHzディジタル信号S2,1をアップサンプル部642,1で96kHzにアップサンプリングした信号との誤差信号を生成し、これら誤差信号のパワーが小さい方を選択し、その誤差信号Δ2,2を圧縮部612,2で符号化して符号Eとすると共に、その選択された属性を表す補助情報を補助符号化部772,2で符号化し、符号Eと関連付けて出力する。
【0141】
あるいは当該ディジタル信号S2,2の下位のサンプリング周波数のディジタル信号S2,1と下位の振幅分解能(量子化精度)のディジタル信号S1,2との重み付け加算信号を作成し、この加算信号と当該ディジタル信号S2,2との誤差信号のパワーが最小となるように重み付け係数を補助情報として決定し、その重み付け係数である補助情報と、誤差信号Δ2,2を符号化する。
図33において20b,96kHzディジタル信号の再生は、符号A,B,Eの組を使って行うこともできるし、符号B,D,Eの組を使って行うこともできることを示す。つまり選択を表す補助情報はディジタル信号の再生の際に図33中の白矢印と黒矢印の何れの復号経路を選択するかを示す。このように下位のディジタル信号を選択して誤差信号を生成して符号化すると、各ディジタル信号の再生に必要とする符号は図34の表に示すようになる。
【0142】
符号化装置
この第9実施例の符号化装置の実施例を図35に示す。符号A〜Iを作るのに必要とするサンプリング周波数と量子化精度の組み合せのそれぞれ原音の第m,nディジタル信号Sm,nが音源60m,n に格納されているとする。あるいは、外部から第m,nディジタル信号が入力されてもよい。m=1, 2, 3の場合であり、第m振幅語長(量子化精度)と対応し、この例ではm=1は16ビット、m=2は20ビット、m=3は24ビットの場合であり、n=1, 2, 3であり、第nサンプリング周波数(サンプリングレート)と対応し、この例ではn=1は48kHz、n=2は96kHz、n=3は192kHzである。m,nはいずれもその値が大きいほど上位の階層を表す。第m,nディジタル信号は第m量子化精度で、第nサンプリング周波数のディジタル信号を表す。またこれら第m量子化精度と第nサンプリング周波数の値を直接使って、例えば16b,96kHzディジタル信号と表現する場合もある。
【0143】
ある条件のディジタル信号が用意されていない場合は、その上位のディジタル信号から作成する。少くとも第3,3ディジタル信号S3,3、つまり振幅語長が24ビットサンプリング周波数が192kHzのディジタル信号音源603,3は用意され、この第3,3ディジタル信号S3,3から、ダウンサンプリングや下位ビット(この例では下位4ビット又は8ビット)の切り捨てなどにより、他の音源60m,n (m≠3, n≠3)のディジタル信号Sm,nを生成する。
音源601,1よりの16b,48kHzディジタル信号S1,1は圧縮部611,1により圧縮符号化され、符号Aが生成出力される。また16b,48kHzディジタル信号は精度変換部621,1でその第1量子化精度(16ビット)がこれよりも高い第2量子化精度(20ビット)に精度変換される。例えば16b,48kHzディジタル信号が符号絶対値表現の場合その下位に0が所定ビット、この例では4ビット付加され、音源602,1 からの20b,48kHzディジタル信号S2,1と同一量子化精度(同一振幅語長)の20b,48kHz精度変換信号とされる。音源602,1よりの20b,48kHzディジタル信号S2,1は減算部632,1でこの20b,48kHz精度変換信号が減算され、20b,48kHz誤差信号Δ2,1が生成され、この誤差信号Δ2,1が圧縮部612,1で圧縮符号化されて符号Dが生成出力される。
【0144】
また16b,48kHzディジタル信号S1,1はアップサンプル部641,1により、そのサンプリング周波数が第1サンプリング周波数(48kHz)より高い第2サンプリング周波数(96kHz)の16b,96kHzアップサンプリング信号に変換生成される。音源601,2よりの16b,96kHzディジタル信号S1,2は減算部631,2において16b,96kHzアップサンプリング信号との差分を16b,96kHz誤差信号Δ1,2として生成される。この16b,96kHz誤差信号Δ1,2は圧縮部611,2により圧縮符号化され、符号Bが生成、出力される。
このように、それより下位のサンプリング周波数がない、つまり最も低いサンプリング周波数のディジタル信号、例えば24b,48kHzディジタル信号S3,1及び20b,48kHzディジタル信号S2,1の符号化は、同一サンプリング周波数でそのディジタル信号より1階層下位の量子化精度のディジタル信号との誤差信号を圧縮符号化することにより行う。また下位の量子化精度がないディジタル信号、例えば16b,96kHzディジタル信号S1,2、16b,192kHzディジタル信号S1,3の符号化は、同一の量子化精度で下位のサンプリング周波数のディジタル信号S1,1, S1,2との誤差信号を圧縮符号化しておこなう。
【0145】
しかし20b,96kHzディジタル信号S2,2のように量子化精度についてもより下位の入力ディジタル信号が存在し、サンプリング周波数についてもより下位の入力ディジタル信号が存在する場合は、これらの何れかを選択する。つまり20b,96kHzディジタル信号S2,2の場合は、そのサンプリング周波数が次に下位で同一振幅語長の20b,48kHzディジタル信号S2,1をアップサンプル部642,1でサンプリング周波数96kHzにアップサンプリングした20b,96kHzアップサンプル信号を使用するか、または振幅語長(量子化精度)が次に下位で同一サンプリング周波数の16b,96kHzディジタル信号S1,2を精度変換部621,2で下位に0を4ビット付加した、20b,96kHzの精度変換信号を使用するかの何れかを図36を参照して後述する選択部762,2 で選択し、その選択した信号と20b,96kHzディジタル信号S2,2との差分を誤差信号Δ2,2として減算部632,2で求める。この誤差信号Δ2,2のパワーが小さい属性の下位からのディジタル信号を選択部762,2で選択し、いずれの属性の信号を選択したかを表す情報を補助符号化部77で符号化し、補助符号を出力する。この20b,96kHz誤差信号Δ2,2が圧縮部612,2で圧縮符号化されて符号Eとされる。
【0146】
同様に24b,48kHzディジタル信号S3,1をアップサンプル部643,1で24b,96kHzのアップサンプル信号とし、また20b,96kHzディジタル信号S2,2を精度変換部622,2で下位に4ビットの"0"を付加することにより24b,96kHz精度変換信号とし、これら両信号の一方を選択部763,2で選択し、その選択した信号と24b,96kHzディジタル信号S3,2との差分を24b,96kHz誤差信号Δ3,2として減算部633,2で生成して、圧縮部613,2で符号Hとする。
20b,192kHzディジタル信号S2,3も同様にして20b,96kHzディジタル信号S2,2のアップサンプル信号と、16b,192kHzディジタル信号S1,3の精度変換信号との一方との誤差信号Δ2,3を圧縮符号化して符号Fを生成する。24b,192kHzディジタル信号S3,3も2つの下位のディジタル信号S3,2, S2,3の一方を選択部763,3で選択し、その誤差信号Δ3,3から符号Iを生成する。
【0147】
選択部762,2,763,2,762,3,763,3 の具体例を図36に示す。この例では2≦m≦M, 1≦n≦N-1の範囲のm,nの組について、第m,n+1ディジタル信号Sm,n+1を圧縮符号化する場合で、第m,nディジタル信号Sm,nがアップサンプル部64m,nで第m,n+1アップサンプル信号にアップサンプリングされ、また第m-1,n+1ディジタル信号Sm-1,n+1が精度変換部62m-1,n+1で第m,n+1精度変換信号に精度変換される。これら第m,n+1アップサンプル信号と第m,n+1ディジタル信号Sm,n+1との歪、及び第m,n+1精度変換信号と第m,n+1ディジタル信号Sm,n+1との歪が第m,n歪及び第m-1,n+1歪としてそれぞれ歪計算部76A及び76Bで計算される。比較部76Cはこれら第m,n歪及び第m-1,n+1歪のパワーを比較し、第m,n歪のパワーの方が小さければ第m,n+1アップサンプル信号を選択し、第m-1,n+1歪のパワーの方が小さければ、第m,n+1精度変換信号を選択するようにスイッチ76Dを制御する。
【0148】
スイッチ76Dで選択された信号が減算部63m,n+1へ供給され、第m,n+1ディジタル信号Sm,n+1との第m,n+1誤差信号Δm,n+1が生成され、これが圧縮部61m,n+1で第m,n+1符号に圧縮符号化される。このようにして第m,n+1ディジタル信号Sm,n+1と第m,nディジタル信号Sm,n及び第m-1,n+1ディジタル信号Sm-1,n+1との両誤差信号のうちパワーが小さい方の誤差信号が第m,n+1誤差信号Δm,n+1として生成される。スイッチ76Dで何れの信号を選択したかを示す補助情報を補助符号化部77で第m,n+1補助符号として第m,n+1符号に関連付けておく。この補助情報は第m,n+1ディジタル信号Sm,n+1に対し、サンプリング周波数がすぐ下位の第m,nディジタル信号Sm,nか、量子化精度がすぐ下位の第m-1,n+1ディジタル信号Sm-1,n+1の何れかを選択したかがわかればよく、第m,n+1補助符号は補助情報の有無の符号と、何れを選択したかを示す符号の計2ビットでもよく、従って、第m,n+1符号に誤差信号符号と補助情報とが区別できるように、一体化して出力してもよい。
【0149】
図35の符号化装置と対応する復号化装置の実施例を図37に示す。最下位のサンプリング周波数48kHzのディジタル信号に対する復号は図32に示した復号化装置と同様である。復号対象ディジタル信号よりも下位の量子化精度及び下位のサンプリング周波数のディジタル信号が再生されている場合は、例えば20b,96kHzディジタル信号S2,2を再生する場合は、再生された20b,48kHzディジタル信号S2,1がアップサンプル部832,1で20b,96kHzアップサンプル信号とされて選択部872,2へ供給され、また再生された16b,96kHzディジタル信号S1,2が精度変換部811,2で20b,96kHz精度変換信号に変換されて選択部872,2 へ供給される。補助復号部862,2で第2,2補助符号が復号され、その復号された補助情報が示す選択情報に従って選択部872,2は両入力信号の一方を選択して加算部822,2 に与える。加算部822,2は伸張部802,2からの符号Eの復号20b,96kHz誤差信号Δ2,2と選択部872,2により選択された信号を加算して20b,96kHzディジタル信号S2,2が再生される。
【0150】
一般的には2≦m≦M, 1≦n≦N-1の範囲のm,nの組について、第m,n+1補助符号が補助復号部86m,n+1で復号された補助情報に従って、何れかの属性の信号、つまり再生された第m,nディジタル信号Sm,nをアップサンプル部83m,n で第m,n+1アップサンプル信号としたものか、又は再生された第m-1,n+1ディジタル信号Sm-1,n+1を精度変換部81m-1,n+1で第m,n+1精度変換信号としたもののいずれか一方が選択部87m,n+1で選択される。選択された信号は加算部82m,n+1で第m,n+1符号を伸張復号した第m,n+1誤差信号Δm,n+1と加算されて、第m,n+1ディジタル信号Sm,n+1が再生される。
なお第m,nディジタル信号Sm,n、第m-1,n+1ディジタル信号Sm-1,n+1の符号からの再生方法は、図37に示した手法に限らない。要はこれら両ディジタル信号を再生する手段があればよい。
【0151】
第10実施例
前述の第9実施例ではサンプリング周波数は同一で下位の量子化精度のディジタル信号と、量子化精度は同一で下位のサンプリング周波数のディジタル信号のうち、誤差信号のパワーが小さいほうのディジタル信号を選んで圧縮率を高めたが、これら2つの下位のディジタル信号を重み付け加算して誤差信号のパワーが小さくなるようにしてもよい。即ち図35中で各選択部76m,n(2≦m≦M, 2≦n≦N)のブロック内に括弧書きで混合部と記すように、選択部の代りに混合部を用いて両入力信号を重み付け加算して出力するようにする。例えば混合部762,2ではアップサンプル部642,1よりの20b,96kHzアップサンプル信号と、精度変換部621,2よりの20b,96kHz精度変換信号とを重み付け加算し、その20b,96kHz加算信号と20b,96kHzディジタル信号S2,2との20b,96kHz誤差信号Δ2,2を減算部632,2で生成する。その際、20b,96kHz誤差信号Δ2,2のパワーを最小にするように、混合部762,2で用いる重み係数の組を、予め図示してない記憶部に格納された複数の組の中から選択して決定する。このようにしてパワーを最小とする20b,96kHz誤差信号Δ2,2が圧縮部612,2で圧縮符号化され、符号Eが出力される。
【0152】
混合部76m,n+1の具体例を図38に示す。アップサンプル部64m,nからの第m,n+1アップサンプル信号、精度変換部62m-1,n+1よりの第m,n+1精度変換信号は乗算部76G,76Hでそれぞれ選択した組の重み係数W1, W2が乗算される。これら乗算結果が加算部76Jで加算され、その第m,n+1加算信号と第m,n+1ディジタル信号Sm,n+1との差分が誤差信号として減算部63m,n+1で生成される。この第m,n+1誤差信号は制御部76Kに分岐入力される。制御部76Kは上述のように図示してない記憶部に予め決めた複数の組の重み係数W1,W2をそれらの組を表す符号と対応させた表として有しており、第m,n+1誤差信号Δm,n+1のパワーが最小となるように重み係数表から1つの組の重み係数W1とW2を選択して乗算部76G,76Hへ与える。誤差信号のパワーが最も小さい時の第m,n+1誤差信号Δm,n+1を圧縮部61m,n+1で圧縮符号化させ、またその時選択した重み係数の組(W1, W2)を指定する符号を補助符号化部79で第m,n+1補助符号として、誤差信号Δm,n+1の第m,n+1符号と関連付けて出力する。
【0153】
ディジタル信号の符号化は一般にフレーム(符号化単位時間)に分割して行うが、この補助情報の決定もフレームごとに行う場合に限らず、フレームを構成するサブフレームごとに行ってもよい。
この混合部76を用いる符号化装置と対応する復号化装置においては、図37中に括弧書きで示すように選択部87の代りに混合部87を用いればよい。混合部87は図38に示した重み付け加算を行う構成、つまり乗算部76G,76Hと加算部76Jとを有する構成と同じである。例えば補助復号部862,2に図38の制御部76Kが有するのと同じ重み係数表が図示してない記憶部に設けられており、入力された補助符号、つまり重みの組み合せを示す符号に基づいて対応する組の重み係数W1, W2を重み係数表から取り出し、アップサンプル部832,1からの20b,96kHzアップサンプル信号と精度変換部811,2からの20b,96kHz精度変換信号に対し、混合部872,2で重みW1, W2をそれぞれ乗算し、その乗算結果を加算し、その加算結果の20b,96kHz加算信号を伸張部802,2からの伸張復号された20b,96kHz誤差信号Δ2,2と加算部822,2で加算して20b,96kHzディジタル信号S2,2を再生する。
【0154】
一般的に表現すると、アップサンプル部83m,nよりの第m,n+1アップサンプル信号と、精度変換部81m-1,n+1 よりの第m,n+1精度変換信号に対し、第m,n+1補助符号を補助復号部86m,n+1で入力された補助符号により指定された重み係数の組W1,W2をそれぞれ混合部87m,n+1で乗算し、その乗算結果を加算し、その第m,n+1加算信号と、伸張部80m,n+1で第m,n+1符号を復号して得た第m,n+1誤差信号Δm,n+1とを加算部82m,n+1で加算して第m,n+1ディジタル信号Sm,n+1を再生する。
第10実施例の変形例
図35中の量子化精度とサンプリング周波数の各種組み合せの第m,nディジタル信号は同じ音場から別々に採取された信号として入力されるか、又はそれらが音源601,1〜603,3に一旦蓄積され、それらから読み出される。各音源のディジタル信号は第m,nディジタル信号Sm,nを単純にダウンサンプリングと下位ビット切り捨てを行ったものと異なり、雑音(固定ディザ信号)を加えたりすることがあり、また振幅やサンプリング(標本点位置)のずれなどの種々の変換や調整が行われている可能性がある。この変換や調整はどのようなものであるか、一般的には事前に知られていない。
【0155】
そこでこの変形例では図35に示した符号化装置において、第nサンプリング周波数、第m量子化精度のディジタル信号に対し、それより下位の第n-1サンプリング周波数のディジタル信号、又は下位の第m-1量子化精度のディジタル信号を上記と同じ階層のディジタル信号に変形して、上位のディジタル信号から下位のディジタル信号を差し引いた誤差信号のパワーが最小となるようにする。
例えば図22に示したように、第m,nディジタル信号Sm,nは精度変換部62m,n において前述したように、量子化精度(振幅語長、振幅分解能)が第m+1量子化精度に変換され、この第m+1,n精度変換信号は、この例では利得調整部66Aによりレベル調整され、更にそのレベル(利得)調整された第m+1,n精度変換信号はタイミング調整部66Bでサンプル位置が調整され、そのサンプル位置調整された第m+1,n精度変換信号により第m+1,nディジタル信号Sm+1,nに対し減算が減算部63m+1,nで行われる。これらの調整については図22を参照して説明したものと同じであり、説明を省略する。
【0156】
また、符号化装置において、下位ディジタル信号、具体的には例えば第m+1,n精度変換信号に時間・利得調整を行った場合、復号化装置において、その時間・利得調整を対応する第m+1,n精度変換信号に行う必要がある。その場合の例も、図23で説明したと同様の構成とすることができ、その動作についてはすでに説明したので、ここでは説明を省略する。
以上の変形例は最下位のサンプリング周波数が、図35、図37では48kHzのディジタル信号、最下位の量子化精度が図35、図37では16ビットのディジタル信号の符号化、復号化の場合の例である。選択部や混合部を用いる場合は、図36中及び図38中に破線で示すように調整部76Eでアップサンプル部64m,nよりの第m,n+1アップサンプル信号と、第m,n+1ディジタル信号Sm,n+1との間で図22に示した利得調整部66Aによるレベル調整及びタイミング調整部66Bによるサンプル位置調整の一方又は両方を行って図36では歪計算部76A及びスイッチ部76D(図38では又は乗算部76G)へ供給し、また調整部76Fで、精度変換部62m-1,n+1よりの第m,n+1精度変換信号と第m,n+1ディジタル信号との間で図22に示したレベル調整及びサンプル位置調整の何れか一方または両方を行って歪計算部76B(又は乗算部76H)へ供給する。またこれら調整部76E,76Fよりの調整利得及び調整サンプル位置量の一方又は両方の第m,n+1補助符号が出力される。これら第m,n+1補助符号は、補助符号化部77よりの第m,n+1補助符号と共に1つの第m,n+1補助符号として出力してもよい。また図38に示した例では、調整部76E,76Fでの各調整利得と、乗算部76G,76Hの各重みW1, W2をそれぞれ乗算した値を補助情報に用いてもよい。
【0157】
図37に示した復号化装置において選択部又は混合部87m,nを用いる場合は、例えば図39に示すように第m,n+1補助符号は、補助情報復号部88により復号される。アップサンプル部83m,n 及び精度変換部81m-1,n+1と選択部(混合部)87m,n+1 との間に調整部87A及び87Bがそれぞれ挿入され、これら調整部87A,87Bはそれぞれ図23中に示した調整部87と同様の構成とされ、補助情報復号部88からの復号された調整利得及び調整サンプル位置量の一方又は両方に対応するものが供給され、第m,n+1アップサンプル信号及び第m,n+1精度変換信号がそれぞれレベル調整及びサンプル位置調整の一方又は両方が行われて選択部(混合部)87m,n+1へ供給される。
【0158】
図35に示した符号化装置においては20b,96kHzディジタル信号S2,2を符号化する場合に、図34に示したように符号A,D,Eの組を用いることができるし、符号A,B,Eの組を用いることもできる。従って、これらの組による符号化のうち、最も情報量の少ない組による符号化方法を用いることができる。同様に24b,192kHzディジタル信号S3,3については符号A,B,C,F,Iの組、符号A,B,E,F,Iの組、符号A,B,E,H,Iの組、符号A,D,E,F,Iの組、符号A,D,E,H,Iの組、符号A,D,G,H,Iの組の6通りの符号化のうち、合計情報量が最も小さくなるものによって符号化されるため、高い圧縮率が得られる。その他のディジタル信号も、図34に示した論理式で表されるように、例えば20b,192kHzディジタル信号の場合は、符号A,B,C,Fの組、A,B,E,Fの組、A,B,E,Fの組、A,D,E,Fの組の4通りによる符号化が可能である。また、24b,96kHzディジタル信号の場合は、A,B,E,Hの組、A,D,E,Hの組、A,D,G,Hの組の3通りによる符号化が可能である。これらのうち最も合計情報量の少ない組(最も圧縮率が高くなる組)を使用することにより、伝送効率を高めることができる。
【0159】
なお図35に示した符号化装置中の圧縮部も、図27、図31に示した符号化装置の圧縮部と同様の構成とすることができ、同様に図37に示した復号化装置中の伸張器は図30、図32に示した復号化装置中の伸張器と同様の構成とすることができる。
先に述べたように、第10実施例の符号器において、いずれかの音源が存在していない場合、あるいは最高量子化精度、最高サンプリング周波数のディジタル信号音源しかない場合は、存在する音源の信号から、他の量子化精度、サンプリング周波数のディジタル信号を作って符号化する。24b,192kHzディジタル化信号S3,3からすべてのディジタル信号を作る例を図40に図35と対応する部分に同一参照番号を付けて変更された部分についてのみ説明する。図40中の左側の破線で示す音源は存在していない。
【0160】
24b,192kHzディジタル信号S3,3は桁落部673,3で下位4桁が除去され、20b,192kHzディジタル信号S2,3が生成される。その20b,192kHzディジタル信号は更に桁落部672,3で下位4ビットを用いずに、16b,192kHzディジタル信号S1,3が生成される。24b,192kHzディジタル信号S3,3はダウンサンプル部683,3でサンプリング周波数が96kHzにダウンサンプリングされ、24b,96kHzディジタル信号S3,2が生成される。この24b,96kHzディジタル信号S3,2は桁落部673,2,672,2により順次、下位4ビットを用いずに、それぞれ20b,96kHzディジタル信号S2,2、16b,96kHzディジタル信号S1,2が生成される。以下同様に24b,48kHzディジタル信号S3,1、20b,48kHzディジタル信号S2,1、16b,48kHzディジタル信号S1,1がダウンサンプル部683,2、桁落部673,1,672,1により生成される。
【0161】
これらディジタル信号の生成法の他の例を図41に示す。この場合は、図40と同様に桁落部673,3,672,3により20b,192kHzディジタル信号S2,3、16b,192kHzディジタル信号S1,3を生成し、ダウンサンプル部683,3,683,2により24b,96kHzディジタル信号S3,2と24b,48kHzディジタル信号S3,1を生成するが、この例では桁落部673,3よりの20b,192kHzティジタル信号S2,3、桁落部672,3よりの16b,192kHzディジタル信号S1,3がそれぞれ、ダウンサンプル部682,3,681,3によりダウンサンプリングされて20b,96kHzディジタル信号、16b,96kHzディジタル信号S1,2が生成され、更にこれらがダウンサンプル部682,2,681,2によりダウンサンプリングされて、20b,48kHzディジタル信号S2,1、16b,48kHzディジタル信号S1,1が生成される。図40、図41においてその他の構成は、図35と同様である。
【0162】
上述した第7〜第10実施例において、量子化精度の種類の数M、サンプリング周波数の種類の数Nは各3に限らず、Mの値を別の値にしてもよい。同様にNの値についても3に限らず、他の値にしてもよい。また上述した各実施例にそれぞれ示した各符号器、各復号器を、それぞれコンピュータにプログラムを実行させて機能させる構成としてもよい。この場合は、例えば復号器について云えば、CD−ROM、磁気ディスクなどの記録媒体から、又は通信回線を通して復号化プログラムをコンピュータ内のCPUなどの制御手段によりダウンロードさせ、その復号化プログラムをコンピュータに実行させればよい。
【0163】
第7〜第10実施例によっても、例えば図24を参照して説明した楽音配信システムを実行することができる。
上述の第7乃至第10実施例によれば、振幅の量子化精度やサンプリング周波数の異なる符号化が統一的に実行でき、システム全体として圧縮率を高めることができる。
第11実施例
まず、この第11実施例において使用するディジタル信号の2次元階層化を図42に示す。M種類の量子化精度として16ビット、20ビット、24ビットの3種類と、N種類のサンプリング周波数として48kHz、96kHz、192kHzの3種類を使用し、M×N=9個のの組み合せのディジタル信号の生成を可能とする。
【0164】
量子化精度が24ビットのディジタル信号中の最下位ビットから下位8ビットを除いた上位16ビットについて、サンプリング周波数が48kHzで符号化した符号Aと、前記上位16ビットについて符号Aにより符号化された成分以上の周波数成分についてサンプリング周波数96kHzで符号化した符号Bと、更に符号Bにより符号化された成分以上の周波数成分についてサンプリング周波数192kHzで符号化した符号Cと、振幅語長16ビット信号についてサンプリング周波数が複数に階層化される。つまりサンプリング周波数の階層化は16ビット語長の信号で実現される。
【0165】
16ビット語長に対し下位4ビットを付加して20ビット語長とした信号については、その下位4ビットの成分、つまり20ビット語長信号から16ビット語長成分を差し引いた残差成分(誤差信号)について、サンプリング周波数48kHzで符号化した符号Dと、20ビット語長でサンプリング周波数48kHzの信号をサンプリング周波数96kHzにアップサンプリングした信号と、20ビットサンプリング周波数96kHzのディジタル信号との誤差信号を圧縮符号化した符号Jと、20b,96kHzディジタル信号をサンプリング周波数192kHzにアップサンプリングした信号と20b,192kHzディジタル信号との誤差信号を圧縮符号化した符号Kとにより20ビット語長信号についてサンプリング周波数の階層化が実現される。
【0166】
20ビット語長に対し更に下位4ビットを付加して24ビット語長とした信号については、その下位4ビットの成分、つまり24ビット語長信号から20ビット語長成分を差し引いた残差成分(誤差信号)について、サンプリング周波数48kHzで符号化した符号Gと、24b,48kHzディジタル信号をサンプリング周波数96kHzにアップサンプリングした信号と、24b,96kHzディジタル信号との誤差信号を圧縮符号化した符号Lと、24b,96kHzディジタル信号をサンプリング周波数192kHzにアップサンプリングした信号と24b,192kHzディジタル信号との誤差信号を圧縮符号化した符号Mとして、周波数方向に階層符号化する。つまり16ビット以上の量子化精度に対する階層化は各サンプリング周波数ごとに行う。この階層化における符号A,B,C,D,Gに対応する信号の量子化精度とサンプリング周波数は、図25における対応する符号と同じであるが、例えば本実施例では符号Lに対応する信号は図25における符号B,E,Hに対応する信号を含んでいる。同様に、本実施例の符号Mは図25における符号C、F、Iを含み,本実施例における符号Kは図25における符号C、Fを含み、本実施例における符号Jは図25における符号B、Eを含んでいる。
【0167】
このように振幅語長(振幅分解能,量子化精度)とサンプリング周波数との二次元階層化された9種類の符号化条件により符号化された符号A〜D,G,J〜Mを用いることにより、図43の表に示すようにM=3種類の振幅語長とN=3種類のサンプリング周波数の組み合せの全M×N=9種類のディジタル信号を出力することができる。つまり各サンプリング周波数と量子化精度との各組み合せについて図43に示す符号を用いればよい。例えば、サンプリング周波数96kHz、振幅語長24ビットの場合、符号AとDとGとLを用いればよい。
次にこれら符号A〜D,G,J〜Mを生成する符号化方法を図44に示す機能構成を参照して説明する。符号A〜D,G,J〜Mを生成するのに必要とするサンプリング周波数と振幅語長の組み合せのそれぞれの原音の第m,nディジタル信号が音源60m,n に格納されているとする。m=1, 2, 3であり、第m振幅語長(量子化精度)と対応し、この例ではm=1は16ビット、m=2は20ビット、m=3は24ビットの場合を示し、n=1, 2, 3であり、第nサンプリング周波数(サンプリングレート)と対応し、この例ではn=1は48kHz、n=2は96kHz、n=3は192kHzを示す。ある条件のディジタル信号が用意されていない場合は、その上位の階層のディジタル信号から作成する。少くとも第3,3ディジタル信号S3,3、つまり振幅語長が24ビットでサンプリング周波数が192kHzのディジタル信号音源603,3 は用意され、この第3.3ディジタル信号S3,3から、必要に応じてダウンサンプリングや下位4ビット又は8ビットの切り捨てなどにより、他の音源60m,n(m≠3、n≠3)のディジタル信号を生成する。
【0168】
音源601,1 よりの第1,1ディジタル信号S1,1は圧縮部611,1 により圧縮符号化され、第1,1符号Aが生成出力される。また第1,1ディジタル信号は精度変換部621,1 でその第1量子化精度がこれよりも高い第2量子化精度に精度変換される。例えば第1,1ディジタル信号S1,1が符号絶対値表現の場合その下位に0が所定ビット数分、この例では4ビット付加され、音源602,1 の第2,1ディジタル信号S2,1と同一量子化精度(同一振幅語長)の第2,1精度変換信号とされる。音源602,1 よりの第2,1ディジタル信号S2,1は減算部632,1 でこの第2,1精度変換信号が減算され、第2,1誤差信号Δ2,1が生成され、この第2,1誤差信号Δ2,1が圧縮部612,1 で圧縮符号化されて符号Dが生成出力される。つまり複数のディジタル信号中のサンプリング周波数が最低のものは、そのディジタル信号より1階層下位の量子化精度のディジタル信号を、同一量子化精度(振幅語長)に精度変換した信号との誤差信号を圧縮符号化する。第3,1ディジタル信号も同様に符号化され、符号Gが生成される。
【0169】
また第1,1ディジタル信号S1,1は第1,1アップサンプル部641,1 により、そのサンプリング周波数が第1サンプリング周波数より高い第2サンプリング周波数の第1,2アップサンプリング信号に変換生成される。この例ではサンプリング周波数が48kHzから96kHzに変換される場合であり、例えば図17A,18Bで説明したように第1,1ディジタル信号の実線のサンプル列における各隣接サンプルを補間する破線のサンプルが挿入される。
音源601,2 よりの第1,2ディジタル信号S1,2は減算部631,2 において第1,2アップサンプリング信号が差し引かれ、第1,2誤差信号Δ1,2が生成される。この第1,2誤差信号Δ1,2は圧縮部611,2 により圧縮符号化され、第1,2符号Bが生成、出力される。
【0170】
他の符号B,C,J,K,L,Mも同様に生成する。これら符号の生成を一般的に述べる。mとnの組み合せについて、最下位のm=1, n=1の第m,nディジタル信号を第m,n圧縮部61m,n で圧縮符号化して、第m,n符号を生成し、出力する。
2≦m≦M, n=1の範囲のm,nの組の第m,nディジタル信号Sm,nについては第m量子化精度の直ぐ下位の第m-1量子化精度の第m-1,nのディジタル信号を同一量子化精度mの第m,n精度変換信号に第m-1,n精度変換部62m-1,n で変換生成し、第m,nディジタル信号と第m,n精度変換信号との差を減算部63m,n で求め、その第m,n誤差信号を圧縮部61m,n で圧縮符号化して第m,n符号を生成、出力する。
【0171】
またサンプリング周波数が最低でない、つまりn≧2の第m,nディジタル信号については、同一量子化精度でサンプリング周波数が直ぐ下位の第m,n-1ディジタル信号を第nサンプリング周波数に第m,n-1アップサンプル部64m,n-1 でアップサンプリングして第m,nアップサンプリング信号を生成し、第m,nディジタル信号から第m,nアップサンプリング信号を減算部63m,n で減算し、その残りを第m,n誤差信号を、圧縮部61m,n で圧縮符号化して、第m,n符号を生成、出力する。
原音信号が音声や音楽のような場合、一般に第1,1ディジタル信号は低周波数領域にエネルギーが大きく偏っているので、第1,1圧縮部611,1 としては予測符号化や変換符号化、あるいは高圧縮の符号化と組み合せた圧縮符号化が可能である。具体的には例えば前述の図18Aの符号化器61を使用することができる。
【0172】
圧縮部611,2 、611,3 への入力である第1,2誤差信号、第1,3誤差信号は前述したように第1,1誤差信号の帯域外である。周波数帯域の上半分にしかエネルギーがないので信号を予測したり、前述の図18A中の配列変換部61Eでの処理のような変換を行った後、圧縮符号化してもよい。圧縮部612,1, 613,1, 612,2, 613,2, 612,3及び613,3は、例えば前述の図28に示した予測符号器と可逆圧縮部との組み合せ、あるいは前述の図18A中の符号化器61から非可逆量子化部61B、逆量子化部61C及び差回路61Dを除いた符号化器、つまり図19Aに示す可逆符号化器61を用いることができる。これら圧縮部612,1,613,1,…,612,3,613,3 に入力される誤差信号が十分小さく、雑音のように系列がランダムの場合は、圧縮率の向上が期待できないので、このフレームにおいては0のみを表わす符号に圧縮符号化してもよい。
【0173】
各アップサンプル部64m,n において用いる補間フィルタのタップ数(図17B参照)が復号化側で予め知られていない場合は、そのタップ数を、図44中に破線で示すように補助符号化部65m,n+1でそれぞれ符号化して第m,n+1補助符号として、それぞれ第m,n+1符号と関連付けて出力する。この補間フィルタのタップ数と補助符号の例は例えば図20Aで示した。
次に図44と対応するディジタル信号復号化方法を図45を参照して説明する。
符号A、D、G、B、J、L、C、K及びMはそれぞれ伸張部801,1 、802,1 、803,1 、801,2 、802,2 、803,2 、801,3 、802,3 及び803,3 に入力されて、それぞれ伸張復号が行われる。これら第m,n伸張部80m,n は対応する第m,n圧縮部61m,n で圧縮符号化された第m,n符号を伸張復号化する構成とされている。
【0174】
伸張部801,1 からの伸張復号化された第1,1ディジタル信号は精度変換部311,1 で下位に0が4ビット付加され、振幅語長が20ビットとされた第2,1精度変換信号が生成される。この第2,1精度変換信号は、伸張部802,1 からの伸張復号化された第2,1誤差信号Δ2,1と加算部822,1で加算されて第2,1ディジタル信号S2,1が再生される。
伸張部801,1 からの伸張復号化された第1,1ディジタル信号S1,1はアップサンプル部831,1でその第1サンプリング周波数が第2サンプリング周波数に変換された第1,2アップサンプリング信号に変換される。この第1,2アップサンプリング信号は第1,2伸張部801,2 よりの伸張復号化された第1,2誤差信号Δ1,2に、加算部821,2で加算されて、第1,2ディジタル信号S1,2が再生される。
【0175】
伸張部80m,n により伸張復号された第m量子化精度、第nサンプリング周波数の第m,nディジタル信号は、そのnが最低値、つまりn=1であれば第m,n精度変換部81m,nでその量子化精度(振幅語長)が第m+1量子化精度の第m+1,n精度変換信号に変換生成され、この第m+1,n精度変換信号が、伸張部80m+1,n よりの伸張復号化された第m+1,n誤差信号に加算部82m+1,nで加算されて第m+1量子化精度(振幅語長)、第nサンプリング周波数の第m+1,nディジタル信号が再生される。
また伸張部80m,n からの第m,n誤差信号のサンプリング周波数が最低値より大、つまりn>1であれば、同一の第m量子化精度で、サンプリング周波数が直ぐ下位の第n-1サンプリング周波数の再生第m,n-1ディジタル信号が第m,n-1アップサンプル部83m,n-1 で第nサンプリング周波数の第m,nアップサンプリング信号に変換生成され、この第m,nアップサンプリング信号は第m,n誤差信号に加算部82m,nで加算されて、第m量子化精度、第nサンプリング周波数の第m,nディジタル信号が再生される。なおm=1, n=1以外の伸張部80m,n においては第m量子化精度、第nサンプリング周波数の第m,n誤差信号が伸張復号化される。
【0176】
各アップサンプル部83m,n に用いる補間フィルタのタップ数が予め知られていない場合は、それぞれ符号B、J、L、C、K及びMと関連付けて入力される第1,2補助符号、第2,2補助符号、第3,2補助符号、第1,3補助符号、第2,3補助符号及び第3,3補助符号がそれぞれ補助復号化部851,2,852,2,853,2,851,3,852,3及び853,3により、タップ数がそれぞれ復号され、各タップ数が対応するアップサンプル部831,1,832,1,833,1,831,2,832,2 及び833,2に設定される。
伸張部801,1 は圧縮部611,1 と対応したものが用いられ、例えば圧縮部611,1 として図18Aの符号化器61が用いられた場合は、伸張部801,1 として図3中の復号器が用いられる。つまり符号A中の可逆圧縮符号を可逆復号し、その復号ビット列からフレーム中の対応ビット位置よりなるビット列の符号絶対値表現した複数サンプルを、そのフレームの誤差信号として再生し、符号A中の非可逆圧縮符号を非可逆復号して局部再生信号を生成し、この再生信号と前記誤差信号を加算して第1,1ディジタル信号を再生する。
【0177】
伸張部801,2 ,801,3 はそれぞれ圧縮部611,2 ,611,3 の符号化方法と対応した復号化方法を使用し、予測復号化法又は変換復号化法などを用いることができる。他の伸張部も対応する圧縮部で用いる符号化方法に対する復号化方法を用いる。圧縮部61が図19Aに示した構成の場合、その伸張部80としては図18Bの復号化器80から逆量子化部80C、加算部80Dを除去した構成、つまり図19Bに示す構成のものとする。
図44に示した符号化装置の構成によれば、各種の量子化精度(振幅分解能、振幅語長)と各種のサンプリング周波数(サンプリングレート)の組み合せをもつ各種のディジタル信号を、2次元階層として統一的に符号化することができ、しかも全体として高い能率で圧縮符号化でき、利用者の要求する品質の再生信号を与えるための各種組み合せのディジタル信号を、少ないデータ量で提供することができる。
【0178】
図45に示した復号化装置の構成によれば、図44に示した符号化装置により符号化された符号から、量子化精度とサンプリング周波数の各種組み合せのディジタル信号中の所望とするものを統一的に復号化することができる。
なお必ずしも図44中に示す全ての組み合せの第m,nディジタル信号を必要としない。例えば図45に示した復号器中の伸張部801,1 の他に、アップサンプリング部831,1、伸張部801,2、加算部822,1 からなる第1手段と、精度変換部811,1、伸張部802,1 及び加算部822,1からなる第2手段と、精度変換部811,2 、第2,2伸張部802,2 ,第2,2加算部822,2、アップサンプリング部832,1、伸張部802,2、加算部822,2 からなる第3手段との1つを少くとも備えたものでもよい。
【0179】
図44、図45に示した各実施例において、量子化精度の種類の数M、サンプリング周波数の種類の数Nは各3に限らず、他の値でもよい。
図44中の量子化精度とサンプリング周波数の各種組み合せの第m,nディジタル信号の音源601,1 〜603,3 が予め用意されている場合、各音源の第m,nディジタル信号は第m,n+1ディジタル信号を単純にダウンサンプリングしたもの、あるいは下位ビット切り捨てを行ったものと異なり、雑音(固定ディザ信号)を加えたりすることがあり、また振幅やサンプリング(標本点位置)のずれなどの種々の変換や調整が行われている可能性がある。この変換や調整はどのようなものであるか、一般的には事前に知られていない。
【0180】
要するに第11実施例の符号化方法は、各種の量子化精度(振幅分解能、振幅語長)と各種のサンプリング周波数(サンプリングレート)のディジタル信号に対する符号化において、1つの量子化精度、サンプリング周波数のディジタル信号の符号化を、これと同一の量子化精度を有し、サンプリング周波数が低いがより近いディジタル信号を同一のサンプリング周波数にアップサンプリングした信号との誤差信号を生成し、その誤差信号を圧縮符号化し、サンプリング周波数が最も低いディジタル信号を除いては、全て上記のようにアップサンプリング信号との誤差信号の圧縮符号化のみにより符号化する。サンプリング周波数が最も低いディジタル信号については、その量子化精度がそれより低いが最も近いディジタル信号を同一量子化精度(同一振幅語長)に精度変換した信号との誤差信号を圧縮符号化する。
【0181】
また、この第11実施例の復号化方法は、復号したいディジタル信号に対する誤差信号の圧縮符号を伸張復号して誤差信号を生成し、前記復号したいディジタル信号と同一量子化精度で、サンプリング周波数が低いがより近い再生ディジタル信号を、復号誤差信号のサンプリング周波数と同一のサンプリング周波数にアップサンプリングして、前記復号誤差信号に加算してディジタル信号を求める。図16、21の実施例で適用した図22、23の変形をこの図44、45の実施例に適用し、アップサンプリング信号及び精度変換信号の一方又は両方に対し、サンプルのレベル調整、サンプル位置の調整を行ってもよい。
【0182】
図44に示した符号化装置、また図45に示した復号化装置を、それぞれコンピュータにプログラムを実行させて機能させる構成としてもよい。この場合は、例えば復号化装置について云えば、CD−ROM、磁気ディスクなどの記録媒体から、又は通信回線を通して復号化プログラムをコンピュータ内にダウンロードさせ、その復号化プログラムをコンピュータに実行させればよい。
上述においてはこの発明を音楽ディジタル信号に適用したが画像のディジタル信号に適用することもできる。
上述の第11実施例によれば、振幅の精度とサンプリングレートの要求の異なる符号化、特に可逆な符号化が統一的に実行でき、個々の圧縮性能と各種符号化条件全体に対する圧縮性能を両立できる。
第12実施例
図46はこの発明の第12の実施例の概念的構成を示す。この実施例では、5チャンネルの信号L5c:前左、R5c:前右、C5c:中央、LS5c:左後(サラウンド)、RS5c:右後(サラウンド)と、2チャンネルのステレオ信号L,Rと、1チャンネルのモノラル信号Mの3種類のチャンネル数の信号を階層符号化することを想定している。いずれも同一空間で収録されたものとする。5チャンネル信号に対し、チャンネル数の少ないステレオ信号L,Rとモノラル信号Mはより下位に、ステレオ信号L,Rに対し、チャンネル数の少ない(即ち1チャンネルの)モノラル信号Mは下位または予め有る規格に従って収録されたものに階層化する。
【0183】
まず、モノラル信号Mは単独で圧縮符号化を行う。この圧縮符号化は可逆符号化でも非可逆符号化でもよい。ステレオ信号L,Rの符号化にはモノラル信号Mを補正して、補正後の信号M'をL,Rから引き算してその差分信号L-M', R-M'をそれぞれ可逆圧縮符号化する。このとき、補正に関する補助情報も可逆符号化する。補助情報自体が符号として出力される場合は、更に符号化を行う必要はない。モノラル信号Mはステレオ信号L,Rとそれぞれある程度の相関があるので、多くの場合、差分信号のほうが信号L,Rそのものより振幅を小さくできる。
補正に関しては、図52を参照して後述するが、信号サンプル値に係数を掛けることによる振幅調整や、サンプル位置の調整、またはこれらの組み合わせを行う。このような補正により後述の圧縮符号化する誤差信号の振幅をできるだけ小さくする。フレームごとに補助情報を使って補正を行うこともできる。決定した補正量に関する補助情報も符号化する。
【0184】
更に、ステレオ信号L,Rとモノラル信号Mを5チャンネルの符号化効率の改善に利用する。一般的な収録条件では5チャンネル信号中の信号L5c, LS5cとステレオ信号Lとの相関が強く、5チャンネル信号中の信号R5c, RS5cとステレオ信号Rとの相関が強く、5チャンネル信号中の信号C5cとモノラル信号Mとの相関が強いことを利用した差分符号化を行う。即ち、ステレオ信号Lから5チャンネル信号中の信号L5c又はLS5cの差分信号(L5c-L), (LS5c-L)をそれぞれ可逆圧縮符号化し、ステレオ信号Rから5チャンネル信号中の信号R5c又はRS5cの差分信号(R4c-R), (RS5c-R)をそれぞれ可逆圧縮符号化する。更に、モノラル信号Mから5チャンネル信号中の信号C5cの差分信号(C5c-M)も可逆圧縮符号化する。
【0185】
図47は図46に示した第12実施例の概念をより具体的に構成した例を示す。ここでは、信号としてサンプリング周波数192kHz, サンプルワード長(量子化精度)24bitの5チャンネル信号C5c, L5c, R5c, LS5c, RS5cが信号源10C5, 10L5, 10R5, 10LS, 10RSによりそれぞれ供給され、サンプリング周波数192kHz, サンプルワード長24bitのステレオ信号L,Rが信号源10L, 10Rにより供給され、サンプリング周波数48kHz、サンプルワード長16bitのモノラル信号Mが信号源10Mにより供給されている場合を示している。
5チャンネル信号中の信号L5cとLS5cはそれぞれ減算器13L5, 13LSにより、図52を参照して後述する補正部16L5, 16LSからの補正されたステレオ信号L'と減算され、得られた残差信号(誤差信号又は差分信号とも呼ぶ)は圧縮符号化部11L5, 11LSにより可逆符号化される。補正部16L5, 16LSで決定された補正情報は補助情報として補助情報符号化部15L5, 15LSで可逆符号化される。同様に、5チャンネル信号中の信号R5cとRS5cはそれぞれ減算器13R5, 13RSにより、補正部16R5, 16RSからの補正されたステレオ信号R'と減算され、得られた残差信号は圧縮符号化部11R5, 11RSにより可逆符号化される。また、補正部16R5, 16RSで決定されたパラメータは補助情報として補助情報符号化部15R5, 15RSで可逆符号化される。補正情報がそれ自体符号として出力される場合は補助情報符号化部で更に符号化する必要はない。
【0186】
モノラル信号Mはグレードアップ部62でサンプリングレートが48kHzから192kHzにアップサンプルされ、更に各サンプルは最上位ビット方向に8ビットシフトして下位側に同数8個の、つまり8ビットの"0"が付加され24ビットのサンプルにグレードアップされる。グレードアップされたモノラル信号は補正部16C5, 16L, 16Rに与えられる。5チャンネル信号中の信号C5cとステレオ信号L, Rはそれぞれ減算器13C5, 13L, 13Rにより、補正部16C5, 16L, 16Rからの補正されたグレードアップモノラル信号M'と減算され、得られた誤差信号は圧縮符号化部11C5, 11L, 11Rにより可逆圧縮符号化される。モノラル信号Mは圧縮符号化部11Mにより圧縮符号化される。圧縮符号化部11Mでの符号化は、可逆符号化でも非可逆符号化でもよい。
【0187】
図48は図47の符号化装置に対応する復号化装置の具体例である。図47における圧縮符号化部11C5, 11L5, 11R5, 11LS, 11RS, 11L, 11Rによりそれぞれ可逆符号化された符号は復号伸張部30C5, 30L5, 30R5, 30LS, 30RS, 30L, 30Rによりそれぞれの符号化に対応した復号アルゴリズムにより復号され、復号信号は加算器32C5, 32L5, 32R5, 32LS, 32RS, 32L, 32Rに与えられ、補正部36C5, 36L5, 36R5, 36LS, 36RS, 36L, 36Rからの補正された信号M',L',R',L',R',M',M'と加算され、原音信号C5c, L5c, R5c, LS5c, RS5c, L, Rが生成される。符号化装置の圧縮符号化部11Mからの符号は復号伸張部30Mで図47の符号化装置における圧縮符号化部11Mの符号化に対応した復号アルゴリズムで復号され、モノラル信号Mとして出力される。更に、符号化装置で符号化された補助情報は補助情報復号化部35C5, 35L5, 35R5, 35LS, 35RS, 35L, 35Rによりそれぞれの符号化に対応した復号化アルゴリズムで復号され、補正部36C5, 36L5, 36R5, 36LS, 36RS, 36L, 36Rに与えられる。
【0188】
伸張復号化部30Mで復号されたモノラル信号はそのままワード長16bit、サンプリングレート48kHzのモノラル信号Mとして出力されるとともに、グレードアップ部81によりワード長24bit、サンプリングレート192kHzにグレードアップされ、補正部36C5, 36L, 36Rに与えられる。図53を参照して後述する補正部36C5, 36L, 36Rはそれぞれ補助情報復号化部35C5, 35L, 35Rで復号された補正パラメータ(後述の利得係数k及びタイミング調整量p)により、グレードアップされたモノラル信号M'を補正して加算器32C5, 32L, 32Rに与える。加算器32C5, 32L, 33Rは5チャンネル信号のセンタ信号C5c、ステレオ信号L,Rを出力する。
【0189】
補正部36L5, 36LSは加算器32Lの出力(ステレオ信号L)を補助情報復号化部35L5, 35LSで復号された補正パラメータにより補正し、補正された信号L'を加算器32L5, 32LSに与える。同様に、補正部36R5, 36RSは加算器32Rの出力(ステレオ信号R)を補助情報復号化部35R5, 35RSで復号された補正パラメータにより補正し、補正された信号R'を加算器32R5, 32RSに与える。加算器32L5, 32R5, 32LS, 32RSは5チャンネル信号L5c, R5c, LS5c, RS5cを出力する。
第13実施例
図49は第13実施例の概念を示し、2チャンネルのステレオ信号L,Rに対して、L、Rの和と差を生成している。一般的な収録条件では、和信号(L+R)は差信号(L-R)より振幅が大きく、かつ1つの位置で捕らえたモノラルの信号M及び5チャンネル信号のセンタ信号C5cとの相関が大きい場合が多い。従って、和信号(L+R)とモノラル信号Mの差分、及び和信号(L+R)とセンタ信号C5cとの差分を可逆符号化し、同時に差信号(L-R)をそのまま可逆符号化する。モノラル信号Mもそのまま可逆符号化または非可逆符号化する。和信号とモノラル信号の差分をとる場合、和信号の半値もしくはモノラル信号の倍値のいずれか一方を用いる。和信号とセンタ信号の差分をとる場合、和信号の半値もしくはセンタ信号の倍値のいずれか一方を用いる。いずれの場合も、半値、倍値を得るためにその値を示すビット列を1ビットずつ下位又は上位にシフトさせてもよい。
【0190】
更に、一般にステレオ信号Lは5チャンネル信号中の信号L5c, LS5cと相関が高く、ステレオ信号Rは5チャンネル信号中の信号R5c, RS5cと相関が高いので、信号L5c, LS5cと信号Lの差分及び信号R5c, RS5cと信号Rの差分をそれぞれ可逆符号化する。なお、以下の説明では差信号(L-R)と和信号(L+R)を符号化する場合で説明するが、いずれか一方を2で割り算して符号化を行っても差信号(L-R)の最下位の桁のビットは、和信号(L+R)の最下位ビットと同じなので、2で割った方を復元時に2倍し(1ビット下位、つまりMSB方向にシフトし)、その最下位ビットを2で割らなかった方の最下位ビットと同じにすれば差信号(L-R)と和信号(L+R)を完全に歪なく再構成できる。信号の再構成時にはモノラル信号Mの復号、和信号(L+R)の復号、差信号(L-R)の復号で、5チャンネル信号、ステレオ信号、モノラル信号のすべてが再構成できる。
【0191】
図50は図49に示した概念による第13実施例の具体的構成例を示す。5チャンネル信号のうち、信号L5c, R5c, LS5c, RS5cに対する符号化処理のための構成は図47の場合と同じであるが、センタ信号C5cに対する符号化がモノラル信号とでなく、和信号(L+R)との差分を取って符号化される点が異なる。図50では、ステレオ信号LとRは減算器78Sで減算されて差信号(L-R)を生成し、圧縮符号化部11Lで可逆符号化される。また、ステレオ信号LとRは加算器78Aで加算され、その加算出力(L+R)は減算器13Mでグレードアップ部62からのサンプルワード長24bit、サンプリングレート192kHzにグレードアップされたモノラル信号M'と減算され、その誤差信号は圧縮符号化部11Rで可逆符号化される。加算器78Aからの出力信号(L+R)はまた、補正部16C5で補正され、減算器13C5に与えられ、5チャンネル信号中のセンタ信号C5cと減算される。各補正部の構成と動作は図47において使用されている補正部16C5,16L5,16R5,16LS,16RS,16L,16Rと同じであり、図52を参照して後述する。
【0192】
図51は図50の符号化装置に対応する復号化装置の構成を示す。この例では、伸張復号化部30Mで復号されたサンプルワード長16bit、サンプリングレート48kHzのモノラル信号Mはそのまま出力されるとともに、グレードアップ部81によりサンプルワード長24bit、サンプリングレート192kHzの信号にグレードアップされ、加算器32Mに与えられる。加算器32Mは伸張復号化部30Rからの復号誤差信号とグレードアップされたモノラル信号M'とを加算し、ステレオ和信号(L+R)を生成する。この和信号(L+R)は補正部36C5で復号化部35C5からの復号された補助情報により補正され(図53を参照して後述)、加算器32C5に与える。加算器32C5は伸張復号化部30C5からの復号誤差信号と補正された和信号(L+R)を加算して5チャンネル信号のセンタ信号C5cを出力する。
【0193】
伸張復号化部30Lで復号された差信号(L-R)と、加算器32Mからの和信号(L+R)は加算器97Aで加算され、2で割り算してステレオ信号Lが生成され、また、減算器97Sで減算され、2で割り算してステレオ信号Rが生成される。伸張復号化部30L5, 30R5, 30LS, 30RSで復号された誤差信号に対する処理は図50の場合と同様であり、その処理により5チャンネル信号C5c, L5c, R5c, LS5c, RS5cが生成される。
図47及び50における各補正部16C5, 16L5, 16R5, 16LS, 16RS, 16L, 16Rは同じ構成であり、例えば図52にその1つを代表して16mnで示すように、前述の図22で示したものと基本的に同じであり、利得調整部16Aと、タイミング調整部16Bと、誤差最小化部16Cとから構成されている。信号源からのチャンネル信号は利得調整部16Aで誤差最小化部16Cから与えられた係数kが乗算され、タイミング調整部16Bで誤差最小化部16Cによりサンプルのタイミングが指定されたシフト量pだけ進み方向または遅延方向にずらされて減算器13mn(13C5, 13L5, ...を代表する)に与えられる。誤差最小化部16Cは減算器13mnの出力誤差のパワーが最小となる係数k及びシフト量pを例えば予め決めた複数の(k,p)の値の組から選択して決定する。この決定された係数kとシフト量pの組を表すインデックスが補正情報として補助情報符号化部15mn(15C5, 15L5, ...を代表する)に与えられ、補助符号として出力される。
【0194】
図48及び51における各補正部36C5, 36L5, 36R5, 36LS, 36RS, 36Lは同じ構成であり、図53にその1つを代表して36mnとして示すように、前述の図23で示したものと基本的に同じであり、利得調整部36Aとタイミング調整部36Bとから構成され、補正情報復号化部35mnからの復号された補正パラメータとして利得調整係数kと時間シフト量pにより信号サンプルの振幅を利得調整部36Aでk倍し、サンプルのタイミングをタイミング調整部36Bでpだけシフトし、加算器32mnに与える。
第14実施例
図54はこの発明による符号化方法の第14実施例の概念を示す。この第14実施例においては、5チャンネルの信号に対してチャンネル間直交変換を行って他チャンネルの信号との差分信号を算出する。チャンネル間直交変換とは、チャンネル間をまたいだ周波数領域への変換などが相当し、同一時刻における各チャンネル1個のサンプルを要素とするチャンネル数Ncを次元数とするベクトルに対し、Nc×Nc直交行列を乗算することと等価である。チャンネル間直交変換としては、例えばチャンネル間の主成分分析行列又はアダマール行列、DCT(ディジタル余弦変換)行列、DFT(ディジタルフーリエ変換)行列、を乗じることが挙げられる。
【0195】
この変換により入力サンプルのベクトルは周波数領域のサンプル要素からなるベクトルに変換される。以下の説明では、その変換出力サンプル要素の周波数の低いほうから順にF0, F1, F2, F3, F4とする。直交変換により最も周波数の低い成分F0は、5チャンネル入力サンプルの和となる成分であり、一般にそれより周波数の高い成分よりもパワーが大きくなる。例えば、マルチチャンネル音楽信号のようなチャンネル間の相関が高い場合、周波数の低域側にエネルギーが集中し、高域側のエネルギーは小さくなっている。従って、チャンネル間直交変換を行うと、周波数の最も低い信号F0側の振幅が大となる。
【0196】
チャンネル間直交変換出力F0〜F4中の振幅の一番大きい信号、例えばF0は、モノラル信号Mとの相関が高いことが期待される。また、2番目に振幅の大きい信号、例えばF1がステレオ差信号(L-R)と相関が高いことが期待される。そこで、モノラル信号Mを補正して振幅の最も大きい直交変換出力信号F0との差分を可逆符号化し、差信号(L-R)を補正して2番目に大きい振幅の直交変換出力信号F1との差分を可逆符号化する。
図55は図54に示した第14実施例の符号化方法の概念を具体的に構成した符号化装置の例を示す。図55における補正部16A, 16Bの構成も接続関係も図52で示したものと同様であり、図を簡略化するために減算器の出力から補正部への接続と、補助情報符号化部15mnの表記を省略してある。5チャンネル信号C5c, L5c, R5c, LS5c, RS5c,に対し直交変換部19でチャンネル間直交変換を行い、変換出力信号F0〜F4を生成する。ステレオ信号L,Rに対しては図50の場合と同様に減算器78Sと加算器78Aにより差信号(L-R)と和信号(L+R)が生成される。差信号(L-R)は圧縮符号化部11Lで可逆符号化される。
【0197】
モノラル信号Mは圧縮符号化部11Mで可逆符号化または非可逆符号化されるとともに、グレードアップ部62でサンプリング周波数が48kHzから192kHzへ、量子化精度が16bitから24bitにグレードアップされる。グレードアップされたモノラル信号Mは減算器13Mで和信号(L+R)と減算され、誤差信号が圧縮符号化部11Rで可逆圧縮される。また、グレードアップされたモノラル信号Mは補正部16Aで補正され、補正された信号と減算器13Aで信号F0〜F4中の最も大きな振幅の信号F0と減算されて得られた誤差信号が圧縮符号化部11C5で可逆符号化される。
【0198】
一方、差信号(L-R)は補正部16Bで補正され、減算器13Bで信号F0〜F4中の2番目に大きい振幅の信号F1と減算され、得られた誤差信号が圧縮符号化部11C5で符号化される。他の変換出力信号F2〜F4は圧縮符号化部11R5, 11LS, 11RSで符号化される。なお、チャンネル間直交変換部19の出力F0, F1, …は入力信号によっては必ずしも常にF0が最大の振幅となり、F1が2番目に大きな振幅となるわけではないが、このような傾向があれば、その傾向にあわせてどの周波数について誤差信号を生成するかを予め決めておけばよい。
図56は図55に対応した復号化装置を示す。伸張復号化部30Mで復号された信号はそのままサンプリング周波数48kHz、量子化精度16bitのモノラル信号Mとして出力されるとともに、グレードアップ部81でサンプリング周波数192kHz、量子化精度24bitの信号にグレードアップされる。伸張復号化部30Rで復号された誤差信号は加算器32Mでグレードアップされたモノラル信号Mと加算され、和信号(L+R)が生成される。この和信号(L+R)と復号化部30Lで復号された差信号(L-R)とが加算器97Aと減算器97Sでそれぞれ加算及び減算されてそれぞれ2で割り算されてステレオ信号LとRが生成される。
【0199】
グレードアップされたモノラル信号Mと差信号(L-R)はそれぞれ補正部36A, 36Bで補正され、補正出力が加算器32A, 32Bでそれぞれ復号化部30C5, 30L5からの復号信号と加算され、信号F0, F1が生成される。これら信号F0, F1及び復号化部30R5, 30LS, 30RSで復号された信号F2, F3, F4はチャンネル間直交逆変換部39で直交逆変換され、時間領域の5チャンネル信号C5c, L5c, R5c, LS5c, RS5cが生成される。
前述した図47及び50の符号化装置の実施例において、5チャンネル信号はサンプリング周波数が192kHz、振幅分解能が24bitとして説明し、これに比べてモノラル信号Mのサンプリング周波数は48kHz、振幅分解能は16bitと低いが、モノラル信号Mをグレードアップ部62においてサンプリング周波数192kHz、振幅分解能24bitにグレードアップして5チャンネル信号のセンタ信号C5cとの差分を可逆符号化している。
【0200】
上述した実施例に拠れば、チャンネル数の異なる可逆な符号化が統一的に実行でき、差分符号化を行わないでそれぞれのチャンネルを別々に符号化する場合に比べてシステム全体として圧縮率を高めることができる。即ち、5チャンネル信号とステレオ信号間の差分を取ることにより両者間の相関を除去できるので、5チャンネル信号とステレオ信号を独立に圧縮したときの合計よりも少ない情報量の符号ビット列となる。また、ネットワーク上の通信量を監視し、通信量が予め決めた値を超えた場合には、例えば5チャンネル信号の送信を停止し、ステレオ信号とモノラル信号のみを送信するなど、ネットワークので利用可能な帯域変動に合わせて、チャンネル数を増減することも可能である。
第15実施例
音声、画像などの情報を圧縮する方法として歪を許さない可逆な符号化方法が知られている。用途によってはサンプリング周波数や量子化精度が異なる場合があり、前述の実施例のように異なる複数種類の組み合わせのサンプリングレートと振幅分解能の信号が予め用意されていると、用途や好みやネットワーク条件によって複数種類のサンプリング周波数の1つと複数種類の振幅分解能の1つの所望の組に対応可能な可逆圧縮符号化が可能となる。以下にそのような圧縮符号化の第15実施例を説明する。
【0201】
ここでは、サンプリング周波数と振幅の量子化精度を前述の図33で示したように2次元的に階層化して信号を符号化することにより、より上位の階層の符号化が下位の階層の符号化で表すことができるようにする。指定されたサンプリング周波数と量子化精度での原音が再現でき、複数種類の符号化に階層的に統合できる。特に下位の階層のサンプリング周波数の信号の低周波数成分と下位の振幅分解能の信号の高周波数成分を組み合わせ、選択又は合成して原音との差分をとることにより符号化効率を改善できる。
図33に示した階層構造によりサンプリング周波数と量子化精度の2次元階層化を行う場合は、量子化精度は階層数P=3であり、それぞれ16, 20, 24ビット、サンプリングレートは階層数Q=3であり、それぞれ48, 96, 192kHzとする。P×Q=9種類の原音A, B, C, D, E, F, G, H, Iが与えられ、できるだけ少ない情報量で符号化し、元の原音を歪なく復号する。原音信号の属性はP×Q=3×3の9種類に階層され、サンプリング周波数と量子化精度が、より下位の信号を用いて上位の信号が構成できるようにする。
【0202】
量子化精度16ビットの信号は、それより下位のサンプリング周波数で同じ量子化精度の信号をアップサンプルした後の信号との誤差信号を符号化する。48kHzの信号はそれより下位の量子化精度の信号を同じ上位に精度変換して、その精度変換した信号との誤差信号を符号化する。サンプリング周波数方向と、量子化精度方向にそれぞれ下位の信号が存在する場合は、2つの下位の信号のうち、いずれかを選択することができる。例えば、サンプリング周波数96kHz、量子化精度20ビットの信号Eを符号化するときにサンプリング周波数96kHz、量子化精度16ビットの信号Bと、サンプリング周波数48kHz、量子化精度20ビットの信号Dのうち、誤差信号のパワーが最小となるほうを選択してもよい。
【0203】
図57はこの第15実施例の符号化装置である。この例では、原音としてサンプリング周波数192kHzで、量子化精度がそれぞれ24bit, 20bit, 16bitの原音信号S3,3, S2,3, S1,3,を出力する信号源103,3, 102,3, 101,3と、サンプリング周波数96kHzで量子化精度がそれぞれ24bit, 20bit, 16bitの原音信号S3,2, S2,2, S1,2を出力する信号源103,2, 102,2, 101,2と、サンプリング周波数48kHzで量子化精度がそれぞれ24bit, 20bit, 16bitの原音信号S3,1, S2,1, S1,1を出力する信号源103,1, 102,1, 101,1が設けられているものとする。それぞれの信号源103,3, 102,3, 101,3からの出力原音信号S3,3, S2,3, S1,3は差分モジュール133,3, 132,3, 131,3においてそれぞれの信号S3,3, S2,3, S1,3より下位の信号を同位にグレードアップして原音信号S3,3, S2,3, S1,3との差分を生成し、圧縮符号化部113,3, 112,3, 111,3により可逆符号化して出力する。
【0204】
同様に、信号源103,2, 102,2, 101,2からの原音信号S3,2, S2,2, S1,2は差分モジュール133,2, 132,2, 131,2においてそれぞれの信号S3,2, S2,2, S1,2より下位の信号を同位にグレードアップして原音信号S3,2, S2,2, S1,2との差分を生成し、圧縮符号化部113,2, 112,2, 111,2により可逆符号化して出力する。信号源103,1, 102,1からの原音信号S3,1, S2,1は差分モジュール133,1, 132,1で信号S3,1, S2,1より下位の信号を同位にグレードアップして信号S3,1, S2,1との差分を生成し、圧縮符号化部113,1, 112,1で可逆符号化して出力する。信号源101,1の原音信号S1,1に対しては、それより下位の信号がないのでそのまま圧縮符号化部111,1で可逆符号化または非可逆符号化して出力する。
【0205】
図57の符号化装置における各差分モジュール133,3, 133,2, 132,3, 132,2は、信号源10m,n(m=2, 3; n=2, 3)からの原音信号Sm,nと、下位の信号Sm-1,nまたはSm,n-1との誤差を生成し、圧縮符号化部11m,nに出力する。下位の信号Sm-1,n又はSm,n-1はアップサンプル、精度調整を経て、信号源10m,nからの原音信号Sm,nにできるだけ近い信号を生成する。この際に、同じサンプリング周波数で量子化精度が下位の信号と、同じ量子化精度でサンプリング周波数が下位の信号の2種類の信号からいずれか1つを選択する。信号の選択情報は補助情報として出力される。
【0206】
例えば差分モジュール133,3には原音信号S3,3と同じ量子化精度24bitでサンプリング周波数は下位の、即ち96kHzの原音信号S3,2と、原音信号S3,3と同じサンプリング周波数192kHzで量子化精度が下位の、即ち20bitの原音信号S2,3が与えられ、図58を参照して後述するように、いずれか一方を選択して原音信号S3,3との差分を生成する。下位のサンプリング周波数の信号に対しては誤差の小さいことが期待される低域(原音信号Sm,nのサンプリング周波数の半値を上限とする低周波成分)のみを使い、下位の量子化精度の信号に対しては、相対的に誤差の小さいことが期待される高域(原音信号Sm,nのサンプリング周波数の半値を下限とする高周波成分)のみを使う。
【0207】
あるいは、上記選択のほかに、2種類の信号を合成することが可能である。合成には、平均、重みつき加算、時間的に変動する重みつき加算などが含まれる。例えば図59を参照して後述するように、2つの信号S3,2, S2,3の重み付け平均と原音信号S3,3との差分を生成し、出力する。差分モジュール132,3, 133,2, 132,2も同様の構成である。
差分モジュール131,3, 131,2, 133,1, 133,2についてはそれらの入力原音信号S1,3, S1,2, S3,1, S2,1より下位のサンプリング周波数の信号はないので、下位の量子化精度の原音信号S1,2, S1,1, S2,1, S1,1のみが与えられる。
【0208】
また、フレーム全体で選択するのではなく、サブフレームごと、又は複数フレームごとに差分パワーが小さくなるほうを選択することも可能である。差分モジュール131,3, 131,2, 133,1, 132,1では、信号源からの信号S1,3, S1,2, S3,1, S2,1に対し、それらより下位の各1つの信号との差分を取り、対応する圧縮符号化部に与える。
図58は各差分モジュール133,3, 132,3, 133,2, 132,2のうちのいずれか1つを13m,nと表して、その入力原音信号Sm,n(m=2, 3; n=2, 3)に対し、それより下位の原音信号Sm,n-2とSm-1,nが入力され、それらはそれぞれアップサンプリング部13Aと精度変換部13Cに与えられる。アップサンプル部13Aで下位の信号Sm,n-1はアップサンプルされ原音信号Sm,nと同じサンプリングレートとされ、そのサンプリング周波数の半値を上限とするカットオフ周波数とする低域通過フィルタ13Bを通してセレクタ13Eに与えられる。精度変換部13Cで下位の信号Sm-1,nは上位ビット方向に4ビットシフトされることにより4ビットの"0"が付加されて信号Sm,nと同じ量子化精度とされ、原音信号Sm,nのサンプリング周波数の半値を下限とするカットオフ周波数とする高域通過フィルタ13Dを通してセレクタ13Eに与えられる。セレクタ13Eにより選択された信号は減算器13Sで入力信号Sm,nと減算される。誤差最小化部13Fは減算器13Sの出力誤差のパワーが最小となる方の信号を選択するようにセレクタ13Eを制御し、どちらの信号を選択したかを表す選択情報を補助情報として出力する。補助情報は図57に破線で示すように対応する圧縮符号化部11m,nに与えられ、誤差信号とともに符号化される。
【0209】
図59は原音信号Sm,nに対し下位の信号Sm,n-1とSm-1,nの重み付け平均を行う場合の差分モジュール13m,n(m=2, 3; n=2, 3)の構成例を示す。図58の差分モジュールにおけるセレクタ13Eの代わりに重み乗算器13G, 13Hと加算器13Kが設けられ、誤差最小化部13Fにより設定された重み係数w1, w2と原音信号Sm,nのサンプリング周波数の半値を上限とするカットオフ周波数を持つ低域通過フィルタ13Bからの出力及び高域通過フィルタ13Dからの出力がそれぞれ乗算され、これら2つの乗算結果は加算器13Kで加算され、減算器13Sに与えられる。誤差最小化部13Fには予め決められた複数の組の重み係数(w1, w2)が組ごとに符号に対応して重み係数表として記憶部(図示してない)に格納されており、誤差最小化部13Fは減算器13Sの出力誤差のパワーが最小となるような重み係数w1, w2の組を重み係数表から選択し、その組の重み係数w1, w2に対応する符号を補助情報として出力する。図57における差分モジュール131,3, 131,2, 133,1, 132,1の場合は、より下位の信号はそれぞれS1,2, S1,1, S2,1, S1,1の1つずつだけなので、図58におけるアップサンプリング部13A、低域通過フィルタ13B、セレクタ13E、誤差最小化部13Fは不要であり、高域通過フィルタ13Dの出力はそのまま減算器13Sに与えられる。同様に、これらの差分モジュールは図59の場合、高域通過フィルタ13Dからの出力はそのまま減算器13Sに与えられる。
【0210】
図60は図57の符号化装置に対応する復号化装置の構成例を示す。音源信号I, F, C, H, E, B, G, D, Aに対応した入力符号はそれぞれ伸張復号化部で補助情報とともに復号され、伸張復号化部301,1からの復号出力は最下位の復号原音信号S1,1として出力されるとともに、それぞれ加算モジュール321,2, 322,1に与えられる。それ以外の復号化部303,3〜302,1の復号誤差信号は加算モジュール323,3〜322,1に与えられる。加算モジュール323,3, 3222,3, 323,2, 322,2は復号された各誤差信号と、それより下位からの2つのグレードアップした原音信号のいずれかとを加算して、あるいは2つの重み付き平均と加算して原音信号S3,3, S2,3, S3,2, S2,2を生成する。加算モジュール321,3, 323,1, 322,1は復号された誤差信号とそれより下位のグレードアップした復号原音信号を加算して原音信号S1,3, S2,3, S2,1, S3,2を生成する。
【0211】
図60中の加算モジュール323,3, 322,3, 323,2, 322,2の任意の1つを32m,n(m=2, 3; n=2, 3)と表し、その構成を図61に示す。mまたはnの値が大きいほうがサンプリング周波数又は量子化精度が高い(つまり上位の属性である)。この例は図58の差分モジュール13m,nに対応して、2つの下位信号の1つを選択して使用する場合である。下位の原音信号Sm,n-1, Sm-1,nはそれぞれアップサンプル部32A、精度変換部32CでSm,nと同じサンプリングレート、Sm,nと同じ量子化精度にグレードアップされ、それぞれ低域通過フィルタ32B、高域通過フィルタ32Dを通してセレクタ32Eに与えられる。制御部32Fは復号された補助情報として2つの下位の信号のうち、どちらを選択したかを表す選択情報に従ってセレクタ32Eを切り替えて選択された信号が加算器32で復号誤差信号と加算されて原音信号Sm,nが生成される。他の加算モジュール321,3, 321,2, 323,1, 322,1は図示していないが、図61においてアップサンプリング部32A、低域通過フィルタ32B、セレクタ32E、制御部32Fを除去し、高域通過フィルタ32Dからの出力を加算器32Sに与える構成となる。
【0212】
図62は図60における加算モジュール32m,n(m=2, 3; n=2, 3)の、図59の差分モジュールに対応した構成を示す。この場合は図61におけるセレクタ32Eの代わりに係数乗算器32G, 32Hと加算器32Kが設けられる。グレードアップされた下位信号Sm,n-1, Sm-1,nに補助情報として復号された重み係数w1, w2が乗算器32G, 32Hで乗算され、乗算結果は加算器32Kで加算される。加算結果は加算器32で伸張復号化部30m,nからの復号誤差信号と加算され、原音信号Sm,nが生成される。他の加算モジュール321,3, 321,2, 323,1, 322,1は図示していないが、図62においてアップサンプリング部32A、低域通過フィルタ32B、乗算器32G、加算器32Kを除去し、乗算器32Hの出力を加算器32Sに与える構成となる。
【0213】
図58、59に示した差分モジュールにおいて、アップサンプル部13A、精度変換部13Cの出力側を図63、64に示すように、それぞれ低域通過フィルタ13B1, 高域通過フィルタ13B2及び低域通過フィルタ13D1, 高域通過フィルタ13D2を設け、下位のサンプリングレートの信号Sm,n-1に対しても、下位の量子化精度の信号Sm-1,nに対しても、上位にグレードアップ後、カットオフ周波数としてその上位のサンプリング周波数の半値より低周波成分と高周波成分に分離し、それらフィルタ出力のうち、減算器13からの出力誤差のパワーが小さい方のフィルタ出力の組を誤差最小化部F13で判定し、セレクタ13Eで選択する(図63)。または、図64に示すようにすべてのフィルタ13B1, 13B2, 13D1, 13D2の出力を乗算器13G1, 13G2, 13H1, 13H2で重み係数w11, w12, w21, w22を乗算し、それらの乗算結果を加算器13Kで加算することにより重み付け平均し、減算器13の出力誤差のパワーが最小となるよう誤差最小化部13Fで重み係数w11, w12, w21, w22を決めることも可能である。この場合、誤差最小化部13Fには記憶部(図示してない)が設けられ、複数の組の重み係数(w11, w12, w21, w22)の値がそれぞれの組を表す符号に対応して表として記憶部に格納されており、それらの組から誤差信号のパワーが最小となる組を探索して決定し、その組に対応する符号を出力してもよい。
【0214】
図61、62に示した復号化装置における加算モジュール32m,nについても図63、64で示したと同様に図65、66に示すようにアップサンプル部32Aの出力を低域通過フィルタ32B1と高域通過フィルタ32B2で信号Sm,nのカットオフ周波数としてサンプリング周波数の半値より高周波成分と低周波成分の2つの成分に分離し、同様に精度変換部32Cからの出力も低域通過フィルタ32D1と高域通過フィルタ32D2により信号Sm,nのカットオフ周波数としてサンプリング周波数の半値より高周波成分と低周波成分の2つの成分に分離し、セレクタ32Eでこれらのフィルタの出力を復号された選択情報に従って選択(図65)するか、重み係数乗算器32G11, 32G12, 32G21, 32G22で入力符号が表す重み係数w11, w12, w21, w22をそれぞれのフィルタ出力に乗算して加算器32Kで加算することにより、重み付き平均を求める(図66)ように構成することができる。
【0215】
図67は、下位のサンプリング周波数の信号Sm,n-1のカットオフ周波数より低域成分と、下位の量子化精度の信号Sm-1,nの高域成分を簡易に合成する実施例を示す。図67Aに示す下位のサンプリング周波数の信号Sm,n-1のN番目(N=0, 1, 2, …)のサンプルの振幅値をそのまま図67Bに示す倍のサンプリング周波数の偶数番2Nのサンプル位置に配置する。次に図67Cの下位の量子化精度の信号Sm-1,nはサンプル位置を合わせてそのまま奇数番目のサンプルを対応する位置に配置する。
または、偶数番目のサンプルは上記と同様に配置し、奇数番目のサンプルは下位のサンプル周波数の信号Sm,n-1をアップサンプルした信号と下位の量子化精度の信号の重み付け加算又はいずれか一方を選択して得た信号のサンプルを配置することが可能である。
第16実施例
前述の第15実施例では図33、34に示した量子化精度とサンプリング周波数の2次元階層化を利用した場合の符号化と復号化について説明したが、この第16実施例では図42、43に示した量子化精度とサンプリング周波数の2次元階層化を使用し、かつ誤差信号を周波数領域で符号化するものである。この実施例を図68を参照して説明する。
【0216】
図68に示すように、第16実施例による符号化装置は、図42、43の信号階層構造に基づく図44に示したと同様の音源601,1〜603,3を有している。この実施例においてはサンプリング周波数96kHzと192kHzの音源601,2〜603,3の出力は、それぞれのサンプリング周波数に対応した予め決めたサンプル数(変換長)ごとに直交変換部191,2〜193,3により周波数領域のそれぞれ同数のサンプルに変換され、対応する減算部631,2〜633,3に与えられる。
減算部631,3, 632,3, 633,3には、下位のサンプリング周波数96kHzの音源601,2, 602,2, 603,2からのディジタル信号が直交変換部191,2, 192,2, 193,2で変換されて出力された周波数領域信号がそれぞれ補正部161,3, 162,3, 163,3により補正されて与えられ、直交変換部191,3, 192,3, 193,3からの周波数領域信号との差分が周波数領域の誤差信号Δ1,3, Δ2,3, Δ3,3として生成され、それらは圧縮部611,3, 612,3, 613,3により圧縮符号化され、符号C,K,Mとして出力される。サンプリング周波数48kHzの信号S1,1, S2,1に対する量子化精度の精度変換は時間領域で行うのが自然であり、音源601,1, 602,1からの量子化精度16ビット及び20ビットのディジタル信号S1,1, S2,1はそれぞれ精度変換部621,1, 622,1に与えられる。
【0217】
最下位のディジタル信号S1,1は直交変換部191,1に与えられ、直交変換部191,1により変換された周波数領域信号はそのまま圧縮部611,1で圧縮符号化され、符号Aとして出力される。
精度変換部621,1は与えられたディジタル信号S1,1の各サンプルの最下位ビットに更に下位位置に4ビットの"0"を付加することにより量子化精度を16ビットから20ビットに変換し、減算部632,1に与える。減算部632,1は精度変換された信号と、音源602,1からのディジタル信号S2,1との差分を誤差信号として生成し、直交変換部192,1に与える。直交変換部192,1は与えられた誤差信号を周波数領域の誤差信号Δ2,1に変換して圧縮部612,1に与え、圧縮部612,1は与えられた誤差信号Δ2,1を圧縮符号化し、符号Dとして出力する。同様に、音源603,1からのディジタル信号S3,1は、精度変換部622,1からの量子化精度が20ビットから24ビットに変換された信号との差分が減算部633,1で取られ、生成された誤差信号は直交変換部193,1で周波数領域誤差信号Δ3,1に変換され、圧縮部613,1で圧縮符号化され、符号Gとして出力される。
【0218】
サンプリング周波数96kHzで量子化精度16ビットの信号S1,2は、図42から明らかなように、符号AとBの信号成分を含み、量子化精度20ビットの信号S2,2は符号A,D,Jの信号成分を含み、量子化精度24ビットの信号S3,2は符号A,D,G,Lの信号成分を含んでいる。従って、符号B,J,Lのそれぞれの信号成分が得られるように減算部631,2, 632,2, 633,2において周波数領域の差分演算が行われる。即ち、量子化精度16ビットの信号S1,1に対する直交変換部191,1による変換信号が補正部161,2を通して減算部631,2に与えられ、サンプリング周波数96kHzの信号S1,2を周波数領域に変換した信号との差分が取られ、その差分が周波数領域の誤差信号Δ1,2として圧縮部611,2に与えられ、圧縮符号化されて符号Bとして出力される。
【0219】
同様に、ディジタル信号S2,2が直交変換されて減算部632,2に与えられ、直交変換部191,1, 192,1からの周波数領域信号が補正部を介して減算部632,2に与えられ、信号S2,2の周波数領域成分から減算されることにより周波数領域の誤差信号Δ2,2が生成され、その誤差信号Δ2,2が圧縮部612,2により圧縮符号化されて符号Jとして出力される。更に、減算部633,2ではディジタル信号S3,2の周波数領域信号からディジタル信号S1,1の周波数領域成分及び周波数領域誤差信号Δ2, 1, Δ3,1を減算することにより誤差信号Δ3,2を生成し、圧縮部613,2で圧縮符号化して符号Lとして出力する。
【0220】
直交変換部191,2, 192,2, 193,2からの周波数領域信号はそれぞれ補正部161,3, 162,3, 163,3を通して減算部631,3, 632,3, 633,3に与えられ、直交変換部191,3, 192,3, 193,3からの周波数領域信号と減算され、誤差信号Δ1,3, Δ2,3, Δ3,3が得られる。これら誤差信号は圧縮部で圧縮符号化され、符号C,K,Mとして出力される。
各直交変換部191,1〜193,3としては歪のない再生を行うために、例えば整数係数のDCT(離散コサイン変換)やMDCT(変形離散コサイン変換)などを使用することができる。また、それらの変換長をサンプリング周波数に合わせて決めることにより、異なるサンプリング周波数間の誤差信号を小さくすることができる。例えばサンプリング周波数48kHz, 96kHz, 192kHzのディジタル信号に対する変換長をサンプル数でそれぞれN点、2N点、4N点とする。サンプリング周波数96kHzの信号の2N点のサンプルを変換して得た周波数領域の2N点の信号のうち、下位N点はサンプリング周波数48kHzの信号のN点のサンプルを変換して得た周波数領域のN点の信号と類似しており、そのまま差分を取れば誤差信号を小さくすることができる。サンプリング周波数192kHzの信号とサンプリング周波数96kHzの信号との関係も同様である。
【0221】
このように、この実施例で特徴的なことは、周波数領域で誤差信号を得るため、異なるサンプリング周波数の信号間でアップサンプルを行わないで誤差信号を生成できる点である。また、各補正部161,2, 162,2, 163,2, 161,3, 162,3, 163,3は、例えば周波数領域信号の利得を図52で説明したように誤差信号のパワー(スペクトルパワー)が最小となるように調整し、その利得を表す符号を補助情報として出力する。この利得調整は周波数領域のそれぞれのサンプルに重み係数を与えて行ってもよい。
図68の符号化装置に対応する復号化装置の例を図69に示す。入力符号A, D, G, B, J, L, C, K, Mはそれぞれ伸張部801,1〜803,3に与えられ伸張復号が行われ、周波数領域の最下位信号と誤差信号Δ2,1〜Δ3,3が生成される。最下位の伸張部801,1からの復号信号は直交逆変換部391,1により時間領域信号に変換され最下位のディジタル信号S1,1が再生される。周波数領域の誤差信号Δ2,1は直交逆変換部392,1で時間領域の誤差信号に変換されてから加算部822,1に与えられ、精度変換部811,1で量子化精度が20ビットに高くされた信号と加算されてディジタル信号S2,1が再生される。この再生信号S2,1は精度変換部812,1により量子化精度が24ビットに上げられて加算部823,1に与えられる。誤差信号Δ3,1が直交逆変換部393,1により時間領域誤差信号に変換されて、加算部823,1で量子化精度が上げられた信号と加算されディジタル信号S3,1が再生される。なお、直交逆変換部391,1〜393,3は図68における直交変換部191,1〜193,3の処理と逆の処理を行い、周波数領域信号を時間領域信号に変換する。
【0222】
周波数領域誤差信号Δ1,2は伸張部801,2により復号され、補正部361,2で補正された周波数領域信号が加算部821,2で加算されて、直交逆変換部391,2で時間領域信号に変換されディジタル信号S1,2が再生される。同様に周波数領域の誤差信号Δ2,2は、伸張部801,1, 802,1からの信号が補正部362,2で各々補正されてから加算部822,2で加算され、加算結果が直交逆変換部S2,2により時間領域信号に変換されてディジタル信号S2,2が再生される。また、周波数領域の誤差信号Δ3,2は、伸張部801,1, 802,1, 803,1からの信号が補正部363,2で各々補正されてから加算部823,2で加算され、加算結果が直交逆変換部393,2により時間領域信号に変換されてディジタル信号S3,2が再生される。周波数領域誤差信号Δ1,3, Δ2,3, Δ3,3は、加算部821,2, 822,2, 823,2からの周波数領域信号がそれぞれ補正部361,3, 362,3, 363,3により各々補正されて加算部821,3, 822,3, 823,3で加算され、加算結果は直交逆変換部391,3, 392,3, 393,3により時間領域信号に変換されディジタル信号S1,3, S2,3, S3,3が各々再生される。なお、各補正部361,2, 362,2, 363,2, 361,3, 362,3, 363,3は、入力された補助情報が示すパラメータを用いて図68における補正部161,2, 162,2, 163,2, 161,3, 162,3, 163,3と同様に例えば利得の補正を行う。
【0223】
図68の実施例では最下位のサンプリング周波数48kHzのディジタル信号S2,1, S3,1に対する誤差信号は時間領域で求め、それを周波数領域に変換した場合を示したが、図70に示す変形実施例では、最下位のサンプリング周波数48kHzのディジタル信号S2,1, S3,1に対する誤差信号も周波数領域で求める場合を示す。その他の構成は図68と同様である。
この場合は、精度変換部621,1, 622,1は、量子化精度が16ビット及び20ビットのディジタル信号S1,1, S2,1を直交変換部191,1, 192,1により変換した周波数領域信号が与えられ、それぞれの周波数領域サンプルの最下位に4ビットの"0"を付加することにより量子化精度を1階層向上させてそれぞれ20ビット、24ビットとして減算部632,1, 633,1に与える。減算部632,1, 633,1はディジタル信号S2,1, S3,1が直交変換部192,1, 193,1により周波数領域信号に変換されて与えられ、精度変換部621,1, 622,1からの精度変換された信号とそれぞれ減算され誤差信号Δ2,1, Δ3,1を生成する。
【0224】
また、サンプリング周波数48kHzのディジタル信号S1,1, S2,1, S3,1が周波数領域信号に変換されてそれぞれ補正部161,2, 162,2, 163,2を通して減算部631,2, 632,2, 633,2に与えられ、サンプリング周波数96kHzのディジタル信号S1,2, S2,2, S3,2が直交変換部191,2, 192,2, 193,2により変換された周波数領域信号と減算され、誤差信号Δ1,2, Δ2,2, Δ3,2が生成される。その他の構成と動作は図68の場合と同様である。
図70の変形実施例による符号化装置に対応する復号化装置を図71に示す。この実施例においても最下位のサンプリング周波数についての復号信号に対する精度変換を周波数領域で行う。即ち、伸張部801,1により入力符号Aが伸張復号されて周波数領域信号が得られ、その周波数領域信号は精度変換部811,1に与えられると共に直交逆変換部391,1で時間領域信号に変換され、ディジタル信号S1,1が再生される。その他の構成は図20と同様である。
【0225】
伸張部802,1, 803,1, 801,2, 802,2, 803,2, 801,3, 802,3, 803,3は入力された符号D, G, B, J, L, C, K, Mを伸張復号してそれぞれ周波数領域誤差信号Δ2, 1, Δ3,1, Δ1,2, Δ2,2, Δ3,2, Δ1,3, Δ2,3, Δ3,3が生成され、それぞれ加算部822,1, 823,1, 821,2, 822,2, 823,2, 821,3, 822,3, 823,3に与えられる。精度変換部811,1で量子化精度が16ビットから20ビットに変換された信号は加算部で誤差信号Δ2,1と加算され、加算結果は精度変換部に与えられると共に直交逆変換部392,1で時間領域信号に変換されディジタル信号S2,1が再生される。精度変換部812,1は与えられた量子化精度20ビットの周波数領域信号を量子化精度24ビットに変換し、加算部823,1に与えて誤差信号Δ3,1と加算され、加算結果は直交逆変換部393,1で時間領域信号に変換されディジタル信号S3,1が再生される。
【0226】
直交逆変換部391,1, 392,1, 393,1への入力信号はそれぞれ補正部361,2, 362,2, 363,2を通して加算部821,2, 822,2, 823,2に与えられ、周波数領域誤差信号Δ1,2, Δ2,2, Δ3,2と加算される。これらの加算結果はそれぞれ直交逆変換部391,2, 392,2, 393,2で時間領域信号に変換され、ディジタル信号S1,2, S2,2, S3,2が再生される。同様に、直交変換部391,2, 392,2, 393,2への入力信号はそれぞれ補正部361,3, 362,3, 363,3を通して加算部821,3, 822,3, 823,3に与えられ、周波数領域誤差信号Δ1,3, Δ2,3, Δ3,3と加算される。これらの加算結果はそれぞれ直交逆変換部391,3, 392,3, 393,3で時間領域信号に変換され、ディジタル信号S1,3, S2,3, S3,3が再生される。
【0227】
図68の実施例において、補正部161,2, 162,2, 163,2, 161,3, 162,3 163,3による補正は周波数領域において行っているが、時間領域で行ってもよい。時間領域における補正も例えば誤差信号のパワーが最小となるように信号S3,2対し利得を調整する。例えば、補正部163,3において破線で示すように、直交変換部193,2の入力である時間領域のディジタル信号S3,2を補正部16'3,3で補正し、補正結果を直交変換部19'3,2で直交変換して周波数領域信号として減算部633,3に与える。他の補正部においても同様である。この場合、復号化装置では、図69に破線で示すように直交逆変換部393,2から得られた時間領域の再生ディジタル信号S3,2を補正部36'3,3で補正し、補正結果を直交変換部39'3,2で周波数領域信号に変換して加算部823,3で周波数領域の誤差信号Δ3,3に加算すればよい。他の補正部についても同様である。あるいは、補正処理が可逆な処理であれば、図68中に示すように単にディジタル信号S3,2を補正部16"3,3で補正して直交変換部193,2に与え、直交変換部193,2の出力をそのまま減算部633,3に与えてもよい。この場合、復号化装置では図69中に破線で示すように加算部823,2の出力をそのまま加算部823,3に与え、対応する直交逆変換部393,2の出力時間領域信号に対し補正部36"3,3により補正を行うだけでよい。後者の変形例では符号化装置及び復号化装置とも直交変換部の数を増やす必要はない。
第17実施例
上述したこの発明で扱う複数の原音信号は、サンプリング周波数、量子化精度、チャンネル数などの信号の属性が異なる場合があり、それらの異なる複数種類の組み合わせの信号が予め用意され、それらの複数信号系列の階層符号化により全体の圧縮効率を改善できる。ここではこのような複数信号の多様な階層構造を指定する方法について説明する。
【0228】
前述のようにサンプリング周波数、量子化精度、更にチャンネル数を階層化してより上位の階層の信号の符号化が下位の階層の信号の符号化を包含することができる。これにより指定されたサンプリング周波数、量子化精度、チャンネル数での原音信号が再現でき、複数種類の条件の符号化を統合できる。ここでは特に各入力信号に対し、自由度を確保した記述法を提供する。
図72は階層の関連付けが指定された圧縮符号列の構成を示す実施例である。この実施例はサンプリング周波数(周波数方向)と量子化精度の階層化、更にチャンネル数の階層構成を想定して、階層間の誤差信号を圧縮符号化した符号列とする。ここでは符号列M,L,G,Aの4つの圧縮符号列を示している。各圧縮符号列は、同じ階層の原音信号を圧縮符号化した一連の符号をデータ領域(後述のフィールドx9)に有しており、従って、符号列に対しても原音信号と同じ階層を定義する。各符号列にはその属性(階層情報)を記述するフィールドx1〜x7が付加されている。
【0229】
フィールドx1は符号列の系列番号を表し、ここでは複数の符号列M, L, G, Aに順番にそれぞれ与えられた系列番号0, 1, 2, 3が書き込まれている。フィールドx2は対応する原音信号のチャンネル構成を表し、フィールドx3は原音信号のサンプリングレートを表し、フィールドx4は原音信号の量子化精度を表し、フィールドx5は対応する音源信号の下位系列の個数を表し、フィールドx6はその下位符号列の系列番号を表し、フィールドx7は補助情報があるか否かを"1"または"0"で表す拡張フラグを表し、フィールドx9はデータ(圧縮符号化により得られた符号列)を表す。フィールドx7の拡張フラグが"1"のときにのみ符号列Gで示すように補助情報を表すフィールドx8が挿入される。例えば符号列Mのようにその符号列に対する下位系列として符号列LとGの2つある場合は下位系列の数x5は2であり、フィールドx6にはその2つの下位系列の系列番号2,3が書き込まれる。最下位の系列Aにはそれ以下の系列はない。
【0230】
拡張フラグx7が"1"であればフィールドx8の符号化補助情報が追加され、拡張フラグが"0"であればフィールドx9のデータ列が開始する。符号列Gは拡張フラグx7が1であり、補助情報のフィールドx8が挿入されている例を示している。各系列はフレーム単位でパケットに対応つけて伝送することが一般的であり、パケットの管理は例えば既存のインターネットプロトコルに従えばよい。伝送せずに蓄積するだけの場合には各符号系列の先頭位置を符号系列とは別途管理しておくことが一般的である。
図73は量子化精度が24bitで、サンプリング周波数が192kHzと96kHzの原音信号S1,1, S1,2及びサンプリング周波数が48kHzで、量子化精度が24bitと16bitの原音信号S2,1, S2,2に対する階層符号化の例を示す。
【0231】
信号源102,2からの原音信号S2,2はその下位の信号S2,1をアップサンプル部13A1でサンプリング周波数96kHzから192kHzにアップサンプルして得た信号との減算を減算器132,2で行い、得られた誤差信号Δ2,2を圧縮符号化部112,2で可逆圧縮符号化して符号列Mを出力する。また信号源102,1からの原音信号S2,1はその下位の信号S1,2をアップサンプル部13A2でサンプリング周波数48kHzから96kHzにアップサンプルして得た信号との減算を減算器132,1で行い、得られた誤差信号Δ2,1を圧縮符号化部112,1で可逆符号化して符号列Lを得る。さらに、信号源101,2からの原音信号S1,2はその下位の信号S1,1を精度変換部13C1で量子化精度を16bitから24bitに変換された信号との減算を減算器131,2で行い、得られた誤差信号Δ1,2を圧縮符号化部111,2で可逆符号化して符号列Gを得る。信号源101,1からの最下位の信号S1,1はそのまま圧縮符号化部111,1で符号化され、符号列Aとされる。
【0232】
従って、符号列Mは下位の符号列Lと関係付けられ、符号列Lは下位の符号列Gと関係付けられ、符号列Gは下位の符号列Aと関係付けられている。
図74は図73の符号化処理により生成された符号列M,L,G,Aに対し、階層構造を規定する情報フィールドx1〜x7が付加された符号列と符号列間の関連付けを示す。符号系列M,L,G,Aにはそれぞれ系列番号0, 1, 2, 3がフィールドx1に書き込まれている。フィールドx2にはそれぞれの符号系列に対応する原音信号のチャンネル構成(チャンネル数)2, 2, 2, 2が書き込まれている。また、フィールドx3には対応する原音信号のサンプリングレート192, 96, 48(kHz)が書き込まれている。フィールドx4には対応する原音信号の量子化精度24, 24, 24, 16(bit)が書き込まれている。各音源信号S22, S21, S12が差分をとるのに使用する下位の音源信号は1つであり、音源信号S22は差分を取らないので、符号系列M,L,Gの下位の系列個数として"1"がフィールドx5に書き込まれており、フィールドx6にはそれぞれの下位の符号系列番号が書き込まれている。符号系列Aのフィールドx5, x6には0が書き込まれている。符号系列M,L,G,Aは補助情報を使用してないのでフィールドx7はすべて"0"とされている。
【0233】
図75は3種類のサンプリング周波数192kHz, 96kHz, 48kHzと3種類の量子化精度24bit, 20bit, 16bitの組み合わせによる9種類の階層化された原音信号を符号化する構成であり、この階層構造を記述したフィールドを有する符号系列を図76に示す。図75の符号化においては、補助情報は使用してないのでフィールドx7の拡張フラグはすべて"0"とされている。また、最下位の信号S1,1を除く他のすべての信号S3,3, S2,3, S1,3, S3,2, S2,2, S1,2, S3,1, S2,1はそれぞれ下位の1つの信号とのみ差分を取っているので、下位系列個数のフィールドには"1"が書き込まれている。
【0234】
図77は図57に示した階層化原音信号に対する符号化により生成された符号列I, F, C, H, E, B, G, D, Aに対する階層構造の記述である。図75の場合と同様に9種類の階層化された原音信号を圧縮符号化する。この符号化には補助情報を使用しているので、符号系列Aを除く他のすべての符号系列の拡張フラグx7は"1"とされ、その直後に符号化された補助情報のフィールドx8が挿入されている。
図78は図50に示したマルチチャンネルの階層符号化による符号系列に対応する階層構造の記述を示す。これまでの実施例では符号化装置では下位の系列からは引き算、あるいは復号化装置では下位の系列からの足し算が前提であった。図78では5番と6番の符号系列のフィールドx6に指定された系列番号7番と8番の符号系列が図50における差信号と和信号の符号列への変換を表しており、復号化装置として解釈すると、5番目と6番目の符号系列にはフィールドx9の圧縮符号データが付加されなく、系列番号5番の補助情報は復号側に対し系列番号7番と8番の符号系列から和の信号を作ることを指定し、系列番号6番の補助情報は復号側に対し系列番号7番と8番の符号列から差信号を作ることを指定している。このため、符号系列5番と6番は後続する圧縮符号データを持っていない。
【0235】
図55で説明したチャンネル間直交変換を行う符号化の場合は、例えば図78においてチャンネル間直交変換が行われた符号系列の補助情報フィールドx8にそれぞれ直交変換を行ったことを表す情報を書き込み、必要であればその詳細を更に付加することができるように文法を予め決めておく。
上述してきた各実施例の符号化装置による基本的な処理手順を図79に示す。この発明においては、階層化された属性を有する複数の原音信号を符号化の対象とする。属性とは、例えば第1乃至第16実施例においてはサンプリング周波数の種類やサンプルの量子化精度の種類がそうであり、更に第12〜第14実施例では5チャンネル信号、ステレオ信号(2チャンネル信号)、モノラル信号(1チャンネル信号)のように、異なるチャンネル数の複数のグループの信号システムにおいて、信号が属するグループのチャンネル数もその信号の属性である。チャンネル数の減少する方向を下位の方向とする。第15実施例においては属性は信号の予め決めた複数のサンプリング周波数及び複数の予め決めた振幅分解能である。以上の定義のもとに、符号化処理は以下のように行われる。
【0236】
ステップS1:符号化対象の原音信号に対し、それより属性が下位の原音信号があるか探す。
ステップS2:下位の原音信号があれば、符号化対象の原音信号と、下位の原音信号又はその変形信号との誤差信号を生成する。即ち、下位の原音信号が2つある場合は、下位の2つの信号から合成した変形信号を得て、その変形信号と符号化対象信号間の誤差信号を求める。
ステップS3:上記誤差信号を可逆符号化する。
ステップS4:すべての原音信号について符号化が終了したか判定し、終了してなければステップS1に戻る。
【0237】
ステップS5:ステップS1で符号化対象の原音信号より下位の原音信号がない場合は、その原音信号を可逆符号化する。
また、上述した実施例の復号化装置による基本的処理手順を図80に示す。
ステップS1:複数の入力符号を復号し、誤差信号と原音信号を得る。
ステップS2:誤差信号より属性が下位の復号原音信号又はその変形信号とその誤差信号を合成して復号原音信号を生成する。
ステップS3:すべての入力符号について処理が終了したか判定し、終了してなければステップS1に戻る。
【0238】
このような符号化処理手順及び復号化処理手順は、コンピュータで実行可能なプログラムとして記述することができる。そのようなプログラムをインストールしたコンピュータによりこの発明による信号の符号化及び復号化を実行することができる。
図81はプログラムに記述したこの発明による符号化方法及び復号化方法を実行するコンピュータの構成を示す。コンピュータ100は共通データバス160に接続されたランダムアクセスメモリ(RAM)110と、中央演算装置(CPU)120と、ハードディスク(HD)130と、入出力インタフェース140と、送受信部150とを有している。図79及び80で説明した符号化処理及び復号化処理の手順を記述したプログラムはハードディスク130に図示してないメディアドライブ(例えばCDドライブ)に挿入した記録媒体から予めインストールしておく。あるいは、ネットワークNWからダウンロードしたプログラムをインストールしてもよい。
【0239】
符号化処理又は復号化処理を実行する場合は、ハードディスク130からプログラムをRAM110に読み込み、CPU120の制御に従ってプログラムを実行する。例えば符号化処理を行う場合、入出力インタフェース140に接続されたマルチチャンネル入力装置220からのマルチチャンネル信号を符号化し、ハードディスク130に一時的に蓄積するか、送受信部150からネットワークNWに送出してもよい。復号処理を行う場合は、例えばネットワークNWから受信したマルチチャンネル音楽プログラムの符号を復号し、入出力インタフェース140からマルチチャンネル再生装置210に出力して再生することができる。
【0240】
【発明の効果】
以上説明したように、この発明によれば、階層化された属性を有する信号を、その信号より下位の属性の信号又はその変形信号との誤差信号を生成し、その誤差信号を可逆符号化することにより、効率のよい符号化が実現でき、また可逆な符号化が実現できる。
【図面の簡単な説明】
【図1】この発明による第1実施例の符号化装置と復号化装置の機能構成例を示す図。
【図2】この発明による第2実施例の符号化装置と復号化装置の機能構成例を示す図。
【図3】この発明による第3実施例の符号化装置と復号化装置の機能構成例を示す図。
【図4】配列変換・符号化部18の機能構成例を示す図。
【図5】Aは極性と絶対値で現されたサンプル列のビット配列変換を説明するための図、Bは2の補数表現されたサンプル列のビット配列変換を説明するための図、Cはパケットのフォーマットの例を示す図である。
【図6】復号・配列逆変換部45と欠落補正部58の機能構成例を示す図。
【図7】図6における欠落情報補正処理の手順の例を示す流れ図。
【図8】図6における欠落情報補正部58Bの具体的機能構成例を示す図。
【図9】この発明の第3実施例の符号化装置と復号化装置の機能構成例を示す図。
【図10】Aは図9における予測誤差生成部31の具体的機能構成例を示す図、Bは予測誤差生成部31の他の構成例を示す図。
【図11】Aは図9における予測合成部56の具体的機能構成例を示す図、Bは予測合成部56の他の構成例を示す図。
【図12】Aは誤差信号の概念的なスペクトル特性の例を示す図、BはAのスペクトル特性の周波数軸を反転して得られるスペクトル特性を示す図。
【図13】この発明の第4実施例の符号化装置と復号化装置の機能構成例を示す図。
【図14】Aはこの発明による符号の階層的分割の例を示す図、Bは振幅分解能と振幅語長の関係例を示す図。
【図15】図14Aに示した階層的分割された符号の組み合わせと各種サンプリング周波数及び各種振幅分解能との関係を示す図。
【図16】この発明による符号化装置の第5実施例の機能構成を示す図。
【図17】Aはアップサンプリングにおける補間を示す図、Bは補間フィルタの例を示す図。
【図18】Aはこの発明の実施例に適用可能な可逆圧縮符号化器の例を示す機能構成図、Bはこの発明の実施例に適用可能な図18Aの可逆圧縮符号化器に対応する復号化器の機能構成図。
【図19】Aはこの発明の実施例に適用可能な可逆符号器の例を示す機能構成図、Bはこの発明の実施例に適用可能な可逆復号器の例を示す機能構成を示す図。
【図20】Aは補助符号とタップ数の対応例を示す図、Bは補助符号と利得の対応例を示す図、Cは補助符号とサンプル点移動の対応例を示す図、Dは補助符号の例を示す図。
【図21】この発明による復号化装置の実施例の機能構成を示す図。
【図22】この発明による符号化装置の他の実施例の機能構成を示す図。
【図23】この発明による復号化装置の他の実施例の機能構成を示す図。
【図24】この発明の効果を説明するための楽音配信システムを示す図。
【図25】この発明の第7実施例による符号の階層的分割の例を示す図。
【図26】階層的分割された符号の組み合わせと各種サンプリング周波数及び各種振幅分解能との関係を示す図。
【図27】この発明の第7実施例による符号化装置の実施例の機能構成を示す図。
【図28】この発明の実施例に適用可能な予測符号化器の機能構成を示す図。
【図29】この発明の第7実施例による符号化装置の他の実施例の機能構成を示す図。
【図30】この発明による第7実施例の復号化装置の機能構成を示す図。
【図31】この発明の第8実施例の符号化装置の機能構成を示す図。
【図32】この発明の第8実施例の復号化装置の機能構成を示す図。
【図33】この発明の第9実施例の符号の階層的分割の例を示す図。
【図34】この発明の第9実施例におけるサンプリング周波数と振幅語長と使用符号の組み合わせとの関係を示す図。
【図35】この発明による第9及び第10実施例の符号化装置の機能構成を示す図。
【図36】図35中の選択部76の機能構成例を示す図。
【図37】この発明による第9及び第10実施例の復号化装置の機能構成を示す図。
【図38】図35中の選択部76の他の機能構成例を示す図。
【図39】第9実施例の復号化装置に適用した選択部87の機能構成例を示す図。
【図40】第9及び第10実施例の符号化装置の他の例を示す図。
【図41】第9及び第10実施例の符号化装置の更に他の例を示す図。
【図42】この発明の第11実施例による符号の階層的分割の例を示す図。
【図43】図42に示した階層的分割された符号の組み合わせと各種サンプリング周波数及び各種振幅分解能との関係を示す図。
【図44】この発明による第11実施例の符号化装置の機能構成を示す図。
【図45】この発明による第11実施例の復号化装置の機能構成を示す図。
【図46】この発明による符号化方法の第12実施例を概念的に説明するための図。
【図47】第12実施例の符号化装置の具体的構成例を示すブロック図。
【図48】第12実施例の復号化装置の具体的構成例を示すブロック図。
【図49】この発明による符号化方法の第13実施例を概念的に説明するための図。
【図50】第13実施例の符号化装置の具体的構成例を示すブロック図。
【図51】第13実施例の復号化装置の具体的構成例を示すブロック図。
【図52】第12及び第13実施例の符号化装置における補正部の構成を示すブロック図。
【図53】第12及び第13実施例の復号化装置における補正部の構成を示すブロック図。
【図54】この発明による符号化方法の第14実施例を概念的に説明するための図。
【図55】第14実施例の符号化装置の具体的構成例を示すブロック図。
【図56】第14実施例の復号化装置の具体的構成例を示すブロック図。
【図57】この発明による符号化装置の第15実施例の構成を示すブロック図。
【図58】第15実施例における差分モジュールの構成例を示すブロック図。
【図59】差分モジュールの他の構成例を示すブロック図。
【図60】第15実施例の復号化装置の構成を示すブロック図。
【図61】図60における加算モジュールの構成を示すブロック図。
【図62】加算モジュールの他の構成例を示すブロック図。
【図63】図57における差分モジュールの他の構成例を示すブロック図。
【図64】図57における差分モジュールの更に他の構成例を示すブロック図。
【図65】図60における加算モジュールの他の構成例を示すブロック図。
【図66】図60における加算モジュールの更に他の構成例を示すブロック図。
【図67】異なるサンプリング周波数と量子化精度の信号を合成する手順を説明する図。
【図68】第16実施例の符号化装置の構成を示すブロック図。
【図69】図68の符号化装置に対応する復号化装置の構成を示すブロック図。
【図70】図68の符号化装置の変形実施例を示すブロック図。
【図71】図70の符号化装置に対応する復号化装置を示すブロック図。
【図72】符号列に付加する階層情報の例を示す図。
【図73】4階層の符号化構成を示す図。
【図74】図73の符号化構成の場合の符号系列に付加される階層情報を示す図。
【図75】9階層の符号化構成を示す図。
【図76】図75の符号化構成の場合の符号系列に付加される階層情報を示す図。
【図77】図57の符号化構成の場合の符号系列に付加される階層情報を示す図。
【図78】図50の符号化構成の場合の符号系列に付加される階層情報を示す図。
【図79】この発明による符号化方法の処理手順を示すフロー図。
【図80】この発明による復号化方法の処理手順を示すフロー図。
【図81】この発明の符号化及び復号化をプログラムで実行するためのコンピュータの構成を示すブロック図。[0001]
BACKGROUND OF THE INVENTION
The present invention relates to an encoding method for converting a digital signal such as voice, music, or an image into a code compressed to a lower information amount, a decoding method thereof, an encoding device, a decoding device, and a program thereof.
[0002]
[Prior art]
There are irreversible encoding that allows distortion and reversible encoding that does not allow distortion as methods of compressing information such as sound and image. As irreversible compression, various methods are known as standards of ITU-T (International Telecommunications Union-Telecom Standardization) and ISO / IEC MPEG (International Organization for Standardization / International Electrotechnical Commission Moving Picture Experts Group). By using these lossy compression methods, it is possible to compress the original digital signal to 1/10 or less while suppressing a slight distortion. However, the distortion depends on the encoding condition and the input signal, and deterioration of the reproduction signal may be a problem depending on the application.
[0003]
On the other hand, as a reversible compression method capable of completely reproducing the original signal, universal compression coding often used for compression of computer files and texts is known. This can be compressed for any signal and can be compressed up to about 1/2 for text and the like, but the compression effect is only about 20% even when applied directly to audio or image data.
By combining lossy encoding with a high compression rate and reversibly compressing the error between the reproduced signal and the original signal, reversible compression at a high compression rate is possible. This combination compression method is proposed in
[0004]
In the encoder, a digital input signal (hereinafter also referred to as an input signal sample sequence) is sequentially divided by a frame division unit into frame units each comprising, for example, 1024 input signal samples. The digital signal is lossy compression encoded for each unit. This encoding may be any system suitable for the input signal as long as the original digital input signal can be reproduced to some extent at the time of decoding. For example, if the digital input signal is speech, speech coding recommended as the ITU-T G.729 standard can be used, and if it is music, Twin VQ (Transform-Domain) adopted in MPEG-4. Weighted Interleaved Vector Quantization) can be used, and the lossy encoding method described in the above document can also be used. This lossy compression code is locally decoded, and an error signal between the local signal and the original digital signal is generated. Actually, local decoding is not necessary, and an error between the quantized signal obtained when generating the lossy compression code and the original digital signal may be obtained. The amplitude of this error signal is usually much smaller than the amplitude of the original digital signal. Therefore, the amount of information can be reduced by reversibly compressing and encoding the error signal rather than reversibly compressing and encoding the original digital signal.
[0005]
In order to increase the efficiency of the lossless compression encoding, the bit positions of all the samples in the frame of the sample sequence in which the absolute value of the error signal is represented (binary number of polarity and absolute value), that is, the MSB, For each second MSB,..., LSB, a bit string in which bits are concatenated in the sample sequence direction (time direction) is generated. That is, bit array conversion is performed. For convenience, the bit string consisting of 1024 bits at the same bit position connected to each other will be referred to as “coordinate bit string”. In contrast, for convenience, a bit string of one word representing an amplitude value including the polarity of each sample is referred to as an “amplitude bit string”. Since the error signal has a small amplitude, one or a plurality of consecutive bits from the most significant bit of each sample often becomes “0”. Therefore, the lossless compression encoding efficiency of the error signal can be improved by expressing the equivalence bit string generated by concatenating these bit positions with a predetermined code.
[0006]
These coordinate bit strings are lossless compression encoded. As lossless compression coding, for example, entropy coding such as Huffman coding or arithmetic coding using a case in which there is a sequence in which the same code (1 or 0) continues or a sequence that frequently appears is used. Can be used.
On the decoding side, the lossless compression code is decoded, and the bit sequence is inversely converted with respect to the decoded signal. That is, the equivalence bit string is converted into the amplitude bit string for each frame, and the obtained error signal is sequentially converted. Played. Further, the lossy compression code is decoded, the decoded signal and the reproduced error signal are added, and finally, the addition signals for each frame are sequentially connected to reproduce the original digital signal sequence.
[0007]
[Patent Document 1]
Patent Application Publication 2001-44847
[0008]
[Problems to be solved by the invention]
An object of the present invention is to provide an encoding method, a decoding method, an encoding device, a decoding device, and a program thereof that can compress information without distortion and select a hierarchical sample rate. It is in.
[0009]
[Means for Solving the Problems]
According to this invention,At least one of the stepwise hierarchy of sampling frequencies and the stepwise hierarchy of quantization accuracy, which are attributes of the digital signal, encode a predetermined digital signalThe digital signal encoding method isHigher frequency is higher, lower is lower, higher quantization accuracy is higher, lower is lower.
(a) Signal to be encoded and its signalThanattributeHierarchy ofSubordinateThe faithGenerating a differential signal from the signal or its deformation signal;
(b) lossless encoding the difference signal;
including.
According to this invention,At least one of the stepwise hierarchy of sampling frequencies and the stepwise hierarchy of quantization accuracy, which are attributes of the digital signal, encode a predetermined digital signalThe digital signal encoder isHigher frequency is higher, lower is lower, higher quantization accuracy is higher, lower is lower.
The signal to be encoded and its signalThanattributeHierarchy ofSubordinateThe faithDifferential signal generating means for generating a differential signal with the signal or its modified signal;
Differential signal lossless encoding means for losslessly encoding the difference signal;
Including.
[0010]
According to this invention,At least one of the stepped hierarchy of sampling frequencies and the stepped hierarchy of quantization accuracy, which are attributes of digital signals, is predetermined.A decoding method for decoding a code of a digital signal is as follows:Higher frequency is higher, lower is lower, higher quantization accuracy is higher, lower is lower.
(a) decoding an input code to generate a differential signal;
(b) The difference signal and the difference signalThanattributeHierarchy ofSubordinateRecoveryGenerating a decoded signal by synthesizing the signal or its modified signal;
Including.
According to this invention,At least one of the stepped hierarchy of sampling frequencies and the stepped hierarchy of quantization accuracy, which are attributes of digital signals, is predetermined.The digital signal decoding device is:Higher frequency is higher, lower is lower, higher quantization accuracy is higher, lower is lower.
Differential signal decoding means for decoding the input code to generate a differential signal;
The difference signal and the difference signalThanattributeHierarchy ofSubordinateRecoveryA signal synthesis means for synthesizing the encoded signal or its modified signal to generate a decoded signal;
Including.
[0011]
According to this invention,At least one of the stepped hierarchy of sampling frequencies and the stepped hierarchy of quantization accuracy, which are attributes of digital signals, is predetermined.A computer-executable encoding program describing a digital signal encoding processing procedure,Higher frequency is higher, lower is lower, higher quantization accuracy is higher, lower is lower.
(a) Signal to be encoded and its signalThanattributeHierarchy ofSubordinateThe faithGenerating a differential signal from the signal or its deformation signal;
(b) lossless encoding the difference signal;
including.
According to this invention,At least one of the stepped hierarchy of sampling frequencies and the stepped hierarchy of quantization accuracy, which are attributes of digital signals, is predetermined.A computer-executable program that describes a decoding processing procedure for decoding a code of a digital signal.Higher frequency is higher, lower is lower, higher quantization accuracy is higher, lower is lower.
(a) decoding an input code to generate a differential signal;
(b) The difference signal and the difference signalThanattributeHierarchy ofSubordinateRecoveryGenerating a decoded signal by synthesizing the signal or its modified signal;
Including.
[0012]
DETAILED DESCRIPTION OF THE INVENTION
First embodiment
A first embodiment of the present invention will be described with reference to FIG. In the figure, the sampling rate (frequency) of the signal is also indicated by a symbol. The digital signal from the
[0013]
Second sampling frequency F2The digital signal is subjected to irreversible or lossless compression encoding in the
[0014]
The
[0015]
The code sequence signal output from the
[0016]
In the
[0017]
The separated error code Pe is subjected to a process of reproducing an error signal by the decoding / array
[0018]
According to this configuration, it is possible to reproduce a high quality signal having the same sampling frequency as that of the original digital signal by using both the main code Im and the error code Pe. In addition, when encoding and outputting with a packet, a high priority is given to the packet with the main code Im, so that a signal with a relatively high quality can be reproduced even when the packet with the error code Pe is lost. In addition, if a user does not require such a high-quality data signal, providing only a main code Im based on a signal whose sampling frequency is lower than that of the original digital signal provides a high-quality signal with a small amount of information. can do. For example, when digital signals are transmitted over a network, that is, on the transmitting side, only the main code Im or an error from the main code Im depending on the network conditions (route communication capacity and traffic) or according to the request on the receiving side There is a degree of freedom in selecting whether to send both of the signs Pe.
When lossless encoding is performed as the
[0019]
Second embodiment
In the second embodiment of the present invention, the sampling frequency of the data signal is hierarchized in multiple stages, and it is possible to selectively provide more types of quality signals.
As shown in FIG. 2 with the same reference numerals assigned to the portions corresponding to FIG. 1, in the second embodiment, the first sampling frequency F from the
[0020]
Third sampling frequency F from the
[0021]
In the
The sub code Ie is decoded by the
[0022]
In the
According to this configuration, if all information, that is, Im, Ie, and Pe, can be obtained correctly, a high sampling frequency F1The original digital signal can be obtained. When the reproduction error signal cannot be obtained, the second sampling frequency F from the
[0023]
To further increase the coding efficiency, the decoded signal of the main code Im, that is, the second sampling frequency F from the
For example, as the original digital signal, the first sampling frequency F1Is a 192kHz music signal and the third sampling frequency FThreeIs 96kHz and the second sampling frequency F2Is 48 kHz, generally, even a reproduced digital signal with a sampling frequency of 48 kHz can obtain a high quality comparable to that of a compact disc (CD). In other words, high quality information can be provided with a small amount of information, and a user who desires a 96 kHz reproduced digital signal with a higher sampling frequency can use a main code Im and a subcode Ie to achieve a higher compression ratio and higher than CD. A quality signal can be provided. The user's
[0024]
Modification of the second embodiment
A modification of the second embodiment in which the sampling frequency is changed in multiple stages will be described with reference to FIG. In FIG. 3, parts corresponding to those in FIG. In this example, the
[0025]
This secondary code Ie is decoded by the
[0026]
In the
[0027]
In the
[0028]
If sufficient information for reproducing the error signal cannot be obtained, or if the error code Pe is not inputted, the third sampling frequency F from the
In the second embodiment shown in FIGS. 2 and 3, the sampling frequency is converted into two stages, but the same encoding and decoding can be performed by converting the sampling frequency more than three stages.
[0029]
Array conversion / encoding unit
A specific example of the array conversion /
[0030]
The equidistant bit string from the bit
An example of bit array conversion is shown in FIG. 5A. The amplitude bit string of each error signal sample expressed as a polarity code and an absolute value is shown in each vertical column on the left side in FIG. 5A, and one frame of the amplitude bit string is sequentially arranged in the sample direction. In order to make it easier to understand the state of one amplitude bit string, the amplitude bit string DV (k) straddling the amplitude is indicated by a bold line, k represents the time in the frame, for example, k = 1, 2,. is there. In this example, the polarity code of each amplitude bit string DV (k) is adjacent to the MSB of the absolute value, and in the figure, the polarity code is positioned immediately above the MSB (Most Significant Bit).
[0031]
An error signal expressed as an absolute value of polarity is supplied to the effective digit number detection unit 18E5, and a place where "1" is present in the digit closest to the MSB in one frame of the amplitude bit string of the error signal is detected, LSB (Least Significant Bit) : The least significant bit) to that digit is obtained as the effective digit Fe. Only the partial LBP within the effective number of digits and the polarity code in the error signal of one frame are converted into a coordinate bit string. That is, it is not necessary to convert the partial HBP from the digit above the effective digit number to the MSB into a coordinate bit string.
As shown on the right side of FIG. 5A, in this example, such sample arrangement data is first converted into a bit string obtained by concatenating only the polarity bits (signs) of the numerical values of the amplitudes of the samples (amplitude bit strings) in the time direction in the frame. Extract as a bit string. Next, a coordinate bit string in which only the most significant digit within the effective number Fe is concatenated in the frame is extracted, and in the same manner, a coordinate bit string concatenated in the time direction for each digit (corresponding bit position) is sequentially extracted. Finally, a coordinate bit string in which only LSBs are concatenated in the frame is extracted. One example of these extracted equidistant bit strings is indicated as DH (i) with a thick frame in the right horizontal arrangement in FIG. 5A. i indicates the bit position in the amplitude bit string before the array conversion of the bits constituting the coordinate bit string. The above bit arrangement conversion does not change the contents of each bit constituting the bit string.
[0032]
In the case of performing bit array conversion of a sample string when each error signal sample is expressed by a two's complement and a positive / negative integer, for example, as shown in FIG. 5B, the absolute value of the sample is shown as an amplitude bit string for one frame. The portion of the digit higher than the digit representing the maximum value (indicated by the portion HBP in FIG. 5B) is all “0” if the amplitude bit string is a positive value, and “1” if the amplitude bit string is a negative value. "Become. The number of digits of the other partial LBP is detected by the effective digit number detection unit 18E5 of FIG. 4 as the effective digit number Fe. Only the significant digit portion LBP and the bit position (digit) adjacent thereto, that is, the polarity code, need only be converted into a coordinate bit string.
[0033]
The transmission record
For example, as shown in FIG. 5C, the
[0034]
The data length DTL is not required if the data length of the transmission recording unit data (payload) PYL is fixed, but is required because the data length differs depending on the packet when compressed by the
When priority is given to the packet PKT, higher priority is given to the packet PKT including the corresponding transmission recording unit data closer to the MSB side. For example, the priority is set to about 2 to 5 levels. The highest priority is given to the equivalence bit string of the polarity code, and then the priority is given in the order of the bit string representing the main code Im and the bit string representing the sub code Ie.
[0035]
Returning to the explanation of FIG. 4, the effective digit number Fe detected by the effective digit number detection unit 18E5 is encoded by the auxiliary
[0036]
The above-described array conversion / encoding unit described the case where the maximum number of significant digits of a sample is detected for each frame and the bits in the significant digits are array-converted, but the efficiency is somewhat lower than that, Instead of detecting significant digits, all bits from the least significant bit to the most significant bit of the sample sequence may be encoded by bit array conversion processing.
[0037]
Decoding / array inverse transform unit
A specific example of the decoding / array
[0038]
The packet of the error code Pe separated by the
[0039]
The error data code Ine is losslessly decoded by the
[0040]
When the transmission record unit data is based on a direct conversion from an amplitude bit string expressed in two's complement to a coordinate bit string, the amplitude of the coordinate bit string shown on the right side in FIG. 5B is shown on the left side. This is converted into an array of bit strings, but the processing is the same as the array inverse conversion in the case of the sample composed of the above-described polarity value and absolute value. The error signal sample from the bit array
[0041]
If a packet loss has occurred, the missing packet number is detected from the packet number of the received packet by the
[0042]
Correction in the missing
[0043]
In other words, the spectrum obtained from information other than the missing information of the frame approximates the average spectrum of the past several frames or the determined spectrum obtained as a result of decoding the auxiliary information as described later. In addition, correction for missing information is performed. A preferred method for this correction will be described later. As a simple correction method, the missing
[0044]
In this way, since the decoding / array
Alternatively, all combinations of possible values of missing information (bits) are added to each sample value to create correction sample string (waveform) candidates, and the spectral envelopes of these candidates are obtained. A correction sample sequence (waveform) candidate corresponding to the one closest to the decoded spectrum envelope is output as a correction sample sequence to the digit alignment unit 58C. 4 and 6, the
In the above description of the decoding / array inverse transform unit, the processing corresponding to the case where the
[0045]
Correction by auxiliary information
When creating correction sample string candidates using all combinations of possible values of missing information, if the missing information (bits) increases, the number of correction sample string (waveform) candidates increases significantly and the amount of processing increases. There is a risk of becoming unrealistic. The processing of the missing
[0046]
FIG. 7 shows an example of the processing procedure, and FIG. 8 shows an example of the functional configuration. First, the provisional waveform generator 58B1 reproduces the provisional waveform (provisional sample string) in the frame using only the confirmed bits input from the
[0047]
Next, the spectrum envelope of the provisional waveform is calculated by the spectrum envelope calculation unit 58B2 (S2). For example, the spectral envelope can be estimated by performing all-pole linear prediction analysis used in speech analysis on the provisional waveform. The error calculation unit 58B3 compares the estimated spectrum envelope with the spectrum envelope of the original sound sent as auxiliary information, that is, the spectrum envelope decoded by the auxiliary
[0048]
In step S3, when the error between the estimated spectral envelope shape and the decoded spectral envelope shape is larger than the allowable range, first, the inverse characteristic of the estimated spectral envelope is given to the provisional waveform (S4). Specifically, the parameter representing the spectral envelope obtained in step S2 is set in, for example, an all-pole linear prediction inverse filter (all zero type) 58B4, and the provisional waveform given from the provisional waveform generator 58B1 through the switch SW2 is set. By passing through the inverse filter 58B4, the spectrum of the provisional waveform is flattened to obtain a flattened signal. The average power of the flattened signal is calculated by the power calculator 58B5 and corrected from this average power and the average power PW decoded from the
[0049]
Next, the spectral envelope characteristic of the auxiliary information is given to the flattened signal whose amplitude has been corrected to correct the spectral envelope (S6). That is, a spectrum correction waveform is created through the output of the power correction unit 58B7 in the all-pole type synthesis filter 58B8 using the parameter LPC representing the decoded spectrum envelope of the auxiliary information. The resulting spectral envelope of the waveform is close to the original error signal.
However, since this spectrum correction waveform may be inconsistent with the already determined digit bit, it is corrected to the correct value by the correction unit 58B9 (S7). For example, when the lower 4 bits of the amplitude value with 16-bit precision are unknown, there are 16 uncertain values for the values that can be taken by each sample, but the values are corrected to the values closest to the spectrum correction waveform. In other words, if the sample value corrected for each sample is out of the possible range, it is corrected to the limit value of the possible range. For example, if the upper 12-bit corrected sample value is larger than the correct 12-bit sample value, the upper 12 bits of the corrected sample value are corrected to the correct sample value, and all the lower 4 bits of the corrected sample value are set to “1” (upper limit). If it is small, set all to "0" (lower limit). With this modification, all the bits whose amplitude values are determined are matched, and at the same time, a waveform having a spectrum envelope close to that of the original error signal can be reproduced.
[0050]
By using this corrected waveform as a provisional waveform in step S1, the processing after step S2 can be repeated. In addition, when the number of significant decoding digits varies from frame to frame, there are cases where samples subject to processing by the linear envelope analysis of the spectrum envelope calculation unit 58B2, the inverse filter 58B4, and the synthesis filter 58B8 span the current frame and the past frame. is there. In this case, even if the object of processing is the current frame, it is necessary to perform analysis and filter processing after aligning the number of significant digits of the past frame with the number of significant digits of the current frame. If the number of significant digits of one past frame is N digits less than the number of significant digits of the current frame, the amplitude value is reduced by shifting the sample of the past frame, for example, by N digits lower, and reducing the amplitude value. Match the number to the number of significant digits in the current frame. Conversely, if the number of significant digits of one previous frame is M digits greater than the number of significant digits of the current frame, the amplitude of the sample of the past frame is temporarily shifted to the upper M digits by, for example, floating point display. Increase the value to match the number of significant digits to that of the current frame. In this case, the accuracy of the amplitude value of the sample of the past frame is lowered when the information overflows from the register due to the upper shift and the information loss is large, so the sample of the past frame is not used or the sample of the current frame is not used. The correction process may be omitted.
[0051]
As shown by the broken line in FIG. 7, such correction of the effective number of digits is performed before the effective processing for correcting the number of digits (S2 ′) described above when necessary for the analysis processing in step S2, and the reverse of step S4. If necessary for the filter processing, the effective digit number correction is performed before that (S4 '), and if necessary for the synthesis filter processing in step S6, the effective digit number correction is performed before that (S6'). Also, in FIG. 8, the significant digits decoded from the auxiliary
[0052]
Note that the waveform (sample value) is premised on an integer value, but it is treated as a real number in the filter calculation, and the output value of the filter must be converted to an integer. In the case of a synthesis filter, the result differs depending on whether it is converted into an integer for each sample or later in a batch for each frame, but both are possible.
As shown by broken lines in FIG. 7 and FIG. 8, after the provisional waveform is flattened in step S4, the flattened provisional waveform (flattened signal) is first passed through the synthesis filter 58B8 and the spectrum envelope corrected. A constituent sample series (waveform) may be obtained (S5 '), the amplitude of the spectrum envelope corrected waveform may be corrected by the power correction unit 58B7' (S7 '), and the process may proceed to step S7. In this case, the average power of the spectrum envelope corrected waveform from the synthesis filter 58B8 is calculated by the power calculation unit 58B5 ′, and this average power and the decoding power PW of the auxiliary information (the output of the power calculation unit 18E in FIG. 4). The correction amount is calculated by the correction amount calculation unit 58B6 ′, and the amplitude correction is performed by the power correction unit 58B7 ′ on the output of the synthesis filter 58B8 based on the correction amount.
[0053]
After step S3 in the process shown in FIG. 7, the filter coefficient of one synthesis filter 58B8 ′ combining the inverse filter 58B4 of the spectrum envelope estimated in step S2 and the synthesis filter 58B8 of the decoded spectrum envelope of the auxiliary information is obtained. The composite spectrum envelope calculation unit 58B10 may synthesize a waveform obtained by correcting the spectrum envelope through the provisional waveform in the synthesis filter 58B8 ′ in which the coefficient is set, and may perform amplitude correction on the waveform with the corrected spectrum envelope. . Further, when the bit
[0054]
In this specification, packets in one frame are intentionally removed in order to adjust the amount of information, so that all the packets in one frame are not input to the decoder, or the switching center due to traffic congestion in the communication network For example, if a packet is missing due to not sending out some packets, or due to a transmission path failure, recording / playback device abnormality, etc., or there is an error in the input packet, the transmission record unit data cannot be decoded. When a packet cannot be used, or when a certain packet is abnormally delayed, it is collectively referred to as a packet loss.
According to the first and second embodiments described above, the original digital signal is encoded by converting its sampling frequency, and the error signal is output as at least a coordinate bit string as the sampling frequency of the original signal. A quality signal can be reproduced.
[0055]
Third embodiment
In the above-described embodiments of FIGS. 1, 2, and 3, the example in which the error signal from the
In this configuration, a prediction
[0056]
As shown in FIG. 10A, for example, the prediction
[0057]
Alternatively, as shown in FIG. 10B, the prediction
[0058]
In each of the above-described embodiments, the
The prediction error signal Spe thus obtained is subjected to bit array conversion in the array conversion /
[0059]
In the
[0060]
The
When the prediction
[0061]
The coefficient code Ic separated by the
The sampling frequency of the error signal reproduced in this way is the first sampling frequency F.1This error signal and the first sampling frequency F from the
[0062]
According to this configuration, for example, the sampling frequency F of the digital signal input to the
[0063]
In this way, it is possible to provide an encoded signal having a quality according to the user's request. However, the high-frequency component has been removed by the
[0064]
Sampling frequency F from the
[0065]
In the above frequency axis inversion, (-1) for each sample amplitude value of the error signal e (t) to be invertednMultiply (n is an integer value indicating the sample number). For this purpose, the sign of the amplitude value for each sample may be inverted. In that case, the frequency domain coefficient E (f) (f is the frequency) is inverted on the frequency axis and E (F1/ 2−f). Where F1Is the sampling frequency of the input signal. Sampling frequency after downsampling is F1/ 2, and the frequency band targeted for lossy encoding is 0 to F1Up to / 4, the error signal high frequency (F1/ 4 to F1/ 2) is not affected by lossy compression, so the error signal component subjected to frequency axis inversion is low frequency (from 0 to F1/ 4) is the main. Therefore, the high frequency component is converted into a low frequency component that hardly contributes to randomness. Compression efficiency is improved by reversibly compressing a prediction error obtained by linearly predicting this. Here, a lossless compression code by lossless compression coding is output. The linear prediction coefficient obtained by linear prediction is quantized and a corresponding prediction coefficient code is output.
[0066]
In the
[0067]
That is, on the decoding side, the input lossless compression code Pe is losslessly decoded by the decoding / array
In this way, it has been experimentally confirmed that when the error signal with the sampling frequency increased is frequency axis inverted to generate the prediction error signal, the performance is better than when the frequency axis inversion is not performed.
[0068]
Fourth embodiment
FIG. 13 shows a fourth embodiment of the present invention, in which parts corresponding to those in FIG. 9 are given the same reference numerals. The difference from FIG. 9 is that in the
[0069]
In the prediction
[0070]
In the
[0071]
As the prediction
Thus, by generating the prediction error signal by lowering the sampling frequency of the error signal, the error signal becomes only a low-frequency component, that is, a component having mainly a large level in the error signal shown in FIG. 12B, and this band is narrow. Since a prediction error signal of the signal is generated, the calculation processing amount is so small or the accuracy of the obtained prediction signal is high.
[0072]
In each of the above-described embodiments, the
As described above, according to the third and fourth embodiments of the present invention, if the main code Im can be correctly decoded and the error signal can be correctly reproduced, a high-quality signal having a high sampling frequency and a high band can be reproduced. Even if an error signal is not obtained or cannot be reproduced satisfactorily, a relatively high quality signal can be reproduced by decoding the main code. If a user does not require a signal with such a high quality, the encoding efficiency can be improved by providing only the main code Im. Moreover, by providing an error signal to a user who requests an ultra-high quality signal, the request can be satisfied. At that time, the error signal is provided as a prediction error signal to increase the encoding efficiency. be able to.
[0073]
Example 5
2D hierarchy
In the first to fourth embodiments described above, the same as the original sound signal, which represents an error between the sign (main code Im) of the signal obtained by down-sampling the input digital signal to a lower sampling frequency and the original sound signal resulting from the encoding. Outputs error code Pe at the sampling frequency and allows the user to select whether to use only the main code Im for decoding or to use both the main code Im and the error code Pe for decoding according to the required quality An example was given. That is, these embodiments show a case where a signal having a sampling frequency that is two layers is used as a signal to be encoded.
[0074]
Hereinafter, in this fifth embodiment, a signal is a combination of M kinds of amplitude resolutions of the sample (also called amplitude word length or quantization accuracy, expressed in bits) and N kinds of sampling frequencies (sampling rates). It is possible to encode and generate digital signals in all layers by forming an M × N two-dimensional layer. FIG. 14A shows an example of a combination of encoded digital signals in the case of two-dimensional hierarchical encoding of the digital signals. In this example, 3 × 3 hierarchies are shown with M = 3 kinds of amplitude word lengths of 16 bits, 20 bits, and 24 bits and N = 3 kinds of sampling frequencies of 48 kHz, 96 kHz, and 192 kHz. In FIG. 14A, the amplitude word length (number of bits) is shown in the downward direction with the most significant bit MSB of the sample word as a reference, and the sampling frequency is shown in the horizontal direction.
[0075]
As shown in FIG. 14B, for the upper 16 bits excluding the lower 8 bits in a digital signal having an amplitude word length of 24 bits, a code A encoded at a sampling frequency of 48 kHz and a component higher than the component encoded by the code A The frequency component is hierarchized into a code B encoded at a sampling frequency of 96 kHz and a code C encoded at a sampling frequency of 192 kHz for a frequency component higher than the component encoded by the code B.
For a 20-bit word length signal in which the lower 4 bits are further added to the 16-bit word length, the lower 4-bit component, that is, the residual component obtained by subtracting the 16-bit word length component from the 20-bit word length signal, The residual signals having sampling frequencies of 48 kHz, 96 kHz, and 192 kHz are hierarchized into codes D, E, and F, respectively. For a 24-bit word length signal in which the lower 4 bits are added to the 20-bit word length, the lower 4-bit component, that is, the residual component obtained by subtracting the 20-bit word length component from the 24-bit word length signal is sampled. The residual signals of
[0076]
As described above, by using the codes A to I encoded according to the two-dimensional hierarchical nine kinds of coding conditions of the amplitude word length (amplitude resolution, quantization accuracy) and the sampling frequency, three kinds of amplitude word lengths are obtained. Nine types of digital signals, which are all combinations of the three types of sampling frequencies, can be output. Generally, a digital signal hierarchized into M × N types can be generated by a combination of M types of amplitude word lengths and N types of sampling frequencies. That is, the codes shown in FIG. 15 may be used for each combination of sampling frequency and amplitude word length. For example, in the case of a sampling frequency of 96 kHz and an amplitude word length of 24 bits, codes A, B, E, and H may be used.
[0077]
Next, an encoding method for generating these codes A to I will be described with reference to the functional configuration shown in FIG. In the following description of the embodiments, the first, second,..., Mth amplitude resolution is called in order from the lowest resolution with respect to the M types of amplitude resolution, and any one of them is referred to as the mth amplitude resolution. This is called resolution. m is 1 ≦ m ≦MAn integer in the range Similarly, with respect to N types of sampling frequencies, the first, second,... n is an integer in the range of 1 ≦ n ≦ N. Further, a digital signal having an mth amplitude resolution and an nth sampling frequency is referred to as an mth and nth digital signal.
[0078]
The mth and nth digital signals S of the original sound of the combination of the sampling frequency and the amplitude word length required to generate the codes A to Im, nIs m, n sound source 60m, n M = 1, 2, 3 corresponding to the m-th amplitude word length (quantization accuracy). In this example, m = 1 is 16 bits, m = 2 is 20 bits, m = 3 is a case of 24 bits, and n = 1, 2, 3 corresponding to the nth sampling frequency (sampling rate). In this example, n = 1 is 48 kHz, n = 2 is 96 kHz, and n = 3 is 192kHz.
If a digital signal of a certain condition is not prepared, it is created from the higher-order digital signal. At least the third and third digital signal S3,3That is, a
[0079]
1st, 1st sound
[0080]
The first and first digital signals S1,1Is the first and
[0081]
First and
Symbol E is the first and second sound sources 60.1,21st and 2nd digital signal S from1,24 bits "0" in the lower order of the first and
[0082]
Symbol H is the third and second sound source 60.3,23rd and 2nd digital signal S from3,2And second and
[0083]
The generation of these codes A to I will be generally described. Only for the combination of m = 1 and n = 1, the first and
[0084]
For m and n combinations in the range of m = 1, 1 ≦ n ≦ N−1, the m,
1st and 1st digital signal S1,1Since the energy bias is large, the first and
[0085]
As shown in FIG. 18A, in the
[0086]
In order to further increase the efficiency of the lossless compression encoding, the error signal, that is, the digital sample string is array-converted by the
[0087]
First and
[0088]
First and
[0089]
Next, a decoding apparatus corresponding to the encoding apparatus in FIG. 16 will be described with reference to FIG. 1st, 1st code A, 2nd, 1st code D, 3rd, 1st code G, 1st, 2nd code B, 2nd, 2nd code E, 3rd, 2th code H, 1st, 3rd code C, 1st The second and third codes F and the third and third codes I are the first and
[0090]
For m and n pairs in the range of 1 ≦ m ≦ M-1 and 1 ≦ n ≦ N, the mth and
For example, the first and
[0091]
Also, for m, n pairs in the range of m = 1, 1 ≦ n ≦ N−1, the first,
For example, the first and
[0092]
1st,
[0093]
In the
[0094]
That is, the lossless compression code I (e) in the first and first codes A is losslessly decoded, and a plurality of samples representing the code absolute value of the bit string consisting of the corresponding bit position in the frame from the decoded bit string are quantized in the frame. Reproduced as an error signal, irreversibly decodes the irreversible compression code I (n) in the first and first codes A to generate a local reproduction signal, and adds the reproduction signal and the quantization error signal to the first , 1 Digital signal S1,1Play.
[0095]
According to the configuration of the encoding device shown in FIG. 16, various digital signals having combinations of various amplitude resolutions (amplitude word lengths) and various sampling frequencies (sampling rates) are uniformly encoded as a two-dimensional hierarchy. In addition, it is possible to perform compression coding with high efficiency as a whole, and to provide various combinations of digital signals requested by users with a small amount of data.
According to the configuration of the decoding apparatus shown in FIG. 21, the desired ones in the digital signals of various combinations of quantization accuracy and sampling frequency are unified from the codes encoded by the encoding apparatus shown in FIG. Can be decrypted automatically.
[0096]
Depending on the user, all combinations of the m-th and n-th digital signals S shown in FIG.m, nDo not need. First and
[0097]
In each of the embodiments shown in FIGS. 16 and 21, the number M of types of quantization accuracy and the number N of types of sampling frequencies are not limited to three, and the number of layers can be increased or decreased to increase the number of hierarchies. May be reduced. Similarly, for N, the number of hierarchies may be increased or decreased.
Sixth embodiment
The mth and nth digital signals S of various combinations of quantization accuracy and sampling frequency in FIG.m, n
[0098]
Therefore, in the sixth embodiment, in the encoding apparatus of FIG. 16, a digital signal having a lower amplitude resolution or a lower sampling frequency is converted into an
For example, as shown in FIG.m, nThe mth and nth digital signals from the
[0099]
The m + 1, n-th error signal Δ that is the subtraction result from the subtracting
[0100]
When the power minimization of the error signal is achieved, the m + 1,
Similarly, as shown by a broken line in FIG. 22 and in parentheses, the mth and nth digital signals are converted into
[0101]
FIG. 20B shows a correspondence example between the auxiliary code and the adjustment gain, and FIG. 20C shows a correspondence example between the auxiliary code and the adjustment sample position amount (sample point movement amount). For example, as shown in FIG. 20D, these auxiliary codes are arranged in the order of presence / absence code C11 indicating the presence / absence of auxiliary information, gain code C12, movement amount code C13, and tap number code C14, and are referred to as m, n + 1 auxiliary codes. The In FIG. 22, the
[0102]
As described above, when the encoding apparatus adjusts the lower digital signal, specifically, for example, the (m + 1, n) th precision conversion signal, the decoding apparatus is provided with an adjustment unit, and the auxiliary code is decoded into the auxiliary information. Similarly, it is necessary to adjust the accuracy conversion signal. An example in that case is shown in FIG. This is a case where the precision conversion signal for the m, n digital signal is adjusted by the
[0103]
On the other hand, the m-th and n-th digital signals subjected to decompression decoding are converted into the m-th and n-
[0104]
The m, n + 1 auxiliary code associated with the m, n + 1 code is also used when the m, n + 1 digital signal is reproduced by using the upsampled m, n digital signal. Is input to the up-
[0105]
The
The encoding apparatus and the encoding method shown in FIG. 22 and the decoding apparatus and the decoding method shown in FIG. 23 itself constitute an embodiment of the invention, whereby the quantization accuracy prepared in advance is set. Therefore, it is possible to perform lossless compression coding with high efficiency and high accuracy with respect to digital signals of at least two sound sources having various combinations of sampling frequencies, and lossless decoding of the codes with high accuracy.
[0106]
The encoding apparatus and the encoding method shown in FIG. 22 may have a two-dimensional multi-hierarchical configuration of quantization accuracy and sampling frequency like the encoding apparatus and the encoding method shown in FIG. Similarly, the decoding apparatus and the decoding method shown in FIG. 23 can have a two-dimensional multi-hierarchical structure as shown in FIG.
The coding apparatus shown in FIGS. 16 and 22 and the decoding apparatus shown in FIGS. 21 and 23 may be configured to cause a computer to function by executing a program. In this case, for example, with regard to a decoding device, a decoding program may be downloaded into a computer from a recording medium such as a CD-ROM or a magnetic disk or through a communication line, and the decoding program may be executed by the computer. .
[0107]
In order to explain the effect of the present invention, for example, three types of musical sound distribution forms shown in FIG. 24 are compared. In other words, in order to meet the different requirements of sampling frequency and quantization accuracy (amplitude resolution),
A. A music signal is encoded and stored by scalable encoding to which the present invention is applied. That is, for example, code sequences A to I shown in FIG. 14A are prepared. In response to a request from the client terminal, these codes are selected and combined and transmitted to the client terminal.
B. An encoded sequence of a combination corresponding to a request from the client terminal for each signal of a combination of a plurality of sampling frequencies and a plurality of quantization accuracy, for example, nine types of sound source signals in FIG. Select one of them according to the request and transmit it to the client terminal.
C. Stores only the compression code of the signal with the highest sampling frequency and the highest quantization accuracy, and transmits to the client terminal after decoding, sampling frequency conversion, quantization accuracy conversion, and re-encoding upon request from the client terminal .
[0108]
On the client terminal side, the received code sequence is decoded, and in the form A using the present invention, the digital signal is reconstructed by performing upsampling and accuracy conversion. In forms B and C, the decoded signal is immediately reconstructed.
In the form B, the capacity of the compression code string in the server becomes considerably large, and in the form C, the calculation amount becomes large. In the form A using the present invention, for example, as shown in FIG. 15, the compression code with the highest sampling frequency and the highest amplitude resolution includes the compression code with the low sampling frequency and the low amplitude resolution. It can be used and the total capacity can be reduced.
[0109]
Although the present invention is applied to a music digital signal in the above description, it can also be applied to an image digital signal.
As described above, according to the fifth and sixth embodiments, encoding with different amplitude accuracy and sampling rate requirements, particularly reversible encoding, can be performed in a unified manner, and the compression rate of the entire system can be increased. .
Example 7
The seventh embodiment of the present invention will be described below. Also in this embodiment, for example, three kinds of quantization precisions of 16 types, 20 bits, and 24 bits as M kinds of quantization precisions, and three kinds of arbitrary quantization precisions and sampling frequencies of 48 kHz, 96 kHz, and 192 kHz as N kinds of sampling frequencies. An example of a two-dimensional hierarchical encoding of a digital signal that enables generation of a digital signal of a combination of the above will be described.
[0110]
FIG. 25 shows an example of decomposition of a 24-
[0111]
For a 20-bit word length signal obtained by adding the lower 4 bits to the 16-bit word length, the lower 4-bit component, that is, the residual component obtained by subtracting the 16-bit word length component from the 20-bit word length signal is similarly applied. A code D encoded with a sampling frequency of 48 kHz, a code E encoded with a sampling frequency of 96 kHz for a frequency component higher than the encoded component of the code D, and a frequency component higher than the component encoded with the code E It is hierarchized into a code F encoded with a frequency of 192 kHz. For a 24-bit word length signal including the lower 4 bits with respect to the 20-bit word length, the lower 4-bit component, that is, the residual component obtained by subtracting the 20-bit word length component from the 24-bit word length signal is similarly sampled. A code G encoded as 48 kHz, a code H encoded with a sampling frequency of 96 kHz for a frequency component higher than the component encoded by the code G, and a sampling frequency for a frequency component higher than the component encoded with the code H Is hierarchized into a code I encoded as 192 kHz.
[0112]
Thus, by using the codes A to I encoded according to the two-dimensional hierarchical M × N encoding conditions of the amplitude word length (amplitude resolution, quantization accuracy) and the sampling frequency, M types of quantization are used. It is possible to output M × N types of digital signals that are all combinations of accuracy and N types of sampling frequencies. That is, the usage code (1) shown in FIG. 26 may be used for each combination of each sampling frequency and amplitude word length. For example, in order to encode a digital signal having a sampling frequency of 96 kHz and a quantization accuracy of 24 bits, codes A, B, D, E, G, and H may be used.
As described above, in this embodiment, a digital signal having a quantization accuracy of 16 bits and a sampling frequency of 48 kHz is basically encoded, and a difference from a signal having a lower quantization accuracy or a lower sampling frequency is obtained for a signal higher in the hierarchy. Since the signal component is encoded, the signal having the m-th quantization accuracy and the n-th sampling frequency can be expressed by a simple combination of codes as shown in the used code example (1) in FIG.
[0113]
FIG. 27 shows a functional mechanism of the encoding apparatus that performs the two-dimensional hierarchical encoding shown in FIGS. Each
First, a digital signal whose amplitude word length is 24 bits from the
[0114]
Downsample section 721,2 Output from the
Downsample section 721,3 Output from the
[0115]
The lower 16 bits of the upper 16 bits of the signal from the dividing
[0116]
Similarly to the above, the least significant 4 bits of the signal from the
In FIG. 27, each upsampling unit performs the interpolation filter processing described in FIGS. 17A and 17B, for example, on the input signal. At this time, the corresponding subtraction unit 74m, n + 1Output error signal Δm, n + 1The coefficients W1, W2, and W3 are determined so that the power of is minimized.
[0117]
For example, the subtraction unit 741,3 Output error signal Δ from1,3Is a signal with an amplitude word length of 16 bits and a sampling frequency of 192 kHz and a band of 96 kHz, but the amplitude is small, and in particular, the component of 0 to 48 kHz is almost zero. For this reason, the
[0118]
As an encoding procedure, in the above, first, each sample of a signal having a quantization accuracy of 24 bits and a sampling frequency of 192 kHz is divided into three signals of 16 bits, 4 bits, and 4 bits, and then divided into layers. The signal with the quantized bit precision is layered at sampling frequencies of 48 kHz, 96 kHz, and 192 kHz. First, the input digital signal is layered at the sampling frequency, and then the amplitude word length of the sample for the error signal of each layer May be divided. That is, for example, as shown in FIG. 29, a digital signal having an amplitude word length of 24 bits and a sampling frequency of 192 kHz from the
[0119]
Downsampling section 72ThreeDownsampling the output from 722Downsampling to a sampling frequency of 48kHz, and the downsampled signal is upsampled 731To upsample to 96kHz sampling frequency. This upsampled signal and downsampler 72ThreeThe difference from the output signal from the error signal Δ2As the subtraction part 742Generate with Subtraction unit 741, 742Each error signal from downsampler 722Each of the output signals of the
[0120]
Each
Decoding device of seventh embodiment
FIG. 30 shows a functional configuration of the decoding apparatus according to the seventh embodiment. This is to decode M × N = 9 types of digital signals encoded by the encoding device shown in FIG. 27 or 29 and combining M types of quantization accuracy and N types of sampling frequencies. This is the case.
[0121]
Reference symbols A, B,...1,1, 801,2 , 801,3 , 802,1 , 802,2 , 802, Three , 803,1 , 803,2, 803,3 Respectively, the input layered signal of each compression unit of the encoder is obtained. Each
[0122]
Hereinafter, the digital signals S are combined by combining the decoded hierarchical signals in the same manner as described above.2,2, S2,3, S3,1, S3,2, S3,3Is played.
[0123]
When the quality of the decoded signal required on the decoding side does not require high quality (for example, a digital signal with a quantization accuracy of 24 bits and a sampling frequency of 192 kHz), a digital signal of the required quality (quantization accuracy and sampling frequency) Further, signals with higher quantization accuracy and higher sampling frequency can be omitted. For example, with respect to the maximum number of
For example, when transmitting on a network, if a different packet is assigned to each code A,..., I, and a higher priority information is given to a lower-level (ie, lower-order) code for output, the network Resources can be used effectively. For example, all information can be transmitted in a normal state, but it is sufficient to preferentially transmit only the code A in the event of a network failure or congestion.
[0124]
Example 8
In the eighth embodiment of the present invention, as shown in FIG. 31, the sampling frequency is hierarchized by a 16-bit quantization accuracy signal as in the seventh embodiment, but the hierarchy for the quantization accuracy of 16 bits or more. Conversion is performed for each sampling frequency. In other words, for signals with a quantization accuracy of 20 bits, the signals D, E, and F are generated by encoding the signals of the
[0125]
Using these codes A,..., I, digital signals having various amplitude resolutions (quantization accuracy) and various sampling frequencies can be reproduced. A code used for reproduction of each digital signal is shown as a use code (2) in FIG. For example, a signal having a sampling frequency of 192 kHz and a quantization accuracy of 20 bits includes a code A obtained by encoding a signal having a sampling frequency of 48 kHz and a quantization accuracy of 16 bits, and a code obtained by encoding a signal having a sampling frequency of 96 kHz and a quantization accuracy of 16 bits. B and a code C obtained by encoding a signal having a sampling frequency of 192 kHz and a quantization accuracy of 16 bits.
The sound source 60 (60 in the encoding apparatus of the eighth embodiment shown in FIG.3,324b, 192kHz digital signal S from3,3An example in which digital signals having various sampling frequencies and amplitude word lengths shown in FIG. 26 are generated and encoded will be described.
[0126]
24b, 192kHz digital signal S3,3Is the
24b, 192kHz digital signal S3,3Down sample section 723,3 Is down-sampled to a signal with a sampling frequency of 96 kHz, and this down-sampled signal is3,2 , 712,2 In the same manner, the signal is sequentially divided into bit sections, and is divided into the least significant 4 bits signal, the next least significant 4 bits signal, and the most significant 16 bits signal.3,2 , 612,2 The 16-bit signal of the latter is generated by the
[0127]
Downsample section 723,2 The 24b, 96kHz digital signal with a sampling frequency of 96kHz is downsampled 723,2In addition, the 24b, 48kHz digital signal is further down-sampled to a signal with a sampling frequency of 48kHz.3,1 , 712,1 In the same manner, the signal is sequentially divided into bit sections, and the least significant 4 bits signal, the next least significant 4 bits signal, and the most significant 16 bits signal are compressed. The two 4 bits signal and the 16 bits signal are compressed.
Furthermore, the 16b, 48kHz digital signal is upsampled 731,1 Is up-sampled to a signal with a sampling frequency of 96 kHz, and this up-sampled signal and the
[0128]
16b, 48kHz digital signal S generated by down-sampling from 24b, 192kHz original sound digital signal1,1For example, in the case of an audio signal or a music signal, the energy is biased to a lower frequency band, so1,1 For example, predictive coding, transform coding, or compression coding combined with high compression coding is possible. Specifically, for example, the
[0129]
Note that the sound source of each digital signal to be encoded is shown by a
[0130]
It is to be noted that this encoding method is generally described below as an encoding method hierarchized by M types of quantization accuracy and N types of sampling frequencies in the same manner as described above.
Mth and Nth digital signals S of Nth sampling frequency with at least Mth quantization accuracyM, NSound source 60M, NShall be obtained from
For a set of m, n in the range m = 1, 2 ≦ n ≦ N, input digital signal Sm, nOr digital signal Sm + 1, nDigital signal S generated by dividing fromm, nAnd the m, n-1th digital signal Sm, n-1Signal S generated by upsamplingm, nThe difference is subtracted by 63m, nThe mth and nth error signal Δm, nAs the
[0131]
For m, n pairs in the range m = M, 2 ≦ n ≦ N, the m, nth digital signal Sm, nDown-sampled and the m, n-1 digital signal Sm, n-1Is generated. For m, n pairs in the range of 2 ≦ m ≦ M and 1 ≦ n ≦ N, the mth and nth digital signals with quantization accuracy m and sampling frequency n are sampled with m−1, which has a quantization accuracy lower than m. M-1, n digital signal S of frequency nm-1, nAnd the m, n error signal Δ, which is the error between the m-1, n digital signal and the m, n digital signal.m, nAnd the mth and nth error signal Δm, nThe mth and
For the set m = 1, n = 1, the mth, nth digital signal S with the mth quantization accuracy divided from the m + 1, nth digital signal.m, nOr the input mth and nth digital signal Sm, nAre compressed and encoded to generate the m-th and n-th codes.
[0132]
This encoding method uses the signal S of the highest layer to be encoded.M, NFirst, a digital signal whose sampling frequency falls in order of N-1, N-2, ..., is generated by down-sampling, while maintaining the amplitude resolution M, and then the quantization accuracy is increased for each sampling frequency. It is layered.
Next, a decoding apparatus corresponding to the encoding apparatus shown in FIG. 31 will be described with reference to FIG. Code A, Code D, Code G, Code B, Code E, Code H, Code C, Code F, and Code I are decompression
[0133]
As in the previous embodiment, for example, a digital signal having a quantization accuracy of 24 bits and a sampling frequency of 192 kHz is expressed as a 24b, 192 kHz digital signal.
[0134]
Expressed in general terms, the
Further, for the m, n pair in the range of m = 1, 1 ≦ n ≦ N−1, the
[0135]
[0136]
According to the configuration shown in FIG. 31, various digital signals having combinations of various quantization accuracies (amplitude resolution, amplitude word length) and various sampling frequencies (sampling rates) are uniformly encoded as a two-dimensional hierarchy. In addition, it is possible to perform compression coding with high efficiency as a whole, and to provide various combinations of digital signals requested by users with a small amount of data.
[0137]
According to the configuration shown in FIG. 32, the desired one in the digital signal of various combinations of quantization accuracy and sampling frequency is uniformly decoded from the code encoded by the encoding device shown in FIG. can do.
Note that some users do not necessarily need the m-th and n-th digital signals in all combinations shown in FIG. In the decoding apparatus shown in FIG.
{
[0138]
Ninth embodiment
The ninth embodiment is based on the premise that there exists a sound source that outputs the mth and nth digital signals in which M kinds of amplitude word lengths (quantization accuracy) and N kinds of sampling frequencies (sampling rates) are combined. However, if any of the sound sources does not exist, it may be created from a digital signal of a higher layer as in the case of the encoding apparatus shown in FIG.
[0139]
As shown in FIG. 33, for the digital signal of the shortest amplitude word length, in this example 16 bits, the sampling frequency is hierarchized to a lower sampling rate, that is, a digital signal having a lower sampling frequency is set to the same sampling frequency as the digital signal. After up-sampling, the error signal with the up-sampled signal is encoded to obtain the codes B and C, and the digital signal with the lowest sampling frequency, in this example 48 kHz, is, for example, a 16-bit signal and 20 The codes D and G are constructed by sequentially using the error signal of the bit signal and the error signal of the 20-bit signal and the 24-bit signal.
[0140]
If there is a low-order signal in the sampling frequency direction or amplitude resolution direction, that is, a signal with a low sampling frequency or a short amplitude word length, there is room for two types of selection. That is, by comparing both error signals of the error of the digital signal and the digital signal of the lower sampling frequency and the error of the digital signal of the lower amplitude word length (amplitude resolution), an error with an attribute of which the power of the error signal is small A signal is selected and encoded, along with auxiliary information specifying the selected attribute. For example, 20b, 96kHz digital signal S2,2For
[0141]
Or the digital signal S2,2Digital signal S with lower sampling frequency2,1And low-order amplitude resolution (quantization accuracy) digital signal S1,2The weighted sum signal is generated and the sum signal and the digital signal S2,2The weighting coefficient is determined as auxiliary information so that the power of the error signal is minimized, and the auxiliary information that is the weighting coefficient and the error signal Δ2,2Is encoded.
In FIG. 33, it is shown that the reproduction of the 20b, 96 kHz digital signal can be performed using the set of codes A, B, and E, or can be performed using the set of codes B, D, and E. That is, the auxiliary information indicating the selection indicates which decoding path of the white arrow and the black arrow in FIG. 33 is selected when the digital signal is reproduced. When a lower digital signal is selected and an error signal is generated and encoded in this way, codes necessary for reproducing each digital signal are as shown in the table of FIG.
[0142]
Encoder
An embodiment of the encoding apparatus of the ninth embodiment is shown in FIG. The mth and nth digital signals S of the original sound, each of which is a combination of the sampling frequency and quantization accuracy required to generate the codes A to Im, nSound source 60m, n It is assumed that it is stored in Alternatively, the mth and nth digital signals may be input from the outside. This is the case of m = 1, 2, 3 and corresponds to the m-th amplitude word length (quantization accuracy). In this example, m = 1 is 16 bits, m = 2 is 20 bits, and m = 3 is 24 bits. N = 1, 2, 3 corresponding to the nth sampling frequency (sampling rate). In this example, n = 1 is 48 kHz, n = 2 is 96 kHz, and n = 3 is 192 kHz. Both m and n represent higher levels as the value increases. The m-th and n-th digital signals represent m-th quantization frequency digital signals with the m-th quantization accuracy. Further, the values of the mth quantization accuracy and the nth sampling frequency may be directly used to express, for example, a 16b, 96 kHz digital signal.
[0143]
If a digital signal of a certain condition is not prepared, it is created from the higher-order digital signal. At least the third and third digital signal S3,3That is, a
[0144]
16b, 48kHz digital signal S1,1Is the upsample 641,1Thus, the sampling frequency is converted into a 16b, 96 kHz upsampling signal having a second sampling frequency (96 kHz) higher than the first sampling frequency (48 kHz).
Thus, there is no lower sampling frequency, i.e. the lowest sampling frequency digital signal, e.g. 24b, 48kHz digital signal S3,1And 20b, 48kHz digital signal S2,1Is encoded by compressing and encoding an error signal with a digital signal of quantization accuracy one layer lower than the digital signal at the same sampling frequency. Also, digital signals without lower quantization accuracy, such as 16b, 96kHz
[0145]
But 20b, 96kHz digital signal S2,2If there is a lower input digital signal with respect to quantization accuracy and a lower input digital signal with respect to the sampling frequency, one of these is selected. That is, 20b, 96kHz digital signal S2,2The sampling frequency is the next lower 20b, 48kHz digital signal S with the same amplitude word length.2,1The
[0146]
Similarly, 24b, 48kHz digital signal S3,1The
20b, 192kHz digital signal S2,3Similarly, the 20b, 96kHz digital signal S2,2Up-sampled signal and 16b, 192kHz digital signal S1,3Error signal Δ with one of the accuracy conversion signal of2,3Is compressed and encoded to generate a code F. 24b, 192kHz digital signal S3,3The two lower digital signals S3,2, S2,3Select one of 763,3And select the error signal Δ3,3A code I is generated from
[0147]
[0148]
The signal selected by the
[0149]
An embodiment of a decoding apparatus corresponding to the encoding apparatus in FIG. 35 is shown in FIG. Decoding of the digital signal with the lowest sampling frequency of 48 kHz is the same as that of the decoding apparatus shown in FIG. When a digital signal with lower quantization accuracy and lower sampling frequency than the digital signal to be decoded is reproduced, for example, a 20b, 96 kHz digital signal S2,2Is reproduced, the reproduced 20b, 48kHz digital signal S2,1
[0150]
In general, for m, n pairs in the range of 2 ≦ m ≦ M, 1 ≦ n ≦ N−1, the m, n + 1 auxiliary code is the
The mth and nth digital signals Sm, n, M-1, n + 1 digital signal Sm-1, n + 1The reproduction method from the code is not limited to the method shown in FIG. In short, it is sufficient if there is a means for reproducing both of these digital signals.
[0151]
10th embodiment
In the ninth embodiment, a digital signal having the same sampling frequency and a lower quantization accuracy and a digital signal having a smaller error signal power among the digital signals having the same quantization accuracy and a lower sampling frequency are selected. However, the power of the error signal may be reduced by weighted addition of these two lower digital signals. That is, each selection unit 76 in FIG.m, nIn the block of (2 ≦ m ≦ M, 2 ≦ n ≦ N), both input signals are weighted and added using the mixing unit instead of the selection unit so that the mixing unit is written in parentheses and output. . For example, mixing section 762,2Then, the
[0152]
Mixing
[0153]
In general, encoding of a digital signal is performed by dividing it into frames (encoding unit time). However, the determination of the auxiliary information is not limited to each frame, and may be performed for each subframe constituting the frame.
In a decoding apparatus corresponding to the encoding apparatus using the mixing unit 76, the mixing
[0154]
Generally speaking, the upsampling unit 83m, nM, n + 1 upsampled signal and
Modification of the tenth embodiment
The m-th and n-th digital signals of various combinations of quantization accuracy and sampling frequency in FIG. 35 are input as signals collected separately from the same sound field, or they are input to the sound source 60.1,1~ 603,3Are once stored and read from them. The digital signal of each sound source is the mth and nth digital signal S.m, nUnlike simple downsampling and lower bit truncation, noise (fixed dither signal) may be added, and various conversions and adjustments such as amplitude and sampling (sample point position) deviations may be made. There is a possibility that It is generally unknown in advance how this conversion or adjustment is.
[0155]
Therefore, in this modification, in the encoding apparatus shown in FIG. 35, a digital signal having a lower (n-1) th sampling frequency or a lower mth sampling frequency is compared with a digital signal having an nth sampling frequency and mth quantization accuracy. The digital signal with -1 quantization accuracy is transformed into a digital signal of the same level as described above so that the power of the error signal obtained by subtracting the lower digital signal from the upper digital signal is minimized.
For example, as shown in FIG. 22, the mth and nth digital signals Sm, nIs the
[0156]
Further, when the encoding apparatus performs time / gain adjustment on the lower-order digital signal, specifically, for example, the (m + 1) th and n-th precision conversion signal, the decoding apparatus corresponds to the mth It needs to be done on + 1, n precision conversion signal. The example in that case can also have the same configuration as that described with reference to FIG. 23, and since the operation has already been described, description thereof is omitted here.
In the above modification, the lowest sampling frequency is 48 kHz in FIG. 35 and FIG. 37, and the lowest quantization accuracy is 16 bits in FIG. 35 and FIG. It is an example. In the case of using the selection unit or the mixing unit, the
[0157]
In the decoding apparatus shown in FIG.m, nFor example, as shown in FIG. 39, the m, n + 1 auxiliary code is decoded by the auxiliary
[0158]
In the coding apparatus shown in FIG. 35, the 20b, 96 kHz digital signal S2,234, a set of codes A, D, and E can be used as shown in FIG. 34, and a set of codes A, B, and E can also be used. Therefore, an encoding method using a set with the least amount of information can be used. Similarly, 24b, 192kHz digital signal S3,3For A, B, C, F, I, A, B, E, F, I, A, B, E, H, I, A, D, E, F, It is encoded by the one with the smallest total information amount among the six types of encoding of the set of I, the set of codes A, D, E, H, and I, and the set of codes A, D, G, H, and I. Therefore, a high compression rate can be obtained. For example, in the case of a 20b, 192 kHz digital signal, a set of codes A, B, C, and F, and a set of A, B, E, and F, as shown in the logical expression shown in FIG. , A, B, E, and F, and A, D, E, and F, can be encoded in four ways. In the case of a 24b, 96 kHz digital signal, encoding can be performed in three ways: a set of A, B, E, H, a set of A, D, E, H, and a set of A, D, G, H. . Of these, the transmission efficiency can be increased by using the group having the smallest total information amount (the group having the highest compression rate).
[0159]
The compression unit in the encoding device shown in FIG. 35 can also have the same configuration as the compression unit of the encoding device shown in FIGS. 27 and 31. Similarly, in the decoding device shown in FIG. The decompressor can have the same configuration as the decompressor in the decoding apparatus shown in FIGS.
As described above, in the encoder of the tenth embodiment, when any sound source does not exist or when there is only a digital signal sound source having the highest quantization accuracy and the highest sampling frequency, the signal of the existing sound source is obtained. Then, a digital signal having other quantization accuracy and sampling frequency is generated and encoded. 24b, 192kHz digitized signal S3,3An example in which all digital signals are generated from FIG. 40 will be described with reference to FIG. 40 where only the parts corresponding to those in FIG. The sound source indicated by the broken line on the left side in FIG. 40 does not exist.
[0160]
24b, 192kHz digital signal S3,3Is the digit part 673,3The lower 4 digits are removed and 20b, 192kHz digital signal S2,3Is generated. The 20b, 192kHz digital signal is further reduced by 672,316b, 192kHz digital signal S without using the lower 4 bits1,3Is generated. 24b, 192kHz digital signal S3,3Down sample section 683,3The sampling frequency is downsampled to 96kHz, and the 24b, 96kHz digital signal S3,2Is generated. This 24b, 96kHz digital signal S3,2Is the digit part 673,2, 672,2In turn, without using the lower 4 bits, each 20b, 96kHz
[0161]
Another example of these digital signal generation methods is shown in FIG. In this case, as shown in FIG.3,3, 672,320b, 192kHz
[0162]
In the seventh to tenth embodiments described above, the number M of types of quantization accuracy and the number N of types of sampling frequencies are not limited to 3 each, and the value of M may be a different value. Similarly, the value of N is not limited to 3, and may be another value. In addition, each encoder and each decoder shown in each of the above-described embodiments may be configured to function by causing a computer to execute a program. In this case, for example, with regard to the decoder, the decoding program is downloaded from a recording medium such as a CD-ROM or a magnetic disk or through a communication line by a control means such as a CPU in the computer, and the decoding program is downloaded to the computer. Just execute.
[0163]
According to the seventh to tenth embodiments, for example, the musical sound distribution system described with reference to FIG. 24 can be executed.
According to the seventh to tenth embodiments described above, encoding with different amplitude quantization accuracy and sampling frequency can be executed in a unified manner, and the compression rate of the entire system can be increased.
11th embodiment
First, FIG. 42 shows two-dimensional hierarchization of digital signals used in the eleventh embodiment. A digital signal of M × N = 9 combinations, using three types of quantization types of 16 bits, 20 bits, and 24 bits as M types of quantization accuracy, and three types of 48 kHz, 96 kHz, and 192 kHz as N types of sampling frequencies. Can be generated.
[0164]
The upper 16 bits obtained by removing the lower 8 bits from the least significant bit in the digital signal having a quantization accuracy of 24 bits are encoded by the code A encoded at a sampling frequency of 48 kHz and the upper 16 bits by the code A. A code B encoded with a sampling frequency of 96 kHz for a frequency component higher than the component, a code C encoded with a sampling frequency of 192 kHz for a frequency component higher than the component encoded with the code B, and a sampling for a signal with an amplitude word length of 16 bits The frequency is hierarchized into a plurality. In other words, the sampling frequency is hierarchized by a 16-bit word length signal.
[0165]
For a signal in which the lower 4 bits are added to the 16-bit word length to obtain a 20-bit word length, the lower 4-bit component, that is, a residual component (error) obtained by subtracting the 16-bit word length component from the 20-bit word length signal. Signal), the error signal between the code D encoded at a sampling frequency of 48 kHz, a signal obtained by upsampling a signal having a 20-bit word length and a sampling frequency of 48 kHz to a sampling frequency of 96 kHz, and a digital signal having a 20-bit sampling frequency of 96 kHz is compressed Hierarchy of sampling frequency for a 20-bit word length signal by an encoded code J, a signal obtained by up-sampling a 20b, 96 kHz digital signal to a sampling frequency of 192 kHz, and a code K obtained by compression encoding an error signal of the 20b, 192 kHz digital signal Is realized.
[0166]
With respect to a signal having a 24-bit word length by adding lower 4 bits to the 20-bit word length, the lower 4-bit component, that is, a residual component obtained by subtracting the 20-bit word length component from the 24-bit word length signal ( Error signal), a code G encoded at a sampling frequency of 48 kHz, a signal obtained by up-sampling a 24b, 48 kHz digital signal to a sampling frequency of 96 kHz, a code L obtained by compression encoding the error signal of the 24b, 96 kHz digital signal, Hierarchical coding is performed in the frequency direction as a code M obtained by compression-coding an error signal between a signal obtained by up-sampling a 24b, 96 kHz digital signal at a sampling frequency of 192 kHz and the 24b, 192 kHz digital signal. That is, hierarchization for quantization accuracy of 16 bits or more is performed for each sampling frequency. The quantization accuracy and sampling frequency of the signals corresponding to codes A, B, C, D, and G in this hierarchization are the same as the corresponding codes in FIG. 25. For example, in this embodiment, the signal corresponding to the code L Includes signals corresponding to symbols B, E, and H in FIG. Similarly, the code M in this embodiment includes the codes C, F and I in FIG. 25, the code K in this embodiment includes the codes C and F in FIG. 25, and the code J in this embodiment is the code in FIG. B and E are included.
[0167]
Thus, by using the codes A to D, G, and J to M encoded according to the nine kinds of encoding conditions that are two-dimensionally hierarchized with the amplitude word length (amplitude resolution, quantization accuracy) and the sampling frequency. 43, all M × N = 9 types of digital signals of combinations of M = 3 types of amplitude word lengths and N = 3 types of sampling frequencies can be output. That is, the symbols shown in FIG. 43 may be used for each combination of sampling frequency and quantization accuracy. For example, in the case of a sampling frequency of 96 kHz and an amplitude word length of 24 bits, codes A, D, G, and L may be used.
Next, an encoding method for generating these codes A to D, G, and J to M will be described with reference to the functional configuration shown in FIG. The mth and nth digital signals of the original sound of the combination of the sampling frequency and the amplitude word length necessary for generating the codes A to D, G and J to M are the sound sources 60.m, n It is assumed that it is stored in m = 1, 2, 3 corresponding to the m-th amplitude word length (quantization accuracy). In this example, m = 1 is 16 bits, m = 2 is 20 bits, and m = 3 is 24 bits. N = 1, 2, 3 corresponding to the nth sampling frequency (sampling rate). In this example, n = 1 is 48 kHz, n = 2 is 96 kHz, and n = 3 is 192 kHz. If a digital signal of a certain condition is not prepared, it is created from the digital signal of the higher hierarchy. At least the third and third digital signal S3,3That is, a
[0168]
[0169]
The first and first digital signals S1,1Is the first and
[0170]
Other codes B, C, J, K, L, and M are similarly generated. The generation of these codes is generally described. For the combination of m and n, the lowest m = 1, n = 1 mth and nth digital signals are converted into mth and
M, n sets of m, n digital signals S in the range of 2 ≦ m ≦ M, n = 1m, nFor the m-1 and n-precision converted signals with the same quantization accuracy m, the m-1 and n-precision digital signals are converted from the m-1 and n-precision digital signals immediately below the m-th quantization accuracy.
[0171]
For the m, n digital signal whose sampling frequency is not the lowest, that is, n ≧ 2, the m, n−1 digital signal immediately below the sampling frequency with the same quantization accuracy is used as the nth sampling frequency. -1
When the original sound signal is speech or music, generally, the first and first digital signals are largely biased in the low frequency region.1,1For example, predictive coding, transform coding, or compression coding combined with high compression coding is possible. Specifically, for example, the
[0172]
[0173]
Each
Next, a digital signal decoding method corresponding to FIG. 44 will be described with reference to FIG.
Reference numerals A, D, G, B, J, L, C, K, and M are
[0174]
[0175]
Also, the
[0176]
Each
[0177]
According to the configuration of the encoding device shown in FIG. 44, various digital signals having combinations of various quantization accuracies (amplitude resolution, amplitude word length) and various sampling frequencies (sampling rates) are formed as a two-dimensional hierarchy. Encoding can be performed uniformly, and compression coding can be performed with high efficiency as a whole, and various combinations of digital signals for providing a reproduction signal of the quality required by the user can be provided with a small amount of data. .
[0178]
According to the configuration of the decoding device shown in FIG. 45, the desired ones in the digital signals of various combinations of quantization accuracy and sampling frequency are unified from the codes encoded by the encoding device shown in FIG. Can be decrypted automatically.
Note that the m-th and n-th digital signals in all combinations shown in FIG. 44 are not necessarily required. For example, the
[0179]
44 and FIG. 45, the number M of types of quantization accuracy and the number N of types of sampling frequencies are not limited to three, but may be other values.
The
[0180]
In short, the encoding method according to the eleventh embodiment has one quantization accuracy and one sampling frequency for encoding digital signals having various quantization accuracies (amplitude resolution, amplitude word length) and various sampling frequencies (sampling rates). Digital signal encoding has the same quantization accuracy as this, generates an error signal with a signal with a lower sampling frequency but a closer digital signal upsampled to the same sampling frequency, and compresses the error signal Encoding is performed only by compressing and encoding the error signal with the upsampling signal as described above except for the digital signal having the lowest sampling frequency. For a digital signal with the lowest sampling frequency, an error signal is compressed and encoded with a signal whose accuracy is converted to the same quantization accuracy (same amplitude word length) from the closest digital signal with a lower quantization accuracy.
[0181]
Also, the decoding method of the eleventh embodiment generates an error signal by decompressing and decoding the compression code of the error signal for the digital signal to be decoded, and has the same quantization accuracy as the digital signal to be decoded and a low sampling frequency. The reproduced digital signal closer to is up-sampled to the same sampling frequency as the sampling frequency of the decoded error signal, and added to the decoded error signal to obtain a digital signal. The modification of FIGS. 22 and 23 applied in the embodiment of FIGS. 16 and 21 is applied to the embodiment of FIGS. 44 and 45, and the level adjustment of the sample and the sample position are applied to one or both of the upsampling signal and the accuracy conversion signal. May be adjusted.
[0182]
The coding apparatus shown in FIG. 44 and the decoding apparatus shown in FIG. 45 may be configured to cause a computer to execute a program and function. In this case, for example, with regard to a decoding device, a decoding program may be downloaded into a computer from a recording medium such as a CD-ROM or a magnetic disk or through a communication line, and the decoding program may be executed by the computer. .
Although the present invention is applied to a music digital signal in the above description, it can also be applied to an image digital signal.
According to the eleventh embodiment described above, encoding with different amplitude accuracy and sampling rate requirements, particularly reversible encoding, can be performed in a unified manner, and both individual compression performance and compression performance for all of the various encoding conditions are compatible. it can.
12th embodiment
FIG. 46 shows a conceptual configuration of the twelfth embodiment of the present invention. In this embodiment, 5-channel signal L5c: front left, R5c: front right, C5c: center, LS5c: left rear (surround), RS5c: right rear (surround), two-channel stereo signals L and R, It is assumed that signals of three types of channels of the mono-channel monaural signal M are hierarchically encoded. Both are recorded in the same space. The stereo signals L and R and the monaural signal M with a smaller number of channels are lower than the 5-channel signal, and the monaural signal M with a smaller number of channels (ie, one channel) is lower or pre-arranged with respect to the stereo signals L and R. Hierarchized to those recorded according to the standard.
[0183]
First, the monaural signal M is compression-coded alone. This compression encoding may be lossless encoding or lossy encoding. The stereo signals L and R are encoded by correcting the monaural signal M, subtracting the corrected signal M ′ from L and R, and reversibly compressing the differential signals L-M ′ and R-M ′, respectively. To do. At this time, auxiliary information related to correction is also losslessly encoded. When the auxiliary information itself is output as a code, it is not necessary to perform further encoding. Since the monaural signal M has a certain degree of correlation with the stereo signals L and R, in many cases, the difference signal can be smaller in amplitude than the signals L and R itself.
Although correction will be described later with reference to FIG. 52, amplitude adjustment by multiplying a signal sample value by a coefficient, adjustment of a sample position, or a combination thereof is performed. By such correction, the amplitude of an error signal to be encoded as described later is made as small as possible. Correction can be performed using auxiliary information for each frame. The auxiliary information related to the determined correction amount is also encoded.
[0184]
Further, the stereo signals L and R and the monaural signal M are used for improving the coding efficiency of the five channels. Under general recording conditions, the signal L5c, LS5c in the 5-channel signal and the stereo signal L have a strong correlation, and the signal R5c, RS5c in the 5-channel signal and the stereo signal R have a strong correlation. Differential encoding is performed using the strong correlation between C5c and monaural signal M. That is, the difference signals (L5c-L) and (LS5c-L) of the signal L5c or LS5c in the 5-channel signal from the stereo signal L are respectively losslessly compressed and encoded from the stereo signal R to the signal R5c or RS5c in the 5-channel signal. The difference signals (R4c-R) and (RS5c-R) are losslessly encoded. Further, the differential signal (C5c-M) of the signal C5c in the 5-channel signal from the monaural signal M is also losslessly encoded.
[0185]
FIG. 47 shows an example in which the concept of the twelfth embodiment shown in FIG. 46 is more specifically configured. Here, five-channel signals C5c, L5c, R5c, LS5c, and RS5c with a sampling frequency of 192 kHz and a sampling word length (quantization accuracy) of 24 bits are supplied by signal sources 10C5, 10L5, 10R5, 10LS, and 10RS, respectively. In this example, stereo signals L and R of 192 kHz and a sample word length of 24 bits are supplied from the
The signals L5c and LS5c in the 5-channel signal are subtracted by the subtracters 13L5 and 13LS, respectively, from the corrected stereo signals L ′ from the correction units 16L5 and 16LS described later with reference to FIG. (Also referred to as an error signal or a differential signal) is losslessly encoded by the compression encoders 11L5 and 11LS. The correction information determined by the correction units 16L5 and 16LS is losslessly encoded as auxiliary information by the auxiliary information encoding units 15L5 and 15LS. Similarly, the signals R5c and RS5c in the 5-channel signal are subtracted from the corrected stereo signal R ′ from the correction units 16R5 and 16RS by the subtractors 13R5 and 13RS, respectively, and the obtained residual signal is compressed and encoded. It is losslessly encoded by 11R5 and 11RS. The parameters determined by the correction units 16R5 and 16RS are losslessly encoded as auxiliary information by the auxiliary information encoding units 15R5 and 15RS. When the correction information is output as a code by itself, it is not necessary to further encode it by the auxiliary information encoding unit.
[0186]
The monaural signal M is up-sampled by the
[0187]
FIG. 48 is a specific example of a decoding apparatus corresponding to the encoding apparatus of FIG. The codes losslessly encoded by the compression encoders 11C5, 11L5, 11R5, 11LS, 11RS, 11L, and 11R in FIG. 47 are encoded by the decoding / decompressing units 30C5, 30L5, 30R5, 30LS, 30RS, 30L, and 30R, respectively. The decoded signal is given to the adders 32C5, 32L5, 32R5, 32LS, 32RS, 32L, 32R and corrected from the correction units 36C5, 36L5, 36R5, 36LS, 36RS, 36L, 36R. The signals M ′, L ′, R ′, L ′, R ′, M ′, and M ′ are added to generate original sound signals C5c, L5c, R5c, LS5c, RS5c, L, and R. The code from the
[0188]
The monaural signal decoded by the
[0189]
The correction units 36L5 and 36LS correct the output (stereo signal L) of the
13th embodiment
FIG. 49 shows the concept of the thirteenth embodiment, which generates the sum and difference of L and R for two-channel stereo signals L and R. Under general recording conditions, the sum signal (L + R) has a larger amplitude than the difference signal (LR), and the correlation between the monaural signal M captured at one position and the center signal C5c of the 5-channel signal is large. There are many. Therefore, the difference between the sum signal (L + R) and the monaural signal M and the difference between the sum signal (L + R) and the center signal C5c are losslessly encoded, and at the same time, the difference signal (L-R) is losslessly encoded as it is. The monaural signal M is also subjected to lossless encoding or lossy encoding as it is. When taking the difference between the sum signal and the monaural signal, either the half value of the sum signal or the double value of the monaural signal is used. When taking the difference between the sum signal and the center signal, either the half value of the sum signal or the double value of the center signal is used. In either case, in order to obtain a half value and a double value, the bit string indicating the value may be shifted to the lower or higher order bit by bit.
[0190]
Furthermore, since the stereo signal L is generally highly correlated with the signals L5c and LS5c in the 5-channel signal and the stereo signal R is highly correlated with the signals R5c and RS5c in the 5-channel signal, the difference between the signals L5c, LS5c and the signal L and The difference between the signals R5c, RS5c and the signal R is losslessly encoded. In the following description, the difference signal (LR) and the sum signal (L + R) are encoded. However, even if one of them is divided by 2, the difference signal (LR) is encoded. Since the least significant bit is the same as the least significant bit of the sum signal (L + R), the one divided by 2 is doubled when restored (1 bit lower, that is, shifted in the MSB direction), and the least significant bit If the bit is the same as the least significant bit that is not divided by 2, the difference signal (LR) and the sum signal (L + R) can be reconstructed completely without distortion. At the time of signal reconstruction, decoding of the monaural signal M, decoding of the sum signal (L + R) and decoding of the difference signal (L-R) can reconstruct all of the 5-channel signal, stereo signal, and monaural signal.
[0191]
FIG. 50 shows a specific configuration example of the thirteenth embodiment based on the concept shown in FIG. Of the five channel signals, the configuration for encoding processing for signals L5c, R5c, LS5c, and RS5c is the same as in FIG. 47, but the encoding for center signal C5c is not a monaural signal but a sum signal (L The difference is that encoding is performed by taking the difference from + R). In FIG. 50, stereo signals L and R are subtracted by a
[0192]
FIG. 51 shows a configuration of a decoding apparatus corresponding to the encoding apparatus of FIG. In this example, the monaural signal M having a sample word length of 16 bits and a sampling rate of 48 kHz decoded by the
[0193]
The difference signal (LR) decoded by the
Each of the correction units 16C5, 16L5, 16R5, 16LS, 16RS, 16L, and 16R in FIGS. 47 and 50 has the same configuration. For example, as shown in FIG. This is basically the same as that described above, and includes a
[0194]
Each of the correction units 36C5, 36L5, 36R5, 36LS, 36RS, and 36L in FIGS. 48 and 51 has the same configuration as shown in FIG. 23 as shown in FIG. It is basically the same, and is composed of a
14th embodiment
FIG. 54 shows the concept of a fourteenth embodiment of the encoding method according to the present invention. In the fourteenth embodiment, inter-channel orthogonal transformation is performed on a 5-channel signal to calculate a differential signal from the signals of other channels. The orthogonal transform between channels corresponds to a conversion to a frequency domain across channels, and Nc × Nc for a vector whose number is the number of channels Nc whose elements are one sample of each channel at the same time. Equivalent to multiplying an orthogonal matrix. Examples of the inter-channel orthogonal transform include multiplication of a principal component analysis matrix or Hadamard matrix, a DCT (digital cosine transform) matrix, and a DFT (digital Fourier transform) matrix between channels.
[0195]
By this conversion, a vector of input samples is converted into a vector composed of frequency domain sample elements. In the following description, F0, F1, F2, F3, and F4 are assumed in order from the lowest frequency of the converted output sample element. The component F0 having the lowest frequency due to the orthogonal transformation is a component that is the sum of the five-channel input samples, and generally has higher power than the component having a higher frequency. For example, when the correlation between channels such as a multi-channel music signal is high, energy is concentrated on the low frequency side and the energy on the high frequency side is small. Therefore, when the inter-channel orthogonal transform is performed, the amplitude on the signal F0 side having the lowest frequency becomes large.
[0196]
A signal having the largest amplitude in the inter-channel orthogonal transform outputs F0 to F4, for example, F0, is expected to have a high correlation with the monaural signal M. In addition, it is expected that a signal having the second largest amplitude, for example, F1 has a high correlation with the stereo difference signal (L-R). Therefore, the monaural signal M is corrected and the difference from the orthogonal transformation output signal F0 having the largest amplitude is losslessly encoded, the difference signal (LR) is corrected and the difference from the orthogonal transformation output signal F1 having the second largest amplitude is obtained. Lossless encoding.
FIG. 55 shows an example of an encoding apparatus that specifically configures the concept of the encoding method of the fourteenth embodiment shown in FIG. The configuration and connection relationship of the
[0197]
The monaural signal M is losslessly or irreversibly encoded by the
[0198]
On the other hand, the difference signal (LR) is corrected by the
FIG. 56 shows a decoding apparatus corresponding to FIG. The signal decoded by the
[0199]
The upgraded monaural signal M and difference signal (LR) are corrected by the
47 and 50, the 5-channel signal is described as having a sampling frequency of 192 kHz and an amplitude resolution of 24 bits. Compared to this, the sampling frequency of the monaural signal M is 48 kHz and the amplitude resolution is 16 bits. Although low, the monaural signal M is upgraded to a sampling frequency of 192 kHz and an amplitude resolution of 24 bits in the
[0200]
According to the above-described embodiment, reversible encoding with different numbers of channels can be performed uniformly, and the compression ratio of the entire system is increased as compared with the case where each channel is encoded separately without performing differential encoding. be able to. That is, since the correlation between the 5-channel signal and the stereo signal can be removed by taking the difference between the 5-channel signal and the stereo signal, the code bit string has a smaller information amount than the total when the 5-channel signal and the stereo signal are independently compressed. Also, the amount of traffic on the network is monitored, and when the amount of traffic exceeds a predetermined value, for example, transmission of 5 channel signals is stopped and only stereo and monaural signals are transmitted. It is also possible to increase / decrease the number of channels according to the band fluctuation.
15th embodiment
A lossless encoding method that does not allow distortion is known as a method for compressing information such as sound and images. Depending on the application, the sampling frequency and quantization accuracy may differ, and as shown in the previous example, if multiple types of sampling rate and amplitude resolution signals are prepared in advance, depending on the application, preference, and network conditions Lossless compression encoding that can correspond to one desired set of one of a plurality of types of sampling frequencies and a plurality of types of amplitude resolution is possible. A fifteenth embodiment of such compression encoding will be described below.
[0201]
Here, as shown in FIG. 33, the sampling frequency and the amplitude quantization accuracy are two-dimensionally hierarchized to encode a signal, so that higher-level coding becomes lower-level coding. So that it can be expressed as The original sound with the specified sampling frequency and quantization accuracy can be reproduced, and can be hierarchically integrated into multiple types of encoding. In particular, the coding efficiency can be improved by combining the low frequency component of the signal of the sampling frequency of the lower layer and the high frequency component of the signal of the lower amplitude resolution, and selecting or synthesizing the difference from the original sound.
When the two-dimensional hierarchization of the sampling frequency and the quantization accuracy is performed with the hierarchical structure shown in FIG. 33, the quantization accuracy is the number of layers P = 3, and the sampling rate is the number of layers Q. = 3, 48, 96 and 192kHz respectively. P × Q = 9 types of original sounds A, B, C, D, E, F, G, H, and I are given and encoded with as little information as possible, and the original original sound is decoded without distortion. The attributes of the original sound signal are hierarchized into nine types of P × Q = 3 × 3, and the sampling frequency and the quantization accuracy allow the higher order signal to be configured using the lower order signal.
[0202]
A 16-bit quantization accuracy signal encodes an error signal from a signal after up-sampling a signal with the same quantization accuracy at a lower sampling frequency. The 48 kHz signal is obtained by converting the lower quantization accuracy signal to the same higher accuracy and encoding an error signal with the accuracy converted signal. When lower signals exist in the sampling frequency direction and the quantization accuracy direction, one of the two lower signals can be selected. For example, when encoding a signal E having a sampling frequency of 96 kHz and a quantization accuracy of 20 bits, an error is detected among the signal B having a sampling frequency of 96 kHz and a quantization accuracy of 16 bits and the signal D having a sampling frequency of 48 kHz and a quantization accuracy of 20 bits. You may choose the one where the power of a signal becomes the minimum.
[0203]
FIG. 57 shows an encoding apparatus according to the fifteenth embodiment. In this example, the original sound signal S with a sampling frequency of 192 kHz as the original sound and a quantization accuracy of 24 bits, 20 bits, and 16 bits, respectively.3,3, S2,3, S1,3,
[0204]
Similarly, signal
[0205]
Each
[0206]
For example, the
[0207]
Alternatively, in addition to the above selection, two types of signals can be synthesized. Synthesis includes averaging, weighted addition, weighted addition that varies with time, and the like. For example, as described later with reference to FIG.3,2, S2,3Weighted average and original sound signal S3,3The difference between and is generated and output.
[0208]
In addition, instead of selecting the entire frame, it is possible to select the one in which the difference power is smaller for each subframe or for each of a plurality of frames.
FIG. 58 shows each
[0209]
FIG. 59 shows the original sound signal Sm, nLower signal Sm, n-1And Sm-1, nDifference module for weighted average of 13m, nA configuration example of (m = 2, 3; n = 2, 3) is shown. 58,
[0210]
FIG. 60 shows a configuration example of a decoding apparatus corresponding to the encoding apparatus of FIG. The input codes corresponding to the sound source signals I, F, C, H, E, B, G, D, and A are each decoded together with the auxiliary information by the decompression decoding unit, and the decompression decoding unit 301,1The decoding output from is the lowest decoded original sound signal S1,1Are output as the
[0211]
[0212]
FIG. 62 shows the
[0213]
58 and 59, as shown in FIGS. 63 and 64, the output side of the
[0214]
61 and 62 in the decoding apparatus shown in FIGS.m, nSimilarly to FIGS. 63 and 64, the output of the
[0215]
FIG. 67 shows the signal S of the lower sampling frequency.m, n-1Signal S with lower frequency components and lower quantization accuracy than the cutoff frequency ofm-1, nAn example of simply synthesizing the high-frequency component of is shown. Signal S of the lower sampling frequency shown in FIG. 67Am, n-1The Nth (N = 0, 1, 2,...) Sample amplitude values are arranged as they are at even-numbered 2N sample positions of the double sampling frequency shown in FIG. 67B. Next, the lower quantization accuracy signal S in FIG. 67C.m-1, nThe sample positions are aligned and the odd-numbered samples are arranged at the corresponding positions.
Or even-numbered samples are arranged in the same way as above, and odd-numbered samples are signals S of lower sample frequencies.m, n-1It is possible to arrange a sample of a signal obtained by selecting a weighted addition of a signal obtained by up-sampling and a signal having a lower quantization accuracy or one of them.
Sixteenth embodiment
In the fifteenth embodiment, encoding and decoding using the two-dimensional hierarchization of the quantization accuracy and sampling frequency shown in FIGS. 33 and 34 have been described. In the sixteenth embodiment, FIGS. 2 is used to encode the error signal in the frequency domain. This embodiment will be described with reference to FIG.
[0216]
As shown in FIG. 68, the encoding apparatus according to the sixteenth embodiment has a
[0217]
The lowest digital signal S1,1Is the
[0218]
Signal S with a sampling frequency of 96kHz and quantization accuracy of 16 bits1,2As is clear from FIG. 42, the signal S includes the signal components A and B and has a quantization accuracy of 20 bits.2,2Includes signal components A, D, and J, and a signal S3,2 having a quantization accuracy of 24 bits includes signal components A, D, G, and L. Accordingly, the subtracting
[0219]
Similarly, the digital signal S2,2Is orthogonally transformed and subtracted 632,2And an
[0220]
Each
[0221]
Thus, what is characteristic of this embodiment is that an error signal can be generated without up-sampling between signals of different sampling frequencies in order to obtain an error signal in the frequency domain. Each
An example of a decoding apparatus corresponding to the encoding apparatus of FIG. 68 is shown in FIG. Input codes A, D, G, B, J, L, C, K, M are
[0222]
Frequency domain error signal Δ1,2Is the
[0223]
In the embodiment of FIG. 68, the digital signal S having the lowest sampling frequency of 48 kHz is used.2,1, S3,1In the modified example shown in FIG. 70, the digital signal S having the lowest sampling frequency of 48 kHz is shown.2,1, S3,1An error signal with respect to is also obtained in the frequency domain. Other configurations are the same as those in FIG.
In this case, the
[0224]
The digital signal S with a sampling frequency of 48 kHz1,1, S2,1, S3,1Is converted into a frequency domain signal, and the
FIG. 71 shows a decoding apparatus corresponding to the encoding apparatus according to the modified embodiment of FIG. Also in this embodiment, the accuracy conversion for the decoded signal at the lowest sampling frequency is performed in the frequency domain. That is, the
[0225]
[0226]
Orthogonal
[0227]
In the embodiment of FIG. 68, the
Seventeenth embodiment
The plurality of original sound signals handled in the present invention described above may have different signal attributes such as sampling frequency, quantization accuracy, number of channels, and the like. Overall compression efficiency can be improved by hierarchical coding of sequences. Here, a method for designating various hierarchical structures of such a plurality of signals will be described.
[0228]
As described above, the sampling frequency, the quantization accuracy, and the number of channels can be hierarchized, and the encoding of the higher layer signal can include the encoding of the lower layer signal. As a result, the original sound signal can be reproduced at the designated sampling frequency, quantization accuracy, and number of channels, and encoding of a plurality of types of conditions can be integrated. Here, a description method that secures a degree of freedom is provided particularly for each input signal.
FIG. 72 shows an example of the structure of a compression code string in which hierarchical association is designated. In this embodiment, assuming that a sampling frequency (frequency direction) and quantization accuracy are hierarchized, and further a hierarchical structure of the number of channels is assumed, an error signal between hierarchies is a code string that is compression-encoded. Here, four compression code strings M, L, G, and A are shown. Each compression code string has a series of codes obtained by compressing and encoding the original sound signal of the same layer in the data area (field x9 described later). Therefore, the same hierarchy as the original sound signal is also defined for the code string. . Each code string is added with fields x1 to x7 describing its attributes (hierarchical information).
[0229]
A field x1 represents a sequence number of a code string, and here,
[0230]
If the extension flag x7 is “1”, the encoding auxiliary information of the field x8 is added, and if the extension flag is “0”, the data string of the field x9 is started. The code string G shows an example in which the extension flag x7 is 1, and the auxiliary information field x8 is inserted. Each sequence is generally transmitted in correspondence with packets in units of frames, and packet management may be performed according to, for example, an existing Internet protocol. When only storing without transmitting, it is common to manage the head position of each code sequence separately from the code sequence.
FIG. 73 shows an original sound signal S with a quantization accuracy of 24 bits and sampling frequencies of 192 kHz and 96 kHz.1,1, S1,2And the sampling frequency is 48kHz, quantization accuracy is 24bit and 16bit original sound signal S2,1, S2,2An example of hierarchical encoding is shown.
[0231]
Signal
[0232]
Therefore, the code string M is related to the lower code string L, the code string L is related to the lower code string G, and the code string G is related to the lower code string A.
FIG. 74 shows the association between a code string and code strings in which information fields x1 to x7 defining a hierarchical structure are added to the code strings M, L, G, and A generated by the encoding process of FIG. In the code sequences M, L, G, and A,
[0233]
Fig. 75 shows a structure that encodes nine types of layered original sound signals by combining three types of sampling frequencies 192kHz, 96kHz, 48kHz and three types of quantization accuracy 24bit, 20bit, 16bit. FIG. 76 shows a code sequence having such fields. In the encoding of FIG. 75, auxiliary information is not used, so that all the extension flags of field x7 are set to “0”. Also, the lowest signal S1,1All other signals except S3,3, S2,3, S1,3, S3,2, S2,2, S1,2, S3,1, S2,1Since each of them is different from only one lower order signal, “1” is written in the field of the number of lower series.
[0234]
FIG. 77 is a description of the hierarchical structure for the code strings I, F, C, H, E, B, G, D, and A generated by encoding the hierarchical original sound signal shown in FIG. Similarly to the case of FIG. 75, nine types of hierarchized original sound signals are compression-coded. Since auxiliary information is used for this encoding, the extension flag x7 of all other code sequences except the code sequence A is set to "1", and the encoded information field x8 is inserted immediately after that. Has been.
FIG. 78 shows a description of the hierarchical structure corresponding to the code sequence by the multi-channel hierarchical encoding shown in FIG. In the embodiments so far, the encoding apparatus is premised on subtraction from the lower sequence, or the decoding apparatus is addition from the lower sequence. In FIG. 78, the code sequences of
[0235]
In the case of the encoding that performs the inter-channel orthogonal transform described in FIG. 55, for example, information indicating that the orthogonal transform has been performed is written in the auxiliary information field x8 of the code sequence that has been subjected to the inter-channel orthogonal transform in FIG. If necessary, the grammar is determined in advance so that further details can be added.
FIG. 79 shows a basic processing procedure by the encoding apparatus of each embodiment described above. In the present invention, a plurality of original sound signals having hierarchized attributes are to be encoded. The attributes are, for example, the type of sampling frequency and the type of quantization accuracy of the samples in the first to sixteenth embodiments, and the five-channel signal and the stereo signal (two-channel signal) in the twelfth to fourteenth embodiments. ) In a signal system of a plurality of groups having different numbers of channels such as a monaural signal (one channel signal), the number of channels of the group to which the signal belongs is also an attribute of the signal. The direction in which the number of channels decreases is the lower direction. In the fifteenth embodiment, the attributes are a plurality of predetermined sampling frequencies and a plurality of predetermined amplitude resolutions of the signal. Based on the above definition, the encoding process is performed as follows.
[0236]
Step S1: The original sound signal to be encoded is searched for an original sound signal having a lower attribute.
Step S2: If there is a lower original sound signal, an error signal between the original sound signal to be encoded and the lower original sound signal or its modified signal is generated. That is, when there are two lower original sound signals, a modified signal synthesized from the lower two signals is obtained, and an error signal between the modified signal and the encoding target signal is obtained.
Step S3: The error signal is losslessly encoded.
Step S4: It is determined whether encoding has been completed for all the original sound signals. If not completed, the process returns to step S1.
[0237]
Step S5: When there is no original sound signal lower than the original sound signal to be encoded in Step S1, the original sound signal is losslessly encoded.
FIG. 80 shows a basic processing procedure performed by the decoding apparatus according to the above-described embodiment.
Step S1: A plurality of input codes are decoded to obtain an error signal and an original sound signal.
Step S2: A decoded original sound signal having a lower attribute than the error signal or a modified signal thereof and the error signal are synthesized to generate a decoded original sound signal.
Step S3: It is determined whether or not the processing has been completed for all the input codes.
[0238]
Such an encoding process procedure and a decoding process procedure can be described as a computer-executable program. The computer in which such a program is installed can execute signal encoding and decoding according to the present invention.
FIG. 81 shows the configuration of a computer that executes the encoding method and decoding method according to the present invention described in a program. The
[0239]
When executing the encoding process or the decoding process, the program is read from the
[0240]
【The invention's effect】
As described above, according to the present invention, an error signal is generated from a signal having a layered attribute and a signal having a lower attribute than that signal or a modified signal thereof, and the error signal is losslessly encoded. Thus, efficient encoding can be realized and reversible encoding can be realized.
[Brief description of the drawings]
FIG. 1 is a diagram showing an example functional configuration of an encoding device and a decoding device according to a first embodiment of the present invention.
FIG. 2 is a diagram showing a functional configuration example of an encoding device and a decoding device according to a second embodiment of the present invention.
FIG. 3 is a diagram showing a functional configuration example of an encoding device and a decoding device according to a third embodiment of the present invention.
4 is a diagram illustrating an example of a functional configuration of an array conversion /
FIG. 5A is a diagram for explaining bit array conversion of a sample string expressed by polarity and absolute value, B is a diagram for explaining bit array conversion of a sample string expressed by two's complement, and C is It is a figure which shows the example of a format of a packet.
FIG. 6 is a diagram showing an example functional configuration of a decoding / array
7 is a flowchart showing an example of a procedure of missing information correction processing in FIG. 6;
8 is a diagram showing a specific functional configuration example of a missing
FIG. 9 is a diagram illustrating a functional configuration example of an encoding device and a decoding device according to a third embodiment of the present invention.
10A is a diagram illustrating a specific functional configuration example of the prediction
11A is a diagram illustrating a specific functional configuration example of the
12A is a diagram illustrating an example of a conceptual spectral characteristic of an error signal, and FIG. 12B is a diagram illustrating a spectral characteristic obtained by inverting the frequency axis of the spectral characteristic of A. FIG.
FIG. 13 is a diagram showing a functional configuration example of an encoding device and a decoding device according to a fourth embodiment of the present invention.
14A is a diagram showing an example of hierarchical code division according to the present invention, and FIG. 14B is a diagram showing an example of the relationship between amplitude resolution and amplitude word length.
15 is a diagram showing the relationship between the hierarchically divided code combinations shown in FIG. 14A and various sampling frequencies and various amplitude resolutions.
FIG. 16 is a diagram showing a functional configuration of a fifth embodiment of the encoding apparatus according to the present invention;
17A is a diagram showing interpolation in upsampling, and B is a diagram showing an example of an interpolation filter. FIG.
18A is a functional configuration diagram showing an example of a lossless compression encoder applicable to the embodiment of the present invention, and B corresponds to the lossless compression encoder of FIG. 18A applicable to the embodiment of the present invention. The functional block diagram of a decoder.
19A is a functional configuration diagram showing an example of a lossless encoder applicable to the embodiment of the present invention, and FIG. 19B is a diagram showing a functional configuration showing an example of a lossless decoder applicable to the embodiment of the present invention.
20A is a diagram illustrating a correspondence example between auxiliary codes and the number of taps, B is a diagram illustrating a correspondence example between auxiliary codes and gains, C is a diagram illustrating a correspondence example between auxiliary codes and sample point movement, and D is an auxiliary code. FIG.
FIG. 21 is a diagram showing a functional configuration of an embodiment of a decoding device according to the present invention;
FIG. 22 is a diagram showing a functional configuration of another embodiment of the encoding apparatus according to the present invention.
FIG. 23 is a diagram showing a functional configuration of another embodiment of the decoding apparatus according to the present invention;
FIG. 24 is a diagram showing a musical sound distribution system for explaining the effect of the present invention.
FIG. 25 is a diagram showing an example of hierarchical code division according to the seventh embodiment of the present invention;
FIG. 26 is a diagram illustrating a relationship between a hierarchically divided code combination, various sampling frequencies, and various amplitude resolutions.
FIG. 27 is a diagram showing a functional configuration of an embodiment of an encoding apparatus according to a seventh embodiment of the present invention;
FIG. 28 is a diagram showing a functional configuration of a predictive encoder applicable to the embodiment of the present invention.
FIG. 29 is a diagram showing a functional configuration of another embodiment of the encoding apparatus according to the seventh embodiment of the present invention;
FIG. 30 is a diagram showing a functional configuration of a decoding apparatus according to a seventh embodiment of the present invention.
FIG. 31 is a diagram showing a functional configuration of an encoding apparatus according to an eighth embodiment of the present invention.
FIG. 32 is a diagram showing a functional configuration of a decoding apparatus according to an eighth embodiment of the present invention.
FIG. 33 is a diagram showing an example of hierarchical code division according to the ninth embodiment of the present invention;
FIG. 34 is a diagram showing a relationship among a sampling frequency, an amplitude word length, and a combination of codes used in the ninth embodiment of the present invention.
FIG. 35 is a block diagram showing the functional arrangement of encoding apparatuses according to ninth and tenth embodiments of the present invention;
36 is a diagram showing a functional configuration example of a selection unit 76 in FIG. 35. FIG.
FIG. 37 is a diagram showing a functional configuration of the decoding apparatuses according to the ninth and tenth embodiments according to the present invention;
38 is a diagram showing another functional configuration example of the selection unit 76 in FIG. 35;
FIG. 39 is a diagram illustrating a functional configuration example of a
FIG. 40 is a diagram illustrating another example of the encoding apparatus according to the ninth and tenth embodiments.
FIG. 41 is a diagram showing still another example of the encoding apparatus according to the ninth and tenth embodiments.
FIG. 42 is a diagram showing an example of hierarchical code division according to the eleventh embodiment of the present invention;
43 is a diagram showing the relationship between the hierarchically divided code combinations shown in FIG. 42, various sampling frequencies, and various amplitude resolutions.
FIG. 44 is a diagram showing a functional configuration of an encoding apparatus according to an eleventh embodiment of the present invention.
FIG. 45 is a diagram showing a functional configuration of a decoding apparatus according to an eleventh embodiment of the present invention.
FIG. 46 is a diagram conceptually illustrating a first embodiment of the encoding method according to the present invention.
FIG. 47 is a block diagram showing a specific configuration example of an encoding apparatus according to a twelfth embodiment.
FIG. 48 is a block diagram illustrating a specific configuration example of a decoding device according to a twelfth embodiment.
FIG. 49 is a diagram for conceptually explaining a thirteenth embodiment of the encoding method according to the present invention;
FIG. 50 is a block diagram illustrating a specific configuration example of an encoding apparatus according to a thirteenth embodiment.
FIG. 51 is a block diagram showing a specific configuration example of a decoding apparatus according to a thirteenth embodiment.
FIG. 52 is a block diagram showing a configuration of a correction unit in the encoding apparatus according to the twelfth and thirteenth embodiments.
FIG. 53 is a block diagram showing a configuration of a correction unit in the decoding devices according to the twelfth and thirteenth embodiments.
FIG. 54 is a diagram for conceptually explaining a fourteenth embodiment of an encoding method according to the present invention.
FIG. 55 is a block diagram illustrating a specific configuration example of an encoding device according to a fourteenth embodiment.
FIG. 56 is a block diagram showing a specific configuration example of a decoding apparatus according to the fourteenth embodiment.
FIG. 57 is a block diagram showing a configuration of a fifteenth embodiment of an encoding apparatus according to the present invention.
FIG. 58 is a block diagram showing a configuration example of a difference module in the fifteenth embodiment.
FIG. 59 is a block diagram showing another configuration example of the difference module.
FIG. 60 is a block diagram showing a configuration of a decoding apparatus according to a fifteenth embodiment.
61 is a block diagram showing a configuration of an addition module in FIG. 60. FIG.
FIG. 62 is a block diagram showing another configuration example of the addition module.
63 is a block diagram showing another configuration example of the difference module in FIG. 57. FIG.
64 is a block diagram showing still another configuration example of the difference module in FIG. 57. FIG.
65 is a block diagram showing another configuration example of the addition module in FIG. 60. FIG.
66 is a block diagram showing still another configuration example of the addition module in FIG. 60. FIG.
FIG. 67 is a diagram for explaining a procedure for synthesizing signals with different sampling frequencies and quantization accuracy;
FIG. 68 is a block diagram showing a configuration of a coding apparatus according to a sixteenth embodiment.
69 is a block diagram showing a configuration of a decoding apparatus corresponding to the encoding apparatus in FIG. 68. FIG.
FIG. 70 is a block diagram showing a modified example of the encoding apparatus in FIG. 68;
71 is a block diagram showing a decoding apparatus corresponding to the encoding apparatus in FIG. 70. FIG.
FIG. 72 is a diagram showing an example of hierarchical information added to a code string.
Fig. 73 is a diagram showing a four-layer encoding configuration;
74 is a diagram showing hierarchical information added to a code sequence in the case of the coding configuration in FIG. 73. FIG.
Fig. 75 is a diagram showing an encoding configuration of nine layers.
76 is a diagram showing hierarchical information added to a code sequence in the case of the coding configuration in FIG. 75. FIG.
77 is a diagram showing hierarchical information added to a code sequence in the case of the encoding configuration in FIG. 57. FIG.
78 is a diagram showing hierarchical information added to the code sequence in the case of the encoding configuration in FIG. 50. FIG.
FIG. 79 is a flowchart showing the processing procedure of the encoding method according to the present invention.
FIG. 80 is a flowchart showing a processing procedure of a decoding method according to the present invention.
FIG. 81 is a block diagram showing the configuration of a computer for executing coding and decoding according to the present invention by a program.
Claims (60)
(a) 符号化する信号より属性の階層が下位の信号又はその変形信号を生成し符号化するステップと、
(b) 符号化する信号と上記属性の階層が下位の信号又はその変形信号との誤差信号を可逆符号化するステップ、
とを含むことを特徴とするディジタル信号符号化方法。 A digital signal encoding method that encodes a predetermined digital signal at least one of the stepwise hierarchy of sampling frequency and the stepwise hierarchy of quantization accuracy, which are attributes of the digital signal, with the higher frequency being the higher order If the lower one is lower, the higher quantization accuracy is higher, and the lower is lower,
comprising the steps of: (a) hierarchy of attributes than the signal to be encoded is generated by encoding the signal or variations signals of the lower,
(b) step of the hierarchy of the signal and the attributes to be encoded reversibly encodes the error signal between signals or variations signals of the lower,
And a digital signal encoding method.
上記ステップ(a) は、フレームごとに第1サンプリング周波数のディジタル信号を、第1サンプリング周波数より低い第2サンプリング周波数のディジタル信号に変換し、
その第2サンプリング周波数のディジタル信号を圧縮符号化して主符号を出力し、
上記ステップ(b) はその主符号に対応した局部信号を第1サンプリング周波数の局部信号に変換し、
上記誤差信号としてその第1サンプリング周波数の局部信号と上記第1サンプリング周波数のディジタル信号との誤差信号を算出し、
上記誤差信号の予測誤差信号を生成し、
その予測誤差信号をその各サンプルの振幅を表わすビット位置のうち少くとも1ビット位置ごとにサンプルを跨いだ等位ビット列を可逆符号化して誤差符号として出力することを特徴とする。The digital signal encoding method according to claim 1, wherein
The step (a) converts a digital signal having a first sampling frequency into a digital signal having a second sampling frequency lower than the first sampling frequency for each frame;
The digital signal of the second sampling frequency is compression encoded and the main code is output,
Step (b) converts the local signal corresponding to the main code into a local signal of the first sampling frequency,
Calculating an error signal between the local signal of the first sampling frequency and the digital signal of the first sampling frequency as the error signal;
Generate a prediction error signal of the error signal,
The prediction error signal is characterized in that at least one bit position representing the amplitude of each sample is losslessly encoded with a coordinate bit string straddling the sample and output as an error code.
上記ステップ(b) は、上記誤差信号を第1サンプリング周波数よりも低いサンプリング周波数の誤差信号に変換するステップと、
その変換された誤差信号についての予測信号を生成し、その予測信号を第1サンプリング周波数の予測信号に変換するステップと、
その変換した予測信号と第1サンプリング周波数の上記誤差信号とから上記予測誤差信号を求めるステップとを含む。The digital signal encoding method according to claim 2,
The step (b) includes converting the error signal into an error signal having a sampling frequency lower than the first sampling frequency;
Generating a prediction signal for the converted error signal and converting the prediction signal to a prediction signal of a first sampling frequency;
Obtaining the prediction error signal from the converted prediction signal and the error signal of the first sampling frequency.
上記ステップ(b) は、上記誤差信号を線形予測分析し、その予測係数により上記誤差信号を処理して予測信号を生成するステップと、
その予測信号と上記誤差信号との差を求めて上記予測誤差信号を生成し、上記予測係数を符号化して係数符号を出力するステップとを含む。The digital signal encoding method according to claim 2,
The step (b) performs a linear prediction analysis of the error signal, processes the error signal with the prediction coefficient, and generates a prediction signal;
Calculating a difference between the prediction signal and the error signal, generating the prediction error signal, encoding the prediction coefficient, and outputting a coefficient code.
上記ステップ(b) は、
m=1, 1≦n≦N-1の範囲のm,nの組について、上記第m,nディジタル信号を第nサンプリング周波数よりも高い第n+1サンプリング周波数にアップサンプリングして第m,n+1アップサンプリング信号を生成し、
第m量子化精度、第n+1サンプリング周波数でサンプリングされた第m,n+1ディジタル信号と上記第m,n+1アップサンプリング信号との誤差信号である第m,n+1誤差信号を上記誤差信号として圧縮符号化して第m,n+1符号を出力し、
1≦m≦M-1, 1≦n≦Nの範囲でm,nの組について、上記第m,nディジタル信号を第m量子化精度よりも高い第m+1量子化精度に精度変換して第m+1,n精度変換信号を生成し、
第m+1量子化精度、第nサンプリング周波数でサンプリングされた第m+1,nディジタル信号と第m+1,n精度変換信号との誤差信号である第m+1,n誤差信号を圧縮符号化して第m+1,n符号を出力することを特徴とする。2. The digital signal encoding method according to claim 1, wherein the step (a) includes the m-th and n-th digital signals having the m-th quantization accuracy and the n-th sampling frequency for the set of m = 1 and n = 1. Is a step of compressing and outputting the mth and nth codes,
Step (b) above is
For a set of m, n in the range of m = 1, 1 ≦ n ≦ N−1, the m, n digital signal is upsampled to an (n + 1) th sampling frequency higher than the nth sampling frequency, and m, Generate n + 1 upsampling signal,
The m, n + 1 error signal, which is an error signal between the m, n + 1 digital signal sampled with the mth quantization accuracy and the n + 1 sampling frequency and the m, n + 1 upsampling signal, Compressed and encoded as the error signal to output the m, n + 1 code,
For m and n pairs in the range of 1 ≦ m ≦ M-1 and 1 ≦ n ≦ N, the above m, n digital signals are converted to m + 1 quantization accuracy higher than the mth quantization accuracy. To generate the (m + 1) th and nth precision conversion signal,
The m + 1, n error signal, which is the error signal between the (m + 1, n) digital signal sampled at the (m + 1) th quantization accuracy and the nth sampling frequency, and the (m + 1, n) precision conversion signal is compressed. It encodes and outputs the m + 1, n code.
上記ステップ(b) は、2≦m≦M, 1≦n≦Nの範囲のm,nの組について第m-1,nディジタル信号を圧縮符号化して、第m-1,n符号を生成し、
2≦m≦M, 1≦n≦N-1の範囲のm,nについて第m-1,nディジタル信号と、第m-1量子化精度、第nサンプリング周波数より高い第n+1サンプリング周波数の第m-1,n+1ディジタル信号との誤差である第m-1,n+1誤差信号を生成するステップと、
その第m-1,n+1誤差信号を圧縮符号化して第m-1,n+1符号を生成することを特徴とする。The digital signal encoding method according to claim 1, wherein the step (a) compresses and encodes the mth and nth error signals for a set of m = 1 and n = 1 to generate an mth and nth code.
Step (b) generates m-1 and n codes by compressing and coding the m-1 and n digital signals for m, n pairs in the range of 2 ≤ m ≤ M and 1 ≤ n ≤ N. And
For m and n in the range of 2 ≦ m ≦ M and 1 ≦ n ≦ N−1, the (m−1) th digital signal, the (m−1) th quantization accuracy, and the (n + 1) th sampling frequency higher than the nth sampling frequency Generating an m−1, n + 1 error signal that is an error from the m−1, n + 1 digital signal of
The m−1, n + 1 error signal is compression encoded to generate the m−1, n + 1 code.
上記ステップ(b) は、2≦m≦M, 1≦n≦N-1の範囲のm,nの組について、
第m量子化精度m、第n+1サンプリング周波数の第m,n+1ディジタル信号と、上記第m,nディジタル信号及び上記第m-1,n+1ディジタル信号との各誤差である第m,n誤差信号及び第m-1,n+1誤差信号を上記誤差信号として生成し、
これら第m,n誤差信号と第m-1,n+1誤差信号との歪が小さい誤差信号を選択して可逆圧縮符号化して第m,n+1符号を生成し、かつ上記何れを選択したかを示す第m,n+1補助符号を生成することを特徴とする。2. The digital signal encoding method according to claim 1, wherein the step (a) compresses the mth and nth digital signals having the mth quantization accuracy and the nth sampling frequency for a set of m = 1 and n = 1. Encoding,
Step (b) above is for m, n pairs in the range 2 ≦ m ≦ M, 1 ≦ n ≦ N−1.
The mth, n + 1th digital signals having the mth quantization accuracy m and the (n + 1) th sampling frequency, and the respective errors between the mth, nth digital signals and the m-1, n + 1th digital signals. m, n error signal and m-1, n + 1 error signal are generated as the error signal,
An error signal having a small distortion between the mth and nth error signals and the m−1 and n + 1 error signals is selected and losslessly encoded to generate the mth and n + 1 codes. The m, n + 1 auxiliary code indicating whether or not it has been generated is generated.
上記ステップ(b) は、2≦m≦M, 1≦n≦N-1の範囲のm,nの組について、
上記第m,nディジタル信号及び上記第m-1,n+1ディジタル信号を重み付き加算して第m,n+1加算信号を生成し、第m,n+1ディジタル信号との差分を上記誤差信号として生成し、
上記誤差信号を可逆圧縮符号化して第m,n+1符号を生成することを特徴とする。2. The digital signal encoding method according to claim 1, wherein the step (a) compresses the mth and nth digital signals having the mth quantization accuracy and the nth sampling frequency for a set of m = 1 and n = 1. Encoding,
Step (b) above is for m, n pairs in the range 2 ≦ m ≦ M, 1 ≦ n ≦ N−1.
The m, n + 1 digital signal is generated by weighted addition of the m, n digital signal and the m-1, n + 1 digital signal, and the difference from the m, n + 1 digital signal is calculated as described above. As an error signal,
The error signal is lossless compression encoded to generate an m, n + 1 code.
上記ステップ(b) は、1≦m≦M, 1≦n≦N-1の範囲のm,nの組について、上記第m,nディジタル信号を第nサンプリング周波数よりも高い第n+1サンプリング周波数にアップサンプリングして第m,n+1アップサンプリング信号を生成し、
第m量子化精度、第n+1サンプリング周波数の第m,n+1ディジタル信号と上記第m,n+1アップサンプリング信号との誤差信号である第m,n+1誤差信号を上記誤差信号として圧縮符号化して第m,n+1符号を出力し、
m=1, 1≦n≦N-1の範囲のm,nの組について、上記第m,nディジタル信号を第m量子化精度よりも高い第m+1量子化精度に精度変換して第m+1,n精度変換信号を生成し、
第m+1量子化精度、第nサンプリング周波数の第m+1,nディジタル信号と第m+1,n精度変換信号との上記誤差信号として誤差信号である第m+1,n誤差信号を圧縮符号化して第m+1,n符号を出力することを特徴とする。2. The digital signal encoding method according to claim 1, wherein the step (a) includes the m-th and n-th digital signals having the m-th quantization accuracy and the n-th sampling frequency for a set of m = 1 and n = 1. Compressed and output the mth and nth codes,
In the step (b), for the m, n pairs in the range of 1 ≦ m ≦ M and 1 ≦ n ≦ N-1, the mth and nth digital signals are sampled at the (n + 1) th sampling higher than the nth sampling frequency. Upsampling to frequency to generate m, n + 1th upsampling signal,
The m, n + 1 error signal, which is an error signal between the m, n + 1 digital signal of the mth quantization accuracy and the (n + 1) th sampling frequency and the m, n + 1 upsampling signal, is the error signal. And outputs the mth, n + 1th code after compression coding as
For m, n pairs in the range of m = 1, 1 ≦ n ≦ N−1, the mth and nth digital signals are converted to the (m + 1) th quantization accuracy higher than the mth quantization accuracy. Generate m + 1, n precision conversion signal,
The m + 1, n error signal, which is an error signal, is used as the error signal between the m + 1, n digital signal of the (m + 1) th quantization accuracy and the nth sampling frequency and the (m + 1, n) th accuracy conversion signal. The m + 1, n code is output after compression encoding.
調整パラメータに基いて調整された上記第m+1,n精度変換信号との上記第m+1,n誤差信号が最小となる調整パラメータを符号化して第m+1,n補助符号を出力するステップとを含む。13. The digital signal encoding method according to claim 12, wherein the step (b) includes calculating the m, n + 1 error signal with the m, n + 1 upsampling signal adjusted based on an adjustment parameter. Encoding an adjustment parameter that minimizes power and outputting an m, n + 1 auxiliary code, or
The first m + 1, n auxiliary code the first m + 1, n error signal that is adjusted based on the adjustment parameter the first m + 1, n precision conversion signal encodes the minimum Do that adjustment parameters Outputting.
符号化する信号より属性の階層が下位の信号又はその変形信号を生成し、符号化する主符号生成手段と、
上記符号化する信号と上記属性の階層が下位の信号又はその変形信号との誤差信号を可逆符号化する誤差信号符号化手段、
とを含むことを特徴とするディジタル信号符号化装置。A digital signal encoding apparatus for encoding a digital signal, at least one of predetermined stepwise hierarchy and the quantization precision stage hierarchy of the sampling frequency is an attribute of the digital signal, the higher the higher of the frequency If the lower one is lower, the higher quantization accuracy is higher, and the lower is lower,
Hierarchical attributes than the signal to be encoded to generate a signal or a variant signal lower, main code generating means for encoding,
An error signal encoding means for losslessly encoding an error signal between the signal to be encoded and a signal having a lower level of the attribute or a modified signal thereof;
And a digital signal encoding device.
上記主符号生成手段は、フレームごとに第1サンプリング周波数のディジタル信号を、第1サンプリング周波数より低い第2サンプリング周波数のディジタル信号に変換するダウンサンプリング部と、
上記第2サンプリング周波数のディジタル信号を圧縮符号化して主符号を出力する符号化部とからなり、
上記誤差信号符号化手段は、上記主符号に対応した局部信号を第1サンプリング周波数の局部信号に変換するアップサンプリング部と、
上記誤差信号として上記第1サンプリング周波数の局部信号と上記第1サンプリング周波数のディジタル信号との誤差信号を算出する誤差算出部と、
上記誤差信号の予測誤差信号を生成する予測誤差生成部からなり、
上記予測誤差信号をその各サンプルの振幅を表わすビット位置のうち少くとも1ビット位置ごとにサンプルを跨いだ等位ビット列を可逆符号化して誤差符号として出力する配列変換部を有することを特徴とする。The digital signal encoding device according to claim 14, wherein
The main code generating means converts a digital signal having a first sampling frequency into a digital signal having a second sampling frequency lower than the first sampling frequency for each frame;
An encoding unit that compresses and encodes the digital signal having the second sampling frequency and outputs a main code;
The error signal encoding means includes an upsampling unit that converts a local signal corresponding to the main code into a local signal having a first sampling frequency;
An error calculator that calculates an error signal between the local signal at the first sampling frequency and the digital signal at the first sampling frequency as the error signal;
A prediction error generation unit that generates a prediction error signal of the error signal,
And an array conversion unit for losslessly encoding a coordinate bit string straddling the sample for each bit position in the bit position representing the amplitude of each sample of the prediction error signal and outputting the result as an error code. .
上記誤差信号符号化手段は、m=1, 1≦n≦N-1の範囲のm,nの組について、上記第m,nディジタル信号を第nサンプリング周波数よりも高い第n+1サンプリング周波数にアップサンプリングして第m,n+1アップサンプリング信号を生成する第 m,n+1アップサンプリング部と、
m=1, 1≦n≦N-1の範囲のm,nの組について、上記第m,n+1アップサンプリング信号と上記第m,n+1ディジタル信号との誤差信号である第m,n+1誤差信号を上記誤差信号として圧縮符号化して第m,n+1符号を出力する第m,n+1符号化部と、
1≦m≦M-1, 1≦n≦Nの範囲のm,nの組について、上記第m,nディジタル信号を第m量子化精度よりも高い第m+1量子化精度に精度変換して第m+1,n精度変換信号を生成する第m+1,n精度変換部からなる。15. The digital signal encoding device according to claim 14, wherein the main code generation means compresses and encodes the m-th and n-th digital signals for m, n sets of m = 1, n = 1. It consists of mth and nth encoding units that output n code,
The error signal encoding unit, m = 1, 1 ≦ n ≦ N-1 in the range of m, for a set of n, the upper Symbol first m, higher than the n sampling frequency n digital signals (n + 1) -th sampling the m, m-th to generate the n + 1 up-sampling signal by up-sampling frequency, and (n + 1) up-sampling unit,
For m, n pairs in the range of m = 1, 1 ≦ n ≦ N−1, the m, n + 1 upsampling signal and the m, n + 1 digital signal are error signals m, an m, n + 1 encoding unit that compresses and encodes an n + 1 error signal as the error signal and outputs an m, n + 1 code;
For m, n pairs in the range of 1 ≦ m ≦ M-1, 1 ≦ n ≦ N, the mth and nth digital signals are converted to m + 1th quantization accuracy higher than the mth quantization accuracy. The m + 1, n accuracy conversion unit for generating the m + 1, n accuracy conversion signal.
m=1, n=1の組について、その第m,n誤差信号を可逆圧縮符号化して第m,n符号を生成する第m,n圧縮部と、
2≦m≦M, 1≦n≦N-1の範囲のm,nの組について上記第m-1,nディジタル信号又は入力された第m-1,nディジタル信号を圧縮符号化して、第m-1,n符号を生成する第m-1,n圧縮部からなり、
上記誤差信号符号化手段は、上記第m-1,n符号の生成に用いた第m-1,nディジタル信号と、第m-1量子化精度、第nサンプリング周波数より高い第n+1サンプリング周波数の第m-1,n+1ディジタル信号との誤差である第m-1,n+1誤差信号を生成する第m-1,n+1誤差生成部と、
その第m-1,n+1誤差信号を可逆圧縮符号化して第m-1,n+1符号を生成する第m-1,n+1圧縮部、
からなる。15. The digital signal encoding apparatus according to claim 14, wherein the main code generating means outputs the mth and nth digital signals having the mth quantization accuracy and the nth sampling frequency to the (m-1) th lower than the mth quantization accuracy. Division to divide into m−1, n digital signal of quantization accuracy, nth sampling frequency and m−1, n error signal which is an error between m−1, n digital signal and m−nth digital signal And
For the set of m = 1, n = 1, the m-th, n-th compression unit that generates the m-th, n-th code by lossless compression coding the m-th, n-th error signal,
The above m-1, n digital signals or the input m-1, n digital signals are compressed and encoded for m, n pairs in the range of 2 ≦ m ≦ M and 1 ≦ n ≦ N−1. The m-1, n compression unit for generating m-1, n code,
The error signal encoding means includes the (m−1) th digital signal used to generate the (m−1, n) code, the (n + 1) th sampling higher than the (m−1) th quantization accuracy and the nth sampling frequency. An m-1, n + 1 error generation unit that generates an m-1, n + 1 error signal that is an error from the m-1, n + 1 digital signal of frequency;
An m−1, n + 1 compression unit for generating a m−1, n + 1 code by lossless compression encoding the m −1 , n + 1 error signal;
Consists of.
上記誤差信号符号化手段は、1≦m≦M, 1≦n≦N-1の範囲のm,nの組について第m量子化精度より低い第m-1量子化精度、第nサンプリング周波数より高い第n+1サンプリング周波数の第m-1,n+1ディジタル信号を圧縮符号化する第m-1,n+1符号化手段と、
第m量子化精度、第n+1サンプリング周波数の第m,n+1ディジタル信号と、上記第m,nディジタル信号及び上記第m-1,n+1ディジタル信号との各誤差である第m,n誤差信号及び第m-1,n+1誤差信号を生成する誤差信号生成手段と、
これら第m,n誤差信号と第m-1,n+1誤差信号との歪が小さい誤差信号を選択して可逆圧縮符号化して第m,n+1符号を生成する第m,n+1圧縮部と、
上記何れを選択したかを示す第m,n+1補助符号を生成する第m,n+1補助符号化部、
からなる。15. The digital signal encoding apparatus according to claim 14, wherein the main code generation means compresses the mth and nth digital signals having the mth quantization accuracy and the nth sampling frequency for a set of m = 1 and n = 1. The mth and nth encoding means for encoding,
The error signal encoding means has an m-1 quantization accuracy lower than the mth quantization accuracy and an nth sampling frequency for a set of m and n in the range of 1 ≦ m ≦ M and 1 ≦ n ≦ N−1. M-1, n + 1 encoding means for compressing and encoding an m-1, n + 1 digital signal having a high n + 1 sampling frequency;
The mth, n + 1th digital signal having the mth quantization accuracy and the (n + 1) th sampling frequency, and the mth error which is an error between the mth, nth digital signal and the m-1, n + 1 digital signal. , n error signal and error signal generating means for generating the (m-1, n + 1) th error signal,
An m, n + 1th code is generated by selecting an error signal having a small distortion between the mth, nth error signal and the (m-1, n + 1) th error signal and performing lossless compression coding. A compression section;
An m, n + 1 auxiliary encoding unit for generating an m, n + 1 auxiliary code indicating which of the above is selected;
Consists of.
上記誤差信号符号化手段は、2≦m≦M, 1≦n≦N-1の範囲のm,nの組について、上記第m,nディジタル信号及び上記第m-1,n+1ディジタル信号を重み付き加算して第m,n+1加算信号を生成し、第m,n+1ディジタル信号との差分を誤差信号として生成する第m,n+1混合部と、
上記誤差信号を可逆圧縮符号化して第m,n+1符号を生成する第m,n+1圧縮部、
からなる。15. The digital signal encoding apparatus according to claim 14, wherein the main code generation means compresses the mth and nth digital signals having the mth quantization accuracy and the nth sampling frequency for a set of m = 1 and n = 1. The mth and nth encoding means for encoding,
The error signal encoding means includes the m, n digital signal and the m-1, n + 1 digital signal for a set of m, n in the range of 2 ≦ m ≦ M and 1 ≦ n ≦ N−1. To generate an m, n + 1 added signal by weighting, and an m, n + 1 mixing unit for generating a difference from the m, n + 1 digital signal as an error signal;
The m, n + 1 compression unit that generates the m, n + 1 code by lossless compression encoding the error signal,
Consists of.
上記誤差信号符号化手段は、1≦m≦M, 1≦n≦N-1の範囲のm,nの組について、上記第m,nディジタル信号を第nサンプリング周波数よりも高い第n+1サンプリング周波数にアップサンプリングして第m,n+1アップサンプリング信号を生成する第m,n+1アップサンプル部と、
第m量子化精度、第n+1サンプリング周波数の第m,n+1ディジタル信号と上記第m,n+1アップサンプリング信号との誤差信号である第m,n+1誤差信号を上記誤差信号として圧縮符号化して第m,n+1符号を出力する第m,n+1圧縮部と、
1≦m≦M-1, 1≦n≦Nの範囲いのm,nの組について、上記第m,nディジタル信号を第m量子化精度よりも高い第m+1量子化精度に精度変換して第m+1,n精度変換信号を生成する第m+1,n精度変換部と、
第m+1量子化精度、第nサンプリング周波数の第m+1,nディジタル信号と上記第m+1,n精度変換信号との上記誤差信号として第m+1,n誤差信号を圧縮符号化して第m+1,n符号を出力する第m+1,n圧縮部、
からなる。15. The digital signal encoding device according to claim 14, wherein the main code generating means is an m-th, n-th digital signal sampled at an m-th quantization accuracy and an n-th sampling frequency for a set of m = 1, n = 1. Comprising an mth and nth compression unit that compresses and encodes and outputs an mth and nth code,
The error signal encoding means converts the mth and nth digital signals to the (n + 1) th higher than the nth sampling frequency for a set of m and n in the range of 1 ≦ m ≦ M and 1 ≦ n ≦ N−1. An m, n + 1 upsampling unit that upsamples to a sampling frequency to generate an m, n + 1 upsampling signal;
The m, n + 1 error signal, which is an error signal between the m, n + 1 digital signal of the mth quantization accuracy and the (n + 1) th sampling frequency and the m, n + 1 upsampling signal, is the error signal. The m, n + 1 compression unit that compresses and outputs the m, n + 1 code as
For m, n pairs in the range of 1 ≦ m ≦ M-1, 1 ≦ n ≦ N, convert the mth and nth digital signals to m + 1th quantization accuracy higher than the mth quantization accuracy. M + 1, n precision conversion unit for generating m + 1, n precision conversion signal,
The m + 1, n error signal is compression-coded as the error signal between the m + 1, n digital signal having the (m + 1) th quantization accuracy and the nth sampling frequency and the m + 1, n accuracy conversion signal. M + 1, n compression unit for outputting the m + 1, n code,
Consists of.
(a) 入力符号を復号化して誤差信号を生成するステップと、
(b) 上記誤差信号と、主符号を復号して生成した復号信号としてその誤差信号より属性の階層が下位の復号信号又はその変形信号とを合成して復号化信号を生成するステップ、
とを含むことを特徴とする復号化方法。A decoding method for decoding a code of digital signals, at least one of predetermined stepwise hierarchy and the quantization precision stage hierarchy of the sampling frequency is an attribute of the digital signal, the higher the higher of the frequency If the lower one is lower, the higher quantization accuracy is higher, and the lower is lower,
(a) decoding an input code to generate an error signal;
(b) the error signals and the step of the error signal from the attribute hierarchy as decoded signal generated by decoding the main code to generate decrypt signals or synthesized and decoded signal and the modified signal of the lower,
The decoding method characterized by including these.
上記ステップ(a) は、上記入力符号として入力誤差符号を復号してビット位置のうち少なくとも1ビット位置ごとにサンプルを跨いだ同一ビット位置のビット列からなる第1サンプリング周波数の予測誤差信号を再生し、
上記ステップ(b) は、上記予測誤差信号を合成して上記誤差信号を再生し、主符号を復号した復号信号を、そのサンプリング周波数より高い上記第1サンプリング周波数の復号信号に変換し、その変換された復号信号と上記誤差信号とを加算して再生ディジタル信号を得ることを特徴とする。The decoding method according to claim 21,
In the step (a), an input error code is decoded as the input code, and a prediction error signal having a first sampling frequency composed of a bit string at the same bit position straddling a sample at every bit position among the bit positions is reproduced. ,
The step (b) combines the prediction error signal to reproduce the error signal, converts the decoded signal obtained by decoding the main code into a decoded signal having the first sampling frequency higher than the sampling frequency, and converts the converted signal. A reproduced digital signal is obtained by adding the decoded signal and the error signal.
上記予測誤差信号を第1サンプリング周波数より低い第2サンプリング周波数の予測誤差信号に変換し、
その第2サンプリング周波数の予測誤差信号に対する予測信号を上記第1サンプリング周波数の予測信号に変換し、
その第1サンプリング周波数の予測信号と上記第1サンプリング周波数の予測誤差信号とを加算して上記誤差信号を生成することを特徴とする。The decoding method according to claim 22, wherein the step (b) comprises:
Converting the prediction error signal into a prediction error signal having a second sampling frequency lower than the first sampling frequency;
Converting a prediction signal for the prediction error signal of the second sampling frequency into a prediction signal of the first sampling frequency;
The error signal is generated by adding the prediction signal of the first sampling frequency and the prediction error signal of the first sampling frequency.
上記ステップ(b) は、入力係数符号を復号した線形予測係数により上記予測誤差信号を線形予測して予測信号を生成し、
この予測信号と上記予測誤差信号を加算して上記誤差信号を得ることを特徴とする。The decoding method according to claim 22,
The step (b) generates a prediction signal by linearly predicting the prediction error signal using a linear prediction coefficient obtained by decoding the input coefficient code,
The prediction signal and the prediction error signal are added to obtain the error signal.
m=1, 1≦n≦N-1の範囲のm,nの組について、上記属性の階層が下位の信号として第m量子化精度、第nサンプリング周波数の第m,nディジタル信号を第nサンプリング周波数よりも高い第n+1サンプリング周波数にアップサンプリングして第m,n+1アップサンプリング信号を生成し、
1≦m≦M, 1≦n≦N-1の範囲のm,nの組について、上記入力符号として第m,n+1符号を復号して第m量子化精度、第n+1サンプリング周波数の第m,n+1誤差信号を生成し、上記第m,n+1誤差信号と上記第m,n+1アップサンプリング信号を加算して第m,n+1再生信号を生成する第1手順と、
1≦m≦M-1, 1≦n≦Nの範囲のm,nの組について、上記属性の階層が下位の信号として上記第m,nディジタル信号を第m量子化精度よりも高い第m+1量子化精度に精度変換して第m+1,n精度変換信号を生成し、上記入力符号として第m+1,n符号を復号して第m+1量子化精度、第nサンプリング周波数の第m+1,n誤差信号を生成し、上記第m+1,n誤差信号と上記m+1,n精度変換信号を加算して第m+1,nディジタル信号を生成する第2手順、
との少なくとも一方の手順からなり、
上記ステップ(b) は、m=1, n=1の組について第m,n符号を復号して上記第m,nディジタル信号を生成することを特徴とする。The digital signal decoding method according to claim 21, wherein said step (a) comprises:
m = 1, 1 ≦ n ≦ N-1 in the range of m, for a set of n m-th quantization precision as signal hierarchy subordinate of the attributes, the m n-th sampling frequency, the n digital signals a up-sampling to the (n + 1) th sampling frequency higher than the n-sampling frequency to generate the (m, n + 1) -th upsampling signal,
For a set of m, n in the range of 1 ≦ m ≦ M, 1 ≦ n ≦ N−1, the mth, n + 1 code is decoded as the input code, the mth quantization accuracy, and the n + 1 sampling frequency The m, n + 1 error signal is generated, and the m, n + 1 error signal and the m, n + 1 upsampling signal are added to generate the m, n + 1 reproduction signal. Procedure and
1 ≦ m ≦ M-1, 1 ≦ n ≦ N range m of, for a set of n, the higher than the a signal hierarchy subordinate of the attributes the m, the n digital signal the m quantization precision m + 1, n accuracy conversion signal is generated by converting the accuracy to m + 1 quantization accuracy, and the m + 1, n code is decoded as the input code to obtain the (m + 1) th quantization accuracy, the nth sampling. A second m + 1, n error signal is generated, and the m + 1, n error signal and the m + 1, n precision conversion signal are added to generate an m + 1, n digital signal. procedure,
And at least one of the steps
The step (b) is characterized in that the mth and nth digital signals are generated by decoding the mth and nth codes for the set of m = 1 and n = 1.
1≦m≦M, 1≦n≦N-1の範囲のm,nの組について、第m,n+1補助情報を復号して上記第m,n+1アップサンプリング信号の調整パラメータを生成するステップと、
上記第m,n+1誤差信号と上記調整パラメータに基づいて調整した第m,n+1アップサンプリング信号を加算して第m,n+1再生信号を生成することを特徴とする。The decoding method according to claim 26, wherein said step (a) comprises:
For m, n pairs in the range of 1 ≦ m ≦ M and 1 ≦ n ≦ N−1, the m, n + 1 auxiliary information is decoded to generate adjustment parameters for the m, n + 1 upsampling signal. And steps to
The m, n + 1 reproduction signal is generated by adding the m, n + 1 error signal and the m, n + 1 upsampling signal adjusted based on the adjustment parameter.
1≦m≦M-1, 1≦n≦Nの範囲のm,nの組について、第m+1,n補助符号を復号して上記m+1,n精度変換信号の調整パラメータを生成し、
上記第m+1,n誤差信号と上記調整パラメータに基づいて調整したm+1,n精度変換信号を加算して第m+1,nディジタル信号を生成することを特徴とする。The decoding method according to claim 26, wherein said step (a) comprises:
For m, n pairs in the range of 1 ≦ m ≦ M-1, 1 ≦ n ≦ N, the m + 1, n auxiliary code is decoded to generate adjustment parameters for the m + 1, n precision conversion signal. ,
The m + 1, n digital signal is generated by adding the m + 1, n error signal and the m + 1, n accuracy conversion signal adjusted based on the adjustment parameter.
1≦m≦M, 1≦n≦N-1の範囲のm,nの組について、上記属性の階層が下位の信号として第m,n+1符号を可逆伸張復号化して第m量子化精度、第n+1サンプリング周波数の第m,n+1誤差信号を生成し、
2≦m≦M, 1≦n≦N-1の範囲のm,nの組について、上記属性の階層が下位の信号として第m,nディジタル信号及び第m-1,n+1ディジタル信号中の第m,n+1補助符号を復号した選択情報により指示された一方の信号と上記第m,n+1誤差信号を加算して第m,n+1ディジタル信号を再生し、
上記ステップ(b) は、m=1, n=1の組について第m,n符号を復号して上記第m,nディジタル信号を生成することを特徴とする。The decoding method according to claim 21, wherein said step (a) comprises:
1 ≦ m ≦ M, 1 ≦ n ≦ N-1 in the range of m, for a set of n, the m quantizing reversibly expansion decoding hierarchy first m as signal backward, the n + 1 code of the attribute Generate the m, n + 1 error signal of accuracy, n + 1 sampling frequency,
2 ≦ m ≦ M, 1 ≦ n ≦ N-1 in the range of m, for a set of n, the m hierarchy of the attributes as a signal of a lower, n digital signal and the m-1, n + 1 digital signal The m, n + 1 digital signal is reproduced by adding one of the signals indicated by the selection information obtained by decoding the m, n + 1 auxiliary code and the m, n + 1 error signal,
The step (b) is characterized in that the mth and nth digital signals are generated by decoding the mth and nth codes for the set of m = 1 and n = 1.
m=1, n=1の組を除く1≦m≦M, 1≦n≦N-1の範囲のm,nの組について、第m,n+1符号を可逆伸張復号化して第m量子化精度、第n+1サンプリング周波数の第m,n+1誤差信号を生成し、
2≦m≦M, 1≦n≦N-1の範囲のm,nの組について、上記属性の階層が下位の信号として第m,nディジタル信号と第m-1,n+1ディジタル信号を、第m,n+1補助符号を復号した情報により重み付き加算して第m量子化精度、第n+1サンプリング周波数の第m,n+1加算信号を生成し、
その第m,n+1加算信号と上記第m,n+1誤差信号とを加算して第m,n+1ディジタル信号を再生し、
上記ステップ(b) は、m=1, n=1の組について第m,n符号を復号して上記第m,nディジタル信号を生成することを特徴とする。The decoding method according to claim 21, wherein said step (a) comprises:
For m, n pairs in the range of 1 ≦ m ≦ M, 1 ≦ n ≦ N−1 excluding the set of m = 1 and n = 1, the mth and n + 1 codes are losslessly decompressed and the mth quantum Generating the m, n + 1 error signal of the (n + 1) th sampling frequency,
2 ≦ m ≦ M, 1 ≦ n ≦ N-1 in the range of m, for a set of n, the m, n digital signal and the m-1, n + 1 digital signal hierarchy of the attributes as a signal of lower Are weighted and added with the information obtained by decoding the m, n + 1 auxiliary code to generate the m, n + 1 added signal having the mth quantization accuracy and the (n + 1) th sampling frequency.
The m, n + 1 added signal and the m, n + 1 error signal are added to reproduce the m, n + 1 digital signal,
The step (b) is characterized in that the mth and nth digital signals are generated by decoding the mth and nth codes for the set of m = 1 and n = 1.
上記入力符号として第m,n+1符号を復号して第m量子化精度、第n+1サンプリング周波数の第m,n+1誤差信号を生成し、
上記ステップ(a) は更に、1≦m≦M-1, 1≦n≦Nの範囲のm,nの組について、上記第m,nディジタル信号を第m量子化精度よりも高い第m+1量子化精度に精度変換して第m+1,n精度変換信号を生成し、
1≦m≦M, 1≦n≦N-1の範囲のm,nの組について、上記第m,n+1誤差信号と上記属性の階層が下位の変形信号として上記第m,n+1アップサンプリング信号を加算して第m,n+1ディジタル信号を生成する第1手順と、
1≦m≦M-1, 1≦n≦Nの範囲のm,nの組について、上記第m+1,n誤差信号と上記属性の階層が下位の変形信号として上記第m+1,n精度変換信号を加算して第m+1,nディジタル信号を生成する第2手順、
とのいずれかの手順により上記復号化信号を生成し、
上記ステップ(b) は、m=1, n=1の組について第m,n符号を復号して上記第m,nディジタル信号を生成することを特徴とする。23. The decoding method according to claim 21, wherein the step (a) includes a combination of m and n in the range of 1 ≦ m ≦ M and 1 ≦ n ≦ N−1, and the attribute hierarchy is lower . the m, m-th to n digital signals by up-sampling to the n + 1 sampling frequency higher than the n sampling frequency to generate n + 1 up-sampling signal as a signal,
Decoding the m, n + 1 code as the input code to generate the m, n + 1 error signal of the mth quantization accuracy and the n + 1 sampling frequency;
In the step (a), the m + n digital signals are converted to m + th higher than the mth quantization accuracy for m, n pairs in the range of 1 ≦ m ≦ M−1, 1 ≦ n ≦ N. 1) Convert the precision to quantization precision to generate m + 1, n precision conversion signal,
1 ≦ m ≦ M, 1 ≦ n ≦ N-1 in the range of m, for a set of n, the first m, n + 1 error signal and the second m hierarchy of the attributes as a deformation signal of the lower, n + A first procedure of adding upsampling signals to generate an m, n + 1 digital signal;
1 ≦ m ≦ M-1, 1 ≦ n ≦ N range m of, for a set of n, the (m + 1) th, n error signal and the (m + 1) -th hierarchy of the attributes as a deformation signal of lower, a second procedure for adding an n-precision conversion signal to generate an m + 1, n digital signal;
And generate the decoded signal by any of the procedures
The step (b) is characterized in that the mth and nth digital signals are generated by decoding the mth and nth codes for the set of m = 1 and n = 1.
入力符号を復号して誤差信号を生成する誤差信号生成手段と、
上記誤差信号と、その誤差信号より属性の階層が下位の復号化信号又はその変形信号とを合成して復号化信号を生成する信号合成手段、
とを含むことを特徴とするディジタル信号復号化装置。 At least one of the stepped hierarchy of sampling frequency and the stepped hierarchy of quantization accuracy, which are attributes of the digital signal, is a predetermined digital signal decoding device, with the higher frequency being higher and the lower being lower If the higher quantization accuracy is higher and the lower quantization is lower,
Error signal generation means for decoding an input code to generate an error signal;
The error signal and a signal synthesizing means for hierarchical attributes from the error signal to produce a lower decrypted signal or synthesized and decoded signal and the modified signal,
And a digital signal decoding apparatus.
入力誤差符号を復号してビット列を得て、得られたビット列の1フレーム分から、その各ビット配列方向における同一ビット位置のビットを抽出して第1サンプリング周波数の予測誤差信号を再生する配列変換部と、
上記予測誤差信号を予測合成して誤差信号を再生する予測合成部とからなり、
上記信号合成手段は、
入力主符号を復号して復号信号を得る復号部と、
上記復号信号を、そのサンプリング周波数より高い上記第1サンプリング周波数の復号信号に変換するアップサンプリング部と、
上記変換された復号信号と上記誤差信号とを加算して再生ディジタル信号を得る加算部、とからなる。34. The decoding apparatus according to claim 33, wherein the error signal generating means is
An array conversion unit that decodes an input error code to obtain a bit string, extracts a bit at the same bit position in each bit array direction from one frame of the obtained bit string, and reproduces a prediction error signal of the first sampling frequency When,
A prediction synthesis unit that predictively synthesizes the prediction error signal and reproduces the error signal;
The signal synthesizing means is
A decoding unit that decodes an input main code to obtain a decoded signal;
An upsampling unit for converting the decoded signal into a decoded signal having the first sampling frequency higher than the sampling frequency;
And an adder that adds the converted decoded signal and the error signal to obtain a reproduced digital signal.
1≦m≦M, 1≦n≦N-1の範囲のm,nの組について、第m,n+1符号を復号して第m量子化精度、第n+1サンプリング周波数の第m,n+1誤差信号を生成する第m,n+1復号部と、
上記第m,n+1誤差信号と上記第m,n+1アップサンプリング信号を加算して第m,n+1再生信号を生成する加算部とを備える第m,n+1再生手段と、
1≦m≦M-1, 1≦n≦Nの範囲のm,nの組について、上記属性の階層が下位の信号として上記第m,nディジタル信号を第m量子化精度よりも高い第m+1量子化精度に精度変換して第m+1,n精度変換信号を生成する精度変換部と、
第m+1,n符号を復号して第m+1量子化精度、第nサンプリング周波数の第m+1,n誤差信号を生成する第m+1,n復号部と、
上記第m+1,n誤差信号と上記m+1,n精度変換信号を加算して第m+1,nディジタル信号を生成する加算部とを備える第m+1,n再生手段との何れかの再生手段とからなり、
上記信号合成手段は、m=1, n=1の組について、第m,n符号を復号して上記第m,nディジタル信号を生成する第m,n復号部からなる。In the decoding apparatus according to claim 33, said signal combining means, m = 1, 1 ≦ n ≦ N-1 in the range of m, for a set of n, the m as signal hierarchy subordinate of the attribute , an upsampling unit that upsamples the n digital signal to an n + 1th sampling frequency higher than the nth sampling frequency to generate an m, n + 1 upsampling signal;
For m, n pairs in the range of 1 ≦ m ≦ M, 1 ≦ n ≦ N−1, the m, n + 1 code is decoded to obtain the mth quantization accuracy, the m + 1th sampling frequency, an m, n + 1 decoding unit for generating an n + 1 error signal;
An m, n + 1 reproducing means comprising an adding unit for adding the m, n + 1 error signal and the m, n + 1 upsampling signal to generate an m, n + 1 reproduced signal;
1 ≦ m ≦ M-1, 1 ≦ n ≦ N range m of, for a set of n, the higher than the a signal hierarchy subordinate of the attributes the m, the n digital signal the m quantization precision an accuracy conversion unit for converting the accuracy to m + 1 quantization accuracy and generating an m + 1, n-th accuracy conversion signal;
An m + 1, n decoding unit that decodes the m + 1, n code to generate an m + 1, n error signal having an (m + 1) th quantization accuracy and an nth sampling frequency;
Any of the (m + 1, n) reproducing means including an adding unit for adding the (m + 1, n) error signal and the (m + 1, n) accuracy conversion signal to generate the (m + 1, n) digital signal. With some replay means,
The signal synthesizing unit includes an m, n decoding unit that decodes the m, n code and generates the m, n digital signal for a set of m = 1, n = 1.
m=1, n=1の組を除く2≦m≦M, 1≦n≦N-1の範囲のm,nの組について、入力された複数の符号を復号化して第m量子化精度、第nサンプリング周波数の第m,nディジタル信号及び第m量子化精度より低い第m-1量子化精度、第nサンプリング周波数より高い第n+1サンプリング周波数の第m-1,n+1ディジタル信号を再生する再生手段と、
第m,n+1符号を可逆伸張復号化して第m量子化精度、第n+1サンプリング周波数の第m,n+1誤差信号を生成する第m,n+1伸張部と、
2≦m≦M, 1≦n≦N-1の範囲のm,nの組について、上記属性の階層が下位の信号として、第m,nディジタル信号及び第m-1,n+1ディジタル信号中の、第m,n+1補助符号を復号した選択情報により指示された一方の信号と上記第m,n+1誤差信号を加算して第m,n+1ディジタル信号を再生する第m,n+1加算部、
とからなり、
上記信号合成手段は、m=1, n=1の組について、第m,n符号を復号して上記第m,nディジタル信号を生成する第m,n復号部からなる。34. The decoding apparatus according to claim 33, wherein the error signal generating means is
For m, n pairs in the range of 2 ≦ m ≦ M, 1 ≦ n ≦ N−1 excluding the pair of m = 1, n = 1, the input multiple codes are decoded to obtain the mth quantization accuracy, The mth and n + 1th digital signals of the nth sampling frequency, the (m-1) th quantization accuracy lower than the mth quantization accuracy, and the (m + 1) th and n + 1th digital signals of the (n + 1) th sampling frequency higher than the nth sampling frequency. Playback means for playing
An m, n + 1 decompression unit that generates a mth, n + 1 error signal having an mth quantization accuracy and an (n + 1) th sampling frequency by performing lossless decompression decoding of the m, n + 1 code;
2 ≦ m ≦ M, 1 ≦ n ≦ N-1 in the range of m, for a set of n, as signal hierarchy subordinate of the attributes, the m, n digital signal and the m-1, n + 1 digital The mth, n + 1th digital signal is reproduced by adding one of the signals instructed by the selection information obtained by decoding the mth, n + 1th auxiliary code and the mth, n + 1th error signal. m, n + 1 adder,
And consist of
The signal synthesizing unit includes an m, n decoding unit that decodes the m, n code and generates the m, n digital signal for a set of m = 1, n = 1.
m=1,n=1の組を除く1≦m≦M, 1≦n≦N-1の範囲のm,nの組について、第m,n+1符号を可逆伸張復号化して第m量子化精度、第n+1サンプリング周波数の第m,n+1誤差信号を生成する第m,n+1伸張部と、
第m,n+1補助符号を復号して加算法を指定する補助情報を求める第m,n+1補助復号部と、
2≦m≦M, 1≦n≦N-1の範囲のm,nの組について、上記補助情報に基づいて上記属性の階層が下位の信号としての第m,nディジタル信号と第m-1,n+1ディジタル信号を重み付き加算して上記属性の階層が下位の変形信号として第m,n+1加算信号を生成する第m,n+1混合部と、
その第m,n+1加算信号と上記第m,n+1誤差信号とを加算して第m量子化精度、第n+1サンプリング周波数の第m,n+1ディジタル信号を再生する第m,n+1加算部、
とからなる。34. The decoding apparatus according to claim 33, wherein the error signal generating means is
For m, n pairs in the range of 1 ≦ m ≦ M, 1 ≦ n ≦ N−1 excluding the set of m = 1, n = 1, the mth and n + 1 codes are losslessly decoded and the mth quantum M, n + 1 decompression unit for generating m, n + 1 error signal of (n + 1) th sampling frequency,
The m, n + 1 auxiliary decoding unit for decoding the m, n + 1 auxiliary code and obtaining auxiliary information specifying the addition method;
2 ≦ m ≦ M, 1 ≦ n ≦ N-1 in the range of m, for a set of n, the m as signal hierarchy subordinate of the attributes based on the auxiliary information, n digital signal and the m- 1, n + 1 m-th digital signal by adding the weighted the hierarchy of the attributes to generate a first m, n + 1 added signal as a deformation signal of the lower, and the (n + 1) mixing section,
The m, n + 1 added signal and the m, n + 1 error signal are added to reproduce the m, n + 1 digital signal having the mth quantization accuracy and the (n + 1) th sampling frequency. , n + 1 adder,
It consists of.
上記入力符号として第m,n+1符号を復号して第m量子化精度、第n+1サンプリング周波数の第m,n+1誤差信号を生成する第m,n+1伸張部と、
1≦m≦M-1, 1≦n≦Nの範囲のm,nの組について、上記第m,n+1誤差信号と上記属性の階層が下位の変形信号としての上記第m,n+1アップサンプリング信号を加算して第m,n+1ディジタル信号を生成する加算部とからなる第m,n+1再生手段と、
1≦m≦M-1, n=1の範囲のm,nの組について、上記第m,nディジタル信号を第m量子化精度よりも高い第m+1量子化精度に精度変換して第m+1,n精度変換信号を生成する第m+1,n精度変換部と、
第m+1,n符号を復号して第m+1量子化精度、第Nサンプリング周波数の第m+1,n誤差信号を生成する第m+1,n伸張部と、
上記第m+1,n誤差信号と上記第m+1,n精度変換信号を加算して第m+1,nディジタル信号を生成する加算部とを備える第m+1,n再生手段と、
上記第m,n+1再生手段と、上記第m+1,n再生手段と、上記第m+1,n再生手段及び上記第m+1,n+1再生手段との少くとも1つからなり、
上記信号合成手段は、m=1,n=1の組について、第m,n符号を復号して上記第m,nディジタル信号を生成する第m,n伸張部とからなる。34. The decoding device according to claim 33, wherein the error signal generation and synthesis means is a signal having a lower hierarchical level of the attribute for a set of m and n in a range of 1 ≦ m ≦ M and 1 ≦ n ≦ N−1. the m, n digital signal hierarchies higher (n + 1) -th sampling frequency up-sampled and the attributes than the n sampling frequency to generate a first m, n + 1 up-sampling signal as a deformation signal of lower as No. The m, n + 1 upsampling unit;
An m, n + 1 decompression unit that decodes the m, n + 1 code as the input code to generate an m, n + 1 error signal having an m + 1 quantization frequency and an n + 1 sampling frequency;
1 ≦ m ≦ M-1, 1 ≦ n ≦ N range m of, for a set of n, the first m as the m-th, n + 1 error signal and the deformation signal hierarchy subordinate the attribute, n An m, n + 1 reproducing means comprising an adding unit for adding an +1 upsampling signal to generate an m, n + 1 digital signal;
For the set of m, n in the range of 1 ≦ m ≦ M−1 and n = 1, the mth and nth digital signals are converted to m + 1th quantization accuracy higher than the mth quantization accuracy and an m + 1, n precision conversion unit for generating an m + 1, n precision conversion signal;
An m + 1, n decompression unit that decodes the m + 1, n code to generate an m + 1, n error signal with an (m + 1) th quantization accuracy and an Nth sampling frequency;
An m + 1, n reproducing means comprising an adding unit for adding the m + 1, n error signal and the m + 1, n accuracy conversion signal to generate an m + 1, n digital signal;
At least one of the m, n + 1 playback means, the m + 1, n playback means, the m + 1, n playback means, and the m + 1, n + 1 playback means. Become
The signal synthesizing means includes an m-th and n-th decompression unit that decodes the m-th and n-th codes and generates the m-th and n-th digital signals for the set of m = 1 and n = 1.
上記属性の階層が下位の信号又はその変形信号は、上記第1のグループより少ないチャンネル数からなる第2のグループのうち1チャンネルのディジタル信号または複数チャンネルのディジタル信号の線形結合であることを特徴とする。2. The digital signal encoding method according to claim 1, wherein the signal to be encoded is a digital signal of one channel in a first group consisting of a plurality of channels.
Hierarchy signals or variations signal that the lower of the attribute is a linear combination of the first consisting of smaller number of channels than the group the second 1-channel digital signal or a digital signal of multiple channels of the group It is characterized by that.
上記ステップ(a) は上記モノラル信号を符号化するステップを含み、
上記ステップ(b) は、
(b-1) 上記モノラル信号を上記第2量子化精度と第2サンプリング周波数に属性の階層をグレードアップした変換信号を生成するステップと、
(b-2) 上記変換信号と上記第2グループのチャンネル信号間の差分を第2グループの誤差信号として生成して符号化するステップと、
(b-3) 上記第2グループのチャンネル信号と上記第1グループのチャンネル信号間でそれぞれ誤差信号を生成して符号化するステップ、
とからなる。40. The digital signal encoding method according to claim 39, wherein the second group of digital signals includes a monaural signal having a first quantization accuracy and a first sampling frequency, and a second higher-order attribute layer than the monaural signal . A plurality of channel signals having quantization accuracy and a second sampling frequency, wherein the first group of digital signals have the second quantization accuracy and the second sampling frequency, and the second group of channel signals. Contains channel signals equal to or greater than the number,
Step (a) includes encoding the monaural signal;
Step (b) above is
(b-1) generating a transformed signal obtained by upgrading the attribute level to the second quantization accuracy and the second sampling frequency for the monaural signal;
(b-2) generating and encoding a difference between the converted signal and the second group of channel signals as a second group error signal;
(b-3) generating and encoding an error signal between each of the second group of channel signals and the first group of channel signals;
It consists of.
上記左チャンネル信号と右チャンネル信号の和信号を生成し、上記変換信号と上記和信号との差信号を上記誤差信号の他の1つとして生成して符号化するステップとからなる。41. The encoding method according to claim 40, wherein the second group includes a left channel signal and a right channel signal, and the step (b-2) uses a difference signal between the left channel signal and the right channel signal as the second channel signal. Generating and encoding as one of the error signals of the group;
Generating a sum signal of the left channel signal and the right channel signal, and generating and encoding a difference signal between the converted signal and the sum signal as another one of the error signals.
上記属性の階層が下位の信号又はその変形信号は、上記第1のグループより少ないチャンネル数からなる第2のグループのうち1チャンネルのディジタル信号または以上の複数チャンネルのディジタル信号の線形結合であることを特徴とする。15. The encoding device according to claim 14, wherein the signal to be encoded is a digital signal of one channel among a first group consisting of a plurality of channels.
Hierarchy signals or variations signal that the lower of the attribute is a linear combination of the first consisting of smaller number of channels than the group the second 1-channel digital signal or more of a plurality of channels of digital signals of the group It is characterized by that.
上記主符号生成手段は、上記モノラル信号を圧縮符号化する手段であり、
上記誤差信号符号化手段は、
上記モノラル信号を上記第2量子化精度と第2サンプリング周波数の信号にグレードアップした変換信号を生成するグレードアップ手段と、
上記変換信号と上記第2グループのチャンネル信号間の誤差を求め、複数の第1誤差信号を出力する複数の第2グループ減算部と、
上記第2グループの誤差信号をそれぞれ可逆符号化する圧縮符号化部と、
上記第2グループのチャンネル信号と上記第1グループのチャンネル信号間の複数の第1グループ誤差信号を生成する複数の第1グループ減算部と、
上記複数の第1グループ誤差信号を可逆符号化する複数の第1グループ圧縮符号化部、
とを含む。In the coding apparatus of claim 42, the digital signal of the second group, a mono signal having a first quantization accuracy and a first sampling frequency, second quantum of hierarchical attributes from the monophonic signal is higher A plurality of channel signals having a quantization accuracy and a second sampling frequency, wherein the first group of digital signals has the second quantization accuracy and a second sampling frequency, and the number of the second group of channel signals. A first group of channel signals equal to or greater than
The main code generating means is means for compressing and encoding the monaural signal,
The error signal encoding means includes:
Upgrading means for generating a converted signal obtained by upgrading the monaural signal to a signal having the second quantization accuracy and the second sampling frequency;
A plurality of second group subtracting sections for obtaining an error between the converted signal and the second group of channel signals and outputting a plurality of first error signals;
A compression encoder for losslessly encoding the second group of error signals,
A plurality of first group subtracting units for generating a plurality of first group error signals between the second group of channel signals and the first group of channel signals;
A plurality of first group compression encoding units for lossless encoding the plurality of first group error signals;
Including.
上記第2グループの誤差信号を生成する上記第2グループ減算部は、
上記左右チャンネル信号間の差信号を上記第2グループの誤差信号の1つとして生成する減算器と、
上記左右チャンネル信号間の和信号と生成する加算部と、その和信号と上記変換信号との差分を上記第2グループの誤差信号として生成する減算器、
とからなる。44. The encoding device according to claim 43, wherein the second group of channel signals comprises a left channel signal and a right channel signal, and the first group of channel signals comprises two or more multi-channel signals,
The second group subtracting unit that generates the error signal of the second group includes:
A subtractor for generating a difference signal between the left and right channel signals as one of the error signals of the second group;
An adder for generating a sum signal between the left and right channel signals, and a subtractor for generating a difference between the sum signal and the converted signal as an error signal of the second group;
It consists of.
上記誤差信号は複数のチャンネルからなる第1のグループのうち、1チャンネルのディジタル誤差信号であり、
上記属性の階層が下位の復号信号又はその復号信号は、上記第1のグループより少ないチャンネル数からなる第2のグループのうち1チャンネルのディジタル復号信号又は2以上の複数チャンネルのディジタル信号の線形結合であることを特徴とする。The decoding method according to claim 21,
The error signal is a digital error signal of one channel in the first group consisting of a plurality of channels.
Hierarchy decrypt signals or decoded signals thereof the lower of the attributes, the linear of the first 1 channel decoded digital signal of the second group of fewer number of channels group or 2 or more of a plurality of channels of digital signals It is a combination.
上記ステップ(a) は、上記第2グループのチャンネル信号の誤差符号および第1グループのチャンネル信号の誤差符号をそれぞれ復号し、第2グループ誤差信号および第1グループ誤差信号を生成するステップとからなり、
上記ステップ(b) は、
(b-1) 主符号を復号して上記モノラル信号を再生するステップと、
(b-2) 上記モノラル信号を第2量子化精度及び第2サンプリング周波数に属性の階層をグレードアップした変換信号を生成するステップと、
(b-3) 上記変換信号と上記第1誤差信号とを加算して第2グループのチャンネル信号を再生するステップと、
(b-4) 上記再生された第2グループのチャンネル信号と上記第1グループの誤差信号を加算して第1グループのチャンネル信号を再生するステップ、
とからなる。46. The decoding method according to claim 45, wherein the digital signals of the second group include a monaural signal having a first quantization accuracy and a first sampling frequency, and a second higher-order attribute layer than the monaural signal . A plurality of channel signals having a quantization accuracy and a second sampling frequency, wherein the first group of digital error signals has the second quantization accuracy and a second sampling frequency, and the second group of channel signals. Contains channel signals equal to or greater than
The step (a) includes the steps of decoding the error code of the second group of channel signals and the error code of the first group of channel signals, respectively, and generating a second group error signal and a first group error signal. ,
Step (b) above is
(b-1) decoding the main code to reproduce the monaural signal;
(b-2) generating a transformed signal obtained by upgrading the attribute level to the second quantization accuracy and the second sampling frequency of the monaural signal;
(b-3) adding the converted signal and the first error signal to reproduce a second group of channel signals;
(b-4) adding the reproduced second group channel signal and the first group error signal to reproduce the first group channel signal;
It consists of.
上記誤差信号は複数のチャンネルからなる第1のグループのうち、1チャンネルのディジタル誤差信号であり、
上記属性の階層が下位の復号信号又はその復号信号は、上記第1のグループより少ないチャンネル数からなる第2のグループのうち1チャンネルのディジタル復号信号又は2以上の複数チャンネルのディジタル信号の線形結合であることを特徴とする。The decoding device according to claim 33,
The error signal is a digital error signal of one channel in the first group consisting of a plurality of channels.
Hierarchy decrypt signals or decoded signals thereof the lower of the attributes, the linear of the first 1 channel decoded digital signal of the second group of fewer number of channels group or 2 or more of a plurality of channels of digital signals It is a combination.
上記誤差信号生成手段は、第2グループの誤差符号を復号して第2グループ誤差信号を得る第2グループ復号部と、第1グループの誤差符号を復号して第1グループ誤差信号を得る第1グループ復号部とからなり、
上記信号合成手段は、主符号を復号してモノラル信号を再生するモノラル信号復号部と、上記モノラル信号を上記第2グループのチャンネル信号と同じ第2量子化精度と第2サンプリング周波数の信号にグレードアップした変換信号を生成するグレードアップ部と、上記変換信号と上記第2グループの誤差信号とを加算して第2グループのチャンネル信号を再生する第2グループ加算部と、再生された上記第2グループのチャンネル信号と上記第1グループの誤差信号を加算して第1グループのチャンネル信号を再生する第1グループ加算部、とからなる。49. The decoding device according to claim 48, wherein the second group of digital signals includes a monaural signal having a first quantization accuracy and a first sampling frequency, and a second higher-order attribute layer than the monaural signal . A plurality of channel signals having a quantization accuracy and a second sampling frequency, wherein the first group of error signals has the second quantization accuracy and a second sampling frequency, and the second group of channel signals Consists of channel signals equal to or greater than the number,
The error signal generating means includes: a second group decoding unit that decodes a second group error code to obtain a second group error signal; and a first group error signal that decodes the first group error code to obtain a first group error signal. It consists of a group decryption unit,
The signal synthesizing means includes a monaural signal decoding unit that decodes the main code to reproduce the monaural signal, and grades the monaural signal into a signal having the same second quantization accuracy and second sampling frequency as the second group of channel signals. An upgraded part for generating an up-converted signal, a second group adder for reproducing the second group of channel signals by adding the converted signal and the error signal of the second group, and the reproduced second A first group adder for adding the group channel signal and the first group error signal to reproduce the first group channel signal;
上記属性の階層が下位の信号又はその変形信号は、上記第1のグループより少ないチャンネル数からなる第2のグループのうち1チャンネルのディジタル信号または以上の複数チャンネルのディジタル信号の線形結合であることを特徴とする。2. The digital signal encoding method according to claim 1, wherein the signal to be encoded is a digital signal of one channel in a first group consisting of a plurality of channels.
Hierarchy signals or variations signal that the lower of the attribute is a linear combination of the first consisting of smaller number of channels than the group the second 1-channel digital signal or more of a plurality of channels of digital signals of the group It is characterized by that.
上記ステップ(a) は、第1量子化精度と第1サンプリング周波数のモノラル信号を圧縮符号化するステップをからなり、
上記ステップ(b) は、
上記モノラル信号の属性の階層を上記第2量子化精度と第2サンプリング周波数の信号にグレードアップした変換信号を生成するステップと、
上記変換信号と上記第2グループのチャンネル信号の成分との差分を第2グループの誤差信号として生成して符号化するステップと、
上記第1グループのチャンネル信号をチャンネル間直交変換して周波数領域信号を生成するステップと、
上記周波数領域信号の少なくとも1つと上記変換信号成分間の差分を上記第1グループの誤差信号として生成するステップと、
これら第1グループの誤差信号及び周波数領域信号をそれぞれ圧縮符号化するステップ、
とからなる。52. The encoding method according to claim 51, wherein the digital signals of the second group include a monaural signal having a first quantization accuracy and a first sampling frequency, and a second higher-order attribute layer than the monaural signal . A plurality of channel signals having a quantization accuracy and a second sampling frequency, wherein the first group of digital signals has the second quantization accuracy and a second sampling frequency, and the second group of channel signals Contains channel signals equal to or greater than the number,
The step (a) includes a step of compressing and encoding a monaural signal having the first quantization accuracy and the first sampling frequency.
Step (b) above is
Generating a converted signal obtained by upgrading the attribute hierarchy of the monaural signal to a signal having the second quantization accuracy and the second sampling frequency;
Generating and encoding a difference between the converted signal and the component of the second group of channel signals as a second group of error signals;
Generating a frequency domain signal by performing inter-channel orthogonal transform on the first group of channel signals;
Generating a difference between at least one of the frequency domain signals and the transformed signal component as the error signal of the first group;
Compressing and encoding each of the first group of error signals and frequency domain signals;
It consists of.
上記誤差信号は複数のチャンネルからなる第1のグループのうち、1チャンネルのディジタル誤差信号であり、
上記属性の階層が下位の復号信号又はその復号信号は、上記第1のグループより少ないチャンネル数からなる第2のグループのうち1チャンネルのディジタル復号信号又は2以上の複数チャンネルのディジタル信号の線形結合であることを特徴とする。The decoding method according to claim 21,
The error signal is a digital error signal of one channel in the first group consisting of a plurality of channels.
Hierarchy decrypt signals or decoded signals thereof the lower of the attributes, the linear of the first 1 channel decoded digital signal of the second group of fewer number of channels group or 2 or more of a plurality of channels of digital signals It is a combination.
上記ステップ(b) は主符号を復号してモノラル信号を再生し、
上記ステップ(a) は上記モノラル信号を上記第2量子化精度と第2サンプリング周波数にグレードアップした変換信号を生成し、第2グループの誤差符号を復号して第2グループの誤差信号を生成し、上記第1グループの1つの誤差信号と上記変換信号と加算して第2グループのチャンネル信号を再生し、
その加算結果と残りの周波数領域信号とを直行逆変換して時間領域信号の第2グループのチャンネル信号として再生することを特徴とする。54. The decoding method according to claim 53, wherein the digital signals of the second group include a monaural signal having a first quantization accuracy and a first sampling frequency, and a second higher-order attribute layer than the monaural signal . A plurality of channel signals having a quantization accuracy and a second sampling frequency, wherein the first group of digital error signals has the second quantization accuracy and a second sampling frequency, and the second group of channel signals. A first group of channel signals equal to or greater than
Step (b) above decodes the main code to reproduce the monaural signal,
The step (a) generates a transformed signal obtained by upgrading the monaural signal to the second quantization accuracy and the second sampling frequency, decodes the second group error code, and generates a second group error signal. , Adding the error signal of the first group and the converted signal to reproduce the channel signal of the second group,
The addition result and the remaining frequency domain signal are subjected to direct inverse transformation and reproduced as a channel signal of the second group of time domain signals.
上記属性の階層が下位の信号又はその変形信号は、上記第1のグループより少ないチャンネル数からなる第2のグループのうち1チャンネルのディジタル信号または以上の複数チャンネルのディジタル信号の線形結合であることを特徴とする。15. The digital signal encoding apparatus according to claim 14, wherein the signal to be encoded is a digital signal of one channel in a first group consisting of a plurality of channels.
Hierarchy signals or variations signal that the lower of the attribute is a linear combination of the first consisting of smaller number of channels than the group the second 1-channel digital signal or more of a plurality of channels of digital signals of the group It is characterized by that.
上記主符号生成手段は、第1量子化精度と第1サンプリング周波数のモノラル信号を圧縮符号化して主符号を生成する手段であり、
上記誤差信号符号化手段は、
上記モノラル信号をそれより属性の階層が上位の上記第2量子化精度と上記第2サンプリング周波数の信号にグレードアップした変換信号を生成するグレードアップ部と、
上記第2グループのチャンネル信号の成分と上記変換信号間の差分を第2グループの誤差信号として生成する第2グループ減算部と、
上記第2グループの誤差信号を圧縮符号化して誤差符号を出力する第1圧縮符号化部と、第1グループのチャンネル信号をチャンネル間直交変換して周波数領域信号を生成するチャンネル間直交変換部と、
上記周波数領域信号の少なくとも1つと、上記変換信号との間の差分を第2グループの誤差信号として生成する第1グループ減算部と、
上記周波数領域信号及び上記第2グループの誤差信号との間の誤差信号を第1グループの誤差信号として生成する第1グループの減算部、とからなる。56. The encoding device according to claim 55, wherein the digital signal of the second group includes a monaural signal having a first quantization accuracy and a first sampling frequency, and a second higher-order attribute layer than the monaural signal . A plurality of channel signals having a quantization accuracy and a second sampling frequency, wherein the first group of digital signals has the second quantization accuracy and a second sampling frequency, and the second group of channel signals Channel signal equal to or greater than the number,
The main code generation means is means for generating a main code by compressing and encoding a monaural signal having a first quantization accuracy and a first sampling frequency.
The error signal encoding means includes:
And upgrading unit for generating a conversion signal the monophonic signal it from the attribute hierarchies upgraded to signals above SL second quantization precision and the second sampling frequency higher,
A second group subtracting unit for generating a difference between the component of the second group of channel signals and the converted signal as an error signal of the second group;
A first compression encoder that compresses and encodes the second group of error signals and outputs an error code; and an interchannel orthogonal transformer that generates a frequency domain signal by orthogonally transforming the first group of channel signals. ,
A first group subtracting unit that generates a difference between at least one of the frequency domain signals and the converted signal as a second group error signal;
And a first group subtracting unit that generates an error signal between the frequency domain signal and the second group error signal as a first group error signal.
上記誤差信号は複数のチャンネルからなる第1のグループのうち、1チャンネルのディジタル誤差信号であり、
上記属性の階層が下位の復号信号又はその復号信号は、上記第1のグループより少ないチャンネル数からなる第2のグループのうち1チャンネルのディジタル復号信号又は2以上の複数チャンネルのディジタル信号の線形結合であることを特徴とする。The decoding device according to claim 33,
The error signal is a digital error signal of one channel in the first group consisting of a plurality of channels.
Hierarchy decrypt signals or decoded signals thereof the lower of the attributes, the linear of the first 1 channel decoded digital signal of the second group of fewer number of channels group or 2 or more of a plurality of channels of digital signals It is a combination.
第2グループの誤差符号を復号して第2グループ誤差信号を生成する第2部ループ復号部と、
少なくとも1つの誤差符号を含む第1グループの符号を復号して周波数領域信号と第1グループ誤差信号とを生成する第1グループ復号部と、
上記モノラル信号を第2量子化精度と第2サンプリング周波数にグレードアップした変換信号を生成するグレードアップ部と、
上記変換信号と上記第2グループの誤差信号とを加算して第2グループのチャンネル信号を再生する第2グループの加算部と、
上記変換信号と上記第1グループの誤差信号とを加算し、その加算結果と上記周波数領域を直交逆変換して時間領域信号に変換し、第1グループのチャンネル信号として再生する直交逆変換部、
とからなる。58. The decoding apparatus according to claim 57, wherein said signal synthesis means decodes a main code and reproduces said monaural signal;
A second loop decoding unit for decoding a second group of error codes to generate a second group error signal;
A first group decoding unit that decodes a first group of codes including at least one error code to generate a frequency domain signal and a first group error signal;
An upgrade unit for generating a converted signal obtained by upgrading the monaural signal to a second quantization accuracy and a second sampling frequency;
A second group adding unit for adding the converted signal and the second group error signal to reproduce a second group channel signal;
An orthogonal inverse transform unit that adds the transformed signal and the error signal of the first group, orthogonally transforms the addition result and the frequency domain to transform it into a time domain signal, and reproduces it as a channel signal of the first group;
It consists of.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2003064092A JP3960932B2 (en) | 2002-03-08 | 2003-03-10 | Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program |
Applications Claiming Priority (7)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002063449 | 2002-03-08 | ||
JP2002063598 | 2002-03-08 | ||
JP2002288677 | 2002-10-01 | ||
JP2002304646 | 2002-10-18 | ||
JP2002346789 | 2002-11-29 | ||
JP2003025272 | 2003-01-31 | ||
JP2003064092A JP3960932B2 (en) | 2002-03-08 | 2003-03-10 | Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004289196A JP2004289196A (en) | 2004-10-14 |
JP3960932B2 true JP3960932B2 (en) | 2007-08-15 |
Family
ID=33304267
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2003064092A Expired - Fee Related JP3960932B2 (en) | 2002-03-08 | 2003-03-10 | Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3960932B2 (en) |
Families Citing this family (19)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005215502A (en) * | 2004-01-30 | 2005-08-11 | Matsushita Electric Ind Co Ltd | Encoding device, decoding device, and method thereof |
KR100707177B1 (en) * | 2005-01-19 | 2007-04-13 | 삼성전자주식회사 | Method and apparatus for encoding and decoding of digital signals |
JP2006254211A (en) * | 2005-03-11 | 2006-09-21 | Kenwood Corp | Data compression apparatus and method, data decompression apparatus and method, and program |
JP5171256B2 (en) * | 2005-08-31 | 2013-03-27 | パナソニック株式会社 | Stereo encoding apparatus, stereo decoding apparatus, and stereo encoding method |
ATE463028T1 (en) * | 2006-09-13 | 2010-04-15 | Ericsson Telefon Ab L M | METHOD AND ARRANGEMENTS FOR A VOICE/AUDIOS TRANSMITTER AND RECEIVER |
DE102006050068B4 (en) * | 2006-10-24 | 2010-11-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for generating an environmental signal from an audio signal, apparatus and method for deriving a multi-channel audio signal from an audio signal and computer program |
WO2008081777A1 (en) * | 2006-12-25 | 2008-07-10 | Kyushu Institute Of Technology | High-frequency signal interpolation device and high-frequency signal interpolation method |
KR101471978B1 (en) * | 2007-02-02 | 2014-12-12 | 삼성전자주식회사 | Method for inserting data for enhancing quality of audio signal and apparatus therefor |
EP2093757A4 (en) * | 2007-02-20 | 2012-02-22 | Panasonic Corp | Multi-channel decoding device, multi-channel decoding method, program, and semiconductor integrated circuit |
EP2132732B1 (en) * | 2007-03-02 | 2012-03-07 | Telefonaktiebolaget LM Ericsson (publ) | Postfilter for layered codecs |
US8386266B2 (en) * | 2010-07-01 | 2013-02-26 | Polycom, Inc. | Full-band scalable audio codec |
US20140214431A1 (en) * | 2011-07-01 | 2014-07-31 | Dolby Laboratories Licensing Corporation | Sample rate scalable lossless audio coding |
KR102222838B1 (en) | 2014-04-17 | 2021-03-04 | 보이세지 코포레이션 | Methods, encoder and decoder for linear predictive encoding and decoding of sound signals upon transition between frames having different sampling rates |
MX2018006677A (en) | 2014-07-28 | 2021-06-29 | Ericsson Telefon Ab L M | Pyramid vector quantizer shape search. |
ES2770704T3 (en) * | 2014-07-28 | 2020-07-02 | Nippon Telegraph & Telephone | Coding an acoustic signal |
WO2020250371A1 (en) * | 2019-06-13 | 2020-12-17 | 日本電信電話株式会社 | Sound signal coding/transmitting method, sound signal coding method, sound signal transmitting-side device, coding device, program, and recording medium |
WO2020250370A1 (en) * | 2019-06-13 | 2020-12-17 | 日本電信電話株式会社 | Audio signal receiving and decoding method, audio signal decoding method, audio signal receiving device, decoding device, program, and recording medium |
WO2020250369A1 (en) * | 2019-06-13 | 2020-12-17 | 日本電信電話株式会社 | Audio signal receiving and decoding method, audio signal decoding method, audio signal receiving device, decoding device, program, and recording medium |
JP7332873B2 (en) * | 2019-09-10 | 2023-08-24 | 富士通株式会社 | Encoding circuit, decoding circuit, encoding method, decoding method, transmission device, and optical transmission system |
-
2003
- 2003-03-10 JP JP2003064092A patent/JP3960932B2/en not_active Expired - Fee Related
Also Published As
Publication number | Publication date |
---|---|
JP2004289196A (en) | 2004-10-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP1484841B1 (en) | DIGITAL SIGNAL ENCODING METHOD, DECODING METHOD, ENCODING DEVICE, DECODING DEVICE and DIGITAL SIGNAL DECODING PROGRAM | |
JP3960932B2 (en) | Digital signal encoding method, decoding method, encoding device, decoding device, digital signal encoding program, and decoding program | |
RU2387022C2 (en) | Lossless scalable audio codec and author tool | |
TWI515720B (en) | Method of compressing a digitized audio signal, method of decoding an encoded compressed digitized audio signal, and machine readable storage medium | |
EP2228791B1 (en) | Scalable lossless audio codec and authoring tool | |
JP2001044847A (en) | Reversible coding method, reversible decoding method, system adopting the methods and each program recording medium | |
JP4831115B2 (en) | Speech encoding method and speech decoding method | |
JP4244223B2 (en) | Speech encoding method and speech decoding method | |
JP4195598B2 (en) | Encoding method, decoding method, encoding device, decoding device, encoding program, decoding program | |
JP2004138789A (en) | Digital signal coding method, decoding method, encoder, decoder, and programs therefor | |
JP4244222B2 (en) | Speech encoding method and speech decoding method | |
JP4148259B2 (en) | Speech encoding method and speech decoding method | |
JP4151031B2 (en) | Speech encoding method and speech decoding method | |
JP4244226B2 (en) | Speech encoding method and speech decoding method | |
JP4244224B2 (en) | Speech encoding method and speech decoding method | |
JP4151032B2 (en) | Speech encoding method and speech decoding method | |
JP4151033B2 (en) | Speech encoding method and speech decoding method | |
JP4196356B2 (en) | Speech encoding method and speech decoding method | |
JP4151034B2 (en) | Speech encoding method and speech decoding method | |
JP4151028B2 (en) | Speech encoding method and speech decoding method | |
JP4151030B2 (en) | Speech encoding method and speech decoding method | |
JP4244225B2 (en) | Speech encoding method and speech decoding method | |
JP4148260B2 (en) | Speech encoding method and speech decoding method | |
JP2004140569A (en) | Digital signal encoding method, decoding method, encoder and decoder for them, and program for them | |
JP2006171769A (en) | Voice coding method and decoding method |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050126 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20061018 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20070122 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20070213 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070315 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070508 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070515 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 3960932 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20100525 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110525 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20120525 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20130525 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20140525 Year of fee payment: 7 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
LAPS | Cancellation because of no payment of annual fees |