JP4610087B2 - 損失のない符号化・復号へのマトリックス改良 - Google Patents
損失のない符号化・復号へのマトリックス改良 Download PDFInfo
- Publication number
- JP4610087B2 JP4610087B2 JP2000610131A JP2000610131A JP4610087B2 JP 4610087 B2 JP4610087 B2 JP 4610087B2 JP 2000610131 A JP2000610131 A JP 2000610131A JP 2000610131 A JP2000610131 A JP 2000610131A JP 4610087 B2 JP4610087 B2 JP 4610087B2
- Authority
- JP
- Japan
- Prior art keywords
- channel
- channel signal
- signal
- matrix
- basic matrix
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Lifetime
Links
- 239000011159 matrix material Substances 0.000 title claims description 176
- 230000006872 improvement Effects 0.000 title description 2
- 238000000034 method Methods 0.000 claims description 64
- 230000008569 process Effects 0.000 claims description 33
- 230000000694 effects Effects 0.000 claims description 20
- 238000013139 quantization Methods 0.000 claims description 18
- 230000004044 response Effects 0.000 claims description 8
- 230000004048 modification Effects 0.000 claims description 5
- 238000012986 modification Methods 0.000 claims description 5
- 108091006146 Channels Proteins 0.000 claims 102
- 230000001131 transforming effect Effects 0.000 claims 6
- 238000007906 compression Methods 0.000 description 17
- 230000006835 compression Effects 0.000 description 17
- 238000004364 calculation method Methods 0.000 description 13
- 238000012545 processing Methods 0.000 description 13
- 238000012360 testing method Methods 0.000 description 12
- 239000013598 vector Substances 0.000 description 12
- 230000002441 reversible effect Effects 0.000 description 11
- 238000005070 sampling Methods 0.000 description 9
- 230000005540 biological transmission Effects 0.000 description 7
- 230000000670 limiting effect Effects 0.000 description 7
- 238000004519 manufacturing process Methods 0.000 description 6
- 230000005236 sound signal Effects 0.000 description 6
- 230000003595 spectral effect Effects 0.000 description 6
- 238000003860 storage Methods 0.000 description 6
- 230000000295 complement effect Effects 0.000 description 5
- 208000019300 CLIPPERS Diseases 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000006243 chemical reaction Methods 0.000 description 4
- 208000021930 chronic lymphocytic inflammation with pontine perivascular enhancement responsive to steroids Diseases 0.000 description 4
- 229910003460 diamond Inorganic materials 0.000 description 4
- 239000010432 diamond Substances 0.000 description 4
- 230000015654 memory Effects 0.000 description 4
- 238000011084 recovery Methods 0.000 description 4
- 230000009467 reduction Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000036961 partial effect Effects 0.000 description 3
- 230000001419 dependent effect Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 238000012856 packing Methods 0.000 description 2
- 230000002829 reductive effect Effects 0.000 description 2
- 238000001228 spectrum Methods 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 230000009466 transformation Effects 0.000 description 2
- 238000000844 transformation Methods 0.000 description 2
- 101150071746 Pbsn gene Proteins 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 230000002411 adverse Effects 0.000 description 1
- 230000015572 biosynthetic process Effects 0.000 description 1
- 239000002131 composite material Substances 0.000 description 1
- 238000005520 cutting process Methods 0.000 description 1
- 125000004122 cyclic group Chemical group 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000005315 distribution function Methods 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 239000000203 mixture Substances 0.000 description 1
- 238000005192 partition Methods 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 239000004576 sand Substances 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
- 230000001052 transient effect Effects 0.000 description 1
- 238000002604 ultrasonography Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00992—Circuits for stereophonic or quadraphonic recording or reproducing
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
-
- H—ELECTRICITY
- H03—ELECTRONIC CIRCUITRY
- H03M—CODING; DECODING; CODE CONVERSION IN GENERAL
- H03M7/00—Conversion of a code where information is represented by a given sequence or number of digits to a code where the same, similar or subset of information is represented by a different sequence or number of digits
- H03M7/30—Compression; Expansion; Suppression of unnecessary data, e.g. redundancy reduction
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/76—Television signal recording
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
- H04S3/02—Systems employing more than two channels, e.g. quadraphonic of the matrix type, i.e. in which input signals are combined algebraically, e.g. after having been phase shifted with respect to each other
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/00007—Time or data compression or expansion
- G11B2020/00014—Time or data compression or expansion the compressed signal being an audio signal
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B2220/00—Record carriers by type
- G11B2220/20—Disc-shaped record carriers
- G11B2220/25—Disc-shaped record carriers characterised in that the disc is based on a specific recording technology
- G11B2220/2537—Optical discs
- G11B2220/2562—DVDs [digital versatile discs]; Digital video discs; MMCDs; HDCDs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Theoretical Computer Science (AREA)
- Multimedia (AREA)
- Physics & Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Physics (AREA)
- Pure & Applied Mathematics (AREA)
- Mathematical Optimization (AREA)
- Acoustics & Sound (AREA)
- General Physics & Mathematics (AREA)
- Algebra (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
- Stereophonic System (AREA)
- Compression Or Coding Systems Of Tv Signals (AREA)
Description
【産業上の利用分野】
本発明はデジタル信号の流れ、特に、多重チャンネル信号のミキシングに関するデジタルオーディオストリームの符号化及び復号に関する。
【0002】
【発明の背景】
損失のない圧縮は、現在デジタルオーディオ信号を記憶又は伝えるのに要するデータレートを低減させる確立された手段である。多重チャンネル信号のデータレートを低減させる一方法は、優勢な情報が伝達されるチャンネルのいくつかに集中されると同時に他のチャンネルは比較的僅かな情報を伝えるようにマトリクス化を用いることである。例えば、もし中央サウンドイメージを伝えるとすれば、2チャンネルオーディオは左右チャンネルで殆ど同一波形を持ち得るであろう。その場合には2チャンネルの和及び差を符号化するのがより有効である。このプロセスはWO−A96/37048にある程度詳説され、それには完全に反転可能な方法若しくは損失のない方法でマトリックス化を達成するために縦続された基本マトリックス量子化器を用いることが含まれる。
【0003】
WO−A96/37048に開示されたプロセス(方法)では、一般的な家庭聴取により適したスピーカ供給量を表わすマトリックス化されたデジタル信号を得るために多重チャンネルデジタル原信号にマトリックスを用いるマトリックス量子化器の利用も考えている。これらのマトリックス化された信号はDVDのようなキャリヤー上に記録され、通常のプレーヤーで各マトリックス化された信号がスピーカに簡単に供給されるであろう。しかし、上級プレーヤーではマトリックス量子化器の効果を反転させ、したがって原デジタル信号を正確に再構成してそれを代替的方法で再生するようにすることが出来る。
【0004】
【発明が解決すべき課題】
DVDオーディオの商業的用途では、損失のない圧縮を用いた伝達システムでマトリックス化された信号及び原信号の双方を与え得るように上記2つの概念を組合せる要求がある。この用途では必要とされるマトリックス化された信号は2チャンネルを有するが原信号は3チャンネル以上を有し、従って、多重信号が回復され得るためには追加の情報が与えられなければならない。しかし、追加情報は、2チャンネルマトリックス化信号のみを復号せんと欲するデコーダに計算上の過負荷(オーバーヘッド)を課すべきではない。
【0005】
現在、デジタルオーディオはしばしば24ビットで伝達され、Motorola56000シリーズのようなオーディオ用にデザインされたポピュラーなデジタル信号処理(DSP)チップまた容易に24ビットワードを処理する。しかし、WO−A96/37048に記載される処理は、原信号より広いワード幅を要する総数を発生させ得る。倍精度計算を用いることは極端に高価なので、実質的な処理が可能であると同時に増大されたワード幅を要しない方法が求められる。
【0006】
最後に、損失のない再生を与えるように設計された装置を購入している消費者は、回復される信号が実際に損失がないことを再確認することを望むであろう。従来の符号化された流れ(ストリーム)内のパリテイー(奇偶性)及びCRC検査は、ストリーム内のデータ崩壊に起因する誤差は示すが、エンコーダ及びデコーダ間のマトリックス化又は他のアルゴリズム不適合に起因する誤差をあばくことはない。
【0007】
【課題を解決するための手段】
本発明の第1面によると、2つサブストリームに分割されるストリームが与えられる。第1サブストリームはマトリックス化によって得られるダウンミックス信号、即ち、ミックスダウンされた信号に関連すると共に原多重チャンネルデジタル信号より少ないチャンネルを含む情報を与え、第2サブストリームは原多重デジタル信号がデコーダによって損失なしに回復され得るようにさせる追加の情報を与える。両サブストリームが損失のない圧縮を用いて伝達される状況では、ダウンミックス信号のみを復号するデコーダは第1サブストリームのみを復元することを要し、従って多重チャンネルデジタル信号を復号するのに要するより少ない計算資源を用い得る。
【0008】
この第1面の変形では、第1サブストリームは複数のサブストリームで置き換えられ、複数の異なったマトリックス化された表現が選択され得る。しかし、最後のサブストリームは完全な原多重デジタル信号が損失なく再生され得るようにさせる追加の情報を再び含むであろう。
【0009】
第1面の望ましい実行においてエンコーダは、縦続された1つ又はそれ以上の基本マトリックス量子化器を用いてダウンミックス信号を供給する。各量子化器はnXnマトリックスを実行し、ダウンミックスに要するmチャンネルの選択がそれに続く。
【0010】
多重チャンネルデコーダは両ストリームから信号をとり、原多重チャンネル信号を回復するために縦続された逆基本マトリックスを用いる。第1サブストリームからの各チャンネルが初めに配置されるように、縦続されたデコーダへの入力であるチャンネルを配列することは自然であると考えられ得る。しかしこれはデコーダのカスケード(縦続)の出力において不正確なチャンネル配列に帰着し得るので、エンコーダによってチャンネル入替えが特定されると共に正しいチャンネル順序を回復するためにデコーダによって実行されるのが望ましい。
【0011】
マトリックス化以内の切捨て又は丸めはすべてディザーを用いて計算すべきである。この場合には、損失のない符号化のために、ディザー信号がエンコーダによってなされる計算を逆にし、従って原信号を損失なしに回復し得るようにするためにそれがデコーダで利用され得るようにしなければならない。ディザーは、WO-A96/37048で認識されるように「自動ディザー」方法を用いて計算され得る。しかし、損失のない圧縮計画の状況では、デコーダにそのディザープロセスをエンコーダによって用いられたもと同期することを可能にする符号化されたストリームにディザー種を与えることによって自動ディザーは避けられ得る。
【0012】
それ故に本発明の第2面によると、符号化されたビットストリームにディザー種を含む損失のない圧縮システムが与えられる。ディザー種は、デコーダの擬似乱数順序発生器をエンコーダの機能的に同一の発生器と同期させるのに用いられる。
【0013】
本発明の重要な用途では、ダウンミックスは2つのチャンネルを有し、2つの基本マトリックス量子化器を原多重デジタル信号に用いることによって最も便利に得られる。本発明の第2面を実行する実施形態では、ディザーは各量子化器によって必要とされ、さらに異なったディザーが2つの量子化器に与えられるべきであると共に各ディザーに対する望ましい確率分布関数(PDF)は三角形のものである。そのような2つの三角形のPDF(TPDF)ディザー(ここでは「ダイヤモンドディザー」と呼ぶ)信号を供給する有効な方法は、2つの独立三角形PDF(RPDF)信号を加算及び減算することである。より多くのチャンネルに対するさらなる詳細及び一般化については、R.Wannakerの「多重チャンネルディザー信号の効率的発生」(AES 103rd Convention, New York, 1997,rprint no. 4553)を見よ。
【0014】
従って、第2面の望ましい実施形態のエンコーダは、2つの独立RPDFディザー信号を供給するために単一順序発生器を用い、2チャンネルダウンミックスを得るために用いられる2つの基本マトリックス量子化器によって必要とされるディザーを与えるためにこれらの信号の和及び差が用いられる。
【0015】
WO-A96/37048は、損失のない圧縮システム内で基本マトリック量子化器を用いることを記載し、我々は第1面の望ましい実施例につき既に言及している。それもまたダウンミックス信号に必要な情報を別々のサブストリームに配置するために基本マトリックス量子化器を用いる。
【0016】
従って、本発明の第3面では限定されていない基本マトリックス量子化器を含むエンコーダ及びデコーダが与えられ、係数からなるマトリックスとして特定されるダウンミックスを受取る論理を有するエンコーダは、ダウンミックスを供給するためにいくつかの基本マトリックス量子化器を割当て、データレートを低減させるマトリクス化を与えるためにさらなる数を選択的に割当てる。エンコーダは用いられる基本マトリックス量子化器の仕様を含むストリームを供給し、選択的にディザーの追加を含み得る。望ましい実施例では、ディザーは2つのRPDFディザー順序(シーケンス)として発生され、エンコーダは各ディザーシーケンスにつき係数を特定する。第1基本マトリックス量子化器の場合には同一標識の2つの係数を特定することによって、また第2基本マトリックス量子化器の場合には反対標識の2つの係数を特定することによってダイヤモンドディザーはこのように入手され得る。
【0017】
第3面の主要な実施例では、ダウンミックス信号が第1サブストリームで直接伝達されるように基本マトリックスが選択される。しかし、これはいくつかの理由で最適でないかもしれない。nチャンネルの多重チャンネルサブスペース(部分空間)をn次元ベクトルスペースと考えると、線形ダウンミックスのゼロでない出力に帰着する信号はサブスペースを形成するであろう。もしダウンミックスがmチャンネルを有するならば、サブスペースもまた通常m次元からなるであろう。それでは第1サブストリームの信号はm次元サブスペースを最適に伝え、その伝達されるチャンネルがダウンミックスチャンネルのマトリックス化された表現にされることを要するかもしれない。従って、たとえダウンミックス信号のみを回復するように設計されたデコーダによっても通常マトリックス化装置が必要となる。
【0018】
オーディオ信号は通常多くて24ビットで、Meridian Lossless Packing(R)(MLP)のような損失のない再生システムで伝えられ、原入力が24ビットを超えなかったので、出力が24ビットを超えないことが保証される。MLP(子午線無損失パッキング)の説明は読出し専用ディスク用DVD仕様書から得られる。即ち、Audio Specifications, Packed PCM, MLP Reference Information, Version 1.0, March 1999及び WO-A 96/37048から得られる。ダウンミックスの場合には、出力レベルはデコーダのマトリックスによって定められる。原則として出力が24ビットワードによって限定される飽和閾値を決して超え得ないようにマトリックス係数を尺度化できる。しかし実際にはこれは受け入れることができない低出力レベルに帰着する。さらにエンコーダでダウンミックス信号を制限又はクリップ(切取る)することは受け入れられない。これは再構成される多重チャンネル信号に影響を与えることなく行なうことはできず、それでは損失のない前提が失われる。飽和閾値を超える出力レベルは本明細書では「過負荷」と呼ばれる。もしラップラウンドを考慮するならば、ダウンミックス信号が時々過負荷になるのは、デジタル過負荷が極端に気になる場合を除けば、容認できると考えられる。ラップラウンドの結果についてはより詳細に以下に述べる。従って、本発明の第1面の望ましい実施例では、ダウンミックス信号を復号するデコーダは、過負荷の影響が気にならなくなるようにマトリック計算の後にクリッピング又は類似の制限装置を有する。
【0019】
高品質オーディオでの24ビットを慣例とする他の結果は、24ビット内部ワード幅を有するDSP処理チップの有効性である。WO−A96/37048に開示されるような各基本マトリックス量子化器は、他チャンネルの大きさを加えることによって多重チャンネル信号の1チャンネルを変更する。そのような基本マトリックス量子化器はストレートスルー単一利得を有する。本発明の第4面は、変更されたチャンネルに対する利得係数を受取る基本マトリックス量子化器に備えると共にlsb_bypass として知られる追加のデータ路を有する。利得は過負荷を避けるために1未満の値に設定され得る。基本マトリックス量子化器の量子化された出力は、それではその入力より少ない情報を含み、残余の情報は利得係数を用いることによって発生される追加の最下位ビット(LSBs)に含まれている。これらのLSBsのいくつか又はすべてはlsb_bypassデータ路を通して別々に伝達される。±1/2の利得係数の場合には特にlsb_bypassを通して伝えられ得る単一LSBが発生される。
【0020】
Lossless_check特性を与える本発明の第5面では、検査値がエンコーダへの多重チャンネル入力で計算されて符号化されたストリームで伝達される。デコーダは復号された出力からの同様な検査値を計算してそれをストリームで伝達される検査値と比較し、概して「無損失光」のような、再生が真に損失なしであることを示す、可視表示を聴取者に与えるようににさせる。本発明の第1面によるダウンミックスを有するストリームの場合には、当該ダウンミックスは原信号の損失のない再生ではない。それにもかかわらず、同期されたディザーが第2面によるデコーダに与えられると共にもしデコーダマトリックス化が、例えば、本発明の第3面によるマトリックス量子化器のように正確に説明されるならば、それではダウンミックス再生は完全に決定論的であり、エンコーダでシミュレートされ得ると同時にマスター製作技術者又はプロジューサによって試聴され得る。それ故に、エンコーダはシミュレートされたダウンミックスで検査値を計算し得ると共にこのワードはデコーダによって検査され得る。従って、試聴されたか若しくは符号化処理で試聴用に入手され得たものと同一ダウンミックスの損失のない再生が確認される。
【0021】
例えば、「予備量子化器」を組入れたエンコーダは、それによって符号化に先立って原多重チャンネル信号を変えることができると共に検査値の計算について選択権を有する。同「予備量子化器」はP.G.Craven及びJ.R.Stuartの『損失のないカーネル(中枢部)を用いるカスケード可能な損失のあるデータ圧縮』(J.Audio Eng.Soc., Abstract March 1997, vol.45,no.5,p.404 preprint no. 4416、本明細書ではAES1997と呼ぶ)もしそれが原信号からの検査値を計算するならば、デコーダの「無損失光」のような損失のない再生の表示は変更されてしまっている部分の間は決して明るくならない。代替手段としては符号化処理の一部として試聴用に変更された信号を入手し得るようにし、変更された信号からの検査値を計算することである。これはダウンミックスの場合と矛盾しない。即ち、双方の状況において「無損失光」は符号化段階での試聴用に入手できた信号の損失のない再生を示す。
【0022】
望ましい実施例では、検査値はすべてのチャンネルにつき計算されるパリテー検査ワードである。本発明の第1面を組入れた実施形態では、第1サブストリームは過負荷を避けるために用いられるクリッピングのようなあらゆる変更に先立ってシミュレートされたダウンミックスから計算されるパリテー検査ワードを含むが、一方第2サブストリームは完全な多重チャンネル信号から計算されるパリテー検査ワードを含む。パリテーを計算する前に、2つのチャンネルに影響を与える誤差が全く同じに検出される高確率を有するように各チャンネル値を表すワードはチャンネル数に等しいビット数だけ回転される。
【0023】
本開示全体を通して、符号化されたストリームをDVDのような記憶媒体に記録する符号化処理及びそのような記憶媒体からの符号化されたストリームを検索する復号処理に対してより特定の言及がなされる。しかし、本発明により実施されるエンコーダは、本質的にベースバンド又は超音波から紫外線周波数全体に亘る通信路等のあらゆる伝達(送信)媒体を用いて符号化されたストリームを送るのに用いられ得るか若しくは本質的に磁気及び光学技術等のあらゆる記録工業技術を用いて符号化されたストリームを記憶媒体に記録するために用いられ得る。同様に本発明により実行されるデコーダはそのような媒体から得られる符号化されたストリームを処理するのに用いられ得る。
【0024】
【実施形態】
ダウンミックス符号化及び復号
「オーディオディスク用損失の無い符号化」(J.Audio Eng. Soc., September 1996, vol. 44, no. 9, pp. 706-720)及び国際特許出願WO-A96/ 37048は損失の無い圧縮に用いられる原理の幾つかの論議を含む。
【0025】
損失の無い圧縮の商業的用途はDVDオーディオに用いることである。そこでは2つの種類のプレーヤーがある。即ち、典型的に「5.1」スピーカ配置を駆動するのに用いられる6つの出力を与える多重チャンネルプレーヤー及び2つの拡声器を有する聴取者又はヘッドホンを用いる携帯用の用途に対して2つの出力を与える2チャンネルプレーヤーがある。
【0026】
従って、DVDオーディオは記録されたオーディオ信号を2度伝達する能力を有する。即ち、一度は多重チャンネル信号として、また再び2チャンネル信号として伝送する。しかし、信号を2度伝送することは演奏時間に関して逆の意味がある。多くの場合において原記録(録音)は多重チャンネル信号のみとして表現され、2チャンネル聴取者は多重チャンネルマスターから得られるダウンミックスを与えられる。
【0027】
もし記録されたオーディオが従来のパルスコード変調(PCM)サンプルとして伝達されるならば、ディスクは多重チャンネル録音にプラスして、プレーヤーに多重チャンネル信号チャンネルの線形組合せとして2チャンネルダウンミックスを導出することを可能にする、ダウンミックス係数を有利に伝えることが出来る。例えば、2チャンネルL。及びR。からなるダウンミックスは、左前、右前、左環境、右環境、中央及び低周波効果チャンネルを含む多重チャンネルから計算され得るであろう。これらのチャンネルはマトリックス等式を用いてそれぞれLf,Rf,Ls,Rs,C及びLfe で示される。
【0028】
【式1】
【0029】
しかし、プレーヤー内でのダウンミックスの計算は損失の無い圧縮が用いられる場合には魅力が少ない。上記マトリックス式が用いられ得る前に多重チャンネルの6つのチャンネル全てが復号されなければならず、この関係で6チャンネルを復号する計算上の過負荷が極端になる。
【0030】
この問題の解決策が図1乃至3に示される。図1では、エンコーダに与えられる多重チャンネル信号は、この場合では6x6マトリックスである「マトリックス1」に供給される。同マトリックスの出力m0乃至m5は2つのサブセットに{m0,m1}及び{m2,m3,m4,m5}に分割される。これらの各サブセットは次いで「エンコーダ0」及び「エンコーダ1」によって「サブストリーム0」及び「サブストリーム1」と呼ばれる2つの独立したサブストリーム(副流れ)に符号化される。その後各サブストリームは、図に示されるように、FIFO(先入先出)バッファーを通してDVDのような媒体に供給される合成出力ストリームを生成するために「パケット化器(パケッタイザー)」内で組合 (結合) される。FIFOバッファーを用いる理由は米国特許6,023,233で論じられ、1998年9月フローレンスで開かれた高品質オーディオ符号化に関するAES第17回国際会議(ここではAES1998と称す)で提示された、M.A. Gerzon, J.R. Stuart, M.J. Law及びR. J. Wilsonの「MLP損失の無い圧縮システム」に例示されている。
【0031】
図1のエンコーダによって符号化された多重チャンネル信号を演奏するためには、図2に示すようなデコーダが用いられる。このデコーダでは、「パケット解除器(デパケッタイザー)」が、図示の通り、伝達媒体又はDVDのような記憶媒体から符号化されたストリームを受取り、符号化されたストリームを解析分解して2つのサブストリームに分離する。各サブストリームは、信号m0乃至 m5を供給するためにFIFOバッファー及び「デコーダコア」を通して送られる。これらの信号は、原多重チャンネル信号を供給するためにその後マトリックス1の逆を通される。
【0032】
2チャンネルダウンミックスを演奏するために図3に示すようなデコーダが用いられる。ここではサブストリーム0のみが保持されて各サブストリームが分離され、信号を供給するためにバッファーされると共に復号される。これらからマトリックス0は所望のL。及びR。を入手する、そこではこれを可能になるためにエンコーダがm0及びm1に正しい情報を配置していると仮定する。例えば、もし図1エンコーダのマトリックス1の頂部2列が上記2x6マトリックスのもののようなダウンミックス係数を含むならば、信号m0及びm1は必要とされるダウンミックス信号L。及びR。であろう。この場合には、図3のマトリックス0は冗長であり、同一マトリックスによって置換されるか若しくは除外される。
【0033】
本発明の区別され得る特徴は、全体を通して損失が無く、図2のデコーダから得られる信号は、多重チャンネル出力信号が図1のエンコーダに与えられる入力信号とビット毎に同一であるようにされることである。従って、もしあるならば、エンコーダ及びデコーダの各コアは無損失でなけばならずマトリックス1及びその逆も又無損失であることが求められる。損失の無いエンコーダ及びデコーダコアは無損失符号化に備える任意の方法で本質的に実施され得るが、望ましい実施形態ではこれらの処理はWO−A 96/37048に開示された処理に従って実施される。マトリックス1実施上考慮すべきことは以下に更に詳説される。
【0034】
損失の無い符号化のこの区別され得る特徴は、原多重チャンネル信号の無損失回復を可能にすると共に、さもなければ原多重チャンネル信号のみを伝達するのに要するものと本質的に同一の記憶空間及び帯域幅を用いて原信号のマトリックス化された表現又はダウンミックスの簡単な回復を可能にする形で、DVD又はその他の媒体で符号化されたストリームを回復させることを可能にする。実際の実施形態では、ダウンミックスを反転させるためにデコーダによって必要とされるか符号化されたストリームによって伝えられる追加の情報の理由及びダウンミックスを符号化するのに用いられるPMQsは符号化プロセスを最適化させるために利用できないという事実の理由で、ダウンミックスを組み入れた損失無く圧縮された信号に要する記憶空間又は帯域幅は、圧縮された多重チャンネル信号のみによって必要とされるものより非常に僅かしか高くなり得ない。
【0035】
損失無くマトリックス化を行う一方法は、縦続接続(カスケード)された基本マトリックス量子化器(PMQs)を用いることであり、それは"基本マトリックス“としてWO−A 96/37048に開示される。これらのPMQsは、反転可能な方法で他のチャンネルから得られる信号値を用いて1つのチャンネルの信号を変更するのに用いられるマトリックスである。特に、WO−A 96/37048は、逆順序の各量子化器の効果を反転することによっていかにして損失の無い逆マトリックス化がなされ得るかにつき開示している。これは図4a及び4bに例示され、それぞれエンコーダ用に縦続接続された2つのPMQs及び逆順序の2つの逆PQMsを示す。特に、2つの基本量子化器しかない簡単な状況では、信号S1、S2、S3及びS4は、Lf,Rf,Ls,Rs等のような原チャンネル、変更された信号S1’及びS2’は、L。及びR。又は 信号 m0及びm1で識別され得る。
【0036】
原信号のビット毎の逐次再構成を立証するために、図4bの量子化器Q2には図4aの量子化器Q2と同一信号が供給される。これらは同一と想定されるので同一出力q2を生成する。図4aではS2’はS2’はS2’=−q2として形成され、一方図4bでは回復S2=S2’+q2を行う。S2がこのように回復されると、図4bの量子化器Q1には図4aの量子化器Q1と同一信号が供給され、信号S1がS2と同一の方法で回復される。
【0037】
量子化器Q1及びQ2は、変更された信号S1’及びS2’のワード長が入力信号S1及びS2のそれを越えるのを防止し、情報内容が増加されないようにするために必要とされる。
【0038】
図4は簡単のために4チャンネルしか示していないが、この原理がどのようにして任意の数のチャンネルに拡張されかつどのようにして多数のPMQsカスケードで用いられ得るかは理解され得るであろう。各PMQは1つのオーディオチャンネルのみを改変し、図4では最初の2チャンネルのみが改変される。実際に、任意の又はすべてのチャンネルが変更可能であり、その順序の制限はなく、また所与のチャンネルが2回以上変更されることを禁止することもない。2チャンネルダウンミックスの場合には少なくとも最初の2チャンネルにつき変更されるのが普通であろう。
【0039】
図4の各PMQは、それが改変するチャンネルに対して1の利得を有するのが理解されるであろう。そのようなPMQsのカスケード(縦続接続)からはもっとも一般的なマトリックスを合成することは出来ない。即ち、WO−A 96/37048では、セットは1に等しい決定子を有するマトリックスに限定されると説明されている。一般的な場合には、単位の大きさを有する決定子を得るためにダウンミックス等式を尺度化(換算)することが必要である。例えば、先に示したダウンミックス等式の場合には、エンコーダのマトリックス1は下式を実行するように4/3に拡大されるべきである。
【0040】
【式2】
一方2チャンネルデコーダのマトリックス0は下式の逆換算を実行する。
【0041】
【式3】
【0042】
マトリックス0がPMQsのカスケードとして実行され得ないことは明らかである。その決定子が単位の大きさを持たないのがその理由である。原信号の無損失再構成を与えるためにはマトリックス0は不要なのでこれは問題にならない。2チャンネルデコーダが、損失無く2チャンネル原信号を復号するPMQsの厳密なカスケードとしてか若しくはダウンミックス用途のより一般的なマトリックスとして、マトリックス0を実行可能にするアーキテクチャーは図8に示され、以下に説明される。
【0043】
マトリックス0を形成するPMQs用の係数を計算するために以下の手順が採用される。例えば、検討された上記の場合にダウンミックス係数は下式で与えられる。
【0044】
【式4】
j=1乃至6に対する計算結果は下式で与えられる。
【0045】
【式5】
【式6】
j=3乃至6に対する計算結果は下式で与えられる。
【0046】
【式7】
i,jに対する図4a及び4bの係数m_coeffは下式で与えられる。
【0047】
m_coeff[i,j]=−coeffi.j
ここでは、図4aの減算のために負符号が生じる。
【0048】
図2の多重チャンネルデコーダでは、デコーダと同一値 m_coeff[i,j]を用いて、図4bにように逆マトリックス1が実行され得るが、図示のようにPMQsの順序が反転されかつ各符号化PMQの減算が加算に置換される。この場合には入力 m0乃至 m5は2つのサブストリームから得られることに注目せよ。
【0049】
これまで記載された本発明は特に圧縮の関係で関連性があるが、それは圧縮システムに限定されず一般的に用いられ得る。また、上記原理は2つのサブストリームに限定されない。 例えば、2つのサブストリームを用いて損失無く9チャンネル信号が伝えられ得る。そこでは、6チャンネルダウンミックスを復号するのに要する情報が最初の2つのサブストリームで伝えられ、2チャンネルダウンミックス(6チャンネルの線形組合せとして)を復号するのに要する情報が第1ストリームのみで伝えられる。
【0050】
現商業的用途では、Lf,Rf,Ls,Rs及びLfeの形でダウンミックス信号L。及びR。を限定するマトリックスは、概して上記例におけるようにLf及びRfを乗算する最大係数を有するであろう。しかし、優勢な係数は他信号の幾つかを乗算し得るのでこの状況は保証され得ない。もしLf及びRfの係数が実際に小さいならば、改変するチャンネルに対してPMQが単位利得を有するとの要件は、1つ又はそれ以上の他のチャンネルがそれに従って拡張されなければならないので問題が導入される。この問題を処理するためにもし上記のような単純な尺度化が用いられるならば、その結果としてマトリックスの他の係数が単位を越えて過負荷又は他の問題が発生し得る。
【0051】
この問題はエンコーダチャンネルの順序交換、即ち入替えによって処理され得る。そこでは、例えば、 そのL。の係数が最大の「第1」チャンネルが順序(シーケンス)の初めに、またそのR。の係数が最大の「第2」チャンネルが順序の2番目に来られ得るようにされる。この例では、第1及び第2チャンネルが同一ではないと想定される。通常この再順序付は、その係数が実質的に単位を越えない2つのPMQを用いることによってエンコーダでL。及びR。に比例するマトリックス化された信号m0及びm1を供給することを可能にする。
【0052】
エンコーダのこのような入替えで、図2の多重チャンネルデコーダは、正しい順序で信号を再生するために逆入替えを要するであろう。出力チャンネルの再マッピングは、符号化されたストリームのch_assignによって指示されるように、MLPデコーダにおいて与えられる。デコーダが入れ替えを用いる場合には、適切な再マッピングを特定することによって逆入替えを加えるようにそれはデコーダに指示し得る。
【0053】
もしマトリックス化の前にデコーダが入替えを用いるならば、逆入替えがデコーダのマトリックス化前に加えられる。他の可能性は、もし入替えがエンコーダでマトリックス化の後で加えられるならば、マトリックス化の前にデコーダで入替えが加えられるであろう。さらに、もしマトリックスの係数も同様に入れ替えられるならば、マトリックス化の前にMLPストリームのデコーダが入替えを用いることが可能であろう。
【0054】
確かに起こりそうもないが、上記概説した計画で処理し得ないダウンミックス仕様があり得る。一可能性は、L。及びR。が、同一又は殆ど同一の係数を有するか若しくは、言い換えると、ダウンミックスがモノラル又は殆どモノラルであり得ることである。この状況では上記手順は不充分である。それはcoeff2,1の式の分母がゼロ又は殆どゼロになり、大きな係数及び過負荷の高確率に帰着するからである。この問題は異なったm0及びm1を選ぶことによって解決される。ベクトル空間の要素としての信号に関しては、概して信号L。及びR。は6次元のユークリッドベクトル空間の2次元サブスペースに跨るか若しくは概して多重チャンネル信号のチャンネルが正規直交基準を形成するn次元ユークリッドベクトル空間に跨る。もしL。及びR。が再構成されるべきならば信号 m0及びm1はこの空間を股がなければならない。m0及びm1がL。及びR。によって跨れるサブ空間で互いに直交又は殆ど直交するように選択するのが合理的である。入力チャンネルの形でm0を決定してしまうと、これらのチャンネルはマトリックスに先立って入替えられ、そのm0の係数が最大であるか又は実質的に最大であるチャンネルが最初に来るようにされ得る。次いでPMQが上記により計算され、第1に伝達されるチャンネルが所望のm0の換算されたものになるようにされる。その後m1 の換算版を供給するようにPMQを計算することを要する。再び、係数の大きさを最少化するためには先立つ入替えが望ましいであろう。マトリックス化されるべき信号のこの入替えは、マトリックス計算の当業者には周知の「部分旋廻(パーシャルピボティング)」の処理に類似しており、ここではこれ以上説明しない。最初に、m0及びm1が任意の換算で与えられ得る。次いでマトリックスダウンミックスを、原チャンネルの形でm0及びm1を与えるマトリックスで置換することによって係数決定の上記手順が用いられ得る。この手順によって決定された係数は次いでm0及びm1の実際の尺度化を決定するであろう。
【0055】
L。及びR。が同一信号であるか又は互いに尺度化されたものである退化した場合には、L。及びR。によって跨れるサブスペースは1次元のものであろう。この場合m0はサブスペース内で任意に選ばれ、m1はm0に直交するが、サブスペースの外部から選ばれ得る。2チャンネルデコーダのマトリックス0は、それではm0の変換版としてL。及びR。を再構成してm1を無視するであろう。
【0056】
MLP無損失システムではマトリックス0の係数は、第1ストリーム、即ち、サブストリーム0で伝達され、マトリックス1の係数は全体が第2サブストリーム、即ち、サブストリーム1で伝達されが、これらの係数の幾つかは第1サブストリームから復号された信号を乗算するのに用いられる。
【0057】
データレート低減と組合ったダウンミックス符号化
マトリックス化を用いる損失の無いエンコーダはWO-A96/37048で広範に論じられ、そこではマトリックス化の目的は伝達されるチャンネル間の相関を低減させ、それによって伝達されるデータレートを低減させることである。ダウンミックスが上記のように符号化されるべき場合には、マトリックス化はダウンミックス要件によって部分的に特定されるが、仕様にはかなりの自由度が依然として残る。
【0058】
第1に、m。及びm1の選択に当たりそれらがほぼ直交されるという条件はなおL。及びR。によって跨れるサブスペース内の任意の回転を可能にする。この自由度は第1サブストリーム、即ち、サブストリーム0を最小化するために用いられ得る。例えば、2つ又はそれ以上のチャンネルの任意の信号によってとられるデータレートを最小化する、WO-A96/37048で論じられる方法を用いて最小化され得る。
【0059】
第2に、例えば6チャンネルの多重チャンネル信号を想定すると、ダウンミックスを供給するために変更されない4つのチャンネルのマトリックス化はそれでもなお完全に特定されない。再び、WO-A96/37048に記載された方法は、第2サブストリーム、即ち、サブストリーム1を符号化するのに要するデータレートを最少化するために用いられ得る。PMQ実施の場合には、ダウンミックスを得るために2つのPMQが用いられると共に任意の他の4チャンネル信号に対するのと同一方法で残りの4つのチャンネルのデータレートを最小化するために任意の残りのPMQが用いられ得る。MLP圧縮システムでは、合計で6個のPMQが入手可能であり、このタスクに4つが割当てられ得る。
【0060】
ディザー
現在オーディオ愛好家仲間ではオーディオ信号の再生に影響するあらゆる量子化がディザーを用いて行なわれることは極度に重要であると考えられる。概して、信号にはそれが量子化器に通される前に小さな擬似乱数のディザー値が信号に加えられる。例えば、S.P. Lipshitz、R.A. Wannamaker及びJ.Vanderkooyの「量子化及びディザー:理論的概説」(J.Audio Eng. Soc., May1992, vol.40, pp. 355-375)を参照せよ。
【0061】
基本マトリックス量子化器は本質的に量子化を行なう。損失のない符号化及び復号の場合にはディザーがないことは問題にならない。それはデコーダの無損失マトリックス化がエンコーダで行なわれたマトリックス化を正確に反転し、量子化の影響を全く含まないからである。しかし、上記のようにダウンミックス供給にあたりマトリックス0はマトリックス1の影響を反転せず、ダウンミックスが両マトリックスからの量子化の影響を含むであろう。
【0062】
良好なダウンミックスにさせるためには両マトリックスによってディザーが加えられなければならない。しかし、エンコーダのマトリックス1にディザーを加えることは伝達される信号に影響を与え、それによって多重チャンネル信号の復号が影響を受ける。従って、損失のない復号に対しては多重チャンネルデコーダの逆マトリックス1が符号化マトリックス化のディザーの影響を補償しなければならない。
【0063】
図5a及び5bはディザーを含む基本マトリックス量子化器の相補的対を示し、この場合には3チャンネル信号に対するものである。2つのマトリックス量子化器は、信号q1が図5aの量子化器で減算され、一方図5bの量子化器で加算され点のみで異なる。箱マークされたディザーが双方共に同一であるとすれば、図5bのPMQは図5aのPMQの作動を元に戻さないことは容易に理解されるであろう。従って、図1に示すエンコーダでは、マトリックス1が図5aに示すPMQのカスケードでありように構成され、また図2之多重チャンネルでコーダでは逆マトリックス1が図5bに示すようにPMQの逆順序にされたカスケードであるように構成され得る。これは多重チャンネル信号が損失無しに再構成されることを保証する。
【0064】
最良品質のダウンミックスを再生するためには、エンコーダのマトリックス1及びデコーダのマトリックス0の双方につきディザーに対する従来の要件が満たされなければならない。従って、例えば、エンコーダにおいては図5a及び5bのディザー発生器は、量子化器Qの2つの量子化段階に等しいピーク対ピーク振幅を有するTPDFディザーを有利に供給できるであろう。もしエンコーダの最初から2つのPMQがダウンミックス信号を供給するならば、それでは以降のPMQにディザーを追加する必要はない。
【0065】
マトリックス0は異なった型のマトリックスで良いが、それにもかかわらずそれは量子化に先立って、ワード長を増加させる計算を含み、各量子化の前にディザーを加えるのが普通である。
【0066】
図5a及び5bの符号化及び復号量子化器での同一ディザー要件は、時々ストリーム内で疑似乱数順序発生器の状態を伝える「シード(種)」を記録するエンコーダ及びシードを読んでそれによってそれ自身の発生器を同期させるデコーダによって満たされ得る。
【0067】
MLPの順序発生器は23ビット環状シフト(送り)レジスタで、下式を用いて疑似乱数2進順序(PRBS)を発生させる。
【0068】
【0069】
したがってストリームのシードは23ビット長である。シフトレジスタは各サンプル期間につき16ビットだけ送られる。これは直角PDFを有する新しい16ビット疑似乱数の数が各信号サンプルにつき発生されことを可能にする。しかし、TPDFディザーが望ましいので、16ビットは8ビットディザーサンプルに分割される。これらの8ビットサンプルはそれぞれ直角PDFを持つが、さらに2つの三角PDFを有する非相関ディザーサンプルを供給するためにこれらの2つのサンプルを加算及び減算する選択権を有する。このプロセスは「ダイヤモンドディザー」として知られ、上記引用したWannamaker 文献AES reprint no.4553に説明されている。エンコーダは、ダウンミックス信号を供給2つのPMQにディザーを加えるためにこれらの2つの三角PDFサンプルを用いることが出来る。
【0070】
オーディオ愛好家の斟酌は、ダウンミックス信号を回復するためにマトリックス0に加えられるディザーがエンコーダの対応するプロセスと同期されることは必要としない。実際、同一ディザーが加えられるか若しくはマトリックス0においてマトリックス1で用いられるディザーと相関するいかなるディザーを用いることも望ましくない。MLPではダウンミックスデコーダは多重チャンネルデコーダと同一アルゴリズムを用いてディザーを発生するが、シードが異なるのでディザーは異なる。即ち、マトリックス0用ディザーはサブストリーム0で伝えられが、マトリックス1用のシードはサブストリーム1で伝えられる。
【0071】
MLPではマトリックス0の量子化及び計算はマトリックス1に対すると丁度同じように正確に特定され、またディザーでも同様にエンコーダによって制御され、デコーダはデコーダによって復号されるL。及びR。信号につき、最後のビットまで正確な知識を有する。
【0072】
この点については以下でさらに触れる。
【0073】
ダウンミックスの飽和
デジタルチャンネルで扱い得る最大レベルでオーディオ信号を符号化することはしばしば商業的に重要であると考えられる。ライブ音楽のピークは殆ど制御されなくても良く、もし生信号のピークが過負荷を生じさせないならば平均レベルはデジタルクリッピングの十分下方に保たれなければならない。しかし、職業的録音技師は、クリッパー及びリミッターのような、波形変更用の手段を十分備えており、それはチャンネルを極めて十分に変調する「制御された信号」を生成するのを可能にすると同時にピークによる過負荷がないことを保証する。
【0074】
デジタル過負荷がラップアラウンド(文字次行送り)効果によって生じる極端に不快な人工物に帰着し得ることは理解されるであろう。例えば、従来の2の補数24ビットオーディオでは最大正値は7fffff16進法で表される。この数値を1量子化レベルだけ増加させる素朴な試みは80000016進数に帰着し、それは最大負偏位と解釈される。従って、小さな過負荷は大きな高周波エネルギー含有量を有する本格的規模の過渡変化を発生させ、それは極端に不快でしばしばツイータの焼損を起こす。
【0075】
DVDマスター製作の関係で、制御された多重チャンネルマスターが生成されて無損失符号化用に与えられることが想定される。言い換えると、多重チャンネル信号生成上のあらゆる過負荷問題が既に扱われてきたと想定される。残されたタスクは受け入れられ得るL。R。ダウンミックスを生成することである。
【0076】
図3の2チャンネルデコーダの出力における過負荷は、マトリックス0の係数を十分に定率削減することによって避けられ得る。しかしそのような定率削減には2つの問題がある。第1に必要とされる定率削減の大きさは全プログラム資料が検査されてしまうまで未知であり、それはマスター製作段階で不都合である。第2に、そのような尺度化は商業的標準により受け入れられない程度に静かな(地味な)ダウンミックスに帰着するかもしれない。これは先立って行なわれる多重チャンネル信号のクリッピング又はリミッティング(振幅制限)が、多重チャンネル信号から得られるダウンミックスのピーク対平均比率の抑制には必ずしも効果的でないからである。
【0077】
符号化段階でダウンミックスを調節するのは不可能である。その理由はこれがm0及びm1の伝達(送信)を変更させ、それでは多重チャンネル信号の回復が無損失でなくなるためであろう。
【0078】
従って、本発明はデジタル出力で扱い得るより大きい振幅のダウンミックス信号を内部的に発生させる能力を有するダウンミックスデコーダに備えると共に不快な影響なくダウンミックス信号の過負荷が扱えるように最終出力の前にリミッター又はクリッパーを内蔵するデコーダに備える。
【0079】
MLPでは、出力ワード幅は24ビットに特定され、大抵の内部信号路も同様に、各PMQ間の路を含めて、24ビット幅に特定される。しかし、デコーダの最終PMQ後に、符号化されたストリーム内で時々運ばれる“output_shift”情報によって特定される可変数ビットだけ左又は右に送るシフター(送り装置)が与えられる。もし入力と、24ビットを超えるビットを要するダウンミックスに帰着するダウンミックス仕様とがエンコーダに与えられるならば、エンコーダはマトリックス化以内での過負荷を避けるために当該ダウンミックス仕様を定率削減させる。この定率削減は2の冪によってなされ、“output_shift”情報の正の左送りを特定することによって正しい振幅がデコーダで回復され得るようにされる。デコーダのシフターはこのように正しい振幅のダウンミックス信号を発生させ、それは24ビット出力にとって大き過ぎるかもしれない。従って、先に述べた望ましくないラップラウンド影響を避けるためにシフターと出力間にクリッパーが配置される。クリッパーは多くのDSPチップで与えられる便宜を用いて好都合に実施され、それによってアッキュムレータ(累算器)の数値は「飽和計算」を用いてメモリに記憶され得る。
【0080】
もしストリームの“ch_assign情報に依存してアッキュムレータが記憶されるメモリ位置を計算し得るならば、この場合には付加的な相乗効果が生じる。これはデコーダで求められるチャンネルの逆入れ替えを、別々の作動として実行させることなく達成させる。
【0081】
LSBバイパス
もし入力信号が全24ビット範囲を用いるならば、図4及び5によりPMQを用いてチャンネルを改変する試みは、24ビット範囲を超える信号につながるかもしれない。損失のない符号化及び復号にとって内在的であるこの増大した範囲は、図6のアーキテクチャーを用いることによって24ビット計算を用いるプロセッサにさえも経済的に収容され得る。
【0082】
図6aは、その左側にシフターを組入れるPMQを示す。信号路は概して24ビット幅と想定されるが、S1から量子化された信号qを減算した後では、加算用の頭上空間(空き高)を可能にする25ビットデータ路が与えられる。次いで信号は算術的に1ビットだけ右に送られ、ワードの底から送られるLSB(最下位ビット)が主出力S1’から別に出力される。S1’は残りの24高順序ビットを含む。
【0083】
このように送り出されたLSBは勿論信号で運ばれる。信号S1、S2及びS3を復号するために信号S1’、S2及びS3と共にLSBは図6bの右側示す逆PMQに与えられるべきである。ここでLSBはS1’に追加され、その結果が1ビットだけ左に送られ、別に運ばれるLSBが送られたワードのLSBになるようにされ、それによって被量子化信号qが追加される25ビット信号を与える。この加算の結果は、S1が24ビット信号であるとの想定で、図6aに示すPMQへの入力として供給された信号S1の損失のない再生のおかげで24ビットの幅だけに止まる。
【0084】
図6aの右側及び図6bの左側に示すと通り、LSBが別に運ばれるようにバイパス路があるとの前提では、2つの相補PMQ間に24ビット幅の損失のない処理及び損失のない逆処理路をさらに挿入することが可能である。例えば、MLPエンコーダの部分構成図が図7aに、またそれに対応するデコーダが図7bに示される。脱相関器及びエントロピーコーダーが図7aのマトリックスの後に続く。従がって、この例では図6aに示す「損失のない処理」はこれらの項目を含む。同様に、図7bを参照すると、図6bに示す「逆損失のない処理」はエントロピーでコーダ及び再相関器を含み得る。図7a及び7bに示す通り、この処理に亘ってバイパスされたLSBを保持し、それを記憶しかつ符号化されたサブストリーム又はストリームからそれを回復するために注意が払われる。
【0085】
時にはMLPのマトリックス化は過負荷の原因とはならない。しかし、概して信号振幅を低減させるように設計される脱相関器は、特殊のサンプルにつき振幅を増加させ、それによって過負荷問題に遭遇する。この場合には図6aに示す型のPMQは、当該信号の振幅を低減させ、従がってさらなる処理のために約6dBの頭上空間を与えるために用いられ得る。PMQがこの目的のためにのみ用いられる場合には図6に示す係数は0に設定され得る。
【0086】
PMQから2つ以上のビットが送り出され、バイパス信号として伝達され得るように図6の構成が一般化され得ることは明らかであろう。これがMLPでなされることはない。
【0087】
図6aに示す処理は無損失であり、それに対応する図6bに示す逆無損失処理もまたぬ損失である。従がって、この処理を入れ子(次々に高次ルーチンに組込む)することが可能である。例えば、図6aの右側に示す「無損失処理」は図6aの左側に示す種類のPMQを含むことが可能で、この入れ子にされたPMQ符号化効果は、図6bの左側に示す「逆無損失処理」に図6bの右側に示す種類のPMQを含ませることによって反転され得る。この場合にはバイパスされるLSBは各段階で発生され、2つのバイパスされたLSBが任意のさらなる処理のために四方に運ばれなければならない。
【0088】
MLPエンコーダではカスケード(縦続接続)された6個までのPMQがあり、その任意のもの又はすべてがバイパスされるLSBを与えるように構成され得る。各バイパスされたLSBは異なったPMQから来るが、異なったチャンネルから来る必要性はなく、エンコーダは時々1チャンネルに2つ又はそれ以上のそのようなPMQを割当てるように選択し、このようにして当該チャンネルに対して12dB又はそれ以上の追加の頭上スペースを得ることができる。
【0089】
図6a及び6bに示すものと同等の効果を有するトポロジー(接続形態)の変形がある。図6aの信号qの減算及び図6bの信号qの加算は相互交換され得る。減算は、係数の符号を反転させることにより、もし用いられているならディザー符号を反転させることによって、また必要なら量子化器Qを調整することによって、例えば、下方に丸める量子化器を上方に丸めるものと置換することによって避けられる。他の変形物は、WO−A96/37048の図23aに示すように、側鎖の代わりに量子化器Qを順方向路に配置し、再び下方又は上方に丸める量子化器の選択に注意することである。図6bでは、S1’信号及びLSBの送りが共にS1’信号の左送りとして代わりに実施され、それによって0のLSBを生成し、次いで別に伝達されるLSBを加えるようにすることができる。この場合には別に伝達されるLSBの追加は、量子化された信号qの追加と組み合うか又はそれ以降に実施され得る。MLPに対する実施形態での追加は24ビット数を生成すべきである。
【0090】
図8はMLPに対して特定されたデコーダPMQを示し、そこでは第2チャンネルS2が変更され、3つのチャンネルS1、S2及びS3を回復するように構成される。これは上記変形物のいくつかを組入れ、さらに左送りを実行するために一般的乗算を用いる。エンコーダーは各係数値を特定してそれらをストリームに含める。このように、信号S2’ を1ビットだけ左に送るためにエンコーダは係数m_coeff[2,2]を+2と等しく設定し得る。MLPは範囲[−2,+2]の16ビットの係数を用いる。従がって、この場合には復号PMQは信号を反転させ、補償するためにエンコーダも同様に信号を反転させなければならない。
【0091】
先に述べた通り、加算及び減算によって2つのTPDFディザー信号を供給するために2つの相関していないRPDFディザー信号を有することは有利である。MLPマトリックス化では、順序発生器から得られる2つの8ビットRPDFディザー信号は24ビットに符号拡張され、それらが2つの余分なチャンネルであるかのように扱われる。これらのディザーチャンネルは決してPMQsによっては変更されない。図8のディザーは以下のように与えられることが理解されるであろう。
【0092】
m_coeff[2,4]ディザー0 + m_coeff[2,5]ディザー1
このディザーは、図6bのディザーとして確認されるものと同一である。もしm_coeff[2,4]及び m_coeff[2,5]が同一大きさを有するならば、ディザーは所望の三角PDFを有するであろう。従がって、もし、ダウンミックスを供給するために2つのPMQsが用いられるならば、エンコーダは、m_coeff[2,4]及び m_coeff[2,5]を、一方のPMQでは同一符号で特定し、他方のPMQでは反対符号で特定し、従って、既に述べた「ダイヤモンドディザー」方法によって相関のないTPDFディザー信号を供給する。
【0093】
もし我々が図8での入力信号を24ビット整数と考えるならば、乗算器からの出力値は2進点後は概して14ビットを有するであろう。それは2進点後では係数m_coeff[2,j]が14ビットに及ぶからである。当面我々は、量子化器QSSが24ビットの整数値に量子化すると想定する。この場合には、もし2つの8ビットRPDFディザー値が24ビットワードディザー0及びディザー1の形で正確に正当化されるならば、m_coeff[2,4]及び m_coeff[2,5]に対する正しい大きさは2−8である。
【0094】
もし、ダウンミックス信号に影響を与えることなくストリームのビットレートを低減させるために追加のPMQsが用いられるならば、エンコーダでディザーを用いないことが普通であり、従ってPMQのディザーチャンネルを乗算するのに用いられるm_coeff[2,j]値は0であろう。これは、すべてのPMQsにディザー能力を含めないことによって節約がなされることを示唆する。しかし、この節約はMLP実施形態ではなされない、その理由は実際の実施形態の規則正しい構成から実現される利点は一対の付加的乗算の費用より遥かに重要だからである。
【0095】
MLPでは図8によりカスケードされたPMQsがマトリックス0及びマトリックス1の双方に用いられる。マトリックス1の場合には、チャンネルの係数が変更されるのが通常であり、例示された場合ではm_coeff[2,2]は、LSBバイパスが用いられる場合には値-2を有し、LSBバイパスが用いられない場合には+1又は-1のいずれかを有するのが普通である。この選択はエンコーダによってなされ、係数はデコーダによって用いられるようにストリームに含まれる。
【0096】
ダウンミックスを再生するために2チャンネルデコーダが用いられる場合には、L。及びR。を与えるためにマトリックス0はm0及びm1信号のマトリックス化、尺度化を与える。再びデコーダの規則性及びエンコーダに対する柔軟性が図8のアーキテクチャを一様に採用する理由である。
【0097】
マトリックス0では、変更されるチャンネルの尺度化(定率換算)は、尺度化に貢献するディザー係数を除くすべての係数を尺度化することによって達成され得る。もし定率拡大を要するならば、求める尺度化が[-2,2]の利用可能な係数範囲を超える可能性があるか若しくはマトリックス化以内で信号過負荷が起こる可能性がある。これは2の冪だけ尺度化を低減させ、次いで所望のレベルを回復するために最終の「出力シフト」を用いることによって扱われ得る。
【0098】
ダウンミックスを有するMLPでは、ダウンミックスデコーダは損失のない再生を試みないので、バイパスされたLSBsを第1ストリーム、即ち、サブストリーム0で運ぶのが通常である。第2サブストリーム、即ち、サブストリーム1は多重チャンネルデコーダのマトリックス化に求められるすべての情報を伝え、それは各係数、ディザーシード及びサブストリーム0で運ばれるチャンネルから脱落されたLSBsを含むバイパスされるLSBsを含む。
【0099】
上記論議に影響しない図8の一特性は、量子化器QSSは2の冪であるステップサイズまで量子化することが可能であり、従って切頭点をLSBより1つ又はそれ以上のビット上方に設けることである。この便宜性は、24ビットワードの最少ビットを用いない入力信号の扱いを最適化するために含まれる。MLPではLSBバイパス特性は量子化ステップサイズが1に設定される時にのみ用いられる。
【0100】
ストリーム完全性及び無損失検査
損失のある符号化システムは概して入力信号の正確な再構成でない出力を供給する。完全性検査、例えば、周期的冗長性検査(CRC)又はパリテー検査は、伝送誤差にフラッグが付けられ得るように符号化された信号に限定されるべきである。入力信号及びその最終再構成物との間の関係については幾分未知であり、損失のある符号化及び復号プロセスに内在する損失の双方によると共に多分符号化プロセッサとは異なる復号プロセッサの計算作用によって生じるプラットフォーム関連誤差によって影響される。
【0101】
MLPでは、「損失のない検査」値として知られるパリティーワードが入力信号の各区分につき計算され、符号化されたストリームに含まれる。デコーダは類似のパリティーワードを計算し、もしこの計算したワードがストリームに含まれるワードと適合しないならば、誤差が起こっていることを指示することが期待される。損失のある符号化システムで可能な検査とは異なり、損失のない符号化システムでなされる検査は、アルゴリズム、プラットフォーム関連不一致及び伝送誤差以内の過負荷又は他のアルゴリズムに起因する不首尾を示すことができる。
【0102】
望ましい実施形態では、プレーヤーがそのような誤差を使用者に知らせることが可能である。例えば、2つの検査ワードが一致すると「無損失」光が点灯され、さもなければ消灯され得る。不首尾は瞬間的なので使用者がそれを認識する時間があるように、例えば、信号不首尾の受信と同時に2秒間で光が消滅されうるようにパルス拡張回路が用いられ得る。
【0103】
MLPでは損失のない検査値は、典型的に1280ワード区分以内のすべてのチャンネル及びすべてのサンプルにつき計算される8ビットパリティーワードである。この区分はMLP仕様の形で2つの連続「再スタートポイント(再開始点)」間にすべてのサンプルを含む。MLPは24ビットワードを想定するので、パリティーは当然24ビットワードとして計算されるが、このパリティーワードは3つのオクテット又はバイトに分割され、損失のない検査値を供給するためにこれらが共に排他的論理和がとられる。パリティーを計算する前に、各24ビット信号ワードはそのチャンネル数と等しいビット数だけ回転される。この回転は、2つのチャンネルに同等に影響を与える誤差がさもなければ検出されない問題を回避する。
【0104】
代替実施例は、8ビットパリティーオクテットを生成するために各チャンネルの各区分以内のすべてのオクテットのパリティーをとり、それらを共に排他的理論和する前に各パリティーオクテットをそのチャンネル数だけ回転させることである。これは24ビットワード長をもたないプロセッサについてはより経済的であり得る。
【0105】
単一サブストリームを有するMLPでは、損失のない検査値は損失なく再生される原信号に関する。MLPがダウンミックスを伝送しているとき第2サブストリームは原信号に関する損失のない検査値を伝送し、これは多重チャンネルでコーダによって検査されるであろう。
【0106】
このダウンミックスの場合では第1サブストリームもまた損失のない検査値を伝送するが、これはダウンミックスのみに関する。ダウンミックス出力は原信号の損失のない再生ではないが、それはマトリックス0の量子化が正確な仕様及びディザーの正確な仕様のおかげで決定され得る。それ故に、エンコーダはデコーダによって再生されるダウンミックスを決定し、このシミュレートされたダウンミックスから「損失のない検査」値を計算し得る。DVDオーディオマスター製作に関連して、エンコーダは試聴のために利用できるシミュレートされたダウンミックスを作るべきであることが意図され、それゆえに聴取者は、このプレーヤーで回復される信号がマスター製作技師又は録音プロデユーサによって聴取された信号とビット毎に同一であることが保証され得る。
【0107】
過負荷の場合には例外が発生し、それは既に述べたように通常プレーヤーのクリッピング又はリミッティングによって扱われる。クリッピング又はリミッティングの作用が正確に限定されないので損失のない検査値は任意の飽和又はリミッティングの直前の信号から計算される。既に述べた通り最終のPMQ後デコーダがシフターを内蔵し、飽和計算を用いてアキュムレータをメモリへ記憶することによってクリッピングを実行しうるMLPでは、損失のない検査がアキュムレータの数値から直接計算され得るので、それによってそれは飽和により影響されない。
【0108】
時には、図9に示す通り、伝送されるデータレートを低減させるために損失のないエンコーダが予備量子化器に続いて設けられ得る。予備量子化に関する追加の情報は既に引用した上記AES1997及びAES1998文献から入手し得る。これらの状況では予備量子化によって受取られる原信号の再生は無損失ではないが、予備量子化された信号の再生は無損失であろう。再び、このプレーヤーで回復される信号は、マスター製作段階で試聴されたか又は少なくとも試聴用に入手可能であった信号とビット毎に同一であることが聴取者に保証され得るように、予備量子化された信号は試聴のために利用可能にされ、また損失のない検査値は予備量子化された信号から計算されるべきである。
【0109】
エンコーダーマトリックス選択計画
2チャンネルダウンミックスを符号化するために信号m0及びm1はダウンミックスチャンネルL。及びR。によって跨れるサブスペース内になければならない。この規準内にはかなりの柔軟性があるが、ある選択では他のものより良い。エンコーダは、いくつかの理由によってm0及びm1が殆ど線形になるように選択することは避けるべきである。第1に、それではマトリックス0が多分大きな形成を有すると共に回復されたダウンミックスは雑音気味であろう。第2に、マトリックス1に含まれるPMQを決定する各式を解くに当たり、エンコーダは多分許容範囲より大きい係数を発生させるであろう。第3に、信号のマトリックス化は損失のない圧縮に対するデータレートに影響を与え、互いに極く類似する信号を別々に伝送するのは非能率である。
【0110】
既に注記したように、これら問題の最悪のものを避ける一方法は、m0及びm1が互いに直交するように選択することである。即ち、m0及びm1は列が互いに直交するマトリックスによっテ入力信号で限定される。この規準もなお幾らかの柔軟性を残し、例えば、それはL。に比例してm0をとることによって解決され得る。例えば、以下のダウンミックス仕様を考究せよ。
【0111】
【式8】
ここではL。に貢献する最大係数はLfのものであり、それは0.75と等しい値を有する。それゆえに、我々が1/0.75=1.333によって尺度化されたL。と等しいm0を発生させれば、下式が得られる、同式は第1チャンネルを無変更で放置するPMQによって実行され得る。
【0112】
【式9】
【0113】
信号m1はL。及びR。の線形結合でなければならない。L。に直交し従ってm0にも直交する線形結合は、m1(unscaled)=R。−λL。によって与えられる。ここでλは下式で表され、同式のシンボルは2つのベクトルのスカラー又はドット積を示す。
【0114】
【式10】
結果的に得られる値は、ダウンミックスマトリックス内の列ベクトルのドット積を取ることと同等である。もし、ダウンマトリックスを示すためにダウンミックスを用いるならば、スカラーλは下式で表される。同式ではdownmix1はマトリックスの第1列ベクトルを示し、downmix2はマトリックスの第2列ベクトルを示す。
【0115】
【式11】
上記例からのダウンマトリックス(λ=0.1849)を用いて下式がえられる。
【0116】
【式12】
m1を発生させる第2PMQは、第1チャンネルがLfよりはむしろm0である、第1PMQによって供給される信号を受取る。それ故にm1はm0、Rf等によって下式のように再表現されなければならない。
【0117】
【式13】
ここで最大係数、0.8000は第4入力チャンネルR5と乗算される。それゆえに、既に述べたように、第2及び第4入力チャンネルを交換するために入替えを用い、かくしてR5
を第2位置に移し、下式で示すようにm1がマトリックス出力の第2位置に現れるようにさせる。
【0118】
【式14】
最後に下式の通り、R5の係数が1になるように尺度化する。
【0119】
【式15】
これは現在第2PMQによって実行される正しい形を示す。
【0120】
上記例は、エンコーダによって採用され得るいくつかの計画の1つを示す。より簡単な計画は、上記のようにm0を計算し、そこで尺度化は別として、Lfの係数が0になるようにL0の比例部分λをR。から減算することによってm1を限定することである。この特殊な例では、原ダウンミックス仕様の希薄さはλ=0で満たされる下式の状態に帰着する。
【0121】
【式16】
第1係数の0値は、第2PMQを計算するとき第1PMQの効果を考慮する必要性を避ける。即ち、何らの変更も行うことなく上記式のLfに対してm0が置換され得る。既に説明したような尺度化及び入替えを用いることによって、第2PMQによって実行される正しい形の下式が得られる。
【0122】
【式17】
【0123】
上記簡略化された手順では直交性は達成されないが、例えば、L。及びR。それ自体が殆ど線形依存するとすれば、殆ど線形依存するm0及びm1の発生を防止することができる。L。及びR。が実際に線形依存している可能性(即ち、それらが相互の尺度化されたものである)は、特殊の場合として試験かつ取扱われなければならない。
【0124】
その代わりに、さらに進んだエンコーダでは上記直交性条件は、信号m0及びm1の相互相関がほぼゼロになるべきであるという条件によって置換えられ得る。この条件はλの適切な選択によって満たされ得る。ゼロ相互相関の条件はm1のエネルギーを最小化し、周波数依存性が無い場合これは伝送されるデータレートを最小化するのに有効であろう。WO−A 96/37048に説明されているように、スペクトル変化存在下のデータレートはエネルギーよりも情報内容により多く依存する。典型的なオーディオ信号では、エネルギー及び相互相関は、帯域幅が小さいために殆ど情報内容を持たない大きな低周波信号によって支配されるであろう。従って、相互相関を計算する前に、典型的に高周波数を強調するスペクトル加重を用いるのがよりよい。理想的にはスペクトル加重は信号それ自体に適応されるであろうが、最適又はそれに近い加重を決めるのは複雑であり、実際には固定加重で十分であろう。例えば、z変換が(1−z−1)2であるデジタルフィルタは、オーディオ帯域の低及び中間周波数部分全体に亘ってオクターブ12dBで上昇する応答を有し、これは概して大きな低周波数信号による不適当な支配を抑制するのに十分である。
【0125】
WO−A 96/37048では伝送される信号の好ましい方向は、周波数依存性のないときには信号の相関マトリックスであったマトリックスの固有ベクトルであると開示されている。そのような選択は伝送される信号間のゼロ相関につながるであろう。しかし、固有ベクトルの計算は時間がかかり、ゼロ相関が減算によって簡単に達成される上記概説された手順は、固有ベクトル計算から結果的に得られるものから理論的には殆ど変わらないデータレートにつながるものである。
【0126】
伝送される信号の方向を選択する上記手順は同様に一般的に用いられる。即ち、ダウンミックスを計算しないエンコーダ又は一度ダウンミックスが引出されてしまっている残りのチャンネルの処理にも用いられ得る。
【0127】
伝送されるチャンネルのベクトル方向が1個ずつ選ばれる手順について以下に述べる。第1チャンネルが選択され、他のチャンネルがそれから減じられ、減じられた後に残留する信号のエネルギーを最小化するように係数が選択される。基本マトリックス量子化器は減算を実行し、出力信号を供給する。次いで他の入力チャンネルが選択され、再びPMQによって他チャンネルが減じられる。PMQは次ぎの出力信号を供給し、そこでのエネルギーが最少になるように係数の選択を完了させる。同プロセスは全入力チャンネルが処理されてしまうか、入手可能な全PMQが用いられてしまうか若しくはさらなるマトリックス変換を用いる価値がないと考えられるまで反復される。PMQによって変更されなかったさらなる入力チャンネルは無変更で出力に送られる。
【0128】
この手順に関する改良は、エントロピーの何らかの量、若しくはエネルギーを単純に最小化するよりはむしろ信号の情報内容を最少にするように減算を選択することであろう。WO−A 96/37048では、エントロピーは全周波数に亘るスペクトルの全対数をとることによって評価されており、この規準に関して各最小化につきを計算することは完全に可能であろう。スペクトル的に加重されたエネルギーの最小化は計算的には集約性がより低い代替案であり、信号に依存して適切なスペクトル加重を計算する各種の方法がある。なお経済的なのは、例えば、z変換(1−z−1)2を有するデジタルフィルタによって与えられるような、固定周波数加重を用いることであろう。
【0129】
上記プロセスがベクトルの直交セットを供給するGram-Schmidt直交化を用いることに幾分類似していることは、数値計算マトリックス代数技術の当業者によって理解されるであろう。減算を考慮するとき既に処理されてしまっている各ベクトルを含めることは、それらがまだ処理されていないベクトルに直交する構成によるものなので、類推により不要と考えられる。しかしダウンミックスが符号化されているときは概してこれは事実ではなく、またエネルギーよりはむしろエントロピーの最小化であるとすれば事実ではない。従って、概して各PMQは既に処理されてしまっている信号及びこれから処理されるべき入力チャンネルの双方を減算するであろう。
【0130】
これまで変更のためにチャンネルが選択される順序は任意と考えられてきた。多くの場合において順序は最終データレートには殆ど影響しないが、それは実質的に減算での係数のサイズに影響し得る。MLPは係数を最大値2に制限しているので、この考察は重要である。もし最小化がエネルギー又は固定スペクトル加重を有するエネルギーについてであれば、これは計算的に極端に速く、試験的に任意に選択し、もし係数が大きすぎるならばそれを拒否して別のものを試験することが完全に可能である。他の発見的研究は、エネルギー又はスペクトル的に加重されたエネルギーが最少のチャンネルを変更のために選択することである。
【0131】
もし、PMQが図8のように実行されるならば、変更されるチャンネルにつき+1若しくは-1の係数を選ぶのが普通であろう。もし、減算で過負荷信号が発生されるならば、係数は低減され得る。MLPでは、上記のバイパス方法を用いてそれを-0.5に低減させるのが普通であろう。これは通常十分な追加の頭上スペース6dBを与えるであろう。もしそうでないならば、幾つかの可能性がある。現在考えられているマトリックス変換は変更又は放棄され得る。即ち、入力チャンネルは変更無しで伝送され得る。又は、もし別のPMQが利用可能ならば、それもまたLSBバイパス作動用に構成され、考慮されているチャンネルに割当てられ、さらに6dB増加された頭上空間が可能になり得る。追加のPMQは減算を実行するPMQに先立って用られるであろう。単に信号振幅を低減させるのに要する追加のPMQは、通常MLPでは-0.5の係数を変更中のチャンネルに用い、さもなければゼロ係数を有するであろう。
【0132】
2つ又は3つのPMQがチャンネル処理に必要とされる特殊の場合は、ダウンミックス仕様が実質的に幾つかの同一大きさの係数を持つところである。例えば、上記例でm0を供給するPMQは1未満のすべての係数を有するが、係数の絶対サイズの和が2.627の場合である。このように、m0を供給するPMQが、たとえLSBバイパスを用い、チャンネルを0.5だけ尺度化するとしても、ファクター1.313の信号サイズの増加がなお可能である。これが起こるのは、所与のサンプル周期で、もし入力チャンネルが同時に全変調を達成し、各々がPMQのその係数と同一符号を有するか、若しくはもし各々がその係数と反対の符号を有するときである。過負荷は、m0を供給するPMQに先立ってLSBバイパスを実行する追加のPMQを割当てることによって避けられ得る。
【0133】
簡単のために、上記記載はエンコーダによって実行されるPMQのみにつき言及している。エンコーダで用いる各PMQにつき、それは損失のないデコーダによってマトリックス1で用いられるべき対応するPMQを特定しなければならないことが理解されるであろう。LSBバイパスの場合には変更中のチャンネルに-1.5の係数を用いるエンコーダPMQは、そのチャンネルに-0.2の係数を用いるデコーダPMQを意味する。ダウンミックスの場合エンコーダは、m0及びにm1になされた選択に依存してダウンミクス0の係数を特定しなければならない。さらに、もしチャンネルが尺度化されてしまっているならば、チャンネルを乗算する後続のダウンミックス係数を計算するに当たり換算係数を考慮しなければならない。
【0134】
混合レート内容の符号化
DVDオーディオ仕様は2つのサンプリング周波数を用いてディスクで運ばれるべき録音物を考慮する。例えば、前方チャンネルLf、Rfは96kHzサンプリングレートで符号化され得るが、その一方でデータレートを低減させるために他のチャンネルは48kHzで符号化され得る。しかし、第1サブストリームでのダウンミックス情報の同時伝送についての前記記載では、チャンネルはすべて同時に、特に同一サンプリングレートでサンプリングされると想定される。
【0135】
P.G. Graven、M.J. Law及びStuartの「IIR予測フィルタを用いる損失のない圧縮」(J. Audio. Eng.Soc., Abstract, March 1997, vol. 45 no. 5, p. 404 preprint no. 4415)は、損失のない圧縮を用いるときデータを節約するためにサンプリングレートを下げる必要はないと説明している。信号の帯域幅を制限することで十分である。それは、無損失エンコーダは自動的に信号の情報内容の低下に応答してそれをより低いビットレートに符号化するからである。
【0136】
アップサンプリングされた信号は内在的に制限された帯域幅を有する。例えば、96kHzでサンプリングされた信号は殆ど48kHzに及ぶ周波数を再生する能力を有するが、そのような信号は、もしそれが48kHzサンプリング信号をアップサンプリングすることによって得られるならば、24kHzを超えると非常に小さいエネルギーを有するであろう。従って、もし「混合されたレート」の資料に無損失圧縮が用いられるならば、データレートに著しい悪影響無しにあらゆるチャンネルをアップサンプリングし得る。即ち、符号化前に、例えば、48kHzより低いレートで与えられるあらゆるチャンネルは、例えば、96kHzの同一サンプリングレートで符号化されるようにされる。この統一されたサンプルレートは本発明を実施するのに要するマトリックス操作を可能にする。
【0137】
アップサンプリングは、「デジタル信号処理」文献では「内挿法」としても知られ、それを行なう技術はよく知られている。図10はこの特性を含むようにされたエンコーダを示す。濾波が遅延を要するので、アップサンプリングを要しないチャンネルLfおよびRfには補償遅延が与えられる。
【0138】
内挿濾波は概して無損失ではないが、望ましい実施形態では図10の「アップサンプル」フィルタは「半帯域フィルタ」として知られる型のものである。内挿に用いられると、半帯域フィルタは、入力サンプリング点の2倍のサンプリング点を有する出力を供給する。偶数番号の出力点は入力点に対応しかつ入力値と同一のサンプル値を含み、一方奇数番号の出力点は各入力値間の中間点にありかつ内挿された値を含む。
【0139】
ストリームがこのように符号化されると、プレーヤーは2つの選択権を有する。それはすべてのチャンネルが元々96kHzでサンプリングされたかのようにストリームを演奏し、このように偶数および奇数サンプルの異なった起源を無視し得る。その代わりにプレーヤーは、元々48kHzでエンコーダに与えられたチャンネルの場合に偶数サンプルのみを選択し得る。この場合にはプレーヤーはエンコーダに与えられた被混合レート内容の無損失再構成を入手し得る。これを可能にするために符号化されたストリームはどのチャンネルが元々より低いサンプリングレートで与えられたかの仕様およびどのサンプルが偶数および奇数と見なされるかの指示を含まなければならない。後者は、ストリームがブロック内のサンプル数が常に偶数であるブロックを含むかどうかを意味する。DVDオーディオでは、「アクセスユニット」および「プレゼンテーションユニット」がそのような構成を与える。
【0140】
DVDオーディオ仕様は同様に88.2kHzおよび44.1kHzでの混合レート内容を規定する。上記混合レート符号化特性はこの場合に対しても同様に用いられ得る。
【0141】
実施
本発明の各種の面を実施するのに要する機能は、離散論理構成素子、1つ又はそれ以上のASIC、プログラム制御プロセッサ等広範な方法で実施される構成要素(素子)によって実行され得る。これらの構成要素が実行される方法は決定的ではない。例えば、本発明のこれらの面を実施するのに要する操作は装置によって実行され得る。同装置はデジタル情報、同情報を記憶するランダムアクセスメモリ、1つ又はそれ以上の命令プログラムを記録する媒体および命令プログラムを実行するプロセッサから成る。命令プログラムは、各種の読出し専用メモリ(ROM)、磁気テープ、磁気ディスク、光学ディスク等各種の機械読取可能な媒体又は他の製造製品によって記録され得るか若しくは超音速から紫外線周波数までのスペクトル全体に及ぶベースバンド又は変調通信路によって伝達され得る。
【0142】
符号化および復号処理並びに装置の各種特性につき以上説明されてきた。これらの特性が別々に実行され得るところでは、これらの特性によって与えられる各種利点から利益を得るために、これらの特性があらゆる組合せで合体され得ると考えられることを理解すべきである。請求の範囲は各種の特性を独立して限定しているが、全請求の範囲は互いに結合され得ると共に本開示はそのようなすべての組合せを含むことを意図する。
【図面の簡単な説明】
以下添付図面を参照して本発明の各例につき説明する。
【図1】 マトリックスを含む損失のない6チャンネルエンコーダの外観を示す。同マトリックスはマトリックス化されたチャンネルを2つのサブストリームに符号化するのに用いられ、同サブストリームは次いで単一ストリームにパッケージされてDVDに記録される。
【図2】 原6チャンネルの損失のない再構成を与えるために図1のエンコーダによって生成された2つのサブストリームを復号する多重チャンネルデコーダを示す。
【図3】 2チャンネルダウンミックスを供給するためにのみ第1サブストリームを復号する2チャンネルデコーダを示す。
【図4】 図4aは4チャンネル信号の2チャンネルを変更する縦続された2つの基本マトリックス量子化器を示す。図4bは図4aの処理を反転するよう構成された類似の縦続された2つの基本マトリックス量子化器を示す。
【図5】 図5aはディザーを組み入れた基本マトリックス量子化器を示す。図5bはディザーを組み入れた基本マトリックス量子化器を示す。
【図6】 図6aは「LSBバイパス」の便宜及びさらなる損失のない処理の場合にバイパスされたものの独立した伝達を与えるために変更された基本マトリックス量子化器を示す。図6bは図6aと相補的であり、さらなる損失のない処理の場合にバイパスされたLSBの単独の伝達及バイパスされたLSBを集積して原信号を再構成する基本マトリックス量子化器を示す。
【図7】 図7aはLSBバイパスを有するKLPエンコーダの一実施形態の部分的構成図である。図7bは図7aのエンコーダと相補であるデコーダの一実施形態を示す。
【図8】 MLPデコーダの一実施形態で用いられるように特定された基本マトリックス量子化器を示す。
【図9】 試聴用の出力及び予備量子化された出力から計算された「無損失検査」値を有する予備量子化器に先行する損失のないエンコーダを示す。
【図10】 48kHz及び96kHzにおいて混合レートの信号サンプルを符号化する、アップサンプラーによって先行される損失のないエンコーダを含む装置を示す。
Claims (30)
- N個の入力チャンネル信号を取得するステップと、
N個のマトリックス出力チャンネル信号を出力するために、縦続接続された基本マトリックス量子化器として実行されるマトリックスにより前記入力チャンネル信号を変換するステップと、
前記入力チャンネル信号から導き出したチャンネル順序づけ情報に応答して、前記マトリックス出力チャンネル信号に対応するN個のデコーディング出力チャンネル信号を順序づけするステップと、
を具備するデコーディング方法。 - 前記順序づけするステップは、前記変換するステップの後に行われることを特徴とする請求項1に記載の方法。
- 前記順序づけするステップは、前記変換するステップの前に行われることを特徴とする請求項1に記載の方法。
- 前記入力チャンネル信号は、左前方、右前方、左環境、右環境、中央及び低周波効果チャンネルを表すことを特徴とする請求項1乃至請求項3のいずれか1項に記載の方法。
- 前記縦続接続された基本マトリックス量子化器中の1つの基本マトリックス量子化器は、前記入力チャンネル信号の1つに対応する第1のチャンネル信号を処理する第1の基本マトリックス量子化器であり、
前記第1の基本マトリックス量子化器において、前記第1のチャンネル信号に前記入力チャンネル信号から取得した利得係数を乗算するステップと、
前記乗算がなされた第1のチャンネル信号と前記入力チャンネル信号から取得した1以上の最下位ビットとを結合するステップと、
を具備することを特徴とする請求項1乃至請求項4のいずれか1項に記載の方法。 - N個の符号化された入力チャンネル信号を取得するステップと、
N個のマトリックス出力チャンネル信号を出力するために、縦続接続された基本マトリックス量子化器として実行されるマトリックスにより前記入力チャンネル信号を変換するステップと、
チャンネル順序づけ情報に応答して、前記マトリックス出力チャンネル信号に対応するN個のエンコーディング出力チャンネル信号を順序づけするステップと、
前記エンコーディング出力チャンネル信号と前記チャンネル順序づけ情報とを表す情報を伝達する複数のサブストリームを生成するステップであって、第1のサブストリームは、前記マトリックス出力チャンネル信号の精密なサブセットを表しダウンミックス仕様を含有することを特徴とするステップと、
を具備するエンコーディング方法。 - 前記ダウンミックス仕様から前記チャンネル順序づけ情報を導き出すことを特徴とする請求項6に記載の方法。
- 前記ダウンミックス仕様中の最大の係数を有するチャンネル信号が前記第1のサブストリーム中に表された第1のチャンネル信号になるように順序づけられた、前記チャンネル順序づけ情報を導き出すことを特徴とする請求項7に記載の方法。
- 前記第2のサブストリームが損失無く圧縮されるような修正を、前記複数のサブストリーム中の第2のサブストリーム中に表されたチャンネル信号に行うために、前記縦続接続された基本マトリックス量子化器中の基本マトリックス量子化器を適用することを特徴とする請求項6乃至請求項8のいずれか1項に記載の方法。
- 前記縦続接続された基本マトリックス量子化器中の1つの基本マトリックス量子化器は、前記入力チャンネル信号の1つに応答する第1のチャンネル信号を処理する第1の基本マトリックス量子化器であり、
前記第1の基本マトリックス量子化器において、前記第1のチャンネル信号に利得係数を乗算するステップと、
前記利得係数と、前記第1のチャンネル信号に乗算演算を行った結果生じた、前記第1のチャンネルに配置されたビット数を越えた1以上の最下位ビットとを含めるために複数のサブストリームを生成するステップと、
を具備することを特徴とする請求項6乃至請求項9のいずれか1項に記載の方法。 - 命令プログラムを記録したコンピュータ読み取り可能な記録媒体であって、該命令プログラムをコンピュータに実行させることにより、該コンピュータに、
N個の入力チャンネル信号を取得するステップと、
N個のマトリックス出力チャンネル信号を出力するために、縦続接続された基本マトリックス量子化器として実行されるマトリックスにより前記入力チャンネル信号を変換するステップと、
前記入力チャンネル信号から導き出したチャンネル順序づけ情報に応答して、前記マトリックス出力チャンネル信号に対応するN個のデコーディング出力チャンネル信号を順序づけするステップと、
を具備するデコーディング方法を実行させることができることを特徴とする、コンピュータ読み取り可能な記録媒体。 - 前記順序づけするステップは、前記変換するステップの後に行われることを特徴とする請求項11に記載のコンピュータ読み取り可能な記録媒体。
- 前記順序づけするステップは、前記変換するステップの前に行われることを特徴とする請求項11に記載のコンピュータ読み取り可能な記録媒体。
- 前記入力チャンネル信号は、左前方、右前方、左環境、右環境、中央及び低周波効果チャンネルを表すことを特徴とする請求項11乃至請求項13のいずれか1項に記載のコンピュータ読み取り可能な記録媒体。
- 前記縦続接続された基本マトリックス量子化器中の1つの基本マトリックス量子化器は、前記入力チャンネル信号の1つに対応する第1のチャンネル信号を処理する第1の基本マトリックス量子化器であり、
前記第1の基本マトリックス量子化器において、前記第1のチャンネル信号に前記入力チャンネル信号から取得した利得係数を乗算するステップと、
前記乗算がなされた第1のチャンネル信号と前記入力チャンネル信号から取得した1以上の最下位ビットとを結合するステップと、
を具備することを特徴とする請求項11乃至請求項14のいずれか1項に記載のコンピュータ読み取り可能な記録媒体。 - 命令プログラムを記録したコンピュータ読み取り可能な記録媒体であって、該命令プログラムをコンピュータに実行させることにより、該コンピュータに、
N個の符号化された入力チャンネル信号を取得するステップと、
N個のマトリックス出力チャンネル信号を出力するために、縦続接続された基本マトリックス量子化器として実行されるマトリックスにより前記入力チャンネル信号を変換するステップと、
チャンネル順序づけ情報に応答して、前記マトリックス出力チャンネル信号に対応するN個のエンコーディング出力チャンネル信号を順序づけするステップと、
前記エンコーディング出力チャンネル信号と前記チャンネル順序づけ情報とを表す情報を伝達する複数のサブストリームを生成するステップであって、第1のサブストリームは、前記マトリックス出力チャンネル信号の精密なサブセットを表しダウンミックス仕様を含有することを特徴とするステップと、
を具備するエンコーディング方法を実行させることができることを特徴とする、コンピュータ読み取り可能な記録媒体。 - 前記エンコーディング方法は、前記ダウンミックス仕様から前記チャンネル順序づけ情報を導き出すことを特徴とする請求項16に記載のコンピュータ読み取り可能な記録媒体。
- 前記エンコーディング方法は、前記ダウンミックス仕様中の最大の係数を有するチャンネル信号が前記第1のサブストリーム中に表された第1のチャンネル信号になるように順序づけられた、前記チャンネル順序づけ情報を導き出すことを特徴とする請求項17に記載のコンピュータ読み取り可能な記録媒体。
- 前記エンコーディング方法は、前記第2のサブストリームが損失無く圧縮されるような修正を、前記複数のサブストリーム中の第2のサブストリーム中に表されたチャンネル信号に行うために、前記縦続接続された基本マトリックス量子化器中の基本マトリックス量子化器を適用することを特徴とする請求項16乃至請求項18のいずれか1項に記載のコンピュータ読み取り可能な記録媒体。
- 前記縦続接続された基本マトリックス量子化器中の1つの基本マトリックス量子化器は、前記入力チャンネル信号の1つに応答する第1のチャンネル信号を処理する第1の基本マトリックス量子化器であり、
前記第1の基本マトリックス量子化器において、前記第1のチャンネル信号に利得係数を乗算するステップと、
前記利得係数と、前記第1のチャンネル信号に乗算演算を行った結果生じた、前記第1のチャンネルに配置されたビット数を越えた1以上の最下位ビットとを含めるために複数のサブストリームを生成するステップと、
を具備することを特徴とする請求項16乃至請求項19のいずれか1項に記載のコンピュータ読み取り可能な記録媒体。 - N個の入力チャンネル信号を取得する手段と、
N個のマトリックス出力チャンネル信号を出力するために、縦続接続された基本マトリックス量子化器として実行されるマトリックスにより前記入力チャンネル信号を変換する手段と、
前記入力チャンネル信号から導き出したチャンネル順序づけ情報に応答して、前記マトリックス出力チャンネル信号に対応するN個のデコーディング出力チャンネル信号を順序づけする手段と、
を具備する装置。 - 前記順序づけするステップは、前記変換するステップの後に行われることを特徴とする請求項21に記載の装置。
- 前記順序づけするステップは、前記変換するステップの前に行われることを特徴とする請求項21に記載の装置。
- 前記入力チャンネル信号は、左前方、右前方、左環境、右環境、中央及び低周波効果チャンネルを表すことを特徴とする請求項21乃至請求項23のいずれか1項に記載の装置。
- 前記縦続接続された基本マトリックス量子化器中の1つの基本マトリックス量子化器は、前記入力チャンネル信号の1つに対応する第1のチャンネル信号を処理する第1の基本マトリックス量子化器であり、前記装置は、
前記第1の基本マトリックス量子化器において、前記第1のチャンネル信号に前記入力チャンネル信号から取得した利得係数を乗算する手段と、
前記乗算がなされた第1のチャンネル信号と前記入力チャンネル信号から取得した1以上の最下位ビットとを結合する手段と、
を具備することを特徴とする請求項21乃至請求項24のいずれか1項に記載の装置。 - N個の符号化された入力チャンネル信号を取得する手段と、
N個のマトリックス出力チャンネル信号を出力するために、縦続接続された基本マトリックス量子化器として実行されるマトリックスにより前記入力チャンネル信号を変換する手段と、
チャンネル順序づけ情報に応答して、前記マトリックス出力チャンネル信号に対応するN個のエンコーディング出力チャンネル信号を順序づけする手段と、
前記エンコーディング出力チャンネル信号と前記チャンネル順序づけ情報とを表す情報を伝達する複数のサブストリームを生成するステップであって、第1のサブストリームは、前記マトリックス出力チャンネル信号の精密なサブセットを表しダウンミックス仕様を含有することを特徴とする手段と、
を具備する装置。 - 前記ダウンミックス仕様から前記チャンネル順序づけ情報を導き出すことを特徴とする請求項26に記載の装置。
- 前記ダウンミックス仕様中の最大の係数を有するチャンネル信号が前記第1のサブストリーム中に表された第1のチャンネル信号になるように順序づけられた、前記チャンネル順序づけ情報を導き出すことを特徴とする請求項27に記載の装置。
- 前記第2のサブストリームが損失無く圧縮されるような修正を、前記複数のサブストリーム中の第2のサブストリーム中に表されたチャンネル信号に行うために、前記縦続接続された基本マトリックス量子化器中の基本マトリックス量子化器を適用することを特徴とする請求項26乃至請求項28のいずれか1項に記載の装置。
- 前記縦続接続された基本マトリックス量子化器中の1つの基本マトリックス量子化器は、前記入力チャンネル信号の1つに応答する第1のチャンネル信号を処理する第1の基本マトリックス量子化器であり、前記装置は、
前記第1の基本マトリックス量子化器において、前記第1のチャンネル信号に利得係数を乗算する手段と、
前記利得係数と、前記第1のチャンネル信号に乗算演算を行った結果生じた、前記第1のチャンネルに配置されたビット数を越えた1以上の最下位ビットとを含めるために複数のサブストリームを生成する手段と、
を具備することを特徴とする請求項26乃至請求項29のいずれか1項に記載の装置。
Applications Claiming Priority (5)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
GBGB9907918.8A GB9907918D0 (en) | 1999-04-07 | 1999-04-07 | Lossless packing |
GB9907918.8 | 1999-04-07 | ||
GB9907919.6 | 1999-04-07 | ||
GBGB9907919.6A GB9907919D0 (en) | 1999-04-07 | 1999-04-07 | Lossless packing |
PCT/GB2000/001308 WO2000060746A2 (en) | 1999-04-07 | 2000-04-07 | Matrixing for losseless encoding and decoding of multichannels audio signals |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2002541524A JP2002541524A (ja) | 2002-12-03 |
JP2002541524A5 JP2002541524A5 (ja) | 2007-06-07 |
JP4610087B2 true JP4610087B2 (ja) | 2011-01-12 |
Family
ID=26315389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000610131A Expired - Lifetime JP4610087B2 (ja) | 1999-04-07 | 2000-04-07 | 損失のない符号化・復号へのマトリックス改良 |
Country Status (15)
Country | Link |
---|---|
US (3) | US6611212B1 (ja) |
EP (4) | EP1370114A3 (ja) |
JP (1) | JP4610087B2 (ja) |
KR (1) | KR100915120B1 (ja) |
AR (1) | AR023424A1 (ja) |
AT (1) | ATE255785T1 (ja) |
AU (1) | AU781629B2 (ja) |
CA (3) | CA2742649C (ja) |
DE (1) | DE60006953T2 (ja) |
DK (1) | DK1173925T3 (ja) |
ES (1) | ES2208297T3 (ja) |
MY (2) | MY149792A (ja) |
SG (2) | SG144695A1 (ja) |
TW (1) | TWI226041B (ja) |
WO (1) | WO2000060746A2 (ja) |
Families Citing this family (114)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
SE0001727L (sv) * | 2000-05-10 | 2001-11-11 | Global Ip Sound Ab | Överföring över paketförmedlade nät |
JP2001314181A (ja) * | 2000-05-10 | 2001-11-13 | Mi Tec:Kk | キレート化合物含有酒類 |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7447321B2 (en) | 2001-05-07 | 2008-11-04 | Harman International Industries, Incorporated | Sound processing system for configuration of audio signals in a vehicle |
US6804565B2 (en) * | 2001-05-07 | 2004-10-12 | Harman International Industries, Incorporated | Data-driven software architecture for digital sound processing and equalization |
US7451006B2 (en) * | 2001-05-07 | 2008-11-11 | Harman International Industries, Incorporated | Sound processing system using distortion limiting techniques |
US20020191522A1 (en) * | 2001-05-07 | 2002-12-19 | Media Tek, Inc. | DVD audio encoder and decoder |
CN100364234C (zh) * | 2001-11-29 | 2008-01-23 | 联发科技股份有限公司 | 声讯的播放系统与无失真压缩编码系统 |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
WO2003093775A2 (en) * | 2002-05-03 | 2003-11-13 | Harman International Industries, Incorporated | Sound detection and localization system |
US6935959B2 (en) * | 2002-05-16 | 2005-08-30 | Microsoft Corporation | Use of multiple player real-time voice communications on a gaming device |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
US7299190B2 (en) | 2002-09-04 | 2007-11-20 | Microsoft Corporation | Quantization and inverse quantization for audio |
JP4676140B2 (ja) * | 2002-09-04 | 2011-04-27 | マイクロソフト コーポレーション | オーディオの量子化および逆量子化 |
DK1716722T3 (da) * | 2003-11-27 | 2008-08-18 | Yul Anderson | Hovedtelefon |
US7460990B2 (en) | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
JP2005215162A (ja) * | 2004-01-28 | 2005-08-11 | Dainippon Printing Co Ltd | 音響信号の再生装置 |
DE102004009628A1 (de) * | 2004-02-27 | 2005-10-06 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Beschreiben einer Audio-CD und Audio-CD |
CA2992097C (en) | 2004-03-01 | 2018-09-11 | Dolby Laboratories Licensing Corporation | Reconstructing audio signals with multiple decorrelation techniques and differentially coded parameters |
US7813513B2 (en) * | 2004-04-05 | 2010-10-12 | Koninklijke Philips Electronics N.V. | Multi-channel encoder |
US8032360B2 (en) * | 2004-05-13 | 2011-10-04 | Broadcom Corporation | System and method for high-quality variable speed playback of audio-visual media |
KR100918741B1 (ko) * | 2004-07-27 | 2009-09-24 | 삼성전자주식회사 | 이동 통신 시스템에서 채널 부호화 장치 및 방법 |
US7706415B2 (en) * | 2004-07-29 | 2010-04-27 | Microsoft Corporation | Packet multiplexing multi-channel audio |
US7930184B2 (en) * | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
SE0402649D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Advanced methods of creating orthogonal signals |
US7809580B2 (en) * | 2004-11-04 | 2010-10-05 | Koninklijke Philips Electronics N.V. | Encoding and decoding of multi-channel audio signals |
EP1817767B1 (en) * | 2004-11-30 | 2015-11-11 | Agere Systems Inc. | Parametric coding of spatial audio with object-based side information |
KR100682904B1 (ko) | 2004-12-01 | 2007-02-15 | 삼성전자주식회사 | 공간 정보를 이용한 다채널 오디오 신호 처리 장치 및 방법 |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
EP1691348A1 (en) * | 2005-02-14 | 2006-08-16 | Ecole Polytechnique Federale De Lausanne | Parametric joint-coding of audio sources |
MX2007011915A (es) | 2005-03-30 | 2007-11-22 | Koninkl Philips Electronics Nv | Codificacion de audio multicanal. |
DE102005014477A1 (de) * | 2005-03-30 | 2006-10-12 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Vorrichtung und Verfahren zum Erzeugen eines Datenstroms und zum Erzeugen einer Multikanal-Darstellung |
US7751572B2 (en) | 2005-04-15 | 2010-07-06 | Dolby International Ab | Adaptive residual audio coding |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US8170883B2 (en) * | 2005-05-26 | 2012-05-01 | Lg Electronics Inc. | Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal |
WO2006126843A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US7958424B2 (en) * | 2005-06-22 | 2011-06-07 | Trident Microsystems (Far East) Ltd. | Multi-channel LDPC decoder architecture |
CA2613731C (en) * | 2005-06-30 | 2012-09-18 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
EP1908057B1 (en) * | 2005-06-30 | 2012-06-20 | LG Electronics Inc. | Method and apparatus for decoding an audio signal |
US8494667B2 (en) * | 2005-06-30 | 2013-07-23 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US7562021B2 (en) * | 2005-07-15 | 2009-07-14 | Microsoft Corporation | Modification of codewords in dictionary used for efficient coding of digital media spectral data |
US7630882B2 (en) * | 2005-07-15 | 2009-12-08 | Microsoft Corporation | Frequency segmentation to obtain bands for efficient coding of digital media |
JP4859925B2 (ja) * | 2005-08-30 | 2012-01-25 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
ATE455348T1 (de) * | 2005-08-30 | 2010-01-15 | Lg Electronics Inc | Vorrichtung und verfahren zur dekodierung eines audiosignals |
JP4568363B2 (ja) * | 2005-08-30 | 2010-10-27 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
US7788107B2 (en) * | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
WO2007027055A1 (en) | 2005-08-30 | 2007-03-08 | Lg Electronics Inc. | A method for decoding an audio signal |
US7770090B1 (en) | 2005-09-14 | 2010-08-03 | Trident Microsystems (Far East) Ltd. | Efficient decoders for LDPC codes |
JP5478826B2 (ja) * | 2005-10-03 | 2014-04-23 | シャープ株式会社 | 表示装置 |
US7751485B2 (en) * | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
US7672379B2 (en) * | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
CN101283249B (zh) * | 2005-10-05 | 2013-12-04 | Lg电子株式会社 | 信号处理的方法和装置以及编码和解码方法及其装置 |
US7646319B2 (en) * | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7696907B2 (en) * | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
KR100878833B1 (ko) * | 2005-10-05 | 2009-01-14 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US8073703B2 (en) * | 2005-10-07 | 2011-12-06 | Panasonic Corporation | Acoustic signal processing apparatus and acoustic signal processing method |
US7974713B2 (en) | 2005-10-12 | 2011-07-05 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Temporal and spatial shaping of multi-channel audio signals |
KR100866885B1 (ko) * | 2005-10-20 | 2008-11-04 | 엘지전자 주식회사 | 멀티채널 오디오 신호의 부호화 및 복호화 방법과 그 장치 |
US7653533B2 (en) * | 2005-10-24 | 2010-01-26 | Lg Electronics Inc. | Removing time delays in signal paths |
US8238561B2 (en) | 2005-10-26 | 2012-08-07 | Lg Electronics Inc. | Method for encoding and decoding multi-channel audio signal and apparatus thereof |
US7752053B2 (en) | 2006-01-13 | 2010-07-06 | Lg Electronics Inc. | Audio signal processing using pilot based coding |
US8411869B2 (en) * | 2006-01-19 | 2013-04-02 | Lg Electronics Inc. | Method and apparatus for processing a media signal |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7953604B2 (en) * | 2006-01-20 | 2011-05-31 | Microsoft Corporation | Shape and scale parameters for extended-band frequency coding |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US9306852B2 (en) * | 2006-01-27 | 2016-04-05 | Avaya Inc. | Coding and packet distribution for alternative network paths in telecommunications networks |
KR100878816B1 (ko) * | 2006-02-07 | 2009-01-14 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
US7907579B2 (en) * | 2006-08-15 | 2011-03-15 | Cisco Technology, Inc. | WiFi geolocation from carrier-managed system geolocation of a dual mode device |
SG175632A1 (en) | 2006-10-16 | 2011-11-28 | Dolby Sweden Ab | Enhanced coding and parameter representation of multichannel downmixed object coding |
JP5337941B2 (ja) | 2006-10-16 | 2013-11-06 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネル・パラメータ変換のための装置および方法 |
US20080175137A1 (en) * | 2007-01-23 | 2008-07-24 | Mediatek Inc. | Method for encoding data written to optical storage media |
US7761290B2 (en) | 2007-06-15 | 2010-07-20 | Microsoft Corporation | Flexible frequency and time partitioning in perceptual transform coding of audio |
US8046214B2 (en) * | 2007-06-22 | 2011-10-25 | Microsoft Corporation | Low complexity decoder for complex transform coding of multi-channel sound |
US7885819B2 (en) * | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
WO2009049895A1 (en) * | 2007-10-17 | 2009-04-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio coding using downmix |
US8249883B2 (en) * | 2007-10-26 | 2012-08-21 | Microsoft Corporation | Channel extension coding for multi-channel source |
KR101158096B1 (ko) * | 2008-11-18 | 2012-06-22 | 삼성전자주식회사 | 다중 송수신 안테나 시스템에서 서로 다른 변조 차수를 갖는 복수의 레이어의 재정렬 방법, 신호 검출 방법 및 그 수신 장치 |
GB2466675B (en) * | 2009-01-06 | 2013-03-06 | Skype | Speech coding |
GB2466671B (en) | 2009-01-06 | 2013-03-27 | Skype | Speech encoding |
GB2466673B (en) | 2009-01-06 | 2012-11-07 | Skype | Quantization |
RU2576476C2 (ru) | 2009-09-29 | 2016-03-10 | Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф., | Декодер аудиосигнала, кодер аудиосигнала, способ формирования представления сигнала повышающего микширования, способ формирования представления сигнала понижающего микширования, компьютерная программа и бистрим, использующий значение общего параметра межобъектной корреляции |
WO2011071928A2 (en) * | 2009-12-07 | 2011-06-16 | Pixel Instruments Corporation | Dialogue detector and correction |
US9138178B2 (en) * | 2010-08-05 | 2015-09-22 | Ace Communications Limited | Method and system for self-managed sound enhancement |
KR101756838B1 (ko) * | 2010-10-13 | 2017-07-11 | 삼성전자주식회사 | 다채널 오디오 신호를 다운 믹스하는 방법 및 장치 |
EP2477188A1 (en) * | 2011-01-18 | 2012-07-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Encoding and decoding of slot positions of events in an audio signal frame |
EP2695161B1 (en) | 2011-04-08 | 2014-12-17 | Dolby Laboratories Licensing Corporation | Automatic configuration of metadata for use in mixing audio programs from two encoded bitstreams |
TWI671736B (zh) | 2011-10-21 | 2019-09-11 | 南韓商三星電子股份有限公司 | 對信號的包絡進行寫碼的設備及對其進行解碼的設備 |
GB2524424B (en) | 2011-10-24 | 2016-04-27 | Graham Craven Peter | Lossless buried data |
JP5930441B2 (ja) | 2012-02-14 | 2016-06-08 | ホアウェイ・テクノロジーズ・カンパニー・リミテッド | マルチチャネルオーディオ信号の適応ダウン及びアップミキシングを実行するための方法及び装置 |
ITTO20120274A1 (it) * | 2012-03-27 | 2013-09-28 | Inst Rundfunktechnik Gmbh | Dispositivo per il missaggio di almeno due segnali audio. |
TWI505262B (zh) | 2012-05-15 | 2015-10-21 | Dolby Int Ab | 具多重子流之多通道音頻信號的有效編碼與解碼 |
EP2862370B1 (en) | 2012-06-19 | 2017-08-30 | Dolby Laboratories Licensing Corporation | Rendering and playback of spatial audio using channel-based audio systems |
WO2014011487A1 (en) * | 2012-07-12 | 2014-01-16 | Dolby Laboratories Licensing Corporation | Embedding data in stereo audio using saturation parameter modulation |
BR112015002367B1 (pt) * | 2012-08-03 | 2021-12-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung Ev | Decodificador e método para codificação de objeto de áudio espacial multi-instância empregando um conceito paramétrico para caixas multicanal de downmix/upmix |
WO2014035864A1 (en) | 2012-08-31 | 2014-03-06 | Dolby Laboratories Licensing Corporation | Processing audio objects in principal and supplementary encoded audio signals |
EP2956899A4 (en) | 2013-02-14 | 2016-09-21 | Howard M Singer | METHODS, SYSTEMS AND MEDIA FOR INDICATING QUALITY OF DIGITAL MEDIA CONTENT TO A USER |
KR102033304B1 (ko) | 2013-05-24 | 2019-10-17 | 돌비 인터네셔널 에이비 | 오디오 오브젝트들을 포함한 오디오 장면들의 효율적 코딩 |
TWI557724B (zh) * | 2013-09-27 | 2016-11-11 | 杜比實驗室特許公司 | 用於將 n 聲道音頻節目編碼之方法、用於恢復 n 聲道音頻節目的 m 個聲道之方法、被配置成將 n 聲道音頻節目編碼之音頻編碼器及被配置成執行 n 聲道音頻節目的恢復之解碼器 |
EP2854133A1 (en) | 2013-09-27 | 2015-04-01 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Generation of a downmix signal |
EP3134897B1 (en) * | 2014-04-25 | 2020-05-20 | Dolby Laboratories Licensing Corporation | Matrix decomposition for rendering adaptive audio using high definition audio codecs |
CN106463125B (zh) * | 2014-04-25 | 2020-09-15 | 杜比实验室特许公司 | 基于空间元数据的音频分割 |
US10089991B2 (en) * | 2014-10-03 | 2018-10-02 | Dolby International Ab | Smart access to personalized audio |
US10176813B2 (en) | 2015-04-17 | 2019-01-08 | Dolby Laboratories Licensing Corporation | Audio encoding and rendering with discontinuity compensation |
TWI596955B (zh) * | 2015-07-09 | 2017-08-21 | 元鼎音訊股份有限公司 | 具有測試功能之助聽器 |
US11183202B2 (en) | 2015-07-28 | 2021-11-23 | Dolby Laboratories Licensing Corporation | Audio discontinuity detection and correction |
GB2547877B (en) * | 2015-12-21 | 2019-08-14 | Graham Craven Peter | Lossless bandsplitting and bandjoining using allpass filters |
US10146500B2 (en) * | 2016-08-31 | 2018-12-04 | Dts, Inc. | Transform-based audio codec and method with subband energy smoothing |
MX2019005147A (es) | 2016-11-08 | 2019-06-24 | Fraunhofer Ges Forschung | Aparato y metodo para codificar o decodificar una se?al multicanal usando una ganancia lateral y una ganancia residual. |
US10522155B2 (en) | 2017-02-21 | 2019-12-31 | Cirrus Logic, Inc. | Pulse code modulation (PCM) data-marking |
TWI739297B (zh) * | 2020-02-06 | 2021-09-11 | 瑞昱半導體股份有限公司 | 音訊處理裝置及音訊處理方法 |
WO2023191796A1 (en) * | 2022-03-31 | 2023-10-05 | Zeku, Inc. | Apparatus and method for data compression and data upsampling |
GB2624686A (en) * | 2022-11-25 | 2024-05-29 | Lenbrook Industries Ltd | Improvements to audio coding |
Family Cites Families (15)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
DE4113506A1 (de) * | 1991-04-25 | 1992-10-29 | Thomson Brandt Gmbh | Verfahren zur kompatiblen uebertragung von progressiv abgetasteten bildsignalen im zwischenzeilen-format |
US5396228A (en) * | 1992-01-16 | 1995-03-07 | Mobile Telecommunications Technologies | Methods and apparatus for compressing and decompressing paging data |
EP0631458B1 (en) * | 1993-06-22 | 2001-11-07 | Deutsche Thomson-Brandt Gmbh | Method for obtaining a multi-channel decoder matrix |
US5684714A (en) * | 1995-05-08 | 1997-11-04 | Kabushiki Kaisha Toshiba | Method and system for a user to manually alter the quality of a previously encoded video sequence |
US5623424A (en) * | 1995-05-08 | 1997-04-22 | Kabushiki Kaisha Toshiba | Rate-controlled digital video editing method and system which controls bit allocation of a video encoder by varying quantization levels |
GB9509831D0 (en) * | 1995-05-15 | 1995-07-05 | Gerzon Michael A | Lossless coding method for waveform data |
EP0784409A3 (en) * | 1996-01-11 | 2001-11-14 | Sony Corporation | Video coding and multiplexing |
US5731837A (en) * | 1996-01-25 | 1998-03-24 | Thomson Multimedia, S.A. | Quantization circuitry as for video signal compression systems |
US5715187A (en) * | 1996-03-04 | 1998-02-03 | Holtek Microelectronics, Inc. | Method and apparatus for integer multiplication |
US5839100A (en) * | 1996-04-22 | 1998-11-17 | Wegener; Albert William | Lossless and loss-limited compression of sampled data signals |
US5832490A (en) * | 1996-05-31 | 1998-11-03 | Siemens Medical Systems, Inc. | Lossless data compression technique that also facilitates signal analysis |
US5848106A (en) * | 1996-12-16 | 1998-12-08 | Ericsson, Inc. | Receiver decoder circuitry, and associated method, for decoding an encoded signal |
GB2323754B (en) * | 1997-01-30 | 2002-03-20 | Peter Graham Craven | Lossless compression using iir prediction filters |
KR100251453B1 (ko) * | 1997-08-26 | 2000-04-15 | 윤종용 | 고음질 오디오 부호화/복호화장치들 및 디지털다기능디스크 |
US6023233A (en) * | 1998-03-20 | 2000-02-08 | Craven; Peter G. | Data rate control for variable rate compression systems |
-
2000
- 2000-04-07 DK DK00917191T patent/DK1173925T3/da active
- 2000-04-07 US US09/958,200 patent/US6611212B1/en not_active Expired - Lifetime
- 2000-04-07 EP EP03020421A patent/EP1370114A3/en not_active Withdrawn
- 2000-04-07 MY MYPI20045076A patent/MY149792A/en unknown
- 2000-04-07 CA CA2742649A patent/CA2742649C/en not_active Expired - Lifetime
- 2000-04-07 KR KR1020017012853A patent/KR100915120B1/ko active IP Right Grant
- 2000-04-07 AR ARP000101618A patent/AR023424A1/es active IP Right Grant
- 2000-04-07 JP JP2000610131A patent/JP4610087B2/ja not_active Expired - Lifetime
- 2000-04-07 MY MYPI20001442A patent/MY123651A/en unknown
- 2000-04-07 SG SG200305891-4A patent/SG144695A1/en unknown
- 2000-04-07 CA CA2859333A patent/CA2859333A1/en not_active Abandoned
- 2000-04-07 AT AT00917191T patent/ATE255785T1/de active
- 2000-04-07 ES ES00917191T patent/ES2208297T3/es not_active Expired - Lifetime
- 2000-04-07 WO PCT/GB2000/001308 patent/WO2000060746A2/en active IP Right Grant
- 2000-04-07 DE DE60006953T patent/DE60006953T2/de not_active Expired - Lifetime
- 2000-04-07 EP EP10184530A patent/EP2391146A3/en not_active Ceased
- 2000-04-07 AU AU38284/00A patent/AU781629B2/en not_active Expired
- 2000-04-07 EP EP00917191A patent/EP1173925B1/en not_active Expired - Lifetime
- 2000-04-07 SG SG2012056305A patent/SG2012056305A/en unknown
- 2000-04-07 EP EP10184504A patent/EP2339756A3/en not_active Withdrawn
- 2000-04-07 CA CA2365529A patent/CA2365529C/en not_active Expired - Lifetime
- 2000-07-06 TW TW089106477A patent/TWI226041B/zh not_active IP Right Cessation
-
2003
- 2003-08-18 US US10/643,073 patent/US6774820B2/en not_active Expired - Lifetime
-
2004
- 2004-08-05 US US10/913,160 patent/US7193538B2/en not_active Expired - Lifetime
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4610087B2 (ja) | 損失のない符号化・復号へのマトリックス改良 | |
US10433091B2 (en) | Compatible multi-channel coding-decoding | |
CA2218893C (en) | Lossless coding method for waveform data | |
KR101251426B1 (ko) | 디코딩 명령으로 오디오 신호를 인코딩하기 위한 장치 및방법 | |
US20060212614A1 (en) | Cd playback augmentation for higher resolution and multi-channel sound | |
AU2005204293B2 (en) | Matrix improvements to lossless encoding and decoding |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20070404 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20070404 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20100427 |
|
A601 | Written request for extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A601 Effective date: 20100727 |
|
A602 | Written permission of extension of time |
Free format text: JAPANESE INTERMEDIATE CODE: A602 Effective date: 20100803 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20100928 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20101012 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131022 Year of fee payment: 3 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 4610087 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
EXPY | Cancellation because of completion of term |