JP3942634B2 - 信号の、符号化の際の冗長度低減方法及び冗長度を低減された信号の復号化装置 - Google Patents
信号の、符号化の際の冗長度低減方法及び冗長度を低減された信号の復号化装置 Download PDFInfo
- Publication number
- JP3942634B2 JP3942634B2 JP50614097A JP50614097A JP3942634B2 JP 3942634 B2 JP3942634 B2 JP 3942634B2 JP 50614097 A JP50614097 A JP 50614097A JP 50614097 A JP50614097 A JP 50614097A JP 3942634 B2 JP3942634 B2 JP 3942634B2
- Authority
- JP
- Japan
- Prior art keywords
- predictor
- signal
- channel
- redundancy
- prediction
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 19
- 230000003044 adaptive effect Effects 0.000 claims description 21
- 230000006978 adaptation Effects 0.000 claims description 13
- 238000004364 calculation method Methods 0.000 claims description 13
- 230000003595 spectral effect Effects 0.000 claims description 13
- 230000005540 biological transmission Effects 0.000 claims description 11
- 230000005236 sound signal Effects 0.000 claims description 5
- 238000000354 decomposition reaction Methods 0.000 claims description 4
- 230000009467 reduction Effects 0.000 claims description 4
- 230000003068 static effect Effects 0.000 claims 1
- 239000011159 matrix material Substances 0.000 description 13
- 239000013598 vector Substances 0.000 description 9
- 238000010586 diagram Methods 0.000 description 7
- 238000005070 sampling Methods 0.000 description 6
- 230000008901 benefit Effects 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 5
- 238000013139 quantization Methods 0.000 description 4
- 238000007792 addition Methods 0.000 description 3
- 230000008859 change Effects 0.000 description 3
- 230000009466 transformation Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 2
- 238000013016 damping Methods 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 1
- 238000013144 data compression Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000001228 spectrum Methods 0.000 description 1
- 230000007704 transition Effects 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B14/00—Transmission systems not characterised by the medium used for transmission
- H04B14/02—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation
- H04B14/04—Transmission systems not characterised by the medium used for transmission characterised by the use of pulse modulation using pulse code modulation
- H04B14/046—Systems or methods for reducing noise or bandwidth
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04N—PICTORIAL COMMUNICATION, e.g. TELEVISION
- H04N5/00—Details of television systems
- H04N5/44—Receiver circuitry for the reception of television signals according to analogue transmission standards
- H04N5/60—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals
- H04N5/602—Receiver circuitry for the reception of television signals according to analogue transmission standards for the sound signals for digital sound signals
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Multimedia (AREA)
- Computational Linguistics (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Human Computer Interaction (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
Description
本発明は信号の、符号化の際の冗長度低減方法及び冗長度を低減された信号の復号化装置に関する。
マルチチャネル信号の、符号化の際の冗長度低減方法がドイツ特許出願公開第4320990号公報から公知である。この公報において2チャネルステレオトーン信号の符号化が開示されている。冗長度低減のために信号がサンプリングされ、量子化され、エンコーダで予測される。実際のサンプル値のための推定値が得られる。予測誤差が求められ、データ線を介しての伝送のために処理される。予測は適応インターチャネル予測である。すなわち2つのチャネルの間の信号の間の統計的依存性(相互相関)が利用される。この場合に予測器係数は副情報として受信器に伝送されなければならない。
その他の参考特許文献として、米国特許第4815132号明細書、国際公開第9016136号公報がある。
1チャネルの場合のための後向き適応形予測器はN.S.Jayant,P.Noll著“波形のディジタル符号化”(Prentice−Hall出版社,Englewood Cliffs,New Jersey,1984)から公知である。
P.Cambridge,M.Todd著“オーディオデータ圧縮技術2”(第94回AES会議,プリプリント3584(K1−9),ベルリン,1993年3月)においては、2ステレオチャネルのための予測器のために自己相関及び相互相関を利用する方法が説明されている。しかしこのための解決方法は記載されていない。
発明の利点
請求項1の特徴部分に記載の特徴を有する本発明の方法の利点は、予測を線形かつ後向き適応で少なくとも2つのチャネルのために共通して行うことが可能であることにあり、その際、複数のチャネルの間の統計的バインディングだけでなく、それぞれの個々のチャネルの中の統計的バインディングも考慮される。これにより、予測品質が改善され、多くの信号領域内で予測利得を高めることが達成される。例えば64kbit/sのデータレートによるトーン信号の符号化において、伝送される信号の品質が大幅に高められる。
本発明は極めて一般的にNチャネルのための予測器に関する、すなわちこのような予測器により2つ以上のチャネルが同時に予測されることが可能であり、その際、それぞれのチャネルの間の統計的バインディング(自己相関)もチャネルとチャネルとの間の統計的バインディング(相互相関)も利用される。自己相関のみが利用される1チャネルの場合に対して大幅な予測利得が達成される。
予測が後向き適応で行われることにより予測係数を、既に伝送された値から計算することが可能となり、従って予測器係数を伝送することが不要となる。これは、前向き適応予測器では可能でない。前向き適応予測器では予測器係数も受信器に伝送され、これにより、データ伝送コストが高められる。
本発明の手段により信号の予測を多段で構成でき、その際、それぞれの予測器段のために格子構造が使用される。これにより、このようにして少なくとも定常信号の場合には直交システムが形成され、直交システムにより予測器次数を簡単に変化することが可能となる、何故ならば1つの更なる段の付加は先行の段に影響しないからである。従って具体的な用途のために、計算コスト及び予測品質の面でそれぞれ最適な予測器を選択することが可能である。
予測器係数を適応計算するために、チャネルの誤差信号出力の和が最小化される。このために誤差信号のための予測値が少なくとも2つのチャネルの中で必要とされる。この場合、予測値を、ある特定の信号の過去にわたる平均値により置換すると有利である。これにより計算コストが大幅に低減される。
予測器の個々の段がスイッチオフ可能に形成されていると非常に有利である。これにより予測器は、例えば予測において不安定性が発生するとフレキシブル応答することが可能である。これは、後向き適応システムにおいて必要ならば、信号交番変化に起因して信号統計が変化した場合に行われる。
スイッチオフされた段が前向き方向で後向き適応で更に作動されると有利である。これにより、スイッチオフされた段の予測器係数も更に適応されることが達成され、従って、スイッチオフされた段の再スイッチオフの後に当該予測器係数が完全に新たに適応される必要はない。
更に、少なくとも2つのチャネルの中の同時のサンプル値の間の統計的依存性(相互相関)も利用すると有利である。このために零次数の簡単なインターチャネル予測器を後置接続することが可能である。これは例えばとりわけモノーラル信号のための音声信号の符号化の場合に、例えばチャネルの中の信号が振幅の面でのみ異なる場合に予測利得をもたらす。
更に、例えばフィルタバンク又は変換等により複数のスペクトル成分へのマルチチャネル信号のスペクトル分解が行われ、このようにして生成されたマルチチャネルスペクトル成分が別個に符号化され、予測が、少なくとも2つのチャネルのスペクトル成分のためにそれぞれ別個に行われると非常に有利である。これは、融通性があり効率的な予測器制御が可能である利点を有する。部分帯域の中に信号成分が存在しない場合、又は予測が利得を得られない場合、当該の予測器をスイッチオフすることが可能である。狭帯域の信号成分のための低い次数の複数の予測器の実現は、高い次数の広帯域予測器の実現に比してしばしば簡単である。
冗長度を低減されたマルチチャネル信号の復号化装置のための有利な手段が請求項8〜10に記載されている。
図面
本発明の4つの有利な実施の形態が図面に示され、以下の説明の中で詳細に説明される。
図1はNチャネル予測を有するNチャネルコーデックのブロック回路図、図2は格子構造を有する次数Pの後向き適応形Nチャネル予測器の回路図、図3は図2のNチャネル予測器の1つの単一の段を示す回路図、図4は格子構造における次数Pの後向き適応形ステレオ予測器の回路略図、図5は2つの信号の同時のサンプル値の間の相関を付加的に考慮した格子構造における次数Pの後向き適応形ステレオ予測器の回路略図、図6はNチャネル予測器を有するNチャネル部分帯域符号器のブロック回路図、図7は予測器次数の切換えが可能でありすべての予測器段を連続的に完全に適応させることが可能である格子構造における後向きNチャネル予測器の回路図である。
発明の説明
図1において参照番号40によりエンコーダが示されている。エンコーダ40には入力側48を介してマルチチャネル入力信号
が供給される。なおnは自然数であり、アナログ入力信号
の第nサンプリング時点を示す。エンコーダ40はNチャネル量子化器42とNチャネル予測器43とを含む。入力信号
から加算部45で予測器出力信号
が減算される。これにより予測誤差信号
が形成される。予測誤差信号
はNチャネル量子化器42に供給される。これによりNチャネル量子化器42の出力側から、量子化された予測誤差信号
が出力される。量子化された予測誤差信号
はエンコーダ40の中の加算部46で予測器出力信号
に加算される。これにより、Nチャネル予測器のための量子化された信号
が形成される。エンコーダ40の出力側から、量子化された予測誤差信号
が出力される。予測誤差信号
は伝送区間を介して伝送され、最終的にデコーダ41の入力側に供給される。デコーダ41もNチャネル予測器43を含む。Nチャネル予測器43は、エンコーダ40の中のNチャネル予測器と全く同一に構成されている。入力側に入力された量子化された予測誤差信号は加算部47で、Nチャネル予測器43から出力された予測器出力信号
に加算される。これにより、量子化された信号
が形成される。デコーダ41をスイッチオンした後にまず初めにビルドアップが行われ、ビルドアップにおいて、出力された予測器出力信号
はまだエンコーダ40の中のNチャネル予測器43の予測器出力信号と一致していない。このフェーズでは、出力された量子化された信号
はまだ抑圧されていなければならない。しかしビルドアップの後に双方の予測器出力信号が、計算式の収斂に起因して自動的に一致する。
前述の信号の記述の仕方に関して次のことを述べておく。前述の信号はベクトル信号として記述されている。複数のベクトルが1つのNチャネル信号に相当する。
次式1はNチャネル入力信号、Nチャネル予測器出力信号及び量子化されたNチャネル信号を表す。
次式2はNチャネル予測誤差信号及び量子化された予測誤差信号を表す。
次に詳細に予測器出力信号の計算が説明される。Nチャネル予測器43は次数Pを有し、次式3により表される予測器係数のP個のマトリクスにより表される。
ただしm及びPは自然数である。予測器出力信号
すなわちそれぞれのチャネルの中のその都度に実際のサンプル値のための推定値の計算のために次式4が成立つ。
Nチャネル予測誤差信号
は次式5により計算できる。
量子化された予測誤差信号のために次式6が成立つ。
従って、量子化された入力信号のために次式7が成立つ。
ただし
は一種の量子化誤差信号であるが、しかし計算のためには更には使用されない。
マトリクスAm(n)の中の予測器係数の計算は、次式8により表される予測誤差信号出力の和を最小化することにより行われる。
式8において、
の転置ベクトルである。予測利得は次式9により表される。
式9において、これらの信号は平均値無しの信号であり、従ってこれらの信号において
が成立つと仮定されている。σxi 2及びσei 2は、値xi及びeiの分散すなわち平方偏差である。
Nチャネル予測器43の実現が次に図2に関連して説明される。このNチャネル予測器43は格子構造を有する。この構造は1チャネル予測器の場合には既に従来の技術から公知である。これに関連してP.Strohbach著“線形予測理論”(Springer出版社,158〜178頁,1990年)を参照されたい。格子構造の1つの重要な利点は、この構造においては少なくとも定常信号の場合には直交システムが形成され、直交システムは予測器基本段のカスケード化により予測器次数の簡単な変形を可能にする、何故ならば更なる段の付加は先行段に影響しないからである。本発明ではこの構造はNチャネルの場合にも行われ、次に詳細に説明される。
図2に示されているNチャネル予測器はP個の段から成り、従って次数Pを有する。左側にNチャネル入力信号
が供給されている。この信号から加算部49でそれぞれある特定の成分が減算される。これらの減算成分が加算されると、その和は、図1に示されている予測器出力信号
に相当する。出力側50から予測誤差信号
が出力される。この予測誤差信号もNチャネル量子化器42に供給され、Nチャネル量子化器42は破線により示されている。図示の構造の下部は予測器43に相当する。加算部51で、Nチャネル量子化器42の出力側の量子化された予測誤差信号に、それぞれ予測器段で計算された値が加算される。これらの加算がすべて行われると、量子化されたNチャネル信号
が得られる。
この信号はNチャネル予測器43の入力側に入力され、これは図1にも示されている。参照番号52により遅延段が示され、遅延段はそれぞれ、信号の印加される値をサンプリング時間間隔だけ遅らす。参照番号53により乗算部が示され、乗算部53において、当該の入力ベクトルといわゆる反射係数又はPARCOR(偏自己相関)係数との乗算が行われる。加算部54において最終的に、図2に示されている入力ベクトルの加算が行われ、これにより補助信号が形成され、しかし補助信号はNチャネル予測器43の中で内部的にしか使用されない。注意すべき点は、図示のように当該の入力ベクトルを正負の符号を考慮して正しく加算することである。
次にこれらのNチャネル予測器構造の数学的表現と、反射係数又はPARCOR係数とも呼称される予測器係数の計算とが説明される。Nチャネル予測器の第m段は次式10の漸化式により表される。
ただし反射係数のベクトルは次式11により表され、反射係数のマトリクスは次式12及び13により表される。
図2との関係を明瞭にするために次式が成立つ。
反射係数又はPARCOR係数の計算は定常信号の場合には、次式14及び15により表されるようにN誤差信号出力の和の最小化により行われる。
最小化は、個々の反射係数によるN×N偏微分を零にすることにより行われる。反射係数マトリクスのN×Nの要素のためのN×Nの方程式が得られる。次式(16)による次の計算は式14に制限されているが、しかし相応して式15にも成立つ。
式16の右側には零マトリクスが記載されている。式10を式16に中に代入して変形すると次式17が得られる。
予測値の中のベクトル積はそれぞれダイナミック積を表し、従って新しいマトリクスが得られる。すなわち式17は新しいマトリクス方程式である。この方程式を解いてKm eを求めると次式18が得られる。
同様にKm rに対して次式19又は20が成立つ。
Nチャネル予測器43の第m段は図3に詳細に示されている。同一の参照番号は図3において、図2に関連して既に説明された部分と同一の部分を示す。付加的に適応ネットワーク57が示されている。適応ネットワーク57はそれらの入力信号を、破線により示されているように、同様に同一の段の中で使用可能である信号のみから得る。どのように適応が詳細には行われるかについて次に1つの実施の形態に関連して詳細に説明される。参照番号55により付加的に減衰定数bが示されている。この減衰定数bは乗算部53に供給される。注意すべき点は、減衰定数もマトリクスとして表されていることである。従って乗算部53において反射係数Km r,Km eのマトリクスと減衰定数bのマトリクス及び当該の入力ベクトル
とが乗算される。遅延段52の前でも参照番号56により減衰定数aのためのマトリクスが示されている。減衰定数a及びbのマトリクスに関して、これらのマトリクスに対して、単位マトリクスが例えば数値0.85等の簡単な減衰定数と乗算されることによより得られることを述べておく。従って減衰定数a及びbのマトリクスは、対角線上でのみ零と異なる値を有する。
次に2チャネルステレオ信号処理の場合とそれに対する数学的表現が詳細に説明される。
ステレオ予測(N=2)の場合のために式21及び22が得られる。
が成立つ。
従ってマトリクスの個々の係数のために次式23が成立つ。
式23の中の係数を瞬時の信号特性に適応するために、式21〜23の中の最適化のために使用される予測値が、制限されている信号の過去にわたって測定された時間的な平均値により置換される。制限された、信号の過去として例えばステレオ信号処理においては、数ms〜100msにわたる信号経過を平均値形成のために考慮することが可能である。準定常信号特性を有する信号部分の中の最適な予測器設定への良好な収斂と、短時間統計のために変化された信号特性への迅速な適応の能力との間の妥協を行わなければならない。これに関連して、所要パラメータの推定値が反復的にすなわちサンプル値毎に改善されるアルゴリズムが適用可能である。このようなアルゴリズムの例として、従来の技術から公知のアルゴリズムLMS(least mean square=最小自乗法)又はRLS(recursive least mean square=反復最小自乗法)を挙げておく。これらのアルゴリズムもP.Strohbach著“線形予測理論”(Springer出版社,1990)から公知である。
次に係数ke xy,m及びkr xy,mの適応がLMSアルゴリズムの例において説明される。予測値は次式24のように予測に忠実な推定値により置換され、推定値は反復的に計算されることが可能である。
ただし
である。
ただしβは適応定数であり、この適応定数は、予測値の推定への瞬時のサンプル値の影響を定める。適応定数βはなかんずくその都度の予測器入力信号のサンプリング周波数に依存して最適化される。これは通常はある特定の符号化アルゴリズムのために実験的に行われる。これにより、前述の反射係数のための次式26及び27が得られる。
値Cxx,m(n),De xx,m(n)及びDr xx,m(n)が、式24及び25におけるのと全く同様に得られる。残りの係数のためには同様の計算仕様が行われる。これらの計算仕様は詳細には説明されない。このようにして得られた計算仕様は、図3に示されているようにそれぞれの予測器段において適応ネットワーク57により実現される。このために、相応してプログラミングされたマイクロプロセッサを使用することが可能である。減衰定数a及びbの最適値も実験的に求めることが可能である。最適値により、伝送誤差の影響をより迅速に除去することが保証される。
図4は、後向き適応の格子構造の中の次数Pの2チャネルステレオ予測器を簡単化して示す。双方のチャネルは個々に示され、x(n)及びy(n)により示されている。図4の中の図1,2及び3におけるのと同一の参照番号はそれぞれ、図1,図2及び3において既に説明されたのと同一の部分を示す。従ってこれらの部分は再度詳細に説明されない。分かりやすくするために、反射係数との乗算及び所属の適応ネットワークと減衰定数とは省かれた。完全な図示のためにはこれらは、図3に示されているように付加されなければならない。
格子構造の漸化式のためにこの場合に次式28及び29が成立つ。
及び
なおマトリクスKm eの及びKm rの反射係数は、式26及び27と関連して説明したように計算される。
2チャネル後向き適応ステレオ予測器の図4に示されている構造において、2つのチャネルxとyとの間の同時のサンプル値の間の相互相関は考慮されていない。この相互相関も考慮するために、図5に示されているように0次数のインターチャネル予測器を後置接続することが提案される。加算部58において、xチャネルに割当てられている量子化器42から出力された信号は係数kxy,0(n)と乗算される。乗算の結果は、矢印により示されているように加算部51及び49で、対応して入力されている入力値に加算される。インターチャネル予測器のための計算式は次式30により表される。
係数kxy,0(n)の計算は、次式31により表されるように、量子化された予測誤差信号ey,p+1(n)のための誤差出力を最小化することから得られる。
式31により表されるように最小化は、次式により表されるように、係数kxy,0(n)による誤差出力の微分により得られる導関数を零に設定することにより行われる。
上記の式から次式が得られる。
すなわち次式32が成立つ。
これらの式はNチャネルの場合に対して相応して微分されることが可能である。
次により正確に、本発明のNチャネル予測器による信号符号化の具体的な実現について説明する。図6において参照番号48は再びエンコーダの入力側を示す。この場合にNチャネル入力信号
が供給されている。信号
は、サンプリング時点nにおけるディジタル化されたサンプル値を含む。この場合に参照番号59によりフィルタバンクが示されている。フィルタバンク59は、供給された信号を異なるスペクトル成分に分解する複数のディジタル帯域フィルタから成る。ステレオ音声信号の符号化の場合には例えば公知の標準である国際標準ISO/IEC“国際標準IS 11172:情報技術−動画像の符号化及び約1.5Mbit/sまでのディジタル記憶媒体のための関連するオーディオ”(ISO/IEC JTC1/SC29,ジュネーブ,1993年8月)(別称MPEG/オーディオ標準)にレイヤ2のために、0〜24KHzのオーディオ信号のスペクトルを32の同一の幅の部分帯域に分解することが提案されている。参照番号60により図6においてそれに対応する多数のエンコーダ回路が示され、図1に示されているようにエンコーダはそれぞれ1つの予測器及び1つの量子化器を含む。参照番号61により示されている回路において公知の方法により、求められた量子化された予測誤差信号の符号化が行われ、更に、相応するブロック形成によるビット流生成も行われる。しかしこの回路の機能は前述のISO規格に詳細に説明されている。図6の構成を最適化するために、それぞれの個々の予測器を個別に制御することが可能であると有利である。後向き適応システムにおいて、必要な場合には短時間にわたり予測損失が、例えば信号統計が信号交番変化に起因して変化した場合等に発生する。この場合にオリジナルのサンプル値が伝送されなければならない、何故ならば予測器は新たに適応しなければならないからである。従って予測器は個々に又は群毎にスイッチオフ可能でなければならない、すなわち予測利得も達成できる場合にしか作動してはならない。しかし更に、予測器長すなわち予測器基本段の数を切換えると有利であることもある。従って予測器が、予測器長を長くすると不安定になることもある。これはエンコーダにおいて検査され、より短い予測器長にスイッチングして戻すことが可能である。これは、エンコーダにおいて付加的な制御コストを必要とし、更に、ビット流の中の副情報として相応する制御パラメータの伝送を必要とするが、この伝送の規模は小さいままである。
フィルタバンクの代りに図6において、変換例えば離散フーリエ変換又は離散余弦変換を行う計算装置により置換することも可能である。この場合にスペクトル成分は変換係数である。この場合、変換係数のそれぞれの列のためにそれぞれ1つの予測器が使用されなければならない。
予測器のスイッチオフ又は切換えにおける1つの問題は、予測器全体又はスイッチオフされたより高い段を再接続の際に新たに適応しなければならないことにあり、これにより予測利得が低減される。この問題を除去するために、図7に示されている回路が提案される。この回路においても同一の参照番号が、図1〜6における同一の部分を示す。重要な点は、図7の予測器は2段形後向き適応予測器として形成されていることである。この場合、予測器の残りの2つの段は、図示の回路においては前向き方向(フィードフォワード)で後向き適応で作動される。これにより、予測器のすべての係数の常時の適応が、予測器がスイッチオフされるかどうか又は可及的最大予測器長に比してより短い予測器長で作動されるかどうかと無関係に可能となる。
通常はNチャネルの場合には、1つの段当りの計算すべき係数の数は、増加する値Nの2乗で依存することに起因して急速に大きい値をとり、従ってなかんずく実際の上での実現の面でNチャネルを部分群N=N1+N2+...に分割し、N1チャネル予測器、N2チャネル予測器、...を使用すると有利であることもある。実際の上で今日重要な場合であるN=5の場合、すなわち3つのフロントチャネル(左側と中央と右側)と2つのサラウンドチャネル(左側サラウンド、右側サラウンド)が存在する場合、例えばフロントチャネルのための3チャネル予測器とサラウンドチャネルのための3チャネル予測器とへの相応する分割が可能である。これにより1つの段当り計算すべき係数の数が2×25=50から2×4+2×9=26に低減される。
前述の線形後向き適応形Nチャネル予測器は多様に使用されることが可能である。例えばISDNネットワークを介しての画像信号及び音声信号の伝送における利用が可能である。その他の利用はディジタルオーディオ放送(DAB)を用いてのディジタル音声信号の伝送に関する。なかんずくマルチメディアへの利用におけるコンピュータネットワークを介してのデータの伝送においても予測器が使用可能である。
最初の作業は、オーディオコーデックの中へのこれらの予測器の集積であった。この場合、予測器はISO MPEGレイヤ2の中にも、ISO MPEGレイヤ3の中にも集積された。ISO MPEGレイヤ2コーデックは、1.5KHzの部分帯域サンプリング周波数にて32の同一の幅の幅750Hzの部分帯域への部分帯域分解を基礎にしている。それぞれのステレオ部分帯域のために、予測器長の中で切換え可能又はスイッチオフ可能な後向き適応形ステレオ予測器が使用される。このコーデックにおいてはそれぞれのチャネルにおいてそれぞれ36の部分帯域サンプル値のブロックがスケール化され、量子化され符号化される。後向き適応予測のためには、1つのブロックのための量子化は既にブロックの開始時に既知でなければならない。この量子化は予測誤差値に依存するので予測、スケール化及び量子化は反復して行われなければならない。量子化器の選択を担当するビットアロケーションアルゴリズムは、予測利得をビット割当ての際に相応して考慮するように適合されなければならない。適応時定数のための値β=2−6と、減衰定数のための値a=1−2β及びb=1−βとにより、2・64=128kbit/sのデータレートによる符号化における従来のクリティカルなテスト信号に対して、予測無しでのレイヤ2に対する平均符号化利得を45〜60kbit/sの領域内で測定することが可能であった。主観的な音質は大幅に改善された。
ISO MPEFレイヤ3コーデックは、後置接続されている変換部を有する部分帯域分解を基礎にし、この変換部出力側は576のスペクトル係数を供給する。順次の係数の時間間隔は12msであり、これは、約83Hzの“部分帯域サンプリング周波数”に相当する。符号化のために576のスペクトル係数がいわゆるスケールファクタ帯域に統合され、スケールファクタ帯域の帯域幅は近似的に聴覚の周波数群に相応する。
ステレオ係数のそれぞれの列のために、後向き適応形ステレオ予測器が使用される、すなわち全部で576の予測器がスケールファクタ帯域毎にスイッチオフされることが可能である。信号の交番変化の場合、レイヤ3コーデックの中の周波数分解能は192のスペクトル係数に低減される。この場合、予測はスイッチオフされ、576の係数への移行の際に初めて再び作動される。レイヤ3の中へのステレオ予測の集積は比較的簡単である、何故ならば処理構造に起因して係数毎に量子化されるからである。適応時定数のための値β=0.1と、減衰定数のためのa=b=0.85とにより、2×64=128kbit/sによる符号化における従来のクリティカルなテスト信号に対して、予測無しでのレイヤ3に対する平均符号化利得を25〜35kbit/sの領域内で測定することが可能であった。レイヤ2に比して符号化利得がより小さいことは、レイヤ3はレイヤ2に対してより大きい符号化効率を有することにから説明できる。この場合にも主観的な音質は改善された。
Claims (10)
- 既にディジタル化された形で存在する信号の、符号化の際の冗長度低減方法において、
ディジタル化された信号を予測し、
ディジタル化された予測された複数の信号の間の予測誤差を求め、
予測誤差を量子化し、伝送区間を介しての伝送のために処理し、
予測を線形かつ後向き適応でかつ多段で行い、
それぞれの段において、1つのチャネルに供給されているそれぞれのディジタル値から減算される成分を計算し、
予測においてそれぞれの段のために格子構造を使用し、
予測器(43)の個々の又は複数の段をスイッチオフ可能に形成して、予測を予測利得が達成できる場合にのみ行い、
前記予測器(43)がスイッチオフされたか、又は可及的最大予測器長に比してより短い予測器長で作動されるかに無関係に予測器係数の適応を行い、
スイッチオフされた段を予測において前向き方向で後向き適応で作動することを特徴とする信号の、符号化の際の冗長度低減方法。 - 適応においてそれぞれの段のための予測器係数を計算し、前記予測器係数の計算のために少なくとも2つのチャネルの中の誤差信号出力の和の最小化を行い、このために1つのチャネルの中の信号の予測値と、前記少なくとも2つのチャネルの間の予測値とを用いることを特徴とする請求項1に記載の信号の、符号化の際の冗長度低減方法。
- 予測値を、制限されている信号の、過去にわたる測定された時間的な平均値により置換することを特徴とする請求項2に記載の信号の、符号化の際の冗長度低減方法。
- 予測器(43)の複数の段をスイッチオフにして、予測を残りの段のみによって線形かつ後向きに行うことを特徴とする請求項1から請求項3のうちのいずれか1つの請求項に記載の信号の、符号化の際の冗長度低減方法。
- マルチチャネル信号の場合、少なくとも2つのチャネルの同時のサンプル値の間の統計的バインディングも考慮し、このためになかんずく、零次数の後置接続されているインターチャネル予測器(58,51)を使用することを特徴とする請求項1から請求項4のうちのいずれか1つの請求項に記載の信号の、符号化の際の冗長度低減方法。
- マルチチャネル信号の場合、複数のスペクトル成分へのマルチチャネル信号のスペクトル分解を行い、このようにして得られるマルチチャネルスペクトル成分を別個に符号化し、予測を、少なくとも2つのチャネルのそれぞれのスペクトル成分のためにそれぞれ別個に行うことを特徴とする請求項1から請求項5のうちのいずれか1つの請求項に記載の信号の、符号化の際の冗長度低減方法。
- マルチチャネル信号の場合、前記マルチチャネル信号が画像及び/又は音声信号であることを特徴とする請求項1から請求項6のうちのいずれか1つの請求項に記載の信号の、符号化の際の冗長度低減方法。
- 請求項1から請求項7のうちのいずれか1つの請求項に記載の信号の、符号化の際の冗長度低減方法により冗長度を低減された信号の復号化装置であって、前記復号化装置に、量子化された予測誤差値が供給される復号化装置において、
線形後向き適応形予測器(43)に、量子化された予測誤差値
を供給し、前記予測器(43)を多段に形成し、それぞれの前記段で、当該チャネルに供給されているそれぞれのディジタル値から減算される成分を計算し、
それぞれの段が格子構造を有し、
前記予測器(43)の個々の段を、予測利得を達成できる場合にのみ予測を行うようにスイッチオフ可能に形成し、
スイッチオフされた段が前向き方向で後向き適応で動作し、
予測器係数の適応を、前記予測器(43)がスイッチオフされているかいないかとは無関係に行えるように、前記予測器(43)を形成することを特徴とする冗長度を低減された信号の復号化装置。 - 予測器(43)が付加的に零次数のインターチャネル予測器(58,51)を有し、前記インターチャネル予測器(58,51)は、少なくとも2つのチャネルの同時のサンプル値の間の統計的バインディングも考慮することを特徴とする請求項8に記載の冗長度を低減された信号の復号化装置。
- 冗長度を低減された信号の復号化装置がそれぞれのマルチチャネル部分帯域信号のためにそれぞれ1つの別個の予測器(60)を含み、前記予測器(60)は別個にスイッチオフ可能であることを特徴とする請求項8又は請求項9に記載の冗長度を低減された信号の復号化装置。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
DE19526366.9 | 1995-07-20 | ||
DE19526366A DE19526366A1 (de) | 1995-07-20 | 1995-07-20 | Verfahren zur Redundanzreduktion bei der Codierung von mehrkanaligen Signalen und Vorrichtung zur Dekodierung von redundanzreduzierten, mehrkanaligen Signalen |
PCT/DE1996/001181 WO1997004621A1 (de) | 1995-07-20 | 1996-07-03 | Verfahren zur redundanzreduktion bei der codierung von mehrkanaligen signalen und vorrichtung zur dekodierung von redundanzreduzierten, mehrkanaligen signalen |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH11509388A JPH11509388A (ja) | 1999-08-17 |
JP3942634B2 true JP3942634B2 (ja) | 2007-07-11 |
Family
ID=7767248
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP50614097A Expired - Fee Related JP3942634B2 (ja) | 1995-07-20 | 1996-07-03 | 信号の、符号化の際の冗長度低減方法及び冗長度を低減された信号の復号化装置 |
Country Status (6)
Country | Link |
---|---|
US (1) | US6360200B1 (ja) |
EP (1) | EP0846405B1 (ja) |
JP (1) | JP3942634B2 (ja) |
KR (1) | KR100468881B1 (ja) |
DE (2) | DE19526366A1 (ja) |
WO (1) | WO1997004621A1 (ja) |
Families Citing this family (33)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FI970553A (fi) * | 1997-02-07 | 1998-08-08 | Nokia Mobile Phones Ltd | Audiokoodausmenetelmä ja -laite |
SE519552C2 (sv) * | 1998-09-30 | 2003-03-11 | Ericsson Telefon Ab L M | Flerkanalig signalkodning och -avkodning |
US6961432B1 (en) * | 1999-04-29 | 2005-11-01 | Agere Systems Inc. | Multidescriptive coding technique for multistream communication of signals |
KR100300306B1 (ko) * | 1999-05-28 | 2001-09-26 | 윤종용 | 무선통신 시스템에서 채널 적응형 맵 채널 복호 장치 및 방법 |
SG99314A1 (en) * | 2000-07-19 | 2003-10-27 | Ct For Signal Proc Nanyang Tec | Method and apparatus for the prediction of audio signals |
ES2237706T3 (es) * | 2001-11-29 | 2005-08-01 | Coding Technologies Ab | Reconstruccion de componentes de alta frecuencia. |
US6751587B2 (en) * | 2002-01-04 | 2004-06-15 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US7206740B2 (en) * | 2002-01-04 | 2007-04-17 | Broadcom Corporation | Efficient excitation quantization in noise feedback coding with general noise shaping |
US7328150B2 (en) * | 2002-09-04 | 2008-02-05 | Microsoft Corporation | Innovations in pure lossless audio compression |
DE102004007185B3 (de) * | 2004-02-13 | 2005-06-30 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Prädiktives Codierungsschema |
US7634148B2 (en) * | 2005-01-07 | 2009-12-15 | Ntt Docomo, Inc. | Image signal transforming and inverse-transforming method and computer program product with pre-encoding filtering features |
WO2006075975A1 (en) * | 2005-01-11 | 2006-07-20 | Agency For Science, Technology And Research | Encoder, decoder, method for encoding/deconding, computer readable media and computer program elements |
CN101167126B (zh) * | 2005-04-28 | 2011-09-21 | 松下电器产业株式会社 | 语音编码装置和语音编码方法 |
US8433581B2 (en) * | 2005-04-28 | 2013-04-30 | Panasonic Corporation | Audio encoding device and audio encoding method |
US8112286B2 (en) * | 2005-10-31 | 2012-02-07 | Panasonic Corporation | Stereo encoding device, and stereo signal predicting method |
GB2444191B (en) * | 2005-11-26 | 2008-07-16 | Wolfson Microelectronics Plc | Audio device |
JPWO2008132850A1 (ja) * | 2007-04-25 | 2010-07-22 | パナソニック株式会社 | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 |
US8374883B2 (en) | 2007-10-31 | 2013-02-12 | Panasonic Corporation | Encoder and decoder using inter channel prediction based on optimally determined signals |
US8386271B2 (en) | 2008-03-25 | 2013-02-26 | Microsoft Corporation | Lossless and near lossless scalable audio codec |
US8867752B2 (en) * | 2008-07-30 | 2014-10-21 | Orange | Reconstruction of multi-channel audio data |
CN102422347B (zh) * | 2009-05-20 | 2013-07-03 | 松下电器产业株式会社 | 编码装置、解码装置及编码和解码方法 |
US8898053B2 (en) * | 2009-05-22 | 2014-11-25 | Panasonic Intellectual Property Corporation Of America | Encoding device, decoding device, and methods therein |
TWI407431B (zh) * | 2009-10-22 | 2013-09-01 | Chunghwa Telecom Co Ltd | A perceptual parameter based objective voice quality estimation method |
TWI412022B (zh) * | 2010-12-30 | 2013-10-11 | Univ Nat Cheng Kung | 遞迴式離散餘弦正、逆轉換之系統 |
JP5799824B2 (ja) * | 2012-01-18 | 2015-10-28 | 富士通株式会社 | オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム |
JP5166618B2 (ja) * | 2012-02-29 | 2013-03-21 | 日本電信電話株式会社 | マルチチャネル信号符号化方法、それを使った符号化装置、その方法によるプログラムとその記録媒体 |
JP5997592B2 (ja) * | 2012-04-27 | 2016-09-28 | 株式会社Nttドコモ | 音声復号装置 |
WO2014053517A1 (en) | 2012-10-01 | 2014-04-10 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Scalable video coding using derivation of subblock subdivision for prediction from base layer |
EP2824661A1 (en) * | 2013-07-11 | 2015-01-14 | Thomson Licensing | Method and Apparatus for generating from a coefficient domain representation of HOA signals a mixed spatial/coefficient domain representation of said HOA signals |
EP2922054A1 (en) * | 2014-03-19 | 2015-09-23 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus, method and corresponding computer program for generating an error concealment signal using an adaptive noise estimation |
US10757485B2 (en) | 2017-08-25 | 2020-08-25 | Honda Motor Co., Ltd. | System and method for synchronized vehicle sensor data acquisition processing using vehicular communication |
US11181929B2 (en) | 2018-07-31 | 2021-11-23 | Honda Motor Co., Ltd. | System and method for shared autonomy through cooperative sensing |
US11163317B2 (en) | 2018-07-31 | 2021-11-02 | Honda Motor Co., Ltd. | System and method for shared autonomy through cooperative sensing |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US4571736A (en) * | 1983-10-31 | 1986-02-18 | University Of Southwestern Louisiana | Digital communication system employing differential coding and sample robbing |
CA1268546C (en) * | 1985-08-30 | 1990-05-01 | STEREO VOICE SIGNAL TRANSMISSION SYSTEM | |
GB8913758D0 (en) | 1989-06-15 | 1989-08-02 | British Telecomm | Polyphonic coding |
US5249205A (en) * | 1991-09-03 | 1993-09-28 | General Electric Company | Order recursive lattice decision feedback equalization for digital cellular radio |
DE4320990B4 (de) | 1993-06-05 | 2004-04-29 | Robert Bosch Gmbh | Verfahren zur Redundanzreduktion |
-
1995
- 1995-07-20 DE DE19526366A patent/DE19526366A1/de not_active Ceased
-
1996
- 1996-07-03 WO PCT/DE1996/001181 patent/WO1997004621A1/de active IP Right Grant
- 1996-07-03 JP JP50614097A patent/JP3942634B2/ja not_active Expired - Fee Related
- 1996-07-03 DE DE59611511T patent/DE59611511D1/de not_active Expired - Fee Related
- 1996-07-03 US US08/983,399 patent/US6360200B1/en not_active Expired - Fee Related
- 1996-07-03 KR KR10-1998-0700511A patent/KR100468881B1/ko not_active IP Right Cessation
- 1996-07-03 EP EP96920738A patent/EP0846405B1/de not_active Expired - Lifetime
Also Published As
Publication number | Publication date |
---|---|
WO1997004621A1 (de) | 1997-02-06 |
DE59611511D1 (de) | 2010-08-05 |
US6360200B1 (en) | 2002-03-19 |
KR100468881B1 (ko) | 2005-06-27 |
EP0846405B1 (de) | 2010-06-23 |
DE19526366A1 (de) | 1997-01-23 |
EP0846405A1 (de) | 1998-06-10 |
KR19990035851A (ko) | 1999-05-25 |
JPH11509388A (ja) | 1999-08-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP3942634B2 (ja) | 信号の、符号化の際の冗長度低減方法及び冗長度を低減された信号の復号化装置 | |
KR100469002B1 (ko) | 오디오 코딩 방법 및 장치 | |
KR100299528B1 (ko) | 인텐서티-스테레오 프로세스와 예측 프로세스를 이용한 오디오신호의 부호화/복호화 장치 및 그 방법 | |
JP4095679B2 (ja) | 冗長性低減方法 | |
KR100913987B1 (ko) | 다중-채널 출력 신호를 발생시키기 위한 다중-채널합성장치 및 방법 | |
RU2422987C2 (ru) | Канальное кодирование на основе комплексного преобразования с частотным кодированием с расширенной полосой | |
FI112979B (fi) | Digitaalisen datan erittäin tehokas koodauslaite | |
US5845243A (en) | Method and apparatus for wavelet based data compression having adaptive bit rate control for compression of audio information | |
JP4000261B2 (ja) | ステレオ音響信号の処理方法と装置 | |
JPH04304031A (ja) | ディジタル信号符号化方法 | |
JPH04104617A (ja) | ディジタル信号符号化装置 | |
EP2345026A1 (en) | Apparatus for binaural audio coding | |
JP5282906B2 (ja) | 多地点接続装置、信号分析及び装置と、その方法及びプログラム | |
US5850418A (en) | Encoding system and encoding method for encoding a digital signal having at least a first and a second digital component | |
US8665914B2 (en) | Signal analysis/control system and method, signal control apparatus and method, and program | |
WO2009087923A1 (ja) | 信号分析制御、信号分析、信号制御のシステム、装置、方法及びプログラム | |
US6009399A (en) | Method and apparatus for encoding digital signals employing bit allocation using combinations of different threshold models to achieve desired bit rates | |
EP0803989B1 (en) | Method and apparatus for encoding of a digitalized audio signal | |
WO1998035447A2 (en) | Audio coding method and apparatus | |
KR960012478B1 (ko) | 오디오 신호간의 상호 유사성에 적응적인 엠 에스 스테레오 디지탈 오디오 부호화 및 복호화 장치 | |
KR960012477B1 (ko) | 인지 정보량을 이용한 적응적 스테레오 디지탈 오디오 부호화 및 복호화장치 | |
KR100370412B1 (ko) | 복잡도 조절이 가능한 오디오 복호화방법 및 이를이용한오디오복호화기 | |
KR970006825B1 (ko) | 오디오신호 부호화장치 | |
JPH03150600A (ja) | 変換復号の方法及び変換復号器 | |
JPH08328594A (ja) | オーディオデータ圧縮装置およびこれに用いる予測係数算出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20060124 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20060421 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20070306 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20070404 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20110413 Year of fee payment: 4 |
|
LAPS | Cancellation because of no payment of annual fees |