JP2001510953A - 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置 - Google Patents
低ビットレート多重オーデイオチャンネル符号・復号方法及び装置Info
- Publication number
- JP2001510953A JP2001510953A JP2000503606A JP2000503606A JP2001510953A JP 2001510953 A JP2001510953 A JP 2001510953A JP 2000503606 A JP2000503606 A JP 2000503606A JP 2000503606 A JP2000503606 A JP 2000503606A JP 2001510953 A JP2001510953 A JP 2001510953A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- signals
- subband
- band
- sub
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims description 97
- 239000002131 composite material Substances 0.000 claims abstract description 72
- 230000004044 response Effects 0.000 claims abstract description 33
- 230000002123 temporal effect Effects 0.000 claims abstract description 28
- 230000003595 spectral effect Effects 0.000 claims abstract description 23
- 230000008859 change Effects 0.000 claims description 24
- 230000000875 corresponding effect Effects 0.000 claims description 22
- 238000013507 mapping Methods 0.000 claims description 13
- 230000009467 reduction Effects 0.000 claims description 9
- 230000002596 correlated effect Effects 0.000 claims description 5
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 claims description 3
- 230000003111 delayed effect Effects 0.000 claims 4
- 238000009499 grossing Methods 0.000 abstract description 15
- 108091006146 Channels Proteins 0.000 description 83
- 238000012937 correction Methods 0.000 description 18
- 239000013598 vector Substances 0.000 description 13
- 238000013144 data compression Methods 0.000 description 12
- 238000007906 compression Methods 0.000 description 10
- 230000006835 compression Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 230000005236 sound signal Effects 0.000 description 10
- 230000000295 complement effect Effects 0.000 description 8
- 238000001914 filtration Methods 0.000 description 8
- 238000013139 quantization Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- 238000009795 derivation Methods 0.000 description 5
- 238000001228 spectrum Methods 0.000 description 4
- 230000009466 transformation Effects 0.000 description 4
- 241000255925 Diptera Species 0.000 description 3
- 230000006978 adaptation Effects 0.000 description 3
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015572 biosynthetic process Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000003786 synthesis reaction Methods 0.000 description 3
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 239000000284 extract Substances 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 239000000203 mixture Substances 0.000 description 2
- 238000012545 processing Methods 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 230000001052 transient effect Effects 0.000 description 2
- 241000238631 Hexapoda Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000003466 anti-cipated effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 239000006185 dispersion Substances 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010237 hybrid technique Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000844 transformation Methods 0.000 description 1
- 238000013519 translation Methods 0.000 description 1
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Mathematical Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Abstract
Description
チャンネルオーデイオ情報の高品質符号化及び復号に関する。本発明は、典型的
にパソコンを公衆網に接続するのに用いられる電話線のような、比較的低帯域幅
伝送路を介して多重チャンネルオーデイオ情報を実時間で伝送するのに有用であ
る。
号を表すために要する情報量を最小にすることには多大の関心がある。必要な情
報量を低減させることによって、通信路及び記憶媒体に対して課される信号表現
の情報容量要件はより低減される。
の高品質デジタルオーデイオ信号を実時間で伝送する方法を開発することについ
ては特に関心がある。この種の通信路は、パソコンを公衆網に接続するために一
般的に用いられ、現在約毎秒50kビットの能力に過ぎない。オーデイオ信号を実 時間伝送することによって、信号によって表される情報は信号が受信されるにつ
れて妨害なしに表現又は再生され得る。
完全な回復を保証せず、概してこれ妨げる方法で情報要件を低減させる。その他
方は、「損失のない」圧縮と呼ばれ、原信号の完全な回復が可能な方法で情報要件
を低減させる。
サンプルを表すのに用いられるビット数を低減させることによって情報容量要件
を低減させ、それによってデジタル信号表現の精度を低減させ得る。オーデイオ
符号化用途では、低減される精度又は量子化誤差は、量子化ノイズとして現れる
。もし誤差が十分大きいなら、量子化ノイズは、符号化される信号の実質的品質
を劣化させるであろう。
に無関係な情報成分を除去することによって、何等の知覚可能な劣化を被ること
なく入力信号に損失のある圧縮技術を適用することが試みられる。除去される成
分が真に無関係であるとすれば、相補的な復号技術で、知覚的に入力信号と区別
できない入力信号レプリカを回復することができる。例えば、分割帯域符号化で
は、入力信号を幾つかの狭帯域信号に分割し、心理音響原理により各狭帯域信号
を適応的に量子化する。
中心周波数の関数として変化する可変中心周波数及び帯域幅を有する高度に非対
称な調整されたフィルタに類似している。別個の音調を検出する能力は、概して
音調間の周波数差が増加するにつれて増加する。人の聴覚系の分解能は、上記濾
波作用の帯域幅未満の周波数差については実質的に一定である。この帯域幅は、
オーデイオスペクトル全体を通して変化し、「臨界帯域幅」と呼ばれる。優勢な信
号は、臨界帯域幅外の周波数における他の信号を隠蔽(マスク)するよりは恐らく
当該臨界帯域幅以内のどこにおいても他の信号の可聴性をより隠蔽するであろう
。優勢な信号は、隠蔽信号と同時に起こる他の信号のみならず、隠蔽信号の前後
に起こる他の信号をも隠蔽し得る。前隠蔽及び後隠蔽効果の持続時間は、隠蔽信
号の大きさに依存するが、前隠蔽効果は通常後隠蔽効果より遥かに短い持続時間
のものである。前隠蔽持続時間は、100msecを超え得るが、概して5ms
ec未満に限られるとみなされる。後隠蔽持続時間は、500msecを超え得
るが、約50msecに限られるとみなされる。信号の隠蔽される成分は重要で
はなく、聴取者の聴覚経験を変えることなく除去し得る。
域幅を有する幾つかのサブバンド信号に、オーデイオ信号帯域幅を分割するため
に、順方向又は「分析」フィルタバンクを用いる。各サブバンド信号が丁度十分な
ビットを用いて量子化され、各バンドの量子化ノイズが当該サブバンド又は多分
隣接サブバンド内のスペクトル成分によって隠蔽されることを保証するようにす
る。分割帯域オーデイオ復号では、逆方向又は「合成」フィルタバンクを用いて原
信号のレプリカを再構成する。もしフィルタバンクのフィルタ帯域幅及びサブバ
ンド信号の量子化精度が適切に選ばれるなら、再構成されるレプリカは、知覚的
に原信号から区別され得ない。
濾波技術を用い得る。変換符号化では、フィルタバンクを実施するために色々な
時間領域対周波数領域変換を用い得る。個々の変換係数帯域幅の合計である有効
帯域幅を有するサブバンドを定めるために隣接周波数領域変換係数はグループ化
され得る。
域幅の各部分に作用する、サブバンド符号化・復号、変換符号化・復号及びその他
の符号化・復号技術を指す。「サブバンド」の用語は、真のサブバンドコーダ、変 換コーダ又は他の技術によって実施されようとされまいと、有効な信号帯域幅の
部分を指す。「サブバンド信号」の用語は、それぞれのサブバンド以内の分割帯域
濾波信号表示を指す。
の符号化技術は、限られたビット数によって表される符号化された情報のダイナ
ミックレンジを伸ばすために位取りされた表現を用いる信号を伝える。位取りさ
れた表現は、符号化される信号の要素に対応する「位取りされた値」と関連する1 つ又はそれ以上の「位取り因(係)数」を含む。多くの形式の位取りされた表現が知
られている。位取りされた値の多少の精度を犠牲にすることによって、「ブロッ ク位取りされた表現」を用いる情報を伝えるためにさらに少ないビットが用いら れ得る。ブロック位取りされた表現は、共通位取り係数と関連する一グループ又
はブロックの位取りされた値を含む。
なしに情報容量要件を低減させる。相補的な圧縮解除技術では、圧縮中に除去さ
れる冗長成分を与えることによって原信号を完全に回復することができる。損失
のない圧縮技術の例には、ランレングス符号化、差分コード化、線型予測コード
化及び変換コード化がある。これらの圧縮技術に対する変形、組合せ及び適応形 式も知られている。
知られている。例えば、変換を基礎とするフィルタバンクを用いる分割帯域コー
ド化は、損失のない変換コード化を損失のある心理音響知覚コード化と組合わせ
る。
従来の電話線のような低帯域幅経路を介して伝えられるべき多重チャンネル高品
質オーデイオを可能にするために十分な程情報要件は低減されない。色々な高性
能コード化システムは、15kHzの帯域幅を有するオーデイオ信号を実時間で
伝えるために毎秒約64kビット又はそれ以上のものを必要とする。多重オーデ
イオチャンネルを伝えるためにはこれらのビットレートの倍数を要するので、従
来の住宅用電話線のような限られた帯域幅経路を介して実時間で多重オーデイオ
チャンネルを伝えることを可能にするためには、単一チャンネルコード化システ
ムの性能に極端な改良を加える必要がある。情報容量要件のさらなる低減は、本
明細書で空間コード化技術と呼ばれる多重チャンネルコード化技術によって扱わ
れる。
的復号マトリックスを用いて原信号のレプリカを回復する。多くの4:2:4マ
トリックス化技術が知られており、同技術では伝送及び記憶のために4つの信号 を2つの信号に組合せ、次いで2つの符号化された信号から4つの原信号のレプリ カを回復する。この符号化技術は、信号間の高レベルクロストークに悩まされる
。クロストークレベルを下げるために多数の適応マトリックス化技術が開発され
てきたが、クロストークの低減及び情報容量要件の低減は共に不十分である。
バンドにおけるチャンネルのスペクトルレベルを表すステアリング(方向づけ)情
報のベクトルを発生させ、和又は合成サブバンド信号を発生させるために所与の
周波数サブバンドのすべてのチャンネルにつきサブバンド信号を組合せ、合成サ
ブバンド信号を知覚的に符号化し、符号化された合成サブバンド信号及びステア
リングベクトルを符号化された信号に組合わせる。相補的デコーダが、適切なサ
ブバンドのステアリングベクトルにより当該サブバンド信号を位取りすることに
よって各出力信号に対するそれぞれの周波数サブバンド内にサブバンド信号を発
生させかつ逆フィルタバンクを通して位取りされたサブバンド信号を通すことに
よって出力信号を発生させる。このような符号化システムの2つの例が、デビス 他(Davis, et al.)の米国特許第5,583,962号及び「約1.5Mbit/sまでにおけるデジ
タル記憶媒体用映画及び関連オーデイオの符号化(International Organization for Standardization, CD 11172-3, Part 3(Audio), Annex 3-G(Joint Stereo C
oding), pp.G-1 to G-4)に開示されている。
ても、実時間再生のために十分低いビットレートにおいて低帯域幅経路を介して
多重チャンネル高品質オーデイオを伝えることは不可能である。これらの技術で
は、原入力信号のレプリカは、ちゅちゅ(小鳥や虫の泣き声)又はかちり(クリッ ク)という音及びファスナの開閉音(ジッパーノイズ)のような、望ましくない人 工物と共に発生される。
号化しかつ符号化された信号を多重オーデイオ信号の高品質レプリカに復号する
方法及び装置を提供することにある。 本発明の一面の教示によるとエンコーダは、複数の周波数サブバンド内の複数
の入力信号から複数チャンネルのサブバンド信号を発生させ、入力信号の帯域幅
の少なくとも一部を表す合成信号を発生させ、周波数サブバンドの各々のチャン
ネルサブバンド信号に応答して音界(サウンドフィールド)の空間特性を表す空間
特性信号を発生させ、空間特性信号が各々のチャンネルサブバンド信号の信号レ
ベルを表す情報を伝える第1形態及び1つ又はそれ以上の意図された方向を表す第
2形態で発生されるようにし、合成信号、空間特性信号及び空間特性信号形態の 表示を符号化された信号にアセンブルする。
数の入力信号から複数チャンネルのサブバンド信号を発生させ、入力信号の帯域
幅の少なくとも一部を表す合成信号を発生させ、周波数サブバンドの各々のチャ
ンネルサブバンド信号に応答して音界(サウンドフィールド)の空間特性を表す空
間特性信号を発生させ、空間特性信号は、信号レベルを表す情報値の減少が人の
聴覚系の一時的後隠蔽特性の減少に比例して制限されるように各々のチャンネル
サブバンド信号のレベルを表す情報を伝え、合成信号及び空間特性信号を符号化
された信号にアセンブルする。
合成サブバンド信号と関連づけられかつ各々の合成サブバンド信号に対応する各
々の音界空間特性を表すようにし、空間特性信号から複数の利得係数を引き出し
、利得係数値の減少が人の聴覚系の一時的後隠蔽特性の減少に比例して制限され
るようにし、各々の利得係数により各々の合成サブバンド信号を1つ又はそれ以 上の中間サブバンド信号にマップ(写像)し、中間サブバンド信号に1つ又はそれ 以上の逆フィルタバンクを適用することによって複数の出力信号を発生させる。 本発明のさらなる面の教示よるとデコーダは、符号化された信号から1つ又は それ以上の合成信号と、複数の空間特性信号と、空間特性信号形態の表示とを入
手し、1つ又はそれ以上の合成信号から複数の合成サブバンド信号を引き出し、 各空間特性信号は、各々の合成サブバンド信号と関連づけられかつ各々の合成サ
ブバンド信号に対応する各々の音界空間特性を表すようにし、また、当該表示は
、空間特性信号が、複数の信号レベルを表す第1形態、1つ又はそれ以上の方向を
表す第2形態であるかどうかを示すようにし、空間特性信号から複数の利得係数 を引き出し、各々の利得係数により各々の合成サブバンド信号を1つ又はそれ以 上の中間サブバンド信号にマップ(写像)し、第1形態を有する関連する空間特性 信号については、同様にマッピングが信号レベルと関連する空間構成信号及び複
数の出力トランスジューサの空間構成を表すトランスジューサ信号によるように
し、第2形態を有する関連する空間特性信号については、同様にマッピングが1 つ又はそれ以上の方向及びトランスジューサ構成信号によるようにし、中間サブ
バンド信号に1つ又はそれ以上の逆フィルタバンクを適用することによって複数 の出力信号を発生させる。
ることによってよりよく理解し得る。幾つかの図面では同一要素は同一参照番号
で示される。以下の論議及び図面の内容は例としてのみ記載され、本発明の範囲
を表すものと理解すべきではない。
路11及び12に沿ってチャンネルサブバンド信号を発生させる。同様に、サブ
バンド信号発生器20は、経路2から受信する入力信号に応答して、経路21及
び22に沿ってチャンネルサブバンド信号を発生させ、サブバンド信号発生器3
0は、経路3から受信する入力信号に応答して、経路31及び32に沿ってチャ
ンネルサブバンド信号を発生させる。多く実際的実施形態では、各信号発生器に
よって3つ以上のチャンネルサブバンド信号が発生される。
ぶ周波数サブバンドを表すチャンネルサブバンド信号を発生させることが予想さ
れる。しかし、これは本発明を実施するためには不必要である。例えば、1つ又 はそれ以上のサブバンド信号発生器は、有効帯域幅の一部、例えば、約1.5k
Hzより下方の帯域幅部分、のみを表すチャンネルサブバンド信号を発生し得る
。概して、チャンネルサブバンドコーダは、音界空間特性を決定するために空間
コーダ40によって分析されるスペクトル部分につき発生されるべきである。
ド信号に応答して経路41及び42に沿って空間特性信号を発生させる。これら
の空間特性信号の各々は、各々の周波数サブバンドの1つ又はそれ以上のチャン ネルサブバンド信号に対応する音界の空間特性を表す。合成信号発生器60は、
経路1,2及び3から受信される入力信号を組合わせることによって経路61に
沿って合成信号を発生させる。
想されるが、本発明を実施するためにデータ圧縮は不要である。もしデータ圧縮
が用いられるなら、実質的にあらゆる形態のデータ圧縮が経路61に沿って発生
される合成信号に適用され得る。
61から受信される合成信号とを出力信号にアセンブルする。出力信号は伝送又
は記憶のために経路51に沿って送られる。もし合成信号がデータ圧縮又は符号
化を受けるなら、合成信号それ自体よりはむしろ符号化された形態が出力信号に
アセンブルされる。
この実施形態は、経路61から受信される合成信号に応答して経路71‐73に
沿って合成サブバンド信号を発生するサブバンド信号発生器70が追加されるこ
とを除けば、図1に例示するものと同一である。
と釣り合うなら知覚的符号化技術が有利に適用され得る。サブバンド信号発生器
70によって発生される合成サブバンド信号の帯域幅が、サブバンド信号発生器
10,20及び30によって発生されるチャンネルサブバンド信号の帯域幅と同
一である必要がないことは指摘されるべきである。実際、サブバンド信号発生器
10,20及び30によって発生されるチャンネルサブバンド信号の帯域幅でさ
えも同一であることを要しない。
。例えば、非再帰(反復)的、再帰的又は格子フィルタが用いられ得る。非再帰的
フィルタの中には多項式フィルタ又は変換操作を用いて実施され得るものもある
。特殊フィルタデザインの例には、離散フーリエ変換(DFT)と離散余弦変換(DCT)
、直角位相ミラーフィルタ(QMF)及びいわゆる偶数積重ねと奇数積重ね時間領域 エイリアシング相殺(TDAC)変換のような各種の変換がある。変換の分析特性は、
変換の適用に先立って信号サンプルブロックを変調するために用いられる任意の
ウインドウファンクション(関数)の形状によって影響される。
であることを要しない。例えば、サブバンド信号発生器10,20及び30は、
同一フィルタバンクを併合するのが望ましい。同フィルタバンクは、スペクトル
分解能を最適化するように設計されかつサブバンド信号パワー(累乗)の正確な尺
度を与える。しかし、サブバンド信号発生器70では、臨界サンプリングを与え
かつスペクトル分解能及び一時的分解能間の兼合いを釣合わせることによってデ
ータ圧縮を最適化するように選択され得る。
の実施形態を例示する。この実勢形態では、サブバンド信号発生器170は、経
路1から受信される入力信号に応答して経路171-173に沿ってサブバンド 信号を発生させる。同様に、サブバンド信号発生器180は、経路2から受信さ
れる入力信号に応答して経路181-183に沿ってサブバンド信号を発生させ 、サブバンド信号発生器190は、経路3から受信される入力信号に応答して経
路191-193に沿ってサブバンド信号を発生させる。サブバンド発生器26 0は、経路171、181及び191から受信されるサブバンド信号に応答して
経路261に沿って合成サブバンド信号を発生させる。同様に、サブバンド発生
器270は、経路172,182及び192から受信されるサブバンド信号に応
答して経路271に沿って合成サブバンド信号を発生させ、サブバンド発生器2
80は、経路173,183及び193から受信されるサブバンド信号に応答し
て経路281に沿って合成サブバンド信号を発生させる。一実施形態では、サブ
バンド信号発生器260、270及び280は、サブバンド信号発生器170、
180及び190から受信するサブバンド信号の和を形成することによって合成
サブバンド信号を発生させる。合成サブバンド信号を形成する代わりの方法は以
下に述べる。合成サブバンド信号が発生される方法は、本発明の実施にとって決
定的ではなくかつ合成サブバンドは、何らかの形態のデータ圧縮を受けられ得る
。
この実施形態は、サブバンド信号発生器10、20及び30によって発生される
チャンネルサブバンド信号に応答して、合成信号発生器160が経路161に沿
って1つ又はそれ以上の合成信号を発生させることを除けば、図1に例示される
実施形態と同一である。一実施形態において、合成信号発生器160は、各入力
信号につき所定の周波数サブバンドにおいてチャンネルサブバンド信号を組合せ
、当該周波数サブバンドにつき合成サブバンド信号を発生させる。経路161に
沿って発生される1つ又はそれ以上の合成信号は、何らかのデータ圧縮を受けら れ得る。
フォーマッタ510は、経路501から受信される符号化された信号から1つ又 はそれ以上の合成信号及び空間特性信号を引き出す。示された一実施形態では、
合成信号が経路511に沿って送られ、空間特性信号が経路515及び516に
沿って送られる。サブバンド信号発生器520は、経路511から受信される合
成信号に応答して経路521及び522に沿って合成サブバンド信号を発生させ
る。空間デコーダ530は、経路515及び516から受信される空間特性信号
から複数の利得係数を引出し、合成信号を1つ又はそれ以上の中間サブバンド信 号にマップ(写像)するためにこれらの利得係数を用いる。中間信号発生器540
は、経路541、542及び543に沿って中間サブバンド信号を発生させ、中
間信号発生器550は、経路551、552及び553に沿って中間サブバンド
信号を発生させる。出力信号発生器560は、経路541及び551から受信さ
れる中間サブバンド信号に応答して経路561に沿って出力信号を発生させる。
同様に、出力信号発生器570は、経路542及び552から受信される中間サ
ブバンド信号に応答して経路571に沿って出力信号を発生させ、出力信号発生
器580は、経路543及び553から受信される中間サブバンド信号に応答し
て経路581に沿って出力信号を発生させる。
は全出力内にマップされるが、これは必要ではない。所与の中間サブバンド信号
が全出力信号内にマップされる必要はない。
なら、経路511に沿って送られる信号、経路521及び522に沿って送られ
るサブバンド信号につき、必要に応じて相補的形態のデータ拡張が適用され得る
。
変換技術が用いられ得る。出力信号発生器を実施するためには相補的技術又は逆
の技術が用いられる。
の実施形態は、デフォーマッタ510が符号化された信号から直接合成信号を引
出してこれらの信号を経路512及び513に沿って送ることを除けば、図5に
例示されたものと同一である。データ拡張は、必要に応じて合成サブバンド信号
に適用され得る。出力信号発生器の実施に用いられる逆濾波又は逆変換技術は、
符号化される信号内にアセンブルされた合成サブバンド信号を発生させるために
用いられる逆濾波又は逆変換技術と相補であるべきである。
は、例えば、ピーク振幅、平均振幅又は二乗平均平方根(RMS)でよい。他の実施 形態における第I信号は、音界に寄与する各「仮想」チャンネルサブバンド信号に
関する信号レベルの何らかの尺度を表す。仮想チャンネルは物理的実体として存
在する必要はないが、例えば、1つ又はそれ以上の物理的チャンネルからの信号 の加重和又はその他の組合せを表す概念上の実体であり得る。空間特性信号内の
要素数が音界に寄与する実際の物理的チャンネル数と等しい必要はないというこ
とが肝要な面である。
向及び多分音界幅の何らかの表示又は方向についての分散特性を表す。方向は、
例えば、3次元又は2次元空間におけるベクトルによって表され得る。
に対する尺度を含む。当該同一システムにおいて各々の周波数サブバンドに対す
る第II種空間特性信号は、1つ又はそれ以上の方向の表示を含む。各周波数サブ バンド内で1方向のみを表す実施形態においては、例えば、各バンドに対する第I
I種信号は、2次元又は3次元空間に対しデカルト座標又は極座標内のベクトルと して表され得る。
空間特性信号を発生させるプロセス(処理)では、音界方向が正確に決定され得る
ように各入力チャンネルによって表される音源の数及び位置につき知らされなけ
ればならない。
品質、出力チャンネル帯域幅、見掛けの方向数のような本質的にあらゆる規準に
基づいて選択され得る。第II種信号は、第I種信号を符号化するのに要するビッ
ト数と対照して第II種信号を符号化するのに要するビット数は概して少ないので
、低チャンネル帯域幅を有する多重チャンネルシステムで用いられ得る。しかし
、もし各々のサブバンドに対する音界が何らかの閾値数を超える数の方向を持つ
とみなされるなら、第I種信号はより少ないビットしか要しないであろう。
品質で再生されるならば、オーケストラの回りを飛ぶ一匹の蚊を表す他のチャン
ネルのオーデイオ情報は劣った品質で再生され得る。オーケストラを表すサブバ
ンド信号に対する空間特性信号は、第1形式で形成され、蚊を表すサブバンド信 号に対する空間特性信号は、第2形式で形成され得るであろう。
要するビット数は増加し、従って、サブバンド内の音界に対する見掛けの方向が
増加するにつれて、当該サブバンドに対しては概して第I種空間特性信号が望ま
しい。もし周波数サブバンド内で1つのチャンネルのみが意味のあるスペクトル エネルギを有するなら、当該サブバンド内の音界に対する見掛けの方向の数は1 つとみなされる。もし1つ又はそれ以上のチャンネルがそれぞれのサブバンドに おいて意味のあるエネルギを有するなら、当該サブバンド内のチャンネルの振幅
及び位相が単一音源を表すように相関づけられならば、見掛けの方向の数は同様
に1つとみなされる。
バンドにつき同一であるべき必要はない。さらに、当該関係は固定されるべき必
要はなく、入力特性又は出力チャンネル帯域幅のような各種の要件に応答して変
わり得る。単純な実施形態においては、それぞれの空間特性信号が各周波数サブ
バンドにつき発生され、当該サブバンド内のすべてのサブバンド信号に対応する
音界の空間特性を表す。
生される空間特性信号は、経路11、21及び31から受信されるチャンネルサ
ブバンド信号に相当する音界空間特性を表し、経路42に沿って発生される空間
特性信号は、経路12及び32から受信されるチャンネルサブバンド信号に相当
する音界空間特性を表す。この例の変形では、経路22から受信されるチャンネ
ルサブバンド信号に相当する音界空間特性を表すために他の空間特性信号が発生
される。
とみなされる見掛けの方向の数、見掛けの方向の知覚される幅、空間特性信号を
伝えるために得られるビット数に基づかれ得る。望ましい実施形態では、空間特
性信号を表すために選ばれる形態は、情報容量要件及び聴覚品質間の最良の兼合
いを与える。
率(レート)を制限することによって低減され得る。第I種信号に対しては、スペ
クトルレベル尺度が変わり得る率を制限するために一時的平滑化が適用される。
一時的平滑化は、これらの尺度の増加及び減少の双方を制限するために適用され
得るが、減少の一時的平滑化は該して増加の一時的平滑化より一層効果的でかつ
目立たない。第II種信号に対しては、空間において方向ベクトルが方位を変化し
得る率を制限するために一時的平滑化が適用される。情報容量要件は多くの方法
で低減され得る。
化され得る。その理由はこれら信号の要素が符号化及び伝送される頻度が低減さ
れ得るからである。デコーダは、内挿又は他の形態の濾波を用いて省略された要
素を回復し得る。さらに、差分符号化が用いられると、信号を表すのに要するビ
ット数が低減され得る。それは、一時的平滑化が連続する値間の差分のダイアナ
ミックレンジを制限するからであり、従って、差分コードを表すために少ないビ
ットしか要しない。
づく。例えば、結果的に生じるレベルが当該隠蔽閾値を超えないならば、レベル
を一時的後隠蔽閾値より下方に低減させ得る変化率は知覚的影響なしに低減され
得る。ある実施形態では、変化率が毎秒約120乃至140dBを超えないよう に制限される。他の実施形態では、過渡現象とみなされる事象に対しては増加率
への制限が緩和される。
間間隔以内で各種信号の振幅が、例えば、10dBを超えるなら、過渡現象が起 こったものとみなされる。このような信号には、入力信号、合成信号、1つ又は
それ以上のチャンネルサブバンド信号又は合成サブバンド信号、特に高周波サブ
バンドに対するサブバンド信号等がある。連続時間間隔につきスペクトル内容の
各種の尺度も同様に比較され得る。例えば、高周波係数を強調する変換係数の加
重和が隣接変換部ブロックにつき比較され得る。
とによって、空間特性信号の情報容量要件が低減され得る。第I種信号についで
は、隣接サブバンドにおける各々の信号レベル尺度間の差を制限するためにスペ
クトル平滑化が適用される。この技術は、サブバンドを横切る空間特性信号を表
すために差分符号化を用いる実施形態で効果的に用いられ得る。一方のサブバン
ドから他方に変わり得る情報量に限界点を課すことによって、差分コードを表す
ためにより少ないビットしか要しない点まで値間のダイナミックレンジの変化が
低減され得る。多くの実施形態において変化量の限界点は、チャンネルサブバン
ド信号を発生させるために用いられるフィルタバンク又は変換内の隣接サブバン
ド間のスペクトル漏洩によって内在的に課せられる。スペクトル包絡線の符号化
に適用されるスペクトル平滑化についての詳しい論議は米国特許第5,581,
653から入手され得る。
ロック符号化計画で用いられるブロックの長さを増加させることによって同様に
低減され得る。不幸にして、このようなブロック長の増加が符号化処理の一時的
分解能を低減させるので、区間特性信号及び下に横たわる音界間の一時的不同も
同様に増加する。ブロック内で起こる空間特性の意味のある変化を示す表示を符
号化される信号内に含めることによって、この誤差の効果は低減され得る。事実
上、当該表示はブロックの始め及び空間的変化の発生間における遅延量を表す。
相補的復号特性は以下で論議される。
合成サブバンド信号に分割される。その代わりに、合成サブバンド信号がエンコ
ーダ内で形成され、符号化された信号号からデコーダによって単に引き出される
。図6と共に上記論議を参照のこと。本発明の実施上いずれの方法も決定的では
ない。
合わされ得る。信号が組み合わされる一方法は、単純な和信号を形成するために
各チャンネルからの対応するデジタルサンプルを加えるか若しくは、その代わり
に、より複雑な和信号を形成するために各チャンネルからのサンプルの加重した
表現を加えることである。他の方法は、RMS信号を形成するために各チャンネ
ルからの対応するサンプルの二乗和の平方根をとることである。
を伝える信号等のパラメトリックな信号を発生させることである。デコーダ内で
適切な信号がパラメトリック信号から合成される。パラメトリック信号の発生が
正にデータ圧縮の別形態なので、本発明の実施上決定的な特定の技術はない。
サブバンド信号及び対応する第I種空間特性信号の情報容量要件は、それぞれの
空間特性信号内の最大要素により各合成サブバンド信号を正規化することによっ
て低減され得る。
特定の周波数サブバンドi内の信号パワーのRMS尺度を伝えると仮定する。こ
の例では、左、右及び中央チャンネルからのサブバンド信号に対するパワーの尺
度は、それぞれ、0.4、0.8及び0.1であり、3つのチャンネルからのサ
ブバンド信号を組合わせることによって得られる合成サブバンド信号に対するパ
ワーの尺度は、1.2である。合成サブバンド信号は当該特定の周波数サブバン
ド内の最大チャンネルサブバンド信号に対する尺度の合成サブバンド信号に対す
る以下の比Rによって位取りされる。、即ち、 R=0.8/1.2=2/3 正味の効果は、合成サブバンド信号に対する信号レベルの尺度が、本例では、
右チャンネルからのサブバンド信号である最大チャンネルサブバンド信号と同一
レベルに位取りされることである。位取りされた合成サブバンド信号は、所望の
通り符号化され得る。特定の周波数サブバンドに対する第I種空間特性信号は、
最大信号レベルに位取りされる各チャンネルサブバンド信号に対する信号レベル
を表す3つのベクトルを含む。本例では、空間特性信号ベクトルVは、それぞれ
左、右及び中央チャンネルサブバンド信号に対する相対レベルを表す以下の値を
有する。即ち、 V= (0.4/0.8,0.8/0.8,0.1/0.8)=(0.5,1.0,0.125) このべくとるは、所望の通り符号化され得る。一実施形態においてベクトルは、
各要素が5つのレベル、即ち、0dB、-3dB、-7dB、-10dB及び「オフ」
の1つを表す形に符号化される。他の実施形態では、ベクトル要素はは異なった
レベル数を表し得る。
は、空間特性信号から複数のゲインファクタ(利得係数)を引き出す。それらの利
得係数は、合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号内にマ ップする。利得係数の導出は、多くの方法で行われ得る。同方法は、用いられる
空間特性信号の種類と、出力チャンネルの数及び方位とに依存する。
と同一である第I種空間特性信号を用いるシステムにおいて利得係数は、空間特
性信号内で伝えられる信号レベルの尺度から簡単な方法で引き出され得る。もし
それぞれの周波数帯域に対する第I種空間特性信号が、各入力信号に対するパワ
ーの尺度を伝えるなら、各出力チャンネルに対する利得係数は第I種信号内の対
応するレベルに比例するであろう。
雑である。特定の周波数サブバンドに対する利得係数の可能な導出は、各入力チ
ャンネルに対してベクトルを形成し、各ベクトルがそれぞれの入力チャンネルの
空間的方位を表す方位を有しかつ第I種空間特性信号内に伝えられる信号レベル
のそれぞれの尺度による長さを有するようにすることである。これらのベクトル
の各々は、次いでそれぞれの出力チャンネルの空間的方位を表す方位を有する軸
上に投影される。各出力チャンネルに対する利得係数は、対応する軸上へ投影物
の合計から得られる。
な相違は、デコーダに入力チャンネルの空間方位を知らせる必要がないことがで
ある。
することによって特定の周波数サブバンドに対する1つ又はそれ以上の中間信号 が発生される。実際、当該サブバンド内の合成サブバンド信号に適切なを乗じる
ことによって、周波数サブバンド内の出力チャンネルに対する中間サブバンド信
号が発生される。利得計数は次式で与えられる、即ち、ISij=gij・XSj ここでISij=周波数サブバンドj内のチャンネルiに対する中間サブバンド信 号 gij=周波数サブバンドj内のチャンネルi用に引出された利得計数 XSj=周波数サブバンドj内の合成サブバンド信号 それぞれの出力チャンネルに対する所与の周波数サブバンド内の出力チャンネル
サブバンド信号は、当該周波数サブバンド内のすべての中間信号を加算すること
によって得られる。既に述べた通り、出力信号それ自体は、当該出力チャンネル
に対する出力チャンネルサブバンド信号に逆又は合成フィルタを適用することに
よって得られる。
ムでは、特定の聴覚効果を示すために当該特定のチャンネル及び周波数サブバン
ド内では音のエネルギが不要であることが確認された。所望の知覚効果を劣化さ
せることなくこれらの脱落(ドロップアウト)が導入される程度まで、本発明によ
って達成される符号化効率の利得が示される。
き声、ジッパー雑音及びその他の人工物が低減され得ることが分かっている。望
ましい実施形態では、人の聴覚システムの一時的隠蔽特性により利得計数値の変
化が制限される。例えば、結果的に生じるレベルが一時的後隠蔽閾値を超えない
とすれば、出力チャンネルサブバンド信号のレベル低下が当該隠蔽閾値より下方
に達することを許容する変化率が知覚可能な影響なしに低減され得る。ある実施
形態では、変化率が毎秒約120dB乃至140dBを超えないように制限される
。他の実施形態では、過渡現象とみなされる事象に関する増加率に対する限度が
緩和される。過渡現象は、上記のものを含めて色々な方法で検出し得る。
変化するスペクトル率を制限することによって改良され得る。この技術は、分析
・合成フィルタバンクを用いる符号化システムに対して特に有効であり、そこで は合成フィルタバンクの隣接サブバンドにおける周波数応答特性の重複がエイリ
アシング人工物を相殺するために用いられる。よく知られている例としてはQMF 及びTDAC変換がある。もし隣接サブバンドの信号が非常に異なった利得を受けや
すいなら、このような濾波システムのエイリアシング相殺特性は劣化される。隣
接サブバンドの利得が変わり得る量を制御することによって、エイリアシング相
殺の悪化は制御され得る。エイリアシング相殺濾波システムを用いる望ましい実
施形態では、相殺されないエイリアシング人工物が実質的に聴取不可能にされる
ように、所与の出力信号に対する隣接サブバンド間の利得の差が制限される。
ある事象が何時起こるかを示す表示をも含み得る。例えば、エンコーダは、ブロ
ックの始めと、過渡現象又は方向の急変のような事象の発生との間の遅延表示を
符号化される信号内に含み得る。このような表示に応答して、デコーダは時間領
域内の1つ又はそれ以上の信号に対し変化を適用し得る。デジタルフィルタを用 いる実施形態では、これらの変化は実質的に信号デフォーマットから出力信号発
生まで復号処理全体を通してあらゆる信号に適用され得る。ブロック変換を用い
る実施形態では、これらの変化は、サブバンド信号発生前の合成信号511、1 つ又はそれ以上の逆フィルタバンクから得られる出力信号に適用され得る。
。
。
構成図である。
号化しかつ符号化された信号を多重オーデイオ信号の高品質レプリカに復号する
方法及び装置を提供することにある。
成サブバンド信号と関連づけられかつ各々の合成サブバンド信号に対応する各々
の音界空間特性を表すようにし、空間特性信号から複数の利得係数を引き出し、
利得係数値の減少が人の聴覚系の一時的後隠蔽特性の減少に比例して制限される
ようにし、各々の利得係数により各々の合成サブバンド信号を1つ又はそれ以上 の中間サブバンド信号にマップ(写像)し、中間サブバンド信号に1つ又はそれ以 上の逆フィルタバンクを適用することによって複数の出力信号を発生させる。
即ち、第1種信号は、音界に寄与する各チャンネルサブバンド信号に関する信号
レベルの尺度を表す。信号レベルの尺度は、例えば、ピーク振幅、平均振幅又は
二乗平均平方根(RMS)でよい。他の実施形態における第1信号は、音界に寄与す る各「仮想」チャンネルサブバンド信号に関する信号レベルの何らかの尺度を表す
。仮想チャンネルは物理的実体として存在する必要はないが、例えば、1つ又は それ以上の物理的チャンネルからの信号の加重和又はその他の組合せを表す概念
上の実体であり得る。空間特性信号内の用素数が音界に寄与する実際の物理的チ
ャンネル数と等しい必要はないということが肝要な面である。
波数サブバンドに対する空間特性信号を発生させる。タイプは、必要なオーデイ
オ品質、出力チャンネル帯域幅、見掛けの方向数のような本質的にあらゆる規準
に基づいて選択され得る。第2種信号は、第1種信号を符号化するのに要するビ
ット数と対照して第2種信号を符号化するのに要するビット数は概して少ないの
で、低チャンネル帯域幅を有する多重チャンネルシステムで用いられ得る。しか
し、もし各々のサブバンドに対する音界が何らかの閾値数を超える数の方向を持
つとみなされるなら、第1種信号はより少ないビットしか要しないであろう。
性信号を適応的に形成する。適応は、周波数サブバンド内で表されるべきである
とみなされる見掛けの方向の数、見掛けの方向の知覚される幅、空間特性信号を
伝えるために得られるビット数に基づかれ得る。望ましい実施形態では、空間特
性信号を表すために選ばれる形態は、情報容量要件及び聴覚品質間の最良の兼合
いを与える。
Claims (46)
- 【請求項1】各々がそれぞれのオーデイオ情報チャンネルを表す複数の入力
信号を符号化することによって符号化された信号を発生させる方法であって、 複数の周波数サブバンド内の前記入力信号を表す複数のチャンネルサブバンド
信号を発生させ、 前記入力信号帯域幅の少なくとも一部を表す合成信号を発生させ、 周波数サブバンド内のそれぞれのチャンネルサブバンド信号に応答して音界の
空間特性を表す空間特性信号を発生させ、信号レベルを表す前記情報値の減少が
人の聴覚系の一時的後隠蔽特性の減少と比例して制限されるように、前記空間特
性信号が前記それぞれのチャンネルサブバンドの前記信号レベルを表す情報を伝
えるようにし、 前記合成信号及び前記空間特性信号を前記符号化された信号内にアセンブルす
ることから成る符号化信号発生方法。 - 【請求項2】各々がそれぞれのオーデイオ情報チャンネルを表す複数の入力
信号を符号化することによって符号化された信号を発生させる方法であって、 複数の周波数サブバンド内の前記入力信号を表す複数のチャンネルサブバンド
信号を発生させ、 前記入力信号帯域幅の少なくとも一部を表す合成信号を発生させ、 周波数サブバンド内のそれぞれのチャンネルサブバンド信号に応答して音界の
空間特性を表す空間特性信号を発生させ、前記空間特性信号が、前記それぞれの
チャンネルサブバンド信号の信号レベルを表す情報を伝える第1形態で発生され かつ1つ又はそれ以上の意図する方向を表す第2形態で発生されるようにし、 前記合成信号、前記空間特性信号及び前記空間特性信号形態を示す表示を前記
符号化された信号内にアセンブルすることから成る符号化信号発生方法。 - 【請求項3】それぞれの周波数サブバンド内の前記それぞれのチャンネルサ
ブバンド信号に応答して、もし前記音界が閾値数より大きい数の見掛けの方向を
有するとみなされるなら前記空間特性信号が前記第1形態で発生され、さもなけ れば前記第2形態で発生される、請求項2の方法。 - 【請求項4】前記閾値数が1であり、前記それぞれのチャンネルサブバンド 信号の1つのみが意味のあるスペクトルエネルギを有するとき若しくは意味のあ るスペクトルエネルギを有する前記それぞれのチャンネルサブバンド信号が相関
された振幅及び相関された位相をも有するとき前記音界は1つの見掛けの方向を 有するとみなされる、請求項3の方法。 - 【請求項5】前記それぞれの空間特性信号が前記第2形態で発生され、それ が意図した方向の回りの音界分散の尺度をも表す、請求項2の方法。
- 【請求項6】前記それぞれの空間特性信号が前記第1形態で発生され、前記 信号レベルを表す前記情報の値の減少が人の聴覚系の一時的後隠蔽特性の減少と
比例して制限されるようにされる、請求項2の方法。 - 【請求項7】前記合成信号がそれぞれの周波数サブバンド内の2つ又はそれ 以上のチャンネルサブバンド信号を組み合せることによって発生される、請求項
1又は2のいずれか1つの方法。 - 【請求項8】前記合成信号は、広帯域幅信号にフィルタバンク又は変換を適
用することによって発生されるサブバンド信号であり、前記広帯域幅信号が2つ 又はそれ以上の前記入力信号を組合わせることによって形成される、請求項1又 は2のいずれか1つの方法。 - 【請求項9】前記合成信号は、2つ又はそれ以上の前記入力信号にフィルタ バンク又は変換を適用することによって得られるサブバンド信号を組合わせるこ
とによって発生される、請求項1又は2のいずれかの方法。 - 【請求項10】前合成信号がパラメトリック信号である、請求項1又は2のい
ずれか1つの方法。 - 【請求項11】前記チャンネルサブバンド信号が、前記入力信号に1つ又は それ以上の離散変換を適用することによって変換係数のブロックとして発生され
る、請求項1又は2のいずれか1つの方法。 - 【請求項12】前記周波数サブバンドの帯域幅が人の聴覚システムの臨界帯
域幅に相当する、請求項1又は2のいずれか1つの方法。 - 【請求項13】前記それぞれのチャンネルサブバンド信号の各々が前記入力
信号の共通時間間隔に応答して発生され、前記それぞれの音界において振幅又は
方向の突然変化が前記共通時間間隔内のどこで起こるかを示す遅延信号を発生さ
せ、前記遅延信号を前記符号化された信号内にアセンブルすることをさらに含む
、請求項1又は2のいずれか1つの方法。 - 【請求項14】前記合成信号は、それぞれの周波数サブバンドに相当するサ
ブバンド信号であり、最大尺度を有する当該それぞれの周波数サブバンド内のチ
ャンネルサブバンドに対する信号レベルの尺度に関して、前記合成信号によって
伝えられる情報を正規化することをさらに含む、請求項1又は2のいずれか1つの
方法。 - 【請求項15】複数の隣接周波数サブバンドに相当する前記空間特性信号の
差分符号化された表現を発生させることをさらに含み、前記差分符号化された表
現が、隣接周波数サブバンド内の前記チャンネルサブバンド信号間のスペクトル
漏洩特性により制限されるダイナミックレンジを有する1つ又はそれ以上のコー
ドを含む、請求項1又は2のいずれか1つの方法。 - 【請求項16】1つ又はそれ以上の出力トランスジューサを介して表現する ために1つ又はそれ以上の出力信号を発生させる符号化された信号を復号する方 法であって、 前記符号化された信号から1つ又はそれ以上の合成信号及び複数の空間特性信 号を入手し、各空間特性信号がそれぞれの合成サブバンド信号と関連づけられ、
前記それぞれの合成サブバンド信号に相当するそれぞれの音界の空間特性を表す
ようにし、 前記空間特性信号から複数の利得係数を引出し、前記利得係数の値の減少が人
の聴覚系の一時的後隠蔽特性の減少に比例するように制限され、それぞれの利得
係数によりそれぞれの合成サブバンド信号を1つ又はそれ以上の中間サブバンド 信号内にマップするようにし、 前記中間サブバンド信号に1つ又はそれ以上の額フィルタバンクを適用するこ とによって前記複数の出力信号を発生させることから成る復号方法。 - 【請求項17】1つ又はそれ以上の出力トランスジューサを介して表現する ために1つ又はそれ以上の出力信号を発生させる符号化された信号を復号する方 法であって、 前記符号化された信号から1つ又はそれ以上の合成信号、複数の空間特性信号 及び前記空間特性信号の形態を示す表示を入手し、各空間特性信号がそれぞれの
合成サブバンド信号と関連づけられ、前記それぞれの合成サブバンド信号に相当
するそれぞれの音界の空間特性を表すようにし、前記表示が前記空間特性信号が
、複数の信号レベルを表す第1形態、1つ又はっそれ以上の方向を表す第2形態で あるかどうかを示すようにし、 前記空間特性信号から複数の利得係数を引出し、それぞれの利得係数によりそ
れぞれの合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号内にマッ プし、前記第1形態を有する前記関連する空間特性信号に対しても、前記マッピ ングが前記信号レベル及び前記出力トランスジューサの空間構成を表すトランス
ジューサ構成構成信号と関連する空間特性信号によるようにし、前記第2形態を
有する前記関連する空間特性信号に対しても、前記マッピングが前記1つ又はそ れ以上の方向及び前記出力トランスジューサ構成信号によるようにし、 前記中間サブバンド信号に1つ又はそれ以上の逆フィルタバンクを適用するこ とによって前記複数の出力信号を発生させることから成る復号方法。 - 【請求項18】前記利得係数の値の減少が、人の聴覚系の一時的後隠蔽特性
の減少に比例するように制限される、請求項17の方法。 - 【請求項19】前記合成サブバンド信号が、前記1つ又はそれ以上の合成信 号にフィルタバンク又は変換を適用することによって引出される、請求項16又 は17のいずれか1つの方法。
- 【請求項20】前記合成信号がパラメトリック信号であり、前記引出す段階
がそれに応答してスペクトル又は一時的信号を発生させることを含む、請求項1 6又は17のいずれか1つの方法。 - 【請求項21】前記符号化された信号から遅延信号を入手し、前記遅延信号
に応答して前記それぞれの合成信号のマッピングを遅延させることをさらに含む
、請求項16又は17のいずれか1つの方法。 - 【請求項22】前記中間サブバンド信号が、人の聴覚系の臨界帯域幅に比例
する帯域幅を有する、請求項16又は17のいずれか1つの方法。 - 【請求項23】前記出力信号は、エイリアシング相殺特性を有する逆フィル
タバンクを適用するか若しくはエイリアシング相殺特性を有する逆変換を適用す
ることによって発生され、不完全なエイリアシング相殺から結果的に生じるノイ
ズが聴取不可能にされるように、前記マッピングが隣接周波数サブバンド内の中
間サブバンド信号レベル間の差を制限する。 - 【請求項24】各々がそれぞれのオーデイオ情報チャンネルを表す複数の入
力信号を符号化することによって符号化された信号を発生させるエンコーダであ
って、 複数の周波数サブバンド内の前記入力信号を表す複数のチャンネルサブバンド
信号を発生させる手段と、 前記入力信号帯域幅の少なくとも一部を表す合成信号を発生させる手段と、 周波数サブバンド内のそれぞれのチャンネルサブバンド信号に応答して音界の
空間特性を表す空間特性信号を発生させる手段であって、信号レベルを表す前記
情報値の減少が人の聴覚系の一時的後隠蔽特性の減少と比例して制限されるよう
に、前記空間特性信号が前記それぞれのチャンネルサブバンドの前記信号レベル
を表す情報を伝えるようにする空間特性信号発生手段と、 前記合成信号及び前記空間特性信号を前記符号化された信号内にアセンブルす
る手段とから成る符号化信号発生エンコーダ。 - 【請求項25】各々がそれぞれのオーデイオ情報チャンネルを表す複数の入
力信号を符号化することによって符号化された信号を発生させるエンコーダであ
って、 複数の周波数サブバンド内の前記入力信号を表す複数のチャンネルサブバンド
信号を発生させる手段と、 前記入力信号帯域幅の少なくとも一部を表す合成信号を発生させる手段と、 周波数サブバンド内のそれぞれのチャンネルサブバンド信号に応答して音界の
空間特性を表す空間特性信号を発生させる手段であって、前記空間特性信号が、
前記それぞれのチャンネルサブバンド信号の信号レベルを表す情報を伝える第1 形態で発生されかつ1つ又はそれ以上の意図する方向を表す第2形態で発生される
ようにする空間特性信号発生手段と、 前記合成信号、前記空間特性信号及び前記空間特性信号形態を示す表示を前記
符号化された信号内にアセンブルする手段とから成る符号化信号発生エンコーダ
。 - 【請求項26】それぞれの周波数サブバンド内の前記それぞれのチャンネル
サブバンド信号に応答して、もし前記音界が閾値数より大きい数の見掛けの方向
を有するとみなされるなら前記空間特性信号が前記第1形態で発生され、さもな ければ前記第2形態で発生される、請求項25のエンコーダ。 - 【請求項27】前記閾値数が1であり、前記それぞれのチャンネルサブバン ド信号の1つのみが意味のあるスペクトルエネルギを有するとき若しくは意味の あるスペクトルエネルギを有する前記それぞれのチャンネルサブバンド信号が相
関された振幅及び相関された位相をも有するとき前記音界は1つの見掛けの方向 を有するとみなされる、請求項26のエンコーダ。 - 【請求項28】前記それぞれの空間特性信号が前記第2形態で発生され、そ れが意図した方向の回りの音界分散の尺度をも表す、請求項25のエンコーダ。
- 【請求項29】前記それぞれの空間特性信号が前記第1形態で発生され、前 記信号レベルを表す前記情報の値の減少が人の聴覚系の一時的後隠蔽特性の減少
と比例して制限されるようにされる、請求項25のエンコーダ。 - 【請求項30】前記合成信号を発生させるためにがそれぞれの周波数サブバ
ンド内の2つ又はそれ以上のチャンネルサブバンド信号を組み合せる手段をさら に含む、請求項24又は25のいずれか1つのエンコーダ。 - 【請求項31】2つ又はそれ以上の前記入力信号を組合わせることによって 前記合成信号を発生させる手段と、広帯域幅信号にフィルタバンク又は変換を適
用することに前記合成信号を発生させる手段とをさらに含む、請求項24又は2 5のいずれか1つのエンコーダ。 - 【請求項32】2つ又はそれ以上の前記入力信号にフィルタバンク又は変換 を適用する手段と、前記フィルタバンク又は前記変換を適用することによって得
られるサブバンド信号を組合わせることによって前記合成信号を発生させる手段
とをさらに含む、請求項24又は25のいずれか1つのエンコーダ。 - 【請求項33】前記合成信号がパラメトリック信号である、請求項24又は
25のいずれか1つのエンコーダ。 - 【請求項34】前記チャンネルサブバンド信号を変換係数のブロックとして
発生させるために前記入力信号に1つ又はそれ以上の離散変換を適用する手段を さらに含む、請求項24又は25のいずれか1つのエンコーダ。 - 【請求項35】前記周波数サブバンドの帯域幅が人の聴覚系の臨界帯域幅に
相当する、請求項24又は25のいずれか1つのエンコーダ。 - 【請求項36】前記それぞれのチャンネルサブバンド信号の各々が前記入力
信号の共通時間間隔に応答して発生され、前記それぞれの音界において振幅又は
方向の突然変化が前記共通時間間隔内のどこで起こるかを示す遅延信号を発生さ
せる手段と、前記遅延信号を前記符号化された信号内にアセンブルする手段とを
さらに含む1、請求項24又は25のいずれか1つのエンコーダ。 - 【請求項37】前記合成信号は、それぞれの周波数サブバンドに相当するサ
ブバンド信号であり、最大尺度を有する当該それぞれの周波数サブバンド内のチ
ャンネルサブバンドに対する信号レベルの尺度に関して、前記合成信号によって
伝えられる情報を正規化する手段をさらに含む、請求項24又は25のいずれか 1つの方法。 - 【請求項38】複数の隣接周波数サブバンドに相当する前記空間特性信号の
差分符号化された表現を発生させる手段をさらに含み、前記差分符号化された表
現が、隣接周波数サブバンド内の前記チャンネルサブバンド信号間のスペクトル
漏洩特性により制限されるダイナミックレンジを有する1つ又はそれ以上のコー
ドを含む、請求項24又は25のいずれか1つの方法。 - 【請求項39】1つ又はそれ以上の出力トランスジューサを介して表現する ために1つ又はそれ以上の出力信号を発生させる符号化された信号を復号するデ コーダであって、 前記符号化された信号から1つ又はそれ以上の合成信号及び複数の空間特性信 号を入手し、前記1つ又はそれ以上の合成信号複数の合成サブバンド信号を引出 す手段であって、各空間特性信号がそれぞれの合成サブバンド信号と関連づけら
れ、前記それぞれの合成サブバンド信号に相当するそれぞれの音界の空間特性を
表すようにする合成サブバンド信号手段と、 前記空間特性信号から複数の利得係数を引出す手段であって、前記利得係数の
値の減少が人の聴覚系の一時的後隠蔽特性の減少に比例するように制限され、そ
れぞれの利得係数によりそれぞれの合成サブバンド信号を1つ又はそれ以上の中 間サブバンド信号内にマップするようにする利得係数手段と、 前記中間サブバンド信号に1つ又はそれ以上の額フィルタバンクを適用するこ とによって前記複数の出力信号を発生させることから成る復号方法。 - 【請求項40】1つ又はそれ以上の出力トランスジューサを介して表現する ために1つ又はそれ以上の出力信号を発生させる符号化された信号を復号するデ コーダであって、 前記符号化された信号から1つ又はそれ以上の合成信号と、複数の空間特性信 号及び該空間特性信号の形態の表示とを入手し、前記1つ又はそれ以上の合成信 号から複数の合成サブバンド信号を引出す手段であって、各空間特性信号がそれ
ぞれの合成サブバンド信号と関連づけられ、前記それぞれの合成サブバンド信号
に相当するそれぞれの音界の空間特性を表し、前記表示は、前記空間特性信号が
複数の信号を表す第1形態であるか、1つ又はそれ以上の方向を表す第2形態であ るかどうかを表すようにする合成サブバンド信号手段と、 前記空間特性信号から複数の利得係数を引出し、それぞれの利得係数によりそ
れぞれのが合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号にマッ プする手段であって、前記第1形態を有する前記関連する空間信号に対しては、 同様に前記マッピングも、前記信号レベルと関連する空間構成信号及び前記出力
トランスジューサの空間構成を表すトランスジューサ構成信号により、前記第2
形態を有する前記関連する空間信号に対しては、同様に前記マッピングも、前記
1つ又はそれ以上の方向及び前記トランスジューサ構成信号によるようにする引 出し・マップ手段と、前記中間サブバンド信号に1つ又はそれ以上の逆フィルタバ
ンクを適用することによって前記複数の出力信号を発生させることから成る復号
方法。 - 【請求項41】前記利得係数の値の減少が、人の聴覚系の一時的後隠蔽特性
の減少と比例するように制限される、請求項40のデコーダ。 - 【請求項42】前記合成サブバンド信号を引出すために1つ又はそれ以上の 合成信号にフィルタバンク又は変換を適用する手段をさらに含む、請求項39又
は40のいずれか1つのデコーダ。 - 【請求項43】前記合成信号がパラメトリック信号であり、前記引出し手段
がそれに応答してスペクトル又は一時的信号をも発生させる、請求項39又は4
0のいずれか1つのデコーダ。 - 【請求項44】前記符号化された信号から遅延信号を入手し、前記遅延信号
に応答して前記それぞれの合成信号のマッピングを遅延させる手段をさらに含む
、請求項39又は40のいずれか1つのデコーダ。 - 【請求項45】前記中間サブバンド信号が、人の聴覚系の臨界帯域帯域幅と
比例する帯域幅を有する、請求項39又は40のいずれか1つのデコーダ。 - 【請求項46】前記出力信号を発生させるために、エイリアシング特性を有
する逆フィルタバンク又はエイリアシング相殺特性を有する逆変換を適用させる
手段をさらに含み、前記マッピング手段が連接周波数サブバンド内の前記中間サ
ブバンド信号レベル間の差を限定し、不完全なエイリアシング相殺から結果的に
生じるノイズを聴取不能にさせるようにする、請求項39又は40のいずれか1 つのデコーダ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/895,496 US5890125A (en) | 1997-07-16 | 1997-07-16 | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
US08/895,496 | 1997-07-16 | ||
PCT/US1998/008647 WO1999004498A2 (en) | 1997-07-16 | 1998-06-19 | Method and apparatus for encoding and decoding multiple audio channels at low bit rates |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001510953A true JP2001510953A (ja) | 2001-08-07 |
JP2001510953A5 JP2001510953A5 (ja) | 2006-01-05 |
JP4223679B2 JP4223679B2 (ja) | 2009-02-12 |
Family
ID=25404588
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000503606A Expired - Fee Related JP4223679B2 (ja) | 1997-07-16 | 1998-06-19 | 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置 |
Country Status (12)
Country | Link |
---|---|
US (1) | US5890125A (ja) |
EP (1) | EP1016320B1 (ja) |
JP (1) | JP4223679B2 (ja) |
KR (1) | KR100550399B1 (ja) |
CN (1) | CN1151705C (ja) |
AT (1) | ATE215295T1 (ja) |
AU (1) | AU746416B2 (ja) |
CA (1) | CA2295505C (ja) |
DE (1) | DE69804478T2 (ja) |
DK (1) | DK1016320T3 (ja) |
ES (1) | ES2171031T3 (ja) |
WO (1) | WO1999004498A2 (ja) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007533221A (ja) * | 2004-04-16 | 2007-11-15 | コーディング テクノロジーズ アクチボラゲット | 低ビットレート用パラメトリック表現の生成方法 |
JP2008511849A (ja) * | 2005-04-15 | 2008-04-17 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネルシンセサイザ制御信号を発生するための装置および方法並びにマルチチャネル合成のための装置および方法 |
JP2008536183A (ja) * | 2005-04-15 | 2008-09-04 | コーディング テクノロジーズ アクチボラゲット | 無相関信号の包絡線整形 |
JP2009503615A (ja) * | 2005-08-02 | 2009-01-29 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 聴覚事象の関数としての空間的オーディオコーディングパラメータの制御 |
JP2009171610A (ja) * | 2002-09-18 | 2009-07-30 | Dolby Sweden Ab | 実数値のフィルタバンクにおけるスペクトルエンベロープ調整によって生じたエイリアシングを低減するための方法 |
US10403295B2 (en) | 2001-11-29 | 2019-09-03 | Dolby International Ab | Methods for improving high frequency reconstruction |
Families Citing this family (113)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6466912B1 (en) * | 1997-09-25 | 2002-10-15 | At&T Corp. | Perceptual coding of audio signals employing envelope uncertainty |
DE69935892D1 (de) * | 1998-03-31 | 2007-06-06 | Koninkl Philips Electronics Nv | Veränderung von kodierten daten |
US6757326B1 (en) * | 1998-12-28 | 2004-06-29 | Motorola, Inc. | Method and apparatus for implementing wavelet filters in a digital system |
US6246345B1 (en) * | 1999-04-16 | 2001-06-12 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
US6405163B1 (en) * | 1999-09-27 | 2002-06-11 | Creative Technology Ltd. | Process for removing voice from stereo recordings |
US8767969B1 (en) * | 1999-09-27 | 2014-07-01 | Creative Technology Ltd | Process for removing voice from stereo recordings |
SG98418A1 (en) * | 2000-07-10 | 2003-09-19 | Cyberinc Pte Ltd | A method, a device and a system for compressing a musical and voice signal |
US6377637B1 (en) * | 2000-07-12 | 2002-04-23 | Andrea Electronics Corporation | Sub-band exponential smoothing noise canceling system |
GB0102230D0 (en) * | 2001-01-29 | 2001-03-14 | Hewlett Packard Co | Sound related systems and methods |
US7308325B2 (en) | 2001-01-29 | 2007-12-11 | Hewlett-Packard Development Company, L.P. | Audio system |
US7660424B2 (en) * | 2001-02-07 | 2010-02-09 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7644003B2 (en) * | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
US7333929B1 (en) | 2001-09-13 | 2008-02-19 | Chmounk Dmitri V | Modular scalable compressed audio data stream |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US7240001B2 (en) | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
DE10163569A1 (de) * | 2001-12-21 | 2003-11-06 | Endress & Hauser Gmbh & Co Kg | Verfahren zur Bestimmung und/oder Überwachung einer physikalischen oder chemischen Prozeßgröße |
EP1470550B1 (en) * | 2002-01-30 | 2008-09-03 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device and methods thereof |
KR20030068308A (ko) * | 2002-02-15 | 2003-08-21 | 주식회사 엘지이아이 | 음성 코덱을 이용한 그래픽 표시장치 및 방법 |
US7328151B2 (en) | 2002-03-22 | 2008-02-05 | Sound Id | Audio decoder with dynamic adjustment of signal modification |
ES2323294T3 (es) | 2002-04-22 | 2009-07-10 | Koninklijke Philips Electronics N.V. | Dispositivo de decodificacion con una unidad de decorrelacion. |
CN1647156B (zh) * | 2002-04-22 | 2010-05-26 | 皇家飞利浦电子股份有限公司 | 参数编码方法、参数编码器、用于提供音频信号的设备、解码方法、解码器、用于提供解码后的多声道音频信号的设备 |
US7257231B1 (en) * | 2002-06-04 | 2007-08-14 | Creative Technology Ltd. | Stream segregation for stereo signals |
CN1669358A (zh) * | 2002-07-16 | 2005-09-14 | 皇家飞利浦电子股份有限公司 | 音频编码 |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
EP2665294A2 (en) * | 2003-03-04 | 2013-11-20 | Core Wireless Licensing S.a.r.l. | Support of a multichannel audio extension |
SE0301273D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
BR122018007834B1 (pt) * | 2003-10-30 | 2019-03-19 | Koninklijke Philips Electronics N.V. | Codificador e decodificador de áudio avançado de estéreo paramétrico combinado e de replicação de banda espectral, método de codificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, sinal de áudio avançado codificado de estéreo paramétrico combinado e de replicação de banda espectral, método de decodificação avançada de áudio de estéreo paramétrico combinado e de replicação de banda espectral, e, meio de armazenamento legível por computador |
US7539614B2 (en) * | 2003-11-14 | 2009-05-26 | Nxp B.V. | System and method for audio signal processing using different gain factors for voiced and unvoiced phonemes |
US7970144B1 (en) | 2003-12-17 | 2011-06-28 | Creative Technology Ltd | Extracting and modifying a panned source for enhancement and upmix of audio signals |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
EP1711938A1 (en) * | 2004-01-28 | 2006-10-18 | Koninklijke Philips Electronics N.V. | Audio signal decoding using complex-valued data |
US20090299756A1 (en) * | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
KR101079066B1 (ko) * | 2004-03-01 | 2011-11-02 | 돌비 레버러토리즈 라이쎈싱 코오포레이션 | 멀티채널 오디오 코딩 |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
WO2005098821A2 (en) * | 2004-04-05 | 2005-10-20 | Koninklijke Philips Electronics N.V. | Multi-channel encoder |
EP1895512A3 (en) * | 2004-04-05 | 2014-09-17 | Koninklijke Philips N.V. | Multi-channel encoder |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
US7490044B2 (en) * | 2004-06-08 | 2009-02-10 | Bose Corporation | Audio signal processing |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
US7536302B2 (en) * | 2004-07-13 | 2009-05-19 | Industrial Technology Research Institute | Method, process and device for coding audio signals |
TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
KR101177677B1 (ko) * | 2004-10-28 | 2012-08-27 | 디티에스 워싱턴, 엘엘씨 | 오디오 공간 환경 엔진 |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
KR101215868B1 (ko) * | 2004-11-30 | 2012-12-31 | 에이저 시스템즈 엘엘시 | 오디오 채널들을 인코딩 및 디코딩하는 방법, 및 오디오 채널들을 인코딩 및 디코딩하는 장치 |
JP5017121B2 (ja) * | 2004-11-30 | 2012-09-05 | アギア システムズ インコーポレーテッド | 外部的に供給されるダウンミックスとの空間オーディオのパラメトリック・コーディングの同期化 |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
JP4809370B2 (ja) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
US7961890B2 (en) * | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
US8090586B2 (en) * | 2005-05-26 | 2012-01-03 | Lg Electronics Inc. | Method and apparatus for embedding spatial information and reproducing embedded signal for an audio signal |
JP4988717B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
WO2006126843A2 (en) * | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method and apparatus for decoding audio signal |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
US8185403B2 (en) * | 2005-06-30 | 2012-05-22 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
US8494667B2 (en) * | 2005-06-30 | 2013-07-23 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
AU2006266655B2 (en) * | 2005-06-30 | 2009-08-20 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
US8081764B2 (en) * | 2005-07-15 | 2011-12-20 | Panasonic Corporation | Audio decoder |
JP5173811B2 (ja) * | 2005-08-30 | 2013-04-03 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
US7761303B2 (en) * | 2005-08-30 | 2010-07-20 | Lg Electronics Inc. | Slot position coding of TTT syntax of spatial audio coding application |
US7788107B2 (en) * | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
JP4859925B2 (ja) * | 2005-08-30 | 2012-01-25 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号デコーディング方法及びその装置 |
US7696907B2 (en) * | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
KR100878828B1 (ko) * | 2005-10-05 | 2009-01-14 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7672379B2 (en) * | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
US7751485B2 (en) | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
US7646319B2 (en) * | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
KR20070038439A (ko) * | 2005-10-05 | 2007-04-10 | 엘지전자 주식회사 | 신호 처리 방법 및 장치 |
US8068569B2 (en) * | 2005-10-05 | 2011-11-29 | Lg Electronics, Inc. | Method and apparatus for signal processing and encoding and decoding |
US7761289B2 (en) * | 2005-10-24 | 2010-07-20 | Lg Electronics Inc. | Removing time delays in signal paths |
US7676360B2 (en) * | 2005-12-01 | 2010-03-09 | Sasken Communication Technologies Ltd. | Method for scale-factor estimation in an audio encoder |
TWI469133B (zh) * | 2006-01-19 | 2015-01-11 | Lg Electronics Inc | 媒體訊號處理方法及裝置 |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
KR20080110920A (ko) * | 2006-02-07 | 2008-12-19 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
US20090276210A1 (en) * | 2006-03-31 | 2009-11-05 | Panasonic Corporation | Stereo audio encoding apparatus, stereo audio decoding apparatus, and method thereof |
US8712061B2 (en) * | 2006-05-17 | 2014-04-29 | Creative Technology Ltd | Phase-amplitude 3-D stereo encoder and decoder |
US9697844B2 (en) * | 2006-05-17 | 2017-07-04 | Creative Technology Ltd | Distributed spatial audio decoder |
US8374365B2 (en) * | 2006-05-17 | 2013-02-12 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
DE602007010330D1 (de) * | 2006-09-14 | 2010-12-16 | Lg Electronics Inc | Dialogerweiterungsverfahren |
DE602007011955D1 (de) * | 2006-09-25 | 2011-02-24 | Dolby Lab Licensing Corp | Ür mehrkanal-tonwiedergabesysteme mittels ableitung von signalen mit winkelgrössen hoher ordnung |
US9015051B2 (en) | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
US8908873B2 (en) | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US8290167B2 (en) | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
WO2009067741A1 (en) * | 2007-11-27 | 2009-06-04 | Acouity Pty Ltd | Bandwidth compression of parametric soundfield representations for transmission and storage |
CN101527327B (zh) * | 2008-03-07 | 2012-09-19 | 清华大学 | 太阳能电池 |
JP4661901B2 (ja) * | 2008-04-18 | 2011-03-30 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びに信号処理システム |
CA2754671C (en) | 2009-03-17 | 2017-01-10 | Dolby International Ab | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
TWI556227B (zh) | 2009-05-27 | 2016-11-01 | 杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
US9105300B2 (en) | 2009-10-19 | 2015-08-11 | Dolby International Ab | Metadata time marking information for indicating a section of an audio object |
US8759661B2 (en) | 2010-08-31 | 2014-06-24 | Sonivox, L.P. | System and method for audio synthesizer utilizing frequency aperture arrays |
EP2661746B1 (en) * | 2011-01-05 | 2018-08-01 | Nokia Technologies Oy | Multi-channel encoding and/or decoding |
US8653354B1 (en) * | 2011-08-02 | 2014-02-18 | Sonivoz, L.P. | Audio synthesizing systems and methods |
WO2013186593A1 (en) | 2012-06-14 | 2013-12-19 | Nokia Corporation | Audio capture apparatus |
WO2014159898A1 (en) * | 2013-03-29 | 2014-10-02 | Dolby Laboratories Licensing Corporation | Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals |
CN104681032B (zh) * | 2013-11-28 | 2018-05-11 | 中国移动通信集团公司 | 一种语音通信方法和设备 |
EP3332557B1 (en) | 2015-08-07 | 2019-06-19 | Dolby Laboratories Licensing Corporation | Processing object-based audio signals |
NO343581B1 (no) * | 2017-03-01 | 2019-04-08 | Dolby Int Ab | Fremgangsmåte, anordning og program til spektralinnhyllingsjustering |
US10984808B2 (en) * | 2019-07-09 | 2021-04-20 | Blackberry Limited | Method for multi-stage compression in sub-band processing |
CN115472170A (zh) * | 2021-06-11 | 2022-12-13 | 华为技术有限公司 | 一种三维音频信号的处理方法和装置 |
CN113873420B (zh) * | 2021-09-28 | 2023-06-23 | 联想(北京)有限公司 | 音频数据处理方法及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
NL9000338A (nl) * | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
US5539829A (en) * | 1989-06-02 | 1996-07-23 | U.S. Philips Corporation | Subband coded digital transmission system using some composite signals |
US5632005A (en) * | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
US5274740A (en) * | 1991-01-08 | 1993-12-28 | Dolby Laboratories Licensing Corporation | Decoder for variable number of channel presentation of multidimensional sound fields |
SG49883A1 (en) * | 1991-01-08 | 1998-06-15 | Dolby Lab Licensing Corp | Encoder/decoder for multidimensional sound fields |
US5581653A (en) * | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
ES2143673T3 (es) * | 1994-12-20 | 2000-05-16 | Dolby Lab Licensing Corp | Metodo y aparato para aplicar una prediccion de formas de onda a subbandas de un sistema codificador perceptual. |
-
1997
- 1997-07-16 US US08/895,496 patent/US5890125A/en not_active Expired - Lifetime
-
1998
- 1998-06-19 WO PCT/US1998/008647 patent/WO1999004498A2/en active IP Right Grant
- 1998-06-19 CA CA002295505A patent/CA2295505C/en not_active Expired - Fee Related
- 1998-06-19 ES ES98931197T patent/ES2171031T3/es not_active Expired - Lifetime
- 1998-06-19 DE DE69804478T patent/DE69804478T2/de not_active Expired - Lifetime
- 1998-06-19 CN CNB988072599A patent/CN1151705C/zh not_active Expired - Fee Related
- 1998-06-19 DK DK98931197T patent/DK1016320T3/da active
- 1998-06-19 AT AT98931197T patent/ATE215295T1/de active
- 1998-06-19 KR KR1019997012376A patent/KR100550399B1/ko not_active IP Right Cessation
- 1998-06-19 EP EP98931197A patent/EP1016320B1/en not_active Expired - Lifetime
- 1998-06-19 AU AU81380/98A patent/AU746416B2/en not_active Ceased
- 1998-06-19 JP JP2000503606A patent/JP4223679B2/ja not_active Expired - Fee Related
Cited By (24)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US10403295B2 (en) | 2001-11-29 | 2019-09-03 | Dolby International Ab | Methods for improving high frequency reconstruction |
US8498876B2 (en) | 2002-09-18 | 2013-07-30 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US10013991B2 (en) | 2002-09-18 | 2018-07-03 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US8346566B2 (en) | 2002-09-18 | 2013-01-01 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
JP2009171610A (ja) * | 2002-09-18 | 2009-07-30 | Dolby Sweden Ab | 実数値のフィルタバンクにおけるスペクトルエンベロープ調整によって生じたエイリアシングを低減するための方法 |
US10685661B2 (en) | 2002-09-18 | 2020-06-16 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
JP2011010346A (ja) * | 2002-09-18 | 2011-01-13 | Dolby Internatl Ab | 実数値のフィルタバンクにおけるスペクトルエンベロープ調整によって生じたエイリアシングを低減するための方法 |
US10418040B2 (en) | 2002-09-18 | 2019-09-17 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US10157623B2 (en) | 2002-09-18 | 2018-12-18 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US10115405B2 (en) | 2002-09-18 | 2018-10-30 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US9990929B2 (en) | 2002-09-18 | 2018-06-05 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US9842600B2 (en) | 2002-09-18 | 2017-12-12 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US11423916B2 (en) | 2002-09-18 | 2022-08-23 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
US8606587B2 (en) | 2002-09-18 | 2013-12-10 | Dolby International Ab | Method for reduction of aliasing introduced by spectral envelope adjustment in real-valued filterbanks |
JP4688867B2 (ja) * | 2004-04-16 | 2011-05-25 | ドルビー インターナショナル アクチボラゲット | 低ビットレート用パラメトリック表現の生成方法 |
JP2010154548A (ja) * | 2004-04-16 | 2010-07-08 | Dolby Internatl Ab | 低ビットレート用パラメトリック表現の生成方法 |
JP2007533221A (ja) * | 2004-04-16 | 2007-11-15 | コーディング テクノロジーズ アクチボラゲット | 低ビットレート用パラメトリック表現の生成方法 |
JP4804532B2 (ja) * | 2005-04-15 | 2011-11-02 | ドルビー インターナショナル アクチボラゲット | 無相関信号の包絡線整形 |
US8532999B2 (en) | 2005-04-15 | 2013-09-10 | Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. | Apparatus and method for generating a multi-channel synthesizer control signal, multi-channel synthesizer, method of generating an output signal from an input signal and machine-readable storage medium |
JP2008536183A (ja) * | 2005-04-15 | 2008-09-04 | コーディング テクノロジーズ アクチボラゲット | 無相関信号の包絡線整形 |
US7983922B2 (en) | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
US7983424B2 (en) | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Envelope shaping of decorrelated signals |
JP2008511849A (ja) * | 2005-04-15 | 2008-04-17 | フラウンホッファー−ゲゼルシャフト ツァ フェルダールング デァ アンゲヴァンテン フォアシュンク エー.ファオ | マルチチャネルシンセサイザ制御信号を発生するための装置および方法並びにマルチチャネル合成のための装置および方法 |
JP2009503615A (ja) * | 2005-08-02 | 2009-01-29 | ドルビー・ラボラトリーズ・ライセンシング・コーポレーション | 聴覚事象の関数としての空間的オーディオコーディングパラメータの制御 |
Also Published As
Publication number | Publication date |
---|---|
EP1016320B1 (en) | 2002-03-27 |
EP1016320A2 (en) | 2000-07-05 |
DK1016320T3 (da) | 2002-07-08 |
KR100550399B1 (ko) | 2006-02-08 |
AU8138098A (en) | 1999-02-10 |
KR20010020540A (ko) | 2001-03-15 |
JP4223679B2 (ja) | 2009-02-12 |
US5890125A (en) | 1999-03-30 |
CN1151705C (zh) | 2004-05-26 |
ES2171031T3 (es) | 2002-08-16 |
CN1264533A (zh) | 2000-08-23 |
DE69804478T2 (de) | 2002-10-02 |
DE69804478D1 (de) | 2002-05-02 |
WO1999004498A3 (en) | 1999-09-16 |
CA2295505A1 (en) | 1999-01-28 |
CA2295505C (en) | 2008-09-02 |
AU746416B2 (en) | 2002-05-02 |
WO1999004498A2 (en) | 1999-01-28 |
ATE215295T1 (de) | 2002-04-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4223679B2 (ja) | 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置 | |
US9653085B2 (en) | Reconstructing an audio signal having a baseband and high frequency components above the baseband | |
JP3804968B2 (ja) | 適応配分式符号化・復号装置及び方法 | |
RU2376654C2 (ru) | Параметрическое совместное кодирование аудиоисточников | |
US8804967B2 (en) | Method for encoding and decoding multi-channel audio signal and apparatus thereof | |
US9626976B2 (en) | Apparatus and method for encoding/decoding signal | |
KR100803344B1 (ko) | 멀티채널 출력 신호를 구성하고 다운믹스 신호를 생성하기위한 장치 및 방법 | |
KR20040054235A (ko) | 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치 | |
JP3827720B2 (ja) | 差分コーディング原理を用いる送信システム | |
MX2008009565A (en) | Apparatus and method for encoding/decoding signal |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050517 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050517 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081021 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081120 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111128 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121128 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131128 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |