JP4223679B2 - 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置 - Google Patents
低ビットレート多重オーデイオチャンネル符号・復号方法及び装置 Download PDFInfo
- Publication number
- JP4223679B2 JP4223679B2 JP2000503606A JP2000503606A JP4223679B2 JP 4223679 B2 JP4223679 B2 JP 4223679B2 JP 2000503606 A JP2000503606 A JP 2000503606A JP 2000503606 A JP2000503606 A JP 2000503606A JP 4223679 B2 JP4223679 B2 JP 4223679B2
- Authority
- JP
- Japan
- Prior art keywords
- signal
- signals
- subband
- spatial characteristic
- channel
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Expired - Fee Related
Links
- 238000000034 method Methods 0.000 title claims description 67
- 230000004044 response Effects 0.000 claims abstract description 33
- 239000002131 composite material Substances 0.000 claims abstract description 29
- 230000003595 spectral effect Effects 0.000 claims abstract description 23
- 230000002123 temporal effect Effects 0.000 claims abstract 4
- 230000008859 change Effects 0.000 claims description 22
- 230000000875 corresponding effect Effects 0.000 claims description 21
- 238000009795 derivation Methods 0.000 claims description 7
- 230000009466 transformation Effects 0.000 claims description 7
- 230000002596 correlated effect Effects 0.000 claims description 6
- 230000009467 reduction Effects 0.000 claims description 5
- 238000001228 spectrum Methods 0.000 claims description 5
- 230000015572 biosynthetic process Effects 0.000 claims description 4
- 238000003786 synthesis reaction Methods 0.000 claims description 4
- 239000006185 dispersion Substances 0.000 claims description 3
- 230000003111 delayed effect Effects 0.000 claims 8
- 238000013507 mapping Methods 0.000 claims 8
- 230000003247 decreasing effect Effects 0.000 claims 2
- 238000000605 extraction Methods 0.000 claims 1
- 238000009499 grossing Methods 0.000 abstract description 15
- 108091006146 Channels Proteins 0.000 description 76
- 239000013598 vector Substances 0.000 description 13
- 238000013144 data compression Methods 0.000 description 12
- 238000007906 compression Methods 0.000 description 10
- 230000006835 compression Effects 0.000 description 10
- 230000000694 effects Effects 0.000 description 10
- 230000000295 complement effect Effects 0.000 description 8
- 238000001914 filtration Methods 0.000 description 8
- 230000005236 sound signal Effects 0.000 description 8
- 238000013139 quantization Methods 0.000 description 7
- 238000010586 diagram Methods 0.000 description 6
- ZYXYTGQFPZEUFX-UHFFFAOYSA-N benzpyrimoxan Chemical compound O1C(OCCC1)C=1C(=NC=NC=1)OCC1=CC=C(C=C1)C(F)(F)F ZYXYTGQFPZEUFX-UHFFFAOYSA-N 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 3
- 230000015556 catabolic process Effects 0.000 description 3
- 238000006731 degradation reaction Methods 0.000 description 3
- 230000001052 transient effect Effects 0.000 description 3
- 241000255925 Diptera Species 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 2
- 238000006243 chemical reaction Methods 0.000 description 2
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000007274 generation of a signal involved in cell-cell signaling Effects 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000008569 process Effects 0.000 description 2
- 238000011084 recovery Methods 0.000 description 2
- 206010011469 Crying Diseases 0.000 description 1
- 241000238631 Hexapoda Species 0.000 description 1
- 230000003044 adaptive effect Effects 0.000 description 1
- 230000001276 controlling effect Effects 0.000 description 1
- 230000006837 decompression Effects 0.000 description 1
- 230000000593 degrading effect Effects 0.000 description 1
- 230000005284 excitation Effects 0.000 description 1
- 230000014509 gene expression Effects 0.000 description 1
- 238000010237 hybrid technique Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000000873 masking effect Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 238000010606 normalization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000002441 reversible effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S3/00—Systems employing more than two channels, e.g. quadraphonic
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04H—BROADCAST COMMUNICATION
- H04H20/00—Arrangements for broadcast or for distribution combined with broadcast
- H04H20/86—Arrangements characterised by the broadcast information itself
- H04H20/88—Stereophonic broadcast systems
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04B—TRANSMISSION
- H04B1/00—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission
- H04B1/66—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission
- H04B1/665—Details of transmission systems, not covered by a single one of groups H04B3/00 - H04B13/00; Details of transmission systems not characterised by the medium used for transmission for reducing bandwidth of signals; for improving efficiency of transmission using psychoacoustic properties of the ear, e.g. masking effect
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04R—LOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
- H04R5/00—Stereophonic arrangements
- H04R5/04—Circuit arrangements, e.g. for selective connection of amplifier inputs/outputs to loudspeakers, for loudspeaker detection, or for adaptation of settings to personal preferences or hearing impairments
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S2420/00—Techniques used stereophonic systems covered by H04S but not provided for in its groups
- H04S2420/03—Application of parametric coding in stereophonic audio systems
Landscapes
- Engineering & Computer Science (AREA)
- Signal Processing (AREA)
- Physics & Mathematics (AREA)
- Acoustics & Sound (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Multimedia (AREA)
- Spectroscopy & Molecular Physics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Mathematical Physics (AREA)
- Compression, Expansion, Code Conversion, And Decoders (AREA)
- Reduction Or Emphasis Of Bandwidth Of Signals (AREA)
- Signal Processing For Digital Recording And Reproducing (AREA)
Description
技術分野
概して本発明は、オーデイオ情報を伝える信号の情報要件を低減させる、多重チャンネルオーデイオ情報の高品質符号化及び復号に関する。本発明は、典型的にパソコンを公衆網に接続するのに用いられる電話線のような、比較的低帯域幅伝送路を介して多重チャンネルオーデイオ情報を実時間で伝送するのに有用である。
【0002】
背景技術
オーデイオ信号処理分野では、信号品質の知覚可能な損失なしにオーデイオ信号を表すために要する情報量を最小にすることには多大の関心がある。必要な情報量を低減させることによって、通信路及び記憶媒体に対して課される信号表現の情報容量要件はより低減される。
【0003】
従来の住宅用電話線のような比較的低帯域幅の通信路を介して多重チャンネルの高品質デジタルオーデイオ信号を実時間で伝送する方法を開発することについては特に関心がある。この種の通信路は、パソコンを公衆網に接続するために一般的に用いられ、現在約毎秒50kビットの能力に過ぎない。オーデイオ信号を実時間伝送することによって、信号によって表される情報は信号が受信されるにつれて妨害なしに表現又は再生され得る。
【0004】
情報容量要件は、2つのデータ圧縮技術の一方又は双方を適用することによって低減され得る。その一方は、「損失のある」圧縮と呼ばれことがあり、原信号の完全な回復を保証せず、概してこれ妨げる方法で情報要件を低減させる。その他方は、「損失のない」圧縮と呼ばれ、原信号の完全な回復が可能な方法で情報要件を低減させる。
【0005】
量子化は、よく知られた損失型圧縮技術である。量子化は、デジタル信号の各サンプルを表すのに用いられるビット数を低減させることによって情報容量要件を低減させ、それによってデジタル信号表現の精度を低減させ得る。オーデイオ符号化用途では、低減される精度又は量子化誤差は、量子化ノイズとして現れる。もし誤差が十分大きいなら、量子化ノイズは、符号化される信号の実質的品質を劣化させるであろう。
【0006】
色々なオーデイオ符号化技術では、知覚可能か若しくは知覚される符号化品質に無関係な情報成分を除去することによって、何等の知覚可能な劣化を被ることなく入力信号に損失のある圧縮技術を適用することが試みられる。除去される成分が真に無関係であるとすれば、相補的な復号技術で、知覚的に入力信号と区別できない入力信号レプリカを回復することができる。例えば、分割帯域符号化では、入力信号を幾つかの狭帯域信号に分割し、心理音響原理により各狭帯域信号を適応的に量子化する。
【0007】
心理音響原理は、人の聴覚系周波数分析特性に基づものである。同聴覚系は、中心周波数の関数として変化する可変中心周波数及び帯域幅を有する高度に非対称な調整されたフィルタに類似している。別個の音調を検出する能力は、概して音調間の周波数差が増加するにつれて増加する。人の聴覚系の分解能は、上記濾波作用の帯域幅未満の周波数差については実質的に一定である。この帯域幅は、オーデイオスペクトル全体を通して変化し、「臨界帯域幅」と呼ばれる。優勢な信号は、臨界帯域幅外の周波数における他の信号を隠蔽(マスク)するよりは恐らく当該臨界帯域幅以内のどこにおいても他の信号の可聴性をより隠蔽するであろう。優勢な信号は、隠蔽信号と同時に起こる他の信号のみならず、隠蔽信号の前後に起こる他の信号をも隠蔽し得る。前隠蔽及び後隠蔽効果の持続時間は、隠蔽信号の大きさに依存するが、前隠蔽効果は通常後隠蔽効果より遥かに短い持続時間のものである。前隠蔽持続時間は、100msecを超え得るが、概して5msec未満に限られるとみなされる。後隠蔽持続時間は、500msecを超え得るが、約50msecに限られるとみなされる。信号の隠蔽される成分は重要ではなく、聴取者の聴覚経験を変えることなく除去し得る。
【0008】
分割帯域オーデイオ符号化では、各々が人の聴覚系の臨界帯域幅と同程度の帯域幅を有する幾つかのサブバンド信号に、オーデイオ信号帯域幅を分割するために、順方向又は「分析」フィルタバンクを用いる。各サブバンド信号が丁度十分なビットを用いて量子化され、各バンドの量子化ノイズが当該サブバンド又は多分隣接サブバンド内のスペクトル成分によって隠蔽されることを保証するようにする。分割帯域オーデイオ復号では、逆方向又は「合成」フィルタバンクを用いて原信号のレプリカを再構成する。もしフィルタバンクのフィルタ帯域幅及びサブバンド信号の量子化精度が適切に選ばれるなら、再構成されるレプリカは、知覚的に原信号から区別され得ない。
【0009】
このような2つの符号化技術がサブバンド符号化及び変換符号化である。サブバンド符号化では、フィルタバンクを実施するために色々なアナログ、デジタル濾波技術を用い得る。変換符号化では、フィルタバンクを実施するために色々な時間領域対周波数領域変換を用い得る。個々の変換係数帯域幅の合計である有効帯域幅を有するサブバンドを定めるために隣接周波数領域変換係数はグループ化され得る。
【0010】
以下の記載全体を通して「分割バンド符号化」及び類似の用語は、有効な信号帯域幅の各部分に作用する、サブバンド符号化・復号、変換符号化・復号及びその他の符号化・復号技術を指す。「サブバンド」の用語は、真のサブバンドコーダ、変換コーダ又は他の技術によって実施されようとされまいと、有効な信号帯域幅の部分を指す。「サブバンド信号」の用語は、それぞれのサブバンド以内の分割帯域濾波信号表示を指す。
【0011】
損失のある圧縮は、スケーリング(位取り)を含む。分割帯域符号化を含む多くの符号化技術は、限られたビット数によって表される符号化された情報のダイナミックレンジを伸ばすために位取りされた表現を用いる信号を伝える。位取りされた表現は、符号化される信号の要素に対応する「位取りされた値」と関連する1つ又はそれ以上の「位取り因(係)数」を含む。多くの形式の位取りされた表現が知られている。位取りされた値の多少の精度を犠牲にすることによって、「ブロック位取りされた表現」を用いる情報を伝えるためにさらに少ないビットが用いられ得る。ブロック位取りされた表現は、共通位取り係数と関連する一グループ又はブロックの位取りされた値を含む。
【0012】
損失のない形の圧縮は、冗長な信号成分を低減又は除去することによって劣化なしに情報容量要件を低減させる。相補的な圧縮解除技術では、圧縮中に除去される冗長成分を与えることによって原信号を完全に回復することができる。損失のない圧縮技術の例には、ランレングス符号化、差分コード化、線型予測コード化及び変換コード化がある。これらの圧縮技術に対する変形、組合せ及び適応形式も知られている。
【0013】
損失のある圧縮技術及び損失のない圧縮技術を組合わせるハイブリッド技術も知られている。例えば、変換を基礎とするフィルタバンクを用いる分割帯域コード化は、損失のない変換コード化を損失のある心理音響知覚コード化と組合わせる。
【0014】
上記のような単一チャンネルコード化技術では、例えば、実時間再生のために従来の電話線のような低帯域幅経路を介して伝えられるべき多重チャンネル高品質オーデイオを可能にするために十分な程情報要件は低減されない。色々な高性能コード化システムは、15kHzの帯域幅を有するオーデイオ信号を実時間で伝えるために毎秒約64kビット又はそれ以上のものを必要とする。多重オーデイオチャンネルを伝えるためにはこれらのビットレートの倍数を要するので、従来の住宅用電話線のような限られた帯域幅経路を介して実時間で多重オーデイオチャンネルを伝えることを可能にするためには、単一チャンネルコード化システムの性能に極端な改良を加える必要がある。情報容量要件のさらなる低減は、本明細書で空間コード化技術と呼ばれる多重チャンネルコード化技術によって扱われる。
【0015】
空間符号化の一形態では、符号化マトリックスにより多重信号を組合せ、相補的復号マトリックスを用いて原信号のレプリカを回復する。多くの4:2:4マトリックス化技術が知られており、同技術では伝送及び記憶のために4つの信号を2つの信号に組合せ、次いで2つの符号化された信号から4つの原信号のレプリカを回復する。この符号化技術は、信号間の高レベルクロストークに悩まされる。クロストークレベルを下げるために多数の適応マトリックス化技術が開発されてきたが、クロストークの低減及び情報容量要件の低減は共に不十分である。
【0016】
空間符号化の他の形態では、多重入力信号をサブバンド信号に分割し、各サブバンドにおけるチャンネルのスペクトルレベルを表すステアリング(方向づけ)情報のベクトルを発生させ、和又は合成サブバンド信号を発生させるために所与の周波数サブバンドのすべてのチャンネルにつきサブバンド信号を組合せ、合成サブバンド信号を知覚的に符号化し、符号化された合成サブバンド信号及びステアリングベクトルを符号化された信号に組合わせる。相補的デコーダが、適切なサブバンドのステアリングベクトルにより当該サブバンド信号を位取りすることによって各出力信号に対するそれぞれの周波数サブバンド内にサブバンド信号を発生させかつ逆フィルタバンクを通して位取りされたサブバンド信号を通すことによって出力信号を発生させる。このような符号化システムの2つの例が、デビス他(Davis, et al.)の米国特許第5,583,962号及び「約1.5Mbit/sまでにおけるデジタル記憶媒体用映画及び関連オーデイオの符号化(International Organization for Standardization, CD 11172-3, Part 3(Audio), Annex 3-G(Joint Stereo Coding), pp.G-1 to G-4)に開示されている。
【0017】
不幸にして、これらの空間コード化技術では、たとえ知覚コード化と組合されても、実時間再生のために十分低いビットレートにおいて低帯域幅経路を介して多重チャンネル高品質オーデイオを伝えることは不可能である。これらの技術では、原入力信号のレプリカは、ちゅちゅ(小鳥や虫の泣き声)又はかちり(クリック)という音及びファスナの開閉音(ジッパーノイズ)のような、望ましくない人工物と共に発生される。
【0018】
発明の開示
本発明の目的は、多重オーデイオ信号を符号化された低ビットレート信号に符号化しかつ符号化された信号を多重オーデイオ信号の高品質レプリカに復号する方法及び装置を提供することにある。
【0019】
本発明の他の面の教示によるとエンコーダは、複数の周波数サブバンド内の複数の入力信号から複数チャンネルのサブバンド信号を発生させ、入力信号の帯域幅の少なくとも一部を表す合成信号を発生させ、周波数サブバンドの各々のチャンネルサブバンド信号に応答して音界(サウンドフィールド)の空間特性を表す空間特性信号を発生させ、空間特性信号は、信号レベルを表す情報値の減少が人の聴覚系の後隠蔽特性の減少に比例して制限されるように各々のチャンネルサブバンド信号のレベルを表す情報を伝え、合成信号及び空間特性信号を符号化された信号にアセンブルする。
【0020】
本発明のさらに他の面の教示によるとデコーダは、符号化された信号から1つ又はそれ以上の合成信号と複数の空間特性信号とを入手し、1つ又はそれ以上の合成信号から複数の合成サブバンド信号を引き出し、各空間特性信号が、各々の合成サブバンド信号と関連づけられかつ各々の合成サブバンド信号に対応する各々の音界空間特性を表すようにし、空間特性信号から複数の利得係数を引き出し、利得係数値の減少が人の聴覚系の後隠蔽特性の減少に比例して制限されるようにし、各々の利得係数により各々の合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号にマップ(写像)し、中間サブバンド信号に1つ又はそれ以上の逆フィルタバンクを適用することによって複数の出力信号を発生させる。
【0021】
本発明の色々な特徴及び望ましい実施形態は、以下の議論及び添付図を参照することによってよりよく理解し得る。幾つかの図面では同一要素は同一参照番号で示される。以下の論議及び図面の内容は例としてのみ記載され、本発明の範囲を表すものと理解すべきではない。
【0022】
発明を実施するモード
エンコーダ
図1は、本発明による多重チャンネルエンコーダの一実施形態である。サブバンド信号発生器10は、経路1から入力信号を受信し、入力信号に応答して、経路11及び12に沿ってチャンネルサブバンド信号を発生させる。同様に、サブバンド信号発生器20は、経路2から受信する入力信号に応答して、経路21及び22に沿ってチャンネルサブバンド信号を発生させ、サブバンド信号発生器30は、経路3から受信する入力信号に応答して、経路31及び32に沿ってチャンネルサブバンド信号を発生させる。多く実際的実施形態では、各信号発生器によって3つ以上のチャンネルサブバンド信号が発生される。
【0023】
多くの用途につき、各サブバンド信号発生器が、各入力信号の有効帯域幅に及ぶ周波数サブバンドを表すチャンネルサブバンド信号を発生させることが予想される。しかし、これは本発明を実施するためには不必要である。例えば、1つ又はそれ以上のサブバンド信号発生器は、有効帯域幅の一部、例えば、約1.5kHzより下方の帯域幅部分、のみを表すチャンネルサブバンド信号を発生し得る。概して、チャンネルサブバンドコーダは、音界空間特性を決定するために空間コーダ40によって分析されるスペクトル部分につき発生されるべきである。
【0024】
空間コーダ40は、サブバンド信号発生器から受信されるチャンネルサブバンド信号に応答して経路41及び42に沿って空間特性信号を発生させる。これらの空間特性信号の各々は、各々の周波数サブバンドの1つ又はそれ以上のチャンネルサブバンド信号に対応する音界の空間特性を表す。合成信号発生器60は、経路1,2及び3から受信される入力信号を組合わせることによって経路61に沿って合成信号を発生させる。
【0025】
本発明は、知覚符号化のようなある種のデータ圧縮と共に用いられることが予想されるが、本発明を実施するためにデータ圧縮は不要である。もしデータ圧縮が用いられるなら、実質的にあらゆる形態のデータ圧縮が経路61に沿って発生される合成信号に適用され得る。
【0026】
フォーマッタ50は、経路41及び42から受信される空間特性信号と、経路61から受信される合成信号とを出力信号にアセンブルする。出力信号は伝送又は記憶のために経路51に沿って送られる。もし合成信号がデータ圧縮又は符号化を受けるなら、合成信号それ自体よりはむしろ符号化された形態が出力信号にアセンブルされる。
【0027】
図2は、本発明による多重チャンネルエンコーダの他の実施形態を例示する。この実施形態は、経路61から受信される合成信号に応答して経路71‐73に沿って合成サブバンド信号を発生するサブバンド信号発生器70が追加されることを除けば、図1に例示するものと同一である。
【0028】
この第2実施形態でデータ圧縮が用いられるなら、それはこれらの合成サブバンド信号に適用され得る。特に、もし合成サブバンド信号の帯域幅が臨界帯域幅と釣り合うなら知覚的符号化技術が有利に適用され得る。サブバンド信号発生器70によって発生される合成サブバンド信号の帯域幅が、サブバンド信号発生器10,20及び30によって発生されるチャンネルサブバンド信号の帯域幅と同一である必要がないことは指摘されるべきである。実際、サブバンド信号発生器10,20及び30によって発生されるチャンネルサブバンド信号の帯域幅でさえも同一であることを要しない。
【0029】
幾つかのサブバンド信号発生器を実施するためには色々な技術が用いられ得る。例えば、非再帰(反復)的、再帰的又は格子フィルタが用いられ得る。非再帰的フィルタの中には多項式フィルタ又は変換操作を用いて実施され得るものもある。特殊フィルタデザインの例には、離散フーリエ変換(DFT)と離散余弦変換(DCT)、直角位相ミラーフィルタ(QMF)及びいわゆる偶数積重ねと奇数積重ね時間領域エイリアシング相殺(TDAC)変換のような各種の変換がある。変換の分析特性は、変換の適用に先立って信号サンプルブロックを変調するために用いられる任意のウインドウファンクション(関数)の形状によって影響される。
【0030】
任意の実施形態で用いられる各種のサブバンド信号発生器の分析特性は、同一であることを要しない。例えば、サブバンド信号発生器10,20及び30は、同一フィルタバンクを併合するのが望ましい。同フィルタバンクは、スペクトル分解能を最適化するように設計されかつサブバンド信号パワー(累乗)の正確な尺度を与える。しかし、サブバンド信号発生器70では、臨界サンプリングを与えかつスペクトル分解能及び時間的分解能間の兼合いを釣合わせることによってデータ圧縮を最適化するように選択され得る。
【0031】
図3は、図1に例示されるようなエンコーダ内に併合され得る合成信号発生器の実施形態を例示する。この実勢形態では、サブバンド信号発生器170は、経路1から受信される入力信号に応答して経路171-173に沿ってサブバンド信号を発生させる。同様に、サブバンド信号発生器180は、経路2から受信される入力信号に応答して経路181-183に沿ってサブバンド信号を発生させ、サブバンド信号発生器190は、経路3から受信される入力信号に応答して経路191-193に沿ってサブバンド信号を発生させる。サブバンド発生器260は、経路171、181及び191から受信されるサブバンド信号に応答して経路261に沿って合成サブバンド信号を発生させる。同様に、サブバンド発生器270は、経路172,182及び192から受信されるサブバンド信号に応答して経路271に沿って合成サブバンド信号を発生させ、サブバンド発生器280は、経路173,183及び193から受信されるサブバンド信号に応答して経路281に沿って合成サブバンド信号を発生させる。一実施形態では、サブバンド信号発生器260、270及び280は、サブバンド信号発生器170、180及び190から受信するサブバンド信号の和を形成することによって合成サブバンド信号を発生させる。合成サブバンド信号を形成する代わりの方法は以下に述べる。合成サブバンド信号が発生される方法は、本発明の実施にとって決定的ではなくかつ合成サブバンドは、何らかの形態のデータ圧縮を受けられ得る。
【0032】
図4は、本発明による多重チャンネルエンコーダの他の実施形態を例示する。この実施形態は、サブバンド信号発生器10、20及び30によって発生されるチャンネルサブバンド信号に応答して、合成信号発生器160が経路161に沿って1つ又はそれ以上の合成信号を発生させることを除けば、図1に例示される実施形態と同一である。一実施形態において、合成信号発生器160は、各入力信号につき所定の周波数サブバンドにおいてチャンネルサブバンド信号を組合せ、当該周波数サブバンドにつき合成サブバンド信号を発生させる。経路161に沿って発生される1つ又はそれ以上の合成信号は、何らかのデータ圧縮を受けられ得る。
【0033】
デコーダ
図5は、本発明による多重チャンネルデコーダの他の実施形態を例示する。デフォーマッタ510は、経路501から受信される符号化された信号から1つ又はそれ以上の合成信号及び空間特性信号を引き出す。示された一実施形態では、合成信号が経路511に沿って送られ、空間特性信号が経路515及び516に沿って送られる。サブバンド信号発生器520は、経路511から受信される合成信号に応答して経路521及び522に沿って合成サブバンド信号を発生させる。空間デコーダ530は、経路515及び516から受信される空間特性信号から複数の利得係数を引出し、合成信号を1つ又はそれ以上の中間サブバンド信号にマップ(写像)するためにこれらの利得係数を用いる。中間信号発生器540は、経路541、542及び543に沿って中間サブバンド信号を発生させ、中間信号発生器550は、経路551、552及び553に沿って中間サブバンド信号を発生させる。出力信号発生器560は、経路541及び551から受信される中間サブバンド信号に応答して経路561に沿って出力信号を発生させる。同様に、出力信号発生器570は、経路542及び552から受信される中間サブバンド信号に応答して経路571に沿って出力信号を発生させ、出力信号発生器580は、経路543及び553から受信される中間サブバンド信号に応答して経路581に沿って出力信号を発生させる。
【0034】
図面に示されるデコーダのすべての実施形態において、各中間サブバンド信号は全出力内にマップされるが、これは必要ではない。所与の中間サブバンド信号が全出力信号内にマップされる必要はない。
【0035】
もし符号化された信号から引き出される合成信号が、データ圧縮を受けているなら、経路511に沿って送られる信号、経路521及び522に沿って送られるサブバンド信号につき、必要に応じて相補的形態のデータ拡張が適用され得る。
【0036】
サブバンド発生器520を実施するためには既に述べたような各種の濾波及び変換技術が用いられ得る。出力信号発生器を実施するためには相補的技術又は逆の技術が用いられる。
【0037】
図6は、本発明による多重チャンネルデコーダの他の実施形態を例示する。この実施形態は、デフォーマッタ510が符号化された信号から直接合成信号を引出してこれらの信号を経路512及び513に沿って送ることを除けば、図5に例示されたものと同一である。データ拡張は、必要に応じて合成サブバンド信号に適用され得る。出力信号発生器の実施に用いられる逆濾波又は逆変換技術は、符号化される信号内にアセンブルされた合成サブバンド信号を発生させるために用いられる逆濾波又は逆変換技術と相補であるべきである。
【0038】
本発明によるエンコーダは、それぞれの周波数サブバンドにつき第1種及び多分追加の第2種形態で空間特性信号を発生し得る。一実施形態における第1形式、即ち、第1種信号は、音界に寄与する各チャンネルサブバンド信号に関する信号レベルの尺度を表す。信号レベルの尺度は、例えば、ピーク振幅、平均振幅又は二乗平均平方根(RMS)でよい。他の実施形態における第1信号は、音界に寄与する各「仮想」チャンネルサブバンド信号に関する信号レベルの何らかの尺度を表す。仮想チャンネルは物理的実体として存在する必要はないが、例えば、1つ又はそれ以上の物理的チャンネルからの信号の加重和又はその他の組合せを表す概念上の実体であり得る。空間特性信号内の用素数が音界に寄与する実際の物理的チャンネル数と等しい必要はないということが肝要な面である。
【0039】
第2の形式、即ち、第II種信号は、音界に関する1つ又はそれ以上の見掛けの方向及び多分音界幅の何らかの表示又は方向についての分散特性を表す。方向は、例えば、3次元又は2次元空間におけるベクトルによって表され得る。
【0040】
例えば、5つの入力チャンネルを表す合成信号を符号化するシステムにおいて、各々の周波数サブバンドに対する第I種空間特性信号は、信号レベルの5つの尺度、例えば、パワー(冪)、即ち、当該周波数サブバンド内の各入力チャンネルに対する尺度を含む。当該同一システムにおいて各々の周波数サブバンドに対する第II種空間特性信号は、1つ又はそれ以上の方向の表示を含む。各周波数サブバンド内で1方向のみを表す実施形態においては、例えば、各バンドに対する第II種信号は、2次元又は3次元空間に対しデカルト座標又は極座標内のベクトルとして表され得る。
【0041】
第II種信号の情報容量要件は、入力チャンネル数には依存しないが、この種の空間特性信号を発生させるプロセス(処理)では、音界方向が正確に決定され得るように各入力チャンネルによって表される音源の数及び位置につき知らされなければならない。
【0042】
一実施形態においてエンコーダは、第1種及び多分追加の第2種形態で各々の周波数サブバンドに対する空間特性信号を発生させる。タイプは、必要なオーデイオ品質、出力チャンネル帯域幅、見掛けの方向数のような本質的にあらゆる規準に基づいて選択され得る。第2種信号は、第1種信号を符号化するのに要するビット数と対照して第2種信号を符号化するのに要するビット数は概して少ないので、低チャンネル帯域幅を有する多重チャンネルシステムで用いられ得る。しかし、もし各々のサブバンドに対する音界が何らかの閾値数を超える数の方向を持つとみなされるなら、第1種信号はより少ないビットしか要しないであろう。
【0043】
もし例えば、大オーケストラを表す幾つかのチャンネルのオーデイオ情報が高品質で再生されるならば、オーケストラの回りを飛ぶ一匹の蚊を表す他のチャンネルのオーデイオ情報は劣った品質で再生され得る。オーケストラを表すサブバンド信号に対する空間特性信号は、第1形式で形成され、蚊を表すサブバンド信号に対する空間特性信号は、第2形式で形成され得るであろう。
【0044】
音界に対する見掛けの方向の数が増加するにつれて、第II種信号を伝えるのに要するビット数は増加し、従って、サブバンド内の音界に対する見掛けの方向が増加するにつれて、当該サブバンドに対しては概して第I種空間特性信号が望ましい。もし周波数サブバンド内で1つのチャンネルのみが意味のあるスペクトルエネルギを有するなら、当該サブバンド内の音界に対する見掛けの方向の数は1つとみなされる。もし1つ又はそれ以上のチャンネルがそれぞれのサブバンドにおいて意味のあるエネルギを有するなら、当該サブバンド内のチャンネルの振幅及び位相が単一音源を表すように相関づけられならば、見掛けの方向の数は同様に1つとみなされる。
【0045】
チャンネルサブバンド信号及び空間特性信号間の関係は、すべての周波数サブバンドにつき同一であるべき必要はない。さらに、当該関係は固定されるべき必要はなく、入力特性又は出力チャンネル帯域幅のような各種の要件に応答して変わり得る。単純な実施形態においては、それぞれの空間特性信号が各周波数サブバンドにつき発生され、当該サブバンド内のすべてのサブバンド信号に対応する音界の空間特性を表す。
【0046】
図1,2及び4に示される実施形態に関する他の例では、経路41に沿って発生される空間特性信号は、経路11、21及び31から受信されるチャンネルサブバンド信号に相当する音界空間特性を表し、経路42に沿って発生される空間特性信号は、経路12及び32から受信されるチャンネルサブバンド信号に相当する音界空間特性を表す。この例の変形では、経路22から受信されるチャンネルサブバンド信号に相当する音界空間特性を表すために他の空間特性信号が発生される。
【0047】
さらに他の例におけるエンコーダは、第1種及び多分追加の第2種形態で空間特性信号を適応的に形成する。適応は、周波数サブバンド内で表されるべきであるとみなされる見掛けの方向の数、見掛けの方向の知覚される幅、空間特性信号を伝えるために得られるビット数に基づかれ得る。望ましい実施形態では、空間特性信号を表すために選ばれる形態は、情報容量要件及び聴覚品質間の最良の兼合いを与える。
【0048】
幾つかの用例では、空間特性信号の情報容量要件は、信号が変化し得る時間的変化速度(レート)を制限することによって低減され得る。第I種信号に対しては、スペクトルレベル尺度が変わり得る率を制限するために時間的平滑化が適用される。時間的平滑化は、これらの尺度の増加及び減少の双方を制限するために適用され得るが、減少の時間的平滑化は該して増加の時間的平滑化より一層効果的でかつ目立たない。第II種信号に対しては、空間において方向ベクトルが方位を変化し得る率を制限するために時間的平滑化が適用される。情報容量要件は多くの方法で低減され得る。
【0049】
時間的平滑化を適用することによって空間特性信号はより少ないビットで符号化され得る。その理由はこれら信号の要素が符号化及び伝送される頻度が低減され得るからである。デコーダは、内挿又は他の形態の濾波を用いて省略された要素を回復し得る。さらに、差分符号化が用いられると、信号を表すのに要するビット数が低減され得る。それは、時間的平滑化が連続する値間の差分のダイアナミックレンジを制限するからであり、従って、差分コードを表すために少ないビットしか要しない。
【0050】
概して、時間的平滑化が用いられる程度は、人の聴覚系の時間的隠蔽特性に基づく。例えば、結果的に生じるレベルが当該隠蔽閾値を超えないならば、レベルを後隠蔽閾値より下方に低減させ得る変化率は知覚的影響なしに低減され得る。ある実施形態では、変化率が毎秒約120乃至140dBを超えないように制限される。他の実施形態では、過渡現象とみなされる事象に対しては増加率への制限が緩和される。
【0051】
過渡現象は、多くの方法で検出され得る。例えば、もし約10msecの短時間間隔以内で各種信号の振幅が、例えば、10dBを超えるなら、過渡現象が起こったものとみなされる。このような信号には、入力信号、合成信号、1つ又はそれ以上のチャンネルサブバンド信号又は合成サブバンド信号、特に高周波サブバンドに対するサブバンド信号等がある。連続時間間隔につきスペクトル内容の各種の尺度も同様に比較され得る。例えば、高周波係数を強調する変換係数の加重和が隣接変換部ブロックにつき比較され得る。
【0052】
ある用例では、信号がスペクトルを横切って変わるスペクトル率を制限することによって、空間特性信号の情報容量要件が低減され得る。第I種信号についでは、隣接サブバンドにおける各々の信号レベル尺度間の差を制限するためにスペクトル平滑化が適用される。この技術は、サブバンドを横切る空間特性信号を表すために差分符号化を用いる実施形態で効果的に用いられ得る。一方のサブバンドから他方に変わり得る情報量に限界点を課すことによって、差分コードを表すためにより少ないビットしか要しない点まで値間のダイナミックレンジの変化が低減され得る。多くの実施形態において変化量の限界点は、チャンネルサブバンド信号を発生させるために用いられるフィルタバンク又は変換内の隣接サブバンド間のスペクトル漏洩によって内在的に課せられる。スペクトル包絡線の符号化に適用されるスペクトル平滑化についての詳しい論議は米国特許第5,581,653から入手され得る。
【0053】
情報要件は、ブロックスケーリング(位取り)及び変換符号化のような各種のブロック符号化計画で用いられるブロックの長さを増加させることによって同様に低減され得る。不幸にして、このようなブロック長の増加が符号化処理の時間的分解能を低減させるので、区間特性信号及び下に横たわる音界間の時間的不同も同様に増加する。ブロック内で起こる空間特性の意味のある変化を示す表示を符号化される信号内に含めることによって、この誤差の効果は低減され得る。事実上、当該表示はブロックの始め及び空間的変化の発生間における遅延量を表す。相補的復号特性は以下で論議される。
【0054】
合成信号及び合成サブバンド信号
1つ又はそれ以上の合成信号がエンコーダ内で形成され、次いでデコーダ内で合成サブバンド信号に分割される。その代わりに、合成サブバンド信号がエンコーダ内で形成され、符号化された信号号からデコーダによって単に引き出される。図6と共に上記論議を参照のこと。本発明の実施上いずれの方法も決定的ではない。
【0055】
合成信号及び合成サブバンド信号を形成するために、信号は色々な方法で組み合わされ得る。信号が組み合わされる一方法は、単純な和信号を形成するために各チャンネルからの対応するデジタルサンプルを加えるか若しくは、その代わりに、より複雑な和信号を形成するために各チャンネルからのサンプルの加重した表現を加えることである。他の方法は、RMS信号を形成するために各チャンネルからの対応するサンプルの二乗和の平方根をとることである。
【0056】
合成信号を形成するさらに他の方法は、楽器デジタルインタフェース(MIDI)標準に従った信号又はピッチ周期及びスペクトル包絡線又は一組のフィルタパラメータ及び広範囲のボコーダによって発生されるような、対応する励磁信号を伝える信号等のパラメトリックな信号を発生させることである。デコーダ内で適切な信号がパラメトリック信号から合成される。パラメトリック信号の発生が正にデータ圧縮の別形態なので、本発明の実施上決定的な特定の技術はない。
【0057】
正規化
エンコーダが合成サブバンド信号を発生かつ符号化する状況においては、合成サブバンド信号及び対応する第I種空間特性信号の情報容量要件は、それぞれの空間特性信号内の最大要素により各合成サブバンド信号を正規化することによって低減され得る。
【0058】
例えば、第I種信号が、左、右及び中央チャンネルからのサブバンドに対する特定の周波数サブバンドi内の信号パワーのRMS尺度を伝えると仮定する。この例では、左、右及び中央チャンネルからのサブバンド信号に対するパワーの尺度は、それぞれ、0.4、0.8及び0.1であり、3つのチャンネルからのサブバンド信号を組合わせることによって得られる合成サブバンド信号に対するパワーの尺度は、1.2である。合成サブバンド信号は当該特定の周波数サブバンド内の最大チャンネルサブバンド信号に対する尺度の合成サブバンド信号に対する以下の比Rによって位取りされる。、即ち、
R=0.8/1.2=2/3
正味の効果は、合成サブバンド信号に対する信号レベルの尺度が、本例では、右チャンネルからのサブバンド信号である最大チャンネルサブバンド信号と同一レベルに位取りされることである。位取りされた合成サブバンド信号は、所望の通り符号化され得る。特定の周波数サブバンドに対する第I種空間特性信号は、最大信号レベルに位取りされる各チャンネルサブバンド信号に対する信号レベルを表す3つのベクトルを含む。本例では、空間特性信号ベクトルVは、それぞれ左、右及び中央チャンネルサブバンド信号に対する相対レベルを表す以下の値を有する。即ち、
V= (0.4/0.8,0.8/0.8,0.1/0.8)=(0.5,1.0,0.125)
このべくとるは、所望の通り符号化され得る。一実施形態においてベクトルは、各要素が5つのレベル、即ち、0dB、-3dB、-7dB、-10dB及び「オフ」の1つを表す形に符号化される。他の実施形態では、ベクトル要素はは異なったレベル数を表し得る。
【0059】
利得係数の導出及び用途
図5及び6に示される実施形態に関して既に述べた通り、空間デコーダ530は、空間特性信号から複数のゲインファクタ(利得係数)を引き出す。それらの利得係数は、合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号内にマップする。利得係数の導出は、多くの方法で行われ得る。同方法は、用いられる空間特性信号の種類と、出力チャンネルの数及び方位とに依存する。
【0060】
単純な例として、出力チャンネルの数及び方位が入力チャンネルの数及び方位と同一である第I種空間特性信号を用いるシステムにおいて利得係数は、空間特性信号内で伝えられる信号レベルの尺度から簡単な方法で引き出され得る。もしそれぞれの周波数帯域に対する第I種空間特性信号が、各入力信号に対するパワーの尺度を伝えるなら、各出力チャンネルに対する利得係数は第I種信号内の対応するレベルに比例するであろう。
【0061】
しかし、もし出力及び入力チャンネルの数、方位が異なるなら、導出は一層複雑である。特定の周波数サブバンドに対する利得係数の可能な導出は、各入力チャンネルに対してベクトルを形成し、各ベクトルがそれぞれの入力チャンネルの空間的方位を表す方位を有しかつ第I種空間特性信号内に伝えられる信号レベルのそれぞれの尺度による長さを有するようにすることである。これらのベクトルの各々は、次いでそれぞれの出力チャンネルの空間的方位を表す方位を有する軸上に投影される。各出力チャンネルに対する利得係数は、対応する軸上へ投影物の合計から得られる。
【0062】
第II種空間特性信号についても同様に利得係数が導出され得る。しかし、主要な相違は、デコーダに入力チャンネルの空間方位を知らせる必要がないことがである。
【0063】
2種類の空間特性信号間で適応的に切替える符号化システムでは、利得係数の導出も同様に必要に応じて適応的に切替える。
【0064】
利得係数が引出された後、それぞれの利得係数を適切な合成サブバンドに適用することによって特定の周波数サブバンドに対する1つ又はそれ以上の中間信号が発生される。実際、当該サブバンド内の合成サブバンド信号に適切なを乗じることによって、周波数サブバンド内の出力チャンネルに対する中間サブバンド信号が発生される。利得計数は次式で与えられる、即ち、ISij=gij・XSj
ここでISij=周波数サブバンドj内のチャンネルiに対する中間サブバンド信号
gij=周波数サブバンドj内のチャンネルi用に引出された利得計数
XSj=周波数サブバンドj内の合成サブバンド信号
それぞれの出力チャンネルに対する所与の周波数サブバンド内の出力チャンネルサブバンド信号は、当該周波数サブバンド内のすべての中間信号を加算することによって得られる。既に述べた通り、出力信号それ自体は、当該出力チャンネルに対する出力チャンネルサブバンド信号に逆又は合成フィルタを適用することによって得られる。
【0065】
多重チャンネル再生システムでは、特定のチャンネルに対する1つ又はそれ以上の周波数サブバンド信号は抜けるか若しくはゼロになる。実際、符号化システムでは、特定の聴覚効果を示すために当該特定のチャンネル及び周波数サブバンド内では音のエネルギが不要であることが確認された。所望の知覚効果を劣化させることなくこれらの脱落(ドロップアウト)が導入される程度まで、本発明によって達成される符号化効率の利得が示される。
【0066】
多くの場合においてこのような時間的平滑化で、回復された信号内のちゅー鳴き声、ジッパー雑音及びその他の人工物が低減され得ることが分かっている。望ましい実施形態では、人の聴覚システムの時間的隠蔽特性により利得計数値の変化が制限される。例えば、結果的に生じるレベルが後隠蔽閾値を超えないとすれば、出力チャンネルサブバンド信号のレベル低下が当該隠蔽閾値より下方に達することを許容する変化率が知覚可能な影響なしに低減され得る。ある実施形態では、変化率が毎秒約120dB乃至140dBを超えないように制限される。他の実施形態では、過渡現象とみなされる事象に関する増加率に対する限度が緩和される。過渡現象は、上記のものを含めて色々な方法で検出し得る。
【0067】
ある実施形態では、再生される信号の品質は利得係数がスペクトルを横切って変化するスペクトル率を制限することによって改良され得る。この技術は、分析・合成フィルタバンクを用いる符号化システムに対して特に有効であり、そこでは合成フィルタバンクの隣接サブバンドにおける周波数応答特性の重複がエイリアシング人工物を相殺するために用いられる。よく知られている例としてはQMF及びTDAC変換がある。もし隣接サブバンドの信号が非常に異なった利得を受けやすいなら、このような濾波システムのエイリアシング相殺特性は劣化される。隣接サブバンドの利得が変わり得る量を制御することによって、エイリアシング相殺の悪化は制御され得る。エイリアシング相殺濾波システムを用いる望ましい実施形態では、相殺されないエイリアシング人工物が実質的に聴取不可能にされるように、所与の出力信号に対する隣接サブバンド間の利得の差が制限される。
【0068】
既に述べた通り、ブロック符号化システムの実施形態は、ブロック内で意味のある事象が何時起こるかを示す表示をも含み得る。例えば、エンコーダは、ブロックの始めと、過渡現象又は方向の急変のような事象の発生との間の遅延表示を符号化される信号内に含み得る。このような表示に応答して、デコーダは時間領域内の1つ又はそれ以上の信号に対し変化を適用し得る。デジタルフィルタを用いる実施形態では、これらの変化は実質的に信号デフォーマットから出力信号発生まで復号処理全体を通してあらゆる信号に適用され得る。ブロック変換を用いる実施形態では、これらの変化は、サブバンド信号発生前の合成信号511、1つ又はそれ以上の逆フィルタバンクから得られる出力信号に適用され得る。
【図面の簡単な説明】
【図1】 図1は、本発明による2つの多重チャンネルエンコーダの機能的構成図である。
【図2】 図2は、本発明による2つの多重チャンネルエンコーダの機能的構成図である。
【図3】 図3は、本発明による合成信号発生器の一実施形態の機能的構成図である。
【図4】 図4は、本発明による多重チャンネルエンコーダの他の実施形態を示す機能的構成図である。
【図5】 図5は、本発明による2つの多重チャンネルデコーダの機能的構成図である。
【図6】 図6は、本発明による2つの多重チャンネルデコーダの機能的構成図である。
Claims (44)
- 各々がそれぞれのオーデイオ情報チャンネルを表す複数の入力信号1,2,3を符号化することによって符号化された信号51を発生させる方法であって、
複数の周波数サブバンド内の前記入力信号を表す複数のチャンネルサブバンド信号11,12,21,22,31,32を発生させ、
前記入力信号帯域幅の少なくとも一部を表す合成信号61,161,71,72,73を発生させ、
周波数サブバンド内のそれぞれのチャンネルサブバンド信号に応答して音界の空間特性を表す空間特性信号41,42を発生させ、前記空間特性信号が前記それぞれのチャンネルサブバンドの前記信号レベルを表す情報を伝えるようにし、
前記合成信号及び前記空間特性信号を前記符号化された信号にアセンブルすることから成り、
前記空間特性信号の発生により空間特性信号を変化させることができる速度が制限され、このことにより、結果的に生じるレベルがその隠蔽閾値を超えないことを条件に、人の聴覚系の後隠蔽閾値の下方にレベルを減少させる変化の速度が低減されることを特徴とする符号化信号発生方法。 - 複数の他チャンネルサブバンド信号に応答して他の音界の空間特性を表す第2空間特性信号を発生させ、前記第2空間特性信号が前記複数の他チャンネルサブバンド信号の信号レベル又は前記他の音界の1つ又はそれ以上の見掛けの方向を表すようにし、前記第2空間特性信号を前記符号化された信号内にアセンブルすることを含む、請求項1の方法。
- 前記他の音界が閾値数未満か若しくはそれと等しい数の見掛けの方向を有するなら、前記第2空間特性信号が前記1つ又はそれ以上の見掛けの方向を表す、請求項2の方法。
- 前記閾値数が1つであり、前記他チャンネルサブバンド信号の1つのみが意味のあるスペクトルエネルギを有するか若しくは意味のあるスペクトルエネルギを有する前記他チャンネルサブバンド信号のすべてが相関させられた振幅及び相関させられた位相を有するならば前記他の音界が1つの見掛けの方向を有するとみなされる、請求項3の方法。
- 前記1つ又はそれ以上の見掛けの方向を表すならば、前記第2空間特性信号も同様に見掛けの方向の回りの音界分散の尺度を表す、請求項2の方法。
- 前記合成信号161が、それぞれの周波数サブバンド内の2つ又はそれ以上のチャンネルサブバンド信号11,12,21,22,31,32を組合わせることによって発生される、請求項1又は2のいずれか1つの方法。
- 前記合成信号71,72,73は、広帯域信号61にフィルタバンク又は変換を適用することによって発生するサブバンド信号であり、前記広帯域信号が2つ又はそれ以上の前記入力信号1,2,3組合わせることによって形成される、請求項1又は2のいずれか1つの方法。
- 前記合成信号は、前記入力信号の2つ又はそれ以上にフィルタバンク又は変換を適用することによって得られるサブバンド信号を組み合せることによって発生する、請求項1又は2のいずれか1つの方法。
- 前合成信号61,161がパラメトリック信号である、請求項1又は2のいずれか1つの方法。
- 前記チャンネルサブバンド信号11,12,21,22,31,32が、前記入力信号1,2,3に1つ又はそれ以上の離散変換を適用することによって変換係数のブロックとして発生する、請求項1乃至8のいずれか1つの方法。
- 前記周波数サブバンドの帯域幅が人の聴覚システムの臨界帯域幅に相当する、請求項1乃至10のいずれか1つの方法。
- 前記それぞれのチャンネルサブバンド信号11,12,21,22,31,32の各々が前記入力信号1,2,3の共通時間間隔に応答して発生し、前記それぞれの音界において振幅又は方向の突然変化が前記共通時間間隔内のどこで起こるかを示す遅延信号を発生させ、前記遅延信号を前記符号化された信号にアセンブルすることをさらに含む、請求項1乃至13のいずれか1つの方法。
- 前記合成信号は、それぞれの周波数サブバンドに相当するサブバンド信号であり、最大尺度を有する当該それぞれの周波数サブバンド内のチャンネルサブバンドに対する信号レベルの尺度に関して、前記合成信号によって伝えられる情報を正規化することをさらに含む、請求項1乃至13のいずれか1つの方法。
- 複数の隣接周波数サブバンドに相当する前記空間特性信号の差分符号化された表現を発生させることをさらに含み、前記差分符号化された表現が、隣接周波数サブバンド内の前記チャンネルサブバンド信号間のスペクトル漏洩特性により制限されるダイナミックレンジを有する1つ又はそれ以上のコードを含む、請求項1乃至13のいずれか1つの方法。
- 1つ又はそれ以上の出力トランスジューサを介して表現するために1つ又はそれ以上の出力信号561,571,581を発生させる符号化された信号501を復号する方法であって、
前記符号化された信号から1つ又はそれ以上の合成信号511及び複数の空間信号特性信号515,516を入手し、各空間特性信号がそれぞれの合成サブバンド信号521,522と関連づけられ、前記それぞれの合成サブバンド信号に相当するそれぞれの音界の空間特性を表すようにし、
前記空間特性信号から複数の利得係数を引出し、それぞれの利得係数によりそれぞれの合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号541−543,551−553内にマップするようにし、
前記中間サブバンド信号に1つ又はそれ以上の逆フィルタバンクを適用することによって前記複数の出力信号を発生させ、
前記複数の利得係数の導出により前記利得係数値の減少が制限され、このことにより結果的に生じるレベルが隠蔽閾値を超えないことを条件に、人の聴覚系の後隠蔽閾値より下方にサブバンド信号のレベルを減少させる変化の速度が低減されることを特徴とする符号化信号復号方法。 - 1つ又はそれ以上の出力トランスジューサを介して表現するために1つ又はそれ以上の出力信号561,571,581を発生させる符号化された信号501を復号する方法であって、
前記符号化された信号から複数の合成信号512,513及び複数の空間特性信号515,516を入手し、各空間特性信号がそれぞれの合成サブバンド信号と関連づけられかつ前記それぞれの合成サブバンド信号に相当するそれぞれの音界の空間特性を表すようにし、
前記空間特性信号から複数の利得係数を引出し、それぞれの利得係数によりそれぞれの合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号内にマップし、
前記空間特性信号から複数の利得係数を引出し、それぞれの利得係数によりそれぞれの合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号541−543,551−553内へマップし、
前記中間サブバンド信号に1つ又はそれ以上の逆フィルタバンクを適用することによって前記複数の出力信号を発生させ
前記複数の利得係数の導出により前記利得係数値の減少が制限され、このことにより結果的に生じるレベルが隠蔽閾値を超えないことを条件に、人の聴覚系の後隠蔽閾値より下方にサブバンド信号のレベルを減少させる変化の速度が低減されることを特徴とする符号化信号復号方法。 - 前記空間特性信号515,516が、複数の信号レベルを表す第1形態、1つ又はそれ以上の方向を表す第2形態のいずれであるかの表示を前記符号化された信号から入手し、それに応答して前記複数の利得係数の導出を適応させることを特徴とする、請求項15又は16のいずれか1つの方法。
- 前記合成サブバンド信号521,522が、前記1つ又はそれ以上の合成信号511にフィルタバンク又は変換を適用することによって引出される、請求項15の方法。
- 前記合成信号511がパラメトリック信号であり、前記引出す段階がそれに応答してスペクトル又は時間的信号を発生させることを含む、請求項15乃至17のいずれか1つの方法。
- 前記符号化された信号501から遅延信号を入手し、前記遅延信号に応答して前記1つ又はそれ以上の中間サブバンド信号541−543,551−553内へのマッピングを遅延させることをさらに含む、請求項15乃至18のいずれか1つの方法。
- 前記中間サブバンド信号541−543,551−553が、人の聴覚系の臨界帯域幅に比例する帯域幅を有する、請求項15乃至20のいずれか1つの方法。
- 前記出力信号561,571,581は、エイリアシング相殺特性を有する逆フィルタバンクを適用するか若しくはエイリアシング相殺特性を有する逆変換を適用することによって発生され、不完全なエイリアシング相殺から結果的に生じるノイズが聴取不可能にされるように、前記マッピングが隣接周波数サブバンド内の中間サブバンド信号541−543,551−553レベル間の差を制限する,請求項15乃至21のいずれか1つの方法。
- 各々がそれぞれのオーデイオ情報チャンネルを表す複数の入力信号1,2,3を符号化することによって符号化された信号51を発生させるエンコーダであって、
複数の周波数サブバンド内の前記入力信号を表す複数のチャンネルサブバンド信号11,12,21,22,31,32を発生させる手段と、
前記入力信号帯域幅の少なくとも一部を表す合成信号61,161,71,72,73を発生させる手段と、
周波数サブバンド内のそれぞれのチャンネルサブバンド信号に応答して音界の空間特性を表す空間特性信号41,42を発生させる手段であって、前記空間特性信号が前記それぞれのチャンネルサブバンドの前記信号レベルを表す情報を伝えるようにする空間特性信号発生手段と、
前記合成信号及び前記空間特性信号を前記符号化された信号にアセンブルする手段とから成り、
前記空間特性信号の発生により空間特性信号を変化させることができる速度が制限され、このことにより、結果的に生じるレベルがその隠蔽閾値を超えないことを条件に、人の聴覚系の後隠蔽閾値の下方にレベルを減少させる変化の速度が低減されることを特徴とする符号化信号発生方法。 - 複数の他チャンネルサブバンド信号に応答して他の音界の空間特性を表す第2空間特性信号を発生させる手段を含み、前記第2空間特性信号が前記複数の他チャンネルサブバンド信号の信号レベル又は前記他の音界の1つ又はそれ以上の見掛けの方向を表し、前記第2空間特性信号を前記符号化された信号内にアセンブルする、請求項23のエンコーダ。
- 前記他の音界が閾値数より少ないか又はそれと等しい数の見掛けの方向を有するとみなされるなら、前記第2空間特性信号が前記1つ又はそれ以上の見掛けの方向を有する、請求項24のエンコーダ。
- 前記閾値数が1つであり、前記他チャンネルサブバンド信号の1つのみが意味のあるスペクトルエネルギを有するか若しくは意味のあるスペクトルエネルギを有する前記他チャンネルサブバンド信号のすべてが相関させられた振幅及び相関させられた位相を有するならば前記他の音界が1つの見掛けの方向を有するとみなされる、請求項25のエンコーダ。
- 前記1つ又はそれ以上の見掛けの方向を表すならば、前記第2空間特性信号も同様に見掛けの方向の回りの音界分散の尺度を表す、請求項24のエンコーダ。
- 前記合成信号161を発生させるためにそれぞれの周波数サブバンド内の2つ又はそれ以上のチャンネルサブバンド信号11,12,21,22,31,32を組み合せる手段をさらに含む、請求項23又は24のいずれか1つのエンコーダ。
- 2つ又はそれ以上の前記入力信号1,2,3を組合わせることによって前記合成信を発生させる手段70と、広帯域信号61にフィルタバンク又は変換を適用することに前記合成信号71,72,73を発生させる手段とをさらに含む、請求項23又は24のいずれか1つのエンコーダ。
- 2つ又はそれ以上の前記入力信号にフィルタバンク又は変換を適用する手段と、前記フィルタバンク又は前記変換を適用することによって得られるサブバンド信号を組合わせることによって前記合成信号を発生させる手段とをさらに含む、請求項23又は24のいずれか1つのエンコーダ。
- 前記合成信号61,161がパラメトリック信号である、請求項23又は24のいずれか1つのエンコーダ。
- 前記チャンネルサブバンド信号11,12,21,22,31,32を変換係数のブロックとして発生させるために前記入力信号に1つ又はそれ以上の離散変換を適用する手段10,20,30をさらに含む、請求項23乃至30のいずれか1つのエンコーダ。
- 前記周波数サブバンドの帯域幅が人の聴覚系の臨界帯域幅に相当する、請求項23乃至32のいずれか1つのエンコーダ。
- 前記それぞれのチャンネルサブバンド信号11,12,21,22,31,32の各々が前記入力信号1,2,3の共通時間間隔に応答して発生され、前記それぞれの音界において振幅又は方向の突然変化が前記共通時間間隔内のどこで起こるかを示す遅延信号を発生させる手段と、前記遅延信号を前記符号化された信号内にアセンブルする手段とをさらに含む、請求項23乃至33のいずれか1つのエンコーダ。
- 前記合成信号71,72,73は、それぞれの周波数サブバンドに相当するサブバンド信号であり、最大尺度を有する当該それぞれの周波数サブバンド内のチャンネルサブバンドに対する信号レベルの尺度に関して、前記合成信号によって伝えられる情報を正規化する手段をさらに含む、請求項23乃至34のいずれか1つのエンコーダ。
- 複数の隣接周波数サブバンドに相当する前記空間特性信号の差分符号化された表現を発生させる手段をさらに含み、前記差分符号化された表現が、隣接周波数サブバンド内の前記チャンネルサブバンド信号間のスペクトル漏洩特性により制限されるダイナミックレンジを有する1つ又はそれ以上のコードを含む、請求項23乃至35のいずれか1つのエンコーダ。
- 1つ又はそれ以上の出力トランスジューサを介して表現するために1つ又はそれ以上の出力信号561,571,581を発生させる符号化された信号501を復号するデコーダであって、
前記符号化された信号から1つ又はそれ以上の合成信号511及び複数の空間特性信号515,516を入手し、前記1つ又はそれ以上の合成信号から複数の合成サブバンド信号521,522を引出す手段510であって、各空間特性信号がそれぞれの合成サブバンド信号と関連づけられ、前記それぞれの合成サブバンド信号に相当するそれぞれの音界の空間特性を表すようにする合成サブバンド信号手段と、
前記空間特性信号から複数の利得係数を引出す手段540,550であって、それぞれの利得係数によりそれぞれの合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号541−543,551−553内にマップするようにする利得係数手段と、
前記中間サブバンド信号に1つ又はそれ以上の逆フィルタバンクを適用することによって前記複数の出力信号を発生させる手段560,570,580とから成り、
前記複数の利得係数の導出により前記利得係数値の減少が制限され、このことにより結果的に生じるレベルが隠蔽閾値を超えないことを条件に、人の聴覚系の後隠蔽閾値より下方にサブバンド信号のレベルを減少させる変化の速度が低減されることを特徴とする符号化信号復号方法。 - 1つ又はそれ以上の出力トランスジューサを介して表現するために1つ又はそれ以上の出力信号561,571,581を発生させる符号化された信号501を復号するデコーダであって、
前記符号化された信号から1つ又はそれ以上の合成サブバンド信号512,513及び複数の空間特性信号515,516を入手する手段510であって、各空間特性信号がそれぞれの合成サブバンド信号と関連づけられ、前記それぞれの合成サブバンド信号に相当するそれぞれの音界の空間特性を表すようにする手段と、
前記空間特性信号から複数の利得係数を引出し、それぞれの利得係数によりそれぞれの合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号541−543,551−553内にマップする手段540,550と、
前記中間サブバンド信号に1つ又はそれ以上の逆フィルタバンクを適用することによって前記複数の出力信号を発生させる手段560,570,580とからなり、
前記複数の利得係数の導出により前記利得係数値の減少が制限され、このことにより結果的に生じるレベルが隠蔽閾値を超えないことを条件に、人の聴覚系の後隠蔽閾値より下方にサブバンド信号のレベルを減少させる変化の速度が低減されることを特徴とする符号化信号復号方法。 - 前記空間特性信号515,516が、複数の信号レベルを表す第1形態、1つ又はそれ以上の方向を表す第2形態のいずれであるかの表示前記符号化された信号501から入手し、それに応答して前記複数の利得係数の導出を適応させる手段を含むことを特徴とする、請求項37又は38のいずれか1つのデコーダ。
- 前記合成サブバンド信号521,522を引出すために1つ又はそれ以上の合成信号511にフィルタバンク又は変換を適用する手段520をさらに含む、請求項37のデコーダ。
- 前記合成信号511がパラメトリック信号であり、前記引出し手段540,550がそれに応答してスペクトル又は一時的信号をも発生させる、請求項37乃至39のいずれか1つのデコーダ。
- 前記符号化された信号501から遅延信号を入手し、前記遅延信号に応答して前記1つ又はそれ以上のサブバンド信号541−543,551−553内へのマッピングを遅延させる手段をさらに含む、請求項39又は40のいずれか1つのデコーダ。
- 前記中間サブバンド信号541−543,551−553内が、人の聴覚系の臨界帯域帯域幅と比例する帯域幅を有する、請求項37乃至42のいずれか1つのデコーダ。
- 前記出力信号を発生させるために、エイリアシング特性を有する逆フィルタバンク又はエイリアシング相殺特性を有する逆変換を適用させる手段560,570,580をさらに含み、前記マッピング手段が連接周波数サブバンド内の前記中間サブバンド信号541−543,551−553レベル間の差を限定し、不完全なエイリアシング相殺から結果的に生じるノイズを聴取不能にさせるようにする、請求項37乃至43のいずれか1つのデコーダ。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US08/895,496 | 1997-07-16 | ||
US08/895,496 US5890125A (en) | 1997-07-16 | 1997-07-16 | Method and apparatus for encoding and decoding multiple audio channels at low bit rates using adaptive selection of encoding method |
PCT/US1998/008647 WO1999004498A2 (en) | 1997-07-16 | 1998-06-19 | Method and apparatus for encoding and decoding multiple audio channels at low bit rates |
Publications (3)
Publication Number | Publication Date |
---|---|
JP2001510953A JP2001510953A (ja) | 2001-08-07 |
JP2001510953A5 JP2001510953A5 (ja) | 2006-01-05 |
JP4223679B2 true JP4223679B2 (ja) | 2009-02-12 |
Family
ID=25404588
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2000503606A Expired - Fee Related JP4223679B2 (ja) | 1997-07-16 | 1998-06-19 | 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置 |
Country Status (12)
Country | Link |
---|---|
US (1) | US5890125A (ja) |
EP (1) | EP1016320B1 (ja) |
JP (1) | JP4223679B2 (ja) |
KR (1) | KR100550399B1 (ja) |
CN (1) | CN1151705C (ja) |
AT (1) | ATE215295T1 (ja) |
AU (1) | AU746416B2 (ja) |
CA (1) | CA2295505C (ja) |
DE (1) | DE69804478T2 (ja) |
DK (1) | DK1016320T3 (ja) |
ES (1) | ES2171031T3 (ja) |
WO (1) | WO1999004498A2 (ja) |
Families Citing this family (119)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6466912B1 (en) * | 1997-09-25 | 2002-10-15 | At&T Corp. | Perceptual coding of audio signals employing envelope uncertainty |
WO1999051036A2 (en) * | 1998-03-31 | 1999-10-07 | Koninklijke Philips Electronics N.V. | Modifying data which has been coded |
US6757326B1 (en) * | 1998-12-28 | 2004-06-29 | Motorola, Inc. | Method and apparatus for implementing wavelet filters in a digital system |
US6246345B1 (en) * | 1999-04-16 | 2001-06-12 | Dolby Laboratories Licensing Corporation | Using gain-adaptive quantization and non-uniform symbol lengths for improved audio coding |
US6405163B1 (en) | 1999-09-27 | 2002-06-11 | Creative Technology Ltd. | Process for removing voice from stereo recordings |
US8767969B1 (en) * | 1999-09-27 | 2014-07-01 | Creative Technology Ltd | Process for removing voice from stereo recordings |
SG98418A1 (en) * | 2000-07-10 | 2003-09-19 | Cyberinc Pte Ltd | A method, a device and a system for compressing a musical and voice signal |
US6377637B1 (en) * | 2000-07-12 | 2002-04-23 | Andrea Electronics Corporation | Sub-band exponential smoothing noise canceling system |
US7308325B2 (en) | 2001-01-29 | 2007-12-11 | Hewlett-Packard Development Company, L.P. | Audio system |
GB0102230D0 (en) * | 2001-01-29 | 2001-03-14 | Hewlett Packard Co | Sound related systems and methods |
US7660424B2 (en) * | 2001-02-07 | 2010-02-09 | Dolby Laboratories Licensing Corporation | Audio channel spatial translation |
US7583805B2 (en) * | 2004-02-12 | 2009-09-01 | Agere Systems Inc. | Late reverberation-based synthesis of auditory scenes |
US7644003B2 (en) | 2001-05-04 | 2010-01-05 | Agere Systems Inc. | Cue-based audio coding/decoding |
US7006636B2 (en) * | 2002-05-24 | 2006-02-28 | Agere Systems Inc. | Coherence-based audio coding and synthesis |
US7116787B2 (en) * | 2001-05-04 | 2006-10-03 | Agere Systems Inc. | Perceptual synthesis of auditory scenes |
US7292901B2 (en) * | 2002-06-24 | 2007-11-06 | Agere Systems Inc. | Hybrid multi-channel/cue coding/decoding of audio signals |
US20030035553A1 (en) * | 2001-08-10 | 2003-02-20 | Frank Baumgarte | Backwards-compatible perceptual coding of spatial cues |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
SE0202159D0 (sv) * | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US7333929B1 (en) | 2001-09-13 | 2008-02-19 | Chmounk Dmitri V | Modular scalable compressed audio data stream |
ES2237706T3 (es) | 2001-11-29 | 2005-08-01 | Coding Technologies Ab | Reconstruccion de componentes de alta frecuencia. |
US7240001B2 (en) * | 2001-12-14 | 2007-07-03 | Microsoft Corporation | Quality improvement techniques in an audio encoder |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
DE10163569A1 (de) * | 2001-12-21 | 2003-11-06 | Endress & Hauser Gmbh & Co Kg | Verfahren zur Bestimmung und/oder Überwachung einer physikalischen oder chemischen Prozeßgröße |
WO2003065353A1 (en) * | 2002-01-30 | 2003-08-07 | Matsushita Electric Industrial Co., Ltd. | Audio encoding and decoding device and methods thereof |
KR20030068308A (ko) * | 2002-02-15 | 2003-08-21 | 주식회사 엘지이아이 | 음성 코덱을 이용한 그래픽 표시장치 및 방법 |
US7328151B2 (en) | 2002-03-22 | 2008-02-05 | Sound Id | Audio decoder with dynamic adjustment of signal modification |
AU2003216686A1 (en) * | 2002-04-22 | 2003-11-03 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
KR101016982B1 (ko) * | 2002-04-22 | 2011-02-28 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 디코딩 장치 |
US7257231B1 (en) | 2002-06-04 | 2007-08-14 | Creative Technology Ltd. | Stream segregation for stereo signals |
US7542896B2 (en) | 2002-07-16 | 2009-06-02 | Koninklijke Philips Electronics N.V. | Audio coding/decoding with spatial parameters and non-uniform segmentation for transients |
US7502743B2 (en) | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
SE0202770D0 (sv) * | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US7787632B2 (en) * | 2003-03-04 | 2010-08-31 | Nokia Corporation | Support of a multichannel audio extension |
SE0301273D0 (sv) * | 2003-04-30 | 2003-04-30 | Coding Technologies Sweden Ab | Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods |
EP1683133B1 (en) * | 2003-10-30 | 2007-02-14 | Koninklijke Philips Electronics N.V. | Audio signal encoding or decoding |
US7539614B2 (en) * | 2003-11-14 | 2009-05-26 | Nxp B.V. | System and method for audio signal processing using different gain factors for voiced and unvoiced phonemes |
US7970144B1 (en) | 2003-12-17 | 2011-06-28 | Creative Technology Ltd | Extracting and modifying a panned source for enhancement and upmix of audio signals |
US7460990B2 (en) * | 2004-01-23 | 2008-12-02 | Microsoft Corporation | Efficient coding of digital media spectral data using wide-sense perceptual similarity |
EP1711938A1 (en) * | 2004-01-28 | 2006-10-18 | Koninklijke Philips Electronics N.V. | Audio signal decoding using complex-valued data |
US20090299756A1 (en) * | 2004-03-01 | 2009-12-03 | Dolby Laboratories Licensing Corporation | Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners |
ATE430360T1 (de) | 2004-03-01 | 2009-05-15 | Dolby Lab Licensing Corp | Mehrkanalige audiodekodierung |
US7805313B2 (en) * | 2004-03-04 | 2010-09-28 | Agere Systems Inc. | Frequency-based coding of channels in parametric multi-channel coding systems |
BRPI0509113B8 (pt) * | 2004-04-05 | 2018-10-30 | Koninklijke Philips Nv | codificador de multicanal, método para codificar sinais de entrada, conteúdo de dados codificados, portador de dados, e, decodificador operável para decodificar dados de saída codificados |
RU2382419C2 (ru) * | 2004-04-05 | 2010-02-20 | Конинклейке Филипс Электроникс Н.В. | Многоканальный кодер |
SE0400998D0 (sv) | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Method for representing multi-channel audio signals |
SE0400997D0 (sv) * | 2004-04-16 | 2004-04-16 | Cooding Technologies Sweden Ab | Efficient coding of multi-channel audio |
US7490044B2 (en) * | 2004-06-08 | 2009-02-10 | Bose Corporation | Audio signal processing |
US7391870B2 (en) * | 2004-07-09 | 2008-06-24 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E V | Apparatus and method for generating a multi-channel output signal |
US7536302B2 (en) * | 2004-07-13 | 2009-05-19 | Industrial Technology Research Institute | Method, process and device for coding audio signals |
TWI393121B (zh) * | 2004-08-25 | 2013-04-11 | Dolby Lab Licensing Corp | 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式 |
US8204261B2 (en) * | 2004-10-20 | 2012-06-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Diffuse sound shaping for BCC schemes and the like |
US7720230B2 (en) * | 2004-10-20 | 2010-05-18 | Agere Systems, Inc. | Individual channel shaping for BCC schemes and the like |
US20070297519A1 (en) * | 2004-10-28 | 2007-12-27 | Jeffrey Thompson | Audio Spatial Environment Engine |
SE0402652D0 (sv) * | 2004-11-02 | 2004-11-02 | Coding Tech Ab | Methods for improved performance of prediction based multi- channel reconstruction |
US7787631B2 (en) * | 2004-11-30 | 2010-08-31 | Agere Systems Inc. | Parametric coding of spatial audio with cues based on transmitted channels |
US8340306B2 (en) * | 2004-11-30 | 2012-12-25 | Agere Systems Llc | Parametric coding of spatial audio with object-based side information |
US7761304B2 (en) * | 2004-11-30 | 2010-07-20 | Agere Systems Inc. | Synchronizing parametric coding of spatial audio with externally provided downmix |
US7903824B2 (en) * | 2005-01-10 | 2011-03-08 | Agere Systems Inc. | Compact side information for parametric coding of spatial audio |
JP4809370B2 (ja) * | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
US7961890B2 (en) * | 2005-04-15 | 2011-06-14 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung, E.V. | Multi-channel hierarchical audio coding with compact side information |
KR100933548B1 (ko) * | 2005-04-15 | 2009-12-23 | 돌비 스웨덴 에이비 | 비상관 신호의 시간적 엔벨로프 정형화 |
US7983922B2 (en) * | 2005-04-15 | 2011-07-19 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Apparatus and method for generating multi-channel synthesizer control signal and apparatus and method for multi-channel synthesizing |
WO2006126859A2 (en) | 2005-05-26 | 2006-11-30 | Lg Electronics Inc. | Method of encoding and decoding an audio signal |
US8917874B2 (en) * | 2005-05-26 | 2014-12-23 | Lg Electronics Inc. | Method and apparatus for decoding an audio signal |
JP4988716B2 (ja) | 2005-05-26 | 2012-08-01 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号のデコーディング方法及び装置 |
US7548853B2 (en) * | 2005-06-17 | 2009-06-16 | Shmunk Dmitry V | Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding |
JP2009500657A (ja) * | 2005-06-30 | 2009-01-08 | エルジー エレクトロニクス インコーポレイティド | オーディオ信号をエンコーディング及びデコーディングするための装置とその方法 |
AU2006266579B2 (en) * | 2005-06-30 | 2009-10-22 | Lg Electronics Inc. | Method and apparatus for encoding and decoding an audio signal |
EP1946294A2 (en) * | 2005-06-30 | 2008-07-23 | LG Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
DE102005032724B4 (de) * | 2005-07-13 | 2009-10-08 | Siemens Ag | Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen |
DE602006010712D1 (de) * | 2005-07-15 | 2010-01-07 | Panasonic Corp | Audiodekoder |
TWI396188B (zh) * | 2005-08-02 | 2013-05-11 | Dolby Lab Licensing Corp | 依聆聽事件之函數控制空間音訊編碼參數的技術 |
US7788107B2 (en) * | 2005-08-30 | 2010-08-31 | Lg Electronics Inc. | Method for decoding an audio signal |
US8577483B2 (en) * | 2005-08-30 | 2013-11-05 | Lg Electronics, Inc. | Method for decoding an audio signal |
AU2006285538B2 (en) * | 2005-08-30 | 2011-03-24 | Lg Electronics Inc. | Apparatus for encoding and decoding audio signal and method thereof |
US7987097B2 (en) * | 2005-08-30 | 2011-07-26 | Lg Electronics | Method for decoding an audio signal |
US8068569B2 (en) * | 2005-10-05 | 2011-11-29 | Lg Electronics, Inc. | Method and apparatus for signal processing and encoding and decoding |
KR100857115B1 (ko) * | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
US7672379B2 (en) * | 2005-10-05 | 2010-03-02 | Lg Electronics Inc. | Audio signal processing, encoding, and decoding |
US7696907B2 (en) * | 2005-10-05 | 2010-04-13 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7646319B2 (en) * | 2005-10-05 | 2010-01-12 | Lg Electronics Inc. | Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor |
US7751485B2 (en) | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
EP1946302A4 (en) * | 2005-10-05 | 2009-08-19 | Lg Electronics Inc | SIGNAL PROCESSING METHOD AND APPARATUS, ENCODING AND DECODING METHOD, AND ASSOCIATED APPARATUS |
US7716043B2 (en) * | 2005-10-24 | 2010-05-11 | Lg Electronics Inc. | Removing time delays in signal paths |
US7676360B2 (en) * | 2005-12-01 | 2010-03-09 | Sasken Communication Technologies Ltd. | Method for scale-factor estimation in an audio encoder |
JP4806031B2 (ja) * | 2006-01-19 | 2011-11-02 | エルジー エレクトロニクス インコーポレイティド | メディア信号の処理方法及び装置 |
US7831434B2 (en) * | 2006-01-20 | 2010-11-09 | Microsoft Corporation | Complex-transform channel coding with extended-band frequency coding |
US8190425B2 (en) * | 2006-01-20 | 2012-05-29 | Microsoft Corporation | Complex cross-correlation parameters for multi-channel audio |
KR100983286B1 (ko) * | 2006-02-07 | 2010-09-24 | 엘지전자 주식회사 | 부호화/복호화 장치 및 방법 |
JPWO2007116809A1 (ja) * | 2006-03-31 | 2009-08-20 | パナソニック株式会社 | ステレオ音声符号化装置、ステレオ音声復号装置、およびこれらの方法 |
US8379868B2 (en) * | 2006-05-17 | 2013-02-19 | Creative Technology Ltd | Spatial audio coding based on universal spatial cues |
US8374365B2 (en) * | 2006-05-17 | 2013-02-12 | Creative Technology Ltd | Spatial audio analysis and synthesis for binaural reproduction and format conversion |
US9697844B2 (en) * | 2006-05-17 | 2017-07-04 | Creative Technology Ltd | Distributed spatial audio decoder |
US8712061B2 (en) * | 2006-05-17 | 2014-04-29 | Creative Technology Ltd | Phase-amplitude 3-D stereo encoder and decoder |
KR101137359B1 (ko) * | 2006-09-14 | 2012-04-25 | 엘지전자 주식회사 | 다이알로그 증폭 기술 |
US8103006B2 (en) * | 2006-09-25 | 2012-01-24 | Dolby Laboratories Licensing Corporation | Spatial resolution of the sound field for multi-channel audio playback systems by deriving signals with high order angular terms |
US8290167B2 (en) | 2007-03-21 | 2012-10-16 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US9015051B2 (en) | 2007-03-21 | 2015-04-21 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Reconstruction of audio channels with direction parameters indicating direction of origin |
US8908873B2 (en) | 2007-03-21 | 2014-12-09 | Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. | Method and apparatus for conversion between multi-channel audio formats |
US7885819B2 (en) | 2007-06-29 | 2011-02-08 | Microsoft Corporation | Bitstream syntax for multi-process audio decoding |
WO2009067741A1 (en) * | 2007-11-27 | 2009-06-04 | Acouity Pty Ltd | Bandwidth compression of parametric soundfield representations for transmission and storage |
CN101527327B (zh) * | 2008-03-07 | 2012-09-19 | 清华大学 | 太阳能电池 |
JP4661901B2 (ja) * | 2008-04-18 | 2011-03-30 | ソニー株式会社 | 信号処理装置および方法、プログラム、並びに信号処理システム |
EP2626855B1 (en) | 2009-03-17 | 2014-09-10 | Dolby International AB | Advanced stereo coding based on a combination of adaptively selectable left/right or mid/side stereo coding and of parametric stereo coding |
US11657788B2 (en) | 2009-05-27 | 2023-05-23 | Dolby International Ab | Efficient combined harmonic transposition |
TWI643187B (zh) | 2009-05-27 | 2018-12-01 | 瑞典商杜比國際公司 | 從訊號的低頻成份產生該訊號之高頻成份的系統與方法,及其機上盒、電腦程式產品、軟體程式及儲存媒體 |
JP5771618B2 (ja) | 2009-10-19 | 2015-09-02 | ドルビー・インターナショナル・アーベー | 音声オブジェクトの区分を示すメタデータ時間標識情報 |
US8759661B2 (en) | 2010-08-31 | 2014-06-24 | Sonivox, L.P. | System and method for audio synthesizer utilizing frequency aperture arrays |
EP2661746B1 (en) | 2011-01-05 | 2018-08-01 | Nokia Technologies Oy | Multi-channel encoding and/or decoding |
US8653354B1 (en) * | 2011-08-02 | 2014-02-18 | Sonivoz, L.P. | Audio synthesizing systems and methods |
US9445174B2 (en) | 2012-06-14 | 2016-09-13 | Nokia Technologies Oy | Audio capture apparatus |
WO2014159898A1 (en) * | 2013-03-29 | 2014-10-02 | Dolby Laboratories Licensing Corporation | Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals |
CN104681032B (zh) * | 2013-11-28 | 2018-05-11 | 中国移动通信集团公司 | 一种语音通信方法和设备 |
EP3332557B1 (en) | 2015-08-07 | 2019-06-19 | Dolby Laboratories Licensing Corporation | Processing object-based audio signals |
NO343581B1 (no) * | 2017-03-01 | 2019-04-08 | Dolby Int Ab | Fremgangsmåte, anordning og program til spektralinnhyllingsjustering |
US10984808B2 (en) * | 2019-07-09 | 2021-04-20 | Blackberry Limited | Method for multi-stage compression in sub-band processing |
CN115472170A (zh) * | 2021-06-11 | 2022-12-13 | 华为技术有限公司 | 一种三维音频信号的处理方法和装置 |
CN113873420B (zh) * | 2021-09-28 | 2023-06-23 | 联想(北京)有限公司 | 音频数据处理方法及装置 |
Family Cites Families (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5539829A (en) * | 1989-06-02 | 1996-07-23 | U.S. Philips Corporation | Subband coded digital transmission system using some composite signals |
NL9000338A (nl) * | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
US5632005A (en) * | 1991-01-08 | 1997-05-20 | Ray Milton Dolby | Encoder/decoder for multidimensional sound fields |
AU653582B2 (en) * | 1991-01-08 | 1994-10-06 | Dolby Laboratories Licensing Corporation | Encoder/decoder for multidimensional sound fields |
US5274740A (en) * | 1991-01-08 | 1993-12-28 | Dolby Laboratories Licensing Corporation | Decoder for variable number of channel presentation of multidimensional sound fields |
US5581653A (en) * | 1993-08-31 | 1996-12-03 | Dolby Laboratories Licensing Corporation | Low bit-rate high-resolution spectral envelope coding for audio encoder and decoder |
DK0799531T3 (da) * | 1994-12-20 | 2000-07-10 | Dolby Lab Licensing Corp | Fremgangsmådeapparat til at anvende bølgeformsforudsigelse til underbånd af et kodningssystem, der vedrører sanseopfattelse |
-
1997
- 1997-07-16 US US08/895,496 patent/US5890125A/en not_active Expired - Lifetime
-
1998
- 1998-06-19 WO PCT/US1998/008647 patent/WO1999004498A2/en active IP Right Grant
- 1998-06-19 AU AU81380/98A patent/AU746416B2/en not_active Ceased
- 1998-06-19 EP EP98931197A patent/EP1016320B1/en not_active Expired - Lifetime
- 1998-06-19 AT AT98931197T patent/ATE215295T1/de active
- 1998-06-19 KR KR1019997012376A patent/KR100550399B1/ko not_active IP Right Cessation
- 1998-06-19 ES ES98931197T patent/ES2171031T3/es not_active Expired - Lifetime
- 1998-06-19 DE DE69804478T patent/DE69804478T2/de not_active Expired - Lifetime
- 1998-06-19 CA CA002295505A patent/CA2295505C/en not_active Expired - Fee Related
- 1998-06-19 CN CNB988072599A patent/CN1151705C/zh not_active Expired - Fee Related
- 1998-06-19 JP JP2000503606A patent/JP4223679B2/ja not_active Expired - Fee Related
- 1998-06-19 DK DK98931197T patent/DK1016320T3/da active
Also Published As
Publication number | Publication date |
---|---|
JP2001510953A (ja) | 2001-08-07 |
WO1999004498A2 (en) | 1999-01-28 |
ES2171031T3 (es) | 2002-08-16 |
WO1999004498A3 (en) | 1999-09-16 |
CA2295505C (en) | 2008-09-02 |
AU8138098A (en) | 1999-02-10 |
KR20010020540A (ko) | 2001-03-15 |
KR100550399B1 (ko) | 2006-02-08 |
AU746416B2 (en) | 2002-05-02 |
CN1264533A (zh) | 2000-08-23 |
DE69804478D1 (de) | 2002-05-02 |
DK1016320T3 (da) | 2002-07-08 |
US5890125A (en) | 1999-03-30 |
DE69804478T2 (de) | 2002-10-02 |
CN1151705C (zh) | 2004-05-26 |
EP1016320A2 (en) | 2000-07-05 |
CA2295505A1 (en) | 1999-01-28 |
ATE215295T1 (de) | 2002-04-15 |
EP1016320B1 (en) | 2002-03-27 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP4223679B2 (ja) | 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置 | |
JP3804968B2 (ja) | 適応配分式符号化・復号装置及び方法 | |
US10529347B2 (en) | Methods, apparatus and systems for determining reconstructed audio signal | |
KR100828952B1 (ko) | 저 비트속도 공간 코딩방법 및 시스템 | |
JP2756515B2 (ja) | 可聴信号の知覚符号化方法および音声信号伝送方法 | |
RU2376654C2 (ru) | Параметрическое совместное кодирование аудиоисточников | |
JP3263168B2 (ja) | 可聴音信号を符号化する方法及びデコーダ | |
JP3153933B2 (ja) | データ符号化装置及び方法並びにデータ復号化装置及び方法 | |
US6415251B1 (en) | Subband coder or decoder band-limiting the overlap region between a processed subband and an adjacent non-processed one | |
US5581654A (en) | Method and apparatus for information encoding and decoding | |
JP2003099099A (ja) | 多次元音場用符号器・復号器 | |
JP2002032100A (ja) | オーディオ信号を符号化する方法 | |
KR20040054235A (ko) | 비트율 조절이 가능한 스테레오 오디오 부호화 및복호화방법 및 그 장치 | |
Johnston et al. | AT&T perceptual audio coding (PAC) | |
US6463405B1 (en) | Audiophile encoding of digital audio data using 2-bit polarity/magnitude indicator and 8-bit scale factor for each subband | |
JPH09102742A (ja) | 符号化方法および装置、復号化方法および装置、並びに記録媒体 | |
KR20040086878A (ko) | 대역 확장 기법을 이용한 오디오 데이터의 부호화 방법,그 장치, 복호화 방법 및 그 장치 | |
JP3827720B2 (ja) | 差分コーディング原理を用いる送信システム | |
JP3513879B2 (ja) | 情報符号化方法及び情報復号化方法 | |
Smyth | An Overview of the Coherent Acoustics Coding System | |
AU682913B2 (en) | Encoder/decoder for multidimensional sound fields | |
KR20070017441A (ko) | 저 비트속도 공간 코딩방법 및 시스템 | |
JPH09261063A (ja) | 信号符号化方法および装置 | |
Bosi et al. | DTS Surround Sound for Multiple Applications |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20050517 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20050517 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20070827 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20081021 |
|
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20081120 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111128 Year of fee payment: 3 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121128 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131128 Year of fee payment: 5 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
R250 | Receipt of annual fees |
Free format text: JAPANESE INTERMEDIATE CODE: R250 |
|
LAPS | Cancellation because of no payment of annual fees |