JP4223679B2

JP4223679B2 - 低ビットレート多重オーデイオチャンネル符号・復号方法及び装置

Info

Publication number: JP4223679B2
Application number: JP2000503606A
Authority: JP
Inventors: デイビス、マーク・エフ; フェラーズ、マシュー・シー
Original assignee: Dolby Laboratories Licensing Corp
Current assignee: Dolby Laboratories Licensing Corp
Priority date: 1997-07-16
Filing date: 1998-06-19
Publication date: 2009-02-12
Anticipated expiration: 2018-06-19
Also published as: JP2001510953A; WO1999004498A2; ES2171031T3; WO1999004498A3; CA2295505C; AU8138098A; KR20010020540A; KR100550399B1; AU746416B2; CN1264533A; DE69804478D1; DK1016320T3; US5890125A; DE69804478T2; CN1151705C; EP1016320A2; CA2295505A1; ATE215295T1; EP1016320B1

Description

【０００１】
技術分野
概して本発明は、オーデイオ情報を伝える信号の情報要件を低減させる、多重チャンネルオーデイオ情報の高品質符号化及び復号に関する。本発明は、典型的にパソコンを公衆網に接続するのに用いられる電話線のような、比較的低帯域幅伝送路を介して多重チャンネルオーデイオ情報を実時間で伝送するのに有用である。
【０００２】
背景技術
オーデイオ信号処理分野では、信号品質の知覚可能な損失なしにオーデイオ信号を表すために要する情報量を最小にすることには多大の関心がある。必要な情報量を低減させることによって、通信路及び記憶媒体に対して課される信号表現の情報容量要件はより低減される。
【０００３】
従来の住宅用電話線のような比較的低帯域幅の通信路を介して多重チャンネルの高品質デジタルオーデイオ信号を実時間で伝送する方法を開発することについては特に関心がある。この種の通信路は、パソコンを公衆網に接続するために一般的に用いられ、現在約毎秒50kビットの能力に過ぎない。オーデイオ信号を実時間伝送することによって、信号によって表される情報は信号が受信されるにつれて妨害なしに表現又は再生され得る。
【０００４】
情報容量要件は、2つのデータ圧縮技術の一方又は双方を適用することによって低減され得る。その一方は、「損失のある」圧縮と呼ばれことがあり、原信号の完全な回復を保証せず、概してこれ妨げる方法で情報要件を低減させる。その他方は、「損失のない」圧縮と呼ばれ、原信号の完全な回復が可能な方法で情報要件を低減させる。
【０００５】
量子化は、よく知られた損失型圧縮技術である。量子化は、デジタル信号の各サンプルを表すのに用いられるビット数を低減させることによって情報容量要件を低減させ、それによってデジタル信号表現の精度を低減させ得る。オーデイオ符号化用途では、低減される精度又は量子化誤差は、量子化ノイズとして現れる。もし誤差が十分大きいなら、量子化ノイズは、符号化される信号の実質的品質を劣化させるであろう。
【０００６】
色々なオーデイオ符号化技術では、知覚可能か若しくは知覚される符号化品質に無関係な情報成分を除去することによって、何等の知覚可能な劣化を被ることなく入力信号に損失のある圧縮技術を適用することが試みられる。除去される成分が真に無関係であるとすれば、相補的な復号技術で、知覚的に入力信号と区別できない入力信号レプリカを回復することができる。例えば、分割帯域符号化では、入力信号を幾つかの狭帯域信号に分割し、心理音響原理により各狭帯域信号を適応的に量子化する。
【０００７】
心理音響原理は、人の聴覚系周波数分析特性に基づものである。同聴覚系は、中心周波数の関数として変化する可変中心周波数及び帯域幅を有する高度に非対称な調整されたフィルタに類似している。別個の音調を検出する能力は、概して音調間の周波数差が増加するにつれて増加する。人の聴覚系の分解能は、上記濾波作用の帯域幅未満の周波数差については実質的に一定である。この帯域幅は、オーデイオスペクトル全体を通して変化し、「臨界帯域幅」と呼ばれる。優勢な信号は、臨界帯域幅外の周波数における他の信号を隠蔽(マスク)するよりは恐らく当該臨界帯域幅以内のどこにおいても他の信号の可聴性をより隠蔽するであろう。優勢な信号は、隠蔽信号と同時に起こる他の信号のみならず、隠蔽信号の前後に起こる他の信号をも隠蔽し得る。前隠蔽及び後隠蔽効果の持続時間は、隠蔽信号の大きさに依存するが、前隠蔽効果は通常後隠蔽効果より遥かに短い持続時間のものである。前隠蔽持続時間は、１００ｍｓｅｃを超え得るが、概して５ｍｓｅｃ未満に限られるとみなされる。後隠蔽持続時間は、５００ｍｓｅｃを超え得るが、約５０ｍｓｅｃに限られるとみなされる。信号の隠蔽される成分は重要ではなく、聴取者の聴覚経験を変えることなく除去し得る。
【０００８】
分割帯域オーデイオ符号化では、各々が人の聴覚系の臨界帯域幅と同程度の帯域幅を有する幾つかのサブバンド信号に、オーデイオ信号帯域幅を分割するために、順方向又は「分析」フィルタバンクを用いる。各サブバンド信号が丁度十分なビットを用いて量子化され、各バンドの量子化ノイズが当該サブバンド又は多分隣接サブバンド内のスペクトル成分によって隠蔽されることを保証するようにする。分割帯域オーデイオ復号では、逆方向又は「合成」フィルタバンクを用いて原信号のレプリカを再構成する。もしフィルタバンクのフィルタ帯域幅及びサブバンド信号の量子化精度が適切に選ばれるなら、再構成されるレプリカは、知覚的に原信号から区別され得ない。
【０００９】
このような2つの符号化技術がサブバンド符号化及び変換符号化である。サブバンド符号化では、フィルタバンクを実施するために色々なアナログ、デジタル濾波技術を用い得る。変換符号化では、フィルタバンクを実施するために色々な時間領域対周波数領域変換を用い得る。個々の変換係数帯域幅の合計である有効帯域幅を有するサブバンドを定めるために隣接周波数領域変換係数はグループ化され得る。
【００１０】
以下の記載全体を通して「分割バンド符号化」及び類似の用語は、有効な信号帯域幅の各部分に作用する、サブバンド符号化・復号、変換符号化・復号及びその他の符号化・復号技術を指す。「サブバンド」の用語は、真のサブバンドコーダ、変換コーダ又は他の技術によって実施されようとされまいと、有効な信号帯域幅の部分を指す。「サブバンド信号」の用語は、それぞれのサブバンド以内の分割帯域濾波信号表示を指す。
【００１１】
損失のある圧縮は、スケーリング(位取り)を含む。分割帯域符号化を含む多くの符号化技術は、限られたビット数によって表される符号化された情報のダイナミックレンジを伸ばすために位取りされた表現を用いる信号を伝える。位取りされた表現は、符号化される信号の要素に対応する「位取りされた値」と関連する1つ又はそれ以上の「位取り因(係)数」を含む。多くの形式の位取りされた表現が知られている。位取りされた値の多少の精度を犠牲にすることによって、「ブロック位取りされた表現」を用いる情報を伝えるためにさらに少ないビットが用いられ得る。ブロック位取りされた表現は、共通位取り係数と関連する一グループ又はブロックの位取りされた値を含む。
【００１２】
損失のない形の圧縮は、冗長な信号成分を低減又は除去することによって劣化なしに情報容量要件を低減させる。相補的な圧縮解除技術では、圧縮中に除去される冗長成分を与えることによって原信号を完全に回復することができる。損失のない圧縮技術の例には、ランレングス符号化、差分コード化、線型予測コード化及び変換コード化がある。これらの圧縮技術に対する変形、組合せ及び適応形式も知られている。
【００１３】
損失のある圧縮技術及び損失のない圧縮技術を組合わせるハイブリッド技術も知られている。例えば、変換を基礎とするフィルタバンクを用いる分割帯域コード化は、損失のない変換コード化を損失のある心理音響知覚コード化と組合わせる。
【００１４】
上記のような単一チャンネルコード化技術では、例えば、実時間再生のために従来の電話線のような低帯域幅経路を介して伝えられるべき多重チャンネル高品質オーデイオを可能にするために十分な程情報要件は低減されない。色々な高性能コード化システムは、１５ｋＨｚの帯域幅を有するオーデイオ信号を実時間で伝えるために毎秒約６４ｋビット又はそれ以上のものを必要とする。多重オーデイオチャンネルを伝えるためにはこれらのビットレートの倍数を要するので、従来の住宅用電話線のような限られた帯域幅経路を介して実時間で多重オーデイオチャンネルを伝えることを可能にするためには、単一チャンネルコード化システムの性能に極端な改良を加える必要がある。情報容量要件のさらなる低減は、本明細書で空間コード化技術と呼ばれる多重チャンネルコード化技術によって扱われる。
【００１５】
空間符号化の一形態では、符号化マトリックスにより多重信号を組合せ、相補的復号マトリックスを用いて原信号のレプリカを回復する。多くの４：２：４マトリックス化技術が知られており、同技術では伝送及び記憶のために4つの信号を2つの信号に組合せ、次いで2つの符号化された信号から4つの原信号のレプリカを回復する。この符号化技術は、信号間の高レベルクロストークに悩まされる。クロストークレベルを下げるために多数の適応マトリックス化技術が開発されてきたが、クロストークの低減及び情報容量要件の低減は共に不十分である。
【００１６】
空間符号化の他の形態では、多重入力信号をサブバンド信号に分割し、各サブバンドにおけるチャンネルのスペクトルレベルを表すステアリング(方向づけ)情報のベクトルを発生させ、和又は合成サブバンド信号を発生させるために所与の周波数サブバンドのすべてのチャンネルにつきサブバンド信号を組合せ、合成サブバンド信号を知覚的に符号化し、符号化された合成サブバンド信号及びステアリングベクトルを符号化された信号に組合わせる。相補的デコーダが、適切なサブバンドのステアリングベクトルにより当該サブバンド信号を位取りすることによって各出力信号に対するそれぞれの周波数サブバンド内にサブバンド信号を発生させかつ逆フィルタバンクを通して位取りされたサブバンド信号を通すことによって出力信号を発生させる。このような符号化システムの2つの例が、デビス他(Davis, et al.)の米国特許第5,583,962号及び「約1.5Mbit/sまでにおけるデジタル記憶媒体用映画及び関連オーデイオの符号化(International Organization for Standardization, CD 11172-3, Part 3(Audio), Annex 3-G(Joint Stereo Coding), pp.G-1 to G-4)に開示されている。
【００１７】
不幸にして、これらの空間コード化技術では、たとえ知覚コード化と組合されても、実時間再生のために十分低いビットレートにおいて低帯域幅経路を介して多重チャンネル高品質オーデイオを伝えることは不可能である。これらの技術では、原入力信号のレプリカは、ちゅちゅ(小鳥や虫の泣き声)又はかちり(クリック)という音及びファスナの開閉音(ジッパーノイズ)のような、望ましくない人工物と共に発生される。
【００１８】
発明の開示
本発明の目的は、多重オーデイオ信号を符号化された低ビットレート信号に符号化しかつ符号化された信号を多重オーデイオ信号の高品質レプリカに復号する方法及び装置を提供することにある。
【００１９】
本発明の他の面の教示によるとエンコーダは、複数の周波数サブバンド内の複数の入力信号から複数チャンネルのサブバンド信号を発生させ、入力信号の帯域幅の少なくとも一部を表す合成信号を発生させ、周波数サブバンドの各々のチャンネルサブバンド信号に応答して音界(サウンドフィールド)の空間特性を表す空間特性信号を発生させ、空間特性信号は、信号レベルを表す情報値の減少が人の聴覚系の後隠蔽特性の減少に比例して制限されるように各々のチャンネルサブバンド信号のレベルを表す情報を伝え、合成信号及び空間特性信号を符号化された信号にアセンブルする。
【００２０】
本発明のさらに他の面の教示によるとデコーダは、符号化された信号から1つ又はそれ以上の合成信号と複数の空間特性信号とを入手し、1つ又はそれ以上の合成信号から複数の合成サブバンド信号を引き出し、各空間特性信号が、各々の合成サブバンド信号と関連づけられかつ各々の合成サブバンド信号に対応する各々の音界空間特性を表すようにし、空間特性信号から複数の利得係数を引き出し、利得係数値の減少が人の聴覚系の後隠蔽特性の減少に比例して制限されるようにし、各々の利得係数により各々の合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号にマップ(写像)し、中間サブバンド信号に1つ又はそれ以上の逆フィルタバンクを適用することによって複数の出力信号を発生させる。
【００２１】
本発明の色々な特徴及び望ましい実施形態は、以下の議論及び添付図を参照することによってよりよく理解し得る。幾つかの図面では同一要素は同一参照番号で示される。以下の論議及び図面の内容は例としてのみ記載され、本発明の範囲を表すものと理解すべきではない。
【００２２】
発明を実施するモード
エンコーダ
図1は、本発明による多重チャンネルエンコーダの一実施形態である。サブバンド信号発生器１０は、経路１から入力信号を受信し、入力信号に応答して、経路１１及び１２に沿ってチャンネルサブバンド信号を発生させる。同様に、サブバンド信号発生器２０は、経路２から受信する入力信号に応答して、経路２１及び２２に沿ってチャンネルサブバンド信号を発生させ、サブバンド信号発生器３０は、経路３から受信する入力信号に応答して、経路３１及び３２に沿ってチャンネルサブバンド信号を発生させる。多く実際的実施形態では、各信号発生器によって3つ以上のチャンネルサブバンド信号が発生される。
【００２３】
多くの用途につき、各サブバンド信号発生器が、各入力信号の有効帯域幅に及ぶ周波数サブバンドを表すチャンネルサブバンド信号を発生させることが予想される。しかし、これは本発明を実施するためには不必要である。例えば、1つ又はそれ以上のサブバンド信号発生器は、有効帯域幅の一部、例えば、約１．５ｋＨｚより下方の帯域幅部分、のみを表すチャンネルサブバンド信号を発生し得る。概して、チャンネルサブバンドコーダは、音界空間特性を決定するために空間コーダ４０によって分析されるスペクトル部分につき発生されるべきである。
【００２４】
空間コーダ４０は、サブバンド信号発生器から受信されるチャンネルサブバンド信号に応答して経路４１及び４２に沿って空間特性信号を発生させる。これらの空間特性信号の各々は、各々の周波数サブバンドの1つ又はそれ以上のチャンネルサブバンド信号に対応する音界の空間特性を表す。合成信号発生器６０は、経路１，２及び３から受信される入力信号を組合わせることによって経路６１に沿って合成信号を発生させる。
【００２５】
本発明は、知覚符号化のようなある種のデータ圧縮と共に用いられることが予想されるが、本発明を実施するためにデータ圧縮は不要である。もしデータ圧縮が用いられるなら、実質的にあらゆる形態のデータ圧縮が経路６１に沿って発生される合成信号に適用され得る。
【００２６】
フォーマッタ５０は、経路４１及び４２から受信される空間特性信号と、経路６１から受信される合成信号とを出力信号にアセンブルする。出力信号は伝送又は記憶のために経路５１に沿って送られる。もし合成信号がデータ圧縮又は符号化を受けるなら、合成信号それ自体よりはむしろ符号化された形態が出力信号にアセンブルされる。
【００２７】
図２は、本発明による多重チャンネルエンコーダの他の実施形態を例示する。この実施形態は、経路６１から受信される合成信号に応答して経路７１‐７３に沿って合成サブバンド信号を発生するサブバンド信号発生器７０が追加されることを除けば、図１に例示するものと同一である。
【００２８】
この第2実施形態でデータ圧縮が用いられるなら、それはこれらの合成サブバンド信号に適用され得る。特に、もし合成サブバンド信号の帯域幅が臨界帯域幅と釣り合うなら知覚的符号化技術が有利に適用され得る。サブバンド信号発生器７０によって発生される合成サブバンド信号の帯域幅が、サブバンド信号発生器１０，２０及び３０によって発生されるチャンネルサブバンド信号の帯域幅と同一である必要がないことは指摘されるべきである。実際、サブバンド信号発生器１０，２０及び３０によって発生されるチャンネルサブバンド信号の帯域幅でさえも同一であることを要しない。
【００２９】
幾つかのサブバンド信号発生器を実施するためには色々な技術が用いられ得る。例えば、非再帰(反復)的、再帰的又は格子フィルタが用いられ得る。非再帰的フィルタの中には多項式フィルタ又は変換操作を用いて実施され得るものもある。特殊フィルタデザインの例には、離散フーリエ変換(DFT)と離散余弦変換(DCT)、直角位相ミラーフィルタ(QMF)及びいわゆる偶数積重ねと奇数積重ね時間領域エイリアシング相殺(TDAC)変換のような各種の変換がある。変換の分析特性は、変換の適用に先立って信号サンプルブロックを変調するために用いられる任意のウインドウファンクション(関数)の形状によって影響される。
【００３０】
任意の実施形態で用いられる各種のサブバンド信号発生器の分析特性は、同一であることを要しない。例えば、サブバンド信号発生器１０，２０及び３０は、同一フィルタバンクを併合するのが望ましい。同フィルタバンクは、スペクトル分解能を最適化するように設計されかつサブバンド信号パワー(累乗)の正確な尺度を与える。しかし、サブバンド信号発生器７０では、臨界サンプリングを与えかつスペクトル分解能及び時間的分解能間の兼合いを釣合わせることによってデータ圧縮を最適化するように選択され得る。
【００３１】
図３は、図１に例示されるようなエンコーダ内に併合され得る合成信号発生器の実施形態を例示する。この実勢形態では、サブバンド信号発生器１７０は、経路１から受信される入力信号に応答して経路１７１-１７３に沿ってサブバンド信号を発生させる。同様に、サブバンド信号発生器１８０は、経路２から受信される入力信号に応答して経路１８１-１８３に沿ってサブバンド信号を発生させ、サブバンド信号発生器１９０は、経路３から受信される入力信号に応答して経路１９１-１９３に沿ってサブバンド信号を発生させる。サブバンド発生器２６０は、経路１７１、１８１及び１９１から受信されるサブバンド信号に応答して経路２６１に沿って合成サブバンド信号を発生させる。同様に、サブバンド発生器２７０は、経路１７２，１８２及び１９２から受信されるサブバンド信号に応答して経路２７１に沿って合成サブバンド信号を発生させ、サブバンド発生器２８０は、経路１７３，１８３及び１９３から受信されるサブバンド信号に応答して経路２８１に沿って合成サブバンド信号を発生させる。一実施形態では、サブバンド信号発生器２６０、２７０及び２８０は、サブバンド信号発生器１７０、１８０及び１９０から受信するサブバンド信号の和を形成することによって合成サブバンド信号を発生させる。合成サブバンド信号を形成する代わりの方法は以下に述べる。合成サブバンド信号が発生される方法は、本発明の実施にとって決定的ではなくかつ合成サブバンドは、何らかの形態のデータ圧縮を受けられ得る。
【００３２】
図４は、本発明による多重チャンネルエンコーダの他の実施形態を例示する。この実施形態は、サブバンド信号発生器１０、２０及び３０によって発生されるチャンネルサブバンド信号に応答して、合成信号発生器１６０が経路１６１に沿って１つ又はそれ以上の合成信号を発生させることを除けば、図１に例示される実施形態と同一である。一実施形態において、合成信号発生器１６０は、各入力信号につき所定の周波数サブバンドにおいてチャンネルサブバンド信号を組合せ、当該周波数サブバンドにつき合成サブバンド信号を発生させる。経路１６１に沿って発生される1つ又はそれ以上の合成信号は、何らかのデータ圧縮を受けられ得る。
【００３３】
デコーダ
図５は、本発明による多重チャンネルデコーダの他の実施形態を例示する。デフォーマッタ５１０は、経路５０１から受信される符号化された信号から1つ又はそれ以上の合成信号及び空間特性信号を引き出す。示された一実施形態では、合成信号が経路５１１に沿って送られ、空間特性信号が経路５１５及び５１６に沿って送られる。サブバンド信号発生器５２０は、経路５１１から受信される合成信号に応答して経路５２１及び５２２に沿って合成サブバンド信号を発生させる。空間デコーダ５３０は、経路５１５及び５１６から受信される空間特性信号から複数の利得係数を引出し、合成信号を1つ又はそれ以上の中間サブバンド信号にマップ(写像)するためにこれらの利得係数を用いる。中間信号発生器５４０は、経路５４１、５４２及び５４３に沿って中間サブバンド信号を発生させ、中間信号発生器５５０は、経路５５１、５５２及び５５３に沿って中間サブバンド信号を発生させる。出力信号発生器５６０は、経路５４１及び５５１から受信される中間サブバンド信号に応答して経路５６１に沿って出力信号を発生させる。同様に、出力信号発生器５７０は、経路５４２及び５５２から受信される中間サブバンド信号に応答して経路５７１に沿って出力信号を発生させ、出力信号発生器５８０は、経路５４３及び５５３から受信される中間サブバンド信号に応答して経路５８１に沿って出力信号を発生させる。
【００３４】
図面に示されるデコーダのすべての実施形態において、各中間サブバンド信号は全出力内にマップされるが、これは必要ではない。所与の中間サブバンド信号が全出力信号内にマップされる必要はない。
【００３５】
もし符号化された信号から引き出される合成信号が、データ圧縮を受けているなら、経路５１１に沿って送られる信号、経路５２１及び５２２に沿って送られるサブバンド信号につき、必要に応じて相補的形態のデータ拡張が適用され得る。
【００３６】
サブバンド発生器５２０を実施するためには既に述べたような各種の濾波及び変換技術が用いられ得る。出力信号発生器を実施するためには相補的技術又は逆の技術が用いられる。
【００３７】
図６は、本発明による多重チャンネルデコーダの他の実施形態を例示する。この実施形態は、デフォーマッタ５１０が符号化された信号から直接合成信号を引出してこれらの信号を経路５１２及び５１３に沿って送ることを除けば、図５に例示されたものと同一である。データ拡張は、必要に応じて合成サブバンド信号に適用され得る。出力信号発生器の実施に用いられる逆濾波又は逆変換技術は、符号化される信号内にアセンブルされた合成サブバンド信号を発生させるために用いられる逆濾波又は逆変換技術と相補であるべきである。
【００３８】
本発明によるエンコーダは、それぞれの周波数サブバンドにつき第1種及び多分追加の第2種形態で空間特性信号を発生し得る。一実施形態における第1形式、即ち、第１種信号は、音界に寄与する各チャンネルサブバンド信号に関する信号レベルの尺度を表す。信号レベルの尺度は、例えば、ピーク振幅、平均振幅又は二乗平均平方根(RMS)でよい。他の実施形態における第１信号は、音界に寄与する各「仮想」チャンネルサブバンド信号に関する信号レベルの何らかの尺度を表す。仮想チャンネルは物理的実体として存在する必要はないが、例えば、1つ又はそれ以上の物理的チャンネルからの信号の加重和又はその他の組合せを表す概念上の実体であり得る。空間特性信号内の用素数が音界に寄与する実際の物理的チャンネル数と等しい必要はないということが肝要な面である。
【００３９】
第2の形式、即ち、第II種信号は、音界に関する1つ又はそれ以上の見掛けの方向及び多分音界幅の何らかの表示又は方向についての分散特性を表す。方向は、例えば、3次元又は2次元空間におけるベクトルによって表され得る。
【００４０】
例えば、5つの入力チャンネルを表す合成信号を符号化するシステムにおいて、各々の周波数サブバンドに対する第Ｉ種空間特性信号は、信号レベルの5つの尺度、例えば、パワー(冪)、即ち、当該周波数サブバンド内の各入力チャンネルに対する尺度を含む。当該同一システムにおいて各々の周波数サブバンドに対する第II種空間特性信号は、1つ又はそれ以上の方向の表示を含む。各周波数サブバンド内で1方向のみを表す実施形態においては、例えば、各バンドに対する第II種信号は、2次元又は3次元空間に対しデカルト座標又は極座標内のベクトルとして表され得る。
【００４１】
第II種信号の情報容量要件は、入力チャンネル数には依存しないが、この種の空間特性信号を発生させるプロセス(処理)では、音界方向が正確に決定され得るように各入力チャンネルによって表される音源の数及び位置につき知らされなければならない。
【００４２】
一実施形態においてエンコーダは、第1種及び多分追加の第2種形態で各々の周波数サブバンドに対する空間特性信号を発生させる。タイプは、必要なオーデイオ品質、出力チャンネル帯域幅、見掛けの方向数のような本質的にあらゆる規準に基づいて選択され得る。第２種信号は、第１種信号を符号化するのに要するビット数と対照して第２種信号を符号化するのに要するビット数は概して少ないので、低チャンネル帯域幅を有する多重チャンネルシステムで用いられ得る。しかし、もし各々のサブバンドに対する音界が何らかの閾値数を超える数の方向を持つとみなされるなら、第１種信号はより少ないビットしか要しないであろう。
【００４３】
もし例えば、大オーケストラを表す幾つかのチャンネルのオーデイオ情報が高品質で再生されるならば、オーケストラの回りを飛ぶ一匹の蚊を表す他のチャンネルのオーデイオ情報は劣った品質で再生され得る。オーケストラを表すサブバンド信号に対する空間特性信号は、第1形式で形成され、蚊を表すサブバンド信号に対する空間特性信号は、第2形式で形成され得るであろう。
【００４４】
音界に対する見掛けの方向の数が増加するにつれて、第II種信号を伝えるのに要するビット数は増加し、従って、サブバンド内の音界に対する見掛けの方向が増加するにつれて、当該サブバンドに対しては概して第Ｉ種空間特性信号が望ましい。もし周波数サブバンド内で1つのチャンネルのみが意味のあるスペクトルエネルギを有するなら、当該サブバンド内の音界に対する見掛けの方向の数は1つとみなされる。もし1つ又はそれ以上のチャンネルがそれぞれのサブバンドにおいて意味のあるエネルギを有するなら、当該サブバンド内のチャンネルの振幅及び位相が単一音源を表すように相関づけられならば、見掛けの方向の数は同様に1つとみなされる。
【００４５】
チャンネルサブバンド信号及び空間特性信号間の関係は、すべての周波数サブバンドにつき同一であるべき必要はない。さらに、当該関係は固定されるべき必要はなく、入力特性又は出力チャンネル帯域幅のような各種の要件に応答して変わり得る。単純な実施形態においては、それぞれの空間特性信号が各周波数サブバンドにつき発生され、当該サブバンド内のすべてのサブバンド信号に対応する音界の空間特性を表す。
【００４６】
図１，２及び４に示される実施形態に関する他の例では、経路４１に沿って発生される空間特性信号は、経路１１、２１及び３１から受信されるチャンネルサブバンド信号に相当する音界空間特性を表し、経路４２に沿って発生される空間特性信号は、経路１２及び３２から受信されるチャンネルサブバンド信号に相当する音界空間特性を表す。この例の変形では、経路２２から受信されるチャンネルサブバンド信号に相当する音界空間特性を表すために他の空間特性信号が発生される。
【００４７】
さらに他の例におけるエンコーダは、第1種及び多分追加の第2種形態で空間特性信号を適応的に形成する。適応は、周波数サブバンド内で表されるべきであるとみなされる見掛けの方向の数、見掛けの方向の知覚される幅、空間特性信号を伝えるために得られるビット数に基づかれ得る。望ましい実施形態では、空間特性信号を表すために選ばれる形態は、情報容量要件及び聴覚品質間の最良の兼合いを与える。
【００４８】
幾つかの用例では、空間特性信号の情報容量要件は、信号が変化し得る時間的変化速度(レート)を制限することによって低減され得る。第Ｉ種信号に対しては、スペクトルレベル尺度が変わり得る率を制限するために時間的平滑化が適用される。時間的平滑化は、これらの尺度の増加及び減少の双方を制限するために適用され得るが、減少の時間的平滑化は該して増加の時間的平滑化より一層効果的でかつ目立たない。第II種信号に対しては、空間において方向ベクトルが方位を変化し得る率を制限するために時間的平滑化が適用される。情報容量要件は多くの方法で低減され得る。
【００４９】
時間的平滑化を適用することによって空間特性信号はより少ないビットで符号化され得る。その理由はこれら信号の要素が符号化及び伝送される頻度が低減され得るからである。デコーダは、内挿又は他の形態の濾波を用いて省略された要素を回復し得る。さらに、差分符号化が用いられると、信号を表すのに要するビット数が低減され得る。それは、時間的平滑化が連続する値間の差分のダイアナミックレンジを制限するからであり、従って、差分コードを表すために少ないビットしか要しない。
【００５０】
概して、時間的平滑化が用いられる程度は、人の聴覚系の時間的隠蔽特性に基づく。例えば、結果的に生じるレベルが当該隠蔽閾値を超えないならば、レベルを後隠蔽閾値より下方に低減させ得る変化率は知覚的影響なしに低減され得る。ある実施形態では、変化率が毎秒約１２０乃至１４０ｄBを超えないように制限される。他の実施形態では、過渡現象とみなされる事象に対しては増加率への制限が緩和される。
【００５１】
過渡現象は、多くの方法で検出され得る。例えば、もし約１０ｍｓｅｃの短時間間隔以内で各種信号の振幅が、例えば、１０ｄBを超えるなら、過渡現象が起こったものとみなされる。このような信号には、入力信号、合成信号、１つ又はそれ以上のチャンネルサブバンド信号又は合成サブバンド信号、特に高周波サブバンドに対するサブバンド信号等がある。連続時間間隔につきスペクトル内容の各種の尺度も同様に比較され得る。例えば、高周波係数を強調する変換係数の加重和が隣接変換部ブロックにつき比較され得る。
【００５２】
ある用例では、信号がスペクトルを横切って変わるスペクトル率を制限することによって、空間特性信号の情報容量要件が低減され得る。第Ｉ種信号についでは、隣接サブバンドにおける各々の信号レベル尺度間の差を制限するためにスペクトル平滑化が適用される。この技術は、サブバンドを横切る空間特性信号を表すために差分符号化を用いる実施形態で効果的に用いられ得る。一方のサブバンドから他方に変わり得る情報量に限界点を課すことによって、差分コードを表すためにより少ないビットしか要しない点まで値間のダイナミックレンジの変化が低減され得る。多くの実施形態において変化量の限界点は、チャンネルサブバンド信号を発生させるために用いられるフィルタバンク又は変換内の隣接サブバンド間のスペクトル漏洩によって内在的に課せられる。スペクトル包絡線の符号化に適用されるスペクトル平滑化についての詳しい論議は米国特許第５，５８１，６５３から入手され得る。
【００５３】
情報要件は、ブロックスケーリング(位取り)及び変換符号化のような各種のブロック符号化計画で用いられるブロックの長さを増加させることによって同様に低減され得る。不幸にして、このようなブロック長の増加が符号化処理の時間的分解能を低減させるので、区間特性信号及び下に横たわる音界間の時間的不同も同様に増加する。ブロック内で起こる空間特性の意味のある変化を示す表示を符号化される信号内に含めることによって、この誤差の効果は低減され得る。事実上、当該表示はブロックの始め及び空間的変化の発生間における遅延量を表す。相補的復号特性は以下で論議される。
【００５４】
合成信号及び合成サブバンド信号
１つ又はそれ以上の合成信号がエンコーダ内で形成され、次いでデコーダ内で合成サブバンド信号に分割される。その代わりに、合成サブバンド信号がエンコーダ内で形成され、符号化された信号号からデコーダによって単に引き出される。図６と共に上記論議を参照のこと。本発明の実施上いずれの方法も決定的ではない。
【００５５】
合成信号及び合成サブバンド信号を形成するために、信号は色々な方法で組み合わされ得る。信号が組み合わされる一方法は、単純な和信号を形成するために各チャンネルからの対応するデジタルサンプルを加えるか若しくは、その代わりに、より複雑な和信号を形成するために各チャンネルからのサンプルの加重した表現を加えることである。他の方法は、ＲＭＳ信号を形成するために各チャンネルからの対応するサンプルの二乗和の平方根をとることである。
【００５６】
合成信号を形成するさらに他の方法は、楽器デジタルインタフェース(ＭＩＤＩ)標準に従った信号又はピッチ周期及びスペクトル包絡線又は一組のフィルタパラメータ及び広範囲のボコーダによって発生されるような、対応する励磁信号を伝える信号等のパラメトリックな信号を発生させることである。デコーダ内で適切な信号がパラメトリック信号から合成される。パラメトリック信号の発生が正にデータ圧縮の別形態なので、本発明の実施上決定的な特定の技術はない。
【００５７】
正規化
エンコーダが合成サブバンド信号を発生かつ符号化する状況においては、合成サブバンド信号及び対応する第Ｉ種空間特性信号の情報容量要件は、それぞれの空間特性信号内の最大要素により各合成サブバンド信号を正規化することによって低減され得る。
【００５８】
例えば、第Ｉ種信号が、左、右及び中央チャンネルからのサブバンドに対する特定の周波数サブバンドｉ内の信号パワーのＲＭＳ尺度を伝えると仮定する。この例では、左、右及び中央チャンネルからのサブバンド信号に対するパワーの尺度は、それぞれ、０．４、０．８及び０．１であり、３つのチャンネルからのサブバンド信号を組合わせることによって得られる合成サブバンド信号に対するパワーの尺度は、１．２である。合成サブバンド信号は当該特定の周波数サブバンド内の最大チャンネルサブバンド信号に対する尺度の合成サブバンド信号に対する以下の比Ｒによって位取りされる。、即ち、
Ｒ＝０．８／１．２＝２／３
正味の効果は、合成サブバンド信号に対する信号レベルの尺度が、本例では、右チャンネルからのサブバンド信号である最大チャンネルサブバンド信号と同一レベルに位取りされることである。位取りされた合成サブバンド信号は、所望の通り符号化され得る。特定の周波数サブバンドに対する第Ｉ種空間特性信号は、最大信号レベルに位取りされる各チャンネルサブバンド信号に対する信号レベルを表す３つのベクトルを含む。本例では、空間特性信号ベクトルＶは、それぞれ左、右及び中央チャンネルサブバンド信号に対する相対レベルを表す以下の値を有する。即ち、
Ｖ= （0.4/0.8，0.8/0.8，0.1/0.8）＝（０．５，１．０，０．１２５）
このべくとるは、所望の通り符号化され得る。一実施形態においてベクトルは、各要素が5つのレベル、即ち、０ｄＢ、-３ｄＢ、-７ｄＢ、-１０ｄＢ及び「オフ」の１つを表す形に符号化される。他の実施形態では、ベクトル要素はは異なったレベル数を表し得る。
【００５９】
利得係数の導出及び用途
図５及び６に示される実施形態に関して既に述べた通り、空間デコーダ５３０は、空間特性信号から複数のゲインファクタ(利得係数)を引き出す。それらの利得係数は、合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号内にマップする。利得係数の導出は、多くの方法で行われ得る。同方法は、用いられる空間特性信号の種類と、出力チャンネルの数及び方位とに依存する。
【００６０】
単純な例として、出力チャンネルの数及び方位が入力チャンネルの数及び方位と同一である第Ｉ種空間特性信号を用いるシステムにおいて利得係数は、空間特性信号内で伝えられる信号レベルの尺度から簡単な方法で引き出され得る。もしそれぞれの周波数帯域に対する第Ｉ種空間特性信号が、各入力信号に対するパワーの尺度を伝えるなら、各出力チャンネルに対する利得係数は第Ｉ種信号内の対応するレベルに比例するであろう。
【００６１】
しかし、もし出力及び入力チャンネルの数、方位が異なるなら、導出は一層複雑である。特定の周波数サブバンドに対する利得係数の可能な導出は、各入力チャンネルに対してベクトルを形成し、各ベクトルがそれぞれの入力チャンネルの空間的方位を表す方位を有しかつ第Ｉ種空間特性信号内に伝えられる信号レベルのそれぞれの尺度による長さを有するようにすることである。これらのベクトルの各々は、次いでそれぞれの出力チャンネルの空間的方位を表す方位を有する軸上に投影される。各出力チャンネルに対する利得係数は、対応する軸上へ投影物の合計から得られる。
【００６２】
第II種空間特性信号についても同様に利得係数が導出され得る。しかし、主要な相違は、デコーダに入力チャンネルの空間方位を知らせる必要がないことがである。
【００６３】
2種類の空間特性信号間で適応的に切替える符号化システムでは、利得係数の導出も同様に必要に応じて適応的に切替える。
【００６４】
利得係数が引出された後、それぞれの利得係数を適切な合成サブバンドに適用することによって特定の周波数サブバンドに対する1つ又はそれ以上の中間信号が発生される。実際、当該サブバンド内の合成サブバンド信号に適切なを乗じることによって、周波数サブバンド内の出力チャンネルに対する中間サブバンド信号が発生される。利得計数は次式で与えられる、即ち、IＳ_ij＝ｇ_ij・XＳ_j
ここでIＳ_ij＝周波数サブバンドｊ内のチャンネルｉに対する中間サブバンド信号
ｇ_ij＝周波数サブバンドｊ内のチャンネルｉ用に引出された利得計数
XＳ_j＝周波数サブバンドｊ内の合成サブバンド信号
それぞれの出力チャンネルに対する所与の周波数サブバンド内の出力チャンネルサブバンド信号は、当該周波数サブバンド内のすべての中間信号を加算することによって得られる。既に述べた通り、出力信号それ自体は、当該出力チャンネルに対する出力チャンネルサブバンド信号に逆又は合成フィルタを適用することによって得られる。
【００６５】
多重チャンネル再生システムでは、特定のチャンネルに対する1つ又はそれ以上の周波数サブバンド信号は抜けるか若しくはゼロになる。実際、符号化システムでは、特定の聴覚効果を示すために当該特定のチャンネル及び周波数サブバンド内では音のエネルギが不要であることが確認された。所望の知覚効果を劣化させることなくこれらの脱落(ドロップアウト)が導入される程度まで、本発明によって達成される符号化効率の利得が示される。
【００６６】
多くの場合においてこのような時間的平滑化で、回復された信号内のちゅー鳴き声、ジッパー雑音及びその他の人工物が低減され得ることが分かっている。望ましい実施形態では、人の聴覚システムの時間的隠蔽特性により利得計数値の変化が制限される。例えば、結果的に生じるレベルが後隠蔽閾値を超えないとすれば、出力チャンネルサブバンド信号のレベル低下が当該隠蔽閾値より下方に達することを許容する変化率が知覚可能な影響なしに低減され得る。ある実施形態では、変化率が毎秒約１２０ｄB乃至１４０ｄBを超えないように制限される。他の実施形態では、過渡現象とみなされる事象に関する増加率に対する限度が緩和される。過渡現象は、上記のものを含めて色々な方法で検出し得る。
【００６７】
ある実施形態では、再生される信号の品質は利得係数がスペクトルを横切って変化するスペクトル率を制限することによって改良され得る。この技術は、分析・合成フィルタバンクを用いる符号化システムに対して特に有効であり、そこでは合成フィルタバンクの隣接サブバンドにおける周波数応答特性の重複がエイリアシング人工物を相殺するために用いられる。よく知られている例としてはQMF及びTDAC変換がある。もし隣接サブバンドの信号が非常に異なった利得を受けやすいなら、このような濾波システムのエイリアシング相殺特性は劣化される。隣接サブバンドの利得が変わり得る量を制御することによって、エイリアシング相殺の悪化は制御され得る。エイリアシング相殺濾波システムを用いる望ましい実施形態では、相殺されないエイリアシング人工物が実質的に聴取不可能にされるように、所与の出力信号に対する隣接サブバンド間の利得の差が制限される。
【００６８】
既に述べた通り、ブロック符号化システムの実施形態は、ブロック内で意味のある事象が何時起こるかを示す表示をも含み得る。例えば、エンコーダは、ブロックの始めと、過渡現象又は方向の急変のような事象の発生との間の遅延表示を符号化される信号内に含み得る。このような表示に応答して、デコーダは時間領域内の1つ又はそれ以上の信号に対し変化を適用し得る。デジタルフィルタを用いる実施形態では、これらの変化は実質的に信号デフォーマットから出力信号発生まで復号処理全体を通してあらゆる信号に適用され得る。ブロック変換を用いる実施形態では、これらの変化は、サブバンド信号発生前の合成信号５１１、1つ又はそれ以上の逆フィルタバンクから得られる出力信号に適用され得る。
【図面の簡単な説明】
【図１】図１は、本発明による２つの多重チャンネルエンコーダの機能的構成図である。
【図２】図２は、本発明による２つの多重チャンネルエンコーダの機能的構成図である。
【図３】図３は、本発明による合成信号発生器の一実施形態の機能的構成図である。
【図４】図４は、本発明による多重チャンネルエンコーダの他の実施形態を示す機能的構成図である。
【図５】図５は、本発明による２つの多重チャンネルデコーダの機能的構成図である。
【図６】図６は、本発明による２つの多重チャンネルデコーダの機能的構成図である。

Claims

各々がそれぞれのオーデイオ情報チャンネルを表す複数の入力信号１，２，３を符号化することによって符号化された信号５１を発生させる方法であって、
複数の周波数サブバンド内の前記入力信号を表す複数のチャンネルサブバンド信号１１，１２，２１，２２，３１，３２を発生させ、
前記入力信号帯域幅の少なくとも一部を表す合成信号６１，１６１，７１，７２，７３を発生させ、
周波数サブバンド内のそれぞれのチャンネルサブバンド信号に応答して音界の空間特性を表す空間特性信号４１，４２を発生させ、前記空間特性信号が前記それぞれのチャンネルサブバンドの前記信号レベルを表す情報を伝えるようにし、
前記合成信号及び前記空間特性信号を前記符号化された信号にアセンブルすることから成り、
前記空間特性信号の発生により空間特性信号を変化させることができる速度が制限され、このことにより、結果的に生じるレベルがその隠蔽閾値を超えないことを条件に、人の聴覚系の後隠蔽閾値の下方にレベルを減少させる変化の速度が低減されることを特徴とする符号化信号発生方法。
複数の他チャンネルサブバンド信号に応答して他の音界の空間特性を表す第2空間特性信号を発生させ、前記第2空間特性信号が前記複数の他チャンネルサブバンド信号の信号レベル又は前記他の音界の1つ又はそれ以上の見掛けの方向を表すようにし、前記第2空間特性信号を前記符号化された信号内にアセンブルすることを含む、請求項1の方法。
前記他の音界が閾値数未満か若しくはそれと等しい数の見掛けの方向を有するなら、前記第2空間特性信号が前記1つ又はそれ以上の見掛けの方向を表す、請求項2の方法。
前記閾値数が1つであり、前記他チャンネルサブバンド信号の1つのみが意味のあるスペクトルエネルギを有するか若しくは意味のあるスペクトルエネルギを有する前記他チャンネルサブバンド信号のすべてが相関させられた振幅及び相関させられた位相を有するならば前記他の音界が1つの見掛けの方向を有するとみなされる、請求項３の方法。
前記1つ又はそれ以上の見掛けの方向を表すならば、前記第2空間特性信号も同様に見掛けの方向の回りの音界分散の尺度を表す、請求項２の方法。
前記合成信号１６１が、それぞれの周波数サブバンド内の2つ又はそれ以上のチャンネルサブバンド信号１１，１２，２１，２２，３１，３２を組合わせることによって発生される、請求項1又は2のいずれか１つの方法。
前記合成信号７１，７２，７３は、広帯域信号６１にフィルタバンク又は変換を適用することによって発生するサブバンド信号であり、前記広帯域信号が2つ又はそれ以上の前記入力信号１，２，３組合わせることによって形成される、請求項1又は2のいずれか１つの方法。
前記合成信号は、前記入力信号の2つ又はそれ以上にフィルタバンク又は変換を適用することによって得られるサブバンド信号を組み合せることによって発生する、請求項1又は2のいずれか１つの方法。
前合成信号６１，１61がパラメトリック信号である、請求項1又は2のいずれか１つの方法。
前記チャンネルサブバンド信号１１，１２，２１，２２，３１，３２が、前記入力信号１，２，３に1つ又はそれ以上の離散変換を適用することによって変換係数のブロックとして発生する、請求項1乃至８のいずれか１つの方法。
前記周波数サブバンドの帯域幅が人の聴覚システムの臨界帯域幅に相当する、請求項1乃至１０のいずれか１つの方法。
前記それぞれのチャンネルサブバンド信号１１，１２，２１，２２，３１，３２の各々が前記入力信号１，２，３の共通時間間隔に応答して発生し、前記それぞれの音界において振幅又は方向の突然変化が前記共通時間間隔内のどこで起こるかを示す遅延信号を発生させ、前記遅延信号を前記符号化された信号にアセンブルすることをさらに含む、請求項1乃至１３のいずれか１つの方法。
前記合成信号は、それぞれの周波数サブバンドに相当するサブバンド信号であり、最大尺度を有する当該それぞれの周波数サブバンド内のチャンネルサブバンドに対する信号レベルの尺度に関して、前記合成信号によって伝えられる情報を正規化することをさらに含む、請求項1乃至１３のいずれか１つの方法。
複数の隣接周波数サブバンドに相当する前記空間特性信号の差分符号化された表現を発生させることをさらに含み、前記差分符号化された表現が、隣接周波数サブバンド内の前記チャンネルサブバンド信号間のスペクトル漏洩特性により制限されるダイナミックレンジを有する１つ又はそれ以上のコードを含む、請求項1乃至１３のいずれか１つの方法。
1つ又はそれ以上の出力トランスジューサを介して表現するために1つ又はそれ以上の出力信号５６１，５７１，５８１を発生させる符号化された信号５０１を復号する方法であって、
前記符号化された信号から1つ又はそれ以上の合成信号５１１及び複数の空間信号特性信号５１５，５１６を入手し、各空間特性信号がそれぞれの合成サブバンド信号５２１，５２２と関連づけられ、前記それぞれの合成サブバンド信号に相当するそれぞれの音界の空間特性を表すようにし、
前記空間特性信号から複数の利得係数を引出し、それぞれの利得係数によりそれぞれの合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号５４１−５４３，５５１−５５３内にマップするようにし、
前記中間サブバンド信号に1つ又はそれ以上の逆フィルタバンクを適用することによって前記複数の出力信号を発生させ、
前記複数の利得係数の導出により前記利得係数値の減少が制限され、このことにより結果的に生じるレベルが隠蔽閾値を超えないことを条件に、人の聴覚系の後隠蔽閾値より下方にサブバンド信号のレベルを減少させる変化の速度が低減されることを特徴とする符号化信号復号方法。
1つ又はそれ以上の出力トランスジューサを介して表現するために1つ又はそれ以上の出力信号５６１，５７１，５８１を発生させる符号化された信号５０１を復号する方法であって、
前記符号化された信号から複数の合成信号５１２，５１３及び複数の空間特性信号５１５，５１６を入手し、各空間特性信号がそれぞれの合成サブバンド信号と関連づけられかつ前記それぞれの合成サブバンド信号に相当するそれぞれの音界の空間特性を表すようにし、
前記空間特性信号から複数の利得係数を引出し、それぞれの利得係数によりそれぞれの合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号内にマップし、
前記空間特性信号から複数の利得係数を引出し、それぞれの利得係数によりそれぞれの合成サブバンド信号を１つ又はそれ以上の中間サブバンド信号５４１−５４３，５５１−５５３内へマップし、
前記中間サブバンド信号に1つ又はそれ以上の逆フィルタバンクを適用することによって前記複数の出力信号を発生させ
前記複数の利得係数の導出により前記利得係数値の減少が制限され、このことにより結果的に生じるレベルが隠蔽閾値を超えないことを条件に、人の聴覚系の後隠蔽閾値より下方にサブバンド信号のレベルを減少させる変化の速度が低減されることを特徴とする符号化信号復号方法。
前記空間特性信号５１５，５１６が、複数の信号レベルを表す第１形態、１つ又はそれ以上の方向を表す第２形態のいずれであるかの表示を前記符号化された信号から入手し、それに応答して前記複数の利得係数の導出を適応させることを特徴とする、請求項１５又は１６のいずれか１つの方法。
前記合成サブバンド信号５２１，５２２が、前記1つ又はそれ以上の合成信号５１１にフィルタバンク又は変換を適用することによって引出される、請求項1５の方法。
前記合成信号５１１がパラメトリック信号であり、前記引出す段階がそれに応答してスペクトル又は時間的信号を発生させることを含む、請求項1５乃至１７のいずれか１つの方法。
前記符号化された信号５０１から遅延信号を入手し、前記遅延信号に応答して前記1つ又はそれ以上の中間サブバンド信号５４１−５４３，５５１−５５３内へのマッピングを遅延させることをさらに含む、請求項1５乃至１８のいずれか１つの方法。
前記中間サブバンド信号５４１−５４３，５５１−５５３が、人の聴覚系の臨界帯域幅に比例する帯域幅を有する、請求項1５乃至２０のいずれか１つの方法。
前記出力信号５６１，５７１，５８１は、エイリアシング相殺特性を有する逆フィルタバンクを適用するか若しくはエイリアシング相殺特性を有する逆変換を適用することによって発生され、不完全なエイリアシング相殺から結果的に生じるノイズが聴取不可能にされるように、前記マッピングが隣接周波数サブバンド内の中間サブバンド信号５４１−５４３，５５１−５５３レベル間の差を制限する，請求項1５乃至２１のいずれか１つの方法。
各々がそれぞれのオーデイオ情報チャンネルを表す複数の入力信号１，２，３を符号化することによって符号化された信号５１を発生させるエンコーダであって、
複数の周波数サブバンド内の前記入力信号を表す複数のチャンネルサブバンド信号１１，１２，２１，２２，３１，３２を発生させる手段と、
前記入力信号帯域幅の少なくとも一部を表す合成信号６１，１６１，７１，７２，７３を発生させる手段と、
周波数サブバンド内のそれぞれのチャンネルサブバンド信号に応答して音界の空間特性を表す空間特性信号４１，４２を発生させる手段であって、前記空間特性信号が前記それぞれのチャンネルサブバンドの前記信号レベルを表す情報を伝えるようにする空間特性信号発生手段と、
前記合成信号及び前記空間特性信号を前記符号化された信号にアセンブルする手段とから成り、
前記空間特性信号の発生により空間特性信号を変化させることができる速度が制限され、このことにより、結果的に生じるレベルがその隠蔽閾値を超えないことを条件に、人の聴覚系の後隠蔽閾値の下方にレベルを減少させる変化の速度が低減されることを特徴とする符号化信号発生方法。
複数の他チャンネルサブバンド信号に応答して他の音界の空間特性を表す第2空間特性信号を発生させる手段を含み、前記第2空間特性信号が前記複数の他チャンネルサブバンド信号の信号レベル又は前記他の音界の1つ又はそれ以上の見掛けの方向を表し、前記第2空間特性信号を前記符号化された信号内にアセンブルする、請求項２３のエンコーダ。
前記他の音界が閾値数より少ないか又はそれと等しい数の見掛けの方向を有するとみなされるなら、前記第2空間特性信号が前記1つ又はそれ以上の見掛けの方向を有する、請求項２４のエンコーダ。
前記閾値数が1つであり、前記他チャンネルサブバンド信号の1つのみが意味のあるスペクトルエネルギを有するか若しくは意味のあるスペクトルエネルギを有する前記他チャンネルサブバンド信号のすべてが相関させられた振幅及び相関させられた位相を有するならば前記他の音界が1つの見掛けの方向を有するとみなされる、請求項２５のエンコーダ。
前記1つ又はそれ以上の見掛けの方向を表すならば、前記第2空間特性信号も同様に見掛けの方向の回りの音界分散の尺度を表す、請求項２４のエンコーダ。
前記合成信号１６１を発生させるためにそれぞれの周波数サブバンド内の2つ又はそれ以上のチャンネルサブバンド信号１１，１２，２１，２２，３１，３２を組み合せる手段をさらに含む、請求項２３又は2４のいずれか1つのエンコーダ。
2つ又はそれ以上の前記入力信号１，２，３を組合わせることによって前記合成信を発生させる手段７０と、広帯域信号６１にフィルタバンク又は変換を適用することに前記合成信号７１，７２，７３を発生させる手段とをさらに含む、請求項２３又は2４のいずれか１つのエンコーダ。
2つ又はそれ以上の前記入力信号にフィルタバンク又は変換を適用する手段と、前記フィルタバンク又は前記変換を適用することによって得られるサブバンド信号を組合わせることによって前記合成信号を発生させる手段とをさらに含む、請求項２３又は2４のいずれか１つのエンコーダ。
前記合成信号６１，１６１がパラメトリック信号である、請求項２３又は2４のいずれか１つのエンコーダ。
前記チャンネルサブバンド信号１１，１２，２１，２２，３１，３２を変換係数のブロックとして発生させるために前記入力信号に1つ又はそれ以上の離散変換を適用する手段１０，２０，３０をさらに含む、請求項２３乃至３０のいずれか１つのエンコーダ。
前記周波数サブバンドの帯域幅が人の聴覚系の臨界帯域幅に相当する、請求項２３乃至３２のいずれか１つのエンコーダ。
前記それぞれのチャンネルサブバンド信号１１，１２，２１，２２，３１，３２の各々が前記入力信号１，２，３の共通時間間隔に応答して発生され、前記それぞれの音界において振幅又は方向の突然変化が前記共通時間間隔内のどこで起こるかを示す遅延信号を発生させる手段と、前記遅延信号を前記符号化された信号内にアセンブルする手段とをさらに含む、請求項２３乃至３３のいずれか１つのエンコーダ。
前記合成信号７１，７２，７３は、それぞれの周波数サブバンドに相当するサブバンド信号であり、最大尺度を有する当該それぞれの周波数サブバンド内のチャンネルサブバンドに対する信号レベルの尺度に関して、前記合成信号によって伝えられる情報を正規化する手段をさらに含む、請求項２３乃至３４のいずれか１つのエンコーダ。
複数の隣接周波数サブバンドに相当する前記空間特性信号の差分符号化された表現を発生させる手段をさらに含み、前記差分符号化された表現が、隣接周波数サブバンド内の前記チャンネルサブバンド信号間のスペクトル漏洩特性により制限されるダイナミックレンジを有する１つ又はそれ以上のコードを含む、請求項２３乃至３５のいずれか１つのエンコーダ。
1つ又はそれ以上の出力トランスジューサを介して表現するために1つ又はそれ以上の出力信号５６１，５７１，５８１を発生させる符号化された信号５０１を復号するデコーダであって、
前記符号化された信号から1つ又はそれ以上の合成信号５１１及び複数の空間特性信号５１５，５１６を入手し、前記1つ又はそれ以上の合成信号から複数の合成サブバンド信号５２１，５２２を引出す手段５１０であって、各空間特性信号がそれぞれの合成サブバンド信号と関連づけられ、前記それぞれの合成サブバンド信号に相当するそれぞれの音界の空間特性を表すようにする合成サブバンド信号手段と、
前記空間特性信号から複数の利得係数を引出す手段５４０，５５０であって、それぞれの利得係数によりそれぞれの合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号５４１−５４３，５５１−５５３内にマップするようにする利得係数手段と、
前記中間サブバンド信号に1つ又はそれ以上の逆フィルタバンクを適用することによって前記複数の出力信号を発生させる手段５６０，５７０，５８０とから成り、
前記複数の利得係数の導出により前記利得係数値の減少が制限され、このことにより結果的に生じるレベルが隠蔽閾値を超えないことを条件に、人の聴覚系の後隠蔽閾値より下方にサブバンド信号のレベルを減少させる変化の速度が低減されることを特徴とする符号化信号復号方法。
1つ又はそれ以上の出力トランスジューサを介して表現するために1つ又はそれ以上の出力信号５６１，５７１，５８１を発生させる符号化された信号５０１を復号するデコーダであって、
前記符号化された信号から1つ又はそれ以上の合成サブバンド信号５１２，５１３及び複数の空間特性信号５１５，５１６を入手する手段５１０であって、各空間特性信号がそれぞれの合成サブバンド信号と関連づけられ、前記それぞれの合成サブバンド信号に相当するそれぞれの音界の空間特性を表すようにする手段と、
前記空間特性信号から複数の利得係数を引出し、それぞれの利得係数によりそれぞれの合成サブバンド信号を1つ又はそれ以上の中間サブバンド信号５４１−５４３，５５１−５５３内にマップする手段５４０，５５０と、
前記中間サブバンド信号に1つ又はそれ以上の逆フィルタバンクを適用することによって前記複数の出力信号を発生させる手段５６０，５７０，５８０とからなり、
前記複数の利得係数の導出により前記利得係数値の減少が制限され、このことにより結果的に生じるレベルが隠蔽閾値を超えないことを条件に、人の聴覚系の後隠蔽閾値より下方にサブバンド信号のレベルを減少させる変化の速度が低減されることを特徴とする符号化信号復号方法。
前記空間特性信号５１５，５１６が、複数の信号レベルを表す第１形態、１つ又はそれ以上の方向を表す第２形態のいずれであるかの表示前記符号化された信号５０１から入手し、それに応答して前記複数の利得係数の導出を適応させる手段を含むことを特徴とする、請求項３７又は３８のいずれか１つのデコーダ。
前記合成サブバンド信号５２１，５２２を引出すために1つ又はそれ以上の合成信号５１１にフィルタバンク又は変換を適用する手段５２０をさらに含む、請求項３７のデコーダ。
前記合成信号５１１がパラメトリック信号であり、前記引出し手段５４０，５５０がそれに応答してスペクトル又は一時的信号をも発生させる、請求項３７乃至３９のいずれか1つのデコーダ。
前記符号化された信号５０１から遅延信号を入手し、前記遅延信号に応答して前記1つ又はそれ以上のサブバンド信号５４１−５４３，５５１−５５３内へのマッピングを遅延させる手段をさらに含む、請求項３９又は４０のいずれか1つのデコーダ。
前記中間サブバンド信号５４１−５４３，５５１−５５３内が、人の聴覚系の臨界帯域帯域幅と比例する帯域幅を有する、請求項３７乃至４２のいずれか1つのデコーダ。
前記出力信号を発生させるために、エイリアシング特性を有する逆フィルタバンク又はエイリアシング相殺特性を有する逆変換を適用させる手段５６０，５７０，５８０をさらに含み、前記マッピング手段が連接周波数サブバンド内の前記中間サブバンド信号５４１−５４３，５５１−５５３レベル間の差を限定し、不完全なエイリアシング相殺から結果的に生じるノイズを聴取不能にさせるようにする、請求項３７乃至４３のいずれか1つのデコーダ。