JP2020525835A

JP2020525835A - 時間領域チャンネル間予測

Info

Publication number: JP2020525835A
Application number: JP2019571621A
Authority: JP
Inventors: アッティ、ベンカトラマン; チェビーヤム、ベンカタ・スブラマニヤム・チャンドラ・セカー; シンダー、ダニエル・ジャレド
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2017-07-03
Filing date: 2018-06-11
Publication date: 2020-08-27
Anticipated expiration: 2038-06-11
Also published as: US10885922B2; WO2019009983A1; BR112019027202A2; US20190005970A1; KR20200004436A; CN110770825A; ES2882904T3; TWI713853B; AU2018297938B2; EP3649639A1; EP3649639B1; US20200013416A1; KR102154461B1; CN110770825B; TW201907730A; AU2018297938A1; JP6798048B2; US10475457B2

Abstract

方法が、復号された低帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの低帯域部分を復号することを含む。方法はまた、低帯域フィルタリングされたミッドチャンネルを生成するために、１つまたは複数のフィルタ係数に従って、復号された低帯域ミッドチャンネルをフィルタリングすることを含む。方法はまた、低帯域フィルタリングされたミッドチャンネルと、チャンネル間予測利得とに基づいて、チャンネル間予測された信号を生成することを含む。方法は、アップミックス係数と、復号された低帯域ミッドチャンネルと、チャンネル間予測された信号とに基づいて、低帯域左チャンネルおよび低帯域右チャンネルを生成することをさらに含む。【選択図】図１

Description

優先権の主張

[0001]本願は、共同所有される２０１７年７月３日に出願された米国仮特許出願第６２／５２８，３７８号、および２０１８年６月８日に出願された米国非仮特許出願第１６／００３，７０４号からの優先権の利益を主張し、これらの各々の内容は、その全体が参照により本明細書に明確に組み込まれている。

[0002]本開示は、一般に複数のオーディオ信号の符号化に関する。

[0003]技術の進歩は、より小型で、より強力なコンピューティングデバイスをもたらした。例えば、モバイルフォンおよびスマートフォンなどのワイヤレス電話、タブレットおよびラップトップコンピュータを含む、様々な携帯用パーソナルコンピューティングデバイスは、小型で軽量であり、ユーザによって容易に持ち運ばれる。これらのデバイスは、ワイヤレスネットワーク上で音声およびデータパケットを通信し得る。さらに、このようなデバイスの多くが、デジタルスチルカメラ、デジタルビデオカメラ、デジタルレコーダ、およびオーディオファイルプレーヤなどの、追加の機能を組み込んでいる。また、このようなデバイスは、インターネットにアクセスするために使用され得る、ウェブブラウザアプリケーションなどのソフトウェアアプリケーションを含む、実行可能命令を処理し得る。したがって、これらのデバイスは、著しいコンピューティング能力を含み得る。

[0004]コンピューティングデバイスは、オーディオ信号を受信するために複数のマイクロフォンを含み得るか、またはそれらに結合され得る。一般に、音源は、複数のマイクロフォンのうちの第２のマイクロフォンよりも第１のマイクロフォンにより近い。したがって、第２のマイクロフォンから受信される第２のオーディオ信号は、音源からのマイクロフォンのそれぞれの距離により、第１のマイクロフォンから受信される第１のオーディオ信号に対して（relative to）遅延し得る。他のインプリメンテーションでは、第１のオーディオ信号は、第２のオーディオ信号に対して（with respect to)遅延し得る。ステレオ符号化では、マイクロフォンからのオーディオ信号は、１つのミッドチャンネル信号および１つまたは複数のサイドチャンネル信号を生成するために符号化され得る。ミッドチャンネル信号は、第１のオーディオ信号と第２のオーディオ信号との和に対応する。サイドチャンネル信号は、第１のオーディオ信号と第２のオーディオ信号との差に対応する。

[0005]特定のインプリメンテーションでは、デバイスが、符号化されたミッドチャンネルと、チャンネル間予測利得（inter-channel prediction gain）とを含むビットストリームを受信するように構成された受信機を含む。デバイスはまた、復号された低帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの低帯域部分を復号するように構成された低帯域ミッドチャンネルデコーダを含む。デバイスはまた、低帯域フィルタリングされたミッドチャンネルを生成するために、１つまたは複数のフィルタ係数（filter coefficient）に従って、復号された低帯域ミッドチャンネルをフィルタリングするように構成された低帯域ミッドチャンネルフィルタを含む。デバイスはまた、低帯域フィルタリングされたミッドチャンネルと、チャンネル間予測利得とに基づいて、チャンネル間予測された信号を生成するように構成されたチャンネル間予測器（inter-channel predictor）を含む。デバイスはまた、アップミックス係数（up-mix factor）と、復号された低帯域ミッドチャンネルと、チャンネル間予測された信号とに基づいて、低帯域左チャンネルおよび低帯域右チャンネルを生成するように構成されたアップミックスプロセッサを含む。デバイスは、復号された高帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの高帯域部分を復号するように構成された高帯域ミッドチャンネルデコーダをさらに含む。デバイスはまた、チャンネル間予測利得と、復号された高帯域ミッドチャンネルのフィルタリングされたバージョンとに基づいて、予測された高帯域サイドチャンネルを生成するように構成されたチャンネル間予測マッパーを含む。デバイスは、復号された高帯域ミッドチャンネルと、予測された高帯域サイドチャンネルとに基づいて、高帯域左チャンネルおよび高帯域右チャンネルを生成するように構成されたチャンネル間帯域幅拡張デコーダをさらに含む。

[0006]別の特定のインプリメンテーションでは、方法が、符号化されたミッドチャンネルと、チャンネル間予測利得とを含むビットストリームを受信することを含む。方法はまた、復号された低帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの低帯域部分を復号することを含む。方法はまた、低帯域フィルタリングされたミッドチャンネルを生成するために、１つまたは複数のフィルタ係数に従って、復号された低帯域ミッドチャンネルをフィルタリングすることを含む。方法はまた、低帯域フィルタリングされたミッドチャンネルと、チャンネル間予測利得とに基づいて、チャンネル間予測された信号を生成することを含む。方法は、アップミックス係数と、復号された低帯域ミッドチャンネルと、チャンネル間予測された信号とに基づいて、低帯域左チャンネルおよび低帯域右チャンネルを生成することをさらに含む。方法はまた、復号された高帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの高帯域部分を復号することを含む。方法は、チャンネル間予測利得と、復号された高帯域ミッドチャンネルのフィルタリングされたバージョンとに基づいて、予測された高帯域サイドチャンネルを生成することをさらに含む。方法はまた、復号された高帯域ミッドチャンネルと、予測された高帯域サイドチャンネルとに基づいて、高帯域左チャンネルおよび高帯域右チャンネルを生成することを含む。

[0007]別の特定のインプリメンテーションでは、非一時的なコンピュータ可読媒体が、プロセッサ内のプロセッサによって実行されると、プロセッサに、符号化されたミッドチャンネルと、チャンネル間予測利得とを含むビットストリームを受信することを含む動作を実行させる命令を含む。動作はまた、復号された低帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの低帯域部分を復号することを含む。動作はまた、低帯域フィルタリングされたミッドチャンネルを生成するために、１つまたは複数のフィルタ係数に従って、復号された低帯域ミッドチャンネルをフィルタリングすることを含む。動作はまた、低帯域フィルタリングされたミッドチャンネルと、チャンネル間予測利得とに基づいて、チャンネル間予測された信号を生成することを含む。動作はまた、アップミックス係数と、復号された低帯域ミッドチャンネルと、チャンネル間予測された信号とに基づいて、低帯域左チャンネルおよび低帯域右チャンネルを生成することを含む。動作はまた、復号された高帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの高帯域部分を復号することを含む。動作はまた、チャンネル間予測利得と、復号された高帯域ミッドチャンネルのフィルタリングされたバージョンとに基づいて、予測された高帯域サイドチャンネルを生成することを含む。動作はまた、復号された高帯域ミッドチャンネルと、予測された高帯域サイドチャンネルとに基づいて、高帯域左チャンネルおよび高帯域右チャンネルを生成することを含む。

[0008]別の特定のインプリメンテーションでは、装置が、符号化されたミッドチャンネルと、チャンネル間予測利得とを含むビットストリームを受信するための手段を含む。装置はまた、復号された低帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの低帯域部分を復号するための手段を含む。装置はまた、低帯域フィルタリングされたミッドチャンネルを生成するために、１つまたは複数のフィルタ係数に従って、復号された低帯域ミッドチャンネルをフィルタリングするための手段を含む。装置はまた、低帯域フィルタリングされたミッドチャンネルと、チャンネル間予測利得とに基づいて、チャンネル間予測された信号を生成するための手段を含む。装置はまた、アップミックス係数と、復号された低帯域ミッドチャンネルと、チャンネル間予測された信号とに基づいて、低帯域左チャンネルおよび低帯域右チャンネルを生成するための手段を含む。装置はまた、復号された高帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの高帯域部分を復号するための手段を含む。装置はまた、チャンネル間予測利得と、復号された高帯域ミッドチャンネルのフィルタリングされたバージョンとに基づいて、予測された高帯域サイドチャンネルを生成するための手段を含む。装置はまた、復号された高帯域ミッドチャンネルと、予測された高帯域サイドチャンネルとに基づいて、高帯域左チャンネルおよび高帯域右チャンネルを生成するための手段を含む。

[0009]本開示の他のインプリメンテーション、利点、および特徴が、以下のセクション、すなわち、図面の簡単な説明、詳細な説明、および特許請求の範囲、を含む本願全体のレビュー後に明らかになるであろう。

[0010]図１は、時間領域チャンネル間予測を実行するように動作可能なデコーダを含むシステムの特定の例示的な例のブロック図である。 [0011]図２は、図１のデコーダを例示する図である。 [0012]図３は、ＩＣＢＷＥデコーダを例示する図である。 [0013]図４は、時間領域チャンネル間予測を実行する方法の特定の例である。 [0014]図５は、時間領域チャンネル間予測を実行するように動作可能であるモバイルデバイスの特定の例示的な例のブロック図である。 [0015]図６は、時間領域チャンネル間予測を実行するように動作可能である基地局のブロック図である。

詳細な説明

[0016]本開示の特定の態様が、図面を参照して以下で説明される。説明において、共通の特徴は、共通の参照番号によって示される。本明細書で使用される場合、様々な用語は、特定のインプリメンテーションを説明することのみを目的として使用され、インプリメンテーションを限定するように意図されるものではない。例えば、単数形「ａ」、「ａｎ」、および「ｔｈｅ」は、文脈がそうでないことを明確に示していない限り、複数形も含むように意図される。「備える（comprises）」および「備える（comprising）」という用語は、「含む（includes）」または「含む（including）」と交換可能に使用され得ることがさらに理解され得る。加えて、「ここにおいて（wherein）」という用語は、「ここで（where）」と交換可能に使用され得ることが理解されるであろう。本明細書で使用される場合、構造、構成要素、動作などといった要素を修飾するために使用される順序を示す用語（例えば、「第１の」、「第２の」、「第３の」など）は、それ自体では別の要素に対するこの要素のいかなる優先度または順序も示すものではなく、むしろこの要素を、（順序を示す用語の使用以外では）同じ名称を有する別の要素から単に区別する。本明細書で使用される場合、「セット（set）」という用語は、１つまたは複数の特定の要素を指し、「複数の（plurality）」という用語は、複数の（multiple）（例えば、２つ以上の）特定の要素を指す。

[0017]本開示では、「決定すること」、「計算すること」、「シフトすること」、「調整すること」などといった用語は、どのように１つまたは複数の動作が実行されるかを説明するために使用され得る。このような用語は限定的であると解釈されるべきではなく、他の技法が同様の動作を実行するために利用され得ることに留意されたい。加えて、本明細書で言及される場合、「生成すること」、「計算すること」、「使用すること」、「選択すること」、「アクセスすること」、および「決定すること」は、交換可能に使用され得る。例えば、パラメータ（または信号）を「生成すること」、「計算すること」、または「決定すること」は、パラメータ（または信号）を能動的に生成すること、計算すること、または決定することを指し得るか、あるいは、別のコンポーネントまたはデバイスなどによって既に生成されているパラメータ（または信号）を使用すること、選択すること、またはそれにアクセスすることを指し得る。

[0018]複数のオーディオ信号を符号化および復号するように動作可能なシステムおよびデバイスが開示される。デバイスは、複数のオーディオ信号を符号化するように構成されたエンコーダを含み得る。複数のオーディオ信号は、例えば、複数のマイクロフォンなどの、複数の記録デバイスを使用して、時間的に同時並行に（concurrently in time）キャプチャされ得る。いくつかの例では、複数のオーディオ信号（または、マルチチャンネルオーディオ）は、同時にまたは異なる時間に記録されたいくつかのオーディオチャンネルを多重化することによって、合成的に（例えば、人工的に）生成され得る。例示的な例として、オーディオチャンネルを同時並行に記録することまたは多重化することは、２チャンネル構成（すなわち、ステレオ：左および右）、５．１チャンネル構成（左、右、中央、左サラウンド、右サラウンド、および低周波数強調（ＬＦＥ：low frequency emphasis）チャンネル）、７．１チャンネル構成、７．１＋４チャンネル構成、２２．２チャンネル構成、またはＮチャンネル構成をもたらし得る。

[0019]テレビ会議室（またはテレプレゼンス室）におけるオーディオキャプチャデバイスは、空間オーディオを捕らえる複数のマイクロフォンを含み得る。空間オーディオは、符号化および送信されるスピーチならびに背景オーディオを含み得る。所与の音源（例えば、話者）からのスピーチ／オーディオは、マイクロフォンがどのように配置されているか、ならびに音源（例えば、話者）がマイクロフォンおよび部屋の寸法に対してどこに位置するかに依存して、異なる時間において（at different times）複数のマイクロフォンに到達し得る。例えば、音源（例えば、話者）は、デバイスに関連付けられた第２のマイクロフォンよりも、デバイスに関連付けられた第１のマイクロフォンにより近くあり得る。したがって、音源から発せられた音は、第２のマイクロフォンよりも時間的に早く第１のマイクロフォンに達し得る。デバイスは、第１のマイクロフォンを介して第１のオーディオ信号を受信し得、第２のマイクロフォンを介して第２のオーディオ信号を受信し得る。

[0020]ミッド−サイド（ＭＳ：mid-side）コーディングおよびパラメトリックステレオ（ＰＳ：parametric stereo）コーディングは、デュアル−モノコーディング技法と比べて改善された効率を提供し得るステレオコーディング技法である。デュアル−モノコーディングでは、左（Ｌ）チャンネル（または信号）および右（Ｒ）チャンネル（または信号）は、チャンネル間相関を利用することなく独立にコーディングされる。ＭＳコーディングは、コーディングより前に、左チャンネルおよび右チャンネルを、和チャンネルおよび差チャンネル（例えば、サイドチャンネル）に変換することによって、相関のあるＬ／Ｒチャンネルペア間の冗長性を低減させる。和信号（ミッドチャンネルとも呼ばれる）および差信号（サイドチャンネルとも呼ばれる）は、ＭＳコーディングにおいて、あるモデルに基づいてコーディングされるか、または波形コーディングされる。相対的により多くのビットが、サイドチャンネルよりも、ミッドチャンネルに使われる。ＰＳコーディングは、Ｌ／Ｒ信号を、和信号（またはミッドチャンネル）と、サイドパラメータのセットとに変換することによって、各サブバンドにおける冗長性を低減させる。サイドパラメータは、チャンネル間強度差（ＩＩＤ：inter-channel intensity difference）、チャンネル間位相差（ＩＰＤ：inter-channel phase difference）、チャンネル間時間差（ＩＴＤ：inter-channel time difference）、サイドまたは残差予測利得などを示し得る。和信号は、波形コーディングされ、サイドパラメータとともに送信される。ハイブリッドシステムでは、サイドチャンネルは、下位帯域（例えば、２キロヘルツ（ｋＨｚ）未満）において波形コーディングされ、チャンネル間位相保持（inter-channel phase preservation）が知覚的にさほど重要でない上位帯域（例えば、２ｋＨｚ以上）においてＰＳコーディングされ得る。いくつかのインプリメンテーションでは、ＰＳコーディングはまた、波形コーディングの前にチャンネル間冗長性を低減させるために、下位帯域において使用され得る。

[0021]ＭＳコーディングおよびＰＳコーディングは、周波数領域またはサブバンド領域のいずれかで行われ得る。いくつかの例では、左チャンネルと右チャンネルは、無相関であり得る。例えば、左チャンネルおよび右チャンネルは、無相関合成信号を含み得る。左チャンネルと右チャンネルが無相関であるとき、ＭＳコーディング、ＰＳコーディング、または両方のコーディング効率は、デュアル−モノコーディングのコーディング効率に近づき得る。

[0022]記録構成に依存して、左チャンネルと右チャンネルとの間の時間的なシフト、ならびに、エコーおよび室内反響などの他の空間エフェクトが存在し得る。チャンネル間の時間的なシフトおよび位相不整合が補償されない場合、和チャンネルおよび差チャンネルは、ＭＳまたはＰＳ技法に関連付けられたコーディング利得を低減させる同等のエネルギー（comparable energies）を含み得る。コーディング利得の低減は、時間的な（または位相）シフトの量に基づき得る。和信号および差信号の同等のエネルギーは、チャンネルが時間的にシフトされているが高度に相関されたある特定のフレームにおいて、ＭＳコーディングの使用を制限し得る。ステレオコーディングでは、ミッドチャンネル（例えば、和チャンネル）およびサイドチャンネル（例えば、差チャンネル）は、下記の式に基づいて生成され得る：

Ｍ＝（Ｌ＋Ｒ）／２、Ｓ＝（Ｌ−Ｒ）／２、式１

[0023]ここで、Ｍはミッドチャンネルに対応し、Ｓはサイドチャンネルに対応し、Ｌは左チャンネルに対応し、Ｒは右チャンネルに対応する。

[0024]いくつかのケースでは、ミッドチャンネルおよびサイドチャンネルは、下記の式に基づいて生成され得る：

Ｍ＝ｃ（Ｌ＋Ｒ）、Ｓ＝ｃ（Ｌ−Ｒ）、式２

[0025]ここで、ｃは、周波数依存である複素数値に対応する。式１または式２に基づいて、ミッドチャンネルおよびサイドチャンネルを生成することは、「ダウンミキシング（downmixing）」と呼ばれ得る。式１または式２に基づいて、ミッドチャンネルおよびサイドチャンネルから、左チャンネルおよび右チャンネルを生成する逆のプロセスは、「アップミキシング（upmixing）」と呼ばれ得る。

[0026]いくつかのケースでは、ミッドチャンネルは、次のような他の式に基づき得る：

Ｍ＝（Ｌ＋ｇ_ＤＲ）／２、または式３

Ｍ＝ｇ_１Ｌ＋ｇ_２Ｒ式４

[0027]ここで、ｇ_１＋ｇ_２＝１．０であり、ここで、ｇ_Ｄは利得パラメータである。他の例では、ダウンミックスは、帯域において実行され得、ここで、ｍｉｄ（ｂ）＝ｃ_１Ｌ（ｂ）＋ｃ_２Ｒ（ｂ）であり、ここで、ｃ_１およびｃ_２は複素数であり、ここで、ｓｉｄｅ（ｂ）＝ｃ_３Ｌ（ｂ）−ｃ_４Ｒ（ｂ）であり、ここで、ｃ_３およびｃ_４は複素数である。

[0028]特定のフレームについてＭＳコーディングまたはデュアル−モノコーディングの間で選択するために使用されるアドホックアプローチが、ミッド信号およびサイド信号を生成することと、ミッド信号およびサイド信号のエネルギーを計算することと、これらエネルギーに基づいて、ＭＳコーディングを実行するかどうかを決定することとを含み得る。例えば、ＭＳコーディングは、サイド信号とミッド信号のエネルギーの比がしきい値未満であると決定することに応答して実行され得る。例示すると、右チャンネルが少なくとも第１の時間（例えば、約０．００１秒または４８ｋＨｚで４８サンプル）だけシフトされている場合、（左信号と右信号の和に対応する）ミッド信号の第１のエネルギーは、ある特定のスピーチフレームについて、（左信号と右信号との間の差に対応する）サイド信号の第２のエネルギーと同等であり得る。第１のエネルギーが第２のエネルギーと同等であるとき、より多くの数のビットがサイドチャンネルを符号化するために使用され得、それによって、ＭＳコーディングのコーディング効率を、デュアル−モノコーディングに比べて（relative to）低減させる。したがって、デュアル−モノコーディングが、第１のエネルギーが第２のエネルギーと同等であるときに（例えば、第１のエネルギーと第２のエネルギーの比がしきい値以上であるときに）使用され得る。代替のアプローチでは、特定のフレームについてのＭＳコーディングとデュアル−モノコーディングとの間の決定は、しきい値と、左チャンネルおよび右チャンネルの正規化された相互相関値との比較に基づいて行われ得る。

[0029]いくつかの例では、エンコーダは、第１のオーディオ信号との第２のオーディオ信号との間の時間的なずれの量（amount of temporal misalignment）を示す不整合値（mismatch value）を決定し得る。本明細書で使用される場合、「時間的なシフト値」、「シフト値」、および「不整合値」は、交換可能に使用され得る。例えば、エンコーダは、第２のオーディオ信号に対する第１のオーディオ信号のシフト（例えば、時間的な不整合）を示す時間的なシフト値を決定し得る。時間的な不整合値は、第１のマイクロフォンにおける第１のオーディオ信号の受信と、第２のマイクロフォンにおける第２のオーディオ信号の受信との間の時間的な遅延の量に対応し得る。さらに、エンコーダは、フレーム単位で、例えば、各２０ミリ秒（ｍｓ）のスピーチ／オーディオフレームに基づいて、時間的な不整合値を決定し得る。例えば、時間的な不整合値は、第２のオーディオ信号の第２のフレームが、第１のオーディオ信号の第１のフレームに対して遅延する時間の量に対応し得る。代替として、時間的な不整合値は、第１のオーディオ信号の第１のフレームが、第２のオーディオ信号の第２のフレームに対して遅延する時間の量に対応し得る。

[0030]音源が第２のマイクロフォンよりも第１のマイクロフォンにより近いとき、第２のオーディオ信号のフレームは、第１のオーディオ信号のフレームに対して遅延し得る。このケースでは、第１のオーディオ信号が、「基準オーディオ信号」または「基準チャンネル」と呼ばれ得、遅延した第２のオーディオ信号は、「ターゲットオーディオ信号」または「ターゲットチャンネル」と呼ばれ得る。代替として、音源が第１のマイクロフォンよりも第２のマイクロフォンにより近いとき、第１のオーディオ信号のフレームは、第２のオーディオ信号のフレームに対して遅延し得る。このケースでは、第２のオーディオ信号が、基準オーディオ信号または基準チャンネルと呼ばれ得、遅延した第１のオーディオ信号は、ターゲットオーディオ信号またはターゲットチャンネルと呼ばれ得る。

[0031]音源（例えば、話者）が会議室またはテレプレゼンス室のどこに位置するか、あるいは音源（例えば、話者）のポジションがマイクロフォンに対してどのように変化するかに依存して、基準チャンネルおよびターゲットチャンネルは、フレームごとに変化し得、同様に、時間的な遅延値も、フレームごとに変化し得る。しかしながら、いくつかのインプリメンテーションでは、時間的な不整合値は、「基準」チャンネルに対する「ターゲット」チャンネルの遅延の量を示すために、常に正であり得る。さらに、時間的な不整合値は、遅延したターゲットチャンネルが「基準」チャンネルと整合される（aligned）（例えば、最大限に整合される）ように、このターゲットチャンネルが時間的に「引き戻される（pulled back）」「非因果的シフト(non-causal shift)」値に対応し得る。ミッドチャンネルおよびサイドチャンネルを決定するためのダウンミックスアルゴリズムは、基準チャンネルおよび非因果的シフトされたターゲットチャンネルに対して実行され得る。

[0032]エンコーダは、基準オーディオチャンネルと、ターゲットオーディオチャンネルに適用される複数の時間的な不整合値とに基づいて、時間的な不整合値を決定し得る。例えば、基準オーディオチャンネルの第１のフレームＸが、第１の時間（ｍ_１）において受信され得る。ターゲットオーディオチャンネルの第１の特定のフレームＹが、第１の時間的な不整合値、例えば、ｓｈｉｆｔ１＝ｎ_１−ｍ_１、に対応する第２の時間（ｎ_１）において受信され得る。さらに、基準オーディオチャンネルの第２のフレームが、第３の時間（ｍ_２）において受信され得る。ターゲットオーディオチャンネルの第２の特定のフレームが、第２の時間的な不整合値、例えば、ｓｈｉｆｔ２＝ｎ_２−ｍ_２、に対応する第４の時間（ｎ_２）において受信され得る。

[0033]デバイスは、第１のサンプリングレート（例えば、３２ｋＨｚサンプリングレート（すなわち、１フレーム当たり６４０個のサンプル））でフレーム（例えば、２０ｍｓのサンプル）を生成するために、フレーミングまたはバッファリングアルゴリズムを実行し得る。エンコーダは、第１のオーディオ信号の第１のフレームと第２のオーディオ信号の第２のフレームが、デバイスに同時に到達すると決定することに応答して、時間的な不整合値（例えば、ｓｈｉｆｔ１）を、ゼロ個のサンプルに等しいと推定し得る。（例えば、第１のオーディオ信号に対応する）左チャンネルと（例えば、第２のオーディオ信号に対応する）右チャンネルが、時間的に整合され得る。いくつかのケースでは、左チャンネルと右チャンネルは、整合されているときでさえも、様々な理由（例えば、マイクロフォンの較正）によりエネルギーが異なり得る。

[0034]いくつかの例では、左チャンネルと右チャンネルは、様々な理由（例えば、話者などの音源が、マイクロフォンのうちの一方に、もう一方よりも近くにあり得、２つのマイクロフォンがしきい値（例えば、１〜２０センチメートル）の距離を超えて離れている可能性がある）により、時間的にずれている場合がある。マイクロフォンに対する音源のロケーションは、左チャンネルと右チャンネルとで異なる遅延をもたらし得る。加えて、左チャンネルと右チャンネルとの間の利得差、エネルギー差、またはレベル差が存在し得る。

[0035]２つより多くのチャンネルが存在するいくつかの例では、基準チャンネルが、チャンネルのレベルまたはエネルギーに基づいて最初に選択され、その後、チャンネルの異なるペア間の時間的な不整合値、例えば、ｔ１（ｒｅｆ，ｃｈ２）、ｔ２（ｒｅｆ，ｃｈ３）、ｔ３（ｒｅｆ，ｃｈ４）、．．．ｔ３（ｒｅｆ，ｃｈＮ）に基づいて改良され（refined）、ここで、ｃｈ１が、最初にｒｅｆチャンネルであり、ｔ１（．）、ｔ２（．）などが、不整合値を推定するための関数である。全ての時間的な不整合値が正である場合には、ｃｈ１が基準チャンネルとして扱われる。不整合値のいずれかが負の値である場合には、基準チャンネルは、負の値が得られた不整合値に関連付けられたチャンネルに再構成され、上記のプロセスは、基準チャンネルの（例えば、最大数のサイドチャンネルを最大限に無相関化すること（maximally decorrelating maximum number of side channels）に基づく）最良の選択が達成されるまで継続される。ヒステリシスが、基準チャンネル選択における任意の突然の変動を克服するために使用され得る。

[0036]いくつかの例では、複数の音源（例えば、話者）からの、マイクロフォンにおけるオーディオ信号の到着時間は、複数の話者が（例えば、重なり合うことなく）交互に話しているときに異なり得る。このようなケースでは、エンコーダは、基準チャンネルを識別するために、話者に基づいて時間的な不整合値を動的に調整し得る。いくつかの他の例では、複数の話者は、同時に話していることがあり得、これは、誰が最も大きい声の話者であるか、誰がマイクロフォンに最も近いかなどに依存して、変動する時間的な不整合値をもたらし得る。このようなケースでは、基準チャンネルおよびターゲットチャンネルの識別は、現在のフレームにおける変動する時間的なシフト値と、前のフレームにおける推定された時間的な不整合値とに基づき、および、第１および第２のオーディオ信号のエネルギーまたは時間的な展開（temporal evolution）に基づき得る。

[0037]いくつかの例では、第１のオーディオ信号および第２のオーディオ信号は、これら２つの信号が、潜在的に相関が少ないこと（例えば、相関なし）を示すときに、合成されるかまたは人工的に生成され得る。本明細書で説明される例は例示的であり、同様のまたは異なる状況において、第１のオーディオ信号と第２のオーディオ信号との間の関係を決定する際に有益であり得ることが理解されるべきである。

[0038]エンコーダは、第１のオーディオ信号の第１のフレームと、第２のオーディオ信号の複数のフレームとの比較に基づいて、比較値（例えば、差分値または相互相関値）を生成し得る。複数のフレームの各フレームは、特定の時間的な不整合値に対応し得る。エンコーダは、比較値に基づいて、第１の推定された時間的な不整合値を生成し得る。例えば、第１の推定された時間的な不整合値は、第１のオーディオ信号の第１のフレームと、第２のオーディオ信号の対応する第１のフレームとの間のより高い時間的な類似性（または、より小さい差分）を示す比較値に対応し得る。[0039]エンコーダは、複数の段階において、一連の推定された時間的な不整合値を改良することによって、最終的な時間的な不整合値を決定し得る。例えば、エンコーダは、最初に、第１のオーディオ信号および第２のオーディオ信号のステレオ前処理されおよび再サンプリングされたバージョンから生成された比較値に基づいて、「暫定的な（tentative）」時間的な不整合値を推定し得る。エンコーダは、推定された「暫定的な」時間的な不整合値に近似の（proximate to）時間的な不整合値に関連付けられた補間された比較値を生成し得る。エンコーダは、補間された比較値に基づいて、第２の推定された「補間された」時間的な不整合値を決定し得る。例えば、第２の推定された「補間された」時間的な不整合値は、残りの補間された比較値および第１の推定された「暫定的な」時間的な不整合値に比べて、より高い時間的な類似性（または、より小さい差分）を示す特定の補間された比較値に対応し得る。現在のフレーム（例えば、第１のオーディオ信号の第１のフレーム）の第２の推定された「補間された」時間的な不整合値が、前のフレーム（例えば、第１のフレームに先行する、第１のオーディオ信号のフレーム）の最終的な時間的な不整合値とは異なる場合には、現在のフレームの「補間された」時間的な不整合値は、第１のオーディオ信号と、シフトされた第２のオーディオ信号との間の時間的な類似性を改善するためにさらに「補正」される。具体的には、第３の推定された「補正された」時間的な不整合値が、現在のフレームの第２の推定された「補間された」時間的な不整合値および前のフレームの最終的な推定された時間的な不整合値の周辺をサーチすること（searching around）によって、時間的な類似性のより正確な測定値に対応し得る。第３の推定された「補正された」時間的な不整合値は、フレーム間の時間的な不整合値における任意のスプリアスの変化（spurious changes）を制限することによって、最終的な時間的な不整合値を推定するためにさらに調整され、本明細書で説明されるように、２つの連続した（successive）（または連続的な（consecutive））フレームにおいて、負の時間的な不整合値から正の時間的な不整合値に（または、その逆に）切り替わらないようにさらに制御される。

[0040]いくつかの例では、エンコーダは、連続的なフレームにおいてまたは隣接フレームにおいて、正の時間的な不整合値と負の時間的な不整合値との間で、またはその逆で、切り替えることを控え得る。例えば、エンコーダは、最終的な時間的な不整合値を、第１のフレームの推定された「補間された」または「補正された」時間的な不整合値と、第１のフレームに先行する特定のフレームにおける対応する推定された「補間された」または「補正された」または最終的な時間的な不整合値とに基づいて、時間的なシフトがないことを示す特定の値（例えば、０）に設定し得る。例示すると、エンコーダは、現在のフレームの推定された「暫定的な」または「補間された」または「補正された」時間的な不整合値の一方が正であり、前のフレーム（例えば、第１のフレームに先行するフレーム）の推定された「暫定的な」または「補間された」または「補正された」または「最終的な」推定された時間的な不整合値の他方が負であると決定することに応答して、現在のフレーム（例えば、第１のフレーム）の最終的な時間的な不整合値を、時間的なシフトがないことを示すように設定し得る、すなわち、ｓｈｉｆｔ１＝０。代替として、エンコーダはまた、現在のフレームの推定された「暫定的な」または「補間された」または「補正された」時間的な不整合値の一方が負であり、前のフレーム（例えば、第１のフレームに先行するフレーム）の推定された「暫定的な」または「補間された」または「補正された」または「最終的な」推定された時間的な不整合値の他方が正であると決定することに応答して、現在のフレーム（例えば、第１のフレーム）の最終的な時間的な不整合値を、時間的なシフトがないことを示すように設定し得る、すなわち、ｓｈｉｆｔ１＝０。

[0041]エンコーダは、時間的な不整合値に基づいて、「基準」または「ターゲット」として、第１のオーディオ信号または第２のオーディオ信号のフレームを選択し得る。例えば、最終的な時間的な不整合値が正であると決定することに応答して、エンコーダは、第１のオーディオ信号が「基準」信号であること、および第２のオーディオ信号が「ターゲット」信号であることを示す第１の値（例えば、０）を有する基準チャンネルまたは信号インジケータを生成し得る。代替として、最終的な時間的な不整合値が負であると決定することに応答して、エンコーダは、第２のオーディオ信号が「基準」信号であること、および第１のオーディオ信号が「ターゲット」信号であることを示す第２の値（例えば、１）を有する基準チャンネルまたは信号インジケータを生成し得る。

[0042]エンコーダは、基準信号と、非因果的シフトされたターゲット信号とに関連付けられた相対利得（例えば、相対利得パラメータ）を推定し得る。例えば、最終的な時間的な不整合値が正であると決定することに応答して、エンコーダは、非因果的な時間的な不整合値（例えば、最終的な時間的な不整合値の絶対値）によってオフセットされた第２のオーディオ信号に対する第１のオーディオ信号の振幅または電力レベルを正規化または等化するための利得値を推定し得る。代替として、最終的な時間的な不整合値が負であると決定することに応答して、エンコーダは、第２のオーディオ信号に対する非因果的シフトされた第１のオーディオ信号の電力または振幅レベルを正規化または等化するための利得値を推定し得る。いくつかの例では、エンコーダは、非因果的シフトされた「ターゲット」信号に対する「基準」信号の振幅または電力レベルを正規化または等化するための利得値を推定し得る。他の例では、エンコーダは、ターゲット信号（例えば、シフトされていないターゲット信号）に対する基準信号に基づく利得値（例えば、相対利得値）を推定し得る。

[0043]エンコーダは、基準信号、ターゲット信号、非因果的な時間的な不整合値、および相対利得パラメータに基づいて、少なくとも１つの符号化された信号（例えば、ミッド信号、サイド信号、または両方）を生成し得る。他のインプリメンテーションでは、エンコーダは、基準チャンネルと、時間的な不整合が調整されたターゲットチャンネル（temporal-mismatch adjusted target channel）とに基づいて、少なくとも１つの符号化された信号（例えば、ミッドチャンネル、サイドチャンネル、または両方）を生成し得る。サイド信号は、第１のオーディオ信号の第１のフレームの第１のサンプルと、第２のオーディオ信号の選択されたフレームの選択されたサンプルとの間の差に対応し得る。エンコーダは、最終的な時間的な不整合値に基づいて、選択されたフレームを選択し得る。より少ないビットが、サイドチャンネル信号を符号化するために使用され得、これは、第１のフレームと同時にデバイスによって受信される第２のオーディオ信号のフレームに対応する第２のオーディオ信号の他のサンプルと比較して、第１のサンプルと選択されたサンプルとの間の差が低減されるためである。デバイスの送信機は、少なくとも１つの符号化された信号、非因果的な時間的な不整合値、相対利得パラメータ、基準チャンネルまたは信号インジケータ、またはこれらの組合せを送信し得る。

[0044]エンコーダは、基準信号、ターゲット信号、非因果的な時間的な不整合値、相対利得パラメータ、第１のオーディオ信号の特定のフレームの低帯域パラメータ、この特定のフレームの高帯域パラメータ、またはこれらの組合せに基づいて、少なくとも１つの符号化された信号（例えば、ミッド信号、サイド信号、または両方）を生成し得る。特定のフレームは、第１のフレームに先行し得る。１つまたは複数の先行するフレームからの、ある特定の低帯域パラメータ、高帯域パラメータ、またはこれらの組合せが、第１のフレームのミッド信号、サイド信号、または両方を符号化するために使用され得る。低帯域パラメータ、高帯域パラメータ、またはこれらの組合せに基づいて、ミッド信号、サイド信号、または両方を符号化することは、チャンネル間相対利得パラメータおよび非因果的な時間的な不整合値の推定値を改善し得る。低帯域パラメータ、高帯域パラメータ、またはこれらの組合せは、ピッチパラメータ、ボイシングパラメータ（voicing parameter）、コーダタイプパラメータ、低帯域エネルギーパラメータ、高帯域エネルギーパラメータ、エンベロープパラメータ（例えば、チルトパラメータ）、ピッチ利得パラメータ、周波数チャンネル利得パラメータ、コーディングモードパラメータ、音声活動パラメータ、雑音推定パラメータ、信号対雑音比パラメータ、フォルマントパラメータ、スピーチ／音楽決定パラメータ、非因果的シフト、チャンネル間利得パラメータ、またはこれらの組合せを含み得る。デバイスの送信機は、少なくとも１つの符号化された信号、非因果的な時間的な不整合値、相対利得パラメータ、基準チャンネル（または信号）インジケータ、またはこれらの組合せを送信し得る。本開示では、「決定すること」、「計算すること」、「シフトすること」、「調整すること」などといった用語は、どのように１つまたは複数の動作が実行されるかを説明するために使用され得る。このような用語は限定的であると解釈されるべきではなく、他の技法が同様の動作を実行するために利用され得ることに留意されたい。

[0045]図１を参照すると、システムの特定の例示的な例が開示され、全体として１００と指定されている。システム１００は、ネットワーク１２０を介して、第２のデバイス１０６に通信可能に結合された第１のデバイス１０４を含む。ネットワーク１２０は、１つまたは複数のワイヤレスネットワーク、１つまたは複数のワイヤードネットワーク、またはこれらの組合せを含み得る。

[0046]第１のデバイス１０４は、メモリ１５３、エンコーダ１３４、送信機１１０、および１つまたは複数の入力インターフェース１１２を含む。メモリ１５３は、命令１９１を含む非一時的なコンピュータ可読媒体を含む。命令１９１は、本明細書で説明される動作のうちの１つまたは複数を実行するために、エンコーダ１３４によって実行可能である。入力インターフェース１１２のうちの第１の入力インターフェースが、第１のマイクロフォン１４６に結合され得る。入力インターフェース１１２のうちの第２の入力インターフェースが、第２のマイクロフォン１４８に結合され得る。エンコーダ１３４は、チャンネル間帯域幅拡張（ＩＣＢＷＥ：inter-channel bandwidth extension）エンコーダ１３６を含み得る。

[0047]第２のデバイス１０６は、受信機１６０およびデコーダ１６２を含む。デコーダ１６２は、高帯域ミッドチャンネルデコーダ２０２、低帯域ミッドチャンネルデコーダ２０４、高帯域ミッドチャンネルフィルタ２０７、チャンネル間予測マッパー２０８、低帯域ミッドチャンネルフィルタ２１２、チャンネル間予測器２１４、アップミックスプロセッサ２２４、およびＩＣＢＷＥデコーダ２２６を含み得る。デコーダ１６２はまた、図１に例示されていない１つまたは複数の他の構成要素を含み得る。例えば、デコーダ１６２は、時間領域チャンネル（例えば、時間領域信号）を周波数領域（例えば、変換領域）に変換するように構成された１つまたは複数の変換ユニットを含み得る。デコーダ１６２の動作に関連付けられたさらなる詳細が、図２および図３に関連して説明される。

[0048]第２のデバイス１０６は、第１のラウドスピーカ１４２、第２のラウドスピーカ１４４、または両方に結合され得る。図示されていないが、第２のデバイス１０６は、プロセッサ（例えば、中央処理装置）、マイクロフォン、送信機、アンテナ、メモリなどといった他の構成要素を含み得る。

[0049]動作中、第１のデバイス１０４は、第１のマイクロフォン１４６から第１の入力インターフェースを介して第１のオーディオチャンネル１３０（例えば、第１のオーディオ信号）を受信し得、第２のマイクロフォン１４８から第２の入力インターフェースを介して第２のオーディオチャンネル１３２（例えば、第２のオーディオ信号）を受信し得る。第１のオーディオチャンネル１３０は、右チャンネルまたは左チャンネルのうちの一方に対応し得る。第２のオーディオチャンネル１３２は、右チャンネルまたは左チャンネルのうちの他方に対応し得る。音源１５２（例えば、ユーザ、スピーカ、周囲雑音、楽器など）は、第２のマイクロフォン１４８よりも第１のマイクロフォン１４６により近くあり得る。したがって、音源１５２からのオーディオ信号は、第２のマイクロフォン１４８を介してよりも早い時間において、第１のマイクロフォン１４６を介して入力インターフェース１１２において受信され得る。複数のマイクロフォンを通じたマルチチャンネル信号捕捉におけるこの自然な遅延は、第１のオーディオチャンネル１３０と第２のオーディオチャンネル１３２との間の時間的なずれをもたらし得る。

[0050]１つのインプリメンテーションによると、第１のオーディオチャンネル１３０が「基準チャンネル」であり得、第２のオーディオチャンネル１３２が「ターゲットチャンネル」であり得る。ターゲットチャンネルは、基準チャンネルと実質的に整合するように調整（例えば、時間的にシフト）され得る。別のインプリメンテーションによると、第２のオーディオチャンネル１３２が基準チャンネルであり得、第１のオーディオチャンネル１３０がターゲットチャンネルであり得る。１つのインプリメンテーションによると、基準チャンネルおよびターゲットチャンネルは、フレーム単位で異なり得る。例えば、第１のフレームについては、第１のオーディオチャンネル１３０が基準チャンネルであり得、第２のオーディオチャンネル１３２がターゲットチャンネルであり得る。しかしながら、第２のフレーム（例えば、後続のフレーム）については、第１のオーディオチャンネル１３０がターゲットチャンネルであり得、第２のオーディオチャンネル１３２が基準チャンネルであり得る。説明を簡単にするために、以下で特に断りのない限り、第１のオーディオチャンネル１３０が基準チャンネルであり、第２のオーディオチャンネル１３２がターゲットチャンネルである。オーディオチャンネル１３０、１３２に関連して説明される基準チャンネルは、基準チャンネルインジケータ１９２（例えば、高帯域基準チャンネルインジケータ）とは独立であり得ることに留意されたい。例えば、基準チャンネルインジケータ１９２は、チャンネル１３０、１３２のいずれかの高帯域が、高帯域基準チャンネルであることを示し得、また、基準チャンネルインジケータ１９２は、基準チャンネルとは異なるチャンネルかまたは同じチャンネルかのいずれかであり得る高帯域基準チャンネルを示し得る。

[0051]エンコーダ１３４は、ミッドチャンネル（Ｍｉｄ）１５４およびサイドチャンネル（Ｓｉｄｅ）１５５を生成するために、第１のオーディオチャンネル（ｃｈ１）１３０および第２のオーディオチャンネル（ｃｈ２）１３２に対して時間領域ダウンミックス動作を実行し得る。ミッドチャンネル１５４は、次のように表され得る：

Ｍｉｄ＝α＊ｃｈ１＋（１−α）＊ｃｈ２式５

そして、サイドチャンネル１５５は、次のように表され得る：

Ｓｉｄｅ＝（１−α）＊ｃｈ１−α＊ｃｈ２式６、

[0052]ここで、αは、エンコーダ１３４ではダウンミックス係数およびデコーダ１６２ではアップミックス係数１６６に対応する。本明細書で使用される場合、αは、アップミックス係数１６６として説明される、しかしながら、エンコーダ１３４では、αは、チャンネル１３０、１３２をダウンミックスするために使用されるダウンミックス係数であることが理解されるべきである。アップミックス係数１６６は、０から１の間で変化し得る。アップミックス係数１６６が０．５である場合、エンコーダ１３４は、パッシブダウンミックスを実行する。アップミックス係数１６６が１に等しい場合、ミッドチャンネル１５４は、第１のオーディオチャンネル（ｃｈ１）１３０にマッピングされ、サイドチャンネル１５５は、負の第２のオーディオチャンネル（a negative of the second audio channel）１３２（例えば、−ｃｈ２）にマッピングされる。式５および式６では、チャンネル１３０、１３２は、非因果的シフトおよびターゲット利得が適用されるように、チャンネル間整合される（inter-channel aligned）。ミッドチャンネル１５４およびサイドチャンネル１５５は、コア（例えば、０〜６．４ｋＨｚまたは０〜８ｋＨｚ）において波形コーディングされ、サイドチャンネル１５５と比べてより多くのビットがミッドチャンネル１５４をコーディングするために指定される。エンコーダ１３４は、符号化されたミッドチャンネル１８２を生成するために、ミッドチャンネルを符号化し得る。

[0053]エンコーダ１３４はまた、フィルタリングされたミッドチャンネル（Ｍｉｄ＿ｆｉｌｔ）１５６を生成するために、ミッドチャンネル１５４をフィルタリングし得る。例えば、エンコーダ１３４は、フィルタリングされたミッドチャンネル１５６を生成するために、１つまたは複数のフィルタ係数に従ってミッドチャンネル１５４をフィルタリングし得る。以下で説明されるように、ミッドチャンネル１５４をフィルタリングするためにエンコーダ１３４によって使用されるフィルタ係数は、デコーダ１６２のミッドチャンネルフィルタ２１２によって使用されるフィルタ係数２７０と同じであり得る。フィルタリングされたミッドチャンネル１５６は、フィルタ（例えば、そのカットオフ周波数が、オーディオ信号タイプスピーチ、音楽、背景雑音、コーディングのために使用されるビットレート、またはコアサンプルレートに基づく、適応ローパスフィルタ、適応ハイパスフィルタ、および予め定義されたフィルタ）に基づく、ミッドチャンネル１５４の調整されたバージョンであり得る。例えば、フィルタリングされたミッドチャンネル１５６は、ミッドチャンネル１５４の励起に適用されたサイドチャンネル１５５に基づく知覚的重み付けフィルタ（ＰＷＦ：perceptual weighting filter）、ミッドチャンネル１５４の帯域幅拡張されたバージョン（例えば、Ａ（ｚ／ｇａｍｍａ１））、またはミッドチャンネル１５４の適応コードブック成分であり得る。代替のインプリメンテーションでは、フィルタリングされたミッドチャンネル１５６は、ミッドチャンネル１５４のハイパスフィルタリングされたバージョンであり得、フィルタカットオフ周波数は、信号のタイプ（例えば、スピーチ、音楽、または背景雑音）に依存し得る。フィルタカットオフ周波数はまた、使用されるダウンミックスアルゴリズム、コアサンプルレート、またはビットレートの関数であり得る。１つのインプリメンテーションでは、ミッドチャンネル１５４は、低帯域ミッドチャンネルおよび高帯域ミッドチャンネルを含み得る。フィルタリングされたミッドチャンネル１５６は、チャンネル間予測利得１６４を推定するために使用されるフィルタリングされた（例えば、ハイパスフィルタリングされた）低帯域ミッドチャンネルに対応し得る。代替のインプリメンテーションでは、フィルタリングされたミッドチャンネル１５６はまた、チャンネル間予測利得１６４を推定するために使用されるフィルタリングされた高帯域ミッドチャンネルに対応し得る。別のインプリメンテーションでは、ローパスフィルタリングされたミッドチャンネル１５６（低帯域）は、予測されたミッドチャンネルを推定するために使用される。予測されたミッドチャンネルは、フィルタリングされたサイドチャンネルから減算され、フィルタリングされた誤差（filtered error）が符号化される。現在のフレームについては、フィルタリングされた誤差およびチャンネル間予測パラメータは、符号化および送信される。

[0054]エンコーダ１３４は、サイドチャンネル１５５が、予測されたサイドチャンネルに実質的に等しくなるように、閉ループ解析を使用して、チャンネル間予測利得（ｇ＿ｉｃｐ）１６４を推定し得る。予測されたサイドチャンネルは、チャンネル間予測利得１６４とフィルタリングされたミッドチャンネル１５６との積（例えば、ｇ＿ｉｃｐ＊Ｍｉｄ＿ｆｉｌｔ）に基づく。したがって、チャンネル間予測利得（ｇ＿ｉｃｐ）１６４は、エンコーダ１３４において、項（Ｓｉｄｅ−ｇ＿ｉｃｐ＊Ｍｉｄ＿ｆｉｌｔ）を低減させる（例えば、最小化する）ように推定され得る。いくつかのインプリメンテーションによると、チャンネル間予測利得（ｇ＿ｉｃｐ）１６４は、歪み側度（distortion measure）（例えば、知覚的に重み付けされた平均２乗誤差（ＭＳ）またはハイパスフィルタリングされた誤差）に基づく。別のインプリメンテーションによると、チャンネル間予測利得１６４は、ミッドチャンネル１５４およびサイドチャンネル１５５の高周波部分を低減（例えば、最小化）しながら推定され得る。例えば、チャンネル間予測利得１６４は、項（Ｈ_ＨＰ（ｚ）（Ｓｉｄｅ−ｇ＿ｉｃｐ＊Ｍｉｄ））を低減させるように推定され得る。

[0055]エンコーダ１３４はまた、サイドチャンネル予測誤差（ｅｒｒｏｒ＿ＩＣＰ＿ｈａｔ）１６８を決定（例えば、推定）し得る。サイドチャンネル予測誤差１６８は、サイドチャンネル１５５と予測されたサイドチャンネル（例えば、ｇ＿ｉｃｐ＊Ｍｉｄ＿ｆｉｌｔ）との間の差に対応し得る。サイドチャンネル予測誤差（ｅｒｒｏｒ＿ＩＣＰ＿ｈａｔ）１６８は、項（Ｓｉｄｅ−ｇ＿ｉｃｐ＊Ｍｉｄ＿ｆｉｌｔ）に等しい。

[0056]ＩＣＢＷＥエンコーダ１３６は、合成された非基準高帯域および非基準ターゲットチャンネルに基づいて、ＩＣＢＷＥパラメータ１８４を推定するように構成され得る。例えば、ＩＣＢＷＥエンコーダ１３６は、残差予測利得３９０（例えば、高帯域サイドチャンネル利得）、スペクトルマッピングパラメータ３９２、利得マッピングパラメータ３９４、基準チャンネルインジケータ１９２などを推定し得る。スペクトルマッピングパラメータ３９２は、非基準高帯域チャンネルのスペクトル（またはエネルギー）を、合成された非基準高帯域チャンネルのスペクトルにマッピングする。利得マッピングパラメータ３９４は、非基準高帯域チャンネルの利得を、合成された非基準高帯域チャンネルの利得にマッピングし得る。基準チャンネルインジケータ１９２は、フレーム単位で、基準チャンネルが左チャンネルであるか、または右チャンネルであるかを示し得る。

[0057]送信機１１０は、ネットワーク１２０を介して、第２のデバイス１０６にビットストリーム１８０を送信し得る。ビットストリーム１８０は、少なくとも、符号化されたミッドチャンネル１８２、チャンネル間予測利得１６４、アップミックス係数１６６、サイドチャンネル予測誤差１６８、ＩＣＢＷＥパラメータ１８４、および基準チャンネルインジケータ１９２を含む。他のインプリメンテーションによると、ビットストリーム１８０は、追加のステレオパラメータ（例えば、チャンネル間強度差（ＩＩＤ）パラメータ、チャンネル間レベル差（ＩＬＤ：interchannel level differences）パラメータ、チャンネル間時間差（ＩＴＤ）パラメータ、チャンネル間位相差（ＩＰＤ）パラメータ、チャンネル間ボイシングパラメータ、チャンネル間ピッチパラメータ、チャンネル間利得パラメータなど）を含み得る。

[0058]第２のデバイス１０６の受信機１６０は、ビットストリーム１８０を受信し得、デコーダ１６２は、第１のチャンネル（例えば、左チャンネル１２６）および第２のチャンネル（例えば、右チャンネル１２８）を生成するために、ビットストリーム１８０を復号する。第２のデバイス１０６は、第１のラウドスピーカ１４２を介して左チャンネル１２６を出力し得、第２のラウドスピーカ１４４を介して右チャンネル１２８を出力し得る。代替の例では、左チャンネル１２６および右チャンネル１２８は、ステレオ信号ペアとして単一の出力ラウドスピーカに送信され得る。デコーダ１６２の動作は、図２〜図３に関してさらに詳細に説明される。

[0059]図２を参照すると、デコーダ１６２の特定のインプリメンテーションが示される。デコーダ１６２は、高帯域ミッドチャンネルデコーダ２０２、低帯域ミッドチャンネルデコーダ２０４、高帯域ミッドチャンネルフィルタ２０７、チャンネル間予測マッパー２０８、低帯域ミッドチャンネルフィルタ２１２、チャンネル間予測器２１４、アップミックスプロセッサ２２４、ＩＣＢＷＥデコーダ２２６、組合せ回路２２８、および組合せ回路２３０を含む。いくつかのインプリメンテーションによると、低帯域ミッドチャンネルフィルタ２１２および高帯域ミッドチャンネルフィルタ２０７は、単一の構成要素（例えば、単一のフィルタ）に一体化される。

[0060]符号化されたミッドチャンネル１８２は、高帯域ミッドチャンネルデコーダ２０２と低帯域ミッドチャンネルデコーダ２０４とに提供される。低帯域ミッドチャンネルデコーダ２０４は、復号された低帯域ミッドチャンネル２４２を生成するために、符号化されたミッドチャンネル１８２の低帯域部分を復号するように構成され得る。非限定的な例として、符号化されたミッドチャンネル１８２が、５０Ｈｚから１６ｋＨｚの間のオーディオコンテンツを有する超広帯域信号である場合、符号化されたミッドチャンネル１８２の低帯域部分は、５０Ｈｚ〜８ｋＨｚに及び得、符号化されたミッドチャンネル１８２の高帯域部分は、８ｋＨｚ〜１６ｋＨｚに及び得る。低帯域ミッドチャンネルデコーダ２０４は、復号された低帯域ミッドチャンネル２４２を生成するために、符号化されたミッドチャンネル１８２の低帯域部分（例えば、５０Ｈｚから８ｋＨｚの間の部分）を復号し得る。上記の例は、例示のみを目的としており、限定的であると解釈されるべきではないことが理解されるべきである。他の例では、符号化されたミッドチャンネル１８２は、広帯域信号、全帯域信号などであり得る。復号された低帯域ミッドチャンネル２４２（例えば、時間領域チャンネル）は、アップミックスプロセッサ２２４に提供される。

[0061]復号された低帯域ミッドチャンネル２４２はまた、低帯域ミッドチャンネルフィルタ２１２に提供される。低帯域ミッドチャンネルフィルタ２１２は、低帯域フィルタリングされたミッドチャンネル（Ｍｉｄ＿ｆｉｌｔ）２４６を生成するために、１つまたは複数のフィルタ係数２７０に従って、復号された低帯域ミッドチャンネル２４２をフィルタリングするように構成され得る。低帯域フィルタリングされたミッドチャンネル１５６は、フィルタ（例えば、予め定義されたフィルタ）に基づく、復号された低帯域ミッドチャンネル２４２の調整されたバージョンであり得る。低帯域フィルタリングされたミッドチャンネル２４６は、復号された低帯域ミッドチャンネル２４２の適応コードブック成分、または復号された低帯域ミッドチャンネル２４２の帯域幅拡張されたバージョンを含み得る。代替のインプリメンテーションでは、低帯域フィルタリングされたミッドチャンネル２４６は、復号された低帯域ミッドチャンネル２４２のハイパスフィルタリングされたバージョンであり得、フィルタカットオフ周波数は、信号のタイプ（例えば、スピーチ、音楽、または背景雑音）に依存し得る。フィルタカットオフ周波数はまた、使用されるダウンミックスアルゴリズム、コアサンプルレート、またはビットレートの関数であり得る。低帯域フィルタリングされたミッドチャンネル２４６は、フィルタリングされた（例えば、ハイパスフィルタリングされた）低帯域ミッドチャンネルに対応し得る。代替のインプリメンテーションでは、低帯域フィルタリングされたミッドチャンネル２４６はまた、フィルタリングされた高帯域ミッドチャンネルに対応し得る。例えば、低帯域フィルタリングされたミッドチャンネル２４６は、図１のフィルタリングされたミッドチャンネル１５６と実質的に同様の特性を有し得る。フィルタリングされたミッドチャンネル２４６は、チャンネル間予測器２１４に提供される。

[0062]チャンネル間予測器２１４はまた、チャンネル間予測利得（ｇ＿ｉｃｐ）を受信し得る。チャンネル間予測器２１４は、低帯域フィルタリングされたミッドチャンネル（Ｍｉｄ＿ｆｉｌｔ）２４６と、チャンネル間予測利得（ｇ＿ｉｃｐ）１６４とに基づいて、チャンネル間予測された信号（ｇ＿ｉｃｐ＊Ｍｉｄ＿ｆｉｌｔ）２４７を生成するように構成され得る。例えば、チャンネル間予測器２１４は、チャンネル間予測された信号２４７を生成するために、チャンネル間予測利得１６４などのチャンネル間予測パラメータを、低帯域フィルタリングされたミッドチャンネル２４６にマッピングし得る。チャンネル間予測された信号２４７は、アップミックスプロセッサ２２４に提供される。

[0063]アップミックス係数１６６（例えば、α）およびサイドチャンネル予測誤差（ｅｒｒｏｒ＿ＩＣＰ＿ｈａｔ）１６８もまた、復号された低帯域ミッドチャンネル（Ｍｉｄ＿ｈａｔ）２４２およびチャンネル間予測された信号（ｇ＿ｉｃｐ＊Ｍｉｄ＿ｆｉｌｔ）２４７とともに、アップミックスプロセッサ２２４に提供される。アップミックスプロセッサ２２４は、アップミックス係数１６６（例えば、α）、復号された低帯域ミッドチャンネル（Ｍｉｄ＿ｈａｔ）２４２、チャンネル間予測された信号（ｇ＿ｉｃｐ＊Ｍｉｄ＿ｆｉｌｔ）２４７、およびサイドチャンネル予測誤差（ｅｒｒｏｒ＿ＩＣＰ＿ｈａｔ）１６８に基づいて、低帯域左チャンネル２４８および低帯域右チャンネル２５０を生成するように構成され得る。例えば、アップミックスプロセッサ２２４は、それぞれ式７および式８に従って、第１のチャンネル（Ｃｈ１）および第２のチャンネル（Ｃｈ２）を生成し得る。式７および式８は、次のように表される：

Ｃｈ１＝α＊Ｍｉｄ＿ｈａｔ＋（１−α）＊（ｇ＿ｉｃｐ＊Ｍｉｄ＿ｆｉｌｔ＋ｅｒｒｏｒ＿ＩＣＰ＿ｈａｔ）式７

Ｃｈ２＝（１−α）＊Ｍｉｄ＿ｈａｔ−α＊（ｇ＿ｉｃｐ＊Ｍｉｄ＿ｆｉｌｔ＋ｅｒｒｏｒ＿ＩＣＰ＿ｈａｔ）式８
１つのインプリメンテーションによると、第１のチャンネル（Ｃｈ１）が、低帯域左チャンネル２４８であり、第２のチャンネル（Ｃｈ２）が、低帯域右チャンネル２５０である。別のインプリメンテーションによると、第１のチャンネル（Ｃｈ１）が、低帯域右チャンネル２５０であり、第２のチャンネル（Ｃｈ２）が、低帯域左チャンネル２４８である。アップミックスプロセッサ２２４は、アップミックス動作中に、ＩＩＤパラメータ、ＩＬＤパラメータ、ＩＴＤパラメータ、ＩＰＤパラメータ、チャンネル間ボイシングパラメータ、チャンネル間ピッチパラメータ、およびチャンネル間利得パラメータを適用し得る。低帯域左チャンネル２４８は、組合せ回路２２８に提供され、低帯域右チャンネル２５０は、組合せ回路２３０に提供される。

[0064]いくつかのインプリメンテーションによると、第１のチャンネル（Ｃｈ１）および第２のチャンネル（Ｃｈ２）は、それぞれ式９および式１０に従って生成される。式９および式１０は、次のように表される：

Ｃｈ１＝α＊Ｍｉｄ＿ｈａｔ＋（１−α）＊Ｓｉｄｅ＿ｈａｔ＋ＩＣＰ＿１式９

Ｃｈ２＝（１−α）＊Ｍｉｄ＿ｈａｔ−α＊Ｓｉｄｅ＿ｈａｔ＋ＩＣＰ＿２式１０、

ここで、Ｓｉｄｅ＿ｈａｔは、復号されたサイドチャンネル（図示せず）に対応し、ここで、ＩＣＰ＿１は、α＊（Ｍｉｄ−Ｍｉｄ＿ｈａｔ）＋（１−α）＊（Ｓｉｄｅ−Ｓｉｄｅ＿ｈａｔ）に対応し、ここで、ＩＣＰ＿２は、（１−α）＊（Ｍｉｄ−Ｍｉｄ＿ｈａｔ）−α＊（Ｓｉｄｅ−Ｓｉｄｅ＿ｈａｔ）に対応する。式９および式１０によると、Ｍｉｄ−Ｍｉｄ＿ｈａｔは、ミッドチャンネル１５４に比べて（relative to）、より無相関であり、より白色化される。加えて、Ｓｉｄｅ−Ｓｉｄｅ＿ｈａｔは、Ｍｉｄ＿ｈａｔから予測されるとともに、エンコーダ１３４において項ＩＣＰ＿１およびＩＣＰ＿２を低減させる。

[0065]高帯域ミッドチャンネルデコーダ２０２は、復号された高帯域ミッドチャンネル２５２を生成するために、符号化されたミッドチャンネル１８２の高帯域部分を復号するように構成され得る。非限定的な例として、符号化されたミッドチャンネル１８２が、５０Ｈｚから１６ｋＨｚの間のオーディオコンテンツを有する超広帯域信号である場合、符号化されたミッドチャンネル１８２の高帯域部分は、８ｋＨｚ〜１６ｋＨｚに及び得る。高帯域ミッドチャンネルデコーダ２０２は、復号された高帯域ミッドチャンネル２５２を生成するために、符号化されたミッドチャンネル１８２の高帯域部分を復号し得る。復号された高帯域ミッドチャンネル２５２（例えば、時間領域チャンネル）は、高帯域ミッドチャンネルフィルタ２０７とＩＣＢＷＥデコーダ２２６とに提供される。

[0066]高帯域ミッドチャンネル２０７は、フィルタリングされた高帯域ミッドチャンネル２５３（例えば、復号された高帯域ミッドチャンネル２５２のフィルタリングされたバージョン）を生成するために、復号された高帯域ミッドチャンネル２５２をフィルタリングするように構成され得る。フィルタリングされた高帯域ミッドチャンネル２５３は、チャンネル間予測マッパー２０８に提供される。チャンネル間予測マッパー２０８は、チャンネル間予測利得（ｇ＿ｉｃｐ）１６４およびフィルタリングされた高帯域ミッドチャンネル２５３に基づいて、予測された高帯域サイドチャンネル２５４を生成するように構成され得る。例えば、チャンネル間予測マッパー２０８は、予測された高帯域サイドチャンネル２５４を生成するために、フィルタリングされた高帯域ミッドチャンネル２５３にチャンネル間予測利得（ｇ＿ｉｃｐ）１６４を適用し得る。代替のインプリメンテーションでは、高帯域ミッドチャンネルフィルタ２０７は、低帯域ミッドチャンネルフィルタ２１２に基づくか、または高帯域特性に基づき得る。高帯域ミッドチャンネルフィルタ２０７は、スペクトル拡散を実行するように、または高帯域で拡散場音（diffuse field sound）を生成するように構成され得る。フィルタリングされた高帯域は、ＩＣＰマッピング２０８を通じて、予測された側波帯チャンネル（side-band channel）２５４にマッピングされる。予測された高帯域サイドチャンネル２５４は、ＩＣＢＷＥデコーダ２２６に提供される。

[0067]ＩＣＢＷＥデコーダ２２６は、復号された高帯域ミッドチャンネル２５２、予測された高帯域サイドチャンネル２５４、およびＩＣＢＷＥパラメータ１８４に基づいて、高帯域左チャンネル２５６および高帯域右チャンネル２５８を生成するように構成され得る。ＩＣＢＷＥデコーダ２２６の動作が、図３に関連して説明される。

[0068]図３を参照すると、ＩＣＢＷＥデコーダ１７４の特定のインプリメンテーションが示される。ＩＣＢＷＥデコーダ２２６は、高帯域残差生成ユニット３０２、スペクトルマッパー３０４、利得マッパー３０６、組合せ回路３０８、スペクトルマッパー３１０、利得マッパー３１２、組合せ回路３１４、およびチャンネルセレクタ３１６を含む。

[0069]予測された高帯域サイドチャンネル２５４は、高帯域残差生成ユニット３０２に提供される。（ビットストリーム１８０に符号化された）残差予測利得３９０もまた、高帯域残差生成ユニット３０２に提供される。高帯域残差生成ユニット３０２は、高帯域残差チャンネル３２４（例えば、高帯域サイドチャンネル）を生成するために、予測された高帯域サイドチャンネル２５４に残差予測利得３９０を適用するように構成され得る。高帯域残差チャンネル３２４は、組合せ回路３１４とスペクトルマッパー３１０とに提供される。

[0070]１つのインプリメンテーションによると、１２．８ｋＨｚの低帯域コアの場合、予測された高帯域サイドチャンネル２５４（例えば、ミッド高帯域ステレオ充填信号（mid high-band stereo filling signal））は、残差予測利得を使用して、高帯域残差生成ユニット３０２によって処理される。例えば、高帯域残差生成ユニット３０２は、２帯域利得（two-band gains）を一次フィルタ（first order filter）にマッピングし得る。処理は、（例えば、３２ｋＨｚ信号の６．４ｋＨｚ〜１４．４ｋＨｚをカバーする）非反転領域（un-flipped domain）で実行され得る。代替として、処理は、（例えば、ベースバンドにおいて６．４ｋＨｚ〜１４．４ｋＨｚをカバーする）スペクトル的に反転されおよびダウンミックスされた高帯域チャンネルに対して実行され得る。１６ｋＨｚの低帯域コアの場合、ミッドチャンネルの低帯域非線形励起が、エンベロープ形状の雑音と混合されて、ターゲット高帯域非線形励起を生成する。ターゲット高帯域非線形励起は、復号された高帯域ミッドチャンネル２５２を生成するために、ミッドチャンネル高帯域ローパスフィルタを使用してフィルタリングされる。

[0071]復号された高帯域ミッドチャンネル２５２は、組合せ回路３１４とスペクトルマッパー３０４とに提供される。組合せ回路３１４は、高帯域基準チャンネル３３２を生成するために、復号された高帯域ミッドチャンネル２５２と高帯域残差チャンネル３２４とを組み合わせるように構成され得る。高帯域基準チャンネル３３２は、チャンネルセレクタ３１６に提供される。

[0072]スペクトルマッパー３０４は、スペクトル的にマッピングされた高帯域ミッドチャンネル３２０を生成するために、復号された高帯域ミッドチャンネル２５２に対して第１のスペクトルマッピング動作を実行するように構成され得る。例えば、スペクトルマッパー３０４は、スペクトル的にマッピングされた高帯域ミッドチャンネル３２０を生成するために、復号された高帯域ミッドチャンネル２５２にスペクトルマッピングパラメータ３９２（例えば、逆量子化されたスペクトルマッピングパラメータ）を適用し得る。スペクトル的にマッピングされた高帯域ミッドチャンネル３２０は、利得マッパー３０６に提供される。

[0073]利得マッパー３０６は、第１の高帯域利得マッピングされたチャンネル３２２を生成するために、スペクトル的にマッピングされた高帯域ミッドチャンネル３２０に対して第１の利得マッピング動作を実行するように構成され得る。例えば、利得マッパー３０６は、第１の高帯域利得マッピングされたチャンネル３２２を生成するために、スペクトル的にマッピングされた高帯域ミッドチャンネル３２０に利得パラメータ３９４を適用し得る。第１の高帯域利得マッピングされたチャンネル３２２は、組合せ回路３０８に提供される。

[0074]スペクトルマッパー３１０は、スペクトル的にマッピングされた高帯域残差チャンネル３２６を生成するために、高帯域残差チャンネル３２４に対して第２のスペクトルマッピング動作を実行するように構成され得る。例えば、スペクトルマッパー３１０は、スペクトル的にマッピングされた高帯域残差チャンネル３２６を生成するために、高帯域残差チャンネル３２４にスペクトルマッピングパラメータ３９２を適用し得る。スペクトル的にマッピングされた高帯域残差チャンネル３２６は、利得マッパー３１２に提供される。

[0075]利得マッパー３１２は、第２の高帯域利得マッピングされたチャンネル３２８を生成するために、スペクトル的にマッピングされた高帯域残差チャンネル３２６に対して第２の利得マッピング動作を実行するように構成され得る。例えば、利得マッパー３１２は、第２の高帯域利得マッピングされたチャンネル３２８を生成するために、スペクトル的にマッピングされた高帯域残差チャンネル３２６に利得パラメータ３９４を適用し得る。第２の高帯域利得マッピングされたチャンネル３２８は、組合せ回路３０８に提供される。

[0076]組合せ回路３０８は、高帯域ターゲットチャンネル３３０を生成するために、第１の高帯域利得マッピングされたチャンネル３２２と第２の高帯域利得マッピングされたチャンネル３２８とを組み合わせるように構成され得る。高帯域ターゲットチャンネル３３０は、チャンネルセレクタ３１６に提供される。

[0077]チャンネルセレクタ３１６は、高帯域左チャンネル２５６として、高帯域基準チャンネル３３２または高帯域ターゲットチャンネル３３０のうちの一方を指定するように構成され得る。チャンネルセレクタ３１６はまた、高帯域右チャンネル２５８として、高帯域基準チャンネル３３２または高帯域ターゲットチャンネル３３０のうちの他方を指定するように構成され得る。例えば、基準チャンネルインジケータ１９２は、チャンネルセレクタ３１６に提供される。基準チャンネルインジケータ１９２が「０」のバイナリ値を有する場合、チャンネルセレクタ３１６は、高帯域左チャンネル２５６として高帯域基準チャンネル３３２を指定し、高帯域右チャンネル２５８として高帯域ターゲットチャンネル３３０を指定する。基準チャンネルインジケータ１９２が「１」のバイナリ値を有する場合、チャンネルセレクタ３１６は、高帯域右チャンネル２８５として高帯域基準チャンネル３３２を指定し、高帯域左チャンネル２５６として高帯域ターゲットチャンネル３３０を指定する。

[0078]図２に戻って参照すると、高帯域左チャンネル２５６は、組合せ回路２２８に提供され、高帯域右チャンネル２５８は、組合せ回路２３０に提供される。組合せ回路２２８は、左チャンネル１２６を生成するために、低帯域左チャンネル２４８と高帯域左チャンネル２５６を組み合わせるように構成され得、組合せ回路２３０は、右チャンネル１２８を生成するために、低帯域右チャンネル２５０と高帯域右チャンネル２５８を組み合わせるように構成され得る。

[0079]いくつかのインプリメンテーションによると、左チャンネル１２６および右チャンネル１２８は、エンコーダ１３４において決定される時間的なシフト値に基づいて、チャンネル１２６、１２８のうちの遅れているチャンネル（例えば、ターゲットチャンネル）を時間的にシフトするために、チャンネル間アライナ（図示せず）に提供され得る。例えば、エンコーダ１３４は、第１のオーディオチャンネル１３０（例えば、基準チャンネル）と時間的に整合されている状態になるように第２のオーディオチャンネル１３２（例えば、ターゲットチャンネル）を時間的にシフトすることによって、チャンネル間整合を実行し得る。チャンネル間アライナ（図示せず）は、チャンネル１２６、１２８のうちの遅れているチャンネルを時間的にシフトするために逆の動作を実行し得る。

[0080]図１〜図３に関連して説明された技法は、典型的には、デコーダ１６２にサイドチャンネル１５５の符号化されたバージョンを送信することによって達成される、拡張されたステレオ特性（例えば、拡張されたステレオパンニングおよび拡張されたステレオの広がり（enhanced stereo broadening））が、サイドチャンネル１５５を符号化するために必要とされるビットよりも少ないビットを使用して、デコーダ１６２において達成されることを可能にし得る。例えば、サイドチャンネル１５５をコーディングし、デコーダ１６２にサイドチャンネル１５５の符号化されたバージョンを送信する代わりに、サイドチャンネル予測誤差（ｅｒｒｏｒ＿ＩＣＰ＿ｈａｔ）１６８およびチャンネル間予測利得（ｇ＿ｉｃｐ）１６４が符号化され、ビットストリーム１８０の一部としてデコーダ１６２に送信され得る。サイドチャンネル予測誤差（ｅｒｒｏｒ＿ＩＣＰ＿ｈａｔ）１６８およびチャンネル間予測利得（ｇ＿ｉｃｐ）１６４は、サイドチャンネル１５５よりも少ないデータを含み（例えば、サイドチャンネル１５５よりも小さく）、これは、データ伝送を低減し得る。結果として、準最適な（sub-optimal）ステレオパンニングと準最適なステレオの広がりとに関連付けられた歪みが低減され得る。例えば、同位相の歪み（in-phase distortions）および逆位相の歪み（out-of-phase distortion）が、指向性というよりも均一な周囲雑音をモデル化するときに、低減（例えば、最小化）され得る。

[0081]いくつかのインプリメンテーションによると、上記で説明されたチャンネル間予測技法は、複数のストリームに拡張され得る。例えば、一次アンビソニックス成分または信号に対応するチャンネルＷ、チャンネルＸ、チャンネルＹ、およびチャンネルＺが、エンコーダ１３４によって受信され得る。エンコーダ１３４は、エンコーダが符号化されたミッドチャンネル１８２を生成するのと同様の方法で、符号化されたチャンネルＷを生成し得る。しかしながら、チャンネルＸ、チャンネルＹ、およびチャンネルＺを符号化する代わりに、エンコーダ１３４は、上記で説明されたチャンネル間予測技法を使用して、チャンネルＸ〜Ｚを反映する、チャンネルＷ（またはチャンネルＷのフィルタリングされたバージョン）からの残差成分（例えば、「サイド成分」）を生成し得る。例えば、エンコーダ１３４は、チャンネルＷとチャンネルＸとの間の差を反映する残差成分（Ｓｉｄｅ＿Ｘ）、チャンネルＷとチャンネルＹとの間の差を反映する残差成分（Ｓｉｄｅ＿Ｙ）、およびチャンネルＷとチャンネルＺとの間の差を反映する残差成分（Ｓｉｄｅ＿Ｚ）を符号化し得る。デコーダ１６２は、チャンネルＷとチャンネルＸ〜Ｚの残差成分との復号されたバージョンを使用してチャンネルＸ〜Ｚを生成するために、上記で説明されたチャンネル間予測技法を使用し得る。

[0082]例となるインプリメンテーションでは、エンコーダ１３４は、フィルタリングされたチャンネルＷを生成するために、チャンネルＷをフィルタリングし得る。例えば、エンコーダ１３４は、フィルタリングされたチャンネルＷを生成するために、１つまたは複数のフィルタ係数に従ってチャンネルＷをフィルタリングし得る。フィルタリングされたチャンネルＷは、チャンネルＷの調整されたバージョンであり得、フィルタリング動作（例えば、そのカットオフ周波数が、オーディオ信号タイプスピーチ、音楽、背景雑音、コーディングのために使用されるビットレート、またはコアサンプルレートに基づく、適応ローパスフィルタ、適応ハイパスフィルタ、および予め定義されたフィルタ）に基づき得る。例えば、フィルタリングされたチャンネルＷは、チャンネルＷの励起に適用されるサイドチャンネルに基づく知覚的重み付けフィルタ（ＰＷＦ）、チャンネルＷの帯域幅拡張されたバージョン（例えば、Ａ（ｚ／ｇａｍｍａ１））、またはチャンネルＷの適応コードブック成分であり得る。

[0083]代替のインプリメンテーションでは、フィルタリングされたチャンネルＷは、チャンネルＷのハイパスフィルタリングされたバージョンであり得、フィルタカットオフ周波数は、信号のタイプ（例えば、スピーチ、音楽、または背景雑音）に依存し得る。フィルタカットオフ周波数はまた、使用されるダウンミックスアルゴリズム、コアサンプルレート、またはビットレートの関数であり得る。１つのインプリメンテーションでは、チャンネルＷは、低帯域チャンネルおよび高帯域チャンネルを含み得る。フィルタリングされたチャンネルＷは、チャンネル間予測利得１６４を推定するために使用されるフィルタリングされた（例えば、ハイパスフィルタリングされた）低帯域チャンネルＷに対応し得る。代替のインプリメンテーションでは、フィルタリングされたチャンネルＷはまた、チャンネル間予測利得１６４を推定するために使用されるフィルタリングされた高帯域チャンネルＷに対応し得る。別のインプリメンテーションでは、ローパスフィルタリングされたチャンネルＷ（低帯域）は、予測されたチャンネルＷを推定するために使用される。予測されたチャンネルＷは、フィルタリングされたチャンネルＸから減算され、フィルタリングされたＸ＿ｅｒｒｏｒが符号化される。現在のフレームについては、フィルタリングされた誤差およびチャンネル間予測パラメータが符号化および送信される。同様に、ＩＣＰは、チャンネル間パラメータおよびＩＣＰ＿ｅｒｒｏｒを推定するために、他のチャンネルＹおよびＺに対して実行され得る。

[0084]図４を参照すると、符号化されたビットストリームを処理する方法４００が示される。方法４００は、図１の第２のデバイス１０６によって実行され得る。より具体的には、方法４００は、受信機１６０およびデコーダ１６２によって実行され得る。

[0085]方法４００は、４０２において、符号化されたミッドチャンネルと、チャンネル間予測利得とを含むビットストリームを受信することを含む。例えば、図１を参照すると、受信機１６０は、ネットワーク１２０を介して、第１のデバイス１０４からビットストリーム１８０を受信し得る。ビットストリーム１８０は、符号化されたミッドチャンネル１８２、チャンネル間予測利得（ｇ＿ｉｃｐ）１６４、およびアップミックス係数（α）１６６を含む。いくつかのインプリメンテーションによると、ビットストリーム１８０はまた、サイドチャンネル予測誤差（例えば、サイドチャンネル予測誤差（ｅｒｒｏｒ＿ＩＣＰ＿ｈａｔ）１６８）のインジケーションを含む。

[0086]方法４００はまた、４０４において、復号された低帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの低帯域部分を復号することを含む。例えば、図２を参照すると、低帯域ミッドチャンネルデコーダ２０４は、復号された低帯域ミッドチャンネル２４２を生成するために、符号化されたミッドチャンネル１８２の低帯域部分を復号し得る。

[0087]方法４００はまた、４０６において、低帯域フィルタリングされたミッドチャンネルを生成するために、１つまたは複数のフィルタ係数に従って、復号された低帯域ミッドチャンネルをフィルタリングすることを含む。例えば、図２を参照すると、低帯域ミッドチャンネルフィルタ２１２は、フィルタリングされたミッドチャンネル２４６を生成するために、フィルタ係数２７０に従って、復号された低帯域ミッドチャンネル２４２をフィルタリングし得る。

[0088]方法４００はまた、４０８において、低帯域フィルタリングされたミッドチャンネルと、チャンネル間予測利得とに基づいて、チャンネル間予測された信号を生成することを含む。例えば、図２を参照すると、チャンネル間予測器２１４は、低帯域フィルタリングされたミッドチャンネル２４６と、チャンネル間予測利得１６４とに基づいて、チャンネル間予測された信号２４７を生成し得る。

[0089]方法４００はまた、４１０において、アップミックス係数と、復号された低帯域ミッドチャンネルと、チャンネル間予測された信号とに基づいて、低帯域左チャンネルおよび低帯域右チャンネルを生成すること含む。例えば、図２を参照すると、アップミックスプロセッサ２２４は、アップミックス係数（α）１６６、復号された低帯域ミッドチャンネル（Ｍｉｄ＿ｈａｔ）２４２、およびチャンネル間予測された信号（ｇ＿ｉｃｐ＊Ｍｉｄ＿ｆｉｌｔ）２４７に基づいて、低帯域左チャンネル２４８および低帯域右チャンネル２５０を生成し得る。いくつかのインプリメンテーションによると、アップミックスプロセッサ２２４はまた、サイドチャンネル予測誤差（ｅｒｒｏｒ＿ＩＣＰ＿ｈａｔ）１６８に基づいて、低帯域左チャンネル２４８および低帯域右チャンネル２５０を生成し得る。例えば、アップミックスプロセッサ２２４は、上記で説明されたように、式７および式８を使用してチャンネル２４８、２５０を生成し得る。

[0090]方法４００はまた、４１２において、復号された高帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの高帯域部分を復号することを含む。例えば、図２を参照すると、高帯域ミッドチャンネルデコーダ２０２は、復号された高帯域ミッドチャンネル２５２を生成するために、符号化されたミッドチャンネル１８２の高帯域部分を復号し得る。

[0091]方法４００はまた、４１４において、チャンネル間予測利得と、復号された高帯域ミッドチャンネルのフィルタリングされたバージョンとに基づいて、予測された高帯域サイドチャンネルを生成することを含む。例えば、図２を参照すると、高帯域ミッドチャンネルフィルタ２０７は、フィルタリングされた高帯域ミッドチャンネル２５３（例えば、復号された高帯域ミッドチャンネル２５２のフィルタリングされたバージョン）を生成するために、復号された高帯域ミッドチャンネル２５２をフィルタリングし得、チャンネル間予測マッパー２０８は、チャンネル間予測利得（ｇ＿ｉｃｐ）１６４およびフィルタリングされた高帯域ミッドチャンネル２５３に基づいて、予測された高帯域サイドチャンネル２５４を生成し得る。

[0092]方法４００はまた、４１６において、復号された高帯域ミッドチャンネルと、予測された高帯域サイドチャンネルとに基づいて、高帯域左チャンネルおよび高帯域右チャンネルを生成することを含む。例えば、図２〜図３を参照すると、ＩＣＢＷＥデコーダ２２６は、復号された高帯域ミッドチャンネル２５２と、予測された高帯域サイドチャンネル２５４とに基づいて、高帯域左チャンネル２５６および高帯域右チャンネル２５８を生成し得る。

[0093]図４の方法４００は、典型的には、デコーダ１６２にサイドチャンネル１５５の符号化されたバージョンを送信することによって達成される、拡張されたステレオ特性（例えば、拡張されたステレオパンニングおよび拡張されたステレオの広がり）が、サイドチャンネル１５５を符号化するために必要とされるビットよりも少ないビットを使用して、デコーダ１６２において達成されることを可能にし得る。例えば、サイドチャンネル１５５をコーディングし、デコーダ１６２にサイドチャンネル１５５の符号化されたバージョンを送信する代わりに、サイドチャンネル予測誤差（ｅｒｒｏｒ＿ＩＣＰ＿ｈａｔ）１６８およびチャンネル間予測利得（ｇ＿ｉｃｐ）１６４が符号化され、ビットストリーム１８０の一部としてデコーダ１６２に送信され得る。結果として、準最適なステレオパンニングと準最適なステレオの広がりとに関連付けられた歪みが低減され得る。例えば、同位相の歪みおよび逆位相の歪みは、指向性というよりも均一な周囲雑音をモデル化するときに、低減（例えば、最小化）され得る。

[0094]図５を参照すると、デバイス（例えば、ワイヤレス通信デバイス）の特定の例示的な例のブロック図が図示され、全体として５００と指定されている。様々なインプリメンテーションでは、デバイス５００は、図５に例示されるより少ないまたはそれより多くの構成要素を有し得る。例示的なインプリメンテーションでは、デバイス５００は、図１の第１のデバイス１０４または図１の第２のデバイス１０６に対応し得る。例示的なインプリメンテーションでは、デバイス５００は、図１〜図４のシステムおよび方法を参照して説明された１つまたは複数の動作を実行し得る。

[0095]特定のインプリメンテーションでは、デバイス５００は、プロセッサ５０６（例えば、中央処理装置（ＣＰＵ））を含む。デバイス５００は、１つまたは複数の追加のプロセッサ５１０（例えば、１つまたは複数のデジタルシグナルプロセッサ（ＤＳＰ））を含み得る。プロセッサ５１０は、メディア（例えば、スピーチおよび音楽）コーダ−デコーダ（ＣＯＤＥＣ）５０８と、エコーキャンセラ５１２とを含み得る。メディアＣＯＤＥＣ５０８は、デコーダ１６２、エンコーダ１３４、またはこれらの組合せを含み得る。

[0096]デバイス５００は、メモリ５５３およびＣＯＤＥＣ５３４を含み得る。メディアＣＯＤＥＣ５０８は、プロセッサ５１０の構成要素（例えば、専用回路および／または実行可能なプログラミングコード）として例示されているが、他のインプリメンテーションでは、デコーダ１６２、エンコーダ１３４、またはこれらの組合せなどの、メディアＣＯＤＥＣ５０８の１つまたは複数の構成要素は、プロセッサ５０６、ＣＯＤＥＣ５３４、別の処理構成要素、またはこれらの組合せに含まれ得る。

[0097]デバイス５００は、アンテナ５４２に結合された受信機１６２を含み得る。デバイス５００は、ディスプレイコントローラ５２６に結合されたディスプレイ５２８を含み得る。１つまたは複数のスピーカ５４８は、ＣＯＤＥＣ５３４に結合され得る。１つまたは複数のマイクロフォン５４６は、（１つまたは複数の）入力インターフェース１１２を介して、ＣＯＤＥＣ５３４に結合され得る。特定のインプリメンテーションでは、スピーカ５４８は、図１の第１のラウドスピーカ１４２、第２のラウドスピーカ１４４、またはこれらの組合せを含み得る。特定のインプリメンテーションでは、マイクロフォン５４６は、図１の第１のマイクロフォン１４６、第２のマイクロフォン１４８、またはこれらの組合せを含み得る。ＣＯＤＥＣ５３４は、デジタルアナログ変換器（ＤＡＣ）５０２およびアナログデジタル変換器（ＡＤＣ）５０４を含み得る。

[0098]メモリ５５３は、図１〜図４を参照して説明された１つまたは複数の動作を実行するために、プロセッサ５０６、プロセッサ５１０、ＣＯＤＥＣ５３４、デバイス５００の別の処理ユニット、またはこれらの組合せによって実行可能な命令５９１を含み得る。

[0099]デバイス５００の１つまたは複数の構成要素は、専用ハードウェア（例えば、回路）を介して、１つまたは複数のタスクを実行するための命令を実行するプロセッサによって、またはこれらの組合せでインプリメントされ得る。例として、メモリ５５３、またはプロセッサ５０６、プロセッサ５１０、および／またはＣＯＤＥＣ５３４の１つまたは複数の構成要素は、ランダムアクセスメモリ（ＲＡＭ）、磁気抵抗ランダムアクセスメモリ（ＭＲＡＭ）、スピン注入ＭＲＡＭ（ＳＴＴ−ＭＲＡＭ：spin-torque transfer MRAM）、フラッシュメモリ、読取専用メモリ（ＲＯＭ）、プログラマブル読取専用メモリ（ＰＲＯＭ）、消去可能なプログラマブル読取専用メモリ（ＥＰＲＯＭ）、電気的に消去可能なプログラマブル読取専用メモリ（ＥＥＰＲＯＭ（登録商標））、レジスタ、ハードディスク、リムーバブルディスク、またはコンパクトディスク読取専用メモリ（ＣＤ−ＲＯＭ）などの、メモリデバイスであり得る。メモリデバイスは、コンピュータ（例えば、ＣＯＤＥＣ５３４におけるプロセッサ、プロセッサ５０６、および／またはプロセッサ５１０）によって実行されると、コンピュータに、図１〜図４を参照して説明された１つまたは複数の動作を実行させ得る命令（例えば、命令５９１）を含み得る。例として、メモリ５５３、またはプロセッサ５０６、プロセッサ５１０、および／またはＣＯＤＥＣ５３４の１つまたは複数の構成要素は、コンピュータ（例えば、ＣＯＤＥＣ５３４におけるプロセッサ、プロセッサ５０６、および／またはプロセッサ５１０）によって実行されると、コンピュータに、図１〜図４を参照して説明された１つまたは複数の動作を実行させる命令（例えば、命令５９１）を含む非一時的なコンピュータ可読媒体であり得る。

[0100]特定のインプリメンテーションでは、デバイス５００は、システムインパッケージまたはシステムオンチップデバイス（例えば、モバイル局モデム（ＭＳＭ））５２２に含まれ得る。特定のインプリメンテーションでは、プロセッサ５０６、プロセッサ５１０、ディスプレイコントローラ５２６、メモリ５５３、ＣＯＤＥＣ５３４、および受信機１６０は、システムインパッケージまたはシステムオンチップデバイス５２２に含まれる。特定のインプリメンテーションでは、タッチスクリーンおよび／またはキーパッドなどの入力デバイス５３０、ならびに電源５４４が、システムオンチップデバイス５２２に結合される。さらに、特定のインプリメンテーションでは、図５に例示されるように、ディスプレイ５２８、入力デバイス５３０、スピーカ５４８、マイクロフォン５４６、アンテナ５４２、および電源５４４は、システムオンチップデバイス５２２の外部にある。しかしながら、ディスプレイ５２８、入力デバイス５３０、スピーカ５４８、マイクロフォン５４６、アンテナ５４２、および電源５４４の各々は、インターフェースまたはコントローラなどの、システムオンチップデバイス５２２の構成要素に結合され得る。

[0101]デバイス５００は、ワイヤレス電話、モバイル通信デバイス、モバイルフォン、スマートフォン、セルラフォン、ラップトップコンピュータ、デスクトップコンピュータ、コンピュータ、タブレットコンピュータ、セットトップボックス、携帯情報端末（ＰＤＡ）、ディスプレイデバイス、テレビ、ゲーム機、音楽プレーヤ、ラジオ、ビデオプレーヤ、エンターテインメントユニット、通信デバイス、固定ロケーションデータユニット、パーソナルメディアプレーヤ、デジタルビデプレーヤ、デジタルビデオディスク（ＤＶＤ）プレーヤ、チューナ、カメラ、ナビゲーションデバイス、デコーダシステム、エンコーダシステム、またはこれらの任意の組合せを含み得る。

[0102]図６を参照すると、基地局６００の特定の例示的な例のブロック図が図示される。様々なインプリメンテーションでは、基地局６００は、図６に例示されるより多くの構成要素またはそれより少ない構成要素を有し得る。例示的な例では、基地局６００は、図１の第１のデバイス１０４または第２のデバイス１０６を含み得る。例示的な例では、基地局６００は、図１〜図４を参照して説明された方法またはシステムのうちの１つまたは複数に従って動作し得る。

[0103]基地局６００は、ワイヤレス通信システムの一部であり得る。ワイヤレス通信システムは、複数の基地局と複数のワイヤレスデバイスとを含み得る。ワイヤレス通信システムは、ロングタームエボリューション（ＬＴＥ（登録商標））システム、符号分割多元接続（ＣＤＭＡ）システム、モバイル通信のためのグローバルシステム（ＧＳＭ（登録商標））システム、ワイヤレスローカルエリアネットワーク（ＷＬＡＮ）システム、または何らかの他のワイヤレスシステムであり得る。ＣＤＭＡシステムは、広帯域ＣＤＭＡ（ＷＣＤＭＡ（登録商標））、ＣＤＭＡ１Ｘ、エボリューションデータオプティマイズド（ＥＶＤＯ）、時分割同期ＣＤＭＡ（ＴＤ−ＳＣＤＭＡ）、または何らかの他のバージョンのＣＤＭＡをインプリメントし得る。

[0104]ワイヤレスデバイスは、ユーザ機器（ＵＥ）、モバイル局、端末、アクセス端末、加入者ユニット、局などとも呼ばれ得る。ワイヤレスデバイスは、セルラフォン、スマートフォン、タブレット、ワイヤレスモデム、携帯情報端末（ＰＤＡ）、ハンドヘルドデバイス、ラップトップコンピュータ、スマートブック、ネットブック、タブレット、コードレスフォン、ワイヤレスローカルループ（ＷＬＬ）局、Ｂｌｕｅｔｏｏｔｈ（登録商標）デバイスなどを含み得る。ワイヤレスデバイスは、図６のデバイス６００を含むか、またはそれに対応し得る。

[0105]メッセージおよびデータ（例えば、オーディオデータ）を送受信することなどの様々な機能が、基地局６００の１つまたは複数の構成要素によって（および／または図示されていない他の構成要素において）実行され得る。特定の例では、基地局６００は、プロセッサ６０６（例えば、ＣＰＵ）を含む。基地局６００は、トランスコーダ６１０を含み得る。トランスコーダ６１０は、オーディオＣＯＤＥＣ６０８を含み得る。例えば、トランスコーダ６１０は、オーディオＣＯＤＥＣ６０８の動作を実行するように構成された１つまたは複数の構成要素（例えば、回路）を含み得る。別の例として、トランスコーダ６１０は、オーディオＣＯＤＥＣ６０８の動作を実行するための１つまたは複数のコンピュータ可読命令を実行するように構成され得る。オーディオＣＯＤＥＣ６０８は、トランスコーダ６１０の構成要素として例示されているが、他の例では、オーディオＣＯＤＥＣ６０８の１つまたは複数の構成要素は、プロセッサ６０６、別の処理構成要素、またはこれらの組合せに含まれ得る。例えば、デコーダ６３８（例えば、ボコーダデコーダ）が、受信機データプロセッサ６６４に含まれ得る。別の例として、エンコーダ６３６（例えば、ボコーダエンコーダ）が、送信データプロセッサ６８２に含まれ得る。

[0106]トランスコーダ６１０は、２つ以上のネットワーク間のメッセージおよびデータをトランスコードするように機能し得る。トランスコーダ６１０は、メッセージおよびオーディオデータを、第１のフォーマット（例えば、デジタルフォーマット）から第２のフォーマットに変換するように構成され得る。例示すると、デコーダ６３８は、第１のフォーマットを有する符号化された信号を復号し得、エンコーダ６３６は、この復号された信号を、第２のフォーマットを有する符号化された信号に符号化し得る。追加または代替として、トランスコーダ６１０は、データレート適応を実行するように構成され得る。例えば、トランスコーダ６１０は、オーディオデータのフォーマットを変更することなく、データレートをダウンコンバートまたはデータレートをアップコンバートし得る。例示すると、トランスコーダ６１０は、６４ｋｂｉｔ／ｓ信号を１６ｋｂｉｔ／ｓ信号にダウンコンバートし得る。

[0107]オーディオＣＯＤＥＣ６０８は、エンコーダ６３６およびデコーダ６３８を含み得る。エンコーダ６３６は、図１のエンコーダ１３４を含み得る。デコーダ６３８は、図１のデコーダ１６２を含み得る。

[0108]基地局６００は、メモリ６３２を含み得る。コンピュータ可読記憶デバイスなどのメモリ６３２は、命令を含み得る。命令は、図１〜図４の方法およびシステムを参照して説明された１つまたは複数の動作を実行するために、プロセッサ６０６、トランスコーダ６１０、またはこれらの組合せによって実行可能である１つまたは複数の命令を含み得る。基地局６００は、アンテナのアレイに結合された、第１のトランシーバ６５２および第２のトランシーバ６５４などの複数の送信機および受信機（例えば、トランシーバ）を含み得る。アンテナのアレイは、第１のアンテナ６４２および第２のアンテナ６４４を含み得る。アンテナのアレイは、図６のデバイス６００などの１つまたは複数のワイヤレスデバイスとワイヤレスに通信するように構成され得る。例えば、第２のアンテナ６４４は、ワイヤレスデバイスからデータストリーム６１４（例えば、ビットストリーム）を受信し得る。データストリーム６１４は、メッセージ、データ（例えば、符号化されたスピーチデータ）、またはこれらの組合せを含み得る。

[0109]基地局６００は、バックホール接続などのネットワーク接続６６０を含み得る。ネットワーク接続６６０は、ワイヤレス通信ネットワークの１つまたは複数の基地局、またはコアネットワークと通信するように構成され得る。例えば、基地局６００は、ネットワーク接続６６０を介してコアネットワークから第２のデータストリーム（例えば、メッセージまたはオーディオデータ）を受信し得る。基地局６００は、第２のデータストリームを処理してメッセージまたはオーディオデータを生成し、これらメッセージまたはオーディオデータを、アンテナのアレイの１つまたは複数のアンテナを介して１つまたは複数のワイヤレスデバイスに、またはネットワーク接続６６０を介して別の基地局に提供し得る。特定のインプリメンテーションでは、ネットワーク接続６６０は、例示的な、非限定的な例として、ワイドエリアネットワーク（ＷＡＮ）接続であり得る。いくつかのインプリメンテーションでは、コアネットワークは、公衆交換電話網（ＰＳＴＮ）、パケットバックボーンネットワーク、または両方を含むか、またはそれらに対応し得る。

[0110]基地局６００は、ネットワーク接続６６０とプロセッサ６０６とに結合されたメディアゲートウェイ６７０を含み得る。メディアゲートウェイ６７０は、異なる電気通信技術のメディアストリーム間で変換するように構成され得る。例えば、メディアゲートウェイ６７０は、異なる送信プロトコル間、異なるコーディング方式間、または両方で変換し得る。例示すると、メディアゲートウェイ６７０は、例示的な、非限定的な例として、ＰＣＭ信号からリアルタイムトランスポートプロトコル（ＲＴＰ：Real-Time Transport Protocol）信号に変換し得る。メディアゲートウェイ６７０は、パケット交換ネットワーク（例えば、ボイスオーバーインターネットプロトコル（ＶｏＩＰ）ネットワーク、ＩＰマルチメディアサブシステム（ＩＭＳ）、ＬＴＥ、ＷｉＭａｘ、およびＵＭＢなどの第４世代（４Ｇ）ワイヤレスネットワークなど）と、回線交換ネットワーク（例えば、ＰＳＴＮ）と、ハイブリッドネットワーク（例えば、ＧＳＭ、ＧＰＲＳ、およびＥＤＧＥなどの第２世代（２Ｇ）ワイヤレスネットワーク、ＷＣＤＭＡ、ＥＶ−ＤＯ、およびＨＳＰＡなどの第３世代（３Ｇ）ワイヤレスネットワークなど）との間でデータを変換し得る。

[0111]加えて、メディアゲートウェイ６７０は、トランスコードを含み得、コーデックの互換性がないときに、データをトランスコードするように構成され得る。例えば、メディアゲートウェイ６７０は、例示的な、非限定的な例として、適応マルチレート（ＡＭＲ：Adaptive Multi-Rate）コーデックとＧ．７１１コーデックとの間でトランスコードし得る。メディアゲートウェイ６７０は、ルータおよび複数の物理インターフェースを含み得る。いくつかのインプリメンテーションでは、メディアゲートウェイ６７０はまた、コントローラ（図示せず）を含み得る。特定のインプリメンテーションでは、メディアゲートウェイコントローラは、メディアゲートウェイ６７０の外部にあるか、基地局６００の外部にあるか、または両方であり得る。メディアゲートウェイコントローラは、複数のメディアゲートウェイの動作を制御および調整し得る。メディアゲートウェイ６７０は、メディアゲートウェイコントローラから制御信号を受信し得、異なる伝送技術間をブリッジするように機能し得、エンドユーザの能力および接続にサービスを付加し得る。

[0112]基地局６００は、トランシーバ６５２、６５４と、受信機データプロセッサ６６４と、プロセッサ６０６とに結合された復調器６６２を含み得、受信機データプロセッサ６６４は、プロセッサ６０６に結合され得る。復調器６６２は、トランシーバ６５２、６５４から受信された変調された信号を復調し、復調されたデータを受信機データプロセッサ６６４に提供するように構成され得る。受信機データプロセッサ６６４は、復調されたデータからメッセージまたはオーディオデータを抽出し、メッセージまたはオーディオデータをプロセッサ６０６に送るように構成され得る。

[0113]基地局６００は、送信データプロセッサ６８２および送信多入力多出力（ＭＩＭＯ）プロセッサ６８４を含み得る。送信データプロセッサ６８２は、プロセッサ６０６および送信ＭＩＭＯプロセッサ６８４に結合され得る。送信ＭＩＭＯプロセッサ６８４は、トランシーバ６５２、６５４、およびプロセッサ６０６に結合され得る。いくつかのインプリメンテーションでは、送信ＭＩＭＯプロセッサ６８４は、メディアゲートウェイ６７０に結合され得る。送信データプロセッサ６８２は、プロセッサ６０６からメッセージまたはオーディオデータを受信し、例示的な、非限定的な例として、ＣＤＭＡまたは直交周波数分割多重化（ＯＦＤＭ）などのコーディング方式に基づいて、メッセージまたはオーディオデータをコーディングするように構成され得る。送信データプロセッサ６８２は、コーディングされたデータを送信ＭＩＭＯプロセッサ６８４に提供し得る。

[0114]コーディングされたデータは、多重化されたデータを生成するために、ＣＤＭＡまたはＯＦＤＭ技法を使用して、パイロットデータなどの他のデータと多重化され得る。その後、多重化されたデータは、変調シンボルを生成するために、特定の変調方式（例えば、２相位相シフトキーイング（「ＢＰＳＫ」）、４相位相シフトキーイング（「ＱＰＳＫ」）、Ｍ相位相シフトキーイング（「Ｍ−ＰＳＫ」）、Ｍ値直交振幅変調（「Ｍ−ＱＡＭ」）など）に基づいて、送信データプロセッサ６８２によって変調（すなわち、シンボルマッピング）され得る。特定のインプリメンテーションでは、コーディングされたデータおよび他のデータは、異なる変調方式を使用して変調され得る。各データストリームについてのデータレート、コーディング、および変調は、プロセッサ６０６によって実行される命令によって決定され得る。

[0115]送信ＭＩＭＯプロセッサ６８４は、送信データプロセッサ６８２から変調シンボルを受信するように構成され得、変調シンボルをさらに処理し得、データに対してビームフォーミングを実行し得る。例えば、送信ＭＩＭＯプロセッサ６８４は、変調シンボルにビームフォーミング重みを適用し得る。ビームフォーミング重みは、変調シンボルが送信されるアンテナのアレイのうちの１つまたは複数のアンテナに対応し得る。

[0116]動作中、基地局６００の第２のアンテナ６４４は、データストリーム６１４を受信し得る。第２のトランシーバ６５４は、第２のアンテナ６４４からデータストリーム６１４を受信し得、復調器６６２にデータストリーム６１４を提供し得る。復調器６６２は、データストリーム６１４の変調された信号を復調し、復調されたデータを受信機データプロセッサ６６４に提供し得る。受信機データプロセッサ６６４は、復調されたデータからオーディオデータを抽出し、抽出されたオーディオデータをプロセッサ６０６に提供し得る。

[0117]プロセッサ６０６は、オーディオデータを、トランスコードするためにトランスコーダ６１０に提供し得る。トランスコーダ６１０のデコーダ６３８は、オーディオデータを第１のフォーマットから復号されたオーディオデータに復号し得、エンコーダ６３６は、復号されたオーディオデータを第２のフォーマットに符号化し得る。いくつかのインプリメンテーションでは、エンコーダ６３６は、ワイヤレスデバイスから受信されたものより高いデータレート（例えば、アップコンバート）またはそれより低いデータレート（例えば、ダウンコンバート）を使用して、オーディオデータを符号化し得る。他のインプリメンテーションでは、オーディオデータは、トランスコードされない場合がある。トランスコーディング（例えば、復号および符号化）は、トランスコーダ６１０によって実行されるものとして例示されているが、トランスコーディング動作（例えば、復号および符号化）は、基地局６００の複数の構成要素によって実行され得る。例えば、復号は、受信機データプロセッサ６６４によって実行され得、符号化は、送信データプロセッサ６８２によって実行され得る。他のインプリメンテーションでは、プロセッサ６０６は、別の送信プロトコル、コーディング方式、またはその両方への変換のために、メディアゲートウェイ６７０にオーディオデータを提供し得る。メディアゲートウェイ６７０は、変換されたデータを、ネットワーク接続６６０を介して別の基地局またはコアネットワークに提供し得る。

[0118]トランスコードされたデータなどの、エンコーダ６３６において生成される符号化されたオーディオデータは、プロセッサ６０６を介して送信データプロセッサ６８２またはネットワーク接続６６０に提供され得る。トランスコーダ６１０からのトランスコードされたオーディオデータは、変調シンボルを生成するために、ＯＦＤＭなどの変調方式に従ってコーディングするために、送信データプロセッサ６８２に提供され得る。送信データプロセッサ６８２は、さらなる処理およびビームフォーミングのために、送信ＭＩＭＯプロセッサ６８４に変調シンボルを提供し得る。送信ＭＩＭＯプロセッサ６８４は、ビームフォーミング重みを適用し得、第１のトランシーバ６５２を介して、第１のアンテナ６４２などの、アンテナのアレイのうちの１つまたは複数のアンテナに変調シンボルを提供し得る。したがって、基地局６００は、ワイヤレスデバイスから受信されたデータストリーム６１４に対応するトランスコードされたデータストリーム６１６を、別のワイヤレスデバイスに提供し得る。トランスコードされたデータストリーム６１６は、データストリーム６１４とは異なる符号化フォーマット、データレート、またはその両方を有し得る。他のインプリメンテーションでは、トランスコードされたデータストリーム６１６は、別の基地局またはコアネットワークへの送信のために、ネットワーク接続６６０に提供され得る。

[0119]特定のインプリメンテーションでは、本明細書で開示されたシステムおよびデバイスの１つまたは複数の構成要素は、復号システムまたは装置（例えば、電子デバイス、ＣＯＤＥＣ、またはその中のプロセッサ）に一体化されるか、符号化システムまたは装置に一体化されるか、またはその両方であり得る。他のインプリメンテーションでは、本明細書で開示されたシステムおよびデバイスの１つまたは複数の構成要素は、ワイヤレス電話、タブレットコンピュータ、デスクトップコンピュータ、ラップトップコンピュータ、セットトップボックス、音楽プレーヤ、ビデオプレーヤ、エンターテインメントユニット、テレビ、ゲーム機、ナビゲーションデバイス、通信デバイス、携帯情報端末（ＰＤＡ）、固定ロケーションデータユニット、パーソナルメディアプレーヤ、または別のタイプのデバイスに一体化され得る。

[0120]説明された技法に関連して、装置が、符号化されたミッドチャンネルと、チャンネル間予測利得とを含むビットストリームを受信するための手段を含む。例えば、ビットストリームを受信するための手段は、図１および図５の受信機１６０、図１、図２、および図５のデコーダ１６２、図６のデコーダ６３８、１つまたは複数の他のデバイス、回路、モジュール、またはこれらの任意の組合せを含み得る。

[0121]装置はまた、復号された低帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの低帯域部分を復号するための手段を含む。例えば、符号化されたミッドチャンネルの低帯域部分を復号するための手段は、図１、図２、および図５のデコーダ１６２、図１〜図２の低帯域ミッドチャンネルデコーダ２０４、図５のＣＯＤＥＣ５０８、図５のプロセッサ５０６、プロセッサによって実行可能な命令５９１、図６のデコーダ６３８、１つまたは複数の他のデバイス、回路、モジュール、またはこれらの任意の組合せを含み得る。

[0122]装置はまた、低帯域フィルタリングされたミッドチャンネルを生成するために、１つまたは複数のフィルタ係数に従って、復号された低帯域ミッドチャンネルをフィルタリングするための手段を含む。例えば、復号された低帯域ミッドチャンネルをフィルタリングするための手段は、図１、図２、および図５のデコーダ１６２、図１〜図２の低帯域ミッドチャンネルフィルタ２１２、図５のＣＯＤＥＣ５０８、図５のプロセッサ５０６、プロセッサによって実行可能な命令５９１、図６のデコーダ６３８、１つまたは複数の他のデバイス、回路、モジュール、またはこれらの任意の組合せを含み得る。

[0123]装置はまた、低帯域フィルタリングされたミッドチャンネルと、チャンネル間予測利得とに基づいて、チャンネル間予測された信号を生成するための手段を含む。例えば、チャンネル間予測された信号を生成するための手段は、図１、図２、および図５のデコーダ１６２、図１〜図２のチャンネル間予測器２１４、図５のＣＯＤＥＣ５０８、図５のプロセッサ５０６、プロセッサによって実行可能な命令５９１、図６のデコーダ６３８、１つまたは複数の他のデバイス、回路、モジュール、またはこれらの任意の組合せを含み得る。

[0124]装置はまた、アップミックス係数と、復号された低帯域ミッドチャンネルと、チャンネル間予測された信号とに基づいて、低帯域左チャンネルおよび低帯域右チャンネルを生成するための手段を含む。例えば、低帯域左チャンネルおよび低帯域右チャンネルを生成するための手段は、図１、図２、および図５のデコーダ１６２、図１〜図２のアップミックスプロセッサ２２４、図５のＣＯＤＥＣ５０８、図５のプロセッサ５０６、プロセッサによって実行可能な命令５９１、図６のデコーダ６３８、１つまたは複数の他のデバイス、回路、モジュール、またはこれらの任意の組合せを含み得る。

[0125]装置はまた、復号された高帯域ミッドチャンネルを生成するために、符号化されたミッドチャンネルの高帯域部分を復号するための手段を含む。例えば、符号化されたミッドチャンネルの高帯域部分を復号するための手段は、図１、図２、および図５のデコーダ１６２、図１〜図２の高帯域ミッドチャンネルデコーダ２０２、図５のＣＯＤＥＣ５０８、図５のプロセッサ５０６、プロセッサによって実行可能な命令５９１、図６のデコーダ６３８、１つまたは複数の他のデバイス、回路、モジュール、またはこれらの任意の組合せを含み得る。

[0126]装置はまた、チャンネル間予測利得と、復号された高帯域ミッドチャンネルのフィルタリングされたバージョンとに基づいて、予測された高帯域サイドチャンネルを生成するための手段を含む。例えば、予測された高帯域サイドチャンネルを生成するための手段は、図１、図２、および図５のデコーダ１６２、図１〜図２の高帯域ミッドチャンネルフィルタ２０７、図１〜図２のチャンネル間予測マッパー２０８、図５のＣＯＤＥＣ５０８、図５のプロセッサ５０６、プロセッサによって実行可能な命令５９１、図６のデコーダ６３８、１つまたは複数の他のデバイス、回路、モジュール、またはこれらの任意の組合せを含み得る。

[0127]装置はまた、復号された高帯域ミッドチャンネルと、予測された高帯域サイドチャンネルとに基づいて、高帯域左チャンネルおよび高帯域右チャンネルを生成するための手段を含む。例えば、高帯域左チャンネルおよび高帯域右チャンネルを生成するための手段は、図１、図２、および図５のデコーダ１６２、図１〜図２のＩＣＢＷＥデコーダ２２６、図５のＣＯＤＥＣ５０８、図５のプロセッサ５０６、プロセッサによって実行可能な命令５９１、図６のデコーダ６３８、１つまたは複数の他のデバイス、回路、モジュール、またはこれらの任意の組合せを含み得る。

[0128]装置はまた、左チャンネルおよび右チャンネルを出力するための手段を含む。左チャンネルは、低帯域左チャンネルおよび高帯域左チャンネルに基づき得、右チャンネルは、低帯域右チャンネルおよび高帯域右チャンネルに基づき得る。例えば、出力するための手段は、図１のラウドスピーカ１４２、１４４、図５のスピーカ５４８、１つまたは複数の他のデバイス、回路、モジュール、またはこれらの任意の組合せを含み得る。

[0129]本明細書で開示されたシステムおよびデバイスの１つまたは複数の構成要素によって実行される様々な機能は、ある特定の構成要素またはモジュールによって実行されるものとして説明されていることに留意されたい。構成要素およびモジュールのこの分担は、例示のみのためのものである。代替のインプリメンテーションでは、特定の構成要素またはモジュールによって実行される機能は、複数の構成要素またはモジュールの間で分割され得る。さらに、代替のインプリメンテーションでは、２つ以上の構成要素またはモジュールが、単一の構成要素またはモジュールに一体化され得る。各構成要素またはモジュールは、ハードウェア（例えば、フィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）、ＤＳＰ、コントローラなど）、ソフトウェア（例えば、プロセッサによって実行可能な命令）、またはこれらの任意の組合せを使用してインプリメントされ得る。

[0130]当業者であれば、本明細書で開示されたインプリメンテーションに関連して説明された様々な例示的な論理ブロック、構成、モジュール、回路、およびアルゴリズムステップは、電子ハードウェア、ハードウェアプロセッサなどの処理デバイスによって実行されるコンピュータソフトウェア、または両方の組合せとしてインプリメントされ得ることをさらに理解するであろう。様々な例示的な構成要素、ブロック、構成、モジュール、回路、およびステップは、概してそれらの機能の観点から上記で説明された。このような機能が、ハードウェアとしてインプリメントされるか、または実行可能なソフトウェアとしてインプリメントされるかは、特定のアプリケーションおよびシステム全体に課せられる設計制約に依存する。当業者は、特定のアプリケーションごとに多様な方法において、説明された機能をインプリメントし得るが、このようなインプリメンテーションの決定は、本開示の範囲から逸脱を引き起こしていると解釈されるべきでない。

[0131]本明細書で開示されたインプリメンテーションに関連して説明された方法またはアルゴリズムのステップは、直接ハードウェアにおいて、プロセッサによって実行されるソフトウェアモジュールにおいて、またはこれら２つの組合せにおいて具現化され得る。ソフトウェアモジュールは、ランダムアクセスメモリ（ＲＡＭ）、磁気抵抗ランダムアクセスメモリ（ＭＲＡＭ）、スピン注入ＭＲＡＭ（ＳＴＴ−ＭＲＡＭ）、フラッシュメモリ、読取専用メモリ（ＲＯＭ）、プログラマブル読取専用メモリ（ＰＲＯＭ）、消去可能なプログラマブル読取専用メモリ（ＥＰＲＯＭ）、電気的に消去可能なプログラマブル読取専用メモリ（ＥＥＰＲＯＭ）、レジスタ、ハードディスク、リムーバブルディスク、またはコンパクトディスク読取専用メモリ（ＣＤ−ＲＯＭ）などの、メモリデバイス内に存在し得る。例示的なメモリデバイスは、プロセッサがメモリデバイスから情報を読み取り、また、メモリデバイスに情報を書き込み得るように、プロセッサに結合される。代替として、メモリデバイスは、プロセッサと一体化され得る。プロセッサおよび記憶媒体は、特定用途向け集積回路（ＡＳＩＣ）内に存在し得る。ＡＳＩＣは、コンピューティングデバイスまたはユーザ端末内に存在し得る。代替として、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末内に個別の構成要素として存在し得る。

[0132]開示されたインプリメンテーションの先の説明は、当業者が開示されたインプリメンテーションを製造または使用することを可能にするように提供される。これらのインプリメンテーションへの様々な変更は、当業者には容易に明らかとなり、本明細書で定義した原理は、本開示の範囲から逸脱することなく、他のインプリメンテーションに適用され得る。したがって、本開示は、本明細書で示されたインプリメンテーションに限定されるようには意図されず、以下の特許請求の範囲によって定義される原理および新規の特徴と一致する最も広い範囲を与えられることとなる。

Claims

符号化されたミッドチャンネルと、チャンネル間予測利得とを含むビットストリームを受信するように構成された受信機と、
復号された低帯域ミッドチャンネルを生成するために、前記符号化されたミッドチャンネルの低帯域部分を復号するように構成された低帯域ミッドチャンネルデコーダと、
低帯域フィルタリングされたミッドチャンネルを生成するために、１つまたは複数のフィルタ係数に従って、前記復号された低帯域ミッドチャンネルをフィルタリングするように構成された低帯域ミッドチャンネルフィルタと、
前記低帯域フィルタリングされたミッドチャンネルと、前記チャンネル間予測利得とに基づいて、チャンネル間予測された信号を生成するように構成されたチャンネル間予測器と、
アップミックス係数と、前記復号された低帯域ミッドチャンネルと、前記チャンネル間予測された信号とに基づいて、低帯域左チャンネルおよび低帯域右チャンネルを生成するように構成されたアップミックスプロセッサと、
復号された高帯域ミッドチャンネルを生成するために、前記符号化されたミッドチャンネルの高帯域部分を復号するように構成された高帯域ミッドチャンネルデコーダと、
前記チャンネル間予測利得と、前記復号された高帯域ミッドチャンネルのフィルタリングされたバージョンとに基づいて、予測された高帯域サイドチャンネルを生成するように構成されたチャンネル間予測マッパーと、
前記復号された高帯域ミッドチャンネルと、前記予測された高帯域サイドチャンネルとに基づいて、高帯域左チャンネルおよび高帯域右チャンネルを生成するように構成されたチャンネル間帯域幅拡張デコーダと
を備えるデバイス。
前記ビットストリームはまた、サイドチャンネル予測誤差のインジケーションを含み、前記低帯域左チャンネルおよび前記低帯域右チャンネルは、前記サイドチャンネル予測誤差に基づいてさらに生成される、請求項１に記載のデバイス。
前記チャンネル間予測利得は、エンコーダ側のサイドチャンネルが、予測されたサイドチャンネルに実質的に等しくなるように、エンコーダにおいて閉ループ解析を使用して推定され、前記予測されたサイドチャンネルは、前記チャンネル間予測利得とエンコーダ側のフィルタリングされたミッドチャンネルとの積に基づく、請求項１に記載のデバイス。
エンコーダ側のミッドチャンネルが、前記エンコーダ側のフィルタリングされたミッドチャンネルを生成するために、前記１つまたは複数のフィルタ係数に従ってフィルタリングされる、請求項３に記載のデバイス。
前記サイドチャンネル予測誤差は、前記エンコーダ側のサイドチャンネルと前記予測されたサイドチャンネルとの間の差に対応する、請求項３に記載のデバイス。
前記チャンネル間予測利得は、エンコーダにおいて閉ループ解析を使用して推定され、これにより、エンコーダ側のサイドチャンネルの高周波部分が、予測されたサイドチャンネルの高周波部分に実質的に等しくなり、前記予測されたサイドチャンネルの前記高周波部分は、前記チャンネル間予測利得とエンコーダ側のミッドチャンネルの高周波部分との積に基づく、請求項１に記載のデバイス。
前記低帯域フィルタリングされたミッドチャンネルは、前記復号された低帯域ミッドチャンネルの適応コードブック成分、または前記復号された低帯域ミッドチャンネルの帯域幅拡張されたバージョンを含む、請求項１に記載のデバイス。
左チャンネルを生成するために、前記低帯域左チャンネルと前記高帯域左チャンネルを組み合わせるように構成された第１の組合せ回路と、
右チャンネルを生成するために、前記低帯域右チャンネルと前記高帯域右チャンネルを組み合わせるように構成された第２の組合せ回路と
をさらに備える、請求項１に記載のデバイス。
前記左チャンネルおよび前記右チャンネルを出力するように構成された出力デバイスをさらに備える、請求項８に記載のデバイス。
前記チャンネル間帯域幅拡張デコーダは、
高帯域残差チャンネルを生成するために、前記予測された高帯域サイドチャンネルに残差予測利得を適用するように構成された高帯域残差生成ユニットと、
高帯域基準チャンネルを生成するために、前記復号された高帯域ミッドチャンネルと前記高帯域残差チャンネルとを組み合わせるように構成された第３の組合せ回路と
を備える、請求項１に記載のデバイス。
前記チャンネル間帯域幅拡張デコーダは、
スペクトル的にマッピングされた高帯域ミッドチャンネルを生成するために、前記復号された高帯域ミッドチャンネルに対して第１のスペクトルマッピング動作を実行するように構成された第１のスペクトルマッパーと、
第１の高帯域利得マッピングされたチャンネルを生成するために、前記スペクトル的にマッピングされた高帯域ミッドチャンネルに対して第１の利得マッピング動作を実行するように構成された第１の利得マッパーと
をさらに備える、請求項１０に記載のデバイス。
前記チャンネル間帯域幅拡張デコーダは、
スペクトル的にマッピングされた高帯域残差チャンネルを生成するために、前記高帯域残差チャンネルに対して第２のスペクトルマッピング動作を実行するように構成された第２のスペクトルマッパーと、
第２の高帯域利得マッピングされたチャンネルを生成するために、前記スペクトル的にマッピングされた高帯域残差チャンネルに対して第２の利得マッピング動作を実行するように構成された第２の利得マッパーと
をさらに備える、請求項１１に記載のデバイス。
前記チャンネル間帯域幅拡張デコーダは、
高帯域ターゲットチャンネルを生成するために、前記第１の高帯域利得マッピングされたチャンネルと前記第２の高帯域利得マッピングされたチャンネルとを組み合わせるように構成された第４の組合せ回路と、
基準チャンネルインジケータを受信することと、
前記基準チャンネルインジケータに基づいて、
前記高帯域左チャンネルとして、前記高帯域基準チャンネルまたは前記高帯域ターゲットチャンネルのうちの一方を指定することと、
前記高帯域右チャンネルとして、前記高帯域基準チャンネルまたは前記高帯域ターゲットチャンネルのうちの他方を指定することと
を行うように構成されたチャンネルセレクタと
をさらに備える、請求項１２に記載のデバイス。
前記復号された高帯域ミッドチャンネルの前記フィルタリングされたバージョンを生成するために、前記復号された高帯域ミッドチャンネルをフィルタリングするように構成された高帯域ミッドチャンネルフィルタをさらに備える、請求項１に記載のデバイス。
前記高帯域ミッドチャンネルフィルタおよび前記低帯域ミッドチャンネルフィルタは、単一の構成要素に一体化される、請求項１４に記載のデバイス。
前記低帯域ミッドチャンネルデコーダ、前記ミッドチャンネルデコーダ、前記ミッドチャンネルフィルタ、前記アップミックスプロセッサ、前記高帯域ミッドチャンネルデコーダ、前記チャンネル間予測マッパー、および前記チャンネル間帯域幅拡張デコーダは、基地局に一体化される、請求項１に記載のデバイス。
前記低帯域ミッドチャンネルデコーダ、前記ミッドチャンネルデコーダ、前記ミッドチャンネルフィルタ、前記アップミックスプロセッサ、前記高帯域ミッドチャンネルデコーダ、前記チャンネル間予測マッパー、および前記チャンネル間帯域幅拡張デコーダは、モバイルデバイスに一体化される、請求項１に記載のデバイス。
符号化されたミッドチャンネルと、チャンネル間予測利得とを含むビットストリームを受信することと、
復号された低帯域ミッドチャンネルを生成するために、前記符号化されたミッドチャンネルの低帯域部分を復号することと、
低帯域フィルタリングされたミッドチャンネルを生成するために、１つまたは複数のフィルタ係数に従って、前記復号された低帯域ミッドチャンネルをフィルタリングすることと、
前記低帯域フィルタリングされたミッドチャンネルと、前記チャンネル間予測利得とに基づいて、チャンネル間予測された信号を生成することと、
アップミックス係数と、前記復号された低帯域ミッドチャンネルと、前記チャンネル間予測された信号とに基づいて、低帯域左チャンネルおよび低帯域右チャンネルを生成することと、
復号された高帯域ミッドチャンネルを生成するために、前記符号化されたミッドチャンネルの高帯域部分を復号することと、
前記チャンネル間予測利得と、前記復号された高帯域ミッドチャンネルのフィルタリングされたバージョンとに基づいて、予測された高帯域サイドチャンネルを生成することと、
前記復号された高帯域ミッドチャンネルと、前記予測された高帯域サイドチャンネルとに基づいて、高帯域左チャンネルおよび高帯域右チャンネルを生成することと
を備える方法。
前記チャンネル間予測利得は、エンコーダ側のサイドチャンネルが、予測されたサイドチャンネルに実質的に等しくなるように、エンコーダにおいて閉ループ解析を使用して推定され、前記予測されたサイドチャンネルは、前記チャンネル間予測利得とエンコーダ側のフィルタリングされたミッドチャンネルとの積に基づく、請求項１８に記載の方法。
エンコーダ側のミッドチャンネルが、前記エンコーダ側のフィルタリングされたミッドチャンネルを生成するために、前記１つまたは複数のフィルタ係数に従ってフィルタリングされる、請求項１９に記載の方法。
前記サイドチャンネル予測誤差は、前記エンコーダ側のサイドチャンネルと前記予測されたサイドチャンネルとの間の差に対応する、請求項１９に記載の方法。
前記チャンネル間予測利得は、エンコーダにおいて閉ループ解析を使用して推定され、これにより、エンコーダ側のサイドチャンネルの高周波部分が、予測されたサイドチャンネルの高周波部分に実質的に等しくなり、前記予測されたサイドチャンネルの前記高周波部分は、前記チャンネル間予測利得とエンコーダ側のミッドチャンネルの高周波部分との積に基づく、請求項１８に記載の方法。
前記低帯域フィルタリングされたミッドチャンネルは、前記復号された低帯域ミッドチャンネルの適応コードブック成分、または前記復号された低帯域ミッドチャンネルの帯域幅拡張されたバージョンを含む、請求項１８に記載の方法。
左チャンネルを生成するために、前記低帯域左チャンネルと前記高帯域左チャンネルを組み合わせることと、
右チャンネルを生成するために、前記低帯域右チャンネルと前記高帯域右チャンネルを組み合わせることと
をさらに備える、請求項１８に記載の方法。
前記左チャンネルおよび前記右チャンネルを出力することをさらに備える、請求項２４に記載の方法。
前記低帯域左チャンネルおよび前記低帯域右チャンネルを生成することは、基地局において実行される、請求項１８に記載の方法。
前記低帯域左チャンネルおよび前記低帯域右チャンネルを生成することは、モバイルデバイスにおいて実行される、請求項１８に記載の方法。
命令を備える非一時的なコンピュータ可読媒体であって、前記命令は、デコーダ内のプロセッサによって実行されると、前記プロセッサに、
符号化されたミッドチャンネルと、チャンネル間予測利得とを含むビットストリームを受信することと、
復号された低帯域ミッドチャンネルを生成するために、前記符号化されたミッドチャンネルの低帯域部分を復号することと、
低帯域フィルタリングされたミッドチャンネルを生成するために、１つまたは複数のフィルタ係数に従って、前記復号された低帯域ミッドチャンネルをフィルタリングすることと、
前記低帯域フィルタリングされたミッドチャンネルと、前記チャンネル間予測利得とに基づいて、チャンネル間予測された信号を生成することと、
アップミックス係数と、前記復号された低帯域ミッドチャンネルと、前記チャンネル間予測された信号とに基づいて、低帯域左チャンネルおよび低帯域右チャンネルを生成することと、
復号された高帯域ミッドチャンネルを生成するために、前記符号化されたミッドチャンネルの高帯域部分を復号することと、
前記チャンネル間予測利得と、前記復号された高帯域ミッドチャンネルのフィルタリングされたバージョンとに基づいて、予測された高帯域サイドチャンネルを生成することと、
前記復号された高帯域ミッドチャンネルと、前記予測された高帯域サイドチャンネルとに基づいて、高帯域左チャンネルおよび高帯域右チャンネルを生成することと
を備える動作を実行させる、非一時的なコンピュータ可読媒体。
符号化されたミッドチャンネルと、チャンネル間予測利得とを含むビットストリームを受信するための手段と、
復号された低帯域ミッドチャンネルを生成するために、前記符号化されたミッドチャンネルの低帯域部分を復号するための手段と、
低帯域フィルタリングされたミッドチャンネルを生成するために、１つまたは複数のフィルタ係数に従って、前記復号された低帯域ミッドチャンネルをフィルタリングするための手段と、
前記低帯域フィルタリングされたミッドチャンネルと、前記チャンネル間予測利得とに基づいて、チャンネル間予測された信号を生成するための手段と、
アップミックス係数と、前記復号された低帯域ミッドチャンネルと、前記チャンネル間予測された信号とに基づいて、低帯域左チャンネルおよび低帯域右チャンネルを生成するための手段と、
復号された高帯域ミッドチャンネルを生成するために、前記符号化されたミッドチャンネルの高帯域部分を復号するための手段と、
前記チャンネル間予測利得と、前記復号された高帯域ミッドチャンネルのフィルタリングされたバージョンとに基づいて、予測された高帯域サイドチャンネルを生成するための手段と、
前記復号された高帯域ミッドチャンネルと、前記予測された高帯域サイドチャンネルとに基づいて、高帯域左チャンネルおよび高帯域右チャンネルを生成するための手段と
を備える装置。
前記ビットストリームはまた、サイドチャンネル予測誤差のインジケーションを含み、前記低帯域左チャンネルおよび前記低帯域右チャンネルは、前記サイドチャンネル予測誤差に基づいてさらに生成される、請求項２９に記載の装置。