JP5559304B2

JP5559304B2 - フィルタバンクを実装する方法及びフィルタバンクデバイス

Info

Publication number: JP5559304B2
Application number: JP2012506178A
Authority: JP
Inventors: チブクラ、ラビ・キラン; レズニク、ユリー
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2009-04-14
Filing date: 2010-04-14
Publication date: 2014-07-23
Anticipated expiration: 2030-04-14
Also published as: JP2012524301A; WO2010120924A1; TW201118861A; CN102388418B; KR101286329B1; US8392200B2; US20100262427A1; KR20120018324A; CN102388418A; EP2419901A1

Description

下記の説明は、一般的にはエンコーダとデコーダに関し、具体的には、ＨＥ-ＡＡＣ（High-Efficiency Advance Audio Coding)、ＥＬＤ（Enhanced Low-Delay)、ＳＡＯＣ（Spatial Audio Codec)、およびＵＳＡＣ（Unified Speech and Audio Codec)のような音声コーデックのＭＰＥＧファミリの計算的に効率の良いフィルタバンク構造に関する。
[米国特許法の下の優先権主張]
本願は、２００９年４月１７日に出願され、ここでの譲受人に譲渡され、ここにおける参照によりここで組み込まれる「Fast SBR filterbanks for AAC-ELD, HE-AAC, and USAC」と題された米国仮出願番号第６１／１６９，１３２号の優先権を主張する。

音声コーディングの１つの目標は、可能な限り多くオリジナルサウンド品質を維持しながら、オーディオ信号を望ましい限定情報へと圧縮することである。エンコーディング処理過程では、時間領域における入力オーディオ信号は、周波数領域オーディオ信号へと変換され、対応するデコーディング処理過程は、その周波数領域オーディオ信号を時間領域における出力オーディオ信号へと変換することによってこのような動作を逆にする。

音声コーデックは、人間の聴覚系の心理音響的特徴(psychoacoustic characteristics of the human auditory system)をモデル化することに基づくことができる。例えば、オーディオ信号は、いくつかの周波数帯域へと分割されることができ、人間の耳のマスキング性質は、心理音響的冗長度を取り除くために使用されることができる。したがって、音声コーデックは、一般的に、圧縮用の変換コーディング技術に依存する。音声コーデックは、一般的に低ビットレートでいずれの一般的なオーディオ材料(audio material)をコード化するのに適切である。複数の音声コーデックは良好な周波数選択性に関してより長いフレーム長さで動作するので、また、それらは直交フィルタバンクを一般的に使用するので、それらの往復のアルゴリズム的な遅延は大きい、そしてそのことは、それらを全２重通信に関して不適切にする。しかしながら、高品質で、低ビットレートの、全２重オーディオ通信アプリケーション(例えば、電話会議とテレビ会議)の必要性が増大している。

ＭＰＥＧは、全２重通信にとって十分に低いコーデック遅延を維持しながらコーディング効率を改善することを試みるＭＰＥＧ-４ＡＡＣ（Advance Audio Coding)-ＥＬＤ（Enhanced Low Delay)と呼ばれる低遅延音声コーデックを規格化した。ＡＡＣは、２つのプライマリコーディング戦術を活用して、高品質デジタルオーディオを表すのに必要なデータの量を劇的に減らす、広帯域音声コーディング・アルゴリズムである。第１に、知覚的に無関係である信号成分が廃棄され、第２に、コード化されたオーディオ信号において冗長度が削除される。

コーディング効率は、スペクトル帯域複製(Spectral Band Replication)（ＳＢＲ）を使用することによって増大される。導入された遅延を最小化するために、解析および合成ＳＢＲフィルタバンクの低遅延バージョンが使用される。しばしば、これらの音声コーデックは、処理電力およびバッテリー寿命が制限されるモバイルプラットフォーム上で、動作することができる。したがって、音声コーデックの計算的に負荷の高い演算(computationally intensive operations)のための高速アルゴリズムの必要性がある。一般的に、フィルタバンクおよび変換は、計算の複雑さのかなりの部分(significant part)に寄与している。ＡＡＣ−ＥＬＤで使用される低遅延ＳＢＲ（ＬＤ−ＳＢＲ）の場合、対応する行列乗算の演算は、最も計算的に大きいインテンシブ部分のうちの１つであることができる。

したがって、計算効率の良いフィルタバンクは、音声コーデックにおける遅延および/または計算の複雑さを減らすために必要とされる。

以下は、いくつかの実施形態の基本的な理解を提供するために、1つまたは複数の実施形態の簡略な概要(summary)を示す。この概要は、すべての熟考された実施形態の広範囲な全体像ではなく、すべての実施形態の重要なあるいは決定的なエレメントを識別することも、あるいは、いずれあるいはすべての実施形態の範囲を詳細に描写することも、意図されていない。その唯一の目的は、後で示される、より詳細な説明の前置きとして、簡略化された形で1つまたは複数の実施形態のいくつかの概念を示すことである。

変換値を計算するためのエンコーディング方法および/またはデバイスが提供される。オーディオ信号を表している時間領域入力値が受信される。時間領域入力値は、例えば離散コサイン変換(ＤＣＴ)を使用して、周波数領域(例えば、実数成分と虚数成分)出力値へと変換されることができる。

変換値を計算するためのデコーディング方法および/またはデバイスが提供される。オーディオ信号を表しているスペクトル係数(Spectral coefficient)が受信される。スペクトル係数は、例えば逆離散コサイン変換(ＩＤＣＴ)を使用して、時間領域出力値へと変換されることができる。

離散コサイン変換は、部分的に、実用的に重要である、なぜならば、離散コサイン変換は、それらの変換行列の因子分解の手段によって非常に効率の良い計算を可能にするからである。したがって、一般的なＮ×Ｎ行列によるＮ点ベクトルの乗算がＯ（Ｎ^２）乗算および加算を要する場合には、適切に因子分解されたＤＣＴ行列によるベクトルの積の計算は、通常、Ｏ（ＮｌｏｇＮ）乗算および／または加算のみを要する。

実際、タイプＩＩの離散コサイン変換とタイプＩＶのＤＣＴが最も一般的に使用されるまたはインプリメントされる。タイプＩＶのＤＣＴは、強制(involuntary)であるというさらなる利点を有する、すなわち、順方向変換と逆変換の双方に対して同じ変換行列を有す。ＤＣＴ−ＩＩおよび／またはＤＣＴ−ＩＶは便利であるが、実際には、基底関数(basis functions)がＤＣＴ−ＩＩまたはＤＣＴ−ＩＶのものと厳密に整合しないフィルタバンクを実装する必要性がしばしば生じる。このことは、例えばＡＡＣ−ＥＬＤコーデック、または、ＨＥ−ＡＡＣコーデック、またはＳＡＯＣコーデックのＳＢＲフィルタバンクにおけるもの、のような低遅延フィルタバンクの設計において生じる。結果、ＤＣＴ−ＩＩまたはＤＣＴ−ＩＶ変換を使用することにより、さまざまなコーデックについてのＳＢＲフィルタバンクのクラスを計算することを可能にする技術がここにおいて開示されている。このような計算は、ＳＢＲフィルタバンクの複雑さの大幅な縮小をもたらす。

複素解析フィルタバンク(complex analysis filterbank)のようなフィルタバンクを実装するための方法および／装置が提供される。入力オーディオ信号は、複数のＮ個の時間領域入力サンプルとして得られる。時間領域入力サンプルのペア毎の加算および減算は、第１グループおよび第２グループの中間サンプルを得るために実行される、なお、各グループは、Ｎ／２個の中間サンプルを有する。第１グループの出力係数は、実数の係数から成ることができ、第２グループの出力係数は、虚数の係数から成ることができる。第２グループにおける奇数インデクス付けされた中間サンプルの符号は、反転される。第１の変換は、周波数領域において第１グループの出力係数を得るために、第１グループの中間サンプルに対して適用される。第２の変換は、周波数領域において中間第２グループの出力係数を得るために、第２グループの中間サンプルに対して適用される。第１の変換および第２の変換は、第１グループおよび第２グループの中間サンプルを変換するために同時に動作しうる。第１の変換と第２の変換は、双方とも、離散コサイン変換（ＤＣＴ）タイプＩＶ変換でありうる。解析フィルタバンクは、分子に（２ｎ±ｘ）の因数を有する式で表されることができる、ここにおいて、ｘは奇数である。中間第２グループの出力係数における係数の順序(order of coefficients in the intermediate second group of output coefficients)は、第２グループの出力係数を得るために、逆にされる。使用される時間領域入力サンプルは実数領域内のサンプルであってもよく、周波数領域は複素領域であってもよい。様々な実装では、フィルタバンクは、例えば解析直交ミラーフィルタバンク、音声エンコーダーおよび/またはデコーダの一部分、および/または、スペクトル帯域複製（ＳＢＲ）エンコーダおよび/またはデコーダの一部分、であってもよい。音声エンコーダーおよび/またはデコーダは、ＭＰＥＧＡＡＣ−ＥＬＤ（Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭ
ＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する。

複素合成フィルタバンク(complex synthesis filterbank)のようなフィルタバンクを実装するための方法および／または装置が提供される。複数のＮ個の入力係数は、周波数領域においてオーディオ信号について得られることができる、なお、第１グループのＮ／２個の入力係数は実数成分であり、第２グループのＮ／２個の入力係数は虚数成分であり、第２グループにおける奇数インデクス付けされたサンプルの符号は、第２グループにおいて偶数インデクス付けされた係数に関連して反転される。第１グループの入力係数は、実数の係数から成ることができ、第２グループの入力係数は、虚数の係数から成ることができる。第１の逆変換は、時間領域において中間第１グループの出力サンプルを得るために、第１グループの入力係数に対して適用されることができる。第２の逆変換は、時間領域において中間第２グループの出力サンプルを得るために、第２グループの入力係数に対して適用されることができる。第１の逆変換と第２の逆変換は、第１グループおよび第２グループの入力係数を変換するために同時に動作しうる。第１の逆変換と第２の逆変換は、双方とも、逆離散コサイン変換（ＩＤＣＴ）タイプＩＶ変換であってもよい。フィルタバンクは、分子に（２ｎ±ｘ）の因数を有する式で表されることができる、ここにおいて、ｘは奇数である。中間第１グループの入力係数からの中間第２グループの入力係数のペア毎の減算は、複数のＮ個の時間領域出力サンプルを得るために、実行されることができる。周波数領域は複素領域であってもよく、時間領域サンプルは実数領域内のサンプルである。様々な実装では、フィルタバンクは、例えば、合成直交ミラーフィルタバンク、音声デコーダーの一部分、および/または、スペクトル帯域複製（ＳＢＲ）デコーダの一部分、であってもよい。音声デコーダーは、ＭＰＥＧ-４ＡＡＣ（Advance Audio Coding)-ＥＬＤ（Low Delay)標準規格、ＭＰＥＧ-４ＡＡＣ−ＥＬＤ（Enhanced Low Delay)標準規格、およびＭＰＥＧ-４ＭＰＥＧ-４ＨＥ（High Efficiency)-ＡＡＣ標準規格、のうちの少なくとも１つを実装することができる。

実解析フィルタバンク(real analysis filterbank)のようなフィルタバンクを実装するための方法および／装置が提供される。入力オーディオ信号は、複数のＮ個の時間領域入力サンプルとして得られる。時間領域入力サンプルのペア毎の加算および減算は、１グループのＮ／２個の中間サンプルを得るために実行されることができる。変換は、周波数領域においてＮ／２個の出力係数を得るために、１グループのＮ／２個の中間サンプルに対して適用されることができる。時間領域入力サンプルと周波数領域係数の双方は、実数であってもよい。変換は、離散コサイン変換（ＤＣＴ）タイプＩＶ変換であってもよい。フィルタバンクは、分子に（２ｎ±ｘ）の因数を有する式で表されることができる、ここにおいて、ｘは奇数である。フィルタバンクは、例えば、解析直交ミラーフィルタバンク、音声エンコーダーおよび／またはデコーダの一部分、および／または、スペクトル帯域複製（ＳＢＲ）エンコーダおよび／またはデコーダでの一部分であってもよい。音声エンコーダーおよび/またはデコーダは、ＭＰＥＧＡＡＣ−ＥＬＤ（Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも１つを実装することができる。

実合成フィルタバンク(real synthesis filterbank)のようなフィルタバンクを実装するための方法および／装置が提供される。複数のＮ／２個の入力係数は、周波数領域においてオーディオ信号について得られる。逆変換は、時間領域において中間グループのＮ出力サンプルを得るために、１グループのＮ／２個の入力係数に対して適用される。係数の複製操作(replication)、符号反転(sign inversion)、および並び替え(reordering)は、複数のＮ個の時間領域出力サンプルを得るために、中間グループのＮ個の入力係数に関して実行されることができる。入力係数および時間領域出力サンプルの双方は、実数（すなわち実数領域）であることができる。逆変換は、離散コサイン変換（ＤＣＴ）タイプＩＶ変換である。フィルタバンクは、分子に（２ｎ±ｘ）の因子を有する式で表される、ここにおいて、ｘは奇数である。様々な実装では、フィルタバンクは、例えば、合成直交ミラーフィルタバンク、音声デコーダーの一部分、および／または、スペクトル帯域複製（ＳＢＲ）デコーダの一部分、であってもよい。音声デコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ（Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する。

様々な特徴、性質、及び利益は、同様な参照数字が全体にわたって対応して識別する図面と併せるとき、下記に記載される詳細な説明からより明らかとなるであろう。

図１は無線ネットワーク上の通信に適合されたモバイルデバイスの例を図示するブロック図である。図２は、効率的な解析フィルタバンクを含むことができるＡＡＣ−ＥＬＤエンコーダの例を図示するブロック図である。図３は、効率的な解析フィルタバンクおよび／または効率的な合成フィルタバンクを含むことができるＡＡＣ−ＥＬＤデコーダの例を図示するブロック図である。図４は、効率的な複素解析フィルタバンクの例を図示する。図５は、一例による解析フィルタバンクを実装するための方法を図示する。図６は、一例による解析フィルタバンクを実装するための関数コンポーネントを図示するブロック図である。図７は、効率的な複素合成フィルタバンクの例を図示する。図８は、一例による合成フィルタバンクを実装する方法を図示する。図９は、一例による合成フィルタバンクを実装するための関数コンポーネントを図示するブロック図である。図１０は、効率的な実領域解析フィルタバンクの例を図示する。図１１は、一例による解析フィルタバンクを実装するための方法を図示する。図１２は、一例による解析フィルタバンクを実装するための関数コンポーネントを図示するブロック図である。図１３は、効率的な実領域合成フィルタバンクの例を図示する。図１４は、一例による合成フィルタバンクを実装するための方法を図示する。図１５は、一例による合成フィルタバンクを実装するための関数コンポーネントを図示するブロック図である。

様々な実施形態は、図面を参照して説明され、同様な参照数字は、全体の同様な構成要素を参照するために使用される。下記の説明では、説明するために、多くの具体的な詳細が、1つまたは複数の実施形態の完全な理解を提供するために記載されている。しかしながら、そのような実施形態(単数または複数)がこれらの具体的な詳細なしで実行されるということは明らかでありうる。他の例では、よく知られた構造及びデバイスは、1つまたは複数の実施形態を説明することを容易にするためにブロック図で示されている。

音声コーデックを備えた例示的なモバイルデバイス(Exemplary Mobile Device with Audio Codec)
図１は、無線ネットワーク上の通信に適合されたモバイルデバイスの例を図示するブロック図である。モバイルデバイス１０２は、音声コーデック１０６と無線通信トランシーバ１０８に結合された処理回路１０４を含むことができる。無線通信トランシーバ１０８は、モバイルデバイスがアンテナ１１０を通じて無線で通信を送信および／または受信することを可能にする。音声コーデック１０６は、入力オーディオ信号１１４を受信するオーディオ入力デバイス１１２（例、マイクロフォン）と、オーディオ信号１１８を出力するオーディオ出力デバイス１１６（例、１つまたは複数のスピーカー）、に結合されることができる。

様々な例では、音声コーデック１０６は、時間領域入力オーディオ信号を受信し、そして、時間領域入力オーディオ信号を周波数領域出力信号へと変換することにより、それを効率的にエンコードするように適合されたエンコーダ１２０を含むことができる。周波数領域出力信号は、モバイルデバイスによって保存され、オーディオ出力デバイスを介してモバイルデバイスによってプレイバックされ、および／または、無線通信トランシーバ１０８上で送信されることができる。さらに、音声コーデック１０６はまた、それを再構築された時間領域オーディオ信号へと変換することによって周波数領域オーディオ信号をデコードするように適合されたデコーダ１２２を含むことができる。そのあとで、再構築された時間領域オーディオ信号は、オーディオ出力デバイス１１６を介してモバイルデバイスによってプレイバックされることができる。様々な例では、音声コーデック１０６は、特にＭＰＥＧＡＡＣ-ＥＬＤ（Enhanced Low Delay)標準規格および/またはＭＰＥＧＨＥ（High Efficiency)-ＡＡＣ標準規格にしたがって動作するように構成されることができる。

１つの特徴によれば、音声コーデック１０６は、エンコーダおよび/またはデコーダの効率的な実装を含むことができる。

例示的なエンコーダ構造(Exemplary Encoder Structure)
図２は、効率的な解析フィルタバンクを含むことができるＡＡＣ−ＥＬＤエンコーダの例を図示するブロック図である。ＡＡＣ−ＥＬＤエンコーダ２０２は、入力オーディオ信号２０４を受信することができる。ダウンサンプラ２０６は、その入力オーディオ信号２０４をダウンサンプリングして、そのサンプリングレートを減らすことができる。ダウンサンプリングされた入力オーディオ信号２０４は、ＡＡＣ−ＥＬＤコアエンコーダ２０８へと受け渡し、ＡＡＣ−ＥＬＤコアエンコーダ２０８は、オーディオ信号を圧縮し、オーディオ信号はそのあとで、ビットストリームフォーマッタ２１０によってビットストリームへとフォーマット化されて、エンコードされたオーディオビットストリーム２１２を生成する。

ＡＡＣエンコーダ２０８に加え、エンコーダ２０２はまた、低遅延（ＬＤ）スペクトル帯域複製（ＳＢＲ）エンコーダ２１４を含むことができる。スペクトル帯域複製は、特に低ビットレートで、音声コーデックまたはスピーチコーデックを強化するために使用されることができ、周波数領域内のハーモニック冗長度(harmonic redundancy)に基づいている。ＳＢＲは、いずれの音声圧縮コーデックとも組み合わせられることができる：コーデック自体は、スペクトラムのより低いまたは中間の周波数を送信し、ＳＢＲは、デコーダにおいてより低いまたは中間の周波数から高調波(up harmonics)を転置することによってより高い周波数のコンテンツを複製する。高周波数スペクトルエンベロープの再構造のためのいくつかのガイダンス情報がエンコーダ２０２によってサイド情報として送信される。ＳＢＲはエイリアシング・エフェクトを回避するために複素数値領域で動作する、したがって、かなりの時間遅延を結果としてもたらす場合がある。

ＳＢＲエンコーダ２１４は、解析直交ミラーフィルタバンク（ＱＭＦ）２１６とエンベロープ計算機２１８を含むことができる。代わりに、解析ＱＭＦバンク２１６は、ウィンドウィング関数２２０と解析ＱＭＦ（ＡＱＭＦ）関数２２２を実装することができる。アプリケーションと、その許容された電力使用量に依存して、ＡＡＣ−ＥＬＤエンコーダは、複素領域または実数領域で動作するように、ＳＢＲエンコーダ２１４に命令することができる。双方のケースにおいて、対応する実数領域または複素領域解析フィルタバンクは、ＡＱＭＦ関数２２２によってインプリメントされることができる。

例示的なデコーダ構造(Exemplary Decoder Structure)
図３は、効率的な解析フィルタバンクおよび／または効率的な合成フィルタバンクを含むことができるＡＡＣ−ＥＬＤデコーダの例を図示するブロック図である。ＡＡＣ−ＥＬＤデコーダ３０２は、エンコードされたオーディオビットストリーム３０４を受信することができる。エントロピーデコーダ３０６、逆量子化器３０８、エンハンスド低遅延コアデコーダ(enhanced low delay core decoder)３１０は、そのあとで、エンコードされたオーディオビットストリーム３０４を処理して、出力オーディオ信号３１４を再構築することができる。出力オーディオ信号３１４を再構築する部分として、低遅延ＳＢＲデコーダ３１２は、エンハンスド低遅延コアデコーダ(enhanced low delay core decoder)３１０から結果として生じる信号を処理することができる。

ＳＢＲデコーダ３１２は、解析直交ミラーフィルタバンク（ＱＭＦ）３１６、高周波数生成器３１８、高周波数調整器３２０、および合成ＱＭＦバンク３２２を含むことができる。代わりに、解析ＱＭＦバンク３１６は、ウィンドウィング関数３２４と解析ＱＭＦ（ＡＱＭＦ）関数３２６を実装することができる。複素数値領域または実数値領域で動作するＳＢＲデコーダ３１２と関連づけられた時間遅延に取り組むために、効率的な解析フィルタバンクは、ＡＱＭＦ関数３２６によってインプリメントされることができる。代わりに、合成ＱＭＦバンク３２２は、合成ＱＭＦ（ＳＱＭＦ）関数３２８とウィンドウィング関数３３０を実装することができる。デコーダの複雑さに依存して、ＳＢＲデコーダ３１２は、複素数値領域または実数値領域で動作することができる。対応する実数領域または複素領域の合成フィルタバンクは、ＳＱＭＦ関数３２８によってインプリメントされることができる。さらに、複雑度またはアプリケーション要件に起因して、名目周波数帯域の半分のみを合成することが合理的である場合には、デコーダは、ＳＱＭＦ関数３２８によって、ダウンサンプリングされた合成フィルタバンクを実装することができる。

低遅延ＳＢＲフィルタバンク
ＡＡＣ−ＥＬＤで定義される、２つのタイプの低遅延のＳＢＲフィルタバンクがある。

・複素低遅延フィルタバンク(complex low-delay filterbank)（ＣＬＤＦＢ）
・実（または低複雑）低遅延フィルタバンク
なお、複素低遅延フィルタバンクは、任意の所与ビットレートにおいて最良に可能なオーディオ品質を要するアプリケーションにおいて使用することが意図されており、低複雑低遅延フィルタバンクは、より低い複雑のバージョンであるように意図され、そしてそれは、それでも受諾可能な結果を生成する（すなわち、品質/レートの点から）。

ＳＢＲ複素低遅延フィルタバンク（ＣＬＤＦＢ）の演算は、下記のように定義される（正規化係数(normalization factor)は無視する）。

複素解析ＱＭＦ：

複素合成ＱＭＦ：

複素ダウンサンプリングされた合成ＱＭＦ：

なお、
ＡＡＣ−ＥＬＤにおける実解析フィルタバンクおよび実合成フィルタバンクはまた、下記のように定義される。

実解析ＱＭＦ：

実合成ＱＭＦ:

実ダウンサンプリングされた合成ＱＭＦ：

サイズＮのＤＣＴ−ＩＶ変換は、下記のように定義される。

一態様によれば、式１-６のフィルタバンクは因子分解されるので、それらの本質的な行列ベクトル積の演算は式７に変わる。

複素解析ＱＭＦのためのマッピング(Mapping for Complex Analysis QMF)
式１の複素解析ＱＭＦを式７のＤＣＴ−ＩＶ変換にマッピングすることにおいて、式１は下記のように表されることができる。

ｐ＝ｎ−４８とする。Ｘ（ｋ）は、下記のように分けられることができる。

加算においてｎ＝ｐ＋６４とする。その場合には、

となる。なお、ｘ’（ｎ）は、２つの成分として定義されることができる。

Ｘ（ｋ）は、下記のように表されることができる。

次に、Ｘ（ｋ）は、さらに下記のように分けられることができる。

次にｎは、第２の加算で、６３−ｎで置き換えられることができ、下記を生成する。

さらに、ｘ_１（ｎ）とｘ_２（ｎ）は、下記のように定義されることができる。

式１１によれば、下記のことを意味する:

結果として生じる式１４に、ｘ_１（ｎ）とｘ_２（ｎ）を挿入することによって、Ｘ（ｋ）は下記のように定義されることができる。

式１７の第１の加算は、３２点離散コサイン変換タイプＩＶ（ＤＣＴ−ＩＶ）であり、式１７の第２の加算は、３２点離散サイン変換タイプＩＶ（ＤＳＴＩＶ）である、ということに留意されたい。

さらに、ＤＳＴ−ＩＶは、入力符号変更(input sign changes)と出力の並べ替え (output permutation)によって、ＤＣＴ−ＩＶにマッピングされることができる。言い換えれば、式１７の２つの成分は、下記のようにＸ_１（ｋ）とＸ_２（ｋ）と表されることができる。

なお、Ｘ_２（ｋ）は、変換されたＤＳＴ−ＩＶ成分である。

Ｘ（ｋ）は、下記のように表されることができる。

双方の部分の計算は、式７の形におけるただのＤＣＴ−ＩＶ変換である。

複素合成ＱＭＦのためのマッピング(Mapping for Complex Synthesis QMF)
式２の複素合成ＱＭＦを式７のＤＣＴ−ＩＶ変換へとマッピングすることにおいて、式２は、下記のように表されることができる。

を下記のように表すとする。

そうすると、下記のようになる。

の実数成分と虚数成分は、

と

と表されることができる：

すなわち、

は、下記のように表されることができる。

次に、

は分けられ、下記のように表されることができる。

ｎ＝０，・・・，９５の場合：

ｎ＝９６，・・，１２７の場合：

ｎ＝０，・・・，３１の場合、

と

を考える。

および

式２８および２９の上記の２つの結果より、

であることに留意されたい。またｎ＝３２，…６３，の場合には、下記を有する：

式３０と式３１の２つの結果より、

は計算されることができるということが明瞭である。残りの値は、関係から得られることができる。

および

また、

は、６４点ＤＣＴ−ＩＶ変換であるということに留意されたい。

これらの観察(observations)をすべて組み合わせることにより、

を計算するための下記のアルゴリズムが得られる。

同様な因子分解が

に対して実行されることができる。このことは、前回に行われたように、式７のＤＣＴ−ＩＶ変換へとマッピングされることができる６４点ＤＳＴ−ＩＶ変換を結果としてもたらすであろう。結果として生じるアルゴリズムは下記の通りである。

式２４（

）を呼び起こし、上記の式を使用して、

は、複素合成ＱＭＦについて計算されることができる。

複素ダウンサンプリングされた合成ＱＭＦのためのマッピング(Mapping for Complex Downsampled Synthesis QMF)
式３から式７の形までの複素ダウンサンプリングされた合成ＱＭＦについての導出は、解析ＱＭＦおよび合成ＱＭＦについて示された導出と類似する。

とする。また、

とする。そのときには、

および

である。

実解析ＱＭＦのためのマッピング(Mapping for Real Analysis QMF)
式４から式７の形までの実解析ＱＭＦについての導出は、上述された複素解析ＱＭＦについて示された導出と類似している。実解析ＱＭＦについての結果として生じるフィルタバンク式は、下記のように与えられる：

なお、

である。

実合成ＱＭＦのためのマッピング（Mapping for Real Synthesis QMF）
式５から式７の形までの実合成ＱＭＦについての導出は、上述された複素合成ＱＭＦについて示された導出と類似する。実合成ＱＭＦについての結果として生じるフィルタバンク式は、下記のように与えられる。

実ダウンサンプリングされた合成ＱＭＦのためのマッピング（Mapping for Real Downsampled Synthesis QMF）
式６から式７の形までの実ダウンサンプリングされた合成ＱＭＦの導出は、上記で説明された複素ダウンサンプリングされた合成ＱＭＦについて示された導出と類似している。実ダウンサンプリングされた合成ＱＭＦについての結果として生じるフィルタバンクの式は下記のように与えられる。

上述されるすべての例では、フィルタバンク計算は、サイズＮ＝３２、またはＮ＝６４のＤＣＴ−ＩＶ変換の計算に効率的に減らされる。

複素解析フィルタバンクの例示的な因子分解(Exemplary Factorization of Complex Analysis Filterbank)
式１、２、３、４、５、および６のフィルタバンクは、奇数相またはインデクス付けされている（odd phased or indexed）ということに留意されたい、そしてそれは、ＳＢＲ式の分子は、因子（２ｎ±ｘ）を含むということを意味する、ここにおいて、ｘは奇数である。上記の例では、式１と式４は、（２ｎ−９５）を含み、式２と式５は、（２ｎ−６３）を含み、式３と式６は、（２ｎ−３１）を含む。実際、エンコーダ／デコーダにおいてこれらのフィルタバンクを実装することは、より多くの遅延を引き起こし、より多くの処理リソースを要求するようなそれらの複雑さのために、困難である。

したがって、ある特徴は、これらのＳＢＲアルゴリズム（例えば、式１、２、３、４、５、および/または６）を変換するので、それらは、コアＤＣＴ−ＩＶ変換（例、式７）に基づいて表されることができる。すなわち、効率的なＤＣＴ−ＩＶ変換に基づいてＳＢＲアルゴリズムを実装することによって、ＳＢＲアルゴリズムは、より効率的に実行されることができる（例えば、より少ない処理リソースを要する、または、より迅速に実行されることができる）。

図４は、効率的な複素解析フィルタバンクの例を図示する。入力オーディオ信号は、複数の時間領域入力サンプル（すなわち、Ｎ点サンプル）へとサンプリングされる４０６。時間領域入力サンプル（例えば値）のペア毎の加算および減算４０７は、第１グループ４０９および第２グループ４１１の中間サンプルを生成するために選ばれる、なお、各グループは、Ｎ／２中間サンプルを有する。第２グループにおける中間サンプル４１１の場合、奇数インデクス付けされたサンプルの符号は反転される（例えば、（−１）^ｎで乗じられる、ここでは、ｎは、例えば０と

の間であってもよい）。第１のＤＣＴ−ＩＶ変換４０２は、周波数領域において第１グループの出力係数を得るために、第１グループ４０９の中間サンプルに対して適用される。第２のＤＣＴ−ＩＶ変換４０４は、周波数領域において中間第２グループ４１５の出力係数を得るために、第２グループ４１１の中間値に対して適用される。中間第２グループ４１５の出力係数における係数の順序は、第２グループ４１０の出力係数を得るために、逆にされる。したがって、時間領域信号入力サンプル４０６は、周波数領域（すなわち、複素領域スペクトラム）へと変換される。ここでは、結果として生じる第１グループ４０８の出力係数は実数部分を表し、第２グループ４１０の出力係数は虚数部分を表す。

図５は、一例による、解析フィルタバンクを実装するための方法を図示する。入力オーディオ信号は、複数のＮ個の時間領域入力サンプルとして得られることができる５０２。時間領域入力サンプルのペア毎の加算および減算は、第１グループおよび第２グループの中間サンプルを得るために実行されることができる、なお、各グループは、Ｎ／２個の中間サンプルを有する５０４。第１グループの出力係数は、実数の係数から成ることができ、第２グループの出力係数は、虚数の係数から成る。第２グループにおける奇数インデクス付けされた中間サンプルの符号は、反転されうる５０６。第１の変換は、周波数領域において第１グループの出力係数を得るために、第１グループの中間サンプルに対して適用されることができる５０８。第２の変換は、周波数領域において中間第２グループの出力係数を得るために、第２グループの中間サンプルに対して適用されることができる５１０。第１の変換と第２の変換は、離散コサイン変換（ＤＣＴ）タイプＩＶ変換であってもよい。第１の変換および第２の変換は、第１グループおよび第２グループの中間サンプルを変換するために同時に動作しうる。中間第２グループの出力係数における係数の順序は、第２グループの出力係数を得るために、逆にされうる５１２。使用される時間領域入力サンプルは、実数領域内のサンプルであってもよく、周波数領域は複素領域である。

様々な実装では、フィルタバンクは、解析直交フィルタバンク、音声エンコーダーの一部分、スペクトル帯域複製（ＳＢＲ）エンコーダ/デコーダ、および/または、音声デコーダーの一部分、であってもよい。音声エンコーダー/デコーダは、ＭＰＥＧＡＡＣ−ＥＬＤ（Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格のうちの少なくとも1つを実装することができる。

図６は、一例による解析フィルタバンクを実装するための関数コンポーネントを図示するブロック図である。フィルタバンクデバイスは、複数のＮ個の時間領域入力サンプルとして入力オーディオ信号６０１を得るように適合されたインタフェース６０４を含むことができる。そのときには、プレ変換回路６０６は、下記のことを行うことができる。（ａ）第１グループおよび第２グループの中間サンプルを得るために、時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、Ｎ／２個の中間サンプルを有する。（ｂ）第２グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること。第１の変換回路６０８は、周波数領域において第１グループ６１４の出力係数を得るために、第１グループの中間サンプルに対して第１の変換を適用するように適合される。第２の変換回路６１０は、周波数領域において中間第２グループの出力係数を得るために、第２グループの中間サンプルに対して第２の変換を適用することができる。ポスト変換回路６１２は、第２グループ６１６の出力係数を得るために、中間第２グループの出力係数における係数の順序を逆にすることができる。

複素合成フィルタバンクの例示的な因子分解(Exemplary Factorization of Complex Synthesis Filterbank)
図７は、効率的な複素合成フィルタバンクの例を図示する。周波数領域（例えば、複素領域）において入力係数が得られる、なお、第１グループ７０６のＮ／２個の入力係数は実数成分であり、第２グループ７０８のＮ／２個の入力係数は虚数成分である。第２グループ７０８の入力係数の場合、奇数インデクス付けされたサンプルの符号は、偶数インデクス付けされた係数に関連して反転される（例えば、（−１）ⁿで乗じられる、なお、ｎは、例えば０と

との間であってもよい）。第１の逆変換ＤＣＴ−ＩＶ変換７０２は、時間領域において出力サンプルの中間第１グループ７０７を得るために、第１グループ７０６の入力係数に対して適用される。第２の逆ＤＣＴ−ＩＶ変換７０４は、時間領域において中間第２グループ７０９の出力サンプルを得るために、第２グループ７０８の入力係数に対して適用されることができる。中間第１グループ７０７からの中間第２グループ７０９のペア毎の減算は、時間領域出力サンプル（例えば、値）を得るために、実行される。

図８は、一例による合成フィルタバンクを実装する方法を図示する。複数のＮ個の入力係数は、周波数領域においてオーディオ信号について得られることができる、なお、第１グループのＮ／２個の入力係数は実数成分であり、第２グループのＮ／２個の入力係数は虚数成分であり、第２グループにおける奇数インデクス付けされたサンプルの符号は、第２グループにおいて偶数インデクス付けされた係数に関連して反転される８０２。第１グループの入力係数は、実数の係数から成ることができ、第２グループの入力係数は、虚数の係数から成ることができる。周波数領域は複素領域であってもよく、時間領域サンプルは実数領域内のサンプルである。第１の逆変換は、時間領域において中間第１グループの出力サンプルを得るために、第１グループの入力係数に対して適用されることができる８０４。第２の逆変換はまた、時間領域において中間第２グループの出力サンプルを得るために、第２グループの入力係数に対して適用されることができる８０６。第１の逆変換と第２の逆変換は、第１グループおよび第２グループの入力係数を変換するために同時に動作しうる。第１の逆変換と第２の逆変換は、逆離散コサイン変換（ＩＤＣＴ）タイプＩＶ変換であってもよい。中間第１グループの入力係数からの中間第２グループの入力係数のペア毎の減算は、複数のＮ個の時間領域出力サンプルを得るために、実行されることができる８０８。

様々な実装では、フィルタバンクは、合成直交ミラーフィルタバンク、音声デコーダーの一部分、および/または、スペクトル帯域複製（ＳＢＲ）デコーダの一部分、であってもよい。音声デコーダーは、ＭＰＥＧ-４ＡＡＣ（Advance Audio Coding)-ＥＬＤ（Enhanced Low Delay)標準規格、ＭＰＥＧ-４ＡＡＣ−ＥＬＤ（Enhanced Low Delay)標準規格、およびＭＰＥＧ-４ＭＰＥＧ-４ＨＥ（High Efficiency)-ＡＡＣ標準規格のうちの少なくとも１つを実装することができる。

図９は、一例による合成フィルタバンクを実装するための関数コンポーネントを図示するブロック図である。合成フィルタバンク９０２は、周波数領域においてオーディオ信号について複数のＮ個の入力係数を得るように適合されたインタフェースを含むことができ、なお、第１グループ９１４のＮ／２個の入力係数は実数成分であり、第２グループ９１６のＮ／２個の入力係数は虚数成分である。プレ処理回路９１２は、第２グループ内の偶数インデクス付けされた係数に関連して、第２グループにおける奇数インデクス付けされたサンプルの符号を反転するように適合される。第１の変換回路９０８は、時間領域において中間第１グループのＮ出力サンプルを得るために、第１グループの入力係数に対して第１の逆変換を適用するように適合されることができる。第２の変換回路９１０は、時間領域において中間第２グループの出力サンプルを得るために、第２グループの入力係数の第２の逆変換を適用するように適合されることができる。ポスト変換回路９０６は、複数のＮ個の時間領域出力サンプルを得るために、中間第１グループの入力係数からの中間第２グループの入力係数のペア毎の減算を実行するように適合されることができる。

実解析フィルタバンクの例示的な因子分解(Exemplary Factorization of Real Analysis Filterbank)
式４８の実解析フィルタバンクは、奇数相またはインデクス付けされるということに留意されたい、そしれそれは、ＳＢＲ式の分子は因数（２ｎ±ｘ）を含むということを意味しており、ここでは、ｘは奇数である。上記の例では、式４８は、（２ｎ＋１）を含む。実際、エンコーダ／デコーダにおいてこれらのフィルタバンクを実装することは、より多くの遅延を引き起こし、より多くの処理リソースを要求するような、それらの複雑さのために困難である。

したがって、ある特性は、これらのＳＢＲアルゴリズム（例えば、式４８）を変換するので、それらは、コアＤＣＴ−ＩＶ変換（例えば、式７）に基づいて表されることができる。すなわち、効率的なＤＣＴ−ＩＶ変換に基づいてＳＢＲアルゴリズムを実装することによって、ＳＢＲアルゴリズムは、より効率的に実行されることができる（例えば、より少ない処理リソースを要する、または、より迅速に実行されることができる）。

図１０は、効率的な実数領域解析フィルタバンクの例を図示する。入力オーディオ信号は、複数の時間領域入力サンプル（すなわち、Ｎ点サンプル）へとサンプリングされる１００６。時間領域入力サンプルのペア毎の加算および減算１００７は、Ｎ／２個の中間サンプル上でグループ１００７を得るために選択される。第１のＤＣＴ−ＩＶ変換１００２は、周波数領域において１グループ１００８の出力係数を得るために、１グループ１００７のＮ／２中間サンプルに対して適用される。ここで、出力係数の結果として生じるグループ１００８は、実数成分を表わす。

図１１は、一例による解析フィルタバンクを実装するための方法を図示する。入力オーディオ信号は、複数のＮ個の時間領域入力サンプルとして得られることができる１１０２。時間領域入力サンプルのペア毎の加算および減算は、１グループのＮ／２個の中間サンプルを得るために実行されることができる１１０４。変換は、周波数領域においてＮ／２個の出力係数を得るために、１グループのＮ／２個の中間サンプルに対して適用されることができる１１０６。時間領域入力サンプルと周波数領域係数は、実数であってもよい。変換は、離散コサイン変換（ＤＣＴ）タイプＩＶ変換であってもよい。

様々な実装では、フィルタバンクは、解析直交フィルタバンク、音声エンコーダーの一部分、スペクトル帯域複製（ＳＢＲ）エンコーダ/デコーダ、および/または、音声デコーダーの一部分、であってもよい。音声エンコーダー/デコーダは、ＭＰＥＧＡＡＣ−ＥＬＤ（Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格のうちの少なくとも１つを実装することができる。

図１２は、一例による解析フィルタバンクを実装するための関数コンポーネントを図示するブロック図である。フィルタバンクデバイス１２０２は、複数のＮ個の時間領域入力サンプルとして入力オーディオ信号１２１４を得るように適合されたインタフェースを含むことができる。プレ変換回路１２１２は、１グループのＮ／２個の中間サンプルを得るために、時間領域入力サンプル１２１４のペア毎の加算および減算を実行するように適合されることができる。変換回路１２０８は、周波数領域において１グループのＮ／２個の出力係数１２０１を得るために、１グループのＮ／２個の中間サンプルに対して変換を適用するように適合されることができる。

実合成フィルタバンクの例示的な因子分解(Exemplary Factorization of Real Synthesis Filterbank)
式５０の実合成フィルタバンクが奇数相またはインデクス付けされるということに留意されたい、そしてそれは、ＳＢＲ式の分子は因数（２ｎ±ｘ）を含むということを意味しており、ここにおいて、ｘは奇数である。上記の例では、式５０は、（２ｎ＋１）を含む。実際、デコーダにおいて、これらのフィルタバンクを実装することは、より多くの遅延を引起こす、および／または、より多くの処理リソースを要求するような複雑さのために困難である。

したがって、ある特徴は、これらのＳＢＲアルゴリズム（例えば式５０）を変換するので、それらは、コアＤＣＴ−ＩＶ変換（例えば、式７）に基づいて表されることができる。すなわち、効率的なＤＣＴ−ＩＶ変換に基づいてＳＢＲアルゴリズムを実装することにより、ＳＢＲアルゴリズムはより効率的に実行されることができる（例えば、より少ない処理リソースを要する、または、より迅速に実行されることができる）。

図１３は、効率的な実数領域の合成フィルタバンクの例を図示する。複数のＮ／２個の入力係数１３０６は、周波数領域においてオーディオ信号について得られる。逆変換１３０２は、時間領域において中間グループ１３０７のＮ個の出力サンプルを得るために、１グループのＮ／２個の入力係数に対して適用される。係数の複製操作、符号反転、および並び替えは、複数１３１０のＮ個の時間領域出力サンプルを得るために、中間グループ１３０７のＮ個の入力係数から実行されることができる。

図１４は、一例による合成フィルタバンクを実装するための方法を図示する。周波数領域においてオーディオ信号についての複数のＮ／２個の入力係数が得られることができる１４０２。逆変換は、時間領域において中間グループのＮ個の出力サンプルを得るために、１グループのＮ／２個の入力係数に対して適用されることができる１４０４。中間グループのＮ個の入力係数からの係数の複製操作、符号反転、および並び替えは、複数のＮ個の時間領域出力サンプルを得るために、実行されることができる１４０６。

様々な実装では、フィルタバンクは、合成直交ミラーフィルタバンク、音声デコーダーの一部分、スペクトル帯域複製（ＳＢＲ）デコーダの一部分、であってもよい。音声デコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ（Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格のうちの少なくとも1つを実装することができる。

図１５は、一例による合成フィルタバンクを実装するための関数コンポーネントを図示するブロック図である。フィルタバンクデバイス１５０２は、周波数領域においてオーディオ信号についての複数のＮ／２個の入力係数１５１４を得るように適合されたインタフェースを含むことができる。変換回路１５１２は、時間領域において中間グループのＮ出力サンプルを得るために、１グループのＮ／２個の入力係数に対して逆変換を適用するように適合されることができる。ポスト変換回路１５０８は、複数のＮ個の時間領域出力サンプルを得るために、中間グループのＮ個の入力係数からの係数の複製操作、符号反転、および並び替えを実行するように適合されることができる。

ＨＥ−ＡＡＣおよびＵＳＡＣにおけるＳＢＲフィルタバンクのためのファストアルゴリズム(Fast Algorithms for SBR Filterbanks in HE-AAC and USAC)
ＨＥ−ＡＡＣ、ＨＥ−ＡＡＣｖ２およびＵＳＡＣは、ここで上述されたものと同様なＳＢＲフィルタバンク構造を使用する。おそらく最も重要な違いは、それらの位相シフトは、（ＡＡＣ−ＥＬＤの場合は奇数であるのに対して）偶数によって表されることである。例えば、ＨＥ−ＡＡＣにおける実解析フィルタバンクは、下記のように定義される。

それは、ＥＬＤ−ＡＡＣでは、ｎが９５である代わりに、４８までであるシフトを使用する。

情報および信号は、様々な異なる技術および技法のいずれかを使用して表されることができる。例えば、上記の説明の全体にわたって参照されることができる、データ、命令、コマンド、情報、信号、及び同様なものは、電圧、電流、電磁波、磁場あるいは磁粒子、光場あるいは光学粒子、あるいはそれらのいずれの組み合わせ、によって表わされることができる。

ここにおいて説明された、様々な説明のための論理ブロック、モジュールおよび回路、およびアルゴリズムステップは、電子ハードウェア、ソフトウェアあるいは双方の組合せとしてインプリメントされることができる。このハードウェアとソフトウェアの互換性を明瞭に説明するために、様々な説明のためのコンポーネント、ブロック、モジュール、回路およびステップが、一般に、それらの機能性という観点から、上記で説明されてきた。そのような機能性が、ハードウェアあるいはソフトウェアとしてインプリメントされるかどうかは、特定のアプリケーションと全体のシステムに課された設計制約によって決まる。本構成は、フローチャート、フロー図、構造図、またはブロック図として表されるプロセスとして説明されることができる、ということに留意されたい。フローチャートは、シーケンシャルプロセスとして動作を説明することができ、動作の多くは、並行または同時に実行されることができる。さらに、動作の順序は並び替えられうる。プロセスは、その動作が完了するとき、終了する。プロセスは、方法、関数、プロシージャ、サブルーチン、サブプログラム、などに対応することができる。プロセスが関数に対応するとき、その終了は、関数の呼出またはメイン関数に対する関数の戻りに対応する。

ハードウェアでインプリメントされるとき、様々な例は、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ信号（ＦＰＧＡ）、あるいは他のプログラマブル論理デバイス、ディスクリートゲートあるいはトランジスタロジック、ディスクリートハードウェアコンポーネント、あるいは、ここに説明された機能を実行するように設計されたそれらのいずれの組み合わせ、を利用することができる。汎用プロセッサは、マイクロプロセッサであってもよいが、代替として、プロセッサは、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、あるいはステートマシン(state machine)であってもよい。プロセッサはまた、コンピューティングデバイスの組み合わせ、例えば、ＤＳＰおよびマイクロプロセッサの組み合わせ、複数のマイクロプロセッサ、ＤＳＰコアと関連している１つまたは複数のマイクロプロセッサ、または、任意の何らかのこのような構成、としてインプリメントされてもよい。

ソフトウェアでインプリメントされるとき、様々な例はファームウェア、ミドルウェアあるいはマイクロコードを使用することができる。必要なタスクを実行するプログラムコードまたはコードセグメントは、記憶媒体または他のストレージ（単数または複数）のようなコンピュータ可読媒体において保存されることができる。プロセッサは必要なタスクを実行することができる。コードセグメントは、プロシージャ(procedure)、関数(function)、サブプログラム、プログラム、ルーチン、サブルーチン、モジュール、ソフトウェアパッケージ、クラス、あるいは、命令、データ構造、あるいはプログラムステートメントのいずれの組み合わせ、を表すことができる。コードセグメントは、情報、データ、アーギュメント(arguments)、パラメータあるいはメモリコンテンツを受け渡すること、および/または受信することによって、別のコードセグメントあるいはハードウェア回路に結合されることが出来る。情報、アーギュメント、パラメータ、データなどは、メモリの共有、メッセージパッシング(message passing)、トークンパッシング(token passing)、ネットワーク送信などを含んでいる、いずれの適切な手段を使用して、受け渡され、転送され、あるいは送信されることが出来る。

本願で使用されるように、用語「コンポーネント(component)」、「モジュール(module)」、「システム(system)」、および同様なものは、コンピュータ関連のエンティティ、ハードウェア、ファームウェア、ハードウェアとソフトウェアの組み合わせ、ソフトウェア、あるいは実行中のソフトウェア、のいずれを指すように意図されている。例えば、コンポーネントは、限定されてはいないが、プロセッサ上で実行しているプロセス、プロセッサ、オブジェクト(object)、実行ファイル(executable)、実行スレッド(thread of execution)、プログラム、及び/またはコンピュータ、であってもよい。例えば、コンピューティングデバイス上で実行しているアプリケーションとコンピューティングデバイスの双方はコンポーネントであることができる。１つまたは複数のコンポーネントは、プロセスおよび/または実行スレッド内に常駐することができ、また、コンポーネントは、1つのコンピュータ上に局在化されてもよいし、かつ/または２以上のコンピュータの間で分散していてもよい。さらに、これらのコンポーネントは、記憶された様々なデータ構造を有している様々なコンピュータ可読媒体から実行することが出来る。コンポーネントは、1つまたは複数のデータパケット(例、ローカルシステムにおいて、分散システムにおいて、及び/または、信号を通って他のシステムを備えたインターネットのようなネットワークにわたって、別のコンポーネントとインタラクトしているあるコンポーネントからのデータ)を有している信号にしたがって、ローカル及び/または遠隔のプロセスで通信することができる。

ここにおける1つまたは複数の例では、記載された機能は、ハードウェア、ソフトウェア、ファームウェアあるいはそれらのいずれかの組み合わせにおいてインプリメントされることができる。ソフトウェアでインプリメントされる場合には、機能は、コンピュータ可読媒体上で、1つまたは複数の命令あるいはコードとして、記憶されてもよく、あるいは、送信されることができる。コンピュータ可読媒体は、ある場所から別の場所へのコンピュータプログラムの転送(transfer)を容易にするいずれの媒体も含んでいる、コンピュータ記憶媒体(computer storage media)と通信媒体(communication media)の双方を含む。記憶媒体は、コンピュータによってアクセスされることができる、いずれの利用可能な媒体であることができる。限定されないが例として、そのようなコンピュータ可読媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、ＣＤ−ＲＯＭあるいは他の光学ディスクストレージ、磁気ディスクストレージあるいは他の磁気ストレージデバイス、あるいは、命令あるいはデータ構造の形態で望まれるプログラムコードを保存あるいは搬送するために使用されることができる、また、コンピュータによってアクセスされることができる、任意の他の媒体も備えることができる。また、いずれの接続もコンピュータ可読媒体(computer-readable medium)と適切に名付けられる。例えば、ソフトウェアがウェブサイト、サーバ、あるいは、同軸ケーブル、光ファイバーケーブル、ツイストペア(twisted pair)、デジタル加入者ライン(digital subscriber line)(ＤＳＬ)、あるいは赤外線、無線、およびマイクロ波のような無線技術を使用している他の遠隔ソース、から送信される場合には、同軸ケーブル、光ファイバーケーブル、ツイストペア、ＤＳＬ、あるいは赤外線、無線、およびマイクロ波のような無線技術は、媒体(medium)の定義に含まれている。ここに使用されているように、ディスク(disk)とディスク(disc)は、コンパクトディスク(compact disc)(ＣＤ)、レーザーディスク(登録商標)(laser disc)、光学ディスク(optical disc)、デジタル汎用ディスク(digital versatile disc)(ＤＶＤ)、フロッピー(登録商標)ディスク(disk)およびブルーレイディスク(blu-ray disc)を含んでおり、「ディスク(disks)」は、大抵、データを磁気で再生し、「ディスク(discs)」は、レーザーで光学的に再生する。上記の組み合わせはまた、コンピュータ可読媒体の範囲内に含まれるべきである。ソフトウェアモジュールは、単一の命令または多くの命令を備えることができ、いくつかの異なるコードセグメント上で、異なるプログラムの中で、そして、複数の記憶媒体にわたって、分散していてもよい。例示的な記憶媒体は、プロセッサに結合されうるので、プロセッサが記憶媒体から情報を読み取ることができ、また記憶媒体に情報を書き込むことができる。あるいは、記憶媒体は、プロセッサに一体化されてもよい。

ここに開示される方法は、説明される方法を達成するための１つまたは複数のステップまたは動作を備える。方法のステップ及び/または動作は、特許請求の範囲から逸脱することなく互いに置き換えられることができる(may be interchanged)。言いかえれば、ステップまたは動作の具体的な順序が記載されている方法の適切な動作に必要とされない限り、具体的なステップ及び/または動作の順序及び/または使用は、特許請求の範囲から逸脱することなく修正されることができる。

図面で説明されるコンポーネント、ステップ、および/または機能のうちの１つまたは複数は、並び替えられうるおよび/または単一のコンポーネント、ステップ、または機能へと組み合わせられうる、または、いくつかのコンポーネント、ステップ、または機能に具現化されうる。さらなるエレメント、コンポーネント、ステップ、および/または、機能がまた追加されることができる。図面で図示される装置、デバイス、および/または、コンポーネントは、他の図面で説明される方法、特徴、またはステップのうちの1つまたは複数を実行するように、構成または適合されうる。ここに説明されるアルゴリズムは、例えば、ソフトウェアおよび/または埋め込み型ハードウェアで効率的にインプリメントされうる。

前述の構成は単なる例にすぎず、本願請求項を限定するものとして解釈されないということは留意されるべきである。本構成の説明は、説明することを意図しており、本願請求項の範囲を限定することは意図していない。そのため、本教示は、他のタイプの装置に対して容易に適用されることができ、多くの代替、修正および変更は当業者にとって容易となるであろう。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］フィルタバンクを実装する方法、該方法は下記を備える：
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得ること；
第１グループおよび第２グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、Ｎ／２中間サンプルを有する；
前記第２グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること；
周波数領域において第１グループの出力係数を得るために、前記第１グループの中間サンプルに対して第１の変換を適用すること；
前記周波数領域において中間第２グループの出力係数を得るために、前記第２グループの中間サンプルに対して第２の変換を適用すること；および、
第２グループの出力係数を得るために、前記中間第２グループの出力係数における係数の次数を逆にすること。
［Ｃ２］使用される前記時間領域入力サンプルは実数領域内のサンプルであり、前記周波数領域は複素領域である、Ｃ１に記載の方法。
［Ｃ３］前記第１グループの出力係数は、実数の係数から成り、前記第２グループの出力係数は、虚数の係数から成る、Ｃ１に記載の方法。
［Ｃ４］前記第１の変換および第２の変換は、双方とも、離散コサイン変換（ＤＣＴ）タイプＩＶ変換であり、前記フィルタバンクは、分子に（２ｎ±ｘ）の因数を有する式によって表される、ここにおいて、ｘは奇数である、Ｃ１に記載の方法。
［Ｃ５］前記第１の変換および第２の変換は、前記第１グループおよび第２グループの中間サンプルを変換するために同時に動作する、Ｃ１に記載の方法。
［Ｃ６］前記フィルタバンクは、解析直交ミラーフィルタバンクである、Ｃ１に記載の方法。
［Ｃ７］前記フィルタバンクは、音声エンコーダーの一部分である、Ｃ１に記載の方法。
［Ｃ８］前記音声エンコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ(Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ(Spatial Audio Coding）、およびＭＰＥＧＵＳＡＣ(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、Ｃ７に記載の方法。
［Ｃ９］前記フィルタバンクは、スペクトル帯域複製（ＳＢＲ）エンコーダの一部分である、Ｃ１に記載の方法。
［Ｃ１０］前記フィルタバンクは、音声デコーダーの一部分である、Ｃ１に記載の方法。
［Ｃ１１］前記音声デコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ(Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ(High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、Ｃ１０に記載の方法。
［Ｃ１２］前記フィルタバンクは、スペクトル帯域複製（ＳＢＲ）デコーダの一部分である、Ｃ１に記載の方法。
［Ｃ１３］下記を備えるフィルタバンクデバイス：
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得るように適合されたインタフェース；
下記を実行するように適合されたプレ変換回路：
第１グループおよび第２グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、Ｎ／２中間サンプルを有する；
前記第２グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること；
周波数領域において第１グループの出力係数を得るために、前記第１グループの中間サンプルに対して第１の変換を適用するように適合された第１の変換回路と；
前記周波数領域において中間第２グループの出力係数を得るために、前記第２グループの中間サンプルに対して第２の変換を適用するように適合された第２の変換回路と；
第２グループの出力係数を得るために、前記中間第２グループの出力係数における係数の次数を逆にするように適合されたポスト変換回路。
［Ｃ１４］使用される前記時間領域入力サンプルは実数領域内のサンプルであり、前記周波数領域は複素領域である、Ｃ１３に記載のフィルタバンクデバイス。
［Ｃ１５］前記第１グループの出力係数は、実数の係数から成り、前記第２グループの出力係数は、虚数の係数から成る、Ｃ１３に記載のフィルタバンクデバイス。
［Ｃ１６］前記第１の変換および第２の変換は、双方とも、離散コサイン変換（ＤＣＴ）タイプＩＶ変換であり、前記フィルタバンクは、分子に（２ｎ±ｘ）という因子を有する式によって表される、ここにおいて、ｘは奇数である、Ｃ１３に記載のフィルタバンクデバイス。
［Ｃ１７］前記第１の変換および第２の変換は、前記第１グループおよび第２グループの中間サンプルを変換するために同時に動作する、Ｃ１３に記載のフィルタバンクデバイス。
［Ｃ１８］前記フィルタバンクデバイスは、解析直交ミラーフィルタバンクである、Ｃ１３に記載のフィルタバンクデバイス。
［Ｃ１９］前記フィルタバンクは、音声エンコーダーの一部分である、Ｃ１３に記載のフィルタバンクデバイス。
［Ｃ２０］前記音声エンコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ(Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ-ＡＡC(High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、Ｃ１９に記載のフィルタバンクデバイス。
［Ｃ２１］前記フィルタバンクは、スペクトル帯域複製（ＳＢＲ）エンコーダの一部分である、Ｃ１３に記載のフィルタバンクデバイス。
［Ｃ２２］前記フィルタバンクは、音声デコーダーの一部分である、Ｃ１３に記載のフィルタバンクデバイス。
［Ｃ２３］前記音声デコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ（Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ-ＡＡＣ(High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、Ｃ２２に記載のフィルタバンクデバイス。
［Ｃ２４］前記フィルタバンクデバイスは、スペクトル帯域複製（ＳＢＲ）デコーダの一部分である、Ｃ１３に記載のフィルタバンクデバイス。
［Ｃ２５］下記を備えるフィルタバンクデバイス：
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得るための手段；
第１グループおよび第２グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行するための手段、なお、各グループは、Ｎ／２中間サンプルを有する；
前記第２グループにおける奇数インデクス付けされた中間サンプルの符号を反転するための手段；
周波数領域において第１グループの出力係数を得るために、前記第１グループの中間サンプルに対して第１の変換を適用するための手段；
前記周波数領域において中間第２グループの出力係数を得るために、前記第２グループの中間サンプルに対して第２の変換を適用するための手段；および、
第２グループの出力係数を得るために、前記中間第２グループの出力係数における係数の次数を逆にするための手段。
［Ｃ２６］前記フィルタバンクは、音声エンコーダーの一部分である、Ｃ２５に記載のフィルタバンクデバイス。
［Ｃ２７］前記音声エンコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ（Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも１つを実装する、Ｃ２６に記載のフィルタバンクデバイス。
［Ｃ２８］前記フィルタバンクは、スペクトル帯域複製（ＳＢＲ）エンコーダの一部分である、Ｃ２５に記載のフィルタバンクデバイス。
［Ｃ２９］前記フィルタバンクは、音声デコーダーの一部分である、Ｃ２５に記載のフィルタバンクデバイス。
［Ｃ３０］フィルタバンクを実装するような動作が可能なＣＰＵ命令を記録したコンピュータ可読記録媒体であって、１つまたは複数のプロセッサによって実施されるとき、前記ＣＰＵ命令が前記プロセッサに、下記動作を実行させるコンピュータ可読記録媒体：
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得ること；
第１グループおよび第２グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、Ｎ／２中間サンプルを有する；
前記第２グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること；
周波数領域において第１グループの出力係数を得るために、前記第１グループの中間サンプルに対して第１の変換を適用すること；
前記周波数領域において中間第２グループの出力係数を得るために、前記第２グループの中間サンプルに対して第２の変換を適用すること；および、
第２グループの出力係数を得るために、前記中間第２グループの出力係数における係数の次数を反転すること。
［Ｃ３１］使用される前記時間領域入力サンプルは実数領域内のサンプルである一方で、前記周波数領域は複素領域である、Ｃ３０に記載の機械可読媒体。
［Ｃ３２］前記第１グループの出力係数は、実数の係数から成り、前記第２グループの出力係数は、虚数の係数から成る、Ｃ３０に記載の機械可読媒体。
［Ｃ３３］フィルタバンクを実装する方法、該方法は下記を備える：
周波数領域においてオーディオ信号について複数のＮ個の入力係数を得ること、なお、第１グループのＮ／２個の入力係数は実数成分であり、第２グループのＮ／２個の入力係数は虚数成分であり、前記第２グループにおける奇数インデクス付けされたサンプルの符号は、前記第２グループにおいて偶数インデクス付けされた係数に関連して反転される；前記時間領域において中間第１グループの出力サンプルを得るために、前記第１グループの入力係数に対して第１の逆変換を適用すること；
前記時間領域において中間第２グループの出力サンプルを得るために、前記第２グループの入力係数に対して第２の逆変換を適用すること；および、
複数のＮ個の時間領域出力サンプルを得るために、前記中間第１グループの入力係数からの前記中間第２グループの入力係数のペア毎の減算を実行すること。
［Ｃ３４］前記第１グループの入力係数は、実数の係数から成り、前記第２グループの入力係数は、虚数の係数から成る、Ｃ３３に記載の方法。
［Ｃ３５］前記周波数領域は複素領域であり、前記時間領域サンプルは実数領域内のサンプルである、Ｃ３３に記載の方法。
［Ｃ３６］前記第１の逆変換と第２の逆変換は、双方とも逆離散コサイン変換（ＩＤＣＴ）タイプＩＶ変換であり、フィルタバンクは、分子に（２ｎ±ｘ）の因子を有する式で表される、ここにおいて、ｘは、奇数である、Ｃ３３に記載の方法。
［Ｃ３７］前記第１の逆変換と第２の逆変換は、前記第１グループおよび第２グループの入力係数を変換するように同時に動作する、Ｃ３３に記載の方法。
［Ｃ３８］前記フィルタバンクは、合成直交ミラーフィルタバンクである、Ｃ３３に記載の方法。
［Ｃ３９］前記フィルタバンクは、音声デコーダーの一部分である、Ｃ３３に記載の方法。
［Ｃ４０］前記音声デコーダーは、ＭＰＥＧ-４ＡＡＣ（Advance Audio Coding)-ＥＬＤ（Low Delay)標準規格、ＭＰＥＧ-４ＡＡＣ−ＥＬＤ（Enhanced Low Delay)標準規格、およびＭＰＥＧ-４ＭＰＥＧ-４ＨＥ（High Efficiency)-ＡＡＣ標準規格のうちの少なくとも１つを実装する、Ｃ３９に記載の方法。
［Ｃ４１］前記フィルタバンクは、スペクトル帯域複製（ＳＢＲ）デコーダの一部分である、Ｃ３３に記載の方法。
［Ｃ４２］下記を備えるフィルタバンクデバイス：
周波数領域においてオーディオ信号について複数のＮ個の入力係数を得るように適合されたインタフェース、なお、第１グループのＮ／２個の入力係数は実数成分であり、第２グループのＮ／２個の入力係数は虚数成分である；
前記第２グループにおける偶数でインデクス付けされた係数に関連して、前記第２グループにおける奇数でインデクス付けされたサンプルの符号を反転するように適合された前処理回路と；
時間領域において中間第１グループのＮ個の出力サンプルを得るために、前記第１グループの入力係数に対して第１の逆変換を適用するように適合された第１の変換回路と；前記時間領域において中間第２グループのＮ個の出力サンプルを得るために、前記第２グループの入力係数に対して第２の逆変換を適用するように適合された第２の変換回路と；および、
複数のＮ個の時間領域出力サンプルを得るために、前記中間第１グループの入力係数からの前記中間第２グループの入力係数のペア毎の減算を実行するように適合された後処理変換回路。
［Ｃ４３］前記第１グループの入力係数は、実数の係数から成り、前記第２グループの入力係数は、虚数の係数から成る、Ｃ４２に記載のフィルタバンクデバイス。
［Ｃ４４］前記周波数領域は複素領域であるが、前記時間領域サンプルは実数領域内のサンプルである、Ｃ４２に記載のフィルタバンクデバイス。
［Ｃ４５］前記第１の逆変換と第２の逆変換は、双方とも逆離散コサイン変換（ＩＤＣＴ）タイプＩＶ変換であり、フィルタバンクは、分子に（２ｎ±ｘ）の因数を有する式で表される、ここにおいて、ｘは、奇数である、Ｃ４２に記載のフィルタバンクデバイス。
［Ｃ４６］前記第１の逆変換と第２の逆変換は、前記第１グループおよび第２グループの入力係数を変換するように同時に動作する、Ｃ４２に記載のフィルタバンクデバイス。
［Ｃ４７］前記フィルタバンクデバイスは、合成直交ミラーフィルタバンクである、Ｃ４２に記載のフィルタバンクデバイス。
［Ｃ４８］前記フィルタバンクは、音声デコーダーの一部分である、Ｃ４２に記載のフィルタバンクデバイス。
［Ｃ４９］前記音声デコーダーは、ＭＰＥＧ-４ＡＡＣ（Advance Audio Coding)-ＥＬＤ（Low Delay)標準規格、ＭＰＥＧ-４ＡＡＣ−ＥＬＤ（Enhanced Low Delay)標準規格、およびＭＰＥＧ-４ＭＰＥＧ-４ＨＥ（High Efficiency)-ＡＡＣ標準規格のうちの少なくとも1つを実装する、Ｃ４８に記載のフィルタバンクデバイス。
［Ｃ５０］前記フィルタバンクデバイスは、スペクトル帯域複製（ＳＢＲ）デコーダの一部分である、Ｃ４２に記載のフィルタバンクデバイス。
［Ｃ５１］下記を備えるフィルタバンクデバイス：
周波数領域においてオーディオ信号について複数のＮ個の入力係数を得るための手段、なお、第１グループのＮ／２個の入力係数は実数成分であり、第２グループのＮ／２個の入力係数は虚数成分であり、第２グループにおける奇数でインデクス付けされたサンプルの符号は、前記第２グループにおいて偶数でインデクス付けされた係数に関連して反転される；
前記時間領域において第１グループの中間の出力サンプルを得るために、前記第１グループの入力係数に対して第１の逆変換を適用するための手段；
前記時間領域において第２グループの中間の出力サンプルを得るために、前記第２グループの入力係数に対して第２の逆変換を適用するための手段；および、
複数のＮ個の時間領域出力サンプルを得るために、前記第１グループの中間の入力係数からの前記第２グループの中間の入力係数のペア毎の減算を実行するための手段。
［Ｃ５２］前記フィルタバンクデバイスは、合成直交ミラーフィルタバンクである、Ｃ５１に記載のフィルタバンクデバイス。
［Ｃ５３］前記フィルタバンクは、音声デコーダーの一部分である、Ｃ５１に記載のフィルタバンクデバイス。
［Ｃ５４］前記音声デコーダーは、ＭＰＥＧ-４ＡＡＣ（Advance Audio Coding)-ＥＬＤ（Enhanced Low Delay)標準規格、ＭＰＥＧ-４ＡＡＣ−ＥＬＤ（Low Delay)標準規格、およびＭＰＥＧ-４ＭＰＥＧ-４ＨＥ（High Efficiency)-ＡＡＣ標準規格のうちの少なくとも1つを実装する、Ｃ５３に記載のフィルタバンクデバイス。
［Ｃ５５］前記フィルタバンクデバイスは、スペクトル帯域複製（ＳＢＲ）デコーダの一部分である、Ｃ５１に記載のフィルタバンクデバイス。
［Ｃ５６］フィルタバンクを実装するように動作が可能な一連のＣＰＵ命令を記録したコンピュータ可読記録媒体であって、１つまたは複数のプロセッサによって実施されるとき、前記プロセッサに下記動作を実行させる前記ＣＰＵ命令を備えるコンピュータ可読記録媒体：複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得ること；
第１グループおよび第２グループの中間サンプルを得るために、時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、Ｎ／２個の中間サンプルを有する；
前記第２グループにおける奇数でインデクス付けされた中間サンプルの符号を反転することと；
前記周波数領域において第１グループの出力係数を得るために、前記第１グループの中間サンプルに対して第１の変換を適用すること；
前記周波数領域において第２グループの中間の出力係数を得るために、前記第２グループの中間サンプルに対して第２の変換を適用すること；
第２グループの出力係数を得るために、前記第２グループの中間の出力係数における係数の次数を逆にすること。
［Ｃ５７］前記第１グループの入力係数は、実数の係数から成り、前記第２グループの入力係数は、虚数の係数から成る、Ｃ５６に記載の機械可読媒体。
［Ｃ５８］前記周波数領域は複素領域であり、前記時間領域サンプルは実数領域内のサンプルである、Ｃ５６に記載の機械可読媒体。
［Ｃ５９］フィルタバンクを実装する方法であって、
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得ることと、
１グループのＮ／２個の中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行することと、
前記周波数領域においてＮ／２個の出力係数を得るために、前記１グループのＮ／２個の中間サンプルに対して変換を適用することと、
を備える方法。
［Ｃ６０］時間領域入力サンプルと周波数領域係数の双方は、実数である、Ｃ５９に記載の方法。
［Ｃ６１］前記変換は、離散コサイン変換（ＤＣＴ）タイプＩＶ変換であり、前記フィルタバンクは、分子に（２ｎ±ｘ）という因子を有する式によって表され、ここにおいて、ｘは奇数である、Ｃ５９に記載の方法。
［Ｃ６２］前記フィルタバンクは、解析直交ミラーフィルタバンクである、Ｃ５９に記載の方法。
［Ｃ６３］前記フィルタバンクは、音声エンコーダーの一部分である、Ｃ５９に記載の方法。
［Ｃ６４］前記音声エンコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ(Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、Ｃ６３に記載の方法。
［Ｃ６５］前記フィルタバンクは、スペクトル帯域複製（ＳＢＲ）エンコーダの一部分である、Ｃ５９に記載の方法。
［Ｃ６６］前記フィルタバンクは、音声デコーダーの一部分である、Ｃ５９に記載の方法。
［Ｃ６７］前記音声デコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ(Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、Ｃ６５に記載の方法。
［Ｃ６８］前記フィルタバンクは、スペクトル帯域複製（ＳＢＲ）デコーダの一部分である、Ｃ５９に記載の方法。
［Ｃ６９］下記を備えるフィルタバンクデバイス：
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得るように適合されたインタフェース；
１グループのＮ／２個の中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行するように適合されたプレ変換回路；および、
前記周波数領域においてＮ／２個の出力係数を得るために、前記１グループのＮ／２個の中間サンプルに対して変換を適用するように適合された変換回路。
［Ｃ７０］時間領域入力サンプルと周波数領域係数の双方は、実数である、Ｃ６９に記載のフィルタバンクデバイス。
［Ｃ７１］前記変換は、離散コサイン変換（ＤＣＴ）タイプＩＶ変換である、Ｃ６９に記載のフィルタバンクデバイス。
［Ｃ７２］前記フィルタバンクデバイスは、解析直交ミラーフィルタバンクである、Ｃ６９に記載のフィルタバンクデバイス。
［Ｃ７３］前記フィルタバンクは、音声エンコーダーの一部分である、Ｃ６９に記載のフィルタバンクデバイス。
［Ｃ７４］前記音声エンコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ(Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、Ｃ73に記載のフィルタバンクデバイス。
［Ｃ７５］前記フィルタバンクは、スペクトル帯域複製（ＳＢＲ）エンコーダの一部分である、Ｃ６９に記載のフィルタバンクデバイス。
［Ｃ７６］前記フィルタバンクは、音声デコーダーの一部分である、Ｃ６９に記載のフィルタバンクデバイス。
［Ｃ７７］前記音声デコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ(Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、Ｃ７６に記載のフィルタバンクデバイス。
［Ｃ７８］前記フィルタバンクデバイスは、スペクトル帯域複製（ＳＢＲ）デコーダの一部分である、Ｃ６９に記載のフィルタバンクデバイス。
［Ｃ７９］下記を備えるフィルタバンクデバイス：
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得るための手段；
１グループのＮ／２個の中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行するための手段；および、
前記周波数領域においてＮ／２個の出力係数を得るために、前記１グループのＮ／２個の中間サンプルに対して変換を適用するための手段。
［Ｃ８０］前記フィルタバンクデバイスは、解析直交ミラーフィルタバンクである、Ｃ７９に記載のフィルタバンクデバイス。
［Ｃ８１］
前記フィルタバンクは、音声エンコーダーの一部分である、Ｃ７９に記載のフィルタバンクデバイス。
［Ｃ８２］前記フィルタバンクは、スペクトル帯域複製（ＳＢＲ）エンコーダの一部分である、Ｃ７９に記載のフィルタバンクデバイス。
［Ｃ８３］前記フィルタバンクは、音声デコーダーの一部分である、Ｃ７９に記載のフィルタバンクデバイス。
［Ｃ８４］フィルタバンクを実装するように動作が可能なＣＰＵ命令を記録したコンピュータ可読記録媒体であって、１つまたは複数のプロセッサによって実施されるとき、前記ＣＰＵ命令が前記プロセッサに、下記動作を実行させるコンピュータ可読記録媒体：
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得ること；
１グループのＮ／２個の中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること；および、
前記周波数領域においてＮ／２個の出力係数を得るために、前記１グループのＮ／２個の中間サンプルに対して変換を適用する。
［Ｃ８５］時間領域入力サンプルと周波数領域係数の双方は、実数である、Ｃ８４に記載の機械可読媒体。
［Ｃ８６］前記変換は、離散コサイン変換（ＤＣＴ）タイプＩＶ変換である、Ｃ８４に記載の機械可読媒体。
［Ｃ８７］フィルタバンクを実装する方法、該方法は下記を備える：
周波数領域においてオーディオ信号について複数のＮ／２個の入力係数を得ること；時間領域において中間グループのＮ個の出力サンプルを得るために、１グループのＮ／２個の入力係数に対して逆変換を適用すること；および、
複数のＮ個の時間領域出力サンプルを得るために、中間グループのＮ個の入力係数からの、係数の複製操作、符号反転、および並び替えを実行すること。
［Ｃ８８］入力係数および時間領域出力サンプルの双方は、実数である、Ｃ８７に記載の方法。
［Ｃ８９］前記変換は、離散コサイン変換（ＤＣＴ）タイプＩＶ変換であり、前記フィルタバンクは、分子に（２ｎ±ｘ）という因数を有する式によって表され、ここにおいて、ｘは奇数である、Ｃ８７に記載の方法。
［Ｃ９０］前記フィルタバンクは、合成直交ミラーフィルタバンクである、Ｃ８７に記載の方法。
［Ｃ９１］前記フィルタバンクは、音声デコーダーの一部分である、Ｃ８７に記載の方法。
［Ｃ９２］前記音声デコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ(Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、Ｃ９１に記載の方法。
［Ｃ９３］前記フィルタバンクは、スペクトル帯域複製（ＳＢＲ）デコーダの一部分である、Ｃ８７に記載の方法。
［Ｃ９４］下記を備えるフィルタバンクデバイス：
周波数領域においてオーディオ信号についての複数のＮ／２個の入力係数を得るように適合されたインタフェース；
時間領域において中間グループのＮ個の出力サンプルを得るために、前記１グループのＮ／２個の入力係数に対して逆変換を適用するように適合された変換回路；および、
複数のＮ個の時間領域出力サンプルを得るために、前記中間グループのＮ個の入力係数からの、係数の複製操作、符号反転、および並び替えを実行するように適合されたポスト変換回路。
［Ｃ９５］入力係数および時間領域出力サンプルの双方は、実数である、Ｃ９４に記載の方法。
［Ｃ９６］前記逆変換は、離散コサイン変換（ＤＣＴ）タイプＩＶ変換であり、前記フィルタバンクは、分子に（２ｎ±ｘ）という因子を有する式によって表され、ここにおいて、ｘは奇数である、Ｃ９４に記載のフィルタバンクデバイス。
［Ｃ９７］前記フィルタバンクデバイスは、合成直交ミラーフィルタバンクである、Ｃ９４に記載のフィルタバンクデバイス。
［Ｃ９８］前記フィルタバンクデバイスは、音声デコーダーの一部分である、Ｃ９４に記載のフィルタバンクデバイス。
［Ｃ９９］前記音声デコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ(Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも１つを実装する、Ｃ９８に記載のフィルタバンクデバイス。
［Ｃ１００］前記フィルタバンクデバイスは、スペクトル帯域複製（ＳＢＲ）デコーダの一部分である、Ｃ９４に記載のフィルタバンクデバイス。
［Ｃ１０１］下記を備えるフィルタバンクデバイス：
周波数領域においてオーディオ信号について複数のＮ／２個の入力係数を得るための手段；
時間領域において中間グループのＮ個の出力サンプルを得るために、１グループのＮ／２個の入力係数に対して逆変換を適用するための手段；および、
複数のＮ個の時間領域出力サンプルを得るために、中間グループのＮ個の入力係数からの、係数の複製操作、符号反転、および並び替えを実行するための手段。
［Ｃ１０２］入力係数および時間領域出力サンプルの双方は、実数である、Ｃ１０１に記載のフィルタバンクデバイス。
［Ｃ１０３］フィルタバンクを実装するように動作が可能なＣＰＵ命令を記録したコンピュータ可読記録媒体であって、１つまたは複数のプロセッサによって実施されるとき、前記ＣＰＵ命令が前記プロセッサに、下記動作を実行させるコンピュータ可読記録媒体：
周波数領域においてオーディオ信号について複数のＮ／２個の入力係数を得ること；時間領域において中間グループのＮ個の出力サンプルを得るために、１グループのＮ／２個の入力係数に対して逆変換を適用すること；および、
複数のＮ個の時間領域出力サンプルを得るために、中間グループのＮ個の入力係数からの、係数の複製操作、符号反転、および並び替えを実行すること。
［Ｃ１０４］入力係数および時間領域出力サンプルの双方は、実数である、Ｃ１０３に記載の機械可読媒体。

Claims

フィルタバンクを実装する方法、該方法は下記を備える：
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得ること；
第１グループおよび第２グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、Ｎ／２個の中間サンプルを有する；
前記第２グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること；
周波数領域において第１グループの出力係数を得るために、前記第１グループの中間サンプルに対して第１の変換を適用すること；
前記周波数領域において中間第２グループの出力係数を得るために、前記第２グループの中間サンプルに対して第２の変換を適用すること；および、
第２グループの出力係数を得るために、前記中間第２グループの出力係数における係数の順序を逆にすること。
使用される前記時間領域入力サンプルは実数領域内のサンプルであり、前記周波数領域は複素領域である、請求項１に記載の方法。
前記第１グループの出力係数は、実数の係数から成り、前記第２グループの出力係数は、虚数の係数から成る、請求項１に記載の方法。
前記第１の変換および第２の変換は、双方とも、離散コサイン変換（ＤＣＴ）タイプＩＶ変換であり、前記フィルタバンクは、分子に（２ｎ±ｘ）の因数を有する式によって表される、ここにおいて、ｘは奇数である、請求項１に記載の方法。
前記第１の変換および第２の変換は、前記第１グループおよび第２グループの中間サンプルを変換するために同時に動作する、請求項１に記載の方法。
前記フィルタバンクは、解析直交ミラーフィルタバンクである、請求項１に記載の方法。
前記フィルタバンクは、音声エンコーダーの一部分である、請求項１に記載の方法。
前記音声エンコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ(Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ(Spatial Audio Coding）、およびＭＰＥＧＵＳＡＣ(Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、請求項７に記載の方法。
前記フィルタバンクは、スペクトル帯域複製（ＳＢＲ）エンコーダの一部分である、請求項１に記載の方法。
前記フィルタバンクは、音声デコーダーの一部分である、請求項１に記載の方法。
前記音声デコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ(Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ(High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、請求項１０に記載の方法。
前記フィルタバンクは、スペクトル帯域複製（ＳＢＲ）デコーダの一部分である、請求項１に記載の方法。
下記を備えるフィルタバンクデバイス：
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得るように適合されたインタフェース；
下記を実行するように適合されたプレ変換回路：
第１グループおよび第２グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、Ｎ／２個の中間サンプルを有する；
前記第２グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること；
周波数領域において第１グループの出力係数を得るために、前記第１グループの中間サンプルに対して第１の変換を適用するように適合された第１の変換回路と；
前記周波数領域において中間第２グループの出力係数を得るために、前記第２グループの中間サンプルに対して第２の変換を適用するように適合された第２の変換回路と；
第２グループの出力係数を得るために、前記中間第２グループの出力係数における係数の順序を逆にするように適合されたポスト変換回路。
使用される前記時間領域入力サンプルは実数領域内のサンプルであり、前記周波数領域は複素領域である、請求項１３に記載のフィルタバンクデバイス。
前記第１グループの出力係数は、実数の係数から成り、前記第２グループの出力係数は、虚数の係数から成る、請求項１３に記載のフィルタバンクデバイス。
前記第１の変換および第２の変換は、双方とも、離散コサイン変換（ＤＣＴ）タイプＩＶ変換であり、前記フィルタバンクデバイスは、分子に（２ｎ±ｘ）という因子を有する式によって表される、ここにおいて、ｘは奇数である、請求項１３に記載のフィルタバンクデバイス。
前記第１の変換および第２の変換は、前記第１グループおよび第２グループの中間サンプルを変換するために同時に動作する、請求項１３に記載のフィルタバンクデバイス。
前記フィルタバンクデバイスは、解析直交ミラーフィルタバンクである、請求項１３に記載のフィルタバンクデバイス。
前記フィルタバンクデバイスは、音声エンコーダーの一部分である、請求項１３に記載のフィルタバンクデバイス。
前記音声エンコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ(Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ-ＡＡC(High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、請求項１９に記載のフィルタバンクデバイス。
前記フィルタバンクデバイスは、スペクトル帯域複製（ＳＢＲ）エンコーダの一部分である、請求項１３に記載のフィルタバンクデバイス。
前記フィルタバンクデバイスは、音声デコーダーの一部分である、請求項１３に記載のフィルタバンクデバイス。
前記音声デコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ（Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ-ＡＡＣ(High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも1つを実装する、請求項２２に記載のフィルタバンクデバイス。
前記フィルタバンクデバイスは、スペクトル帯域複製（ＳＢＲ）デコーダの一部分である、請求項１３に記載のフィルタバンクデバイス。
下記を備えるフィルタバンクデバイス：
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得るための手段；
第１グループおよび第２グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行するための手段、なお、各グループは、Ｎ／２個の中間サンプルを有する；
前記第２グループにおける奇数インデクス付けされた中間サンプルの符号を反転するための手段；
周波数領域において第１グループの出力係数を得るために、前記第１グループの中間サンプルに対して第１の変換を適用するための手段；
前記周波数領域において中間第２グループの出力係数を得るために、前記第２グループの中間サンプルに対して第２の変換を適用するための手段；および、
第２グループの出力係数を得るために、前記中間第２グループの出力係数における係数の順序を逆にするための手段。
前記フィルタバンクデバイスは、音声エンコーダーの一部分である、請求項２５に記載のフィルタバンクデバイス。
前記音声エンコーダーは、ＭＰＥＧＡＡＣ−ＥＬＤ（Advance Audio Coding Enhanced Low Delay)標準規格、ＭＰＥＧＨＥ−ＡＡＣ（High Efficiency AAC)標準規格、ＭＰＥＧＳＡＯＣ（Spatial Audio Coding)、およびＭＰＥＧＵＳＡＣ（Unified Speech and Audio Coding)標準規格、のうちの少なくとも１つを実装する、請求項26に記載のフィルタバンクデバイス。
前記フィルタバンクデバイスは、スペクトル帯域複製（ＳＢＲ）エンコーダの一部分である、請求項２５に記載のフィルタバンクデバイス。
前記フィルタバンクデバイスは、音声デコーダーの一部分である、請求項２５に記載のフィルタバンクデバイス。
フィルタバンクを実装するような動作が可能な複数の命令を記録した機械可読記憶媒体であって、１つまたは複数のプロセッサによって実施されるとき、前記命令が前記プロセッサに、下記動作を実行させる機械可読記憶媒体：
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得ること；
第１グループおよび第２グループの中間サンプルを得るために、前記時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、Ｎ／２個の中間サンプルを有する；
前記第２グループにおける奇数インデクス付けされた中間サンプルの符号を反転すること；
周波数領域において第１グループの出力係数を得るために、前記第１グループの中間サンプルに対して第１の変換を適用すること；
前記周波数領域において中間第２グループの出力係数を得るために、前記第２グループの中間サンプルに対して第２の変換を適用すること；および、
第２グループの出力係数を得るために、前記中間第２グループの出力係数における係数の順序を反転すること。
使用される前記時間領域入力サンプルは実数領域内のサンプルである一方で、前記周波数領域は複素領域である、請求項３０に記載の機械可読記憶媒体。
前記第１グループの出力係数は、実数の係数から成り、前記第２グループの出力係数は、虚数の係数から成る、請求項３０に記載の機械可読記憶媒体。
フィルタバンクを実装するように動作が可能な複数の命令を記録した機械可読記憶媒体であって、１つまたは複数のプロセッサによって実施されるとき、前記プロセッサに下記動作を実行させる前記命令を備える機械可読記憶媒体：
複数のＮ個の時間領域入力サンプルとして入力オーディオ信号を得ること；
第１グループおよび第２グループの中間サンプルを得るために、時間領域入力サンプルのペア毎の加算および減算を実行すること、なお、各グループは、Ｎ／２個の中間サンプルを有する；
前記第２グループにおける奇数でインデクス付けされた中間サンプルの符号を反転することと；
周波数領域において第１グループの出力係数を得るために、前記第１グループの中間サンプルに対して第１の変換を適用すること；
前記周波数領域において第２グループの中間の出力係数を得るために、前記第２グループの中間サンプルに対して第２の変換を適用すること；
第２グループの出力係数を得るために、前記第２グループの中間の出力係数における係数の順序を逆にすること。
前記第１グループの入力係数は、実数の係数から成り、前記第２グループの入力係数は、虚数の係数から成る、請求項３３に記載の機械可読記憶媒体。
前記周波数領域は複素領域であり、前記時間領域サンプルは実数領域内のサンプルである、請求項３３に記載の機械可読記憶媒体。