JP2010507820A

JP2010507820A - オーディオ副帯値を生成する装置及び方法、並びに、時間領域オーディオサンプルを生成する装置及び方法

Info

Publication number: JP2010507820A
Application number: JP2009533722A
Authority: JP
Inventors: シュネール、マルクス; ルツキー、マンフレート; ローヴァーサー、マルクス; シュミット、マルクス; ゲイヤー、マルク; メラー、ミカエル; エードラー、バーント; ムルトラス、マルクス; シューラー、ゲラルド; ゲイガー、ラルフ; グリル、バーンハート
Original assignee: フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date: 2006-10-25
Filing date: 2007-10-23
Publication date: 2010-03-11
Anticipated expiration: 2027-10-23
Also published as: ES2947516T3; AR063400A1; PT3848928T; CN101606194B; AU2007308416B2; US20100023322A1; TWI357065B; NO342691B1; BRPI0709310B1; US8438015B2; ZA200902199B; EP4325723A2; EP2076901B1; NO20084012L; ES2966657T3; AR063394A1; DE602007001460D1; FI3848928T3; EP2109098A3; JP4936569B2

Abstract

オーディオ副帯チャンネルのオーディオ副帯値を生成する装置（１００）の一実施形態は、ウィンドウ処理後サンプルを得るために、初期のサンプルから後期のサンプルに至る時間系列にある時間領域オーディオ入力サンプルフレーム（１２０）を、ウィンドウ係数列を含む解析ウィンドウ関数（１９０）を使用してウィンドウ処理するための解析ウィンドウ処理部（１１０）を有する。解析ウィンドウ関数（１９０）はウィンドウ係数第１グループ（２００）及びウィンドウ係数第２グループ（２１０）を含む。ウィンドウ係数第１グループ（２００）は後期の時間領域サンプルをウィンドウ処理するのに使用され、ウィンドウ係数第２グループ（２１０）は初期の時間領域サンプルをウィンドウ処理するのに使用される。装置（１００）は、さらに、ウィンドウ処理後サンプルを使用してオーディオ副帯値を算出するための計算機（１７０）を有する。
【選択図】図１

Description

本発明の実施形態はオーディオ副帯値を生成する装置及び方法、並びに、時間領域オーディオサンプルを生成する装置及び方法及び前記いずれかの装置を含むシステムに関し、本発明の実施形態は、例えば最近のオーディオ符号化、オーディオ復号化又は他のオーディオ転送に関する応用分野で実施可能である。

最近のデジタルオーディオ処理は、概して、オーディオデータの直接転送又は直接保存と比較して、ビットレート、転送帯域幅及び保存スペースに関してかなりの節約を可能にする符号化体系に基づいているものである。これは、オーディオデータを送信側で符号化し、符号化されたデータを例えばリスナー又は更なる信号処理部に提供する前に、受信側で復号化することによって達成される。

このようなデジタルオーディオ処理システムは、概して、一方では転送されたあるいは処理されたオーディオデータの質に影響を及ぼす広範囲のパラメータと、他方ではコンピュータ処理能力、帯域幅及び他の性能に関するパラメータに関して実施可能である。高品質であるためには、高いビットレート、複雑なコンピュータ処理及び対応する復号化されたオーディオデータのためのより大きい記憶容量が必要となることが非常によくある。従って、計画している応用により、許容ビットレート、容認可能なコンピュータ処理の複雑さ、容認可能なデータ量というような要因は、望ましい達成可能な質とバランスを取る必要がある。

双方向又は一方向通信のような同時アプリケーションにとって特に重要であるさらに別のパラメータや、異なる符号化体系によって生じる遅延もまた、重要な役割を果たす。従って、応用分野が計画中のものに特定されている異なる符号化体系の必要性とコストのバランスを取る際に、オーディオ符号化・復号化によって生じる遅延が、前述したパラメータの点から、さらに別の制限を与える。このようなデジタルオーディオシステムは超低質転送から最高転送までの多様な分野に応用可能であるので、異なるパラメータと異なる制限がそれぞれのオーディオシステムに課せられることが非常によくある。いくつかの応用において、より小さい遅延のために、より高いビットレートが必要とされ、従って、高い遅延を有するオーディオシステムと比較して、同等の質レベルとしては、より広い転送帯域が必要となる場合がある。

しかし、多くの場合、ビットレート、コンピュータ処理の複雑さ、メモリー条件、質及び遅延などの多様なパラメータに関して、妥協が必要とされる。

オーディオ副帯チャンネルのオーディオ副帯値を生成する装置の一実施形態は、ウィンドウ処理後サンプルを得るために、初期のサンプルから後期のサンプルに及ぶ時間列内にある時間領域オーディオ入力サンプルのフレームを、ウィンドウ係数列を含む解析ウィンドウ関数を使用してウィンドウ処理するための解析ウィンドウ処理部を有する。解析ウィンドウ関数は、ウィンドウ係数の第１部分を含むウィンドウ係数第１グループ、及びウィンドウ係数の第２部分を含むウィンドウ係数第２グループを含み、第１部分は第２部分よりも少ない個数のウィンドウ係数を含み、第１部分のウィンドウ係数のエネルギー値は第２部分のウィンドウ係数のエネルギー値よりも高い。ウィンドウ係数第１グループは後期の時間領域サンプルをウィンドウ処理するために使用され、ウィンドウ係数第２グループは初期の時間領域サンプルをウィンドウ処理するために使用される。さらに、この実施形態は、ウィンドウ処理後サンプルを使用してオーディオ副帯値を算出する計算機を有する。

時間領域オーディオサンプルを生成する装置の一実施形態は、オーディオ副帯チャンネルのオーディオ副帯値から中間時間領域サンプル列を算出するための計算機を有し、この中間時間領域サンプル列は初期の中間時間領域サンプル及び後期の中間時間領域サンプルを含む。この実施形態は、さらに、ウィンドウ処理後中間時間領域サンプルを得るために、ウィンドウ係数列を含む合成ウィンドウ関数を使用して、中間時間領域サンプル列をウィンドウ処理するための合成ウィンドウ処理部を有する。この合成ウィンドウ処理部は、ウィンドウ係数の第１部分を含むウィンドウ係数第１グループ、及びウィンドウ係数の第２部分を含むウィンドウ係数第２グループを含む。第１部分は第２部分よりも少ない個数のウィンドウ係数を含み、第１部分のウィンドウ係数のエネルギー値は第２部分のウィンドウ係数のエネルギー値よりも高い。ウィンドウ係数第１グループは後期の中間時間領域サンプルをウィンドウ処理するために使用され、ウィンドウ係数第２グループは初期の中間時間領域サンプルをウィンドウ処理するために使用される。さらに、この時間領域オーディオサンプルを生成する装置の一実施形態は、時間領域サンプルを得るために、ウィンドウ処理後中間時間領域サンプルを処理するための重複／加算出力部を有する。

オーディオ副帯値生成装置の一実施形態のブロック図である。時間領域オーディオサンプル生成装置の一実施形態のブロック図である。時間領域サンプル生成装置という形での本発明の実施形態に係る機能原理を示す。本発明の一実施形態に係るウィンドウ係数の補間の概念を示す。正弦ウィンドウ関数の場合のウィンドウ係数の補間を示す。ＳＢＲデコーダ及びＳＢＲエンコーダを有する本発明の一実施形態のブロック図である。ＳＢＲシステムの遅延源を示す。オーディオ副帯値生成方法の一実施形態のフローチャートである。図７Ａの方法の実施形態の一ステップを示す。オーディオ副帯値生成方法の一実施形態のフローチャートである。時間領域サンプル生成方法の一実施形態のフローチャートである。時間領域サンプル生成方法の一実施形態のフローチャートである。時間領域サンプル生成方法の別の実施形態のフローチャートである。時間領域サンプル生成方法のさらに別の実施形態のフローチャートである。オーディオ副帯値生成方法の実施形態の可能な実行を示す。オーディオ副帯値生成方法の実施形態の可能な実行を示す。時間領域サンプル生成方法の一実施形態の可能な実行を示す。時間領域サンプル生成方法の一実施形態の別の可能な実行を示す。本発明の一実施形態に係る合成ウィンドウ関数と正弦ウィンドウ関数との比較を示す。本発明の一実施形態に係る合成ウィンドウ関数とＳＢＲＱＭＦプロトタイプフィルター関数との比較を示す。図１２のウィンドウ関数とプロトタイプフィルター関数それぞれによって生じる多様な遅延を示す。従来のＡＡＣ−ＬＤ＋ＳＢＲコーデックと本発明の一実施形態を含むＡＡＣ−ＥＬＤコーデックそれぞれの遅延に対する影響を示す表である。多様なコーデックの多様な部品の遅延に関する詳細を示す表である。本発明の一実施形態に係るウィンドウ関数を使用した装置と正弦ウィンドウ関数を使用した装置との周波数応答に関する比較を示す。図１５Ａに示す周波数応答の一部拡大図である。四つの異なるウィンドウ関数の周波数応答に関する比較を示す。図１６Ａに示す周波数応答の一部拡大図である。二つの異なるウィンドウ関数の周波数応答に関する比較を示し、一つは本発明に係るウィンドウ関数であり、もう一つは対称ウィンドウ関数である。人間の耳の一般的な一時的マスキング特性を示す概略図である。元々のオーディオ時間信号、ＨＥＡＡＣコーデックに基づき生成された時間信号及び本発明の一実施形態を含むコーデックに基づく時間信号の比較を示す。元々のオーディオ時間信号、ＨＥＡＡＣコーデックに基づき生成された時間信号及び本発明の一実施形態を含むコーデックに基づく時間信号の比較を示す。元々のオーディオ時間信号、ＨＥＡＡＣコーデックに基づき生成された時間信号及び本発明の一実施形態を含むコーデックに基づく時間信号の比較を示す。

以下に、添付図面を参照して本発明の実施形態を説明する。

図１〜図１９は、オーディオ副帯値を生成する装置及び方法、時間領域サンプルを生成する装置及び方法、並びに前記装置及び方法のうちの少なくとも一つを含むシステムの多様な実施形態の機能的特性及び特徴を説明するブロック図及び他の図表を示す。本発明の第１実施形態を詳細に説明する前に、本発明の実施形態はハードウェア及びソフトウェアで実現可能であることを明記しておく。従って、それぞれの実施形態のハードウェア実施のブロック図に関する説明は、それに相当する方法の適当な実施形態に関するフローチャートとしても考えられ得る。また、本発明の一実施形態を説明するフローチャートは、それに相当するハードウェア実施のブロック図としても考えられ得る。

以下に、フィルターバンクの実施形態を説明するが、それらは解析フィルターバンク又は合成フィルターバンクとして実施可能である。解析フィルターバンクは、初期のサンプルから後期のサンプルに至る時間系列に存在する時間領域オーディオ（入力）サンプルに基づき、オーディオ副帯チャンネルのオーディオ副帯値を生成する装置である。換言すれば、解析フィルターバンクという言葉は、オーディオ副帯値生成装置という形での本発明の一実施形態と同義に使用できる。同様に、合成フルターバンクは、オーディオ副帯チャンネルのオーディオ副帯値から時間領域オーディオサンプルを生成するためのフィルターバンクである。つまり、合成フィルターバンクという言葉は、時間領域オーディオサンプル生成装置という形での本発明の一実施形態と同義に使用できる。

解析フィルターバンク及び合成フィルターバンクはどちらも概してフィルターバンクと称されるが、例えば変調フィルターバンクとして実施できる。変調フィルターバンクの例や実施形態は後に詳述するが、それらは周波数領域の対応する副帯の中心周波数に基づく周波数を有する振動に基づくものである。「変調」という言葉は、ここでは、前記振動が、このような変調フィルターバンクの詳細な実施状況に応じて、ウィンドウ関数又はプロトタイプフィルター関数に関して使用されるという事実を示している。変調フィルターバンクは、原則的に、調和振動（正弦振動又は余弦振動）などの実数値振動、又は複合値振動（複素励振）に基づき可能である。従って、変調フィルターバンクは、実数変調フィルターバンク又は複合フィルター変調フィルターバンクと称される。

以下に、複合変調低遅延フィルターバンク及び実数変調低遅延フィルターバンクという形での本発明の実施形態、及びこれらに相当する方法とソフトウェア実施を詳細に説明する。このような変調低遅延フィルターバンクの主な応用の一つは低遅延スペクトル帯域再生システム（ＳＢＲ）への統合であり、ＳＢＲは、現在、対称プロトタイプフィルターと共に複合ＱＭＦフィルターバンク（ＱＭＦ＝直角ミラーフィルター）の使用に基づくものである。

本明細書の以下の説明から明らかになるであろうが、本発明の実施形態に係る低遅延フィルターバンクは、遅延、周波数応答、一時的なノイズ分散及び再生の質の間のトレードオフを向上させるという利点を有する。

特に、遅延と再生の質との間の前記トレードオフの向上は、更なる遅延を生み出すことなく、それぞれのフィルターバンクのフィルターインパルス応答を向上させるためのいわゆる０遅延技術を使用する方法に基づくものである。本発明の一実施形態に係る解析フィルターバンク又は合成フィルターバンクを採用することにより、既定の質のレベルでのより低い遅延、既定の遅延レベルでのより高い質、又は遅延と質両方同時の向上が達成できる。

本発明の実施形態は、これらの向上は、前述の二つのフィルターバンクのいずれかに新たなウィンドウ関数を使用することで達成できる。換言すれば、質及び／又は遅延は、以下のような一つのウィンドウ係数列を含む解析ウィンドウ関数を解析フィルターバンクに使用することで向上できる。このウィンドウ関数は、前記ウィンドウ係数列の第１連続部分を含む第１グループ、及び前記ウィンドウ係数列の第２連続部分を含む第２グループを含む。第１部分及び第２部分はウィンドウ関数の全てのウィンドウ係数を含む。さらに、第１部分は第２部分よりも少ない個数のウィンドウ係数を含むが、第１部分内のウィンドウ係数のエネルギー値は第２部分内のウィンドウ係数のエネルギー値よりも高い。第１グループのウィンドウ係数は後期の時間領域サンプルをウィンドウ処理するのに使用され、第２部分のウィンドウ係数は初期の時間領域サンプルをウィンドウ処理するのに使用される。ウィンドウ関数のこの形が、時間領域サンプルを、初期に、高いエネルギー値を有するウィンドウ係数で処理する機会を与えることになる。これは、前述したようなウィンドウ係数の二つの部分への配置と、これらのウィンドウ係数の時間領域オーディオサンプル列への応用の結果である。つまり、このようなウィンドウ関数の使用により、ある一定の質レベルでフィルターバンクにより導入される遅延の低下、あるいは、ある一定の遅延レベルにおける質の向上が可能となる。

従って、時間領域オーディオサンプルを生成する装置及び方法という形での本発明の実施形態において、合成ウィンドウ処理部は、第１（連続）部分と第２（連続）部分に対応して整列された一列の合成ウィンドウ係数を含む合成ウィンドウ関数を使用する。また、合成ウィンドウ関数において、第１部分のウィンドウ係数のエネルギー値つまり第１部分全体のエネルギー値は第２部分のウィンドウ係数のエネルギー値つまり第２部分全体のエネルギー値よりも高く、第１部分のウィンドウ係数の個数は第２部分のウィンドウ係数の個数よりも少ない。このウィンドウ係数の二つの部分への配置のために、また、合成ウィンドウ処理部は後期の時間領域サンプルをウィンドウ処理するために第１部分のウィンドウ係数を使用し、初期の時間領域サンプルをウィンドウ処理するために第２部分のウィンドウ係数を使用するという事実のために、前述の効果及び利点が合成フィルターバンク又はこれに相当する方法の実施形態にもあてはまる。

本発明の構成に採用される合成ウィンドウ関数及び解析ウィンドウ関数について、以下に詳細に説明する。本発明の多くの実施形態において、合成ウィンドウ関数及び／又は解析ウィンドウ関数のウィンドウ係数列は、正に第１グループのウィンドウ係数と第２グループのウィンドウ係数から成る。さらに言えば、ウィンドウ係数列の各ウィンドウ係数は、第１グループ又は第２グループのどちらかに正に属する。

第１グループ、第２グループのそれぞれは、ウィンドウ係数列の正に一部分を連続的に含む。本明細書では、一部分は、ウィンドウ係数列に応じた一組の連続したウィンドウ係数を含む。本発明の実施形態において、第１グループ、第２グループのそれぞれは、まさに前述のようなウィンドウ係数列の一部分を含む。それぞれのウィンドウ係数グループは、それぞれのグループの一部分に属さないいかなるウィンドウ係数も含まない。換言すれば、本発明の多くの実施形態において、ウィンドウ係数第１グループ、第２グループのそれぞれは、ウィンドウ係数第１部分とウィンドウ係数第２部分のみを含み、それ以外のウィンドウ係数は含まない。

本明細書において、ウィンドウ係数列の連続部分は、数学的な意味でウィンドウ係数の連続集合として理解されるべきものであり、この集合には、それぞれの部分のウィンドウ係数の一範囲（例えば指数範囲）に存在する一連のウィンドウ係数と比較して、欠けたウィンドウ係数が全くない。つまり、本発明の多くの実施形態において、ウィンドウ係数列は正に二つのウィンドウ係数連続部分に分けられ、これらはそれぞれウィンドウ係数の第１グループ、第２グループを形成する。これらの場合、ウィンドウ係数第１グループに含まれる各ウィンドウ係数は、ウィンドウ係数列全体に関して、ウィンドウ係数第２グループの各ウィンドウ係数の前又は後に配置されている。

さらに換言すると、本発明の多くの実施形態において、ウィンドウ係数列は、いかなるウィンドウ係数をも省略することなく、正に二つのグループに分けられる。ウィンドウ係数列、また、これらの順序に応じて、二つのグループのそれぞれは、ボーダーウィンドウ係数まで（ボーダーウィンドウ係数を除く）、あるいはボーダーウィンドウ係数から（ボーダーウィンドウ係数を含む）全てのウィンドウ係数を含む。一例として、６４０個のウィンドウ係数（指数０〜６３９）を含むウィンドウ関数の場合、第１部分つまり第１グループは指数０〜９５のウィンドウ係数を含み、第２部分つまり第２グループは指数９６〜６３９のウィンドウ係数を含んでいてもよい。ここで、ボーダーのウィンドウ係数は指数９６のウィンドウ係数である。当然、他の例も可能である（例えば、０〜５４３と５４４〜６３９）。

以下に説明する解析フィルターバンクの実施形態は、１０ブロックの入力サンプルをカバーするフィルター長を有するが、たった２ブロックのシステム遅延しか生じさせないものである。この遅延は、ＭＤＣＴ（修正離散余弦変換）又はＭＤＳＴ（修正離散正弦変換）によって引き起こされる遅延と同程度のものである。ＭＤＣＴ又はＭＤＳＴを使用する場合との違いは、フィルター長が１０ブロックの入力サンプルをカバーする長いものであるので、重複がＭＤＣＴ又はＭＤＳＴの場合の１ブロックから９ブロックに増加することである。しかし、別の個数の入力サンプル（オーディオ入力サンプルと称してもよい）ブロックをカバーするような別の実施が行われてもよい。さらに、他のトレードオフも考慮でき、実行することも可能である。

図１は、オーディオ副帯チャンネルのオーディオ副帯値を生成するための装置の一実施形態として、解析フィルターバンク１００を示すブロック図である。解析フィルターバンク１００は、時間領域オーディオ入力サンプルフレーム１２０をウィンドウ処理するための解析ウィンドウ処理部１１０を有する。フレーム１２０は、Ｔ個の時間領域オーディオ（入力）サンプルブロック１３０−１，…，１３０−Ｔを含み、Ｔは整数であり、図１の実施形態の場合、Ｔは１０である。しかし、フレーム１２０は別の個数のブロック１３０を含んでいてもよい。

フレーム１２０も各ブロック１３０も、図１中矢印１４０で示されている時間軸に沿って初期のサンプルから後期のサンプルに至る時間列内の時間領域オーディオ入力サンプルを含む。換言すれば、図１において、時間領域オーディオサンプル（この場合、時間領域オーディオ入力サンプルでもある）が右寄りであればあるほど、その時間領域オーディオサンプルは、時間領域オーディオサンプル列に関して後方にある。

解析ウィンドウ処理部１１０は、時間領域オーディオサンプル列に基づき、時間領域のウィンドウ処理後サンプルを生成し、それらはウィンドウ処理後サンプルのフレーム１５０に配列される。時間領域オーディオ入力サンプルのフレーム１２０に応じて、ウィンドウ処理後サンプルのフレーム１５０も、Ｔ個のウィンドウ処理後サンプルブロック１６０−１，…，１６０−Ｔを含む。本発明の好ましい実施形態において、ウィンドウ処理後サンプルの各ブロック１６０は、時間領域オーディオ入力サンプルの各ブロック１３０内のオーディオ入力サンプルと同じ個数のウィンドウ処理後サンプルを含む。従って、各ブロック１３０がＮ個の時間領域入力オーディオサンプルを含む場合、フレーム１２０及びフレーム１５０のそれぞれはＴ・Ｎ個のサンプルを含む。この場合、Ｎは正の整数で、例えば３２又は６４という値を取る。この場合、Ｔ＝１０であれば、フレーム１２０，１５０のそれぞれは３２０又は６４０個のサンプルを含む。

解析ウィンドウ処理部１１０は、解析ウィンドウ処理部１１０によって与えられるウィンドウ処理後サンプルに基づきオーディオ副帯値を算出する計算機１７０に接続されている。オーディオ副帯値は計算機１７０によってオーディオ副帯値ブロック１８０として与えられ、各オーディオ副帯値は一つのオーディオ副帯チャンネルに相当する。本実施形態において、オーディオ副帯値ブロック１８０もまたＮ個の副帯値を含む。

各オーディオ副帯値チャンネルは特有の中心周波数に対応する。多様なオーディオ副帯チャンネルの中心周波数は、例えば、解析フィルターバンク１００に与えられる時間領域オーディオ入力サンプルによって説明されるようなオーディオ信号の周波数帯域幅に関して、等しく分配又は等間隔で配置されている。

解析ウィンドウ処理部１１０は、フレーム１５０のウィンドウ処理後サンプルを得るために、フレーム１２０の時間領域オーディオ入力サンプルを、ウィンドウ係数列を含む解析ウィンドウ関数に基づきウィンドウ処理する。解析ウィンドウ処理部１１０は、時間領域オーディオサンプルフレーム１２０のウィンドウ処理を、時間領域オーディオサンプルを解析ウィンドウ関数のウィンドウ係数で掛け算することにより行うものである。換言すれば、ウィンドウ処理は、時間領域オーディオサンプルと対応するウィンドウ係数との素子ごとの掛け算を含む。時間領域オーディオサンプル及びウィンドウ係数はどちらも対応する列であるので、ウィンドウ係数と時間領域オーディオサンプルとの素子ごとの掛け算は、例えばサンプルとウィンドウ係数指数によって示されるようなそれぞれの順序に基づき行われる。

図１に示すような解析フィルターバンク１００という形での本発明の実施形態における解析ウィンドウ関数及び合成フィルターバンクの場合の合成ウィンドウ関数は、実数値のウィンドウ係数のみを含む。つまり、ウィンドウ係数指数に帰する各ウィンドウ係数は実数値である。

ウィンドウ係数全体でそれぞれのウィンドウ関数を形成し、この一例が図１に解析ウィンドウ関数１９０として示されている。前述したように、解析ウィンドウ関数１９０を形成するウィンドウ係数列はウィンドウ係数の第１グループ２００及び第２グループ２１０を含む。第１グループ２００は、ウィンドウ係数列のうちのウィンドウ係数第１連続部分を含み、第２グループ２１０はウィンドウ係数第２連続部分を含む。第１グループ２００の第１部分と第２グループ２１０の第２部分は、解析ウィンドウ関数１９０のウィンドウ係数列全体を形成する。さらに、ウィンドウ係数列の各ウィンドウ係数は、ウィンドウ係数の第１部分又は第２部分のどちらかに属し、従って、解析ウィンドウ関数１９０全体が第１部分及び第２部分のウィンドウ係数によって形成される。図１中矢印２００，２１０で示されているように、ここでは、ウィンドウ係数第１部分はウィンドウ係数第１グループ２００と同じであり、ウィンドウ係数第２部分はウィンドウ係数第２グループ２００と同じである。

ウィンドウ係数第１グループ２００のウィンドウ係数の個数は、ウィンドウ係数第２グループ２１０のウィンドウ係数の個数よりも少ない。しかし、第１グループ２００のエネルギー値つまりその全体のエネルギー値は、第２グループ２１０のエネルギー値つまりその全体のエネルギー値よりも高い。以下に説明するように、ウィンドウ係数の集合のエネルギー値は、そのウィンドウ係数の絶対値の２乗の合計に基づく。

本発明の実施形態において、解析ウィンドウ関数１９０及びそれに対応する合成ウィンドウ関数は、ウィンドウ係数列又はウィンドウ係数の指数に関して、非対称である。解析ウィンドウ１９０を定義するウィンドウ係数指数の定義集合において、全ての実数ｎに対して、別の実数ｎ₀が、ウィンドウ係数指数（ｎ₀−ｎ）に対応するウィンドウ係数の絶対値がウィンドウ係数指数（ｎ₀＋ｎ）に対応するウィンドウ係数の絶対値とは等しくならない（（ｎ₀−ｎ）及び（ｎ₀＋ｎ）は定義集合に属する）ように存在する場合、解析ウィンドウ関数１９０は非対称である。

また、図１に概略的に示されているように、解析ウィンドウ関数１９０は、二つの連続するウィンドウ係数の積が負となる符号変換を含む。本発明の実施形態に係る可能なウィンドウ関数の特徴に関しては、図１１〜１９を参照して後に詳述する。

前述したように、ウィンドウ処理後サンプルフレーム１５０は、時間領域入力サンプルフレーム１２０と同様に、個々のブロック１６０−１，…，１６０−Ｔから成るブロック構造を有する。解析ウィンドウ処理部１１０は、時間領域オーディオ入力サンプルの値を解析ウィンドウ関数１９０のウィンドウ係数で掛け算することにより、時間領域オーディオ入力サンプルをウィンドウ処理するものであるので、ウィンドウ処理後サンプルフレーム１５０もまた時間領域である。計算機１７０は、ウィンドウ処理後サンプルフレーム１５０を使用してオーディオ副帯値、あるいはより詳細には、オーディオ副帯値ブロック１８０を算出し、時間領域から周波数領域への変換を行う。従って計算機１７０は時間／周波数コンバータと見なすことができ、オーディオ副帯値ブロック１８０をウィンドウ処理後サンプルフレーム１５０のスペクトル表示として与えることができる。

ブロック１８０の各オーディオ副帯値は特有の周波数を有する一つの副帯に相当する。ブロック１８０に含まれるオーディオ副帯値の個数は帯域数と称される場合もある。

本発明の多くの実施形態において、ブロック１８０のオーディオ副帯値の個数は、フレーム１２０の各ブロック１３０内の時間領域オーディオ入力サンプルの個数と同じである。ウィンドウ処理後サンプルフレーム１５０がフレーム１２０と同じブロック構造を有し、ウィンドウ処理後サンプルの各ブロック１６０が時間領域オーディオ入力サンプルの各ブロック１３０内と同じ個数のウィンドウ処理後サンプルを含む場合、オーディオ副帯値のブロック１８０も当然、ブロック１６０内と同じ個数の値を含む。

フレーム１２０は、新たな時間領域オーディオ入力サンプルのブロックに基づき、ブロック１３０−１，…，１３０−（Ｔ−１）を、時間方向を示す矢印１４０とは逆の方向に一ブロック移動させることにより、任意に生成できる。これにより、処理されるべき時間領域オーディオ入力サンプルフレーム１２０は、直前の時間領域オーディオサンプルフレーム１２０の（Ｔ−１）個の後期のブロックを初期の時間領域オーディオサンプルの方向に一ブロック分だけ移動させ、新たな時間領域オーディオ入力サンプルの新しいブロック２２０を、現在のフレーム１２０の最新の時間領域オーディオ入力サンプルを含む新しいブロック１３０−１として追加することにより、生成される。図１中、これは、ブロック１３０−１，…，１３０−（Ｔ−１）の矢印１４０とは反対方向への移動を示す一連の点線矢印２３０によって示されている。

ブロック１３０の矢印１４０で示される時間方向とは反対方向への移動により、処理されるべき現在のフレーム１２０は、直前のフレーム１２０のブロック１３０−（Ｔ−１）を新たな１３０−Ｔのブロックとして含む。同様に、処理されるべき現在のフレーム１２０のブロック１３０−（Ｔ−１），…，１３０−２は、直前のフレーム１２０のブロック１３０−（Ｔ−２），…，１３０−１と同じである。直前のフレーム１２０のブロック１３０−Ｔは廃棄される。

従って、新しいブロック２２０内の各時間領域オーディオサンプルは、時間領域オーディオ入力サンプルのＴ個の連続するフレーム１２０をＴ回連続して処理する間に、それぞれＴ回処理される。従って、新しいブロック２２０内の各時間領域オーディオ入力サンプルはＴ個の異なるフレーム１２０の一部となるだけでなく、Ｔ個の異なるウィンドウ処理後サンプルフレーム１５０及びＴ個のオーディオ副帯値ブロック１８０の一要因となる。前述したように、本発明の好ましい実施形態においては、フレーム１２０のブロックの個数Ｔは１０であり、解析フィルターバンク１００に与えられる各時間領域オーディオサンプルは、１０個の異なるオーディオ副帯値ブロック１８０に影響する。

最初に、一つのフレーム１２０が解析フィルターバンク１００によって処理される前に、そのフレーム１２０は小さな絶対値（既定の閾値未満）、例えば０に初期化され得る。以下に詳述するが、解析ウィンドウ関数１９０の形は、中心点または「質量の中心」を有し、それは典型的には第１グループ２００の二つのウィンドウ係数指数の間に位置する。

従って、フレーム１２０が、少なくとも部分的に、そのエネルギー値に関して重要な要因となるウィンドウ係数に相当する消失しない値（つまり０ではない値）で占められるような点まで埋められる前に、フレーム１２０に挿入される新しいブロック２２０の数は少ない。典型的には、「意味のある」処理が開始可能となる前にフレーム１２０に挿入されるべきブロックの数は、解析ウィンドウ関数１９０の形により、２〜４ブロックである。従って、解析フィルターバンク１００は、例えば対称ウィンドウ関数を使用している対応するフィルターバンクよりも速くブロック１８０を提供することができる。典型的には新しいブロック２２０はひとまとめで解析フィルターバンク１００に与えられるので、各新しいブロックは、基本的にブロック２２０の長さ（つまり、ブロック２２０に含まれる時間領域オーディオ入力サンプルの数）によって決まる記録又はサンプリング時間及びサンプリング速度又はサンプリング周波数に対応する。故に、本発明の実施形態に用いられるような解析ウィンドウ関数１９０は、オーディオ副帯値の第１及びそれに引き続くブロック１８０がフィルターバンク１００によって提供又は出力される前の遅延を小さくする。

更なる選択として、装置１００は、フレーム１８０を生成する際に使用される解析ウィンドウ関数１９０に関する情報または合成フィルターバンクの構造に使用されるべき合成ウィンドウ関数に関する情報を含む信号を生成してもよい。従って、解析フィルター関数１９０は、例えば、合成フィルターバンクによって使用されるべき合成ウィンドウ関数の時間逆転又は指数逆転のものであってもよい。

図２Ａは、オーディオ副帯値ブロックに基づき時間領域オーディオサンプルを生成する装置３００の一実施形態を示すブロック図である。前述したように、時間領域オーディオサンプルを生成する装置３００としての本発明の一実施形態は、しばしば合成フィルターバンクとも称される。この装置は時間領域オーディオサンプルを生成することができ、時間領域オーディオサンプルは原則的に、オーディオ信号に関するスペクトル情報を含むオーディオ副帯値に基づき再生可能である。従って、合成フィルターバンク３００は、オーディオ副帯値に基づき時間領域オーディオサンプルを合成することができるが、これらのオーディオ副帯値は例えば対応する解析フィルターバンク１００によって生成できる。

図２Ａのブロック図に示す合成フィルターバンク３００は計算機３１０を含み、そこに（周波数領域の）オーディオ副帯値ブロック３２０が与えられる。計算機３１０は、ブロック３２０のオーディオ副帯値から、中間時間領域サンプル列を含むフレーム３３０を算出することができる。本発明の多くの実施形態において、中間時間領域サンプルフレーム３３０もまた、例えば図１の解析フィルターバンク１００のウィンドウ処理後サンプルフレーム１５０と同様のブロック構造を有している。このような場合、フレーム３３０は中間時間領域サンプルのブロック３４０−１，…，３４０−Ｔを含む。

フレーム３３０の中間時間領域サンプル列及び中間時間領域サンプルの各ブロック３４０は、図２Ａの矢印３５０によって示されるような時間に基づく順序を有する。従って、フレーム３３０は、ブロック３４０−Ｔ内に初期の中間時間領域サンプル、そしてブロック３４０−１内に最新の中間時間領域サンプルを含み、それぞれのブロック３４０−Ｔ，３４０−１内のサンプルは、つまりフレーム３３０における最初と最後の中間時間領域サンプルである。また、各ブロック３４０も同様の順序を有している。つまり、合成フィルターバンクの実施形態において、「フレーム」という言葉と「列」という言葉はしばしば同意語として使用される。

計算機３１０は、中間時間領域サンプルフレーム３３０がそこに与えられる合成ウィンドウ処理部３６０と組み合わされている。合成ウィンドウ処理部３６０は、図２Ａに概略的に示すように、合成ウィンドウ関数３７０を使用して中間時間領域サンプル列をウィンドウ処理するように構成されている。合成ウィンドウ処理部３６０は、一つの出力として、ウィンドウ処理後中間時間領域サンプルフレーム３８０を提供し、このフレーム３８０もまたブロック３９０−１，…，３９０−Ｔというブロック構造を有している。

フレーム３３０と３８０は、それぞれＴ個（Ｔは正の整数）のブロック３４０，３９０を含んでいてもよい。合成フィルターバンク３００としての本発明の好ましい実施形態において、ブロックの個数Ｔは１０である。しかし、異なる実施形態において、それぞれのフレームのブロックの個数はこれと異なっていてもよい。より正確には、どちらもブロック構造である解析フィルターバンク１００と合成フィルターバンク３００を含む本発明の実施形態における実施環境や前述したトレードオフに応じて、ブロックの個数Ｔは原則的には３以上又は４以上である。

合成ウィンドウ処理部３６０は重複加算出力部４００と組み合わされ、そこにはウィンドウ処理後中間時間領域サンプルが与えられる。重複加算出力部４００は、時間領域サンプルブロック４１０を得るために、ウィンドウ処理後中間時間領域サンプルを処理することができる。時間領域（出力）サンプルは、その後、例えば更なる処理、保存または視聴可能なオーディオ信号への変換のための別の部材に与えられ得る。

フレーム３３０に含まれる時間領域サンプル列を算出するための計算機３１０は、データを周波数領域から時間領域に変換可能である。故に、計算機３１０は、オーディオ副帯値ブロック３２０に含まれるスペクトル表示の時間領域信号を生成可能な周波数／時間コンバータを含んでいてもよい。図１に示した解析フィルターバンク１００の計算機１７０で説明したように、ブロック３２０の各オーディオ副帯値は、特徴的な中心周波数を有するオーディオ副帯チャンネルに相当する。

これとは対照的に、フレーム３３０に含まれる中間時間領域サンプルは、原則的に時間領域の情報である。合成ウィンドウ処理部３６０は、図２Ａに概略的に示すように、合成ウィンドウ関数３７０を使用してフレーム３３０に含まれている中間時間領域サンプル列をウィンドウ処理できる。合成ウィンドウ関数３７０はウィンドウ係数列を含み、これもまた、前述のウィンドウ係数の第１グループ２００及び第２グループ２１０を有するウィンドウ関数１９０と同様に、ウィンドウ係数の第１グループ４２０と第２グループ４３０を含むものである。

合成ウィンドウ関数３７０の第１グループ４２０のウィンドウ係数はウィンドウ係数列の第１連続部分を含む。同様に、第２グループ４３０のウィンドウ係数もウィンドウ係数列の第２連続部分を含む。第１部分は第２部分よりも少ない個数のウィンドウ係数を含み、第１部分のウィンドウ係数のエネルギー値つまり第１部分の全体エネルギー値は第２部分のウィンドウ係数の同様のエネルギー値よりも高い。合成ウィンドウ関数３７０の更なる特徴や特性は、図１に概略的に示されているような解析ウィンドウ関数１９０の特徴や特性と同様のものであってもよい。従って、ここでは解析ウィンドウ関数１９０の構造について説明し、さらに図１１〜図１９を参照したウィンドウ関数の説明においては、第１グループ２００は第１グループ４２０に相当し、第２グループ２１０は第２グループ４３０に相当する。

例えば、ウィンドウ係数の二つのグループ４２０，４３０の部分は、典型的には、それぞれウィンドウ係数の連続集合を形成し、これら両方のウィンドウ係数の集合内にウィンドウ関数３７０のウィンドウ係数列の全てのウィンドウ係数を含む。本発明の多くの実施形態において、図１に示すような解析ウィンドウ関数１９０と図２Ａに示すような合成ウィンドウ関数３７０は互いを基礎とするものである。例えば、解析ウィンドウ関数１９０は合成ウィンドウ関数３７０の時間逆転版又は指数逆転版であってもよい。しかし、これら二つのウィンドウ関数１９０，３７０の関係は他のものであってもよい。合成ウィンドウ処理部３６０で使用される合成ウィンドウ関数３７０は、合成フィルターバンク３００に与えられたオーディオ副帯値ブロック３２０を生成する（その後任意に更なる変更が行われてもよい）際に使用された解析ウィンドウ関数１９０に関連するものであることが望ましい。

図１に関して述べたように、図２Ａの合成フィルターバンク３００は、入力されてくるブロック３２０がウィンドウ関数に関する信号又は情報を更に含むように構成されてもよい。一例として、ブロック３２０は、ブロック３２０を生成するのに使用された解析ウィンドウ関数１９０に関する情報、又は合成ウィンドウ処理部３６０によって使用されるべき合成ウィンドウ関数３７０に関する情報を含んでいてもよい。従って、フィルターバンク３００はそれぞれの情報を分離し、合成ウィンドウ処理部３６０にこれらを与えるものであってもよい。

重複加算出力部４００は、フレーム３８０に含まれるウィンドウ処理後中間時間領域サンプルを処理することで、時間領域サンプルブロック４１０を生成することができる。本発明の多様な実施形態において、重複加算出力部４００は以前に受信したウィンドウ処理後中間時間領域サンプルブロック３８０を一時的に記憶するためのメモリーを有していてもよい。実施の詳細な状況により、重複加算出力部４００は、例えば、合計Ｔ個のウィンドウ処理後中間時間領域サンプルフレームを記憶するためのＴ個の記憶部をメモリー内に有していてもよい。しかし、必要に応じて他の個数の記憶部が重複加算出力部４００に含まれていてもよい。さらに、本発明の多様な実施形態において、重複加算出力部４００は、１個の中間時間領域サンプルブロック３８０に基づき、時間領域サンプルブロック４１０を生成するものであってもよい。多様な合成フィルターバンク３００の実施形態を以下に詳述する。

図２Ｂは、合成フィルターバンク３００という形での本発明の実施形態の機能原理を説明するものである。オーディオ副帯値ブロック３２０は、最初に計算機３１０によって周波数領域から時間領域に変換されるが、これは図２Ｂ中矢印４４０で示される。中間時間領域サンプルブロック３４０−１，…，３４０−Ｔを含む中間時間領域サンプルフレーム３２０は、その後、合成ウィンドウ処理部３６０（図２Ｂでは図示せず）によってウィンドウ処理される。つまり、フレーム３２０の中間時間領域サンプル列を合成ウィンドウ関数３７０のウィンドウ係数列で掛け算し、ウィンドウ処理後中間時間領域サンプルフレーム３８０を得る。フレーム３８０は、ここでもウィンドウ処理後中間時間領域サンプルブロック３９０−１，…，３９０−Ｔを含み、これらのブロックは全体としてウィンドウ処理後中間時間領域サンプルフレーム３８０を形成している。

本発明に係る合成フィルターバンク３００の図２Ｂに示す実施形態において、その後、重複加算出力部４００が時間領域出力サンプルブロック４１０を生成することができる。つまり、ブロック４１０の時間領域オーディオサンプルの各指数値のために、異なるフレーム３８０の一つのブロック３９０のウィンドウ処理後中間時間領域サンプルを合算する。図２Ｂに示すように、各オーディオサンプル指数のために、合成ウィンドウ処理部３６０により現在処理されており前述したようなフレーム３８０のブロック３９０−１の一つのウィンドウ処理後中間時間領域サンプルと、このフレーム３８０の直前に処理されて重複加算出力部４００の記憶部に保存されたフレーム３８０−１の第２ブロック３９０−２内の前記ウィンドウ処理後中間時間領域サンプルに相当するウィンドウ処理後中間時間領域サンプルとを合算することで、ブロック４１０の時間領域オーディオサンプルが得られる。図２Ｂに示すように、合成フィルターバンク３００によりさらに以前に処理されたフレームのブロック（例えば、フレーム３８０−２のブロック３９０−３、フレーム３８０−３のブロック３９０−４、フレーム３８０−４のブロック３９０−５）の相当するウィンドウ処理後中間時間領域サンプルが、さらに使用されてもよい。これらのフレーム３８０−２，３８０−３，３８０−４及びさらに別のフレーム３８０は、以前に合成フィルターバンク３００で処理されたものである。フレーム３８０−２はフレーム３８０−１の直前に処理され、フレーム３８０−３はフレーム３８０−２の直前に生成されたものであり、以下同様である。

本実施形態に採用されている重複加算出力部４００は、時間領域（出力）サンプルブロック４１０の各指数のために、Ｔ個の異なるフレーム３８０，３８０−１，…，３８０−（Ｔ−１）からのＴ個の異なるブロック３９０−１，…，３９０−Ｔを合算することができる。従って、最初に処理されたＴ個のブロックは別として、ブロック４１０の各時間領域（出力）サンプルはＴ個の異なるオーディオ副帯値ブロック３２０に基づくものである。

本発明の実施形態における図１に示す解析フィルターバンク１００と同様に、合成フィルターバンク３００は時間領域（出力）サンプルブロック４１０を迅速に与えることができる。これは、合成ウィンドウ関数３７０の形によるものである。ウィンドウ係数第１グループ４２０は第２グループ４３０よりも高いエネルギー値を有し、少ない個数のウィンドウ係数を含むので、合成ウィンドウ処理部３６０は、中間時間領域サンプルのフレーム３３０が少なくとも第１グループ４２０のウィンドウ係数がフレーム３８０に影響を及ぼすように埋められる場合に、「意味のある」ウィンドウ処理後サンプルフレームを提供することができる。第２グループ４３０のウィンドウ係数は、そのエネルギー値が小さいために、影響力は小さい。

故に、最初に合成フィルターバンク３００が０で初期化された場合、原則的に、合成フィルターバンク３００はわずか２〜３個のオーディオ副帯値ブロックを受け取っただけで、ブロック４１０を供給し始めることができる。従って、合成フィルターバンク３００もまた、例えば対称合成ウィンドウ関数を使用する合成フィルターバンクと比較して、かなりの遅延低下を可能とする。

前述したように、図１、図２Ａに示す実施形態の計算機１７０，３１０は、それぞれブロック１８０，３２０の実数のオーディオ副帯値を生成可能又は処理可能である実数値計算機であってもよい。これらの場合、計算機は例えば正弦関数や余弦関数のような調和振動関数に基づく実数値計算機として実施してもよい。しかし、計算機１７０，３１０として、複合値計算機も使用できる。これらの場合、計算機は例えば複合指数関数又は他の調和複合値関数に基づき実施されてもよい。実数値振動又は複合値振動の周波数は、通常、オーディオ副帯値の指数による。オーディオ副帯値の指数は、特定の副帯の帯域指数又は副帯指数と称される場合もある。さらに、その周波数は対応する副帯の中心周波数と同じもの、あるいはそれに応じたものであってもよい。例えば、振動周波数は、一定の率で掛け算されて対応する副帯の中心周波数に関してずらされてもよいし、あるいは両方の変更の組み合わせによるものであってもよい。

複合値計算機１７０，３１０は実数値計算機に基づき構成又は実施されてもよい。例えば、複合値計算機に関して、複合値成分の実数部分と虚数部分を示すフィルターバンクの余弦変調部分と正弦変調部分両方のために、原則的に効率的な実施が行われ得る。これは、例えば修正ＤＣＴ−ＩＶ構造及びＤＳＴ−ＩＶ構造に基づく余弦変調部分及び正弦変調部分の両方の実施が可能であることを意味している。また、別の実施において、ＦＦＴ（ＦＦＴ＝高速フーリエ変換）を随意に使用してもよい。複合変調計算機の実数部分と虚数部分の両方のために一つのＦＦＴ（高速フーリエ変換）が共通して使用されるか、または各変換のために別々のＦＦＴが使用される。

数学的説明
前述したような更なる遅延を生じさせない過去への８ブロックの重複部分と、ＭＤＣＴ（修正離散余弦変換）／ＭＤＳＴ（修正離散正弦変換）構造と同じ遅延を引き起こす未来への１ブロックの重複部分を有する解析フィルターバンク及び合成フィルターバンクの実施形態の一例について、以下に説明する。以下の例では、パラメータＴは１０である。

まず、複合変調低遅延解析フィルターバンクを説明する。図１に示すように、解析フィルターバンク１００は、解析ウィンドウ処理部１１０によって行われる解析ウィンドウ処理、及び計算機１７０によって行われる解析変換という変換ステップを実行する。解析ウィンドウ処理は以下の式に基づき行われる。

ｚ_i,nは、図１に示すフレーム１５０のブロック指数ｉ及びサンプル指数ｎに対応する（実数値の）ウィンドウ処理後のサンプルである。ｘ_i,nは、同じブロック指数ｉ及びサンプル指数ｎに対応する（実数値の）時間入力サンプルである。解析ウィンドウ関数１９０は、式（１）中、その実数値のウィンドウ係数ｗ（ｎ）で表わされ、ｎは式（１）で示される範囲におけるウィンドウ係数指数である。前述したように、パラメータＮは一つのブロック２２０，１３０，１６０，１８０内のサンプルの個数である。

解析ウィンドウ関数ｗ（１０Ｎ−１−ｎ）の偏角から、この解析ウィンドウ関数は合成ウィンドウ関数の逆転版つまり時間逆転版であることがわかり、合成ウィンドウ関数は実際ウィンドウ係数ｗ（ｎ）で表わされるものである。

図１の実施形態において計算機１７０で実行される解析変調は、以下の二つの式に基づいている。

ｋはスペクトル係数指数又は帯域指数であり、以下の範囲の整数である。

値Ｘ_Real,i,k及びＸ_Imag,i,kは、ブロック１８０のブロック指数ｉとスペクトル係数指数ｋに対応する複合値オーディオ副帯値の実数部分と虚数部分を示している。パラメータｎ₀は指数オプションを示し、以下の式で表されるものである。

このフィルターバンクに相当する複合変調低遅延合成フィルターバンクは、以下に説明するように、合成変調、合成ウィンドウ処理及び重複加算という変換ステップを実行する。

合成変調は以下の式に基づき行われる。

ｘ’_i,nは、サンプル指数ｎ及びブロック指数ｉに相当するフレーム３３０の中間時間領域サンプルである。パラメータＮは、ブロック３２０，３４０，３９０，４１０の長さを示す整数であり、変換ブロック長、あるいはフレーム３３０，３８０のブロック構造のために前のブロックに対するオフセットとも称される。また、スペクトル係数指数ｋやオフセットｎ₀等の他の変数やパラメータも導入されている。

図２Ａの実施形態において合成ウィンドウ処理部３６０によって実行される合成ウィンドウ処理は以下の式に基づいている。

ｚ’_i,nは、フレーム３８０のサンプル指数ｎ及びブロック指数ｉに対応するウィンドウ処理後中間時間領域サンプルの値である。

重複加算の変換ステップは以下の式に基づいて行われる。

ｏｕｔ_i,nは、サンプル指数ｎ及びブロック指数ｉに対応する時間領域（出力）サンプルを示す。従って、式（８）は、図２Ｂの下部に示す重複加算出力装置４００で実行されるような重複加算処理を説明している。

しかし、本発明に係る実施形態はオーディオ信号処理を可能にする複合変調低遅延フィルターバンクに限るものではない。超低遅延オーディオ符号化のための実数値用の低遅延フィルターバンクもまた実施可能である。例えば、式（２），（６）はその余弦部分によって、解析変調及び合成変調への余弦の影響は、ＭＤＣＴのそれと同等のものであることを示している。原則として、設計方法により、ＭＤＣＴの時間に関する両方向への延長が可能であるが、Ｔ個のブロックのそれぞれがＮ個のサンプルを有している場合、ここでは過去へのＥ（＝Ｔ−２）個のブロックの延長のみが可能である。Ｎチャンネル又はＮ帯域の解析フィルターバンク内の帯域ｋとブロックｉの周波数係数Ｘ_i,kは、以下のように集約される。

ｋは式（４）によって定義されるスペクトル係数指数である。ここでもまた、ｎはサンプル指数であり、ｗ_aは解析ウィンドウ関数である。

完全を期するため、複合変調低遅延解析フィルターバンクの上記数学的説明は、余弦関数を複合値指数関数に交換することで、式（９）のような集約形態として提示され得る。より正確には、上記の定義及び変数により、式（１），（２），（３），（５）は以下のように集約され、延長される。

式（２），（３）と比較して、過去への８ブロックの延長が変数Ｅ（＝８）に置き換えられた。

合成変調及び合成ウィンドウ処理のステップは、式（６），（７）のような複雑な場合に関して説明したように、実数値の合成フィルターバンクの場合に集約可能である。ウィンドウ処理後中間時間領域サンプルフレーム３８０は復調ベクトルとも称されるものであるが、これは以下の式（１１）によって与えられる。

ｚ’_i,nは、帯域指数ｉ及びサンプル指数ｎに対応するウィンドウ処理後中間時間領域サンプルである。サンプル指数ｎは以下の範囲の整数である。

ｗ_s（ｎ）は合成ウィンドウであり、式（９）の解析ウィンドウｗ_a（ｎ）と合致している。

重複加算の変換ステップは、以下の式で与えられる。

ｘ’_i,nは、再生された信号、正確に言えば、図２Ａに示す重複加算出力装置４００によって与えられるブロック４１０の時間領域サンプルである。

複合値合成フィルターバンク３００のために、式（６），（７）は以下の式により、Ｅ（＝８）個のブロックの過去への延長に関して集約され、一般化される。

ｊ＝√（−１）は虚数部分単位である。式（１３）は式（８）の一般化された形態を示し、また、複合値の場合にも有効なものである。

式（１４）と式（７）を直接比較すると、式（７）のウィンドウ関数ｗ（ｎ）は式（１４）の合成ウィンドウ関数ｗ_s（ｎ）と同じである。前述したように、解析ウィンドウ関数係数ｗ_a（ｎ）を有する式（１０）と式（１）を比較すると、解析ウィンドウ関数は式（１）の合成ウィンドウ関数の時間逆転版であることがわかる。

図１の解析フィルターバンク１００及び図２Ａの合成フィルターバンクのどちらにおいても、一方では遅延、他方ではオーディオ処理の質との間のトレードオフに関してかなりの向上が見られるので、これらのフィルターバンク１００，３００はしばしば低遅延フィルターバンクと称される。これらの複合値用のものは複合値低遅延フィルターバンクと称されることもあり、ＣＬＤＦＢと省略される。ＣＬＤＦＢという言葉は、状況によっては、複合値フィルターバンクに限らず実数値フィルターバンクにも使用される場合がある。

以上検討したような数学的背景が示すように、ここで提案する低遅延フィルターバンクを実施するための構造は、ＭＰＥＧ−４標準から知られており、延長重複を使用するＭＤＣＴ又はＩＭＤＣＴ（逆転ＭＤＣＴ）構造を利用するものである。追加の重複部分は、ＭＤＣＴのようなコアの右側だけでなく左側にも、ブロックごとに付け加えることができる。ここでは、（合成フィルターバンクの場合）右側への延長のみが行われ、この延長は過去のサンプルからのみであり、故に更なる遅延を引き起こすことはない。

式（１），（２），（１４）を見ると、この処理はＭＤＣＴまたはＩＭＤＣＴの処理と非常に似ていることがわかる。修正解析ウィンドウ関数と修正合成ウィンドウ関数を含むわずかな修正により、ＭＤＣＴまたはＩＭＤＣＴは、多層重複部を扱うことができ、その遅延に関して非常に融通性のある変調フィルターバンクにまで拡大される。例えば、複合版を示す式（２），（３）は、原則的に、単に余弦変調に正弦変調を付加することで得られる。

補間
図１、図２Ａに関して説明したように、解析ウィンドウ処理部１１０と合成ウィンドウ処理部３６０、またはフィルターバンク１００，３００は、各時間領域オーディオサンプルに個々のウィンドウ係数を掛けることで、それぞれの時間領域サンプルフレームをウィンドウ処理するように構成されている。つまり、式（１）、（７），（９），（１０），（１１），（１４）が示しているように、各時間領域サンプルは、（個々の）ウィンドウ係数で掛けられる。従って、それぞれのウィンドウ関数のウィンドウ係数の個数は、概して時間領域オーディオサンプルの個数と等しい。

しかし、ある実施状況においては、より少ない第１の個数の係数を有し、それぞれの時間領域オーディオサンプルフレームまたは列をウィンドウ処理するのに使用される実際のウィンドウ関数に比べて、より多い第２の個数のウィンドウ係数を有するウィンドウ関数を使用することの方が良い場合もある。これは、例えば特定の実施のために必要なメモリー容量がコンピュータ処理の能率よりも重要である場合に薦められる。ウィンドウ係数のダウンサンプリングが有効である別の場合は、例えばＳＢＲ（スペクトル帯域再生）システムの構造に用いられる、いわゆる二種速度方法の場合である。ＳＢＲの概念は、図５、図６を参照して後述する。

このような場合、解析ウィンドウ処理部１１０または合成ウィンドウ処理部３６０は、また、それぞれのウィンドウ処理部１１０，３６０に与えられた時間領域オーディオサンプルをウィンドウ処理するのに使用される各ウィンドウ関数が、より多くの第２の個数のウィンドウ係数を有する大きなウィンドウ関数のウィンドウ係数の補間により導き出されるように、構成されている。

この補間は、例えば直線的、多項式的又はスプラインに基づく補間である。例えば、直線的補間の場合だけでなく多項式的又はスプラインに基づく補間の場合にも、それぞれのウィンドウ処理部１００，３６０は、ウィンドウ関数の一つのウィンドウ係数を得るために、大きいウィンドウ関数の、そのウィンドウ係数列において連続する二つのウィンドウ係数に基づき、ウィンドウ処理に使用されるウィンドウ関数のウィンドウ係数を補間可能であってもよい。

特に時間領域オーディオサンプルとウィンドウ係数の個数が偶数である場合、前述したような補間の実行はオーディオの質の点でかなりの向上をもたらす。例えば、フレーム１２０，３３０のいずれか一つの時間領域オーディオサンプルが偶数Ｎ・Ｔである場合、直線的補間等の補間を実行しなければ、それぞれの時間領域オーディオサンプルの更なる処理の間に深刻なエイリアシング効果が起こることになる。

図３は、Ｎ・Ｔ／２個の時間領域オーディオサンプルを含むフレームの場合に使用されるべきウィンドウ関数（解析ウィンドウ関数又は合成ウィンドウ関数）に基づく直線的補間の例を示す。メモリーの制限や他の詳細な実施状況により、ウィンドウ関数自身のウィンドウ係数はメモリーに保存されず、Ｎ・Ｔ個のウィンドウ係数を含む大きいウィンドウ関数が適当なメモリーに保存されているか、あるいは何らかの方法で入手可能である。図３の上部グラフは、０〜Ｎ・Ｔ−１の間のウィンドウ係数指数ｎの関数として、それに相当するウィンドウ係数ｃ（ｎ）を示す。

より多くの個数のウィンドウ係数を有するウィンドウ関数の二つの連続したウィンドウ係数の直線的補間に基づき、図３の上部グラフに示すように、補間されたウィンドウ関数は以下の式により算出される。

Ｎ・Ｔ／２個の時間領域オーディオサンプルを有するフレームに応用されるウィンドウ関数の補間されたウィンドウ係数ｃｉ（ｎ）の個数は、ウィンドウ係数の数の半分である。

これをさらに説明するために、図３の上部に、ウィンドウ係数４５０−０，…，４５０−７が示され、これらはウィンドウ係数ｃ（０），…，ｃ（７）に相当するものである。これらのウィンドウ係数及びウィンドウ関数のさらなるウィンドウ係数に基づき、式（１５）を使用して、図３の下部に示すような補間後のウィンドウ関数のウィンドウ係数ｃｉ（ｎ）を導き出す。例えば、ウィンドウ係数４５０−２，４５０−３に基づき、図３の矢印４７０で示されているように、ウィンドウ係数４６０−１が式（１５）より生成される。同様に、補間後のウィンドウ関数のウィンドウ係数４６０−２は、図３の上部に示すウィンドウ関数のウィンドウ係数４５０−４，４５０−５に基づき算出される。図３はさらなるウィンドウ係数ｃｉ（ｎ）の生成を示している。

ウィンドウ関数の補間ダウンサンプリングにより達成できるエイリアシング解消を説明するために、図４に、例えばＭＤＣＴに使用され得る正弦ウィンドウ関数の場合のウィンドウ係数の補間を示す。簡略化のために、このウィンドウ関数の左半分と右半分を重ねて示している。図４に示されているものは、８個のサンプル長を有するＭＤＣＴのためのたった２・４の個のウィンドウ係数又はポイントしか含まない簡単な正弦ウィンドウである。

図４は、正弦ウィンドウの前半の４個のウィンドウ係数４８０−１，４８０−２，４８０−３，４８０−４及び正弦ウィンドウの後半の４個のウィンドウ係数４９０−１，４９０−２，４９０−３，４９０−４を示す。ウィンドウ係数４９０−１，…，４９０−４はウィンドウ係数指数５，…，８に対応する。ウィンドウ係数４９０−１，…，４９０−４はウィンドウ関数長さの後半に相当し、実指数を得るために、指数にＮ’＝４が与えられる。

前述したようにエイリアシング効果の低下または解消を達成するために、ウィンドウ係数は可能な限り以下の条件を満たす。

条件（１６）に近づけば近づくほど、エイリアシングはより良く低下又は解消される。

半分の数のウィンドウ係数を有する新しいウィンドウ関数がウィンドウ関数の左半分のために決定されるとすると、以下の問題が生じる。ウィンドウ関数は偶数個のウィンドウ係数（偶数個のダウンサンプリング）を含むという事実のために、図３に示すような補間体系を使用しなくても、ウィンドウ係数４８０−１と４８０−３又は４８０−２と４８０−４が元のウィンドウ関数又は元のフィルターのただ一つのエイリアシング値に相当する。

このことは、スペクトルエネルギーの不均衡な割合と対応するウィンドウ関数の中心周波数（質量の中心）の非対称な再分配をもたらす。図４のウィンドウ係数ｗ（ｎ）のための補間式（１５）に基づき補間された値Ｉ₁，Ｉ₂はエイリアシングの条件（１６）をよりよく満たし、従って処理されたオーディオデータの質のかなりの向上をもたらす。

しかし、より精巧な補間体系、例えばスプラインに基づく補間体系又はそれと同様の別の補間体系を使用することにより、条件（１６）をさらによりよく満たすウィンドウ係数が得られる。多くの場合、直線的な補間が十分な成果をもたらし、速く能率的な実施を可能にする。

ＳＢＲ−ＱＭＦフィルターバンク（ＱＭＦ＝直角ミラーフィルター）を使用した典型的なＳＢＲシステムの場合には、このＳＢＲ−ＱＭＦプロトタイプフィルターは奇数個のプロトタイプフィルター係数を含むので、直線的補間もまた他の補間体系も実行される必要がない。このことは、ＳＢＲ−ＱＭＦプロトタイプフィルターが、ＳＢＲ−ＱＭＦプロトタイプフィルターの対称性が全く損なわれないようにダウンサンプリングが実施され得る最大値を有していることを意味する。

図５、図６では、解析フィルターバンク及び合成フィルターバンク両方の形での本発明に係る実施形態の可能な応用を説明する。一つの重要な応用分野はＳＢＲシステム又はＳＢＲ装置（ＳＢＲ＝スペクトル帯域再生）である。しかし、本発明はさらに他の分野でも応用できる。他の分野とは、空間的オーディオ対象符号化、低遅延パラメータのステレオ符号化、低遅延空間的／サラウンド符号化、フレーム損失隠蔽、エコー消去または他の同様の応用等の、スペクトル修正（ゲイン修正又は均一化）の必要性がある分野のことである。

ＳＢＲの背後にある基本的な考えは、通常、同じ信号の、高周波域（いわゆる高帯域信号と称される）の特徴と低周波域（低帯域または低帯域信号と称される）の特徴との間に関連性があるというものである。従って、元の入力信号の高帯域の再生は、低帯域から高帯域への置換によって、より近似的に行われ得る。

置換に加えて、高帯域の再生は、ゲイン調整を含むスペクトルエンヴィロープの整形を含む。この工程は、概して元の入力信号の高帯域スペクトルエンヴィロープの送信によって制御される。置換だけでは十分ではないと思われる場合、エンコーダから送られる更なるガイダンス情報が、オーディオ材料を扱うための逆転フィルターやノイズ・正弦加算機等の更なる合成モジュールを制御する。対応するパラメータは、ノイズの合計のためのパラメータ「ノイズ高帯域」と正弦加算のためのパラメータ「調性高帯域」を含む。これらのガイダンス情報は通常ＳＢＲデータと称される。

ＳＢＲ処理は、エンコーダでの前処理及びデコーダでの後処理による従来の波形又はコーデックと組み合わされてもよい。ＳＢＲはオーディオ信号の高周波部分を非常に低コストで符号化し、オーディオコーデックは信号の低周波部分を符号化するのに使用される。

エンコーダ側において、元の入力信号が解析され、高帯域スペクトルエンヴィロープ及び低帯域に対するそれの特徴が符号化され、その結果得られるＳＢＲデータに低帯域のためのコーデックからのビットストリームで多重化される。デコーダ側において、ＳＢＲデータはまず単一化される。復号化工程は一般的にいくつかのステップから成り立っている。まず、コアデコーダが低帯域を生成し、次に、ＳＢＲデコーダが、スペクトル帯域再生をガイドするために、復号化されたＳＢＲデータを使用して後処理装置として動作する。そして、全帯域出力信号が得られる。

できる限り高い符号化効率を得るために、そしてコンピュータ処理の複雑性を低く抑えるために、ＳＢＲ機能の高いコーデックがいわゆる二種速度システムとして実行されることがよくある。二種速度とは、帯域限定のコアコーデックが、外部オーディオサンプリング速度の半分の速度で動作することを意味する。対照的に、ＳＢＲ部分はサンプリング周波数全体において処理される。

図５はＳＢＲシステム５００の概略ブロック図を示す。ＳＢＲシステム５００は、例えばＡＡＣ−ＬＤエンコーダ（ＡＡＣ−ＬＤ＝高度オーディオ低遅延コーデック）５１０及びＳＢＲエンコーダ５２０を含み、処理されるべきオーディオデータはそれらに並列的に与えられる。ＳＢＲエンコーダ５２０は解析フィルターバンク５３０を含み、それは、図５中、ＱＭＦ解析フィルターバンクとして示されている。解析フィルターバンク５３０は、ＳＢＲシステム５００に与えられるオーディオ信号に基づき、副帯に相当する副帯オーディオ値を提供することができる。これらの副帯オーディオ値はＳＢＲパラメータ抜粋モジュール５４０に送られ、このモジュール５４０は、例えば高帯域のためのスペクトルエンヴィロープ、高帯域ノイズパラメータ及び高帯域調性パラメータを含む前述したようなＳＢＲデータを生成する。これらのＳＢＲデータはＡＡＣ−ＬＤエンコーダ５１０に送られる。

ＡＡＣ−ＬＤエンコーダ５１０は、図５中、二種速度エンコーダとして示されている。換言すれば、エンコーダ５１０は、そこに入力されるオーディオデータのサンプリング周波数と比較すると、その半分の周波数で動作する。これを容易にするために、ＡＡＣ−ＬＤエンコーダ５１０は、ダウンサンプリング部５５０を有し、それは、例えばナイキスト−シャノン理論を破ったために生じる歪曲を避けるために、随意にローパスフィルターを有していてもよい。ダウンサンプリング部５５０の出力としてのダウンサンプルされたオーディオデータは、それからＭＤＣＴフィルターバンクという形態のエンコーダ５６０（解析フィルターバンク）に送られる。エンコーダ５６０によって出力される信号は、その後、量子化・符号化部５７０において量子化、符号化される。さらに、ＳＢＲパラメータ抜粋モジュール５４０によって生成されるＳＢＲデータもまたビットストリームを得るために符号化され、このビットストリームはその後ＡＣＣ−ＬＤエンコーダ５１０から出力される。量子化・符号化部５７０は、例えば人の耳の聴覚特性に応じてデータを量子化する。

ビットストリームは、その後、このビットストリームが送られるデコーダ側の一部であるＡＡＣ−ＬＤデコーダ５８０に与えられる。ＡＡＣ−ＬＤデコーダは復号化・非量子化部５９０を含み、これは、ビットストリームからＳＢＲデータを抜粋し、量子化されたオーディオ信号を低帯域の周波数領域に戻す。その後、低帯域データは合成フィルターバンク６００（逆転ＭＤＣＴフィルターバンク）に送られる。逆転ＭＤＣＴ部（ＭＤＣＴ^-1）６００は、時間信号を得るために、与えられた信号を周波数領域から時間領域に変換する。この時間領域信号はその後ＳＢＲデコーダ６１０に与えられる。ＳＢＲデコーダ６１０は、解析フィルターバンク６２０を含み、これは、図５中、ＱＭＦ解析フィルターバンクとして示されている。

解析フィルターバンク６２０は、そこに与えられた低帯域を表す時間信号のスペクトル解析を行う。これらのデータはその後、ＨＦ生成部とも称される高周波生成部６３０に送られる。ＡＡＣ−ＬＤデコーダ５８０及びその復号化・非量子化部５９０によって与えられたＳＢＲ信号に基づき、ＨＦ生成部６３０は解析フィルターバンク６２０により与えられた低帯域信号から高帯域信号を生成する。低帯域信号、高帯域信号のどちらも、その後合成フィルターバンク６４０に送られ、それらの信号は周波数領域から時間領域に変換される。そして、ＳＢＲシステム５００からの時間領域オーディオ出力信号が得られる。

完全を期するために、多くの場合、ＳＢＲシステム５００は図５に示すようには実施されてはいないことを明記しておく。より正確には、ＡＡＣ−ＬＤエンコーダ５１０及びＳＢＲエンコーダ５２０は、通常、エンコーダ側に配置され、エンコーダ側は、通常、ＡＡＣ−ＬＤデコーダ５８０及びＳＢＲデコーダ６１０を含むデコーダ側とは分かれて設置されている。換言すれば、図５に示すシステム５００は、本来的に二つのシステム、つまり前記エンコーダ５１０，５２０を含むエンコーダと前記デコーダ５８０，６１０を含むデコーダとの連結を示すものである。

解析フィルターバンク１００及び合成フィルターバンク３００という形での本発明に係る実施形態は、例えば、図５に示すシステム５００において、解析フィルターバンク５３０，６２０及び合成フィルターバンク６４０の代わりに用いてもよい。つまり、システム５００のＳＢＲ部品である合成フィルターバンクと解析フィルターバンクは、例えば本発明のそれぞれ相当する実施形態に置き換えられる。また、ＭＤＣＴ５６０と逆転ＭＤＣＴ６００も、それぞれ低遅延解析フィルターバンクと合成フィルターバンクとに置き換えられる。このような置換がすべて行われた場合、いわゆる超低遅延ＡＡＣコーデック(ＡＡＣコーダ・デコーダ)が実現できる。

この超低遅延ＡＡＣ（ＡＡＣ−ＥＬＤ）は、ＳＢＲをＡＡＣ−ＬＤと共に用いることにより、ＡＡＣ−ＬＤ（低遅延高度オーディオコーデック）の低遅延特徴とＨＥ−ＡＡＣ（高能率高度オーディオコーデック）の高い符号化能率を組み合わせようとするものである。ＳＢＲデコーダ６１０は、この場合、完全な解析フィルターバンクと合成フィルターバンク６４０を含むコアデコーダ５８０の後に設置される後処理装置として機能する。故に、ＳＢＲデコーダ６１０の部品はさらなる復号遅延を生じさせ、これは、図５中、部分６２０，６３０，６４０への斜線で示されている。

ＳＢＲシステム５００の実施の多くの場合、０ｋＨｚから概して５〜１５ｋＨＺの低周波域または低帯域は、コアコーデックと称される波形コーダを使用して符号化される。コアコーデックは、例えばＭＰＥＧオーディオコーデックのうちの一つである。さらに、高周波域又は高帯域の再生は低帯域の転移によって行われる。ＳＢＲとコアコーダとの組み合わせは、多くの場合、二種速度システムとして実施され、このシステムでは、基本的なＡＡＣエンコーダ／デコーダは、ＳＢＲエンコーダ／デコーダのサンプリング速度の半分の速度で動作する。

制御データの大部分はスペクトルエンヴィロープ表示のために使用され、スペクトルエンヴィロープ表示は、できる限り小さいビットレートで最大限にＳＢＲ処理を制御できるように、変動時間周波数分解を有する。他の制御データは、主に、高帯域の調性−ノイズ率を制御するのに使用される。

図５に示すように、基本的なＡＡＣデコーダ５８０からの出力は一般的に３２チャンネルＱＭＦフィルターバンク６２０で解析される。そして、ＨＦ生成モジュール６３０は、存在する低帯域から高帯域までのＱＭＦ副帯を修正することによって高帯域を再生する。さらに、ビットストリームから得られる制御データ（ＳＢＲデータ）に基づき、副帯ごとに逆フィルタリングが行われる。エンヴィロープアジャスターは、再生された高帯域のスペクトルエンヴィロープを修正し、ノイズのような更なる部分を付加する。これにより、ビットストリームの制御データに応じたしなやかさが付け加えられる。全ての動作が周波数領域（ＱＭＦまたは副帯領域としても知られている）で行われ、デコーダ６１０の最後の段階は、時間領域信号を保持するためのＱＭＦ合成６４０である。例えば、１０２４個の時間領域サンプルのために、エンコーダ側のＱＭＦ解析が３２のＱＭＦ副帯システムで行われる場合、高周波再生は６４ＱＭＦ副帯を生じさせ、それに基づく合成は２０４８個の時間領域サンプルを生み出すことになり、比率が２のアップサンプリングが行われることになる。

また、コアコーダ５１０の遅延は、二種速度モードで元のサンプリング速度の半分の速度で動作することにより、倍加され、このことは、ＳＢＲと組み合わせたＡＡＣ−ＬＤの符号化及び復号化処理両方において遅延源が増すことになる。以下に、このような遅延源と、それらに関する遅延の最小化を検討する。

図６は、図５に示したシステムの簡易化されたブロック図である。図６は、ＳＢＲと低遅延フィルターバンクを使用する符号化／復号化処理における遅延源に焦点を当てたものである。図６を図５と比較すると、ＭＤＣＴ５６０と逆転ＭＤＣＴ６００が、遅延最適化モジュール、いわゆる低遅延ＭＤＣＴ５６０’（ＬＤＭＤＣＴ）と低遅延逆転ＭＤＣＴ６００’（ＬＤＩＭＤＣＴ）に置き換えられている。さらに、ＨＦ生成器６３０もまた遅延最適化モジュール６３０’に置き換えられている。

図６のシステムには、低遅延ＭＤＣＴ５６０’や低遅延逆転ＭＤＣＴ６１０’とは別に、修正ＳＢＲフレーム・修正ＨＦ生成器６３０’が用いられている。コアエンコーダ／デコーダ５６０，６００のフレームとそれぞれのＳＢＲモジュールを異ならせることで遅延を避けるために、ＳＢＲフレーム生成器は４８０のフレーム長又はＡＡＣ−ＬＤの５１２個のサンプルに適合している。さらに、ＨＦ生成器６３０の可変時間グリッドは３８４個のサンプルの遅延を含み、互いに隣接するＡＣ−ＬＤフレームへのＳＢＲデータの拡散に関して制限されている。これにより、ＳＢＲモジュールにおいて未だ遅延源であるのはフィルターバンク５３０，６２０，６４０である。

図６はＡＡＣ−ＥＬＤコーデックの一部実施を示しているが、この場合、ＡＡＣ−ＬＤコアの低遅延フィルターバンクの使用と前述したＳＢＲ重複の除去を含む、いくらかの遅延最適化が行われたものである。さらなる遅延向上のために、残りのモジュールに関しても検討する必要がある。図６は、ＳＢＲとＬＤ−ＭＤＣＴとＬＤ−ＩＭＤＣＴと呼ばれる低遅延フィルターバンクを使用する符号化／復号化処理における遅延源を示している。図５とは対照的に、図６に示す全ての部分が遅延源であり、そのうち遅延最適化モジュールは斜線で示されている。その他のモジュールは、現時点では、低遅延のための最適化が行われていない。

図７Ａは、解析フィルターバンク、またはそれに対応するオーディオ副帯チャンネルのオーディオ副帯値を生成する方法という形での本発明の一実施形態を説明するためのＣ−又はＣ＋＋−偽コードを含むフローチャートである。より正確には、図７Ａは、３２帯域のための複合値解析フィルターバンクのフローチャートである。

前述したように、解析フィルターバンクは時間領域信号、例えば、コアコーダからの出力をＮ＝３２の副帯信号に分けるものである。複合値解析フィルターバンクの場合、そのフィルターバンクの出力、つまり副帯サンプル又はオーディオ副帯値は、実数値フィルターバンクの場合と比較すると、複合値、つまり２の比率でオーバーサンプルされたものである。フィルタリングは以下に説明するステップを含み、一つのアレイｘ（ｎ）が正確に３２０個の時間領域サンプルを含むものである。アレイのサンプル指数ｎが高ければ高いほど、サンプルは古いものである。

本実施形態の方法がステップＳ１００で開始され、その後、最初にステップＳ１１０でアレイｘ（ｎ）のサンプルが３２個の位置分移動させられる。最も古い３２個のサンプルが廃棄され、ステップＳ１２０で、３２個の新しいサンプルが位置３１〜０に保存される。図７Ａに示すように、入力される時間領域オーディオサンプルは、３１から０まで減少していく指数ｎで示される位置に保存される。これは、相当するフレーム又はベクトルに保存されたサンプルを時間逆転することになり、（同じ長さの）合成ウィンドウ関数に基づき解析ウィンドウ関数を得るためのウィンドウ関数の逆転がすでに行われたことになる。

ステップＳ１３０では、式（１５）に基づき係数ｃ（ｊ）の直線的補間を行うことにより、ウィンドウ係数ｃｉ（ｊ）が得られる。この補間は、Ｎ＝６４というブロックサイズ値（ブロック長又は副帯値の数）及びＴ＝１０という１フレーム中のブロック数に基づいている。従って、補間後のウィンドウ関数のウィンドウ係数の指数は、式（１５）より、０〜３１９の範囲にある。ウィンドウ係数ｃ（ｎ）は、本明細書の付録１の表に示す。しかし、実施の詳細により、付録１，３の表に示す値に基づくウィンドウ係数を得るために、指数１２８〜２５５と指数３８４〜５１１に対応するウィンドウ係数に関して、符号変換（比率−１の掛け算）がさらに必要となる場合がある。

これらの場合、使用されるべきウィンドウ係数ｗ（ｎ）又はｃ（ｎ）は以下の式に基づき得られる。

符号変換関数ｓ（ｎ）は以下に基づいている。

ｎ＝０〜６３９であり、Ｗ_table（ｎ）は、付録の表に示す値である。

しかし、ウィンドウ係数は、例えば前述したような遅延低下のために付録１の表に基づき実施される必要はない。処理後のオーディオデータの質を保ちながらこの遅延低下を達成するために、あるいは別のトレードオフを達成するために、０〜６３９の範囲のウィンドウ係数指数ｎのためのウィンドウ係数ｃ（ｎ）は付録２〜４のうちのいずれか一つに示されている関係を満たしていてもよい。付録１〜４の表は６４０個のウィンドウ係数を有するウィンドウ関数に応用されるものであるが、当然、３２０又は６４０以外の別の個数のウィンドウ係数を有する他のウィンドウ関数も使用可能である。

ステップＳ１３０の直線的補間は、偶数個のウィンドウ係数を有するウィンドウ関数の場合、かなりの質の向上及びエイリアシング効果の低下又は解消につながる。複合単位は、式（１），（２），（１６）のようなｊではなく、ｉ＝√（−１）によって示されている。

ステップＳ１４０では、アレイｘ（ｎ）のサンプルは補間後のウィンドウ係数ｃｉ（ｎ）で素子ごとに掛け算される。

ステップＳ１５０では、６４個の素子を有するアレイｕ（ｎ）を生成するために、ウィンドウ処理後のサンプルが図７ａのフローチャートに示されている式に基づき合計される。ステップＳ１６０では、３２個の新しい副帯サンプルつまりオーディオ副帯値Ｗ（ｋ，１）がマトリックス処理Ｍｕにより算出され、マトリックスＭの素子は以下の式で与えられる。

ｅｘｐ（）は複合指数関数を示し、前述したように、ｉは虚数単位である。フローチャートの循環がステップＳ１７０で終わる前に、各副帯値Ｗ（ｋ，１）（＝Ｗ［ｋ］［ｌ］）が出力され、それは指数ｋを有する副帯の副帯サンプルｌに相当する。換言すれば、図７ａのフローチャートの一巡の間に、それぞれが一つのフィルターバンク副帯からの出力を表す３２個の複合副帯値が生成される。

図７Ｂは、１０ブロック１６０−１，…，１６０−１０のウィンドウ処理後の時間領域オーディオサンプルｚ（ｎ）を含むウィンドウ処理後時間領域オーディオサンプルフレーム１５０を、フレーム１５０のブロックを二つずつ、５回合算することでベクトルｕ（ｎ）に分解するステップＳ１５０を示している。この分解または再構成は素子ごとに行われ、１６０−１，１６０−３，１６０−５，１６０−７，１６０−９の各ブロック内の同じサンプル指数に対応するウィンドウ処理後時間領域オーディオサンプルが合計され、ベクトルｕ（ｎ）の第１ブロック６５０−１内に対応する値が得られる。ステップＳ１５０では、同様に、１６０−２，１６０−４，１６０−６，１６０−８，１６０−１０のブロックに基づき、ベクトルｕ（ｎ）のブロック６５０−２内に対応する素子が得られる。

解析フィルターバンクという形での本発明に係る別の実施形態は、６４帯域複合低遅延フィルターバンクとして実施できるものである。この複合低遅延フィルターバンクの解析フィルターバンクとしての処理は、基本的に図７Ａを参照して説明した解析フィルターバンクと同様のものである。図７Ａに関して説明した処理と類似であり基本的に同じであるので、ここでは、６４副帯のための複合解析フィルターバンクの、図７Ａに関して説明した３２帯域のための複合解析フィルターバンクとの違いについて概略的に説明する。

図７Ａに示すような解析フィルターバンクを含む３２副帯のものと比較して、６４副帯解析フィルターバンク６４０の場合、フレームｘ（ｎ）のベクトルは０〜６３９の指数を有する素子を含む。従って、ステップＳ１１０は、アレイｘ（ｎ）のサンプルが６４個の位置分移動させられ、最も古い６４個のサンプルが廃棄されるように、変更される。ステップＳ１２０において、３２個ではなく６４個の新しいサンプルが位置６３〜０に保存される。図７ｃに示すように、入力されてくる時間領域オーディオサンプルは６３〜０まで減少する指数ｎに対応する位置に保存される。これは、相当するフレーム又はベクトルに保存されたサンプルを時間逆転することになり、（同じ長さの）合成ウィンドウ関数に基づき解析ウィンドウ関数を得るためのウィンドウ関数の逆転がすでに行われたことになる。

フレームｘ（ｎ）のベクトルの素子のウィンドウ処理に使用されるウィンドウｃ（ｎ）は概して６４０個の素子を含んでいるので、補間後のウィンドウｃｉ（ｎ）を得るためのウィンドウ関数の直線的補間のステップＳ１３０は省略できる。

そして、ステップＳ１４０においては、ウィンドウ係数列ｃ（ｎ）を使用してアレイｘ（ｎ）のサンプルの掛け算つまりウィンドウ処理が行われる。ウィンドウ係数列ｃ（ｎ）は付録１の表中の値に基づくものである。ウィンドウ係数ｃ（ｎ）が合成ウィンドウ関数のものである場合、アレイｘ（ｎ）のウィンドウｃ（ｎ）によるウィンドウ処理つまり掛け算は以下の式に応じて行われる。

ｎ＝０，…，６３９である。ここでもまた、ウィンドウ関数の低遅延特性を達成するために、必ずしも正確に付録１の表に示す値に基づくウィンドウ係数に応じたウィンドウ関数を採用する必要はない。多くの応用において、質と遅延の低下との間の許容できるトレードオフを達成するためには、ウィンドウ係数が付録２〜４の表のうちのいずれかに示されている関係を満たすものであれば十分である。しかし、実施の詳細によっては、付録１〜３の表に示されている値に基づくウィンドウ係数を得るために、指数１２８〜２５５，３８４〜５１１に対応するウィンドウ係数に関し、式（１６ａ），（１６ｂ）に基づく符号変換（比率−１の掛け算）がさらに必要となる場合がある。

図７Ａに示すフローチャートのステップＳ１５０は、１２８個の素子を有するアレイｕ（ｎ）を生成するために、以下の式（１９）に基づくフレームｚ（ｎ）のベクトルのサンプルの合計に置き換えられる。

そして、図７ＡのステップＳ１６０は、６４個の新しい副帯サンプルがマトリクス処理Ｍｕに基づき計算されるステップに置き換えられる。このマトリクス処理において、マトリクスＭのマトリクス素子は以下の式によって与えられる。

ｅｘｐ（）は複合指数関数を示し、ｉは前述したように虚数単位である。

図７Ｃは、３２副帯チャンネルのための実数値解析フィルターバンクという形での本発明に係る実施形態のフローチャートを示している。図７Ｃに示す実施形態は、図７Ａに示す実施形態とは重要な違いはない。これら二つの実施形態の間の主な違いは、新しい３２個の複合値副帯オーディオ値を計算するステップＳ１６０が、図７Ｃにおいては、３２個の実数値副帯オーディオサンプルがマトリクス処理Ｍ_rｕに基づき計算されるステップＳ１６２に置き換えられていることである。マトリクスＭ_rの素子は以下の式によって与えられる。

従って、フローチャートの一巡は３２個の実数値副帯サンプルを生成し、Ｗ（ｋ、ｌ）は、副帯ｋの副帯オーディオサンプルｌに相当する。

実数値解析フィルターバンクは、図５に示すように、例えばＳＢＲシステムの低電源モード構造に使用され得る。ＳＢＲ装置の低電源モードは、主に実数値フィルターバンクが使用されているという点で、高性能ＳＢＲ装置とは異なっている。これは、虚数部分の計算を必要としないので、２の比率でコンピュータ処理の複雑さ及びコンピュータ処理の手間を低減させ、単位時間あたりの処理数は基本的に２の比率で減じられる。

本発明によって提案される新たなフィルターバンクはＳＢＲシステムの低電源モードにも十分適合するものである。従って、本発明のフィルターバンクを使用すれば、ＳＢＲシステムは、通常モードつまり複合フィルターバンクを使用する高性能モード及び実数値フィルターバンクを使用する低電源モードのどちらにおいても動作可能である。実数値フィルターバンクは、例えば実数値（余弦変調によるもの）のみを使用し、虚数値（正弦変調によるもの）を省略することにより、複合フィルターバンクから導き出されるものであってもよい。

図８Ａは、６４個の副帯チャンネルのための複合値合成フィルターバンクという形での本発明の別の例に基づくフローチャートを示している。前述したように、ＳＢＲ処理された副帯信号の合成フィルタリングは、本発明の一実施形態に係る６４個の副帯のための合成フィルターバンクを使用して行われる。このフィルターバンクからの出力は、図１に関して説明したように、１ブロックの実数値時間領域サンプルである。この処理は図８Ａのフローチャートによって説明され、図８Ａはまた、時間領域オーディオサンプルを生成する方法という形の例を示すものである。

合成フィルタリングは、開始（ステップＳ２００）後、以下のようなステップを含み、一つのアレイｖは１２８０個のサンプルを含む。ステップＳ２１０において、アレイｖのサンプルは１２８個の位置分移動させられ、最も古い１２８個のサンプルが廃棄される。ステップＳ１２０では、６４個の新しい複合値オーディオ副帯サンプルがマトリクスＮによって掛け算され、マトリクス素子Ｎ（ｋ、ｎ）は以下の式によって与えられる。

ｅｘｐ（）は複合指数関数を示し、ｉは虚数単位を示す。図８Ａに示すように、この処理の出力の実数部分は、アレイｖの位置０〜１２７に保存される。

ステップＳ２３０において、今や時間領域であるサンプルが図８Ａに示されている式に基づきアレイｖから抜粋され、６４０個の素子を有するアレイｇ（ｎ）が生成される。ステップＳ２４０では、アレイｗを生成するために、アレイｇの時間領域の実数値サンプルをウィンドウ係数ｃ（ｎ）で掛ける。これらのウィンドウ係数ｃ（ｎ）は、付録１の表に示されている値に基づくものである。

しかし、前述したように、ウィンドウ係数は必ずしも正確に付録１の表によって与えられる値である必要はない。本発明の多様な実施形態においては、付録２〜４の表のいずれかに示されている関係を満足するウィンドウ係数であれば、合成フィルターバンクの望ましい低遅延特性を達成するのに十分である。さらに、解析フィルターバンクに関して説明したように、合成フィルターバンクの構造に他のウィンドウ係数が使用されてもよい。しかし、実施の詳細により、付録１〜３の表によって与えられる値に基づくウィンドウ係数を得るために、指数１２８〜２５５，３８４〜５１１に対応するウィンドウ係数に関する符号変換（比率−１の掛け算）がさらに必要となる場合がある。

図８Ａのフローチャートの一巡がステップＳ２６０で終了する前に、ステップＳ２５０で、このフローチャートの最後のステップとして示されている式に基づくアレイｗ（ｎ）からのサンプルの合計によって、６４個の新しい出力サンプルが算出される。図８Ａに示すフローチャートにおいて、Ｘ［ｋ］［ｌ］（＝Ｘ（ｋ，ｌ））は指数ｋを有する副帯のオーディオ副帯値ｌに相当する。図８Ａに示すような新たな一巡は、その出力として、６４個の時間領域実数値オーディオサンプルを生成する。

６４個の帯域のための複合値解析フィルターバンクの図８Ａに示すような実施は、図２Ｂに示す実施形態に関して説明したようないくつかの記憶領域を含む重複加算バッファを必要としない。ここでは、重複加算バッファはベクトルｖ，ｇに「かくれて」いる。ベクトルｇはベクトルｖに保存された値に基づき計算される。重複・加算バッファは、指数が１２８よりも大きいこれらのベクトルの構造内で実現され、その結果、値は以前のブロックからのものと同じである。

図８Ｂは、６４個の実数値オーディオ副帯チャンネルのための実数値合成フィルターバンクのフローチャートを示している。図８Ｂに係る実数値合成フィルターバンクは、低電源ＳＢＲ装置の場合、ＳＢＲフィルターバンクとして実施され得る。

図８Ｂのフローチャートは、主にステップＳ２２２が図８ＡのステップＳ２２０に取って代わっているという点で、図８Ａのフローチャートとは異なっている。ステップＳ２２２では、６４個の新しい実数値オーディオ副帯値がマトリクスＮ_rで掛け算され、このマトリクスの素子Ｎ_r（ｋ，ｎ）は以下の式によって与えられる。

この処理の出力は、ここでもまた、アレイｖの位置０〜１２７に保存される。

これらの変更以外に、低電源ＳＢＲモードのための実数値合成フィルターバンクの場合の図８Ｂに示すフローチャートは、高性能ＳＢＲモードのための複合値合成フィルターバンクの場合の図８Ａに示すフローチャートとはほとんど違いがない。

図８Ｃは、ダウンサンプルされた複合値合成フィルターバンク、及び例えば高性能ＳＢＲ装置に採用される適当な方法という形での本発明の一実施形態に係るフローチャートを示している。より正確には、図８Ｃに示す合成フィルターバンクは、３２個の副帯チャンネルのための複合値オーディオ副帯値を処理可能な複合値合成フィルターバンクに関連するものである。

ＳＢＲ処理副帯信号のダウンサンプル合成フィルタリングは、図８Ｃに示す３２チャンネルの合成フィルターバンクを使用して行われる。このフィルターバンクからの出力は、一ブロックの実数値時間領域サンプルである。この処理は図８Ｃのフローチャートに示されている。合成フィルタリングは、開始（ステップＳ３００）後、以下のステップを含み、一つのアレイｖは６４０個の実数値時間領域サンプルを含む。

ステップＳ３１０において、アレイｖのサンプルは６４個の位置分移動させられ、最も古い６４個のサンプルが廃棄される。そして、ステップＳ３２０では、６４個の新しい複合値副帯サンプルつまり複合値オーディオ副帯値がマトリクスＮで掛け算され、このマトリクスの素子は以下の式によって与えられる。

ｅｘｐ（）は複合値指数関数を示し、ｉは虚数単位である。この処理の出力の実数部分はアレイｖの位置０〜６３に保存される。

ステップＳ３３０では、サンプルが図８Ｃのフローチャートに示されている式に基づきベクトルｖから抜粋され、３２０個の素子を有するアレイｇが生成される。ステップＳ３４０では、式（１５）に基づく係数ｃ（ｎ）の直線的補間により、補間されたウィンドウ関数のウィンドウ係数ｃｉ（ｎ）が得られる。ここでもまた、指数ｎは０〜３１９（式（１５）に対してＮ＝６４，Ｔ＝１０）の範囲にある。前述したように、ウィンドウ関数ｃ（ｎ）の係数は付録１の表に示されている値に基づくものである。また、前述したような低遅延特性を得るためには、ウィンドウ係数が必ずしも正確に付録１の表に示されている数値である必要はない。ウィンドウ係数ｃ（ｎ）が付録２〜４に示されている少なくともいずれかの関係を満たすものであれば十分である。しかし、実施の詳細により、付録１〜３の表に示されている値に基づくウィンドウ係数を得るために、指数１２８〜２５５，３８４〜５１１に相当するウィンドウ係数に関して、式（１６ａ），（１６ｂ）に基づく符号変換（比率−１の掛け算）がさらに必要となる場合がある。当然、本発明の実施形態に、他のウィンドウ係数ｃ（ｎ）を含む他のウィンドウ関数を用いてもよい。

ステップＳ３５０において、アレイｇのサンプルが補間後のウィンドウ関数の補間後ウィンドウ係数ｃｉ（ｎ）で掛け算され、補間後の時間領域サンプルｗ（ｎ）が得られる。

そして、図８Ｃのフローチャートの最後のステップＳ３７０の前に、ステップＳ３６０において、アレイｗ（ｎ）からのサンプルの合計によって３２個の新しいサンプルを算出する。

前述したように、図８Ｃのフローチャートでは、Ｘ（［ｋ］，［ｌ］）（＝ｘ（ｋ，ｌ）はオーディオ副帯チャンネルｋのオーディオ副帯値ｌに相当する。また、図８Ｃに示すフローチャートの新たな一巡は、その出力として、新しい３２個の実数値時間領域サンプルを生成する。

図８Ｄは、例えば低電源ＳＢＲ装置に採用可能なダウンサンプル実数値合成フィルターバンクという形での本発明の一実施形態に係るフローチャートを示している。図８Ｄに示す実施形態及びフローチャートと図８Ｃに示したダウンサンプル複合値合成フィルターバンクのフローチャートとの違いは、ステップＳ３２０が図８ＤではステップＳ３２２に置き換えられている点だけである。

ステップＳ３２２において、３２個の新しい実数値オーディオ副帯値つまり副帯サンプルがマトリクスＮ_rで掛け算され、マトリクスＮ_rの素子は以下の式で与えられる。

この処理の出力はアレイｖの０〜６４の位置に保存される。

図９Ａは、６４個の副帯のための複合値解析フィルターバンクに対応する方法という形での本発明ん係る別の実施形態を示す。図９Ａは、出力としてベクトルｙとベクトル“ｓｔａｔｅ”を提供するＭＡＴＬＡＢ実施を示す。図９Ａに示す手順で定義される関数はＬＤＦＢ８０と呼ばれ、新しいオーディオサンプルを含むベクトルｘとベクトル“ｓｔａｔｅ”がこのＬＤＦＢ８０に入力として与えられる。関数ＬＤＦＢ８０という名前は、過去に８ブロック及び未来に０ブロック延長するための低遅延フィルターバンクの省略である。

ＭＡＴＬＡＢプログラム言語において、パーセントの印（％）は注記を示し、それは実行されないが、注解をしたりソースコードを説明する目的でのみ記されている。以下では、ソースコードの異なる部分をその機能に関して説明する。

ステップＳ４００では、指数５７７〜６４０を有するベクトル“ｓｔａｔｅ”の内容が新しい時間領域オーディオ入力サンプルを含むベクトルｘの内容に置き換えられるように、ベクトル“ｓｔａｔｅ”によって表わされるバッファが更新される。ステップＳ４１０では、可変ＬＤＦＢ８０＿ｗｉｎに保存されているような解析ウィンドウ関数のウィンドウ係数がベクトルｗｉｎ＿ａｎａに転送される。

ステップＳ４２０では、最新のサンプルがバッファの右側に並べられると仮定して、実際のウィンドウ処理を行う。ステップＳ４２０では、ベクトル“ｓｔａｔｅ”の内容が素子ごとに、解析ウィンドウ関数を含むベクトルｗｉｎ＿ａｎａで掛け算される（．^＊）。この掛け算の出力は、ベクトルｘ＿ｗｉｎ＿ｏｒｉｇに保存される。

ステップＳ４３０において、ｘ＿ｓｔａｃｋと呼ばれる１２８・５の素子を有するサイズのマトリクスを形成するために、ベクトルｘ＿ｗｉｎ＿ｏｒｉｇの内容が整形される。ステップＳ４４０では、マトリクスｘ＿ｓｔａｃｋの第２〜第４列に関して、ｘ＿ｓｔａｃｋの符号変換が実行される。

ステップＳ４５０では、第２の指数に関するｘ＿ｓｔａｃｋの素子を合計し、同時に素子の順序を逆転し、結果を置き換えることによってｘ＿ｓｔａｃｋを破壊又は取り消し、その結果は再びｘ＿ｓｔａｃｋに保存される。

ステップＳ４６０においては、ｘ＿ｓｔａｃｋの素子ごとに複合指数関数で掛けられた内容が複合高速フーリエ変換（ＦＦＴ）で時間領域から周波数領域へ転換され、０〜−１２７の指数及び虚数単位ｉに関して偏角（−ｉ・π・ｎ／１２８）が提供される。

ステップＳ４７０では後処理が行われ、変数ｍ＝（６４＋１）／２を定義し、以下の式によりオーディオ副帯値を含むブロックをベクトルｙとして算出する。

図９Ａに示す実施において、指数ｋは１〜６４の整数をカバーする。ベクトルｙは図１のオーディオ副帯値１８０を含むベクトル又はブロックとして出力される。第２の要因となる式（２６）の上の線及び図９Ａに示すステップＳ４７０のｃｏｎｊ（）の符号化部分は、それぞれの複素数の偏角の複合共役を示す。

最後の符号化ステップＳ４８０において、ステートベクトルが６４個の素子分移動させられる。移動後のステートベクトルは、関数ＬＤＦＢ８０に、次の一巡の入力として与えられる。

図９Ｂは３２個の副帯のための複合値解析フィルターバンクに相当する方法という形での本発明の一実施形態に係るＭＴＢＬＡＢ実施を示す。従って、定義される関数はＬＤＦＢ８０＿３２と称され、これは、過去に８ブロック未来に０ブロックの追加重複に基づく３２個の副帯のための低遅延フィルターバンクを示す。

図９Ｂの実施と図９Ａの実施との違いは、いくつかの符号化ステップに関するものだけであり、これについて以下に説明する。主に副帯の数つまり関数ＬＤＦＢ８０＿３２によって出力される副帯値の数が２の比率で少なくなるという事実を考慮して、ステップＳ４００，Ｓ４３０，Ｓ４６０，Ｓ４７０はステップＳ４３０’，Ｓ４６０’，Ｓ４７０’に置き換えられている。従って、ステップＳ４００’は、図１に示すような新しいブロック２２０の３２個の時間領域オーディオ入力サンプルを有する指数２８９〜３２０に対応する最後の３２個の入力に関して更新されたステートベクトルに関するものである。

しかし、図９Ａの実施と図９Ｂの実施との主な違いは、図９ＡのステップＳ４１０が、図９Ｂの実施においてはステップＳ４１２に置き換えられていることである。図９ＢのステップＳ４１２は、まず、ベクトルＬＤＦＢ８０＿ｗｉｎに保存されているウィンドウを含む６４０個のウィンドウ係数をローカルベクトルｗｉｎ＿ａｎａにコピーする。そして、式（１５）に基づき補間を実行し、ベクトルｗｉｎ＿ａｎａのベクトル素子によって示される二つの連続するウィンドウ係数が加算され、２で割られ、そしてベクトルｗｉｎ＿ａｎａに再び保存される。

次のステップＳ４２０は図９Ａに示されているステップＳ４２０と同じであり、ステートベクトルの値つまり素子の、補間後のウィンドウ関数の補間ウィンドウ係数を含むベクトルｗｉｎ＿ａｎａの素子での掛け算（．^＊）というウィンドウ処理が実行される。この処理の出力はベクトルｘ＿ｗｉｎ＿ｏｒｉｇに保存される。しかし、図９ＢのステップＳ４２０と図９ＡのステップＳ４２０との違いは、図９Ｂの場合には、ウィンドウ処理として６４０個ではなく３２０個の掛け算が行われることである。

ステップＳ４３０に取って代わるステップＳ４３０’において、ベクトルｘ＿ｗｉｎ＿ｏｒｉｇを整形することによってｘ＿ｓｔａｃｋが準備される。しかし、ベクトルｘ＿ｗｉｎ＿ｏｒｉｇはたった３２０個の素子を含むだけなので、図９Ａの対応するベクトルに比べて、そのマトリクスｘ＿ｓｔａｃｋはたった６４・５個の素子を含むだけである。

符号変換のステップＳ４４０及びスタックを崩壊させるステップＳ４５０は、素子の数が少なくなった（６４０に対して３２０）という点以外は、図９Ａ，９Ｂどちらの実施においても同じである。

ステップＳ４６０に取って代わるステップＳ４６０’においては、ウィンドウデータの奇数複合高速フーリエ変換（ＦＦＴ）が行われ、これは図９ＡのステップＳ４６０で実行される変換と酷似している。高速フーリエ変換の出力、つまりｘ＿ｓｔａｃｋと偏角（−ｉ・π・ｎ／６４）の複合指数関数の素子ごとの掛け算の出力がベクトルｔｅｍｐに与えられるが、ここでも、出力オーディオ副帯値の数が少なくなったために、指数ｎは０〜６３の範囲である。

その後、修正ステップＳ４７０’において、変数ｍ＝（３２＋１）／２を定義し、式（２６）に基づきベクトルｙを生成することで、後処理が行われる。ここでは、指数ｋは１〜３２の範囲しかカバーせず、複合指数関数の偏角に現れる１２８という数字は６４に置き換えられている。

最後に、図９Ａの場合はステップＳ４８０でバッファが６４個の素子分移動させられたが、図９Ｂの場合、最後のステップＳ４８０’でバッファが３２個の素子分移動させられる。

図１０Ａは、６４副帯のための複合値合成フィルターバンクに相当する方法という形での本発明に係る一実施形態を示すＭＡＴＬＡＢ原稿である。図１０Ａの原稿は関数ＩＬＤＦＢ８０を示し、この関数ＩＬＤＦＢ８０には、図２Ａのオーディオ副帯値のブロック３２０及びステートベクトル“ｓｔａｔｅ”が入力パラメータとして与えられる。関数ＬＤＦＢ８０という名前は、定義される関数が、過去の８ブロックのオーディオデータ及び未来の０ブロックのオーディオデータに相当する逆転低遅延フィルターバンクであることを示している。この関数は、出力として、ベクトルｙ及び新しいつまり再定義されたステートベクトル“ｓｔａｔｅ”を与え、ベクトルｙは図２Ａの時間領域オーディオサンプルブロック４１０に相当する。

ステップＳ５００では、前処理が行われ、変数ｍ＝（６４＋１）／２及びベクトルｔｅｍｐが定義される。ベクトルｔｅｍｐの素子ｔｅｍｐ（ｎ）は以下の式に基づき定義される。

ベクトルの素子ｘ（ｎ）の上の線及び関数ｃｏｎｊ（）は複合共役を示し、ｅｘｐ（）は複合指数関数を示し、ｉは虚数単位を示し、ｎは１〜６４の範囲の指数を示す。

ステップＳ５１０においては、ベクトルｔｅｍｐが、第１列にベクトルｔｅｍｐの素子及び第２列にベクトルの指数に定義された素子の順序に関して逆転されたベクトルｔｅｍｐの複合共役を有するマトリクスに変換される。このように、ステップＳ５１０では、ベクトルｔｅｍｐに基づきマトリクスｔｅｍｐの奇数対称が確立される。

ステップＳ５２０では、奇数高速フーリエ変換（ＦＦＴ）がマトリクスｔｅｍｐに基づき実行される。このステップでは、マトリクスｔｅｍｐの逆フーリエ変換の出力と（ｉ・π/１２８）の偏角を有する指数関数との素子ごとの実数部分での掛け算が実行され、ベクトルｙ＿ｋｎｌに出力される。ここでは、指数ｎは０〜１２７の範囲にある。

ステップＳ５３０において、データの拡張及び交互の符号変換が行われる。これを達成するために、ベクトルｙ＿ｋｎｌの素子の順序が逆転され、必要な場合には符号変換が同時に行われる。そして、第１，第３，第５列にベクトルｙ＿ｋｎｌを含み、第２，第４列に符号変換されたベクトルｙ＿ｋｎｌを含むマトリクスｔｅｍｐが定義される。

ステップＳ５４０では、ベクトルＬＤＦＢ８０＿ｗｉｎに保存されているウィンドウ係数がまずベクトルｗｉｎ＿ａｎａにコピーされる。そして、合成ウィンドウ係数がベクトルｗｉｎ＿ａｎａに保存された解析ウィンドウ係数に基づき決定されるが、これは、以下の式に基づき解析ウィンドウ関数の時間逆転版を生成することにより行われる。

Ｎ・Ｔはウィンドウ係数の合計数であり、ｎはウィンドウ係数の指数である。

ステップＳ５５０において、ベクトルと合成ウィンドウ関数の素子ごとの掛け算により、合成ウィンドウがベクトルｔｅｍｐに適応される。ステップＳ５６０では、５７７〜６４０の指数を有するベクトルｓｔａｔｅの素子を０にセットし、ステートベクトルｓｔａｔｅにウィンドウ処理されたベクトルｔｅｍｐを付加することにより、バッファが更新される。

ステップＳ５７０では、指数１〜６４を有するベクトルｓｔａｔｅの素子を抜粋することにより、時間領域オーディオサンプルを含む出力ベクトルｙがベクトルｓｔａｔｅから抜粋される。

ステップＳ５８０は図１０Ａに示す関数の最後のステップであり、ステートベクトルｓｔａｔｅが６４個の素子分だけ移動させられ、６５〜６４０の指数を有する素子がベクトルｓｔａｔｅの最初の５７６個の素子にコピーされる。

図１０Ｂは３２個の副帯値のための複合値合成フィルターバンクという形での本発明の実施形態のＭＡＴＬＡＢ原稿を示す。図１０Ｂに示す原稿により定義される関数はＩＬＤＦＢ８０＿３２と呼ばれるものであるが、この名前は、この関数が過去からの８ブロックの重複と未来からの０ブロックの重複を有する３２帯域のための逆転低遅延フィルターバンクであることを示している。

図９Ａ、図９Ｂに示した実施形態に関して説明したように、図１０Ｂの実施形態もまた、図１０Ａに係る６４副帯合成バンクフィルターと密接に関わるものである。つまり、同様のベクトルが関数に与えられ、また関数によって出力される。しかし、それらのベクトルは、図１０Ａの場合と比較して、半分の数の素子しか含まない。３２帯域合成フィルターバンクは、図１０Ａに示す６４副帯の合成フィルターバンクとは、主に二つの面で異なっている。ステップＳ５００，Ｓ５１０，Ｓ５２０，Ｓ５３０，Ｓ５６０，Ｓ５７０，Ｓ５８０は、処理される素子の数及び素子に関係するパラメータの数が半分であるステップに置き換えられている。さらに、合成ウィンドウ関数を生成するステップＳ５４０は、ステップＳ５４２に置き換えられ、合成ウィンドウ関数は、式（１５）に基づき直線的補間された合成ウィンドウ関数として生成される。

ステップＳ５００に取って代わるステップＳ５００’において、変数ｍはｍ＝（３２＋１）／２として定義され、ベクトルｔｅｍｐは式（２７）に基づき定義される。そこでは、指数ｎは単に１〜３２の範囲をカバーするだけのものであり、指数関数の偏角において、１／１２８の比率が１／６４の比率に置き換えられる。

従って、ステップＳ５１０に取って代わるステップＳ５１０’においても、指数の範囲はベクトルｔｅｍｐを含む単に３２個の素子の指数である。換言すれば、指数は１〜３２の値をカバーしているだけである。従って、ステップＳ５２０に取って代わるステップＳ５２０’においても、指数関数の偏角は（ｉ・π・ｎ・６４）に置き換えられ、指数ｎは０〜６３の範囲である。ステップＳ５３０’においても、指数範囲は、ステップＳ５３０と比べて２の比率で減じられている。

図１０ＡのステップＳ５４０に取って代わるステップＳ５４２でもまた、ベクトルＬＤＦＢ８０＿ｗｉｎに保存されているウィンドウ関数がベクトルｗｉｎ＿ａｎａにコピーされ、式（２８）に基づき時間逆転版ｗｉｎ＿ｓｙｎが生成される。しかし、図１０Ｂに示す実施形態のステップＳ５４２は、さらに式（１５）に基づく補間ステップを含み、合成ウィンドウ関数のウィンドウ係数を含む再定義されたベクトルｗｉｎ＿ｓｙｎの各素子のために、元の合成ウィンドウ関数の二つの連続するウィンドウ係数の直線的補間が行われる。

ウィンドウをベクトルｔｍｐに応用し、素子ｔｍｐをそのウィンドウ処理後のものに置き換えるステップＳ５５０は、図１０Ａ、図１０Ｂのそれぞれのステップを直接比較すると、同じである。しかし、図１０Ｂの場合にはベクトルｔｍｐのサイズが小さいので、半分の掛け算が実行されるだけである。

ステップＳ５６０，Ｓ５７０，Ｓ５８０に取って代わるステップＳ５６０’，Ｓ５７０’，Ｓ５８０’においても、指数６４０及び６４がそれぞれ３２０及び３２に置換される。故に、これらの最後の三つのステップは、図１０Ａに示した実施形態のこれらのステップと比べて、ベクトルｓｔａｔｅのサイズの点でのみ異なっている。

これまでに説明した実施形態で述べたように、解析ウィンドウ処理装置及び合成ウィンドウ処理装置は、それぞれのフレームに含まれる時間領域のそれぞれのサンプルをウィンドウ関数のウィンドウ係数と素子ごとに掛け算することによってウィンドウ処理するように構成されている。

例えば合成ウィンドウ関数及びその時間逆転版の解析ウィンドウ関数として使用され得るウィンドウ関数をより詳細に説明する前に、本発明に係る実施形態の利点を、特に図５、図６に示すＳＢＲ装置またはシステムの構造の実施に関して詳細に説明する。

本発明に係る実施形態及び本発明の実施形態を一つ以上含むシステムが提供する利点は、他のフィルターバンクによる遅延をかなり低下させることである。この低遅延特性は図１３、図１４に関して後により詳細に述べる。これに関する一つの重要な側面は、ウィンドウ関数の長さ、つまり時間領域サンプルのフレームまたはブロックに適応されるウィンドウ係数の数は、遅延とは無関係であるということである。

また、図１７、図１８に関して後に詳細に述べるが、心理音響の点に関して、本発明の実施形態は、しばしば、他の多くのフィルターバンクよりも有効に人間の耳の一時的なマスキング特性を利用している。さらに、図１５、図１６、図１９を参照して後により詳細に述べるが、本発明の実施形態は非常に良好な周波数応答を提供する。

また、本発明の一実施形態に係る多くのフィルターバンクにおいては、解析フィルターバンクと合成フィルターバンクが相互接続されているならば、完全な再生が可能である。換言すれば、本発明の実施形態は、このような相互接続された一組の解析フィルターバンクと合成フィルターバンクへの入力と比較して聴覚的に区別不可能な出力を提供するだけでなく、量子化の誤差及びコンピュータ処理の循環効果と必要な個別分離化によって生じる他の効果は別として、入力と同じ出力を提供する。

本発明に係るフィルターバンクのＳＢＲモジュールへの統合は、簡単にできる。概してＳＢＲモジュールは二種速度モードで動作するが、本発明にかかる複合値低遅延フィルターバンクは一種速度モードで完全な再生を行うことが可能である。しかし、元来のＳＢＲＱＭＦフィルターバンクは完全ではなく、それに近い再生が可能であるだけである。二種速度モードでは、インパルス応答の３２帯域版が直線的補間によって得られる。この直線的補間は、図３に関して説明したように、６４帯域インパルス応答またはウィンドウ関数の二つの隣接したタップ又はウィンドウ係数のダウンサンプリングのことを意味している。

複合値フィルターバンクの場合、批判的に取り上げたフィルターバンクに比べて、解析（または合成）遅延をかなり低下させることができ、サンプリング周波数又は処理周波数は、ナイキスト−シャノン理論によるボーダー周波数に相当するものである。実数値フィルターバンクの場合、例えば図９、図１０でＭＡＴＬＡＢ実施に関して示したように、最適化されたアルゴリズムを使用することで有効な実施ができる。これらの実施形態は、図５、図６に関して説明したように、例えばＳＢＲ装置の低電源モードに使用できる。

図５、図６を参照して述べたように、ＳＢＲシステムにおいて、本発明の一実施形態に係る複合値低遅延フィルターバンクを使用することで、遅延をより低下させることができる。前述したように、図５に示すようなＳＢＲデコーダ６１０において、ＱＭＦ解析フィルターバンク６２０は本発明の一実施形態に係る複合値低遅延フィルターバンク（ＣＬＤＦＢ）に置き換えられる。帯域の数（６４）とインパルス応答の長さ（６４０）を保ちながら、複合調整を用いることによって、この置き換えはコンピュータ処理として実行される。この装置による遅延は、達成可能な質のレベルを犠牲にせずに、全体としての遅延が双方向通信にとって十分低いものとなる程度に抑えられる。

例えば、複合値のＭＤＣＴに類似のシステムを形成するためにＭＤＣＴ及びＭＤＳＴを有するシステムと比較して、本発明に係る一実施形態は非常に良い周波数応答を有する。例えば、今日、ＭＰＥＧ−４ＳＢＲに使用されるＱＭＦフィルターバンクと比べて、本発明の実施形態に係る一つ又はそれ以上のフィルターバンクを含むシステムは、かなり低い遅延を有する。

低遅延ＱＭＦフィルターバンクと比較しても、本発明に係る実施形態は、低遅延と共に完全な再生という利点を有する。ＱＭＦフィルターバンクの完全に近い再生とは対照的に、完全な再生特性から得られる利点は以下のようなものである。完全に近い再生のためには、エイリアシングを十分に低いレベルに抑えるために、高いストップバンド減衰が必要である。このことは、フィルター設計において非常に低遅延なものを達成する可能性に制限を与える。しかし、本発明に係る実施形態を採用すれば、エイリアシングを十分に低いレベルに抑えるために高いストップバンド減衰を必要としないので、フィルターを独立的に設計する可能性を与えることになる。ストップバンド減衰は、必要とされる信号処理の応用にとってエイリアシングの十分な低下を可能とするのに十分な低さである。従って、フィルター設計において、低遅延に対するより良いトレードオフが可能である。

図１１は、例えば正弦ウィンドウ関数７１０と本発明に係る実施形態に使用可能なウィンドウ関数７００との比較を示す。このウィンドウ関数７００は「合成」ＣＭＬＤＦＢウィンドウ（ＣＭＬＤＦＢ＝複合変調低遅延フィルターバンク）とも称されるが、付録１の表に示す値に基づく６４０個のウィンドウ係数を有している。ウィンドウ関数の大きさに関して、以下に示すように、ウィンドウ信号の振幅調整のための一般的な増幅率又は抑制率は考慮されないことを明記しておく。このウィンドウ関数は、図１３に示されているように、例えば遅延の中心に相当する値に関して、又はｎ＝Ｎ，ｎ＝Ｎ−１，ｎ＝Ｎ＋１（Ｎ＝ブロック長，ｎ＝ウィンドウ係数の指数）に関して標準化される。これに対して、正弦ウィンドウ関数７１０は１２８個のサンプルによって定義されるものであり、例えば、ＭＤＣＴ又はＭＤＳＴモジュールに使用される。

しかし、実施の詳細により、付録１〜３の表に示されている値に基づくウィンドウ係数を得るために、指数１２８〜２５５，３８４〜５１１に相当するウィンドウ係数に関して、式（１６ａ），（１６ｂ）に基づく符号変換（比率−１の掛け算）がさらに必要となる場合がある。

二つのウィンドウ関数７００，７１０を論ずる前に、どちらのウィンドウ関数も実数値のウィンドウ係数のみを含むものであることを明記する。さらに、どちらの場合も、指数ｎ＝０に相当するウィンドウ係数の絶対値は０．１よりも小さい。ＣＭＬＤＦＢウィンドウ７００の場合、それぞれの値はさらに０．０２よりも小さい。

二つのウィンドウ関数７００，７１０をそれらの定義集合に関して考慮すると、いくつかの重要な違いが明らかとなる。正弦ウィンドウ関数７１０は対称であるのに対し、ウィンドウ関数７００は非対称である。これをより明確に定義するために、全ての実数ｎに関してある一つの実数値ｎ₀が存在し、（ｎ₀＋ｎ）及び（ｎ₀−ｎ）にとって正弦ウィンドウ関数７１０が望ましい誤差（ε≧０；式（２９）の両辺の項の差の絶対値はε以下である）で、以下の関係を満たすように定義されるので、正弦ウィンドウ関数は対称である。

ｗ（ｎ）は指数ｎに相当するウィンドウ係数を示す。正弦ウィンドウの場合、それぞれの指数ｎ₀が二つの最大のウィンドウ係数の正確に真ん中にある。換言すれば、正弦ウィンドウ関数７１０にとって、その指数はｎ₀＝６３．５である。この正弦ウィンドウ関数は指数ｎ＝０，…，１２７で定義される。

これとは対照的に、ウィンドウ関数７００は指数ｎ＝０，…，６３９によって定義される。このウィンドウ関数７００は、全ての実数ｎ₀のために少なくとも一つの実数が常に存在し、（ｎ₀＋ｎ）及び（ｎ₀−ｎ）は、以下の不等式が（ほぼ計画的に）定義可能な誤差（ε≧０；式（２９）の両辺の項の差の絶対値はε以上である）で成り立つウィンドウ関数の定義集合に属している点から、明らかに非対称である。

ここでも、ｗ（ｎ）は指数ｎに相当するウィンドウ係数である。

これら二つのウィンドウ関数はどちらも６４個のサンプルというブロックサイズに関するものであるが、これらの間の更なる違いは、ウィンドウ関数７００の最大値は１よりも大きく、合成ウィンドウに関して以下の範囲の指数のために得られたものであるということである。

図１１に示すウィンドウ関数７００の場合、得られた最大値は、指数ｎ＝７７のサンプルで得られた１．０４よりも大きい。これに対して、正弦ウィンドウ７１０の最大値は１以下であり、ｎ＝６３及びｎ＝６４で得られる。

しかし、ウィンドウ関数７００では、ｎ＝Ｎ近辺のサンプル指数で約１の値が得られる。より正確には、指数ｎ＝Ｎ−１に相当するウィンドウ係数ｗ（Ｎ−１）の絶対値又はそれ自身の値は１よりも小さく、ｎ＝Ｎに相当するウィンドウ係数ｗ（Ｎ）の絶対値又はそれ自身の値は１よりも大きい。本発明に係るいくつかの実施形態において、これら二つのウィンドウ係数は以下の関係を満たす。

これは本発明の実施形態に係るフィルターバンクのオーディオの質を最適化した結果である。多くの場合において、できる限り小さい絶対値のウィンドウ係数ｗ（０）を有することが望ましい。この場合、可能なパラメータに関して最適化されたオーディオの質を達成するためには、以下の式で示されるように、ウィンドウ係数の決定要素はできる限り１に近づけるべきである。

式（３３）によって与えられる決定要素の符号は、しかし自由に選択できる。ウィンドウ係数ｗ（０）は０よりも小さい又は約０であるので、ｗ（Ｎ−１）・ｗ（Ｎ）の積又はその絶対値は＋／−１に限りなく近い。この場合、ウィンドウ係数ｗ（２Ｎ−１）はほとんど自由に選択できる。式（３３）は、Ｇ．Ｄ．Ｔ．シュラー及びＭ．Ｊ．Ｔ．スミスによる「変調完全再生フィルターバンクの新しい構造」（信号処理に関するＩＥＥＥ変換，Ｖｏｌ．４４，Ｎｏ．８，１９９６年８月）に説明されているような０遅延マトリクス技術を用いた結果である。

さらに、図１３を参照しながら後述するが、指数Ｎ−１及びＮに相当するウィンドウ係数は変調コアの中心に含まれ、従って、約１．０の値を含み、プロトタイプフィルター関数又はウィンドウ関数によって定義されるフィルターバンクの遅延と同時に生じるサンプルに相当する。

図１１に示すような合成ウィンドウ関数７００は、さらに、最新の時間領域オーディオサンプルをウィンドウ処理するのに使用される指数（ｎ＝０）に相当するウィンドウ係数列のウィンドウ係数から、合成ウィンドウ関数７００のウィンドウ係数全てのうちで最も高い絶対値を有するウィンドウ係数まで、完全に単調に増加する振動を示す。当然、時間逆転解析ウィンドウ関数の場合には、対応する（時間逆転）解析ウィンドウ関数で最も高い絶対値を有するウィンドウ係数から、最新の時間領域オーディオサンプルをウィンドウ処理するのに使用される指数（ｎ＝６３９）に相当するウィンドウ係数列のウィンドウ係数まで、完全に単調に低下する振動を示す。

このような振動の結果、合成ウィンドウ関数７００の展開は０．０２よりも小さい絶対値を有する指数ｎ＝０に相当するウィンドウ係数から開始され、指数ｎ＝１に相当するウィンドウ係数の絶対値は０．０３よりも小さく、指数ｎ＝Ｎで約１の値が得られ、式（３１）に示す範囲内の指数で１．０４より大きい最大値が得られ、ｎ＝９０及びｎ＝９１で再び約１の値が得られ、ｎ＝１６２及びｎ＝１６３の指数で最初の符号変換が見られ、約ｎ＝３Ｎの指数で−０．１又は−０．１２７５５よりも小さい最小値が得られ、ｎ＝２８４及びｎ＝２８５の指数でさらなる符号変換が見られる。しかし、この合成ウィンドウ関数７００は、さらに別の指数ｎでさらなる符号変換をしてもよい。これらのウィンドウ係数を付録１及び３の表に示されている値と比較すると、指数１２８〜２５５，３８４〜５１１に相当するウィンドウ係数に関して、式（１６ａ），（１６ｂ）に基づくさらなる符号変換（比率−１の掛け算）が考えられるべきである。

合成ウィンドウ関数７００のこの振動は、かなり低減された振動と同様のものであり、最大値が約１．０４、最小値が−０．１２として描かれている。この結果、全てのウィンドウ係数のうちの５０％以上が０．１以下の絶対値を有している。図１、図２Ａの実施形態に関して説明したように、ウィンドウ関数の展開は第１グループ４２０（又は２００）及び第２グループ４３０（又は２１０）を含み、第１グループ４２０はウィンドウ係数第１連続部分を含み、第２グループ４３０はウィンドウ係数第２連続部分を含む。前述したように、ウィンドウのウィンドウ係数列は第１グループ４２０のウィンドウ係数と第２グループ４３０のウィンドウ係数だけを含み、第１グループ４２０のウィンドウ係数は正にウィンドウ係数第１連続部分であり、第２グループ４３０のウィンドウ係数は正にウィンドウ係数第２連続部分である。従って、第１グループ４２０とウィンドウ係数第１連続部分、第２グループとウィンドウ係数第２連続部分とは類義語として使用される。

全てのウィンドウ係数のうちの５０％以上のものは０．１以下の値を有しており、第２グループつまりウィンドウ係数第２部分４３０に、ウィンドウ関数７００の非常に低減された振動の結果として含まれている。また、第２グループつまり第２部分４３０に含まれている全てのウィンドウ係数のうちの５０％以上のものは０．０１以下の絶対値を有する。

ウィンドウ係数第１部分４２０は、ウィンドウ係数列の全てのウィンドウ係数のうちの３分の１未満のものを含んでいる。従って、ウィンドウ係数第２部分４３０はウィンドウ係数の２／３以上を含んでいることになる。フレーム１２０，１５０，３３０，３８０のいずれかで処理されるべきブロックの合計数がＴ（４ブロックよりも多い）である場合、第１部分は概して３／２・Ｎ個のウィンドウ係数を含み、Ｎは一つのブロック中の時間領域サンプルの数である。従って、第２部分は残りのウィンドウ係数、より正確には、（Ｔ−３／２）Ｎ個のウィンドウ係数を含む。図１１に示すように、フレームごとのブロック数が１０（Ｔ＝１０）の場合、第１部分は３／２・Ｎ個のウィンドウ係数を含み、第２部分は８．５・Ｎ個のウィンドウ係数を含む。ブロックごとの時間領域オーディオサンプルの数が６４（ブロックサイズがＮ＝６４）の場合、第１部分は９６個のウィンドウ係数を含み、第２部分は５４４個のウィンドウ係数を含む。図１１に示すような合成ウィンドウ関数７００では、第１部分と第２部分のボーダー、つまり指数ｎが９５又は９６の部分において、約０．９６の値が得られる。

第１部分４２０及び第２部分４３０に含まれているウィンドウ係数の数がこのようなものであるにもかかわらず、それぞれの部分でのウィンドウ係数のエネルギー値または合計エネルギー値は互いに大きく異なっている。エネルギー値は以下の式によって定義される。

ｗ（ｎ）はウィンドウ係数であり、式（３４）で合計される指数ｎはそれぞれの部分４２０，４３０の指数であり、それぞれのエネルギー値Ｅは、一組のウィンドウ係数全体のものである。ウィンドウ係数が数の点で上記のような重大な違いがあるにもかかわらず、第１部分４２０のエネルギー値は全てのウィンドウ係数の合計エネルギー値の２／３以上である。従って、第２部分４３０のエネルギー値は全てのウィンドウ係数の合計エネルギー値の１／３以下である。

より詳細には、ウィンドウ関数７００のウィンドウ係数第１部分４２０のエネルギー値は約５５．８５であり、ウィンドウ係数第２部分４３０のエネルギー値は２２．８１である。ウィンドウ関数７００の全てのウィンドウ係数の合計エネルギー値は約７８．０３であるので、第１部分４２０のエネルギー値はウィンドウ係数全体のエネルギー値の約７１．６％であり、第２部分４３０のエネルギー値は全体のエネルギー値の約２８．４％である。

当然、式（３４）は、エネルギー値Ｅを標準化係数Ｅ₀で割ることにより、標準化版として示すことも可能である。Ｅ₀は原則的にどんなエネルギー値であってもよい。標準化係数Ｅ₀は、例えば式（３４）に基づき計算されるウィンドウ係数列の全てのウィンドウ係数の合計エネルギー値であってもよい。

ウィンドウ係数の絶対値又はそれぞれのウィンドウ係数のエネルギー値に基づき、ウィンドウ係数列の中心点つまり「質量の中心」が決定され得る。ウィンドウ係数列の質量の中心つまり中心点は実数であり、概してウィンドウ係数第１部分４２０の指数範囲に存在している。それぞれのフレームが４よりも多いブロック数の時間領域オーディオサンプル（Ｔ＞４）を含む場合、ウィンドウ係数の絶対値に基づく質量の中心ｎ_ca又はウィンドウ係数のエネルギー値に基づく質量の中心ｎ_ceは、３／２・Ｎよりも小さい。換言すれば、フレームごとのブロック数Ｔ＝１０の場合、質量の中心は第１部分４２０の指数の領域にある。

ウィンドウ係数ｗ（ｎ）の絶対値に基づく質量の中心ｎ_caは、以下の式（３５）によって定義され、ウィンドウ係数ｗ（ｎ）のエネルギー値に基づく質量の中心ｎ_ceは、以下の式（３６）によって定義される。

ＮとＴは、それぞれ、ブロックごとの時間領域オーディオサンプルの数及びフレームごとのブロックの数を示す正の整数である。当然、式（３５），（３６）による中心点はまた、上記の合計の限界を置き換えることによって、ウィンドウ係数の限定集合に関して求めることも可能である。

図１に示すようなウィンドウ関数７００に関して、ウィンドウ係数ｗ（ｎ）の絶対値に基づく質量の中心ｎ_caは、ｎ_ca≒８７．７５の値に等しく、ウィンドウ係数ｗ（ｎ）のエネルギー値に関する中心点つまり質量の中心ｎ_ceは、ｎ_ce≒８０．０４である。ウィンドウ関数７００のウィンドウ係数第１部分２００は９６個（＝３／２・Ｎ；Ｎ＝６４）のウィンドウ係数を含み、前述したように、中心点は両方ともウィンドウ係数第１部分２００内にある。

ウィンドウ係数７００のウィンドウ係数ｗ（ｎ）は付録１の表に示されている値に基づいている。しかし、例えば前述したようなフィルターバンクの低遅延特性を達成するためには、付録１の表に示されている値を正確にウィンドウ係数に適用する必要はない。多くの場合、６４０個のウィンドウ係数を含むウィンドウ関数のウィンドウ係数のためには、付録２〜４のいずれかの表に示されている関係又は式を満たすだけで十分である。付録１の表に示されているウィンドウ係数又はフィルター係数は好ましい値を示し、いくつかの実施においては式（１６ａ），（１６ｂ）により適応されてもよい。しかし、例えば、別の付録の別の表により、これらの好ましい値は小数点第２位、第３位、第４位、第５位以降が変更されてもよく、結果としてのフィルター又はウィンドウ関数は本発明に係る実施形態の利点をなおも有している。しかし、実施の詳細により、付録１〜３の表に示されている値に基づくウィンドウ係数を得るために、指数１２８〜２５５，３８４〜５１１に対応するウィンドウ係数に関して、式（１６ａ），（１６ｂ）に応じたさらなる符号変換（比率−１の掛け算）を考慮すべきである。

当然、別の個数のウィンドウ係数を含む別のウィンドウ関数が同様に定義され、本発明に係る実施形態の構造に使用され得る。これに関して、過去のサンプルと未来のサンンプルに関するブロックの配列だけでなく、ブロックごとの時間領域オーディオサンプルの数とフレームごとのブロックの数のどちらもまた、多様な範囲のパラメータにより変更可能である。

図１２は、図１１に示すような複合変調低遅延フィルターバンクウィンドウ（ＣＭＬＤＦＢ−ウィンドウ）７００と、例えばＭＰＥＧ標準のＳＢＲ装置に使用される元来のＳＢＲＱＭＦプロトタイプフィルター７２０との比較である。図１１に示すように、ＣＭＬＤＦＢウィンドウ７００は本発明の一実施形態に係る合成ウィンドウである。

本発明の一実施形態に係るウィンドウ関数７００は式（３０）で定義されるように明らかに非対称である。ウィンドウ関数７００及びＳＢＲＱＭＦプロトタイプフィルター７２０はそれぞれ６４０個の指数に関して定義されるので、元来のＳＢＲＱＭＦプロトタイプフィルター７２０は、指数ｎ＝３１９及び３２０に関して対称である。換言すれば、式（２９）に関して、対称の中心を表す「指数値」ｎ₀は、ＳＢＲＱＭＦプロトタイプフィルター７２０の場合、ｎ₀＝３１９．５である。

さらに、ＳＢＲＱＭＦプロトタイプフィルター７２０が対称であるために、式（３５），（３６）による中心点ｎ_ca，ｎ_ceもまた、それぞれ対称の中心ｎ₀に等しい。ＳＢＲＱＭＦプロトタイプフィルター７２０は直交フィルターであるので、このプロトタイプフィルターのエネルギー値は６４．００である。これとは対照的に、明らかに非対称のウィンドウ関数７００は、前述したように、７８．０３２７のエネルギー値を有している。

以下に、図５、図６に関して説明したＳＢＲシステムについて検討する。このシステムにおいて、ＳＢＲデコーダ６１０は、解析フィルターバンクという形の本発明の実施形態をフィルターバンク６２０として、及び合成フィルターバンクの形の本発明の実施形態を合成フィルターバンク６４０として含む。後述するように、図１１、図１２に示すようなウィンドウ関数７００を使用する本発明に係る解析フィルターバンクの総合遅延は、１２７個のサンプルの合計遅延であるが、元来のＳＢＲＱＭＦプロトタイプのフィルターに基づくＳＢＲ装置では６４０個のサンプルの合計遅延となる。

例えばＳＢＲデコーダ６１０におけるＳＢＲモジュールのＱＭＦフィルターバンクを、複合値低遅延フィルターバンク（ＣＬＤＦＢ）に置き換えることで、オーディオの質を低下させることもコンピュータ処理を複雑化させることもなく、遅延を４２ｍｓから３１．３ｍｓに低下させることができる。図７〜図１０に関する本発明に係る実施形態で説明したように、この新しいフィルターバンクで、標準ＳＢＲモード（高性能モード）と実数値フィルターバンクのみを使用する低電源モードの両方が支えられる。

特に遠距離通信と双方向通信の分野において、低遅延は非常に重要である。超低遅延ＡＡＣはすでに４２ｍｓの通信応用にとって十分低い遅延を達成できたが、そのアルゴリズムの遅延はなおも、ＡＡＣ低遅延コアコーデック（２０ｍｓという低遅延を達成した）や他の遠距離通信コーデックのそれよりも高い。その遅延を低下させるための有望な方法は、本発明の一実施形態に係る低遅延フィルターバンク技術を利用することと、現在のＱＭＦフィルターバンクを本発明の実施形態に係る低遅延のものに置き換えることである。換言すれば、さらなる遅延低下は、単にＳＢＲモジュール６１０で使用されている通常のフィルターバンクを本発明の実施形態に係る複合低遅延フィルターバンクに置き換えることによって達成される。

ＣＬＤＦＢとも称される本発明の実施形態に係る新しいフィルターバンクは、ＳＢＲモジュール６１０での使用のために、できる限り元々使用されてきたＱＭＦフィルターバンクと類似するように設計される。これは、例えば、ＳＢＲシステムで使用されているような６４副帯又は６４帯域の使用、同じ長さのインパルス応答、二種速度モードとの適合性を含む。

図１３は、本発明の一実施形態に係るＣＬＤＦＢウィンドウ７００と元のＳＢＲＱＭＦプロトタイプフィルター７２０との比較を示す。さらに、図１３は変調フィルターバンクの遅延を示し、これは、ＤＣＴ−ＩＶシステムの場合、Ｎ個のサンプルという長さを有する変調コアのフレーム遅延及びプロトタイプフィルター又はウィンドウ関数によって引き起こされる重複遅延を解析することによって決定できる。図１３もまた、合成フィルターバンクの場合を示している。ウィンドウ関数７００もプロトタイプフィルター関数７２０も、これら二つのフィルターバンクの合成プロトタイプフィルターのインパルス応答を示している。

ＳＢＲＱＭＦフィルターバンク及び本発明の一実施形態によって提案されているＣＬＤＦＢの両方の遅延解析に関して、解析及び合成において変調コアの右側と左側の重複部のみがそれぞれ遅延となる。

両方のフィルターバンクにおいて、変調コアは、図１３では遅延７５０として記されている６４個のサンプルの遅延を引き起こすＤＣＴ−ＩＶに基づいている。ＳＢＲＱＭＦプロトタイプフィルター７２０の場合、その対称性のために、図１３に示すように、変調コア遅延７５０は、プロトタイプフィルター関数７２０の質量の中心つまり中心点に関して対称的に配置される。これは、ＳＢＲＱＭＦフィルターバンクのバッファは、プロトタイプフィルター値のそれぞれのエネルギー値の点で最も大きな影響を及ぼすプロトタイプフィルター関数７２０が処理の際に考慮されるであろうポイントまで埋められる必要があるからである。プロトタイプフィルター関数７２０のこの形のために、バッファが、それぞれのプロトタイプフィルター関数の少なくとも中心点つまり質量の中心まで埋められなければならない。

このことをさらに説明すると、最初にＳＢＲＱＭＦフィルターバンクのバッファを全て初期化し、そのバッファは、データ処理が意義のあるデータの処理となるようなポイントまで埋められる必要があり、このためには、それぞれのウィンドウ関数又はプロトタイプフィルター関数が大きな要因となる。ＳＢＲＱＭＦプロトライプフィルター関数の場合、プロトタイプフィルター関数の質量の中心つまり中心点に関してプロトタイプフィルター７２０が対称形であることが、遅延を生じさせる。

しかし、サンプル数Ｎ＝６４のＤＣＴ−ＩＶを基礎とするシステムの変調コアによって生じる遅延は常に存在し、このシステムはまた１ブロックの遅延を含むので、ＳＢＲＱＭＦのための合成プロトタイプは２８８個のサンプルの重複遅延を生じさせることになる。

前述したように、図１３に関する合成フィルターバンクの場合、この付加的な左側の重複７６０が遅延を生じさせ、右側の重複７７０は過去のサンプルに関しているのでさらなる遅延を生じさせない。

これとは対照的に、本発明の一実施形態に係るＣＬＤＦＢのバッファは最初に全て初期化され、合成フィルターバンク及び解析フィルターバンクは、そのウィンドウ関数の形のために、ＳＢＲＱＭＦフィルターバンクと比べて即座に「意味のある」データを提供することができる。換言すれば、解析又は合成ウィンドウ関数７００の形のために、ウィンドウ関数で処理され、重要な影響力を有するサンプルがより即座に得られる。従って、ＣＬＤＦＢのプロトタイプ又は合成ウィンドウ関数は、変調コアによってすでに生じた遅延７５０を考慮に入れて、３２個のサンプルの重複遅延が生じるだけである。本発明の一実施形態に係るウィンドウ関数７００のウィンドウ係数第１部分つまり第１グループ４２０は、好ましくは、変調コア遅延７５０と左側の重複７６０により生じる遅延に相当する９６個のウィンドウ係数を含む。

解析フィルターバンクも合成フィルターバンクもどちらも同じ遅延を引き起こす。それは、解析フィルターバンクは、合成ウィンドウ関数又はプロトタイプ関数の時間領域逆転版に基づくものであるからである。従って、重複遅延は、合成フィルターバンクと同じ重複サイズを有する右側に生じる。このように、本発明の一実施形態に係る解析フィルターバンクの場合には、３２サンプルの遅延が生じるのに対して、一方、元のＱＭＦプロトタイプフィルターバンクの場合には、２８８サンプルの遅延が生じる。

図１４Ａに示す表は、フレーム長が４８０サンプル、サンプリング速度が４８ｋＨｚの場合を想定し、多様な修正段階での遅延を示す。標準ＳＢＲ装置と共にＡＡＣ−ＬＤコーデックを有する標準的な構造において、二種速度モードのＭＤＣＴ，ＩＭＤＣＴフィルターバンクは４０ｍｓの遅延を引き起こす。そして、ＱＭＦ装置自身が１２ｍｓの遅延を引き起こす。また、ＳＢＲ重複のために、さらに８ｍｓの遅延が生じ、このコーデックの総合的な遅延は大体６０ｍｓとなる。

ＭＤＣＴ，ＩＭＤＣＴの低遅延版を有するＡＡＣ−ＥＬＤは、二種速度において、３０ｍｓの遅延を生じさせる。また、ＳＢＲ装置の元来のＱＭＦフィルターバンクによる遅延が１２ｍｓであるのに対して、本発明の一実施形態に係る複合値低遅延フィルターバンクを使用することで、たった１ｍｓの遅延となる。ＳＢＲ重複を避けることにより、ＡＡＣ−ＬＤ装置とＳＢＲ装置の単純な組み合わせにより８ｍｓの遅延が生じることを完全に防止することができる。従って、上記のような単純な組み合わせで６０ｍｓの遅延が生じるのに対して、超低遅延ＡＡＣコーデックは、アルゴリズム全体の遅延として３０ｍｓとすることができる。故に、前述したような遅延低下方法の組み合わせは、実際、遅延全体として２９ｍｓの節約になる。

図１４Ｂの表は、図５、図６に示したシステムの元来のフィルターバンク及びここで提案するフィルターバンクによって生じる全体的なコーデック遅延を示す。図１４Ｂに示すデータ及び値は、サンプリング速度が４８ｋＨｚ、コアコーダのフレームサイズが４８０サンプルの場合に基づく。図５、図６で説明したＳＢＲシステムの二種速度方法により、コアコーダは２４ｋＨｚのサンプリング速度で効果的に動作する。変調コアでの６４サンプルのフレーム遅延がコアコーダによってすでに引き起こされているので、図１３に関して説明しように、二つのフィルターバンクの個別の遅延値からそれを差し引くことができる。

図１４Ｂの表が、ＭＤＣＴ，ＩＭＤＣＴの低遅延版（ＬＤＭＤＣＴ，ＬＤＩＭＤＣＴ）を有する超低遅延ＡＡＣコーデックの全体的な遅延を低下させることが可能であるということの基礎になる。ＭＤＣＴ，ＩＭＤＣＴの低遅延版および元来のＱＭＦフィルターバンクを使用するだけで、全体的なアルゴリズム遅延が４２ｍｓとなり、さらに従来のＱＭＦフィルターバンクを本発明の一実施形態に係る複合値低遅延フィルターバンクに置き換えるだけで、全体的なアルゴリズム遅延を３１．３ｍｓにまで低下させることができる。

一つ又はそれ以上のフィルターバンクを含む本発明の実施形態に係るフィルターバンクの質を評価するために、リスニングテストが行われ、そのテストから、本発明の実施形態に係るフィルターバンクはＡＡＣ−ＥＬＤと同じレベルのオーディオの質を保持し、複合ＳＢＲモード、実数値低電源ＳＢＲモードのどちらにおいても質の低下がないという結論が得られた。従って、本発明の実施形態に係る遅延最適化フィルターバンクは、遅延を１０ｍｓ以上低下させるにもかかわらず、オーディオの質にも負担をかけることがない。一時的な特徴として、統計上重要でないが、わずかな向上さえ見られた。この向上は、カスタネットと鉄琴のテストにおいて観察された。

本発明の一実施形態に係る３２帯域のフィルターバンクの場合のダウンサンプリングは、本発明に係るフィルターバンクのために、ＱＭＦフィルターバンクと同様によく動作することをさらに証明するために、以下のような評価が行われた。まず、対数正弦曲線がダウンサンプルされた３２帯域フィルターバンクで解析され、０に初期化された３２個の高帯域が付加された。その後、その出力は６４帯域フィルターバンクにより合成され、再びダウンサンプルされ、元の信号と比較された。従来のＳＢＲＱＭＦプロトタイプフィルターバンクの使用は、信号・ノイズ率（ＳＮＲ）が５９．５ｄＢという結果になる。しかし、本発明に係るフィルターバンクは７８．５ｄＢのＳＮＲを達成する。このことは、本発明の実施形態に係るフィルターバンクは、ダウンサンプルされたものにおいても、少なくとも元のＱＭＦフィルターバンクと同様に機能することを示している。

本発明の実施形態に採用されたこの遅延最適化非対称フィルターバンク方法は、対称プロトタイプの従来のフィルターバンクと比較して、まさに付加価値を提供するということを示すために、以下、同じ遅延を有する非対称プロトタイプと対称プロトタイプとを比較する。

図１５Ａは、広範囲における、低遅延ウィンドウ（グラフ８００）を使用する本発明に係るフィルターバンクの周波数応答と１２８タップの長さを有する正弦ウィンドウ（グラフ８１０）を使用するフィルターバンクの周波数応答との比較を示す。図１５Ｂは、これらのウィンドウ関数を使用する同じフィルターバンクの狭い範囲での周波数応答を示す拡大図である。

二つのグラフ８００，８１０の直接的な比較から、本発明の一実施形態に係る低遅延フィルターバンクを使用するフィルターバンクの周波数応答は、同じ遅延を有する１２８タップの正弦ウィンドウを使用するフィルターバンクの周波数応答よりもかなり良いことがわかる。

また、図１６Ａは、全体的な遅延が１２７サンプルである異なるウィンドウ関数の比較を示す。６４帯域のフィルターバンク（ＣＬＤＦＢ）は、フレーム遅延と重複遅延を含む１２７サンプルの全体的な遅延を有する。対称プロトタイプと同じ遅延を有する変調フィルターバンクは、従って、図１５Ａ、図１５Ｂに関して説明したように、１２８の長さのプロトタイプを有することになる。５０％の重複を有するこれらのフィルターバンクのために、例えばＭＤＣＴ、正弦ウィンドウ又はカイザー・ベッセルから導き出されるウィンドウは、概してプロトタイプとして良い選択である。従って、図１６Ａにおいて、本発明の一実施形態に係るプロトタイプとしての低遅延ウィンドウを使用するフィルターバンクの周波数応答が、同じ遅延を有する対称プロトタイプの周波数応答と比較されている。図１６Ａでは、図１５Ａ、図１５Ｂで説明したような、本発明の実施形態に係るフィルターバンクの周波数応答（グラフ８００）と正弦ウィンドウを使用するフィルターバンクの周波数応答（グラフ８１０）以外に、さらに二つのＫＢＤウィンドウ、つまりパラメータα＝４に基づくもの（グラフ８２０）とα＝６に基づくもの（グラフ８３０）が示されている。図１６Ａ、及び図１６Ａの拡大図である図１６Ｂのどちらも、非対称ウィンドウ関数または同じ遅延のプロトタイプフィルター関数を有する本発明の一実施形態に係るフィルターバンクを使用することで、かなり良い周波数応答が達成できることを示している。

この利点をより一般的な点から説明するために、図１７において、前記フィルターバンクとは異なる遅延値を有する二つのフィルターバンクプロトタイプが比較されている。図１５、図１６で検討した本発明に係るフィルターバンクは１２７サンプルの全体的な遅延を有し、この遅延は過去に８ブロック及び未来に０ブロックの重複（ＣＬＤＦＢ８０）に相当するものである。図１７は、同じ遅延（３８３サンプルの遅延）を有する二つの異なるフィルターバンクプロトタイプの周波数応答の比較を示す。より正確には、図１７は、本発明の一実施形態に係る非対称プロトタイプフィルターバンクの周波数応答（グラフ８４０）を示し、これは、過去に６ブロックの時間領域サンプル、未来に２ブロックの時間領域サンプルの重複に基づくものである（ＣＬＤＥＦＢ６２）。さらに図１７は、３８３サンプルの遅延を有する対称プロトタイプフィルター関数の周波数応答（グラフ８５０）を示す。非対称プロトタイプ又はウィンドウ関数が、同じ遅延値の対称ウィンドウ関数又はプロトタイプフィルターを有するフィルターバンクよりも良い周波数応答を達成することがわかる。このことは、前述したように、遅延と質との間のより良いトレードオフが可能であることを示している。

図１８は人間の耳の一時的なマスキング効果を示す。図１８中、線８６０で示す瞬間に音が発生する場合、その音の周波数とその近辺の周波数に関するマスキング効果が、実際の音が開始される約２０ｍｓ前に発生する。この効果はプレマスキングと呼ばれ、人間の耳の心理音響特性の一つの側面である。

図１８に示す状況において、音は、線８７０で示される瞬間までの約２００ｍｓの間聞こえるものとして残る。この間、人間の耳のマスキングが働き、これは同時マスキングとも称される。図１８に示すように、音が止まった後（線８７０で示される）、その音の周波数及び近辺の周波数のマスキングは約１５０ｍｓの間、徐々に消えていく。この心理音響効果はポストマスキングとも称される。

図１９は、本発明の一実施形態に係る低遅延フィルターバンク（ＣＭＬＤＦＢ）を使用するフィルターバンクに基づく従来のＨＥ−ＡＡＣ符号化信号とＨＥ−ＡＡＣ符号化信号のプレエコーを示す。図１９Ａは、カスタネットの元の時間信号を示し、ＨＥ−ＡＡＣコーデック（高能率高度オーディオコーデック）を含むシステムで処理されたものである。従来のＨＥ−ＡＡＣに基づくシステムの出力は図１９Ｂに示されている。二つの信号、つまり元の時間信号とＨＥ−ＡＡＣコーデックの出力信号とを直接比較すると、ＨＥ−ＡＡＣコーデックの出力信号において、カスタネットの音が始まる前の矢印８８０で示されている部分に、プレエコーが見られることがわかる。

図１９Ｃは、本発明の一実施形態に係るＣＭＬＤＦＢウィンドウを含むフィルターバンクに基づくＨＥ−ＡＡＣを有するシステムの出力信号を示す。図１９Ａに示されている元の時間信号と、本発明の一実施形態に係るフィルターバンクを使用した処理後の信号から、図１９Ｃの矢印８９０で示されているように、カスタネットの音の開始直前のプレエコー効果がかなり低下していることがわかる。図１８に関して説明したプレマスキング効果のために、図１９Ｃの矢印８９０で示されるプレエコー効果は、従来のＨＥ−ＡＡＣコーデックの場合の矢印８８０で示されるプレエコー効果よりも、ずっとよく隠されている。本発明に係るフィルターバンクのプレエコーのこの状態は、従来のフィルターバンクに比べてかなり遅延が低下されたという結果でもあるが、これは人間の耳の一時的なマスキング特性と心理音響特性にずっとよく適合した出力を提供するものである。結果的に、リスニングテストを説明する際に述べたように、本発明の一実施形態に係るフィルターバンクを使用することは、遅延低下によりもたらされる質の向上さえにもつながる。

本発明に係る実施形態は、従来のフィルターバンクに比べて、コンピュータ処理の複雑さを増すことはない。低遅延フィルターバンクは、コンピュータ処理が複雑化されないように、ＳＢＲシステムの場合には、例えばＱＭＦフィルターバンクと同じフィルター長及び同じ変調モードを使用する。プロトタイプフィルターの非対称な本質のために必要とされるメモリーに関して、合成フィルターバンクのために必要なＲＯＭ（読み出し専用メモリ）は、ブロックごとのサンプル数Ｎ＝６４であり、フレームごとのブロック数Ｔ＝１０であるフィルターバンクの場合、約３２０ワード増加する。さらに、ＳＢＲ関連のシステムの場合、解析フィルターが別に保存されるならば、必要なメモリーは、さらにもう３２０ワード増加する。

しかし、ＡＡＣ−ＥＬＤコアのために現在必要なＲＯＭは約２．５キロワードであり、ＳＢＲ装置のためには、さらに２．５キロワード必要であるが、必要なＲＯＭは約１０％増加するだけである。メモリーと複雑性との間のできる限りのトレードオフとして、低いメモリー消費の方が重要である場合、図３及び式（１５）に関して述べたように、合成フィルターから解析フィルターを生成するために直線的補間が使用できる。この補間処理は、必要な指示の数を約３．６％増加させるだけである。従って、ＳＢＲモジュール構造内の従来のＱＭＦフィルターバンクを本発明の実施形態に係る低遅延フィルターバンクに置き換えることで、いくつかの実施形態においては、オーディオの質の低下や目立った複雑化を引き起こすことなく、１０ｍｓ以上の遅延の低下を達成することができる。

このように、本発明に係る実施形態は、解析又は合成ウィンドウ、あるいはウィンドウ処理のための装置又は方法に関する。さらに、解析又は合成フィルターバンク、あるいはウィンドウを用いて信号を解析又は合成する方法を説明する。当然、上記の方法のうちの一つを実行するためのコンピュータプログラムもまた開示される。

本発明の実施形態は、ハードウェアでの実施、ソフトウェアでの実施又は両方の組み合わせとして実行され得る。生成され、受信され、または処理のために保存されるデータ、ベクトル及び変数は、ランダムアクセスメモリー、バッファ、リードオンリーメモリー、持久記憶装置（例えばＥＥＰＲＯＭ、フラッシュメモリー）、あるいは磁器メモリー、光メモリーなどの多様な種類のメモリーに保存可能である。保存場所は、例えば、変数、パラメータ、ベクトル、マトリクス、ウィンドウ係数や他の情報及びデータのそれぞれのデータ量を保存するのに必要な一つ又はそれ以上のメモリーユニットであってもよい。

ソフトウェアの実施は、多様なコンピュータ、コンピュータと同様のシステム、プロセッサ、ＡＳＩＣ（応用特定集積回路）また他の集積回路（ＩＣ）で実行され得る。

本発明の方法を実施するための必要条件によって、本発明の方法の実施形態はハードウェア、ソフトウェア又はその両方の組み合わせで実行可能である。プログラム可能なコンピュータシステム、プロセッサや集積回路と協働するデジタル記憶媒体、特にＣＤ、ＤＶＤや電気的に読み出し可能な制御信号を記憶する他のディスクを使用して、本発明の実施形態が実行される。一般的に、本発明の一実施形態は、プログラムコードが機械読み取り可能な媒体に保存されたコンピュータプログラム製品であり、そのプログラムコードは、コンピュータプログラムがコンピュータ、プロセッサや集積回路上で起動された際、本発明の方法の実施形態を実行するものである。換言すれば、本発明の方法の実施形態は、従って、コンピュータ、プロセッサや集積回路上で起動された際に本発明の方法の少なくとも一つの実施形態を実行するプログラムコードを有するコンピュータプログラムである。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置の解析ウィンドウ処理部（１１０）において、解析ウィンドウ関数の第１部分は１よりも大きい最大絶対値を有するウィンドウ係数を含む。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置の解析ウィンドウ処理部（１１０）において、解析ウィンドウ関数は振動を示すものである。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置の解析ウィンドウ処理部（１１０）において、ウィンドウ係数列の全てのウィンドウ係数が実数値ウィンドウ係数である。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置の解析ウィンドウ処理部（１１０）において、時間領域オーディオ入力サンプルフレーム（１２０）は最初の時間領域オーディオ入力サンプルから最新の時間領域オーディオ入力サンプルまでＴ個の時間領域オーディオ入力サンプルブロック（１３０）を含み、各ブロックはＮ個の時間領域オーディオ入力サンプルを含む。ここで、Ｔ及びＮは正の整数であり、Ｔは４よりも大きい。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）のウィンドウ処理は、フレーム（１２０）の時間領域オーディオ入力サンプルを素子ごとにウィンドウ係数列のウィンドウ係数と掛け算することを含む。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置の解析ウィンドウ処理部（１１０）において、各時間領域オーディオ入力サンプルは、時間領域オーディオ入力サンプル列とウィンドウ係数列に従い、素子ごとに解析ウィンドウ関数のウィンドウ係数と掛け算される。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置の解析ウィンドウ処理部（１１０）において、時間領域オーディオ入力サンプルフレーム（１２０）の各時間領域オーディオ入力サンプルに対して、正に一つのウィンドウ処理後サンプルが生成される。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置の解析ウィンドウ処理部（１１０）において、ウィンドウ係数指数ｎ＝（Ｔ−３）・Ｎに対応するウィンドウ係数は−０．１よりも小さい値を含む。ここで、ウィンドウ係数列の指数は０〜Ｎ・Ｔ−１の範囲内の整数であり、最新の時間領域オーディオ入力サンプルをウィンドウ処理するためのウィンドウ係数は指数Ｎ・Ｔ−１に対応するウィンドウ係数である。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置の解析ウィンドウ処理部（１１０）において、ウィンドウ係数列のうち、ウィンドウ係数第１部分が３／２・Ｎ個のウィンドウ係数を含み、ウィンドウ係数第２部分が（Ｔ−３／２）・Ｎ個のウィンドウ係数を含む。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置の解析ウィンドウ処理部（１１０）において、ウィンドウ係数ｃ（ｎ）は付録３の表に示されている関係を満たす。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置の解析ウィンドウ処理部（１１０）において、ウィンドウ係数ｃ（ｎ）は付録２の表に示されている関係を満たす。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置の解析ウィンドウ処理部（１１０）において、ウィンドウ係数ｃ（ｎ）は付録１の表に示されている値を含む。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置（１００）又はその解析ウィンドウ処理部（１１０）において、解析ウィンドウ関数（１９０）は第１の個数のウィンドウ係数を含み、これらのウィンドウ係数は第１よりも大きい第２の個数のウィンドウ係数列を含む大きなウィンドウ関数から導き出されるものである。ウィンドウ関数（１９０）のウィンドウ係数は、大きなウィンドウ関数のウィンドウ係数の補間により導き出され、第２の個数は偶数である。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置（１００）又はその解析ウィンドウ処理部（１１０）において、ウィンドウ関数のウィンドウ係数は直線的に補間される。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置（１００）又はその解析ウィンドウ処理部（１１０）において、ウィンドウ関数のウィンドウ係数を得るために、解析ウィンドウ関数のウィンドウ係数は、大きなウィンドウ関数の、そのウィンドウ係数列において二つの連続したウィンドウ係数に基づき補間される。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置（１００）又はその解析ウィンドウ処理部（１１０）は、以下の式に基づき解析ウィンドウ関数のウィンドウ係数ｃ（ｎ）を得るように構成されている。

ｎはウィンドウ係数ｃ（ｎ）の指数を示す整数、ｃ₂（ｎ）は大きなウィンドウ関数のウィンドウ係数である。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置（１００）において、現在の処理されるべき時間領域オーディオ入力サンプルフレーム（１２０）は、直前の時間領域オーディオ入力サンプルフレーム（１２０）の（Ｔ−１）個の最近のブロックを初期の時間領域オーディオ入力サンプルの方向へ一ブロック分ずつ移動させ、現在のフレーム（１２０）の最新の時間領域オーディオ入力サンプルを含むブロックとして新しい一ブロック（２２０）の時間領域オーディオ入力サンプルを追加することで、生成される。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置（１００）において、現在の処理されるべき時間領域オーディオ入力サンプルｘ（ｎ）のフレーム（１２０）は、直前の時間領域オーディオ入力サンプルフレーム１２０の時間領域オーディオ入力サンプルｘ_prev（ｎ）を、時間又はサンプル指数ｎ＝３２，…，３１９に対して以下の式に基づき移動させることにより、生成される。

この装置（１００）はさらに、時間又はサンプル指数ｎ＝３１から始まる時間領域オーディオ入力サンプルｘ（ｎ）の現在のフレーム（１２０）のために、時間又はサンプル指数ｎが小さくなっていく時間領域オーディオ入力サンプルの順番に基づき、次に来る３２個の時間領域オーディオ入力サンプルを含ませることにより、時間領域オーディオ入力サンプルの現在のフレーム（１２０）の時間領域オーディオ入力サンプルｘ（ｎ）を生成するように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、計算機（１７０）は、一つのウィンドウ処理後サンプルフレーム（１５０）に基づくすべての副帯値がそのウィンドウ処理後サンプルフレーム（１５０）のウィンドウ処理後サンプルのスペクトル表示であるようにオーディオ副帯値を生成する時間／周波数コンバータを含む。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、時間／周波数コンバータは複合値又は実数値オーディオ副帯値を生成するものである。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、計算機（１７０）は、時間領域オーディオ入力サンプルの一ブロック（１３０）内の各時間領域オーディオ入力サンプルに対して一つのオーディオ副帯値を算出し、各オーディオ副帯値の算出つまり一つの時間領域オーディオ入力サンプルブロック（１３０）内の各時間領域オーディオ入力サンプルの計算は、ウィンドウ処理後フレーム（１５０）のウィンドウ処理後のサンプルに基づいている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、計算機（１７０）は、ウィンドウ処理後のサンプル（１５０）を各副帯値のための調和振動関数で掛け算し、掛け算されたウィンドウ処理後のサンプルを合計することでオーディオ副帯値を算出し、調和振動関数の周波数は副帯値のうちの対応する副帯の中心周波数に基づいている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置の計算機（１７０）において、調和振動関数は複合指数関数、正弦関数又は余弦関数である。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、計算機（１７０）は、ｎ＝０，…，６３、ｋ＝０，…，３１の場合、以下の式に基づきオーディオ副帯値ｗ_klを算出する。

ｚ（ｎ）は指数ｎに対応するウィンドウ処理後のサンプルであり、ｋは副帯指数であり、ｌはオーディオ副帯値ブロック（１８０）の指数であり、ｆ_osc（ｘ）は実数値変数ｘに応じた振動関数である。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、計算機（１７０）は、振動関数ｆ_osc（ｘ）は以下の式のうちのいずれかである。

ｉは虚数単位である。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置（１００）は、実数値時間領域オーディオ入力サンプルフレーム（１２０）を処理するものである。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置（１００）は、このオーディオ副帯値と共に使用されるべき合成ウィンドウ関数（３７０）を示すか又はオーディオ副帯値を生成するのに使用された解析ウィンドウ関数（１９０）を示す信号を与えるものである。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置（３００）は、時間領域オーディオ入力サンプルブロック（４１０）を生成するものであるが、この時間領域オーディオ入力サンプルブロック（４１０）はＮ個の時間領域オーディオ入力サンプルを含み、Ｎは正の整数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置（３００）は、時間領域オーディオサンプルブロック（４１０）をＮ個のオーディオ副帯値を含む一つのオーディオ副帯値ブロック（３２０）に基づき生成する。この装置（３００）において、計算機（３１０）はＴ・Ｎ個の中間時間領域オーディオサンプルを含む中間時間領域オーディオサンプル列（３３０）を算出し、Ｔは正の整数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置の合成ウィンドウ処理部（３６０）において、合成ウィンドウ関数はウィンドウ係数列に関して非対称である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置の合成ウィンドウ処理部（３６０）において、第１部分が、合成ウィンドウ関数の全てのウィンドウ係数のうちの１よりも大きい絶対値を有する最大値を含む。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置の合成ウィンドウ処理部（３６０）において、合成ウィンドウ関数（３７０）は振動を示すものである。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置の合成ウィンドウ処理部（３６０）において、第１部分が３／２・Ｎ個のウィンドウ係数を含み、第２部分が（Ｔ−３／２）・Ｎ個のウィンドウ係数を含む。ここで、Ｔは中間時間領域サンプルフレーム（３３０）に含まれるブロック３４０の個数を示す４以上の指数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置の合成ウィンドウ処理部（３６０）において、中間時間領域サンプル列のウィンドウ処理は、中間時間領域サンプルとウィンドウ係数の素子ごとの掛け算を含む。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置の合成ウィンドウ処理部（３６０）において、各中間時間領域サンプルは、中間時間領域サンプル列とウィンドウ係数列に従って、合成ウィンドウ関数（３７０）のウィンドウ係数で素子ごとに掛け算される。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置の合成ウィンドウ処理部（３６０）において、ウィンドウ関数（３７０）のウィンドウ係数は実数値である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置の合成ウィンドウ処理部（３６０）において、ウィンドウ係数ｃ（ｎ）は付録３の表に示されている関係を満たす。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置の合成ウィンドウ処理部（３６０）において、ウィンドウ係数ｃ（ｎ）は付録２の表に示されている関係を満たす。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置の合成ウィンドウ処理部（３６０）において、ウィンドウ係数ｃ（ｎ）は付録１の表に示されている値を含む。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置（３００）又はその合成ウィンドウ処理部（３６０）において、合成ウィンドウ関数は第１の個数のウィンドウ係数を含み、これらのウィンドウ係数は第１よりも大きい第２の個数の一連のウィンドウ係数を含む大きなウィンドウ関数から導き出されたものである。ここで、ウィンドウ関数のウィンドウ係数は、大きなウィンドウ関数のウィンドウ係数の補間によって導き出されたものであり、第２の個数は偶数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置（３００）又はその合成ウィンドウ処理部（３６０）において、合成ウィンドウ関数（３７０）は直線的に補間されたものである。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置（３００）又はその合成ウィンドウ処理部（３６０）において、ウィンドウ関数（３７０）のウィンドウ係数は、ウィンドウ関数のウィンドウ係数を得るために、大きなウィンドウ関数の、そのウィンドウ係数列において二つの連続するウィンドウ係数に基づき補間される。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置（３００）又はその合成ウィンドウ処理部（３６０）は、以下の式に基づき合成ウィンドウ関数のウィンドウ係数ｃ（ｎ）を得る。

ｎはウィンドウ係数ｃ（ｎ）の指数を示す整数であり、ｃ₂（ｎ）は大きなウィンドウ関数のウィンドウ係数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、計算機（３１０）は、オーディオ副帯値を調和振動関数で掛け算し、掛け算されたオーディオ副帯値を合計することで中間時間領域サンプル列の中間時間領域サンプルを算出するものであり、調和振動関数の周波数はそれに対応する副帯の中心周波数に基づくものである。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置の計算機（３１０）において、調和振動関数は複合指数関数、正弦関数又は余弦関数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、計算機（３１０）は、複合値又は実数値オーディオ副帯値に基づき、実数値中間時間領域サンプルを算出するものである。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、計算機（３１０）は、以下の式に基づき、実数値中間時間領域サンプルｚ（ｉ，ｎ）の列を算出する。

ｎは０〜Ｎ・Ｔ−１の範囲の整数、Ｒｅ（ｘ）は複合値ｘの実数部分、π＝３．１４．．．は円周率である。ｆ_osc（ｘ）は、計算機に与えられたオーディオ副帯値が複合値である場合、以下のようになり、ｉは虚数単位である。

計算機に与えられたオーディオ副帯値が実数値である場合、以下のようになる。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、計算機（３１０）は、計算機（３１０）に与えられるオーディオ副帯値が中間時間領域サンプル列のスペクトル表示であるように、中間時間領域サンプル列を生成するための周波数／時間コンバータを含む。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、周波数／時間コンバータは、複合値又は実数値オーディオ副帯値に基づき中間時間領域サンプル列を生成する。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、計算機（３１０）は、以下の式に基づきオーディオ副帯値Ｘ（ｋ）から中間時間領域サンプルｇ（ｎ）の列を算出する。

ｎが２０Ｎ−１〜２Ｎの範囲内の整数である場合、以下のようになる。

ｎが０〜２Ｎ−1の範囲内の整数である場合、以下のようになる。

ｊが０〜４の範囲内の整数であり、ｋが０〜Ｎ−１の範囲内の整数である場合、以下のようになる。

Ｎは副帯値の個数及び時間領域オーディオサンプルの個数を示す整数、ｖは実数値ベクトル、ｖ_prevは直前に生成された時間領域オーディオサンプルの実数値ベクトルｖ、ｉは虚数単位、πは円周率である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、計算機（３１０）は、整数ｎが２０Ｎ−１〜２Ｎの範囲である場合、以下の式に基づき、オーディオ副帯値Ｘ（ｋ）から中間時間領域サンプル列ｇ（ｎ）を算出するように構成されている。

整数ｎが０〜２Ｎ−１の範囲の場合、以下の式に基づき算出される。

整数ｊが０〜４の範囲であり、整数ｋが０〜Ｎ−１の場合、以下の式に基づき算出される。

Ｎはオーディオ副帯値の個数つまり時間領域オーディオサンプルの個数を示す整数、ｖは実数値ベクトルであり、Ｖ_prevは直前に生成された時間領域オーディオサンプルの実数値ベクトルｖであり、πは円周率である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、重複加算出力部（４００）は、ウィンドウ処理後の中間時間領域サンプルを、Ｔ個の連続するオーディオ副帯値ブロック（３２０）に基づき、重複方法で処理するように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、重複加算出力部（４００）は、時間領域サンプルｏｕｔ₁（ｎ）を以下の式に基づき出力するように構成されている。

ｎはサンプル指数を示す整数であり、ｚ_l,nはサンプル指数ｎと０〜Ｔ−１の範囲のフレーム指数又は列指数ｌに対応するウィンドウ処理後の中間時間領域サンプルであり、ｌ＝０は最新のフレーム又は列に相当し、小さいｌの値は以前に生成されたフレーム又は列に相当する。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、重複加算出力部（４００）は、時間領域サンプルｏｕｔ（ｋ）を以下の式に基づき出力するように構成されている。

ｗはウィンドウ処理後の中間時間領域サンプルを含むベクトルであり、ｋは０〜Ｎ−１の範囲の指数を示す整数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、この装置（３００）は、オーディオ副帯値を生成するために使用された解析ウィンドウ関数（１９０）を示す信号又は時間領域オーディオサンプルを生成するのに使用されるべき合成ウィンドウ関数（３７０）を示す信号を受信するように構成されている。

本発明の一実施形態によると、エンコーダ（５１０）は、本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置（５６０）を含む。

本発明の一実施形態によると、エンコーダ（５１０）はさらに、オーディオ副帯チャンネルのオーディオ副帯値を生成する装置（５６０）に接続され、装置（５６０）によって出力されたオーディオ副帯値を量子化・符号化し、量子化及び符号化されたオーディオ副帯値を出力するように構成されている量子化・符号化部（５７０）を含む。

本発明の一実施形態によると、デコーダ（５８０）は、本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置（６００）を含む。

本発明の一実施形態によると、デコーダ（５８０）はさらに、オーディオ副帯値を生成する装置（５６０）に接続され、符号化・量子化されたオーディオ副帯値を受信し、時間領域オーディオサンプルを生成する装置に接続され、復号化・非量子化されたオーディオ副帯値をオーディオ副帯値として装置（６００）に提供するように構成された非量子化・復号化部（５９０）を含む。

本発明の一実施形態によると、ＳＢＲエンコーダ（５２０）は、ＳＢＲエンコーダ（５２０）に与えられた時間領域オーディオ入力サンプルフレームに基づき、オーディオ副帯チャンネルのオーディオ副帯値を生成する装置（５３０）、及びオーディオ副帯値を生成する装置（５３０）に接続され、オーディオ副帯値に基づきＳＢＲパラメータを抜粋、出力するＳＢＲパラメータ抜粋モジュール（５４０）を含む。

本発明の一実施形態によると、システム（６１０）は、システム（６１０）に与えられた時間領域オーディオ入力サンプルフレームに基づき、オーディオ副帯値を生成する装置（６２０）、及びオーディオ副帯値生成装置（６２０）によって生成されたオーディオ副帯値に基づき、時間領域オーディオサンプルを生成する装置（６４０）を含む。

本発明の一実施形態によると、システム（６１０）はＳＢＲデコーダを含む。

本発明の一実施形態によると、システムはさらに、オーディオ副帯値を生成する装置（６２０）と時間領域オーディオサンプルを生成する装置（６４０）との間に相互接続され、ＳＢＲデータを受信し、ＳＢＲデータとオーディオ副帯値生成装置（６２０）からのオーディオ副帯値に基づきオーディオ副帯値を修正又は加算するように構成されたＨＦ生成部（６３０）を含む。

本発明の実施形態に係る全ての装置及び方法に関して、実施の詳細により、付録１，３の表に示されている値に基づくウィンドウ係数を得るために、指数１２８〜２５５，３８４〜５１１に対応するウィンドウ係数に関する符号変換（比率−１の掛け算）が、式（１６ａ），（１６ｂ）に基づきさらに実行されてもよい。つまり、ウィンドウ関数のウィンドウ係数は付録１の表に示されているウィンドウ係数に基づくものである。表に示されているウィンドウ関数のウィンドウ係数を得るためには、指数０〜１２７，２５６〜３８３，５１２〜６３９に対応する表中のウィンドウ係数が（＋１）で掛けられ（つまり符号変換は行われない）、指数１２８〜２５５，３８４〜５１１に対応するウィンドウ係数は（−１）で掛けられる（つまり符号変換が行われる）必要がある。付録３の表に示されている関係をこのように扱う必要がある。さらに換言すると、付録１〜４の表に示されているウィンドウ係数は、式（１６ａ），（１６ｂ）に従い変更されてもよい。

さらなる遅延、要因、付加的な係数の導入及び別の簡単な関数の導入も、式に基づく本応用の構造に含まれると理解されるべきである。さらに、簡単な定数、定加数などは削除してもよい。また、代数変換、同値変換及び近似式（例えばテイラー近似式）は式の結果を全くあるいは意義深く変えることはない。換言すれば、わずかな変更や変換が結果において本質的に同じものとなるならば、それらは、式に基づいていると考えられる。

以上、本発明を特に実施形態に関して説明してきたが、当業者にとっては、本発明の要旨の範囲内での形や詳細における多様な変更が可能である。これらの変更は、ここで開示し、以下のクレームにより理解される広い概念から離れない限り、本発明の別の実施形態として理解すべきである。

Claims

オーディオ副帯チャンネルのオーディオ副帯値を生成する装置であり、以下のものを含む、
ウィンドウ処理後のサンプルを得るために、初期のサンプルから後期のサンプルに至る時間列にある時間領域入力サンプルのフレーム（１２０）を、ウィンドウ係数列を含む解析ウィンドウ関数（１９０）を使用してウィンドウ処理するための解析ウィンドウ処理部（１１０）であり、該解析ウィンドウ関数（１９０）は、該ウィンドウ係数列の第１部分を含むウィンドウ係数第１グループ（２００）と該ウィンドウ係数列の第２部分を含むウィンドウ係数第２グループ（２１０）とを含み、前記第１部分は前記第２部分よりも少ない個数のウィンドウ係数を含む、
前記第１部分のウィンドウ係数のエネルギー値は前記第２部分のウィンドウ係数のエネルギー値よりも高く、
前記ウィンドウ係数第１グループは後期の時間領域サンプルをウィンドウ処理するのに使用され、前記ウィンドウ係数第２グループは初期の時間領域サンプルをウィンドウ処理するのに使用される、
ウィンドウ処理後サンプルを使用してオーディオ副帯値を算出するための計算機（１７０）。
請求項１に記載の装置（１００）であり、前記解析ウィンドウ処理部（１１０）において、前記解析ウィンドウ関数（１９０）はウィンドウ係数列に関して非対称である。
請求項１又は請求項２に記載の装置（１００）であり、前記解析ウィンドウ処理部（１１０）において、前記ウィンドウ係数列第１部分のウィンドウ係数のエネルギー値はウィンドウ係数列の全てのウィンドウ係数のエネルギー値の２／３以上であり、前記ウィンドウ係数列第２部分のウィンドウ係数のエネルギー値はウィンドウ係数列の全てのウィンドウ係数のエネルギー値の１／３以下である。
請求項１ないし請求項３のいずれかに記載の装置（１００）であり、前記解析ウィンドウ処理部（１１０）において、前記ウィンドウ係数列第１部分はウィンドウ係数列のウィンドウ係数の合計数の１／３以下の個数のウィンドウ係数を含み、前記ウィンドウ係数列第２部分はウィンドウ係数列のウィンドウ係数の合計数の２／３以上の個数のウィンドウ係数を含む。
請求項１ないし請求項４のいずれかに記載の装置（１００）であり、前記解析ウィンドウ処理部（１１０）において、前記解析ウィンドウ関数（１９０）のウィンドウ係数の中心点はウィンドウ係数列第１部分の指数範囲内の実数値に相当する。
請求項１ないし請求項５のいずれかに記載の装置（１００）であり、前記解析ウィンドウ処理部（１１０）において、前記解析ウィンドウ関数（１９０）は、解析ウィンドウ関数（１９０）の全てのウィンドウ係数のうちの最大絶対値を有するウィンドウ係数から、最新の時間領域オーディオサンプルをウィンドウ処理するために使用されるウィンドウ係数まで、厳密に単調な減少を示す。
請求項１ないし請求項６のいずれかに記載の装置（１００）であり、前記解析ウィンドウ処理部（１１０）において、指数ｎ＝（Ｔ−１）・Ｎに対応するウィンドウ係数は０．９〜１．１の範囲内の絶対値を有し、ウィンドウ係数列の指数は０〜Ｎ・Ｔ−１の範囲内の整数であり、フレーム（１２０）の最新の時間領域オーディオ入力サンプルをウィンドウ処理するのに使用されるウィンドウ係数は、指数Ｎ・Ｔ−１に対応するウィンドウ係数であり、また、前記時間領域オーディオ入力サンプルフレーム（１２０）は、フレーム（１２０）の初期の時間領域オーディオ入力サンプルから後期の時間領域オーディオ入力サンプルに至るＴ個の時間領域オーディオ入力サンプルブロック（１３０）を含み、各ブロックはＮ個の時間領域オーディオ入力サンプルを含み、Ｔ及びＮは正の整数であり、Ｔは４よりも大きい。
請求項７に記載の装置（１００）であり、前記解析ウィンドウ処理部（１１０）において、ウィンドウ係数指数ｎ＝Ｎ・Ｔ−１に対応するウィンドウ係数は０．０２よりも小さい絶対値を有する。
請求項１ないし請求項８のいずれかに記載の装置（１００）であり、前記解析ウィンドウ処理部（１１０）において、ウィンドウ処理後フレームのウィンドウ処理後サンプルｚ（ｎ）を得るために、ウィンドウ処理は、以下の式に基づきフレーム（１２０）の時間領域オーディオ入力サンプルｘ（ｎ）の掛け算をすることを含む、

ｎは０〜Ｔ・Ｎ−１の範囲内のウィンドウ係数列の指数を示す整数であり、ｃ（ｎ）は指数ｎに対応する解析ウィンドウ関数のウィンドウ係数であり、ｘ（Ｎ・Ｔ−１）は時間領域オーディオ入力サンプルフレーム（１２０）の最新の時間領域オーディオ入力サンプルであり、時間領域オーディオ入力サンプルフレーム（１２０）は、フレーム（１２０）の初期の時間領域オーディオ入力サンプルから後期の時間領域オーディオ入力サンプルに至るＴ個の時間領域オーディオ入力サンプルブロック（１３０）を含み、各ブロックはＮ個の時間領域オーディオ入力サンプルを含み、Ｔ及びＮは正の整数であり、Ｔは４よりも大きい。
請求項９に記載の装置（１００）であり、解析ウィンドウ処理部（１１０）において、ウィンドウ係数ｃ（ｎ）は付録４の表に示されている関係に従うものである。
請求項１ないし請求項１０のいずれかに記載の装置であり、該装置（１００）は、オーディオ副帯値のために使用されるべき合成ウィンドウ関数（３７０）の時間逆転版又は指数逆転版である解析ウィンドウ関数（１９０）を使用する。
時間領域オーディオサンプルを生成する装置（３００）であり、以下のものを含む、
オーディオ副帯チャンネルのオーディオ副帯値から中間時間領域サンプル列（３３０）を生成するための計算機（３３０）であり、該中間時間領域サンプル列は初期の中間時間領域サンプル及び後期の時間領域サンプルを含む、
ウィンドウ処理後の中間時間領域サンプルを得るために、ウィンドウ係数列を含む合成ウィンドウ関数（３７０）を使用して前記中間時間領域サンプル列（３３０）をウィンドウ処理する合成ウィンドウ処理部（３６０）であり、該合成ウィンドウ関数（３７０）はウィンドウ係数列の第１部分を含むウィンドウ係数第１グループ（４２０）及びウィンドウ係数列の第２部分を含むウィンドウ係数第２グループ（４３０）を含み、前記第１部分は前記第２部分よりも少ない個数のウィンドウ係数を含む、
前記第１部分のウィンドウ係数のエネルギー値は前記第２部分のウィンドウ係数のエネルギー値よりも高く、
前記ウィンドウ係数第１グループは後期の中間時間領域サンプルをウィンドウ処理するのに使用され、前記ウィンドウ係数第２グループは初期の中間時間領域サンプルをウィンドウ処理するのに使用される、
時間領域サンプルを得るために、ウィンドウ処理後中間時間領域サンプルを処理するための重複加算出力部（４００）。
請求項１２に記載の装置（３００）であり、前記合成ウィンドウ処理部（３６０）において、前記ウィンドウ係数列第１部分のウィンドウ係数のエネルギー値は合成ウィンドウ関数（３７０）の全てのウィンドウ係数のエネルギー値の２／３以上であり、前記ウィンドウ係数列第２部分のウィンドウ係数のエネルギー値は合成ウィンドウ関数（３７０）の全てのウィンドウ係数のエネルギー値の１／３以下である。
請求項１２又は請求項１３に記載の装置（３００）であり、前記合成ウィンドウ処理部（３６０）において、前記ウィンドウ係数列第１部分はウィンドウ係数列のウィンドウ係数の合計数の１／３以下の個数のウィンドウ係数を含み、前記ウィンドウ係数列第２部分はウィンドウ係数列のウィンドウ係数の合計数の２／３以上の個数のウィンドウ係数を含む。
請求項１２ないし請求項１４のいずれかに記載の装置（３００）であり、前記合成ウィンドウ処理部（３６０）において、前記合成ウィンドウ関数（３７０）のウィンドウ係数の中心点はウィンドウ係数列第１部分の指数範囲内の実数値に相当する。
請求項１２ないし請求項１５のいずれかに記載の装置（３００）であり、前記合成ウィンドウ処理部（３６０）において、前記合成ウィンドウ関数（３７０）は、最新の時間領域オーディオサンプルをウィンドウ処理するために使用されるウィンドウ係数から、合成ウィンドウ関数（３７０）の全てのウィンドウ係数のうちの最大絶対値を有するウィンドウ係数まで、厳密に単調な増加を示す。
請求項１２ないし請求項１６のいずれかに記載の装置（３００）であり、指数ｎ＝Ｎに対応するウィンドウ係数は０．９〜１．１の範囲内の絶対値を有し、ウィンドウ係数列の指数は０〜Ｎ・Ｔ−１の範囲内の整数であり、最新の中間時間領域サンプルをウィンドウ処理するのに使用されるウィンドウ係数は、指数ｎ＝０に対応するウィンドウ係数であり、Ｔは中間時間領域サンプルフレーム（３３０）に含まれるブロックの個数を示す４よりも大きい整数であり、また、該装置（３００）はＮ個の時間領域オーディオサンプルを含む時間領域オーディオサンプルブロック（４１０）を生成し、Ｎは正の整数である。
請求項１７に記載の装置（３００）であり、前記合成ウィンドウ処理部（３６０）において、指数ｎ＝０に対応するウィンドウ係数は０．０２以下の絶対値を有する。
請求項１２ないし請求項１８のいずれかに記載の装置（３００）であり、前記合成ウィンドウ処理部（３６０）において、指数ｎ＝３Ｎに対応するウィンドウ係数は−０．１よりも小さく、該装置（３００）はＮ個の時間領域オーディオサンプルを含む時間領域オーディオサンプルブロック（４１０）を生成し、Ｎは正の整数である。
請求項１２ないし請求項１９のいずれかに記載の装置（３００）であり、前記合成ウィンドウ処理部（３６０）において、ウィンドウ処理後フレーム（３８０）のウィンドウ処理後サンプルｚ（ｎ）を得るために、ウィンドウ処理は、以下の式に基づき中間時間領域サンプル列の中間時間領域サンプルｇ（ｎ）の掛け算をすることを含む、

ｎ＝０，…，Ｔ・Ｎ−１である。
請求項２０に記載の装置（３００）であり、合成ウィンドウ処理部（３６０）において、ウィンドウ係数ｃ（ｎ）は付録４の表に示されている関係を満たす。
請求項１２ないし請求項２１のいずれかに記載の装置（３００）であり、該装置（３００）は、オーディオ副帯値を生成するために使用される解析ウィンドウ関数（１９０）の時間逆転版又は指数逆転版である合成ウィンドウ関数（３７０）を使用する。
オーディオ副帯値チャンネルのオーディオ副帯値を生成する方法であり、以下のステップを含む、
初期のサンプルから後期のサンプルに至る時間列にある時間領域入力サンプルのフレームを、ウィンドウ係数列を含む解析ウィンドウ関数を使用してウィンドウ処理するステップであり、該解析ウィンドウ関数は、該ウィンドウ係数列の第１部分を含むウィンドウ係数第１グループ（２００）と該ウィンドウ係数列の第２部分を含むウィンドウ係数第２グループ（２１０）とを含み、前記第１部分は前記第２部分よりも少ない個数のウィンドウ係数を含み、前記第１部分のウィンドウ係数のエネルギー値は前記第２部分のウィンドウ係数のエネルギー値よりも高く、前記ウィンドウ係数第１グループ（２００）は後期の時間領域サンプルをウィンドウ処理するのに使用され、前記ウィンドウ係数第２グループ（２１０）は初期の時間領域サンプルをウィンドウ処理するのに使用される、
ウィンドウ処理後サンプルを使用してオーディオ副帯値を算出するステップ。
時間領域オーディオサンプルを生成する方法であり、以下のステップを含む、
オーディオ副帯チャンネルのオーディオ副帯値から中間時間領域サンプル列（３３０）を算出するステップであり、該中間時間領域サンプル列は初期の中間時間領域サンプル及び後期の時間領域サンプルを含む、
ウィンドウ処理後の中間時間領域サンプルを得るために、ウィンドウ係数列を含む合成ウィンドウ関数を使用して前記中間時間領域サンプル列をウィンドウ処理するステップであり、該合成ウィンドウ関数はウィンドウ係数列の第１部分を含むウィンドウ係数第１グループ（４２０）及びウィンドウ係数列の第２部分を含むウィンドウ係数第２グループ（４３０）を含み、前記第１部分は前記第２部分よりも少ない個数のウィンドウ係数を含み、前記第１部分のウィンドウ係数のエネルギー値は前記第２部分のウィンドウ係数のエネルギー値よりも高く、該ウィンドウ係数第１グループ（４２０）は後期の中間時間領域サンプルをウィンドウ処理するのに使用され、前記ウィンドウ係数第２グループ（４３０）は初期の中間時間領域サンプルをウィンドウ処理するのに使用される、
時間領域サンプルを得るために、ウィンドウ処理後時間領域サンプルを重複加算処理するステップ。
プロセッサで起動された際、請求項２３又は請求項２４に記載の方法を実行するためのプログラムコードを有するプログラム。