JP2009530675A

JP2009530675A - オーディオ副帯値を生成する装置及び方法、並びに、時間領域オーディオサンプルを生成する装置及び方法

Info

Publication number: JP2009530675A
Application number: JP2009500788A
Authority: JP
Inventors: シュネール、マルクス; ルツキー、マンフレート; ローヴァーサー、マルクス; シュミット、マルクス; ゲイヤー、マルク; メラー、ミカエル; エードラー、バーント; ムルトラス、マルクス; シューラー、ゲラルド; ゲイガー、ラルフ; グリル、バーンハート
Original assignee: フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン
Priority date: 2006-10-25
Filing date: 2007-10-23
Publication date: 2009-08-27
Anticipated expiration: 2027-10-23
Also published as: ES2947516T3; AR063400A1; PT3848928T; CN101606194B; AU2007308416B2; US20100023322A1; TWI357065B; NO342691B1; BRPI0709310B1; US8438015B2; ZA200902199B; EP4325723A2; EP2076901B1; NO20084012L; ES2966657T3; AR063394A1; DE602007001460D1; FI3848928T3; EP2109098A3; JP4936569B2

Abstract

オーディオ副帯値を生成するための装置及び方法、及び時間領域オーディオサンプルを生成するための装置及び方法
オーディオ副帯チャンネルのオーディオ副帯値を生成するための装置(100)の一実施形態は、ウィンドウ処理後のサンプルを得るために、初期のサンプルから後期のサンプルに至る時間列にある時間領域入力サンプルのフレーム(120)を、ウィンドウ係数列を含む解析ウィンドウ関数(190)を使用してウィンドウ処理するための解析ウィンドウ処理部(110)を含む。解析ウィンドウ関数は第１の個数のウィンドウ係数を含み、該第１の個数のウィンドウ係数は、より多い第２の個数のウィンドウ係数を有する列を含むより大きいウィンドウ関数から導き出され、ウィンドウ関数のウィンドウ係数は、このより大きいウィンドウ関数のウィンドウ係数の補間により、導き出される。この装置(100)はさらに、前記ウィンドウ処理後のサンプルを使用して、オーディオ帯域値を算出するための計算機を含む。
【選択図】図１

Description

本発明は、オーディオ副帯値を生成する装置及び方法、並びに、時間領域オーディオサンプルを生成する装置及び方法、さらに、前記いずれかの装置を含むシステムに関し、本発明は、例えば最近のオーディオ符号化、オーディオ復号化または他のオーディオ転送に関する応用分野で実施可能である。

最近のデジタルオーディオ処理は、概して、オーディオデータの直接転送または直接保存と比較して、ビットレート、転送帯域幅及び保存スペースに関してかなりの節約を可能にする符号化体系に基づいているものである。これは、オーディオデータを送信側で符号化し、符号化されたデータを受信側で復号化し、その後例えばリスナーまたはさらなる信号処理部に提供することによって達成される。

このようなデジタルオーディオ処理システムは、概して、一方では転送されたあるいは処理されたオーディオデータの質に影響を及ぼす広範囲のパラメータと、他方ではコンピュータ処理能力、帯域幅及び他の性能に関するパラメータに関して実施可能である。高品質であるためには、高いビットレート、複雑なコンピュータ処理及び復号化されたオーディオデータのためのより大きい記憶容量が必要となることが非常によくある。従って、計画している応用により、許容ビットレート、容認可能なコンピュータ処理の複雑さ、容認可能なデータ量というような要因は、望ましい達成可能な質とバランスを取る必要がある。

双方向また一方向通信のような同時アプリケーションにとって特に重要なさらに別のパラメータや、異なる符号化体系によって生じる遅延もまた、重要な役割を果たす。従って、応用分野が計画中のものに特定されている異なる符号化体系の必要性とコストのバランスを取る際に、オーディオ符号化・復号化によって生じる遅延が、前述したパラメータの点から、さらに別の制限を与える。このようなデジタルオーディオシステムは超低質転送から最高転送までの多様な分野に応用可能であるので、異なるパラメータと異なる制限がそれぞれのオーディオシステムに課せられることが非常によくある。いくつかの応用において、より小さい遅延のために、より高いビットレートが必要とされ、従って、高い遅延を有するオーディオシステムと比較して、同等の質レベルとしては、より広い転送帯域が必要となる場合がある。

しかし、多くの場合、ビットレート、コンピュータ処理の複雑さ、メモリー条件、質及び遅延などの多様なパラメータに関して、妥協が必要とされる。

本発明の一実施形態によると、オーディオ副帯チャンネルのオーディオ副帯値を生成するための装置は、ウィンドウ処理されたサンプルを得るために、初期のサンプルから後期のサンプルに及ぶ時間列内にある時間領域オーディオ入力サンプルのフレームを、ウィンドウ係数列を含む解析ウィンドウ関数を使用してウィンドウ処理するための解析ウィンドウ処理部を有し、解析ウィンドウ関数は第１の個数のウィンドウ係数を含み、この第１の個数のウィンドウ係数はより多数の第２の個数のウィンドウ係数を含むより大きなウィンドウ関数から導き出されるものであり、このウィンドウ関数のウィンドウ係数はより大きなウィンドウ関数のウィンドウ係数の補間によって導き出され、第２の個数は偶数である。また、この装置はウィンドウサンプルを使用してオーディオ副帯値を算出する計算機を有する。

本発明の一実施形態によると、時間領域オーディオサンプルを生成する装置は、オーディオ副帯チャンネルのオーディオ副帯値から、初期の中間時間領域サンプルと後期の中間時間領域サンプルを含む中間時間領域サンプル列を算出する計算機、及びウィンドウ処理された中間時間領域サンプルを得るために、中間時間領域サンプル列を、ウィンドウ係数列を含む合成ウィンドウ関数を使用してウィンドウ処理する合成ウィンドウ処理部を有し、合成ウィンドウ関数は第１の個数のウィンドウ係数を含み、この第１の個数のウィンドウ係数はより多数の第２の個数のウィンドウ係数を含むより大きなウィンドウ関数から導き出されるものであり、このウィンドウ関数のウィンドウ係数はより大きなウィンドウ関数のウィンドウ係数の補間によって導き出され、第２の個数は偶数である。また、この装置は時間領域サンプルを得るために、ウィンドウ処理後の中間時間領域サンプルを処理する重複加算出力部を有する。

添付図面を参照しながら、本発明の実施形態を以下に説明する。

図１〜１９は、オーディオ副帯値を生成する装置及び方法、時間領域サンプルを生成する装置及び方法、前記装置、方法のうちの少なくともいずれか一つを含むシステムの異なる実施形態の機能的特性及び特徴を示す回路図及び説明図である。本発明の第１実施形態を詳しく説明する前に、本発明の実施形態はハードウェアにもソフトウェアにも実行可能であることを明記しておく。従って、それぞれの実施形態のハードウェアへ実行する場合のブロック図として説明されているものは、それに相当する方法の実施形態のフローチャートとしても考えられ得る。また、本発明の実施形態を説明するフローチャートは、それに相当するハードウェアへの実行のブロック図としても考えられ得る。

以下に、フィルターバンクとしての実施形態を説明するが、これは解析フィルターバンクまたは合成フィルターバンクとして実施可能である。解析フィルターバンクは、初期のサンプルから後期のサンプルに至る時間列内にある時間領域オーディオ（入力）サンプルに基づき、オーディオ副帯チャンネルのオーディオ副帯値を生成する装置である。つまり、解析フィルターバンクという言葉は、オーディオ副帯値を生成する装置としての本発明の実施形態と類義語的に使用され得る。合成フィルターバンクは、オーディオ副帯チャンネルのオーディオ副帯値から時間領域オーディオサンプルを生成するフィルターバンクである。つまり、合成フィルターバンクという言葉は、時間領域オーディオサンプルを生成する装置としての本発明の実施形態と類義語的に使用され得る。

解析フィルターバンク、合成フィルターバンクどちらも略してフィルターバンクと称されるものであるが、例えば、変調フィルターバンクとして実施されてもよい。変調フィルターバンクは、周波数領域の対応する副帯の中心周波数から導き出される周波数を有する振動に基づくものであり、その例及び実施形態は後述する。「変調」という言葉は、ここでは、このような変調フィルターバンクの具体的な実施に応じて、前述の振動はウィンドウ関数またはプロトタイプフィルター関数に関連して使用されるという事実を指している。変調フィルターバンクは、原則的には、調和振動（正弦振動または余弦振動）などの実数値振動またはそれに対応する複合値振動（複素励振）に基づき可能である。従って、変調フィルターバンクは、実数変調フィルターバンクまたは複合フィルター変調フィルターバンクと称される。

以下、複合変調低遅延フィルターバンクや実数変調低遅延フィルターバンクとしての本発明の実施形態、及びそれに相当する方法やソフトウェアへの実施を詳細に説明する。このような変調低遅延フィルターバンクの主な応用の一つは、低遅延スペクトル帯域再生（ＳＢＲ）システムへの統合であり、現在、対称プロトタイプフィルターを備えた複合ＱＭＦ（複合直角ミラーフィルター）の使用に基づいている。

本明細書の構成から明らかなように、本発明の実施形態に係る低遅延フィルターバンクは、コンピュータ処理の複雑さ、周波数応答、一時的なノイズ拡散及び（再生の）質の間のトレードオフが向上されるという利点をもたらす。さらに、遅延と再生の質との間のトレードオフの向上は、さらなる遅延を引き起こすことなく、それぞれのフィルターバンクのフィルターインパルス応答を引き延ばすためのいわゆるゼロ遅延技術を利用する方法に基づき、達成できる。既定の質レベルでの低遅延、既定の遅延レベルでのより良い質または遅延と質の同時向上は、本発明の実施形態に係る解析フィルターバンクまたは合成フィルターバンクを用いることで達成可能である。

本発明の実施形態は、これらの向上は、第１の個数のウィンドウ係数を有するウィンドウ関数を、それより多い第２の個数のウィンドウ係数を有するウィンドウ関数に基づき得るために補間体系を利用することで達成できるという発見に基づくものである。補間体系を利用することで、ウィンドウ関数のウィンドウ係数のエネルギー値の分布の向上が達成できる。これは、多くの場合、エイリアシングレベルの向上とオーディオの質に関する向上をもたらす。例えば、より大きいウィンドウ関数が偶数個のウィンドウ係数を含む場合、補間体系は有用である。

補間体系を用いることにより、コンピュータ処理の複雑化はわずかですむ。しかし、二つの別のウィンドウ関数が独立して記憶されている場合と比較すると、このわずかな複雑化があるにしても、それを上回る質の向上とメモリー使用量の節約が得られる。補間がプロセッサのクロック信号の一回または数回のサイクルの内に行われている間、多くの場合はわずかな遅延とコンピュータ処理の複雑化をもたらすが、メモリーが余分にあることは多くの応用で非常に重要である。例えば、モバイルに応用する場合、特にかなり多数のウィンドウ係数を有する長いウィンドウ関数が使用される場合、メモリーは限られている。

さらに、本発明に係る実施形態は、前述した二つのフィルターバンクのいずれかのための新しいウィンドウ関数に使用でき、前述のトレードオフをさらに向上させる。解析フィルターバンクの場合、一つのウィンドウ係数列を含む解析ウィンドウ関数を使用することによって、質及び／または遅延をさらに向上できる。ウィンドウ係数列は、ウィンドウ係数第１連続部を含む第１グループとウィンドウ係数第２連続部を含む第２グループとからなる。第１連続部と第２連続部はウィンドウ関数の全てのウィンドウ係数を含む。さらに、第１部は第２部よりも少ないウィンドウ係数を含むが、第１部のウィンドウ係数のエネルギー値は第２部のウィンドウ係数のエネルギー値よりも高い。第１グループのウィンドウ係数は後期の時間領域サンプルをウィンドウ処理するために使用され、第２グループのウィンドウ係数は前期の時間領域サンプルをウィンドウ処理するために使用される。これが、前述したウィンドウ係数の二つの部分への分配の結果と、それらの時間領域オーディオサンプル列への応用である。結果的に、このようなウィンドウ関数を使用することで、一定の質レベルでフィルターバンクによって生じる遅延を低下させ、あるいは一定の遅延レベルで質の向上を可能にする。

従って、時間領域オーディオサンプルを生成する装置及び方法としての本発明の実施形態の場合、合成ウィンドウ処理部は、ウィンドウ係数が第１連続部と第２連続部にそれぞれ同様に配置されたウィンドウ係数列を含む合成ウィンドウ関数を使用し得る。合成ウィンドウ関数の場合も、第１部のウィンドウ係数のエネルギー値つまり第１部全体のエネルギー値は第２部のウィンドウ係数のエネルギー値つまり第２部全体のエネルギー値よりも大きいが、第１部は第２部よりも少ない数のウィンドウ係数を含む。合成ウィンドウ処理部のウィンドウ係数がこのように二つの部分へ分配され、また、合成ウィンドウ処理部は後期の時間領域サンプルをウィンドウ処理するために第１部のウィンドウ係数を使用し、前期の時間領域サンプルをウィンドウ処理するために第２部のウィンドウ係数を使用するという事実により、合成フィルターバンク及び相当する方法にも前述した効果及び利点が当てはまる。

本発明のいくつかの実施形態の構造に用いられている合成ウィンドウ関数と解析ウィンドウ関数については後に詳細に説明する。本発明の多くの実施形態において、合成ウィンドウ関数及び／または解析ウィンドウ関数のウィンドウ係数列は、正に第１グループのウィンドウ係数と第２グループのウィンドウ係数を含んでいる。さらに、このウィンドウ係数列の各ウィンドウ係数は、確実に第１グループか第２グループのいずれかに属している。

前記二つの各グループは、正にウィンドウ係数列の一部分を連続的に含んでいる。本明細書では、一つの部分は、ウィンドウ係数列に応じた連続した一組のウィンドウ係数を含んでいる。本発明に係る実施形態において、二つのグループ（第１及び第２グループ）のそれぞれは、正に前述したウィンドウ係数列の一部を含んでいる。ウィンドウ係数の各グループは、正にそのグループの部分に属さないいかなるウィンドウ係数をも含まない。換言すれば、本発明に係る多くの実施形態において、第１、第２各グループのウィンドウ係数は、それぞれ、ウィンドウ係数第１部分、ウィンドウ係数第２部分のみを含み、他のウィンドウ係数を含まない。

本明細書の構造において、ウィンドウ係数列の一つの連続部とは、数学的な意味で接続する一組のウィンドウ係数として理解されるべきものである。ウィンドウ係数列と比較して、一組のウィンドウ係数は、それぞれの部分の範囲（例えば指数範囲）内にあるウィンドウ係数を欠くことはない。つまり、本発明に係る多くの実施形態において、一つのウィンドウ係数列は二つのウィンドウ係数接続部分に分けられ、これらの部分はそれぞれウィンドウ係数の第１グループと第２グループを形成する。これらの場合、第１グループに含まれる各ウィンドウ係数は、ウィンドウ係数列全体に関して、第２グループの各ウィンドウ係数の前または後に配置される。

さらに換言すると、本発明に係る多くの実施形態において、ウィンドウ係数列は、いかなるウィンドウ係数をも省くことなく、正確に二つのグループまたは部分に分けられる。ウィンドウ係数列はまたウィンドウ係数の順番を表わすものでもあるが、これに応じて、二つのグループまたは部分のそれぞれがボーダー係数までの（ボーダー係数を含まない）またはボーダー係数から始まる（ボーダー係数を含む）全てのウィンドウ係数を含む。一例として、一つのウィンドウ関数が６４０のウィンドウ係数（０〜６３９の指数を有する）を含む場合、第１部分または第１グループが０〜９５，（の指数を有するウィンドウ係数を含み、第２部分または第２グループが）９６〜６３９の指数を有するウィンドウ係数を含んでいてもよい。この場合、ボーダー係数は９６の指数に相当するものである。当然、他の例も可能である（例えば０〜５４３と５４４〜６３９）。

以下に説明する解析フィルターバンクの具体例は１０ブロックの入力サンプルをカバーするだけの長さを有するのに対し、わずか２ブロックのシステム遅延を引き起こす。このシステム遅延はＭＤＣＴ（修正分散余弦変換）またはＭＤＳＴ（修正分散正弦変換）によって生じる遅延に相当する。ＭＤＣＴまたはＭＤＳＴの場合と比較して、１０ブロックの入力サンプルをカバーするだけの長いフィルター長による違いは、ＭＤＣＴおよびＭＤＳＴの場合には１ブロックである重複が、９ブロックの重複にまで増加することである。しかし、別の個数のブロックの入力サンプル（オーディオ入力サンプルとも称される）をカバーする他の実施も実現可能である。さらに、他のトレードオフも考慮、実行可能である。

図１は、オーディオ副帯チャンネルのオーディオ副帯値を生成する装置の一実施形態としての解析フィルターバンク１００のブロック図を示す。解析フィルターバンク１００は、時間領域オーディオ入力サンプルのフレーム１２０をウィンドウ処理するための解析ウィンドウ処理部１１０を有する。フレーム１２０は、Ｔ個のブロック１３０−１，…，１３０−Ｔの時間領域オーディオ（入力）サンプルを含んでいる。Ｔは正の整数であり、図１に示す実施形態の場合は１０である。しかし、フレーム１２０は別の個数のブロック１３０を含んでいてもよい。

フレーム１２０と各ブロック１３０のどちらにおいても、図１に矢印１４０で示すような時間直線に応じた初期サンプルから後期サンプルまで続く時間列内の時間領域オーディオ入力サンプルを含んでいる。換言すれば、図１の場合、時間領域オーディオサンプル（この場合時間領域オーディオ入力サンプル）が右寄りであればあるほど、その時間領域オーディオサンプルは時間領域オーディオサンプル列に関して後方にある。

解析ウィンドウ処理部１１０は時間領域オーディオサンプル列に基づき、時間領域でウィンドウ処理されたサンプルを生成する。これらのウィンドウ処理されたサンプルはウィンドウ処理後のサンプルのフレーム１５０に配列される。時間領域オーディオ入力サンプルフレーム１２０に応じて、ウィンドウ処理後サンプルフレーム１５０もまたＴ個のブロック１６０−１，…，１６０−Ｔのウィンドウ処理後のサンプルを含む。本発明の好ましい実施形態において、ウィンドウ処理後サンプルの各ブロック１６０は、時間領域オーディオ入力サンプルの各ブロック１３０内の時間領域オーディオ入力サンプルの数と同じ数のウィンドウ処理後サンプルを含む。従って、各ブロック１３０がＮ個の時間領域オーディオ入力サンプルを含む場合、フレーム１２０，１５０はそれぞれＴ・Ｎ個のサンプルを含む。この場合、Ｎは正の整数であり、例えば３２または６４である。この例のそれぞれの場合、Ｔ＝１０であれば、各フレーム１２０，１５０は３２０個または６４０個のサンプルを含む。

解析ウィンドウ処理部１１０は、解析ウィンドウ処理部１１０によって提供されるウィンドウ処理後のサンプルに基づきオーディオ副帯値を計算する計算機１７０と組み合わされている。オーディオ副帯値は、計算機１７０によって、オーディオ副帯値ブロック１８０として提供され、その中の各オーディオ副帯値は一つのオーディオ副帯チャンネルに相当する。好ましい実施形態において、オーディオ副帯値ブロック１８０もまたＮ個の副帯値を含んでいる。

各オーディオ副帯チャンネルは特有の中心周波数に相当している。異なるオーディオ副帯チャンネルのそれぞれの中心周波数は、例えば、解析フィルターバンク１００に与えられた時間領域オーディオ入力サンプルで説明したように、対応するオーディオ信号の周波帯域に関して等しく分配されている、つまり等間隔で配置されていてもよい。

解析ウィンドウ処理部１１０は、フレーム１５０のウィンドウ処理後のサンプルを得るために、フレーム１２０の時間領域オーディオ入力サンプルを第１の個数のウィンドウ係数の列を含む解析ウィンドウ関数に基づきウィンドウ処理するように構成されている。解析ウィンドウ処理部１１０における時間領域オーディオサンプルのフレーム１２０のウィンドウ処理は、時間領域オーディオサンプルの値を解析ウィンドウ関数のウィンドウ係数を掛けることによって実行される。つまり、このウィンドウ処理は、時間領域オーディオサンプルのそれぞれの要素とそれに対応するウィンドウ係数との掛け算を含むものである。時間領域オーディオサンプルとウィンドウ係数は一致する順序を有し、ウィンドウ係数と時間領域オーディオサンプルの要素ごとの掛け算は、例えばサンプル／ウィンドウ係数指数によって示されるそれぞれの順序に応じて実行される。

本発明の実施形態において、時間領域オーディオ入力サンプルのフレームのウィンドウ処理に使用されるウィンドウ関数は、より多くの個数のウィンドウ係数を含むより大きいウィンドウ関数に基づき、例えば図３，４に示すような補間体系を用いて生成される。このより大きいウィンドウ関数は典型的には偶数個のウィンドウ係数を含み、例えばウィンドウ係数列に関しては非対称であってもよい。

時間領域オーディオ入力サンプルフレーム１２０のウィンドウ処理に使用されるウィンドウ関数１９０は、例えばより大きいウィンドウ関数のウィンドウ係数を補間する解析ウィンドウ処理部１１０またはフィルターバンク１００によって得られる。本発明に係る実施形態において、これは、例えばより大きいウィンドウ関数の連続するウィンドウ係数を補間することによって実行される。ここでは、直線的、多項式的またはスプラインを基にした補間体系が使用され得る。

例えばより大きいウィンドウ関数の各ウィンドウ係数がウィンドウ関数のウィンドウ係数を生成するのに一度だけ使用され、第２の数が偶数である場合、ウィンドウ関数１９０のウィンドウ係数の個数（第１の数）は第２の数の半分である。このような補間は直線的補間に基づくものであり、その一例は後記の式（１５）に示されている。しかし、他の補間体系も使用可能である。

図１に示すような解析フィルターバンク１００としての本発明の実施形態において、解析ウィンドウ関数は例えば実数値ウィンドウ係数のみを含むものであってもよい。このことは、合成フィルターバンクの場合の合成ウィンドウ関数においても同様である。換言すれば、ウィンドウ係数指数に起因する各ウィンドウ係数は実数値である。

これらのウィンドウ係数がまとまり、それぞれのウィンドウ関数を形成する。この一例は、解析ウィンドウ関数１９０として図１に示されている。前述したようなフィルターバンクに使用される場合、遅延低下を可能にするウィンドウ関数を、以下に検討する。しかし、本発明の実施形態はこのような低遅延ウィンドウ関数に限るものではない。

解析ウィンドウ関数１９０を形成するウィンドウ係数列は、ウィンドウ係数の第１グループ２００と第２グループ２１０を有する。第１グループ２００は、ウィンドウ係数列の第１連続接続部分を含み、第２のグループ２１０は、ウィンドウ係数列の第２連続接続部分を含む。第１グループ２００の第１部分と第２グループの第２部分は共に解析ウィンドウ関数１９０のウィンドウ係数列全体を形成する。また、このウィンドウ係数列の各ウィンドウ係数は第１部分または第２部分のどちらかに属し、解析ウィンドウ関数１９０全体が第１部分及び第２部分のウィンドウ係数によって成り立っている。従って、図１の矢印２００，２０１で示されているように、ウィンドウ係数の第１部分はウィンドウ係数の第１グループ２００と同じであり、第２部分はウィンドウ係数の第２グループ２１０と同じである。

第１グループ２００つまり第１部分のウィンドウ係数の個数は、第２グループつまり第２部分のウィンドウ係数の個数よりも少ない。しかし、第１グループ２００のウィンドウ係数のエネルギー値または全体的なエネルギー値は第２グループ２１０のウィンドウ係数のエネルギー値または全体的なエネルギー値よりも高い。後述するように、一組のウィンドウ係数のエネルギー値は、それらのウィンドウ係数の絶対値の２乗の合計に基づくものである。

従って、本発明に係る実施形態において、解析ウィンドウ関数１９０及び合成ウィンドウ関数はウィンドウ係数列またはウィンドウ係数指数に関して非対称であってもよい。解析ウィンドウ関数１９０がそれにより定義されるウィンドウ係数指数の定義集合を基に、全ての実数ｎに対してさらなる実数ｎ₀が存在し、ウィンドウ係数指数（ｎ₀−ｎ）に対応するウィンドウ係数の絶対値はウィンドウ係数指数（ｎ₀＋ｎ）に対応するウィンドウ係数の絶対値と異なり、（ｎ₀−ｎ）と（ｎ₀＋ｎ）がその定義集合に属する場合、その解析ウィンドウ関数１９０は非対称である。

さらに、図１に概略的に示すように、解析ウィンドウ関数１９０は、二つの連続するウィンドウ係数の積が負である際の符号変換を含む。本発明の実施形態に係るウィンドウ関数の特徴に関しては、図１１〜１９を参照してより詳細に説明する。

前述したように、ウィンドウ処理後のサンプルのフレーム１５０は、時間領域入力サンプルのフレーム１２０と同様に、個々のブロック１６０−１，…，１６０−Ｔを有するブロック構造である。解析ウィンドウ処理部１１０は、時間領域オーディオ入力サンプルを解析ウィンドウ関数１９０のウィンドウ係数で掛けることにより、これらの値をウィンドウ処理するように構成されているので、ウィンドウ処理後サンプルフレーム１５０もまた時間領域である。計算機１７０はオーディオ副帯値、より正確には、ウィンドウ処理後サンプルフレーム１５０を使用してオーディオ副帯値ブロック１８０を算出し、時間領域から周波数領域への変換を行う。計算機１７０は従って、時間／周波数変換機と考えられ、この変換機は、オーディオ副帯値ブロック１８０をウィンドウ処理後サンプルフレーム１５０のスペクトル表示として提供することができる。

ブロック１８０の各オーディオ副帯値は特性周波数を有する一つの副帯に相当する。ブロック１８０に含まれるオーディオ副帯値の数はバンド数と称されることもある。

本発明に係る多くの実施形態において、ブロック１８０内のオーディオ副帯値の個数は、フレーム１２０のそれぞれのブロック１３０内の時間領域オーディオ入力サンプルの個数と一致している。ウィンドウ処理後サンプルフレーム１５０がフレーム１２０と同じブロック構造である場合、ウィンドウ処理後サンプルの各ブロック１６０が時間領域オーディオ入力サンプルブロック１３０と同じ個数のサンプルを含み、オーディオ副帯値ブロック１８０も当然ブロック１６０と同じ個数の値を含む。

フレーム１２０は、新しい時間領域オーディオ入力サンプルのブロック２２０に基づき、ブロック１３０−１，…，１３０−（Ｔ−１）を、時間方向を示す矢印１４０と反対の方向に１ブロック分だけ移動させることにより、生成され得る。このように、処理されるべき時間領域オーディオ入力サンプルフレーム１２０は、直前の時間領域オーディオサンプルフレーム１２０の最新の（Ｔ−１）個のブロックを初期の方向に１ブロック分だけ移動させ、新たな時間領域オーディオ入力サンプルの新しいブロック２２０を、現在のフレーム１２０の最新の時間領域オーディオ入力サンプルを含む新しいブロック１３０−１として追加することにより生成される。このことは、図１において、一連の点線矢印２３０により、ブロック１３０−１，…，１３０−（Ｔ−１）の矢印１４０とは反対の方向への移動として示されている。

矢印１４０で示す時間方向とは反対の方向へのブロック１３０の移動により、直前のフレーム１２０の１３０−（Ｔ−１）というブロックは、処理すべき現在のフレーム１２０においては、１３０−Ｔのブロックとして含まれることになる。同様に、処理すべき現在のフレーム１２０のブロック１３０−（Ｔ−１），…，１３０−２は直前のフレーム１２０のブロック１３０−（Ｔ−２），…，１３０−２と等しい。直前のフレーム１２０のブロック１３０−Ｔは廃棄される。

従って、新しいブロック２２０内の時間領域オーディオサンプルは、時間領域オーディオ入力サンプルのＴ個の連続するフレーム１２０をＴ回連続して処理する間に、それぞれＴ回処理される。従って、新しいブロック２２０内の各時間領域オーディオ入力サンプルはＴ個の異なるフレーム１２０の一部となるだけでなく、Ｔ個の異なるウィンドウ処理後サンプルフレーム１５０及びＴ個のオーディオ副帯値ブロック１８０の一要因となる。前述したように、本発明の好ましい実施形態においては、フレーム１２０のブロックの個数Ｔは１０であり、解析フィルターバンク１００に与えられる各時間領域オーディオサンプルは、１０個の異なるオーディオ副帯値ブロック１８０に影響する。

最初に、一つのフレーム１２０が解析フィルターバンク１００によって処理される前に、そのフレーム１２０は小さな絶対値（既定の閾値未満）、例えば０に初期化され得る。以下に詳述するが、解析ウィンドウ関数１９０の形は、中心点または「質量の中心」を有し、それは典型的には第１グループ２００の二つのウィンドウ係数指数の間に位置する。

従って、フレーム１２０が、少なくともフレーム１２０の部分がそのエネルギー値に関して重要な要因となるウィンドウ係数に相当する消失しない値（つまり０ではない値）で占められるような点まで埋められる前に、フレーム１２０に挿入される新しいブロック２２０の数は少ない。典型的には、「意味のある」処理が開始可能となる前にフレーム１２０に挿入されるべきブロックの数は、解析ウィンドウ関数１９０の形により、２〜４ブロックである。従って、解析フィルターバンク１００は、例えば対称ウィンドウ関数を使用している対応するフィルターバンクよりも速くブロック１８０を提供することができる。典型的には新しいブロック２２０はひとまとめで解析フィルターバンク１００に与えられるので、各新しいブロックは、基本的にブロック２２０の長さ（つまり、ブロック２２０に含まれる時間領域オーディオ入力サンプルの数）によって決まる記録またはサンプリング時間及びサンプリング速度またはサンプリング周波数に対応する。故に、本発明の実施形態に用いられるような解析ウィンドウ関数１９０は、オーディオ副帯値の第１及びそれに引き続くブロック１８０がフィルターバンク１００によって提供または出力される前の遅延を小さくする。

さらなる選択として、装置１００は、フレーム１８０を生成する際に使用される解析ウィンドウ関数１９０に関する情報または合成フィルターバンクの構造に使用されるべき合成ウィンドウ関数に関する情報を含む信号を生成してもよい。従って、解析フィルター関数１９０は、例えば、合成フィルターバンクによって使用されるべき合成ウィンドウ関数の時間逆転または指数逆転のものであってもよい。

図２ａは、オーディオ副帯値ブロックに基づき時間領域オーディオサンプルを生成する装置３００の一実施形態のブロック図を示す。前述したように、時間領域オーディオサンプルを生成する装置３００としての本発明の一実施形態は、しばしば合成フィルターバンクとも称される。この装置は時間領域オーディオサンプルを生成することができ、時間領域オーディオサンプルは原則的に、オーディオ信号に関するスペクトル情報を含むオーディオ副帯値に基づき再生可能である。従って、合成フィルターバンク３００は、オーディオ副帯値に基づき時間領域オーディオサンプルを合成することができるが、これらのオーディオ副帯値は例えば対応する解析フィルターバンク１００によって生成できる。

図２ａのブロック図に示す合成フィルターバンク３００は計算機３１０を含み、そこに（周波数領域の）オーディオ副帯値が与えられる。計算機３１０は、ブロック３２０のオーディオ副帯値から、中間時間領域サンプル列を含むフレーム３３０を算出することができる。本発明の多くの実施形態において、中間時間領域サンプルフレーム３３０もまた、例えば図１の解析フィルターバンク１００のウィンドウ処理後サンプルフレーム１５０と同様のブロック構造を有している。このような場合、フレーム３３０は中間時間領域サンプルのブロック３４０−１，…，３４０−Ｔを含む。

フレーム３３０の中間時間領域サンプル列及び中間時間領域サンプルの各ブロック３４０は、図２ａの矢印３５０によって示されるような時間に基づく順序を有する。従って、フレーム３３０は、ブロック３４０−Ｔ内に初期の中間時間領域サンプル、そしてブロック３４０−１内に最新の中間時間領域サンプルを含み、それぞれのブロック３４０−Ｔ，３４０−１内のサンプルは、つまりフレーム３３０における最初と最後の中間時間領域サンプルである。また、各ブロック３４０も同様の順序を有している。つまり、合成フィルターバンクの実施形態において、「フレーム」という言葉と「列」という言葉はしばしば同意語として使用される。

計算機３１０は、中間時間領域サンプルフレーム３３０がそこに与えられる合成ウィンドウ処理部３６０と組み合わされている。合成ウィンドウ処理部は、図２ａに概略的に示すように、合成ウィンドウ関数３７０を使用して中間時間領域サンプル列をウィンドウ処理するように構成されている。合成ウィンドウ処理部３６０は、一つの出力として、ウィンドウ処理後の中間時間領域サンプルフレーム３８０を提供し、このフレーム３８０もまたブロック３９０−１，…，３９０−Ｔというブロック構造を有している。

フレーム３３０と３８０は、それぞれＴ個（Ｔは正の整数）のブロック３４０，３９０を含んでいてもよい。合成フィルターバンク３００としての本発明の好ましい実施形態において、ブロックの個数Ｔは１０である。しかし、異なる実施形態において、それぞれのフレームのブロックの個数はこれと異なっていてもよい。より正確には、どちらもブロック構造である解析フィルターバンク１００と合成フィルターバンク３００を含む本発明の実施形態における実施環境や前述したトレードオフに応じて、ブロックの個数Ｔは原則的には３以上または４以上である。

合成ウィンドウ処理部３６０は重複加算出力部４００と組み合わされ、そこにはウィンドウ処理後の中間時間領域サンプルが与えられる。重複加算出力部４００は、時間領域サンプルのブロック４１０を得るために、ウィンドウ処理後の中間時間領域サンプルを処理することができる。時間領域（出力）サンプルは、その後、例えばさらなる処理、保存または視聴可能なオーディオ信号への変換のための別の部材に与えられ得る。

フレーム３３０に含まれる時間領域サンプル列を算出するための計算機３１０は、データを周波数領域から時間領域に変換可能である。故に、計算機３１０は、オーディオ副帯値ブロック３２０に含まれるスペクトル表示の時間領域信号を生成可能な周波数／時間変換機を含んでいてもよい。図１に示した解析フィルターバンク１００の計算機１７０で説明したように、ブロック３２０の各オーディオ副帯値は、特徴的な中心周波数を有するオーディオ副帯チャンネルに相当する。

これとは対照的に、フレーム３３０に含まれる中間時間領域サンプルは、原則的に時間領域の情報である。合成ウィンドウ処理部３６０は、図２ａに概略的に示すように、合成ウィンドウ関数３７０を使用してフレーム３３０に含まれている中間時間領域サンプル列をウィンドウ処理できる。

図１に関して述べたように、合成ウィンドウ処理部３６０もまた合成ウィンドウ関数３７０を使用し、この関数３７０は第２の数のウィンドウ係数を含むより大きなウィンドウ関数の補間によって得られるものである。第２の数は、従って、フレーム３３０の中間時間領域サンプルをウィンドウ処理するのに使用される合成ウィンドウ関数３７０のウィンドウ係数の個数（第１の数）よりも大きい。

合成ウィンドウ関数３７０は、例えば合成ウィンドウ処理部３６０、または前述した補間体系のうちの一つを実行するフィルターバンク３００（装置）によって得られる。合成ウィンドウ関数のウィンドウ係数は、例えば、直線的、多項式的またはスプラインを基にした補間に基づき生成されてもよい。さらに、本発明の実施形態において、補間はより大きいウィンドウ関数の連続するウィンドウ係数を使用して行われる。より大きいウィンドウ関数のウィンドウ係数がそれぞれ正確に一度ずつ使用される場合、第２の数が偶数であるならば、ウィンドウ関数３７０に含まれるウィンドウ係数の数（より小さい第１の数）は、より大きいウィンドウ関数のウィンドウ係数の数の半分である。換言すれば、この場合、第２の数は第１の数の２倍である。しかし、他の補間方法や補間体系も本発明の実施形態に適用可能である。

以下に、いわゆる低遅延ウィンドウ関数の場合をより詳細に検討する。前述したように、本発明に係る実施形態はこれらのウィンドウ関数に限るものではない。また、対称ウィンドウ関数等の他のウィンドウ関数を用いてもよい。

合成ウィンドウ関数３７０はウィンドウ係数列を含み、このウィンドウ係数列は、前述したウィンドウ関数１９０がウィンドウ係数の第１グループ２００と第２グループ２１０を含むのと同様に、ウィンドウ係数の第１グループ４２０と第２グループ４３０を含む。

合成ウィンドウ関数３７０のウィンドウ係数の第１グループ４２０はウィンドウ係数列の第１連続部分を含む。同様に、ウィンドウ係数の第２グループ４３０は係数列の第２連続部分を含む。第１部分は第２部分よりも少ないウィンドウ係数を有しているが、第１部分のウィンドウ係数のエネルギー値または全体的なエネルギー値は第２部分のウィンドウ係数のエネルギー値または全体的なエネルギー値よりも高い。さらに、合成ウィンドウ関数３７０の特徴及び特性は、図１に概略的に示す解析ウィンドウ関数１９０の特徴及び特性と同様であってもよい。従って、ここでは解析ウィンドウ関数１９０の構造について説明し、さらに図１１〜１９を参照したウィンドウ関数の説明においては、第１グループ２００は第１グループ４２０に相当し、第２グループ２１０は第２グループ４３０に相当する。

例えば、ウィンドウ係数の二つのグループ４２０，４３０に含まれる各部分は、概して、ウィンドウ係数の連続接続部分を形成し、これらの連続接続部分はひとまとまりとして、ウィンドウ関数３７０のウィンドウ係数列の全てのウィンドウ係数を含む。本発明に係る多くの実施形態において、図１に示すような解析ウィンドウ関数１９０及び図２ａに示すような合成ウィンドウ関数３７０は、互いを基礎としている。例えば、解析ウィンドウ関数１９０は合成ウィンドウ関数３７０の時間的逆転版または指数的逆転版であってもよい。しかし、これらの二つのウィンドウ関数１９０，３７０の間には他の関係も可能である。合成ウィンドウ関数３７０は、合成フィルターバンク３００に与えられたオーディオ副帯値ブロック３２０の生成（さらなる処理の前の生成であってもよい）の際に使用された解析ウィンドウ関数１９０に関連する合成ウィンドウ処理部３６０の構造で使用されることが望ましい。

図１を参照して述べたように、図２ａの合成フィルターバンク３００は、入力されてくるブロック３２０がウィンドウ関数に関する付加的な信号または付加的な情報を含む場合に適合させたものであってもよい。一例として、ブロック３２０は、ブロック３２０の生成の際に使用された解析ウィンドウ関数１９０に関する情報、または合成ウィンドウ処理部３６０によって使用されるべき合成ウィンドウ関数３７０に関する情報を含んでいてもよい。このように、フィルターバンク３００はそれぞれの情報を分離し、これらを合成ウィンドウ処理部３６０に与えるように構成されたものであってもよい。

重複加算出力装置４００は、フレーム３８０に含まれるウィンドウ処理後の中間時間領域サンプルを処理することによって時間領域サンプルのブロック４１０を生成することができる。本発明の別の実施形態において、重複加算出力装置４００は、以前に受信したウィンドウ処理後中間時間領域サンプルフレーム３８０を一時的に保存するためのメモリーを含んでいてもよい。実施の詳細により、重複加算出力装置４００は、例えばウィンドウ処理後中間時間領域サンプルの全てのフレーム３８０（フレーム総数Ｔ）を記憶するためのメモリー内にＴ個の記憶部を有していてもよい。しかし、重複加算出力装置４００内には、必要に応じてそれ以外の個数の記憶部があってもよい。さらに、本発明の別の実施形態において、重複加算出力装置４００は中間時間領域サンプルの一つのフレーム３８０のみに基づき時間領域サンプルのブロック４１０を与えることができるものであってもよい。異なる合成フィルターバンク３００の実施形態は後に詳述する。

図２ｂは、合成フィルターバンク３００としての本発明に係る実施形態の機能的原理を示す。図２ｂにおいて、簡略化のために、補間によるウィンドウ関数３７０の生成は示していない。

オーディオ副帯値ブロック３２０は、最初に、図２ｂ中矢印４４０で示すように、計算機３１０によって周波数領域から時間領域に変換される。その結果生じる中間時間領域サンプルブロック３４０はブロック３４０−１，…，３４０−Ｔを含み、その後、図２ｂには図示されていないが、合成ウィンドウ処理部３６０によってウィンドウ処理される。詳しくは、フレーム３４０の中間時間領域サンプル列に合成ウィンドウ関数３７０のウィンドウ係数列を掛けることで、ウィンドウ処理後の中間時間領域サンプルのフレーム３８０を得る。このフレーム３８０は、ウィンドウ処理後の中間時間領域サンプルのブロック３９０−１，…，３９０−Ｔを含み、これらのブロックがまとまってウィンドウ処理後中間時間領域サンプルフレーム３８０を形成している。

本発明に係る合成フィルターバンク３００の図２ｂに示す実施形態において、その後、重複加算出力装置４００は、ブロック４１０の時間領域オーディオサンプルのそれぞれの指数のために、異なるフレーム３８０の一つのブロック３９０のウィンドウ処理後中間時間領域サンプルを加算することで、時間領域出力サンプルのブロック４１０を生成する。図２ｂに示すように、ブロック４１０の時間領域オーディオサンプルは、各オーディオサンプル指数のために、前述したように今回合成ウィンドウ処理部３６０によって処理されたフレーム３８０内のブロック３９０−１の一つのウィンドウ処理後時間領域サンプルと、フレーム３８０の直前に処理され、重複加算出力装置４００の記憶部に保存されているフレーム３８０−１内の第２ブロック３９０−２の中間時間領域サンプルを加算することによって得られる。図２ｂに示すように、以前に合成フィルターバンク３００によって処理されたさらなるブロック３９０（例えばフレーム３８０−２の３９０−３、フレーム３８０−３のブロック３９０−４、フレーム３８０−４のブロック３９０−５）のウィンドウ処理後中間時間領域サンプルを使用してもよい。フレーム３８０−２，３８０−３，３８０−４及びさらなるフレームは以前に合成フィルターバンク３００で処理されたものである。フレーム３８０−２はフレーム３８０−１の直前に処理され、フレーム３８０−３はフレーム３８０−２の直前に処理されたものである。

実施形態に使用されるような重複加算出力装置４００は、時間領域（出力）サンプルブロック４１０の各指数を求めるために、Ｔ個の異なるフレーム３８０，３８０−１，…，３８０−（Ｔ−１）からのＴ個の異なるウィンドウ処理された中間時間領域サンプルブロック３９０−１，…，３９０−Ｔを合計する。従って、処理された最初のＴ個のブロックとは別に、ブロック４１０の各時間領域（出力）サンプルはオーディオ副帯値のＴ個の異なるブロック３２０に基づいている。

本発明の一実施形態である図１に示す解析フィルターバンク１００の場合と同様に、合成ウィンドウ関数３７０の形のために、合成フィルターバンク３００は時間領域（出力）サンプルブロック４１０を素早く与えることができる。これはまた、ウィンドウ関数３７０の形の結果である。ウィンドウ係数の第１グループ４２０はより高いエネルギー値を有し、第２グループ４３０よりも少ないウィンドウ係数を有するので、合成ウィンドウ処理部３６０は、少なくとも第１グループ４２０のウィンドウ係数がフレーム３８０の要因となるように中間時間領域サンプルのフレーム３３０が満たされると、ウィンドウ処理後サンプルの「意味のある」フレーム３８０を与えることができる。第２グループ４３０のウィンドウ係数は、それらが小さいエネルギー値しか持っていないために、それらの影響は小さい。

従って、合成フィルターバンク３００は最初０に初期化され、原則的に、オーディオ副帯値のわずか数個のブロック３２０を受信しただけでブロック４１０を提供し始める。このように、合成フィルターバンク３００もまた、例えば対称合成ウィンドウ関数を有する合成フィルターバンクと比較してかなりの遅延低下を可能にする。

前述したように、図１，２ａに示す実施形態の計算機１７０，３１０は、それぞれブロック１８０，３２０の実数オーディオ副帯値を生成または処理する実数値計算機として実施可能である。これらの場合、計算機は例えば正弦関数または余弦関数等の調和振動関数に基づく実数値計算機であってもよい。また、複合値計算機も、計算機１７０，３１０として使用可能である。これらの場合、計算機は例えば複合指数関数または他の調和複合値関数に基づくものであってもよい。実数値振動または複合値振動の周波数は通常、オーディオ副帯値の指数に左右されるものである。オーディオ副帯値の指数は特定の副帯の帯域指数または副帯指数と称されることもある。さらに、周波数は対応する副帯の中心周波数と同じか、またはそれによって決まる。例えば、振動周波数に一定の因数を掛け、振動周波数が対応する副帯の中心周波数によって変化するようにするか、または両方の修正の組み合わせによって決まるようにしてもよい。

複合値計算機１７０，３１０は実数値計算機に基づき構成されてもよい。例えば、複合値計算機の有効な実施は、原則的に、複合値成分の実数部分及び仮想部分を表すフィルターバンクの余弦変調部分及び正弦変調部分両方のために使用できるものである。これは、例えば、修正ＤＣＴ−ＩＶ構造及び修正ＤＳＴ−ＩＶ構造に基づき余弦修正部分及び正弦修正部分の両方を提供できるということを意味する。また、別の実施において、ＦＦＴ（高速フーリエ変換）を随意に使用してもよい。複合変調計算機の実数部分と仮想部分の両方のために一つのＦＦＴ（高速フーリエ変換）が共通して使用されるか、または各変換のために別々のＦＦＴが使用される。

数学的説明
前述したようなさらなる遅延を生じさせない過去への８ブロックの重複部分と、ＭＤＣＴ（修正離散余弦変換）／ＭＤＳＴ（修正離散正弦変換）構造と同じ遅延を引き起こす未来への１ブロックの重複部分を有する解析フィルターバンク及び合成フィルターバンクの実施形態の一例について、以下に説明する。以下の例では、パラメータＴは１０である。

まず、複合変調低遅延解析フィルターバンクを説明する。図１に示すように、解析フィルターバンク１００は、解析ウィンドウ処理部１１０によって行われる解析ウィンドウ処理、及び計算機１７０によって行われる解析変換という変換ステップを実行する。解析ウィンドウ処理は以下の式に基づき行われる。

ｚ_i,nは、図１に示すフレーム１５０のブロック指数ｉ及びサンプル指数ｎに対応する（実数値の）ウィンドウ処理後のサンプルである。ｘ_i,nは、同じブロック指数ｉ及びサンプル指数ｎに対応する（実数値の）時間入力サンプルである。解析ウィンドウ関数１９０は、式（１）中、その実数値のウィンドウ係数ｗ（ｎ）で表わされ、ｎは式（１）で示される範囲におけるウィンドウ係数指数である。前述したように、パラメータＮは一つのブロック２２０，１３０，１６０，１８０内のサンプルの個数である。

解析ウィンドウ関数ｗ（１０Ｎ−１−ｎ）の偏角から、この解析ウィンドウ関数は合成ウィンドウ関数の逆転版つまり時間逆転版であることがわかり、合成ウィンドウ関数は実際ウィンドウ係数ｗ（ｎ）で表わされるものである。

図１の実施形態において計算機１７０で実行される解析変調は、以下の二つの式に基づいている。

ｋはスペクトル係数指数または帯域指数であり、以下の範囲である。

値Ｘ_Real,i,k及びＸ_Imag,i,kは、ブロック１８０のブロック指数ｉとスペクトル係数指数ｋに対応する複合値オーディオ副帯値の実数部分と仮想部分を示している。パラメータｎ₀は指数オプションを示し、以下の式で表されるものである。

このフィルターバンクに相当する複合変調低遅延合成フィルターバンクは、以下に説明するように、合成変調、合成ウィンドウ処理及び重複加算という変換ステップを実行する。

合成変調は以下の式に基づき行われる。

ｘ’_i,nは、サンプル指数ｎ及びブロック指数ｉに相当するフレーム３３０の中間時間領域サンプルである。パラメータＮは、ブロック３２０，３４０，３９０，４１０の長さを示す整数であり、変換ブロック長、またはフレーム３３０，３８０のブロック構造のために前のブロックに対するオフセットとも称される。また、スペクトル係数指数ｋやオフセットｎ₀等の他の変数やパラメータも導入されている。

図２ａの実施形態において合成ウィンドウ処理部３６０によって実行される合成ウィンドウ処理は以下の式に基づいている。

ｚ’_i,nは、サンプル指数ｎ及びフレーム３８０のブロック指数ｉに対応する中間時間領域サンプルの値である。

重複加算の変換ステップは以下の式に基づいて行われる。

ｏｕｔ_i,nは、サンプル指数ｎ及びブロック指数ｉに対応する時間領域（出力）サンプルを示す。従って、式（８）は、図２ｂの下部に示す重複加算出力装置４００で実行されるような重複加算処理を説明している。

しかし、本発明に係る実施形態はオーディオ信号処理を可能にする複合変調低遅延フィルターバンクに限るものではない。超低遅延オーディオ符号化のための実数値用の低遅延フィルターバンクもまた実施可能である。例えば、式（２），（６）はその余弦部分によって、解析変調及び合成変調への余弦の影響は、ＭＤＣＴのそれと同等のものであることを示している。原則として、設計方法により、ＭＤＣＴの時間に関する両方向への延長が可能であるが、Ｔ個のブロックのそれぞれがＮ個のサンプルを有している場合、ここでは過去へのＥ（＝Ｔ−２）個のブロックの延長のみが可能である。ＮチャンネルまたはＮ帯域解析フィルターバンク内の帯域ｋとブロックｉの周波数係数Ｘ_i,kは、以下のように集約される。

ｋは式（４）によって定義されるスペクトル係数指数である。ここでもまた、ｎはサンプル指数であり、Ｗａは解析ウィンドウ関数である。

完全を期するため、複合変調低遅延解析フィルターバンクの前記数学的説明は、余弦関数を複合値指数関数に交換することで、式（９）のような集約形態として提示する。より正確には、前記の定義及び変数により、式（１），（２），（３），（５）は以下のように集約され、延長される。

式（２），（３）と比較して、過去への８ブロックの延長が変数Ｅ（＝８）に置き換えられた。

合成変調及び合成ウィンドウ処理のステップは、式（６），（７）のような複雑な場合に関して説明したように、実数値の合成フィルターバンクの場合に集約可能である。ウィンドウ処理後時間領域サンプルフレーム３８０は復調ベクトルとも称されるものであるが、これは以下の式（１１）によって与えられる。

ｚ’_i,nは、帯域指数ｉ及びサンプル指数ｎに対応するウィンドウ処理後の時間領域サンプルである。サンプル指数ｎは以下の範囲の整数である。

ｗ_s（ｎ）は合成ウィンドウであり、式（９）の解析ウィンドウｗ_a（ｎ）と合致している。

重複加算の変換ステップは、以下の式で与えられる。

ｘ’ｉ，ｎは、再生された信号、正確に言えば、図２ａに示す重複加算出力装置４００によって与えられるブロック４１０の時間領域サンプルである。

複合値合成フィルターバンク３００のために、式（６），（７）は以下の式により、Ｅ（＝８）個のブロックの過去への延長に関して集約され、一般化される。

ｊ＝√（−１）は仮想単位である。式（１３）は式（８）の一般化された形態を示し、また、複合値の場合にも有効なものである。

式（１４）と式（７）を直接比較すると、式（７）のウィンドウ関数ｗ（ｎ）は式（１４）の合成ウィンドウ関数ｗ_s（ｎ）と同じである。前述したように、解析ウィンドウ関数係数ｗ_a（ｎ）を有する式（１０）と式（１）を比較すると、解析ウィンドウ関数は式（１）の合成ウィンドウ関数の時間逆転版であることがわかる。

図１の解析フィルターバンク１００及び図２ａの合成フィルターバンクのどちらにおいても、一方では遅延、他方ではオーディオ処理の質との間のトレードオフに関してかなりの向上が見られるので、これらのフィルターバンク１００，３００はしばしば低遅延フィルターバンクと称される。これらの複合値用のものは複合値低遅延フィルターバンクと称されることもあり、ＣＬＤＦＢと省略される。ＣＬＤＦＢという言葉は、複合値フィルターバンクに限らず実数値フィルターバンクにも使用される場合がある。

以上検討したような数学的背景が示すように、ここで提案する低遅延フィルターバンクを実施するための構造は、ＭＰＥＧ−４標準から知られており、延長重複を使用するＭＤＣＴまたはＩＭＤＣＴ（逆転ＭＤＣＴ）構造を利用するものである。追加の重複部分は、ＭＤＣＴのようなコアの右側だけでなく左側にも、ブロックごとに付け加えることができる。ここでは、（合成フィルターバンクの場合）右側への延長のみが行われ、この延長は過去のサンプルからのみであり、故にさらなる遅延を引き起こすことはない。

式（１），（２），（１４）を参照すると、この処理はＭＤＣＴまたはＩＭＤＣＴの処理と非常に似ていることがわかる。修正解析ウィンドウ関数と修正合成ウィンドウ関数を含むわずかな修正により、ＭＤＣＴまたはＩＭＤＣＴは、多層重複部を扱うことができ、その遅延に関して非常に融通性のある変調フィルターバンクにまで拡大される。例えば、複合版を示す式（２），（３）は、原則的に、単に余弦変調に正弦変調を付加することで得られる。

補間
図１，２ａに関して説明したように、解析ウィンドウ処理部１１０と合成ウィンドウ処理部３６０、またはフィルターバンク１００，３００は、各時間領域オーディオサンプルに個々のウィンドウ係数を掛けることで、それぞれの時間領域サンプルフレームをウィンドウ処理するように構成されている。つまり、式（１）、（７），（９），（１０），（１１），（１４）が示しているように、各時間領域サンプルは、（個々の）ウィンドウ係数で掛けられる。従って、それぞれのウィンドウ関数のウィンドウ係数の個数は、概して時間領域オーディオサンプルの個数と等しい。

しかし、ある実施状況においては、より少ない第１の個数の係数を有し、それぞれの時間領域オーディオサンプルフレームまたは列をウィンドウ処理するのに使用される実際のウィンドウ関数に比べて、より多い第２の個数のウィンドウ係数を有するウィンドウ関数を使用することの方が良い場合もある。これは、例えば特定の実施のために必要なメモリー容量がコンピュータ処理の能率よりも重要である場合に薦められる。ウィンドウ係数のダウンサンプリングが有効である別の場合は、例えばＳＢＲ（スペクトル帯域再生）システムの構造に用いられる、いわゆる二種速度方法の場合である。ＳＢＲの概念は、図５，６を参照して後述する。

このような場合、解析ウィンドウ処理部１１０または合成ウィンドウ処理部３６０は、また、それぞれのウィンドウ処理部１１０，３６０に与えられた時間領域オーディオサンプルをウィンドウ処理するのに使用される各ウィンドウ関数が、より多くの（第２の数の）ウィンドウ係数を有するより大きなウィンドウ関数のウィンドウ係数の補間により導き出されるように、構成されている。

この補間は、例えば直線的、多項式的またはスプラインに基づく補間である。例えば、直線的補間の場合だけでなく多項式的またはスプラインに基づく補間の場合にも、それぞれのウィンドウ処理部１００，３６０は、ウィンドウ関数の一つのウィンドウ係数を得るために、より大きいウィンドウ関数のウィンドウ係数列に応じた、より大きなウィンドウ関数の二つの連続したウィンドウ係数に基づき、ウィンドウ処理に使用されるウィンドウ関数のウィンドウ係数を補間可能であってもよい。

特に時間領域オーディオサンプルとウィンドウ係数の個数が偶数である場合、前述したような補間の実行はオーディオの質の点でかなりの向上をもたらす。例えば、フレーム１２０，３３０のいずれか一つの時間領域オーディオサンプルが偶数Ｎ・Ｔである場合、直線的補間等の補間を実行しなければ、それぞれの時間領域オーディオサンプルのさらなる処理の間に深刻なエイリアシング効果が起こることになる。

図３は、Ｎ・Ｔ／２個の時間領域オーディオサンプルを含むフレームの場合に使用されるべきウィンドウ関数（解析ウィンドウ関数または合成ウィンドウ関数）に基づく直線的補間の例を示す。メモリーの制限や他の詳細な実施状況により、ウィンドウ関数自身のウィンドウ係数はメモリーに保存されず、Ｎ・Ｔ個のウィンドウ係数を含むより大きいウィンドウ関数が適当なメモリーに保存されているかまたは何らかの方法で入手可能である。図３の上部グラフは、０〜Ｎ・Ｔ−１の間のウィンドウ係数指数ｎの関数として、それに相当するウィンドウ係数ｃ（ｎ）を示す。

より多くの数のウィンドウ係数を有するウィンドウ関数の二つの連続したウィンドウ係数の直線的補間に基づき、図３の上部グラフに示すように、補間されたウィンドウ関数は以下の式により算出される。

Ｎ・Ｔ／２個の時間領域オーディオサンプルを有するフレームに応用されるウィンドウ関数の補間されたウィンドウ係数ｃｉ（ｎ）の個数は、ウィンドウ係数の数の半分である。

これをさらに説明するために、図３の上部に、ウィンドウ係数４５０−０，…，４５０−７が示され、これらはウィンドウ係数ｃ（０），…，ｃ（７）に相当するものである。これらのウィンドウ係数及びウィンドウ関数のさらなるウィンドウ係数に基づき、式（１５）を使用して、図３の下部に示すような補間後のウィンドウ関数のウィンドウ係数ｃｉ（ｎ）を導き出す。例えば、ウィンドウ係数４５０−２，４５０−３に基づき、図３の矢印４７０で示されているように、ウィンドウ係数４６０−１が式（１５）より生成される。同様に、補間後のウィンドウ関数のウィンドウ係数４６０−２は、図３の上部に示すウィンドウ関数のウィンドウ係数４５０−４，４５０−５に基づき算出される。図３はさらなるウィンドウ係数ｃｉ（ｎ）の生成を示している。

ウィンドウ関数の補間ダウンサンプリングにより達成できるエイリアシング解消を説明するために、図４に、例えばＭＤＣＴに使用され得る正弦ウィンドウ関数の場合のウィンドウ係数の補間を示す。簡略化のために、このウィンドウ関数の左半分と右半分を重ねて示している。図４に示されているものは、８個のサンプル長を有するＭＤＣＴのためのたった２・４の個のウィンドウ係数またはポイントしか含まない簡単な正弦ウィンドウである。

図４は、正弦ウィンドウの前半の４個のウィンドウ係数４８０−１，４８０−２，４８０−３，４８０−４及び正弦ウィンドウの後半の４個のウィンドウ係数４９０−１，４９０−２，４９０−３，４９０−４を示す。ウィンドウ係数４９０−１，…，４９０−４はウィンドウ係数指数５，…，８に対応する。ウィンドウ係数４９０−１，…，４９０−４はウィンドウ関数長さの後半に相当し、実指数を得るために、指数にＮ’＝４が与えられる。

前述したようにエイリアシング効果の低下または解消を達成するために、ウィンドウ係数は可能な限り以下の条件を満たす。

条件（１６）に近づけば近づくほど、エイリアシングの低下または解消が良くなる。

半分の数のウィンドウ係数を有する新しいウィンドウ関数がウィンドウ関数の左半分のために決定されるとすると、以下の問題が生じる。ウィンドウ関数は偶数個のウィンドウ係数（偶数個のダウンサンプリング）を含むという事実のために、図３に示すような補間体系を使用しないでも、ウィンドウ係数４８０−１，４８０−３または４８０−２，４８０−４が元のウィンドウ関数または元のフィルターのただ一つのエイリアシング値に相当する。

このことは、スペクトルエネルギーの不均衡な割合と対応するウィンドウ関数の中心周波数（質量の中心）の非対称な再分配をもたらす。図４のウィンドウ係数ｗ（ｎ）のための補間式（１５）に基づき補間された値Ｉ１，Ｉ２はエイリアシングの条件（１６）をよりよく満たし、従って処理されたオーディオデータの質のかなりの向上をもたらす。

しかし、より精巧な補間体系、例えばスプラインに基づく補間体系またはそれと同様の別の補間体系を使用することにより、条件（１６）をさらによりよく満たすウィンドウ係数が得られる。多くの場合、直線的な補間が十分な成果をもたらし、速く能率的な実施を可能にする。

ＳＢＲ−ＱＭＦフィルターバンク（ＱＭＦ＝方形ミラーフィルター）を使用した典型的なＳＢＲシステムの場合には、このＳＢＲ−ＱＭＦプロトタイプフィルターは奇数個のプロトタイプフィルター係数を含むので、直線的補間もまた他の補間体系も実行される必要がない。このことは、ＳＢＲ−ＱＭＦプロトタイプフィルターが、ＳＢＲ−ＱＭＦプロトタイプフィルターの対称性が全く損なわれないようにダウンサンプリングが実施され得る最大値を有していることを意味する。

図５，６では、解析フィルターバンク及び合成フィルターバンク両方の形での本発明に係る実施形態の可能な応用を説明する。一つの重要な応用分野はＳＢＲシステムまたはＳＢＲ装置（ＳＢＲ＝スペクトル帯域再生）である。しかし、本発明はさらに他の分野でも応用できる。他の分野とは、空間的オーディオ対象符号化、低遅延パラメータのステレオ符号化、低遅延空間的／サラウンド符号化、フレーム損失隠蔽、エコー消去または他の同様の応用等の、スペクトル修正（ゲイン修正または均一化）の必要性がある分野のことである。

ＳＢＲの背後にある基本的な考えは、通常、同じ信号の、高周波域（いわゆる高帯域信号と称される）の特徴と低周波域（低帯域または低帯域信号と称される）の特徴との間に関連性があるというものである。従って、元の入力信号の高帯域の再生は、低帯域から高帯域への置換によって、より近似的に行われ得る。

置換に加えて、高帯域の再生は、ゲイン調整を含むスペクトルエンヴィロープの整形を含む。この工程は、概して元の入力信号の高帯域スペクトルエンヴィロープの送信によって制御される。置換だけでは十分ではないと思われる場合、エンコーダから送られるさらなるガイダンス情報が、オーディオ材料を扱うための逆転フィルターや正弦加算機等のさらなる合成モジュールを制御する。対応するパラメータは、ノイズの合計のためのパラメータ「ノイズ高帯域」と正弦加算のためのパラメータ「調性高帯域」を含む。これらのガイダンス情報は通常ＳＢＲデータと称される。

ＳＢＲ処理は、エンコーダでの前処理及びデコーダでの後処理による従来の波形またはコーデックと組み合わされてもよい。ＳＢＲはオーディオ信号の高周波部分を非常に低コストで符号化し、オーディオコーデックは信号の低周波部分を符号化するのに使用される。

エンコーダ側において、元の入力信号が解析され、高帯域スペクトルエンヴィロープ及び低帯域に対するそれの特徴が符号化され、その結果得られるＳＢＲデータに低帯域のためのコーデックからのビットストリームで多重化される。デコーダ側において、ＳＢＲデータはまず単一化される。復号化工程は一般的にいくつかのステップから成り立っている。まず、コアデコーダが低帯域を生成し、次に、ＳＢＲデコーダが、スペクトル帯域再生をガイドするために、復号化されたＳＢＲデータを使用して後処理装置として動作する。そして、全帯域出力信号が得られる。

できる限り高い符号化能率を得るために、そしてコンピュータ処理の複雑性を低く抑えるために、ＳＢＲ機能の高いコーデックがいわゆる二種速度システムとして実行されることがよくある。二種速度とは、帯域限定のコアコーデックが、外部オーディオサンプリング速度の半分の速度で動作することを意味する。対照的に、ＳＢＲ部分はサンプリング周波数全体において処理される。

図５はＳＢＲシステム５００の概略ブロック図を示す。ＳＢＲシステム５００は、例えばＡＡＣ−ＬＤエンコーダ（ＡＡＣ−ＬＤ＝高度オーディオ低遅延コーデック）５１０及びＳＢＲエンコーダ５２０を含み、処理されるべきオーディオデータはそれらに並列的に与えられる。ＳＢＲエンコーダ５２０は解析フィルターバンク５３０を含み、それは、図５中、ＱＭＦ解析フィルターバンクとして示されている。解析フィルターバンク５３０は、ＳＢＲシステム５００に与えられるオーディオ信号に基づき、副帯に相当する副帯オーディオ値を提供することができる。これらの副帯オーディオ値はＳＢＲパラメータ抜粋モジュール５４０に送られ、このモジュール５４０は、例えば高帯域のためのスペクトルエンヴィロープ、高帯域ノイズパラメータ及び高帯域調性パラメータを含む前述したようなＳＢＲデータを生成する。これらのＳＢＲデータはＡＡＣ−ＬＤエンコーダ５１０に送られる。

ＡＡＣ−ＬＤエンコーダ５１０は、図５中、二種速度エンコーダとして示されている。換言すれば、エンコーダ５１０は、そこに入力されるオーディオデータのサンプリング周波数と比較すると、その半分の周波数で動作する。これを容易にするために、ＡＡＣ−ＬＤエンコーダ５１０は、ダウンサンプリング部５５０を有し、それは、例えばナイキスト−シャノン理論を破ったために生じる歪曲を避けるために、随意にローパスフィルターを有していてもよい。ダウンサンプリング部５５０の出力としてのダウンサンプルされたオーディオデータは、それからＭＤＣＴフィルターバンクという形態のエンコーダ５６０（解析フィルターバンク）に送られる。エンコーダ５６０によって出力される信号は、その後、量子化・符号化部５７０において量子化、符号化される。さらに、ＳＢＲパラメータ抜粋モジュール５４０によって生成されるＳＢＲデータもまたビットストリームを得るために符号化され、このビットストリームはその後ＡＣＣ−ＬＤエンコーダ５１０から出力される。量子化・符号化部５７０は、例えば人の耳の聴覚特性に応じてデータを量子化する。

ビットストリームは、その後、このビットストリームが送られるデコーダ側の一部であるＡＡＣ−ＬＤデコーダ５８０に与えられる。ＡＡＣ−ＬＤデコーダは復号化・復量子化部５９０を含み、これは、ビットストリームからＳＢＲデータを抜粋し、量子化されたオーディオ信号を低帯域の周波数領域に戻す。その後、低帯域データは合成フィルターバンク６００（逆転ＭＤＣＴフィルターバンク）に送られる。逆転ＭＤＣＴ部（ＭＤＣＴ^-1）６００は、時間信号を得るために、与えられた信号を周波数領域から時間領域に変換する。この時間領域信号はその後ＳＢＲデコーダ６１０に与えられる。ＳＢＲデコーダ６１０は、解析フィルターバンク６２０を含み、これは、図５中、ＱＭＦ解析フィルターバンクとして示されている。

解析フィルターバンク６２０は、そこに与えられた低帯域を表す時間信号のスペクトル解析を行う。これらのデータはその後、ＨＦ生成部とも称される高周波生成部６３０に送られる。ＡＡＣ−ＬＤデコーダ５８０及びその復号化・復量子化部５９０によって与えられたＳＢＲ信号に基づき、ＨＦ生成部６３０は解析フィルターバンク６２０により与えられた低帯域信号から高帯域信号を生成する。低帯域信号、高帯域信号のどちらも、その後合成フィルターバンク６４０に送られ、それらの信号は周波数領域から時間領域に変換される。そして、ＳＢＲシステム５００からの時間領域オーディオ出力信号が得られる。

完全を期するために、多くの場合、ＳＢＲシステム５００は図５に示すようには実施されてはいないことを明記しておく。より正確には、ＡＡＣ−ＬＤエンコーダ５１０及びＳＢＲエンコーダ５２０は、通常、エンコーダ側に配置され、エンコーダ側は、通常、ＡＡＣ−ＬＤデコーダ５８０及びＳＢＲデコーダ６１０を含むデコーダ側とは分かれて設置されている。換言すれば、図５に示すシステム５００は、本来的に二つのシステム、つまり前記エンコーダ５１０，５２０を含むエンコーダと前記デコーダ５８０，６１０を含むデコーダとの連結を示すものである。

解析フィルターバンク１００及び合成フィルターバンク３００という形での本発明に係る実施形態は、例えば、図５に示すシステム５００において、解析フィルターバンク５３０，６２０及び合成フィルターバンク６４０の代わりに用いてもよい。つまり、システム５００のＳＢＲ部品である合成フィルターバンクと解析フィルターバンクは、例えば本発明のそれぞれ相当する実施形態に置き換えられる。また、ＭＤＣＴ５６０と逆転ＭＤＣＴ６００も、それぞれ低遅延解析フィルターバンクと合成フィルターバンクとに置き換えられる。このような置換がすべて行われた場合、いわゆる超低遅延ＡＡＣコーデック(ＡＡＣコーダ・デコーダ)が実現できる。

この超低遅延ＡＡＣ（ＡＡＣ−ＥＬＤ）は、ＳＢＲをＡＡＣ−ＬＤと共に用いることにより、ＡＡＣ−ＬＤ（低遅延高度オーディオコーデック）の低遅延特徴とＨＥ−ＡＡＣ（高能率高度オーディオコーデック）の高い符号化能率を組み合わせようとするものである。ＳＢＲデコーダ６１０は、この場合、完全な解析フィルターバンクと合成フィルターバンク６４０を含むコアデコーダ５８０の後に設置される後処理装置として機能する。故に、ＳＢＲデコーダ６１０の部品はさらなる復号遅延を生じさせ、これは、図５中、部分６２０，６３０，６４０への斜線で示されている。

ＳＢＲシステム５００の実施の多くの場合、０ｋＨｚから概して５〜１５ｋＨＺの低周波域または低帯域は、コアコーデックと称される波形コーダを使用して符号化される。コアコーデックは、例えばＭＰＥＧオーディオコーデックのうちの一つである。さらに、高周波域または高帯域の再生は低帯域の転移によって行われる。ＳＢＲとコアコーダとの組み合わせは、多くの場合、二種速度システムとして実施され、このシステムでは、基本的なＡＡＣエンコーダ／デコーダは、ＳＢＲエンコーダ／デコーダのサンプリング速度の半分の速度で動作する。

制御データの大部分はスペクトルエンヴィロープ表示のために使用され、スペクトルエンヴィロープ表示は、できる限り小さいビットレートで最大限にＳＢＲ処理を制御できるように、変動時間周波数分解を有する。他の制御データは、主に、高帯域の調性−ノイズ率を制御するのに使用される。

図５に示すように、基本的なＡＡＣデコーダ５８０からの出力は一般的に３２チャンネルＱＭＦフィルターバンク６２０で解析される。そして、ＨＦ生成モジュール６３０は、存在する低帯域から高帯域までのＱＭＦ副帯を修正することによって高帯域を再生する。さらに、ビットストリームから得られる制御データ（ＳＢＲデータ）に基づき、副帯ごとに逆フィルタリングが行われる。エンヴィロープアジャスターは、再生された高帯域のスペクトルエンヴィロープを修正し、ノイズのようなさらなる部分を付加する。これにより、ビットストリームの制御データに応じたしなやかさが付け加えられる。全ての動作が周波数領域（ＱＭＦまたは副帯領域としても知られている）で行われ、デコーダ６１０の最後の段階は、時間領域信号を保持するためのＱＭＦ合成６４０である。例えば、１０２４個の時間領域サンプルのために、エンコーダ側のＱＭＦ解析が３２のＱＭＦ副帯システムで行われる場合、高周波再生は６４ＱＭＦ副帯を生じさせ、それに基づく合成は２０４８個の時間領域サンプルを生み出すことになり、比率が２のアップサンプリングが行われることになる。

また、コアコーダ５１０の遅延は、二種速度モードで元のサンプリング速度の半分の速度で動作することにより、倍加され、このことは、ＳＢＲと組み合わせたＡＡＣ−ＬＤの符号化及び復号化処理両方において遅延源が増すことになる。以下に、このような遅延源と、それらに関する遅延の最小化を検討する。

図６は、図５に示したシステムの簡易化されたブロック図である。図６は、ＳＢＲと低遅延フィルターバンクを使用する符号化／復号化処理における遅延源に焦点を当てたものである。図６を図５と比較すると、ＭＤＣＴ５６０と逆ＭＤＣＴ６００が、遅延最適化モジュール、いわゆる低遅延ＭＤＣＴ５６０’（ＬＤＭＤＣＴ）と低遅延逆ＭＤＣＴ６００’（ＬＤＩＭＤＣＴ）に置き換えられている。さらに、ＨＦ生成器６３０もまた遅延最適化モジュール６３０’に置き換えられている。

図６のシステムには、低遅延ＭＤＣＴ５６０’や低遅延逆ＭＤＣＴ６１０’とは別に、修正ＳＢＲフレーム・修正ＨＦ生成器６３０’が用いられている。コアエンコーダ／デコーダ５６０，６００のフレームとそれぞれのＳＢＲモジュールを異ならせることで遅延を避けるために、ＳＢＲフレーム生成器は４８０のフレーム長またはＡＡＣ−ＬＤの５１２個のサンプルに適合している。さらに、ＨＦ生成器６３０の可変時間グリッドは遅延の３８４のサンプルを含み、互いに隣接するＡＣ−ＬＤフレームに関するＳＢＲデータの拡散に関して制限されている。これにより、ＳＢＲモジュールにおいて未だ遅延源であるのはフィルターバンク５３０，６２０，６４０である。

図６はＡＡＣ−ＥＬＤコーデックの一部実施を示しているが、この場合、ＡＡＣ−ＬＤコアの低遅延フィルターバンクの使用と前述したＳＢＲ重複の除去を含む、いくらかの遅延最適化が行われたものである。さらなる遅延向上のために、残りのモジュールに関しても検討する必要がある。図６は、ＳＢＲとＬＤ−ＭＤＣＴとＬＤ−ＩＭＤＣＴと呼ばれる低遅延フィルターバンクを使用する符号化／復号化処理における遅延源を示している。図５とは対照的に、図６に示す全ての部分が遅延源であり、そのうち遅延最適化モジュールは斜線で示されている。その他のモジュールは、この時点では、低遅延のための最適化が行われていない。

図７ａは、解析フィルターバンク、またはそれに対応するオーディオ副帯チャンネルのオーディオ副帯値を生成する方法という形での本発明の一実施形態を説明するためのＣ−またはＣ＋＋−偽コードを含むフローチャートである。より正確には、図７ａは、３２帯域のための複合値解析フィルターバンクのフローチャートである。

前述したように、解析フィルターバンクは時間領域信号、例えば、コアコーダからの出力をＮ＝３２の副帯信号に分けるものである。複合値解析フィルターバンクの場合、そのフィルターバンクの出力、つまり副帯サンプルまたはオーディオ副帯値は、実数値フィルターバンクの場合と比較すると、複合値、つまり２の比率でオーバーサンプルされたものである。フィルタリングは以下に説明するステップを含み、一つのアレイｘ（ｎ）が正確に３２０個の時間領域サンプルを含むものである。アレイのサンプル指数ｎが高ければ高いほど、サンプルは古いものである。

本実施形態の方法がステップＳ１００で開始され、その後、最初にステップＳ１１０でアレイｘ（ｎ）のサンプルが３２個の位置分移動させられる。最も古い３２個のサンプルが廃棄され、ステップＳ１２０で、３２個の新しいサンプルが位置３１〜０に保存される。図７ａに示すように、入力される時間領域オーディオサンプルは、３１から０まで減少していく指数ｎで示される位置に保存される。これは、相当するフレームまたはベクトルに保存されたサンプルを時間逆転することになり、（同じ長さの）合成ウィンドウ関数に基づき解析ウィンドウ関数を得るためのウィンドウ関数の逆転がすでに行われたことになる。

ステップＳ１３０では、式（１５）に基づき係数ｃ（ｊ）の直線的補間を行うことにより、ウィンドウ係数ｃｉ（ｊ）が得られる。この補間は、Ｎ＝６４というブロックサイズ値（ブロック長または副帯値の数）及びＴ＝１０という１フレーム中のブロック数に基づいている。従って、補間後のウィンドウ関数のウィンドウ係数の指数は、式（１５）より、０〜３１９の範囲にある。ウィンドウ係数ｃ（ｎ）は、本明細書の付録１の表に示す。しかし、実施の詳細により、付録１，３の表に示す値に基づくウィンドウ係数を得るために、指数１２８〜２５５と指数３８４〜５１１に対応するウィンドウ係数に関して、符号変換（比率−１の掛け算）がさらに必要となる場合がある。

これらの場合、使用されるべきウィンドウ係数ｗ（ｎ）またはｃ（ｎ）は以下の式に基づき得られる。

符号変換関数ｓ（ｎ）は以下に基づいている。

ｎ＝０〜６３９であり、Ｗ_table（ｎ）は、付録の表に示す値である。

しかし、ウィンドウ係数は、例えば前述したような遅延低下のために付録１の表に基づき実施される必要はない。処理後のオーディオデータの質を保ちながらこの遅延低下を達成するために、または別のトレードオフを達成するために、０〜６３９の範囲のウィンドウ係数指数ｎのためのウィンドウ係数ｃ（ｎ）は付録２〜４のうちのいずれか一つに示されている関係を満たしていてもよい。付録１〜４の表は６４０個のウィンドウ係数を有するウィンドウ関数に応用されるものであるが、当然、３２０または６４０以外の別の個数のウィンドウ係数を有する他のウィンドウ関数も使用可能である。

ステップＳ１３０の直線的補間は、偶数個のウィンドウ係数を有するウィンドウ関数の場合、かなりの質の向上及びエイリアシング効果の低下または解消につながる。複合単位は、式（１），（２），（１６）のようなｊではなく、ｉ＝√（−１）によって示されている。

ステップＳ１４０では、アレイｘ（ｎ）のサンプルは補間後のウィンドウ係数ｃｉ（ｎ）で素子ごとに掛け算される。

ステップＳ１５０では、６４個の素子を有するアレイｕ（ｎ）を生成するために、ウィンドウ処理後のサンプルが図７ａのフローチャートに示されている式に基づき合計される。ステップＳ１６０では、３２個の新しい副帯サンプルまたはオーディオ副帯値Ｗ（ｋ，１）がマトリックス処理Ｍｕにより算出され、マトリックスＭの素子は以下の式で与えられる。

ｅｘｐ（）は複合指数関数を示し、前述したように、ｉは仮想単位である。フローチャートの循環がステップＳ１７０で終わる前に、各副帯値Ｗ（ｋ，１）（＝Ｗ［ｋ］［ｌ］）が出力され、それは指数ｋを有する副帯の副帯サンプルｌに相当する。換言すれば、図７ａのフローチャートの一巡の間に、それぞれが一つのフィルターバンク副帯からの出力を表す３２個の複合副帯値が生成される。

図７ｂは、１０ブロック１６０−１、…，１６０−１０のウィンドウ処理後の時間領域オーディオサンプルｚ（ｎ）を含むウィンドウ処理後の時間領域オーディオサンプルフレーム１５０を、フレーム１５０のブロックを二つずつ、５回合算することでベクトルｕ（ｎ）に分解するステップＳ１５０を示している。この分解または再構成は素子ごとに行われ、１６０−１、１６０−３，１６０−５，１６０−７，１６０−９の各ブロック内の同じサンプル指数に対応するウィンドウ処理後の時間領域オーディオサンプルが合計され、ベクトルｕ（ｎ）の第１ブロック６５０−１内に対応する値が得られる。ステップＳ１５０では、同様に、１６０−２，１６０−４、１６０−６，１６０−８，１６０−１０のブロックに基づき、ベクトルｕ（ｎ）のブロック６５０−２内に対応する素子が得られる。

解析フィルターバンクという形での本発明に係る別の実施形態は、６４帯域複合低遅延フィルターバンクとして実施できるものである。この複合低遅延フィルターバンクの解析フィルターバンクとしての処理は、基本的に図７ａを参照して説明した解析フィルターバンクと同様のものである。図７ａに関して説明した処理と類似であり基本的に同じであるので、ここでは、６４副帯のための複合解析フィルターバンクの、図７ａに関して説明した３２帯域のための複合解析フィルターバンクとの違いについて概略的に説明する。

図７ａに示すような解析フィルターバンクを含む３２副帯のものと比較して、６４副帯解析フィルターバンク６４０の場合、フレームｘ（ｎ）のベクトルは０〜６３９の指数を有する素子を含む。従って、ステップＳ１１０は、アレイｘ（ｎ）のサンプルが６４個の位置分移動させられるように、変更される。ステップＳ１２０において、３２個ではなく６４個の新しいサンプルが位置６３〜０に保存される。図７ｃに示すように、入力されてくる時間領域オーディオサンプルは６３〜０まで減少する指数ｎに対応する位置に保存される。これは、相当するフレームまたはベクトルに保存されたサンプルを時間逆転することになり、（同じ長さの）合成ウィンドウ関数に基づき解析ウィンドウ関数を得るためのウィンドウ関数の逆転がすでに行われたことになる。

フレームｘ（ｎ）のベクトルの素子のウィンドウ処理に使用されるウィンドウｃ（ｎ）は概して６４０個の素子を含んでいるので、ウィンドウ処理されたウィンドウｃｉ（ｎ）を得るためのウィンドウ関数の直線的補間のステップＳ１３０は省略できる。

そして、ステップＳ１４０においては、ウィンドウ係数列ｃ（ｎ）を使用してアレイｘ（ｎ）のサンプルの掛け算またはウィンドウ処理が行われる。ウィンドウ係数列ｃ（ｎ）は付録１の表中の値に基づくものである。ウィンドウ係数ｃ（ｎ）が合成ウィンドウ関数のものである場合、アレイｘ（ｎ）のウィンドウｃ（ｎ）によるウィンドウ処理または掛け算は以下の式に応じて行われる。

ｎ＝０，…，６３９である。ここでもまた、ウィンドウ関数の低遅延特性を達成するために、必ずしも正確に付録１の表に示す値に基づくウィンドウ係数に応じたウィンドウ関数を採用する必要はない。多くの応用において、質と遅延の低下との間の許容できるトレードオフを達成するためには、ウィンドウ係数が付録２〜４の表のうちのいずれかに示されている関係を満たすものであれば十分である。しかし、実施の詳細によっては、付録１〜３の表に示されている値に基づくウィンドウ係数を得るために、指数１２８〜２５５，３８４〜５１１に対応するウィンドウ係数に関し、式（１６ａ），（１６ｂ）に基づく符号変換（比率−１の掛け算）がさらに必要となる場合がある。

図７ａに示すフローチャートのステップＳ１５０は、１２８個の素子を有するアレイｕ（ｎ）を生成するために、以下の式（１９）に基づくフレームｚ（ｎ）のベクトルのサンプルの合計に置き換えられる。

そして、図７ａのステップＳ１６０は、６４個の新しい副帯サンプルがマトリクス処理Ｍｕに基づき計算されるステップに置き換えられる。このマトリクス処理において、マトリクスＭのマトリクス素子は以下の式によって与えられる。

式（２０）中、ｅｘｐ（）は複合指数関数を示し、ｉは前述したように仮想単位である。

図７ｃは、３２副帯チャンネルのための実数値解析フィルターバンクという形での本発明に係る実施形態のフローチャートを示している。図７ｃに示す実施形態は、図７ａに示す実施形態とは重要な違いはない。これら二つの実施形態の間の主な違いは、新しい３２個の複合値副帯オーディオ値を計算するステップＳ１６０が、図７ｃにおいては、３２個の実数値副帯オーディオサンプルがマトリクス処理Ｍ_rｕに基づき計算されるステップＳ１６２に置き換えられていることである。マトリクスＭ_rの素子は以下の式によって与えられる。

従って、フローチャートの一巡は３２個の実数値副帯サンプルを生成し、Ｗ（ｋ、ｌ）は、副帯ｋの副帯オーディオサンプルｌに相当する。

実数値解析フィルターバンクは、図５に示すように、例えばＳＢＲシステムの低電源モード構造に使用され得る。ＳＢＲ装置の低電源モードは、主に実数値フィルターバンクが使用されているという点で、高性能ＳＢＲ装置とは異なっている。これは、仮想部分の計算を必要としないので、２の比率でコンピュータ処理の複雑さ及びコンピュータ処理の手間を低減させ、単位時間あたりの処理数は基本的に２の比率で減じられる。

本発明によって提案される新たなフィルターバンクはＳＢＲシステムの低電源モードにも十分適合するものである。従って、本発明のフィルターバンクを使用すれば、ＳＢＲシステムは、通常モードつまり複合フィルターバンクを使用する高性能モード及び実数値フィルターバンクを使用する低電源モードのどちらにおいても動作可能である。実数値フィルターバンクは、例えば実数値（余弦変調によるもの）のみを使用し、仮想値（正弦変調によるもの）を省略することにより、複合フィルターバンクから導き出されるものであってもよい。

図８ａは、６４個の副帯チャンネルのための複合値合成フィルターバンクという形での本発明の別の例に基づくフローチャートを示している。前述したように、ＳＢＲ処理された副帯信号の合成フィルタリングは、６４個の副帯のための合成フィルターバンクを使用して行われる。このフィルターバンクからの出力は、図１に関して説明したように、１ブロックの実数値時間領域サンプルである。この処理は図８ａのフローチャートによって説明され、図８ａはまた、時間領域オーディオサンプルを生成する方法という形の例を示すものである。

合成フィルタリングは、開始（ステップＳ２００）後、以下のようなステップを含み、一つのアレイｖは１２８０個のサンプルを含む。ステップＳ２１０において、アレイｖのサンプルは１２８個の位置分移動させられ、最も古い１２８個のサンプルが廃棄される。ステップＳ１２０では、６４個の新しい複合値オーディオ副帯サンプルがマトリクスＮによって掛けられ、マトリクス素子Ｎ（ｋ、ｎ）は以下の式によって与えられる。

式中、ｅｘｐ（）は複合指数関数を示し、ｉは仮想単位を示す。図８ａに示すように、この処理の出力の実数部分は、アレイｖの位置０〜１２７に保存される。

ステップＳ２３０において、今や時間領域であるサンプルが図８ａに示されている式に基づきアレイｖから抜粋され、６４０個の素子を有するアレイｇ（ｎ）が生成される。ステップＳ２４０では、アレイｗを生成するために、アレイｇの時間領域の実数値サンプルをウィンドウ係数ｃ（ｎ）で掛ける。これらのウィンドウ係数ｃ（ｎ）は、付録１の表に示されている値に基づくものである。

しかし、前述したように、ウィンドウ係数は必ずしも正確に付録１の表によって与えられる値である必要はない。異なる比較例においては、付録２〜４の表のいずれかに示されている関係を満足するウィンドウ係数であれば、合成フィルターバンクの望ましい低遅延特性を達成するのに十分である。さらに、解析フィルターバンクに関して説明したように、合成フィルターバンクの構造に他のウィンドウ係数が使用されてもよい。しかし、実施の詳細により、付録１〜３の表によって与えられる値に基づくウィンドウ係数を得るために、指数１２８〜２５５，３８４〜５１１に対応するウィンドウ係数に関する符号変換（比率−１の掛け算）がさらに必要となる場合がある。

図８ａのフローチャートの一巡がステップＳ２６０で終了する前に、ステップＳ２５０で、このフローチャートの最後のステップとして示されている式に基づくアレイｗ（ｎ）からのサンプルの合計によって、６４個の新しい出力サンプルが算出される。図８ａに示すフローチャートにおいて、Ｘ［ｋ］［ｌ］（＝Ｘ（ｋ，ｌ））は指数ｋを有する副帯のオーディオ副帯値ｌに相当する。図８ａに示すような新たな一巡は、その出力として、６４個の時間領域実数値オーディオサンプルを生成する。

６４個の帯域のための複合値解析フィルターバンクの図８ａに示すような実施は、図２ｂに示す実施形態に関して説明したようないくつかの記憶領域を含む重複・加算バッファを必要としない。ここでは、重複・加算バッファはベクトルｖ，ｇに「かくれて」いる。ベクトルｇはベクトルｖに保存された値に基づき計算される。重複・加算バッファは、指数が１２８よりも大きいこれらのベクトルの構造内で実現され、その結果、値は以前のブロックからのものと同じである。

図８ｂは、６４個の実数値オーディオ副帯チャンネルのための実数値合成フィルターバンクのフローチャートを示している。図８ｂに係る実数値合成フィルターバンクは、低電源ＳＢＲ装置の場合、ＳＢＲフィルターバンクとして実施され得る。

図８ｂのフローチャートは、主にステップＳ２２２が図８ａのステップＳ２２０に取って代わっているという点で、図８ａのフローチャートとは異なっている。ステップＳ２２２では、６４個の新しい実数値オーディオ副帯値がマトリクスＮ_rで掛け算され、このマトリクスの素子Ｎ_r（ｋ，ｎ）は以下の式によって与えられる。

この処理の出力は、ここでもまた、アレイｖの位置０〜１２７に保存される。

これらの変更以外に、低電源ＳＢＲモードのための実数値合成フィルターバンクの場合の図８ｂに示すフローチャートは、高性能ＳＢＲモードのための複合値合成フィルターバンクの場合の図８ａに示すフローチャートとはほとんど違いがない。

図８ｃは、ダウンサンプルされた複合値合成フィルターバンク、及び例えば高性能ＳＢＲ装置に採用される適当な方法という形での本発明の一実施形態に係るフローチャートを示している。より正確には、図８ｃに示す合成フィルターバンクは、３２個の副帯チャンネルのための複合値オーディオ副帯値を処理可能な複合値合成フィルターバンクに関連するものである。

ＳＢＲ処理副帯信号のダウンサンプル合成フィルタリングは、図８ｃに示す３２チャンネルの合成フィルターバンクを使用して行われる。このフィルターバンクからの出力は、一ブロックの実数値時間領域サンプルである。この処理は図８ｃのフローチャートに示されている。合成フィルタリングは、開始（ステップＳ３００）後、以下のステップを含み、一つのアレイｖは６４０個の実数値時間領域サンプルを含む。

ステップＳ３１０において、アレイｖのサンプルは６４個の位置分移動させられ、最も古い６４個のサンプルが廃棄される。そして、ステップＳ３２０では、６４個の新しい複合値副帯サンプルまたは複合値オーディオ副帯値がマトリクスＮで掛け算され、このマトリクスの素子は以下の式によって与えられる。

式中、ｅｘｐ（）は複合値指数関数を示し、ｉは仮想単位である。この処理の出力の実数部分はアレイｖの位置０〜６３に保存される。

ステップＳ３３０では、サンプルが図８ｃのフローチャートに示されている式に基づきベクトルｖから抜粋され、３２０個の素子を有するアレイｇが生成される。ステップＳ３４０では、式（１５）に基づく係数ｃ（ｎ）の直線的補間により、補間されたウィンドウ関数ｃ（ｎ）が得られる。ここでもまた、指数ｎは０〜３１９（式（１５）に対してＮ＝６４，Ｔ＝１０）の範囲にある。前述したように、ウィンドウ関数ｃ（ｎ）の係数は付録１の表に示されている値に基づくものである。また、前述したような低遅延特性を得るためには、ウィンドウ経緯数が必ずしも正確に付録１の表に示されている数値である必要はない。ウィンドウ係数ｃ（ｎ）が付録２〜４に示されている少なくともいずれかの関係を満たすものであれば十分である。しかし、実施の詳細により、付録１〜３の表に示されている値に基づくウィンドウ係数を得るために、指数１２８〜２５５，３８４〜５１１に相当するウィンドウ係数に関する式（１６ａ），（１６ｂ）に基づく符号変換（比率−１の掛け算）がさらに必要となる場合がある。当然、本発明の実施形態に、他のウィンドウ係数ｃ（ｎ）を含む他のウィンドウ関数を用いてもよい。

ステップＳ３５０において、アレイｇのサンプルが補間後のウィンドウ関数の補間後ウィンドウ係数ｃｉ（ｎ）で掛け算され、補間後の時間領域サンプルｗ（ｎ）が得られる。

そして、図８ｃのフローチャートの最後のステップＳ３７０の前に、ステップＳ３６０において、アレイｗ（ｎ）からのサンプルの合計によって３２個の新しいサンプルを算出する。

前述したように、図８ｃのフローチャートでは、Ｘ（［ｋ］，［ｌ］）（＝ｘ（ｋ，ｌ）はオーディオ副帯チャンネルｋのオーディオ副帯値ｌに相当する。また、図８ｃに示すフローチャートの新たな一巡は、その出力として、新しい３２個の実数値時間領域サンプルを生成する。

図８ｄは、例えば低電源ＳＢＲ装置に採用可能なダウンサンプルされた実数値合成フィルターバンクという形での本発明の一実施形態に係るフローチャートを示している。図８ｄに示す実施形態及びフローチャートと図８ｃに示したダウンサンプルされた複合値合成フィルターバンクのフローチャートとの違いは、ステップＳ３２０が図８ｄではステップＳ３２２に置き換えられている点だけである。

ステップＳ３２２において、３２個の新しい実数値オーディオ副帯値または副帯サンプルがマトリクスＮ_rで掛け算され、マトリクスＮｒの素子は以下の式で与えられる。

この処理の出力はアレイｖの０〜６４の位置に保存される。

図９ａは、６４個の副帯のための複合値解析フィルターバンクに対応する方法の比較例を示す。図９ａは、出力としてベクトルｙとベクトル“ｓｔａｔｅ”を提供するＭＡＴＬＡＢ実施を示す。図９ａに示す手順で定義される関数はＬＤＦＢ８０と呼ばれ、新しいオーディオサンプルを含むベクトルｘとベクトル“ｓｔａｔｅ”がこのＬＤＦＢ８０に入力として与えられる。関数ＬＤＦＢ８０という名前は、過去に８ブロック及び未来に０ブロック延長するための低遅延フィルターバンクの省略である。

ＭＡＴＬＡＢプログラム言語において、パーセントの印（％）は注記を示し、それは実行されないが、注解をしたりソースコードを説明する目的でのみ記されている。以下では、ソースコードの異なる部分をその機能に関して説明する。

ステップＳ４００では、指数５７７〜６４０を有するベクトル“ｓｔａｔｅ”の内容が新しい時間領域オーディオ入力サンプルを含むベクトルｘの内容に置き換えられるように、ベクトル“ｓｔａｔｅ”によって表わされるバッファが更新される。ステップＳ４１０では、可変ＬＤＦＢ８０＿ｗｉｎに保存されているような解析ウィンドウ関数のウィンドウ係数がベクトルｗｉｎ＿ａｎａに転送される。

ステップＳ４２０では、最新のサンプルがバッファの右側に並べられると仮定して、実際のウィンドウ処理を行う。ブロックＳ４２０では、ベクトル“ｓｔａｔｅ”の内容が素子ごとに、解析ウィンドウ関数を含むベクトルｗｉｎ＿ａｎａで掛け算される（．*）。この掛け算の出力は、ベクトルｘ＿ｗｉｎ＿ｏｒｉｇに保存される。

ステップＳ４３０において、ｘ＿ｓｔａｃｋと呼ばれる１２８・５の素子を有するサイズのマトリクスを形成するために、ベクトルｘ＿ｗｉｎ＿ｏｒｉｇの内容が整形される。ステップＳ４４０では、マトリクスｘ＿ｓｔａｃｋの第２〜第４列に関して、ｘ＿ｓｔａｃｋの符号変換が実行される。

ステップＳ４５０では、第２の指数に関するｘ＿ｓｔａｃｋの素子を合計し、同時に素子の順序を逆転し、結果を置き換えることによってｘ＿ｓｔａｃｋを破壊または取り消し、その結果は再び別のｘ＿ｓｔａｃｋに保存される。

ステップＳ４６０においては、ｘ＿ｓｔａｃｋの素子ごとに複合指数関数で掛けられた内容が複合高速フーリエ変換（ＦＦＴ）で時間領域から周波数領域へ転換され、０〜−１２７の指数及び仮想単位ｉに関して偏角（−ｉ・π・ｎ／１２８）が提供される。

ステップＳ４７０では後処理が行われ、変数ｍ＝（６４＋１）／２を定義し、以下の式によりオーディオ副帯値を含むブロックをベクトルｙとして算出する。

図９ａに示す実施において、指数ｋは１〜６４の整数をカバーする。ベクトルｙは図１のオーディオ副帯値１８０を含むベクトルまたはブロックとして出力される。第２の要因となる式（２６）の上の線及び図９ａに示すステップＳ４７０のｃｏｎｊ（）の符号化部分は、それぞれの複素数の偏角の複合共役を示す。

最後の符号化ステップＳ４８０において、ステートベクトルが６４個の素子分移動させられる。移動後のステートベクトルは、関数ＬＤＦＢ８０に、次の一巡の入力として与えられる。

図９ｂは３２個の副帯のための複合値解析フィルターバンクに相当する方法という形での本発明の一実施形態に係るＭＴＢＬＡＢ実施を示す。従って、定義される関数はＬＤＦＢ８０＿３２と称され、これは、過去に８ブロック未来に０ブロックの追加重複に基づく３２個の副帯のための低遅延フィルターバンクを示す。

図９ｂの実施と図９ａの実施との違いは、いくつかの符号化ステップに関するものだけであり、これについて以下に説明する。主に副帯の数つまり関数ＬＤＦＢ８０＿３２によって出力される副帯値の数が２の比率で少なくなるという事実を考慮して、ステップＳ４００，Ｓ４３０，Ｓ４６０，Ｓ４７０はステップＳ４３０’，Ｓ４６０’，Ｓ４７０’に置き換えられている。従って、ステップＳ４００’は、図１に示すような新しいブロック２２０の３２個の時間領域オーディオ入力サンプルを有する指数２８９〜３２０に対応する最後の３２個の入力に関して更新されたステートベクトルに関するものである。

しかし、図９ａの実施と図９ｂの実施との主な違いは、図９ａのステップＳ４１０が、図９ｂの実施においてはステップＳ４１２に置き換えられていることである。図９ｂのステップＳ４１２は、まず、ベクトルＬＤＦＢ８０＿ｗｉｎに保存されているウィンドウを含む６４０個のウィンドウ係数をローカルベクトルｗｉｎ＿ａｎａにコピーする。そして、式（１５）に基づき補間を実行し、ベクトルｗｉｎ＿ａｎａのベクトル素子によって示される二つの連続するウィンドウ係数が加算され、２で割られ、そしてベクトルｗｉｎ＿ａｎａに再び保存される。

次のステップＳ４２０は図９ａに示されているステップＳ４２０と同じであり、ステートベクトルの値つまり素子の、補間後のウィンドウ関数の補間ウィンドウ係数を含むベクトルｗｉｎ＿ａｎａの素子での掛け算（．*）というウィンドウ処理が実行される。この処理の出力はベクトルｘ＿ｗｉｎ＿ｏｒｉｇに保存される。しかし、図９ｂのステップＳ４２０と図９aのステップＳ４２０との違いは、図９ｂの場合には、ウィンドウ処理として６４０個ではなく３２０個の掛け算が行われることである。

ステップＳ４３０に代わるステップＳ４３０’において、ベクトルｘ＿ｗｉｎ＿ｏｒｉｇを整形することによってｘ＿ｓｔａｃｋが準備される。しかし、ベクトルｘ＿ｗｉｎ＿ｏｒｉｇはたった３２０個の素子を含むだけなので、図９ａの対応するベクトルに比べて、そのマトリクスｘ＿ｓｔａｃｋはたった６４・５個の素子を含むだけである。

符号変換のステップＳ４４０及びスタックを崩壊させるステップＳ４５０は、素子の数が少なくなった（６４０に対して３２０）という点以外は、図９ａ，９ｂどちらの実施においても同じである。

ステップＳ４６０に代わるステップＳ４６０’においては、ウィンドウデータの奇数複合高速フーリエ変換（ＦＦＴ）が行われ、これは図９ａのステップＳ４６０で実行される変換と酷似している。高速フーリエ変換の出力、つまりｘ＿ｓｔａｃｋと偏角（−ｉ・π・ｎ／６４）の複合指数関数の素子ごとの掛け算の出力がベクトルｔｅｍｐに与えられるが、ここでも、出力オーディオ副帯値の数が少なくなったために、指数ｎは０〜６３の範囲である。

その後、修正ステップＳ４７０’において、変数ｍ＝（３２＋１）／２を定義し、式（２６）に基づきベクトルｙを生成することで、後処理が行われる。ここでは、指数ｋは１〜３２の範囲しかカバーせず、複合指数関数の偏角に現れる１２８という数字は６４に置き換えられている。

最後に、図９ａの場合はステップＳ４８０でバッファが６４個の素子分移動させられたが、図９ｂの場合、変更ステップＳ４８０’でバッファが３２個の素子分移動させられる。

図１０ａは、６４副帯のための複合値合成フィルターバンクに相当する方法の比較例を示すＭＡＴＬＡＢ原稿である。図１０ａの原稿は関数ＩＬＤＦＢ８０を示し、この関数ＩＬＤＦＢ８０には、図２ａのオーディオ副帯値のブロック３２０及びステートベクトル“ｓｔａｔｅ”が入力パラメータとして与えられる。関数ＬＤＦＢ８０という名前は、この関数が定義するものは、過去の８ブロックのオーディオデータ及び未来の０ブロックのオーディオデータに相当する逆転低遅延フィルターバンクであることを示している。この関数は、出力として、ベクトルｙ及び新しいまたは再定義されたステートベクトル“ｓｔａｔｅ”を与え、ベクトルｙは図２ａの時間領域オーディオサンプルブロック４１０に相当する。

ステップＳ５００では、前処理が行われ、変数ｍ＝（６４＋１）／２及びベクトルｔｅｍｐが定義される。ベクトルｔｅｍｐの素子ｔｅｍｐ（ｎ）は以下の式に基づき定義される。

ベクトルの素子ｘ（ｎ）の上の線及び関数ｃｏｎｊ（）は複合共役を示し、ｅｘｐ（）は複合指数関数を示し、ｉは仮想単位を示し、ｎは１〜６４の範囲の指数を示す。

ステップＳ５１０においては、ベクトルｔｅｍｐが、第１列にベクトルｔｅｍｐの素子及び第２列にベクトルの指数に定義された素子の順序に関して逆転されたベクトルｔｅｍｐの複合共役を有するマトリクスに変換される。このように、ステップＳ５１０では、ベクトルｔｅｍｐに基づきマトリクスｔｅｍｐの奇数対称が確立される。

ステップＳ５２０では、奇数高速フーリエ変換（ＦＦＴ）がマトリクスｔｅｍｐに基づき実行される。このステップでは、マトリクスｔｅｍｐの逆フーリエ変換の出力と（ｉ・π/１２８）の偏角を有する指数関数との素子ごとの実数部分での掛け算が実行され、ベクトルｙ＿ｋｎｌに出力される。ここでは、指数ｎは０〜１２７の範囲にある。

ステップＳ５３０において、データの拡張及び交互の符号変換が行われる。これを達成するために、ベクトルｙ＿ｋｎｌの素子の順序が逆転され、必要な場合には符号変換が同時に行われる。そして、第１，第３，第５列にベクトルｙ＿ｋｎｌを含み、第２，第４列に符号変換されたベクトルｙ＿ｋｎｌを含むマトリクスｔｅｍｐが定義される。

ステップＳ５４０では、ベクトルＬＤＦＢ８０＿ｗｉｎに保存されているウィンドウ係数がまずベクトルｗｉｎ＿ａｎａにコピーされる。そして、合成ウィンドウ係数がベクトルｗｉｎ＿ａｎａに保存された解析ウィンドウ係数に基づき決定されるが、これは、以下の式に基づき解析ウィンドウ関数の時間逆転版を生成することにより行われる。

Ｎ・Ｔはウィンドウ係数の合計数であり、ｎはウィンドウ係数の指数である。

ステップＳ５５０において、ベクトルと合成ウィンドウの素子ごとの掛け算により、合成ウィンドウがベクトルｔｅｍｐに適応される。ステップＳ５６０では、５７７〜６４０の指数を有するベクトルｓｔａｔｅの素子を０にセットし、ステートベクトルｓｔａｔｅにウィンドウ処理されたベクトルｔｅｍｐを付加することにより、バッファが更新される。

ステップＳ５７０では、指数１〜６４を有するベクトルｓｔａｔｅの素子を抜粋することにより、時間領域オーディオサンプルを含む出力ベクトルｙがベクトルｓｔａｔｅから抜粋される。

ステップＳ５８０は図１０ａに示す関数の最後のステップであり、ステートベクトルｓｔａｔｅが６４個の素子分だけ移動させられ、６５〜６４０の指数を有する素子がベクトルｓｔａｔｅの最初の５７６個の素子にコピーされる。

図１０ｂは３２個の副帯値のための複合値合成フィルターバンクという形での本発明の実施形態のＭＡＴＬＡＢ原稿を示す。図１０ｂに示す原稿により定義される関数はＩＬＤＦＢ８０＿３２と呼ばれるものであるが、この名前は、この関数が過去からの８ブロックの重複と未来からの０ブロックの重複を有する３２帯域のための逆転低遅延フィルターバンクであることを示している。

図９ａ，９ｂに示した実施形態に関して説明したように、図１０ｂの実施形態もまた、図１０ａに係る６４副帯合成バンクフィルターと密接に関わるものである。つまり、同様のベクトルが関数に与えられ、また関数によって出力される。しかし、それらのベクトルは、図１０ａの場合と比較して、半分の数の素子しか含まない。３２帯域合成フィルターバンクは、図１０ａに示す６４副帯の合成フィルターバンクとは、主に二つの面で異なっている。ステップＳ５００，Ｓ５１０，Ｓ５２０，Ｓ５３０，Ｓ５６０，Ｓ５７０，Ｓ５８０は、処理される素子の数及び素子に関係するパラメータの数が半分であるステップに置き換えられている。さらに、合成ウィンドウ関数を生成するステップＳ５４０は、ステップＳ５４２に置き換えられ、合成ウィンドウ関数は、式（１５）に基づき直線的補間された合成ウィンドウ関数として生成される。

ステップＳ５００に代わるステップＳ５００’において、変数ｍはｍ＝（３２＋１）／２として定義され、ベクトルｔｅｍｐは式（２７）に基づき定義される。そこでは、指数ｎは単に１〜３２の範囲をカバーするだけのものであり、指数関数の偏角において、１／１２８の比率が１／６４の比率に置き換えられる。

従って、ステップＳ５１０に代わるステップＳ５１０’においても、指数の範囲はベクトルｔｅｍｐを含む単に３２個の素子の指数である。換言すれば、指数は１〜３２の値をカバーしているだけである。従って、ステップＳ５２０に代わるステップＳ５２０’においても、指数関数の偏角は（ｉ・π・ｎ／６４）に置き換えられ、指数ｎは０〜６３の範囲である。ステップＳ５３０’においても、指数範囲は、ステップＳ５３０と比べて２の比率で減じられている。

図１０ａのステップＳ５４０に代わるステップＳ５４２でもまた、ベクトルＬＤＦＢ８０＿ｗｉｎに保存されているウィンドウ関数がベクトルｗｉｎ＿ａｎａにコピーされ、式（２８）に基づき時間逆転版ｗｉｎ＿ｓｙｎが生成される。しかし、図１０ｂに示す実施形態のステップＳ５４２は、さらに式（１５）に基づく補間ステップを含み、合成ウィンドウ関数のウィンドウ係数を含む再定義されたベクトルｗｉｎ＿ｓｙｎの各素子のために、元の合成ウィンドウ関数の二つの連続するウィンドウ係数の直線的補間が行われる。

ウィンドウをベクトルｔｍｐに応用し、素子ｔｍｐをそのウィンドウ処理後のものに置き換えるステップＳ５５０は、図１０ａ，図１０ｂのそれぞれのステップを直接比較すると、同じである。しかし、図１０ｂの場合にはベクトルｔｍｐのサイズが小さいので、半分の掛け算が実行されるだけである。

ステップＳ５６０，Ｓ５７０，Ｓ５８０に代わるステップＳ５６０’，Ｓ５７０’，Ｓ５８０’においても、指数６４０及び６４がそれぞれ３２０及び３２に置換される。故に、これらの最後の三つのステップは、図１０ａに示した実施形態のこれらのステップと比べて、ベクトルｓｔａｔｅのサイズの点でのみ異なっている。

これまでに説明した実施形態で述べたように、解析ウィンドウ処理装置及び合成ウィンドウ処理装置は、それぞれのフレームに含まれる時間領域のそれぞれのサンプルをウィンドウ関数のウィンドウ係数と素子ごとに掛け算することによってウィンドウ処理するように構成されている。

例えば、時間逆転版に合成ウィンドウ関数及び解析ウィンドウ関数として使用され得るウィンドウ関数をより詳細に説明する前に、本発明に係る実施形態の利点を、特に図５，６に示すＳＢＲ装置またはシステムの構造の実施に関して詳細に説明する。

本発明に係る実施形態及び本発明の実施形態を一つ以上含むシステムが提供する利点は、他のフィルターバンクによる遅延をかなり低下させることである。この低遅延特性は図１３，１４に関して後により詳細に述べる。これに関する一つの重要な側面は、ウィンドウ関数の長さ、つまり時間領域サンプルのフレームまたはブロックに適応されるウィンドウ係数の数は、遅延とは無関係であるということである。

本発明に係る実施形態は、（再生された）オーディオデータの質を高めるというさらなる利点を有する。本発明の実施形態で使用される補間は、ウィンドウ係数の数を減らすという他の方法と比較して、エイリアシングをかなり低下させる。

また、図１７，１８に関して後に詳細に述べるが、心理音響の点に関して、本発明の実施形態は、しばしば、他の多くのフィルターバンクよりも有効に人間の耳の一時的なマスキング特性を利用している。さらに、図１５，１６，１９を参照して後により詳細に述べるが、本発明の実施形態は非常に良好な周波数応答を提供する。

また、本発明の一実施形態に係る多くのフィルターバンクにおいては、解析フィルターバンクと合成フィルターバンクが相互接続されているならば、完全な再生が可能である。換言すれば、本発明の実施形態は、このような相互接続された一組の解析フィルターバンクと合成フィルターバンクへの入力と比較して聴覚的に区別不可能な出力を提供するだけでなく、量子化の誤差及びコンピュータ処理の循環効果と必要な個別分離化によって生じる他の効果は別として、入力と同じ出力を提供する。

本発明に係るフィルターバンクのＳＢＲモジュールへの統合は、簡単にできる。概してＳＢＲモジュールが二種速度モードで動作するが、本発明にかかる複合値低遅延フィルターバンクは一種速度モードで完全な再生を行うことが可能である。しかし、元来のＳＢＲＱＭＦフィルターバンクは完全ではなく、それに近い再生が可能であるだけである。二種速度モードでは、インパルス応答の３２帯域版が直線的補間によって得られる。この直線的補間は、図３に関して説明したように、６４帯域インパルス応答またはウィンドウ関数の二つの隣接したタップまたはウィンドウ係数のダウンサンプリングのことを意味している。

複合値フィルターバンクの場合、批判的に取り上げたフィルターバンクに比べて、解析（または合成）遅延をかなり低下させることができ、サンプリング周波数または処理周波数は、ナイキスト−シャノン理論によるボーダー周波数に相当するものである。実数値フィルターバンクの場合、例えば図９，１０でＭＡＴＬＡＢ実施に関して示したように、最適化されたアルゴリズムを使用することで有効な実施ができる。これらの実施形態は、図５，６に関して説明したように、例えばＳＢＲ装置の低電源モードに使用できる。

図５，６を参照して述べたように、ＳＢＲシステムにおいて、本発明の一実施形態に係る複合値低遅延フィルターバンクを使用することで、遅延をより低下させることができる。前述したように、図５に示すようなＳＢＲデコーダ６１０において、ＱＭＦ解析フィルターバンク６２０は本発明の一実施形態に係る複合値低遅延フィルターバンク（ＣＬＤＦＢ）に置き換えられる。帯域の数（６４）とインパルス応答の長さ（６４０）を保ちながら、複合調整を用いることによって、この置き換えはコンピュータ処理として実行される。この装置による遅延は、達成可能な質のレベルを犠牲にせずに、全体としての遅延が双方向通信にとって十分低いものとなる程度に、抑えられる。

例えば、複合値のＭＤＣＴに類似のシステムを形成するためにＭＤＣＴ及びＭＤＳＴを有するシステムと比較して、本発明に係る一実施形態は非常に良い周波数応答を有する。例えば、今日、ＭＰＥＧ−４ＳＢＲに使用されるＱＭＦフィルターバンクと比べて、本発明の実施形態に係る一つまたはそれ以上のフィルターバンクを含むシステムは、かなり低い遅延を有する。

低遅延ＱＭＦフィルターバンクと比較しても、本発明に係る実施形態は、低遅延と共に完全な再生という利点を有する。ＱＭＦフィルターバンクの完全に近い再生とは対照的な完全な再生特性から得られる利点は、以下のようなものである。完全に近い再生のためには、エイリアシングを十分に低いレベルに抑えるために、高いストップバンド減衰が必要である。このことは、フィルター設計において非常に低遅延なものを達成する可能性に制限を与える。しかし、本発明に係る実施形態を採用すれば、エイリアシングを十分に低いレベルに抑えるために高いストップバンド減衰を必要としないので、フィルターを独立的に設計する可能性を与えることになる。ストップバンド減衰は、必要とされる信号処理の応用にとってエイリアシングの十分な低下を可能とするのに十分な低さである。従って、フィルター設計において、低遅延に対するより良いトレードオフが可能である。

図１１は、例えば正弦ウィンドウ関数７１０と本発明に係る実施形態に使用可能なウィンドウ関数７００との比較を示す。このウィンドウ関数７００は「合成」ＣＭＬＤＦＢウィンドウ（ＣＭＬＤＦＢ＝複合変調低遅延フィルターバンク）とも称されるが、付録１の表に示す値に基づく６４０個のウィンドウ係数を有している。ウィンドウ関数の大きさに関して、以下に示すように、ウィンドウ信号の振幅調性のための一般的な増幅率または抑制率は考慮されないことを明記しておく。このウィンドウ関数は、図１３に示されているように、例えば遅延の中心に相当する値に関して、またはｎ＝Ｎ，ｎ＝Ｎ−１，ｎ＝Ｎ＋１（Ｎ＝ブロック長，ｎ＝ウィンドウ係数の指数）に関して標準化される。これに対して、正弦ウィンドウ関数７１０は１２８個のサンプルによって定義されるものであり、例えば、ＭＤＣＴまたはＭＤＳＴモジュールに使用される。

しかし、実施の詳細により、付録１〜３の表に示されている値に基づくウィンドウ係数を得るために、指数１２８〜２５５，３８４〜５１１に相当するウィンドウ係数に関して、式（１６ａ），（１６ｂ）に基づく符号変換（比率−１の掛け算）がさらに必要となる場合がある。

二つのウィンドウ関数７００，７１０を論ずる前に、どちらのウィンドウ関数も実数値のウィンドウ係数のみを含むものであることを明記する。さらに、どちらの場合も、指数ｎ＝０に相当するウィンドウ係数の絶対値は０．１よりも小さい。ＣＭＬＤＦＢウィンドウ７００の場合、それぞれの値はさらに０．０２よりも小さい。

二つのウィンドウ関数７００，７１０をそれらの定義集合に関して考慮すると、いくつかの重要な違いが明らかとなる。正弦ウィンドウ関数７１０は対称であるのに対し、ウィンドウ関数７００は非対称である。これをより明確に定義するために、全ての実数ｎに関するある一つの実数値ｎ₀の場合、（ｎ₀＋ｎ）及び（ｎ₀−ｎ）にとって正弦ウィンドウ関数７１０が望ましい誤差（ε≧０；式（２９）の両辺の項の差の絶対値はε以下である）まで、以下の関係を満たすように定義されるので、正弦ウィンドウ関数は対称である。

ｗ（ｎ）は指数ｎに相当するウィンドウ係数を示す。正弦ウィンドウの場合、それぞれの指数ｎ₀が二つの最大のウィンドウ係数の正確に真ん中にある。換言すれば、正弦ウィンドウ関数７１０にとって、指数はｎ₀＝６３．５である。この正弦ウィンドウ関数は指数ｎ＝０，…，１２７で定義される。

これとは対照的に、ウィンドウ関数７００は指数ｎ＝０，…，６３９によって定義される。このウィンドウ関数７００は、全ての実数ｎ₀のために少なくとも一つの実数が常に存在し、（ｎ₀＋ｎ）及び（ｎ₀−ｎ）は、以下の不等式が（ほぼ計画的に）定義可能な誤差（ε≧０；式（２９）の両辺の項の差の絶対値はε以上である）にするウィンドウ関数の定義集合に属している点から、明らかに非対称である。

ここでも、ｗ（ｎ）は指数ｎに相当するウィンドウ係数である。

これら二つのウィンドウ関数はどちらも６４個のサンプルというブロックサイズに関するものであるが、これらのさらなる違いは、ウィンドウ関数７００の最大値は１よりも大きく、合成ウィンドウに関して以下の範囲の指数のために得られたものであるということである。

図１１に示すウィンドウ関数７００の場合、得られた最大値は、指数ｎ＝７７のサンプルで得られた１．０４よりも大きい。これに対して、正弦ウィンドウ７１０の最大値は１以下であり、ｎ＝６３及びｎ＝６４で得られる。

しかし、ウィンドウ関数７００では、ｎ＝Ｎ近辺のサンプル指数で約１の値が得られる。より正確には、指数ｎ＝Ｎ−１に相当するウィンドウ係数ｗ（Ｎ−１）の絶対値またはそれ自身の値は１よりも小さく、ｎ＝Ｎに相当するウィンドウ係数ｗ（Ｎ）の絶対値またはそれ自身の値は１よりも大きい。本発明に係るいくつかの実施形態において、これら二つのウィンドウ係数は以下の関係を満たす。

これは本発明の実施形態に係るフィルターバンクのオーディオの質を最適化した結果である。多くの場合において、できる限り小さい絶対値のウィンドウ係数ｗ（０）を有することが望ましい。この場合、可能なパラメータに関して最適化されたオーディオの質を達成するためには、以下の式で示されるように、ウィンドウ係数の決定要素はできる限り１に近づけるべきである。

式（３３）によって与えられる決定要素は、しかし自由に選択できる。ウィンドウ係数ｗ（０）は０よりも小さいまたは約０であるので、ｗ（Ｎ−１）・ｗ（Ｎ）の積またはその絶対値は＋／−１に限りなく近い。この場合、ウィンドウ係数ｗ（２Ｎ−１）はほとんど自由に選択できる。式（３３）は、Ｇ．Ｄ．Ｔ．シュラー及びＭ．Ｊ．Ｔ．スミスによる「変調完全再生フィルターバンクの新しい構造」（信号処理に関するＩＥＥＥ変換，Ｖｏｌ．４４，Ｎｏ．８，１９９６年８月）に説明されているような０遅延マトリクス技術を用いた結果である。

さらに、図１３を参照しながら後述するが、指数Ｎ−１及びＮに相当するウィンドウ係数は変調コアの中心に含まれ、従って、約１．０の値を含み、プロトタイプフィルター関数またはウィンドウ関数によって定義されるフィルターバンクの遅延と同時に生じるサンプルに相当する。

図１１に示すような合成ウィンドウ関数７００は、さらに、最新の時間領域オーディオサンプルをウィンドウ処理するのに使用される指数（ｎ＝０）に相当するウィンドウ係数列のウィンドウ係数から、合成ウィンドウ関数７００のウィンドウ係数全てのうちで最も高い絶対値を有するウィンドウ係数まで、完全に単調に増加する動きを示す。当然、時間逆転解析ウィンドウ関数の場合には、対応する（時間逆転）解析ウィンドウ関数で最も高い絶対値を有するウィンドウ係数から、最新の時間領域オーディオサンプルをウィンドウ処理するのに使用される指数（ｎ＝６３９）に相当するウィンドウ係数列のウィンドウ係数まで、完全に単調に低下する動きを示す。

このような動きの結果、合成ウィンドウ関数７００の展開は０．０２よりも小さい絶対値を有する指数ｎ＝０に相当するウィンドウ係数から開始され、指数ｎ＝１に相当するウィンドウ係数の絶対値は０．０３よりも小さく、指数ｎ＝Ｎで約１の値が得られ、式（３１）に示す範囲内の指数で１．０４より大きい最大値が得られ、ｎ＝９０及びｎ＝９１で再び約１の値が得られ、ｎ＝１６２及びｎ＝１６３の指数で最初の符号変化が見られ、約ｎ＝３Ｎの指数で−０．１または−０．１２７５５よりも小さい最小値が得られ、ｎ＝２８４及びｎ＝２８５の指数でさらなる符号変化が見られる。しかし、この合成ウィンドウ関数７００は、さらに別の指数ｎでさらなる符号変化をしてもよい。これらのウィンドウ係数を付録１及び３の表に示されている値と比較すると、指数１２８〜２５５，３８４〜５１１に相当するウィンドウ係数に関して、式（１６ａ），（１６ｂ）に基づくさらなる符号変換（比率−１の掛け算）が考えられるべきである。

合成ウィンドウ関数７００のこの振動は、かなり低減された振動と同様のものであり、最大値が約１．０４、最小値が−０．１２として描かれている。この結果、全てのウィンドウ係数のうちの５０％以上が０．１以下の絶対値を有している。図１，２ａの実施形態に関して説明したように、ウィンドウ関数の展開は第１グループ４２０（または２００）及び第２グループ４３０（または２１０）を含み、第１グループ４２０はウィンドウ係数第１連続部分を含み、第２グループ４３０はウィンドウ係数第２連続部分を含む。前述したように、ウィンドウのウィンドウ係数列は第１グループ４２０のウィンドウ係数と第２グループ４３０のウィンドウ係数だけを含み、第１グループ４２０のウィンドウ係数は正にウィンドウ係数第１連続部分であり、第２グループ４３０のウィンドウ係数は正にウィンドウ係数第２連続部分である。従って、第１グループ４２０とウィンドウ係数第１連続部分、第２グループとウィンドウ係数第２連続部分とは類義語として使用される。

全てのウィンドウ係数のうちの０．１以下の値を有している５０％以上のものは、第２グループつまりウィンドウ係数第２部分４３０に、ウィンドウ関数７００の非常に低減された振動の結果として含まれている。また、第２グループつまり第２部分４３０に含まれている全てのウィンドウ係数のうちの５０％以上のものは０．０１以下の絶対値を有する。

ウィンドウ係数第１部分４２０は、ウィンドウ係数列の全てのウィンドウ係数のうちの３分の１未満のものを含んでいる。従って、ウィンドウ係数第２部分４３０はウィンドウ係数の２／３以上を含んでいることになる。フレーム１２０，１５０，３３０，３８０のいずれかで処理されるべきブロックの合計数がＴ（４ブロックよりも多い）である場合、第１部分は概して３／２・Ｎ個のウィンドウ係数を含み、Ｎは一つのブロック中の時間領域サンプルの数である。従って、第２部分は残りのウィンドウ係数、より正確には、（Ｔ−３／２）Ｎ個のウィンドウ係数を含む。図１１に示すように、フレーム毎のブロック数が１０（Ｔ＝１０）の場合、第１部分は３／２・Ｎ個のウィンドウ係数を含み、第２部分は８．５・Ｎ個のウィンドウ係数を含む。ブロック毎の時間領域オーディオサンプルの数が６４（ブロックサイズがＮ＝６４）の場合、第１部分は９６個のウィンドウ係数を含み、第２部分は５４４個のウィンドウ係数を含む。図１１に示すような合成ウィンドウ関数７００では、第１部分と第２部分のボーダー、つまり指数ｎが９５または９６の部分において、約０．９６の値が得られる。

第１部分４２０及び第２部分４３０に含まれているウィンドウ係数の数がこのようなものであるにもかかわらず、それぞれの部分でのウィンドウ係数のエネルギー値または合計エネルギー値は互いに大きく異なっている。エネルギー値は以下の式によって定義される。

ｗ（ｎ）はウィンドウ係数であり、式（３４）で合計される指数ｎはそれぞれの部分４２０，４３０の指数であり、それぞれのエネルギー値Ｅは、一組のウィンドウ係数全体のものである。ウィンドウ係数が数の点で前記のような重大な違いがあるにもかかわらず、第１部分４２０のエネルギー値は全てのウィンドウ係数の合計エネルギー値の２／３以上である。従って、第２部分４３０のエネルギー値は全てのウィンドウ係数の合計エネルギー値の１／３以下である。

より詳細には、ウィンドウ関数７００のウィンドウ係数第１部分４２０のエネルギー値は約５５．８５であり、ウィンドウ係数第２部分４３０のエネルギー値は２２．８１である。ウィンドウ関数７００の全てのウィンドウ係数の合計エネルギー値は約７８．０３であるので、第１部分４２０のエネルギー値はウィンドウ係数全体のエネルギー値の約７１．６％であり、第２部分４３０のエネルギー値は全体のエネルギー値の約２８．４％である。

当然、式（３４）は、エネルギー値Ｅを標準化係数Ｅ₀で割ることにより、標準化版として示すことも可能である。Ｅ₀は原則的にどんなエネルギー値であってもよい。標準化係数Ｅ₀は、例えば式（３４）に基づき計算されるウィンドウ係数列の全てのウィンドウ係数の合計エネルギー値であってもよい。

ウィンドウ係数の絶対値またはそれぞれのウィンドウ係数のエネルギー値に基づき、ウィンドウ係数列の中心点または「質量の中心」が決定され得る。ウィンドウ係数列の質量の中心または中心点は実数であり、概してウィンドウ係数第１部分４２０の指数の範囲に存在している。それぞれのフレームが４よりも多いブロック数の時間領域オーディオサンプル（Ｔ＞４）を含む場合、ウィンドウ係数の絶対値に基づく質量の中心ｎ_caまたはウィンドウ係数のエネルギー値に基づく質量の中心ｎ_ceは、３／２・Ｎよりも小さい。換言すれば、フレーム毎のブロック数Ｔ＝１０の場合、質量の中心は第１部分４２０の指数の領域にある。

ウィンドウ係数ｗ（ｎ）の絶対値に基づく質量の中心ｎ_caは、以下の式（３５）によって定義され、ウィンドウ係数ｗ（ｎ）のエネルギー値に基づく質量の中心ｎ_ceは、以下の式（３６）によって定義される。

ＮとＴは、それぞれ、ブロック毎の時間領域オーディオサンプルの数及びフレーム毎のブロックの数を示す正の整数である。当然、式（３５），（３６）による中心点はまた、前記の合計の限界を置き換えることによって、限定された一組のウィンドウ係数に関して求めることも可能である。

図１に示すようなウィンドウ関数７００のために、ウィンドウ係数ｗ（ｎ）の絶対値に基づく質量の中心ｎ_caは、ｎ_ca≒８７．７５の値に等しく、ウィンドウ係数ｗ（ｎ）のエネルギー値に関する中心点または質量の中心ｎ_ceは、ｎ_ce≒８０．０４である。ウィンドウ関数７００のウィンドウ係数第１部分２００は９６個（＝３／２・Ｎ；Ｎ＝６４）のウィンドウ係数を含み、前述したように、中心点は両方ともウィンドウ係数第１部分２００内にある。

ウィンドウ係数７００のウィンドウ係数ｗ（ｎ）は付録１の表に示されている値に基づいている。しかし、例えば前述したようなフィルターバンクの低遅延特性を達成するためには、付録１の表に示されている値を正確にウィンドウ係数に適用する必要はない。多くの場合、６４０個のウィンドウ係数を含むウィンドウ関数のウィンドウ係数のためには、付録２〜４のいずれかの表に示されている関係または式を満たすだけで十分である。付録１の表に示されているウィンドウ係数またはフィルター係数は好ましい値を示し、いくつかの実施においては式（１６ａ），（１６ｂ）により適応されてもよい。しかし、例えば、別の付録の別の表により、これらの好ましい値は小数点第２位、第３位、第４位、第５位以降が変更されてもよく、結果としてのフィルターまたはウィンドウ関数は本発明に係る実施形態の利点をなおも有している。しかし、実施の詳細により、付録１〜３の表に示されている値に基づくウィンドウ係数を得るために、指数１２８〜２５５，３８４〜５１１に対応するウィンドウ係数に関して、式（１６ａ），（１６ｂ）に応じたさらなる符号変換（比率−１の掛け算）を考慮すべきである。

当然、別の個数のウィンドウ係数を含む別のウィンドウ関数が同様に定義され、本発明に係る実施形態の構造に使用され得る。これに関して、過去のサンプルと未来のサンンプルに関するブロックの配列だけでなく、ブロック毎の時間領域オーディオサンプルの数とフレーム毎のブロックの数のどちらもまた、多様な範囲のパラメータにより変更可能である。

図１２は、図１１に示すような複合変調低遅延フィルターバンクウィンドウ（ＣＭＬＤＦＢ−ウィンドウ）７００と、例えばＭＰＥＧ標準のＳＢＲ装置に使用される元来のＳＢＲＱＭＦプロトタイプフィルター７２０との比較である。図１１に示すように、ＣＭＬＤＦＢウィンドウ７００は本発明の一実施形態に係る合成ウィンドウである。

本発明の一実施形態に係るウィンドウ関数７００は式（３０）で定義されるように明らかに非対称である。ウィンドウ関数７００及びＳＢＲＱＭＦプロトタイプフィルター７２０はそれぞれ６４０個の指数に関して定義されるので、元来のＳＢＲＱＭＦプロトタイプフィルター７２０は、指数ｎ＝３１９及び３２０に関して対称である。換言すれば、式（２９）に関して、対称の中心を表す「指数値」ｎ₀は、ＳＢＲＱＭＦプロトタイプフィルター７２０の場合、ｎ₀＝３１９．５である。

さらに、ＳＢＲＱＭＦプロトタイプフィルター７２０が対称であるために、式（３５），（３６）による中心点ｎ_ca，ｎ_ceもまた、それぞれ対称の中心ｎ₀に等しい。ＳＢＲＱＭＦプロトタイプフィルター７２０は直交フィルターであるので、このプロトタイプフィルターのエネルギー値は６４．００である。これとは対照的に、明らかに非対称のウィンドウ関数７００は、前述したように、７８．０３２７のエネルギー値を有している。

以下に、図５，６に関して説明したＳＢＲシステムについて検討する。このシステムにおいて、ＳＢＲデコーダ６１０は、解析フィルターバンクという形の本発明の実施形態をフィルターバンク６２０として、及び合成フィルターバンクの形の本発明の実施形態を合成フィルターバンク６４０として含む。後述するように、図１１，１２に示すようなウィンドウ関数７００を使用する本発明に係る解析フィルターバンクの総合遅延は、１２７個のサンプルの合計遅延であるが、元来のＳＢＲＱＭＦプロトタイプのフィルターに基づくＳＢＲ装置では６４０個のサンプルの合計遅延となる。

例えば、ＳＢＲデコーダ６１０におけるＱＭＦフィルターバンクのようなＳＢＲモジュールを、複合値低遅延フィルターバンク（ＣＬＤＦＢ）に置き換えることで、オーディオの質を低下させることもコンピュータ処理を複雑化させることもなく、遅延を４２ｍｓから３１．３ｍｓに低下させることができる。図７〜１０に関する本発明に係る実施形態で説明したように、この新しいフィルターバンクで、標準ＳＢＲモード（高性能モード）と実数値フィルターバンクのみを使用する低電源モードの両方が支えられる。

特に遠距離通信と双方向通信の分野において、低遅延は非常に重要である。超低遅延ＡＡＣはすでに４２ｍｓの通信応用にとって十分低い遅延を達成できたが、そのアルゴリズムの遅延はなおも、ＡＡＣ低遅延コアコーデック（２０ｍｓという低遅延を達成した）や他の遠距離通信コーデックのそれよりも高い。その遅延を低下させるための有望な方法は、本発明の一実施形態に係る低遅延フィルターバンク技術を利用することと、現在のＱＭＦフィルターバンクを本発明の実施形態に係る低遅延のものに置き換えることである。換言すれば、さらなる遅延低下は、単にＳＢＲモジュール６１０で使用されている通常のフィルターバンクを本発明の実施形態に係る複合低遅延フィルターバンクに置き換えることによって達成される。

ＣＬＤＦＢとも称される本発明の実施形態に係る新しいフィルターバンクは、ＳＢＲモジュール６１０での使用のために、できる限り元々使用されてきたＱＭＦフィルターバンクと類似するように設計される。これは、例えば、ＳＢＲシステムで使用されているような６４帯域または６４副帯の使用、同じ長さのインパルス応答、二種速度モードとの適合性を含む。

図１３は、本発明の一実施形態に係るＣＬＤＦＢウィンドウ７００と元のＳＢＲＱＭＦプロトタイプフィルター７２０との比較を示す。さらに、図１３は変調フィルターバンクの遅延を示し、これは、ＤＣＴ−ＩＶシステムの場合、Ｎ個のサンプルという長さを有する変調コアのフレーム遅延及びプロトタイプフィルターまたはウィンドウ関数によって引き起こされる重複遅延を解析することによって決定できる。図１３もまた、合成フィルターバンクの場合を示している。ウィンドウ関数７００もプロトタイプフィルター関数７２０も、これら二つのフィルターバンクの合成プロトタイプフィルターのインパルス応答を示している。

ＳＢＲＱＭＦフィルターバンク及び本発明の一実施形態によって提案されているＣＬＤＦＢの両方の遅延解析に関して、解析及び合成において変調コアの右側と左側の重複部のみがそれぞれ遅延となる。

両方のフィルターバンクにおいて、変調コアは、図１３では遅延７５０として記されている６４個のサンプルの遅延を引き起こすＤＣＴ−ＩＶに基づいている。ＳＢＲＱＭＦプロトタイプフィルター７２０の場合、その対称性のために、図１３に示すように、変調コア遅延７５０は、質量の中心またはプロトタイプフィルター関数７２０の中心点に関して対称的に配置される。このようなふるまいの理由は、ＳＢＲＱＭＦフィルターバンクのバッファは、プロトタイプフィルター値のそれぞれのエネルギー値の点で最も大きな影響を及ぼすプロトタイプフィルター関数７２０が処理の際に考慮されるであろうポイントまで埋められる必要がある。プロトタイプフィルター関数７２０のこの形のために、バッファが、それぞれのプロトタイプフィルター関数の少なくとも中心点または質量の中心まで埋められなければならない。

このことをさらに説明すると、最初にＳＢＲＱＭＦフィルターバンクのバッファを全て初期化し、そのバッファは、データ処理が意義のあるデータの処理となるようなポイントまで埋められる必要があり、このためには、それぞれのウィンドウ関数またはプロトタイプフィルター関数が大きな要因となる。ＳＢＲＱＭＦプロトライプフィルター関数の場合、質量の中心つまりプロトタイプフィルター関数の中心点に関して、プロトタイプフィルター７２０が対称形であることが遅延を生じさせる。

しかし、サンプル数Ｎ＝６４のＤＣＴ−ＩＶを基礎とするシステムの変調コアによって生じる遅延は常に存在し、このシステムはまた１ブロックの遅延を含むので、ＳＢＲＱＭＦのための合成プロトタイプは２８８個のサンプルの重複遅延を生じさせることになる。

前述したように、図１３に関する合成フィルターバンクの場合、この付加的な左側の重複７６０が遅延を生じさせ、右側の重複７７０は過去のサンプルに関しているのでさらなる遅延を生じさせない。

これとは対照的に、本発明の一実施形態に係るＣＬＤＦＢのバッファは最初に全て初期化され、合成フィルターバンク及び解析フィルターバンクは、そのウィンドウ関数の形のために、ＳＢＲＱＭＦフィルターバンクと比べて即座に「意味のある」データを提供することができる。換言すれば、解析または合成フィルターバンク７００の形のために、ウィンドウ関数で処理され、重要な影響力を有するサンプルがより即座に得られる。従って、ＣＬＤＦＢのプロトタイプまたは合成ウィンドウ関数は、変調コアによってすでに生じた遅延７５０を考慮に入れて、３２個のサンプルの重複遅延が生じるだけである。本発明の一実施形態に係るウィンドウ関数７００のウィンドウ係数第１部分または第１グループ４２０は、好ましくは、変調コア遅延７５０と左側の重複７６０により生じる遅延７５０に相当する９６個のウィンドウ係数を含む。

解析フィルターバンクも合成フィルターバンクもどちらも同じ遅延を引き起こす。それは、解析フィルターバンクは、合成ウィンドウ関数またはプロトタイプ関数の時間領域逆転版に基づくものであるからである。従って、重複遅延は、合成フィルターバンクと同じ重複サイズを有する右側に生じる。このように、本発明の一実施形態に係る解析フィルターバンクの場合には、３２サンプルの遅延が生じるのに対して、一方、元のＱＭＦプロトタイプフィルターバンクの場合には、２８８サンプルの遅延が生じる。

図１４ａに示す表は、フレーム長が４８０サンプル、サンプリング速度が４８ｋＨｚの場合を想定し、異なる修正段階での遅延を示す。標準ＳＢＲ装置と共にＡＡＣ−ＬＤコーデックを有する標準的な構造において、二種速度モードのＭＤＣＴ，ＩＭＤＣＴフィルターバンクは４０ｍｓの遅延を引き起こす。そして、ＱＭＦ装置自身が１２ｍｓの遅延を引き起こす。また、ＳＢＲ重複のために、さらに８ｍｓの遅延が生じ、このコーデックの総合的な遅延は大体６０ｍｓとなる。

ＭＤＣＴ，ＩＭＤＣＴの低遅延版を有するＡＡＣ−ＥＬＤは、二種速度において、３０ｍｓの遅延を生じさせる。また、ＳＢＲ装置の元来のＱＭＦフィルターバンクによる遅延が１２ｍｓであるのに対して、本発明の一実施形態に係る複合値低遅延フィルターバンクを使用することで、たった１ｍｓの遅延となる。ＳＢＲ重複を避けることにより、ＡＡＣ−ＬＤ装置とＳＢＲ装置の単純な組み合わせにより８ｍｓの遅延が生じることを完全に防止することができる。従って、前記のような単純な組み合わせで６０ｍｓの遅延が生じるのに対して、超低遅延ＡＡＣコーデックは、アルゴリズム全体の遅延として３０ｍｓとすることができる。故に、前述したような遅延低下方法の組み合わせは、実際、遅延全体として２９ｍｓの節約になる。

図１４ｂの表は、図５，６に示したシステムの元来のフィルターバンク及びここで提案するフィルターバンクによって生じる全体的なコーデック遅延を示す。図１４ｂに示すデータ及び値は、サンプリング速度が４８ｋＨｚ、コアコーダのフレームサイズが４８０サンプルの場合に基づく。図５，６で説明したＳＢＲシステムの二種速度方法により、コアコーダは２４ｋＨｚのサンプリング速度で効果的に動作する。変調コアでの６４サンプルのフレーム遅延がコアコーダによってすでに引き起こされているので、図１３に関して説明しように、二つのフィルターバンクの個別の遅延値からそれを差し引くことができる。

図１４ｂの表が、ＭＤＣＴ，ＩＭＤＣＴの低遅延版（ＬＤＭＤＣＴ，ＬＤＩＭＤＣＴ）を有する超低遅延ＡＡＣコーデックの全体的な遅延を低下させることが可能であるということの基礎になる。ＭＤＣＴ，ＩＭＤＣＴの低遅延版および元来のＱＭＦフィルターバンクを使用するだけで、全体的なアルゴリズム遅延が４２ｍｓとなり、さらに従来のＱＭＦフィルターバンクを本発明の一実施形態に係る複合値低遅延フィルターバンクに置き換えるだけで、全体的なアルゴリズム遅延を３１．３ｍｓにまで低下させることができる。

一つまたはそれ以上のフィルターバンクを含む本発明の実施形態に係るフィルターバンクの質を評価するために、リスニングテストが行われ、そのテストから、本発明の実施形態に係るフィルターバンクはＡＡＣ−ＥＬＤと同じレベルのオーディオの質を保持し、複合ＳＢＲモード、実数値低電源ＳＢＲモードのどちらにおいても質の低下がないという結論が得られた。従って、本発明の実施形態に係る遅延最適化フィルターバンクは、遅延を１０ｍｓ以上低下させるにもかかわらず、オーディオの質にも負担をかけることがない。一時的な特徴として、統計上重要でないが、わずかな向上さえ見られた。この向上とは、カスタネットと鉄琴のテストにおいて観察された。

本発明の一実施形態に係る３２帯域のフィルターバンクの場合のダウンサンプリングは、本発明に係るフィルターバンクのために、ＱＭＦフィルターバンクと同様によく動作することをさらに証明するために、以下のような評価が行われた。まず、対数正弦曲線がダウンサンプルされた３２帯域フィルターバンクで解析され、０に初期化された３２個の高帯域が付加された。その後、その出力は６４帯域フィルターバンクにより合成され、再びダウンサンプルされ、元の信号と比較された。従来のＳＢＲＱＭＦプロトタイプフィルターバンクの使用は、信号・ノイズ率（ＳＮＲ）が５９．５ｄＢという結果になる。しかし、本発明に係るフィルターバンクは７８．５ｄＢのＳＮＲを達成する。このことは、本発明の実施形態に係るフィルターバンクは、ダウンサンプルされたものにおいても、少なくとも元のＱＭＦフィルターバンクと同様に機能することを示している。

本発明の実施形態に採用されたこの遅延最適化非対称フィルターバンク方法は、対称プロトタイプの従来のフィルターバンクと比較して、まさに付加価値を提供するということを示すために、以下、同じ遅延を有する非対称プロトタイプと対称プロトタイプとを比較する。

図１５ａは、広範囲における、低遅延ウィンドウ（グラフ８００）を使用する本発明に係るフィルターバンクの周波数応答と１２８タップの長さを有する正弦ウィンドウ（グラフ８１０）を使用するフィルターバンクの周波数応答との比較を示す。図１５ｂは、これらのウィンドウ関数を使用する同じフィルターバンクの狭い範囲での周波数応答を示す拡大図である。

二つのグラフ８００，８１０の直接的な比較から、本発明の一実施形態に係る低遅延フィルターバンクを使用するフィルターバンクの周波数応答は、同じ遅延を有する１２８タップの正弦ウィンドウを使用するフィルターバンクの周波数応答よりもかなり良いことがわかる。

また、図１６ａは、全体的な遅延が１２７サンプルである異なるウィンドウ関数の比較を示す。６４帯域のフィルターバンク（ＣＬＤＦＢ）は、フレーム遅延と重複遅延を含む１２７サンプルの全体的な遅延を有する。対称プロトタイプと同じ遅延を有する変調フィルターバンクは、従って、図１５ａ，１５ｂに関して説明したように、１２８の長さのプロトタイプを有することになる。５０％の重複を有するこれらのフィルターバンクのために、例えばＭＤＣＴ、正弦ウィンドウまたはカイザー・ベッセルから導き出されるウィンドウは、概してプロトタイプとして良い選択である。従って、図１６ａにおいて、本発明の一実施形態に係るプロトタイプとしての低遅延ウィンドウを使用するフィルターバンクの周波数応答が、同じ遅延を有する対称プロトタイプの周波数応答と比較されている。図１６ａでは、図１５ａ，１５ｂで説明したような、本発明の実施形態に係るフィルターバンクの周波数応答（グラフ８００）と正弦ウィンドウを使用するフィルターバンクの周波数応答（グラフ８１０）以外に、さらに二つのＫＢＤウィンドウ、つまりパラメータα＝４に基づくもの（グラフ８２０）とα＝６に基づくもの（グラフ８３０）が示されている。図１６ａ、及び図１６ａの拡大図である図１６ｂのどちらも、非対称ウィンドウ関数または同じ遅延のプロトタイプフィルター関数を有する本発明の一実施形態に係るフィルターバンクを使用することで、かなり良い周波数応答が達成できることを示している。

この利点をより一般的な点から説明するために、図１７において、前記フィルターバンクとは異なる遅延値を有する二つのフィルターバンクプロトタイプが比較されている。図１５，１６で検討した本発明に係るフィルターバンクは１２７サンプルの全体的な遅延を有し、この遅延は過去に８ブロック及び未来に０ブロックの重複（ＣＬＤＦＢ８０）に相当するものである。図１７は、同じ遅延（３８３サンプルの遅延）を有する二つの異なるフィルターバンクプロトタイプの周波数応答の比較を示す。より正確には、図１７は、本発明の一実施形態に係る非対称プロトタイプフィルターバンクの周波数応答（グラフ８４０）を示し、これは、過去に６ブロックの時間領域サンプル、未来に２ブロックの時間領域サンプルの重複に基づくものである（ＣＬＤＥＦＢ６２）。さらに図１７は、３８３サンプルの遅延を有する対称プロトタイプフィルター関数の周波数応答（グラフ８５０）を示す。非対称プロトタイプまたはウィンドウ関数が、同じ遅延値の対称ウィンドウ関数またはプロトタイプフィルターを有するフィルターバンクよりも良い周波数応答を達成することがわかる。このことは、前述したように、遅延と質との間のより良いトレードオフが可能であることを示している。

図１８は人間の耳の一時的なマスキング効果を示す。図１８中、線８６０で示す瞬間に音が発生する場合、その音の周波数とその近辺の周波数に関するマスキング効果が、実際の音が開始される約２０ｍｓ前に発生する。この効果はプレマスキングと呼ばれ、人間の耳の心理音響特性の一つの側面である。

図１８に示す状況において、音は、線８７０で示される瞬間までの約２００ｍｓの間聞こえるものとして残る。この間、人間の耳のマスキングが働き、これは同時マスキングとも称される。図１８に示すように、音が止まった後（線８７０で示される）、その音の周波数及び近辺の周波数のマスキングは約１５０ｍｓの間、徐々に消えていく。この心理音響効果はポストマスキングとも称される。

図１９は、本発明の一実施形態に係る低遅延フィルターバンク（ＣＭＬＤＦＢ）を使用するフィルターバンクに基づく従来のＨＥ−ＡＡＣ符号化信号とＨＥ−ＡＡＣ符号化信号のプレエコーを示す。図１９ａは、カスタネットの元の時間信号を示し、ＨＥ−ＡＡＣコーデック（高能率高度オーディオコーデック）を含むシステムで処理されたものである。従来のＨＥ−ＡＡＣに基づくシステムの出力は図１９ｂに示されている。二つの信号、つまり元の時間信号とＨＥ−ＡＡＣコーデックの出力信号との直接比較すると、ＨＥ−ＡＡＣコーデックの出力信号において、カスタネットの音が始まる前の矢印８８０で示されている部分に、プレエコーが見られることがわかる。

図１９ｃは、本発明の一実施形態に係るＣＭＬＤＦＢウィンドウを含むフィルターバンクに基づくＨＥ−ＡＡＣを有するシステムの出力信号を示す。図１９ａに示されている元の時間信号と、本発明の一実施形態に係るフィルターバンクを使用した処理後の信号から、図１９ｃの矢印８９０で示されているように、カスタネットの音の開始直前のプレエコー効果がかなり低下していることがわかる。図１８に関して説明したプレマスキング効果のために、図１９ｃの矢印８９０で示されるプレエコー効果は、従来のＨＥ−ＡＡＣコーデックの場合の矢印８８０で示されるプレエコー効果よりも、ずっとよく隠されている。本発明に係るフィルターバンクのプレエコーのこの状態は、従来のフィルターバンクに比べてかなり遅延が低下されたという結果でもあるが、これは人間の耳の一時的なマスキング特性と心理音響特性にずっとよく適合した出力を提供するものである。結果的に、リスニングテストを説明する際に述べたように、本発明の一実施形態に係るフィルターバンクを使用することは、遅延低下によりもたらされる質の向上さえにもつながる。

本発明に係る実施形態は、従来のフィルターバンクに比べて、コンピュータ処理の複雑さを増すことはない。低遅延フィルターバンクは、コンピュータ処理が複雑化されないように、例えばＳＢＲシステムの場合のＱＭＦフィルターバンクと同じフィルター長及び同じ変調モードを使用する。プロトタイプフィルターの非対称な本質のために必要とされるメモリーに関して、合成フィルターバンクのために必要なＲＯＭ（読み出し専用メモリ）は、ブロック毎のサンプル数Ｎ＝６４であり、フレーム毎のブロック数Ｔ＝１０であるフィルターバンクの場合、約３２０ワード増加する。さらに、ＳＢＲ関連のシステムの場合、解析フィルターが別に保存されるならば、必要なメモリーは、さらにもう３２０ワード増加する。

しかし、ＡＡＣ−ＥＬＤコアのために現在必要なＲＯＭは約２．５キロワードであり、ＳＢＲ装置のためには、さらに２．５キロワード必要であるが、必要なＲＯＭは約１０％増加するだけである。メモリーと複雑性との間のできる限りのトレードオフとして、低いメモリー使用量の方が重要である場合、図３及び式（１５）に関して述べたように、合成フィルターから解析フィルターを生成するために直線的補間が使用できる。この補間処理は、必要な指示の数を約３．６％増加させるだけである。従って、ＳＢＲモジュール構造内の従来のＱＭＦフィルターバンクを本発明の実施形態に係る低遅延フィルターバンクに置き換えることで、いくつかの実施形態においては、オーディオの質の低下や目立った複雑化を引き起こすことなく、１０ｍｓ以上の遅延の低下を達成することができる。

このように、本発明に係る実施形態は、解析または合成ウィンドウまたはウィンドウ処理のための装置または方法に関する。さらに、解析または合成フィルターバンクまたはウィンドウを用いて信号を解析または合成する方法を説明する。当然、前記の方法のうちの一つを実行するためのコンピュータプログラムもまた開示される。

本発明の実施形態は、ハードウェアでの実施、ソフトウェアでの実施または両方の組み合わせとして実行され得る。生成され、受信され、または処理のために保存されるデータ、ベクトル及び変数は、ランダムアクセスメモリー、バッファ、リードオンリーメモリー、持久記憶装置（例えばＥＥＰＲＯＭ、フラッシュメモリー）また磁器メモリー、光メモリーなどの多様な種類のメモリーに保存可能である。保存場所は、例えば、変数、パラメータ、ベクトル、マトリクス、ウィンドウ係数や他の情報及びデータのそれぞれのデータ量を保存するのに必要な一つまたはそれ以上のメモリーユニットであってもよい。

ソフトウェアの実施は、多様なコンピュータ、コンピュータと同様のシステム、プロセッサ、ＡＳＩＣ（応用特定集積回路）また他の集積回路（ＩＣ）で実行され得る。

本発明の方法を実施するための必要条件によって、本発明の方法の実施形態はハードウェア、ソフトウェアまたはその両方の組み合わせで実行可能である。プログラム可能なコンピュータシステム、プロセッサや集積回路と協働するデジタル記憶媒体、特にＣＤ、ＤＶＤや電気的に読み出し可能な制御信号を記憶する他のディスクを使用して、本発明の実施形態が実行される。一般的に、本発明の一実施形態は、プログラムコードが機械読み取り可能な媒体に保存されたコンピュータプログラム製品であり、そのプログラムコードは、コンピュータプログラムがコンピュータ、プロセッサや集積回路上で起動された際、本発明の方法の実施形態を実行するものである。換言すれば、本発明の方法の実施形態は、従って、コンピュータ、プロセッサや集積回路上で起動された際に本発明の方法の少なくとも一つの実施形態を実行するプログラムコードを有するコンピュータプログラムである。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置は、ウィンドウ処理されたサンプルを得るために、初期のサンプルから後期のサンプルに至る時間列での時間領域オーディオ入力サンプルのフレーム（１２０）を、ウィンドウ係数列を含む解析ウィンドウ関数（１９０）を使用してウィンドウ処理するためのウィンドウ処理部（１１０）を有し、解析ウィンドウ関数（１９０）は、ウィンドウ係数列の第１部分を含むウィンドウ係数第１グループ（２００）と、ウィンドウ係数列の第２部分を含むウィンドウ係数第２グループ（２１０）とを含み、第１部分は第２部分よりも少ない数のウィンドウ係数を含むが、第１部分のウィンドウ係数のエネルギー値は第２部分のウィンドウ係数のエネルギー値よりも高く、ウィンドウ係数第１グループは後期の時間領域サンプルをウィンドウ処理するのに使用され、ウィンドウ係数第２グループは初期の時間領域サンプルをウィンドウ処理するのに使用される。また、この装置はウィンドウ処理後のサンプルを使用してオーディオ副帯値を算出する計算機（１７０）を有する。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、解析ウィンドウ関数（１９０）がウィンドウ係数列に関して非対称であるように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、第１部分のウィンドウ係数のエネルギー値がウィンドウ係数列の全てのウィンドウ係数のエネルギー値の２／３以上であり、第２部分のウィンドウ係数のエネルギー値がウィンドウ係数列の全てのウィンドウ係数のエネルギー値の１／３以下であるように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、第１部分に含まれるウィンドウ係数がウィンドウ係数列のウィンドウ係数の総合計の１／３以下の個数であり、第２部分に含まれるウィンドウ係数がウィンドウ係数列のウィンドウ係数の総合計の２／３以上の個数であるように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、解析ウィンドウ関数（１９０）のウィンドウ係数の中心点が第１部分のウィンドウ係数の指数範囲の実数値に相当するように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、解析ウィンドウ関数（１９０）が、解析ウィンドウ関数（１９０）の全てのウィンドウ係数のうちで最大の絶対値を有するウィンドウ係数から、最新の時間領域オーディオサンプルをウィンドウ処理するのに使用されるウィンドウ係数列の一つのウィンドウ係数までの、厳密に単調な減少を有するように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、解析ウィンドウ関数（１９０）が振動挙動を有するように構成される。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、指数ｎ＝（Ｔ−１）・Ｎに対応するウィンドウ係数が０．９〜１．１の範囲の絶対値を有するように構成され、ウィンドウ係数列の指数は０〜Ｎ・Ｔ−１の範囲の整数であり、フレーム（１２０）の最新の時間領域オーディオ入力サンプルをウィンドウ処理するのに使用されるウィンドウ係数は、指数Ｎ・Ｔ−１に対応するウィンドウ係数であり、解析ウィンドウ処理部（１１０）はまた、時間領域オーディオ入力サンプルのフレーム（１２０）が、そのフレーム（１２０）の最初から最新までの時間領域オーディオ入力サンプルのＴ個のブロック列を含み、各ブロックはＮ個の時間領域オーディオ入力サンプルを含み、Ｔ及びＮは正の整数であり、Ｔは４よりも大きい。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、ウィンドウ係数指数ｎ＝Ｎ・Ｔ−１に対応するウィンドウ係数が０．０２よりも小さい絶対値を有するように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、ウィンドウ処理が、ウィンドウ処理後のフレームのウィンドウ処理後のサンプルｚ（ｎ）を得るために、以下の式に基づきフレーム（１２０）の時間領域オーディオ入力サンプルｘ（ｎ）の掛け算をすることを含む。

ｎは０〜Ｔ・Ｎ−１の範囲のウィンドウ係数列の指数を示す整数であり、ｃ（ｎ）は指数ｎに対応する解析ウィンドウ関数のウィンドウ係数であり、ｘ（Ｎ・Ｔ−１）は時間領域オーディオ入力サンプルフレーム（１２０）の最新の時間領域オーディオ入力サンプルであり、解析ウィンドウ処理部（１１０）はまた、時間領域オーディオ入力サンプルフレーム（１２０）がフレーム（１２０）の最初から最新まで延びるＴ個のブロック（１３０）の時間領域オーディオ入力サンプル列を含むように構成され、各ブロックはＮ個の時間領域オーディオ入力サンプルを含み、Ｔ及びＮは正の整数、Ｔは４よりも大きい。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、ウィンドウ係数ｃ（ｎ）が付録４の表に示す関係を満たすように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、この装置（１００）は、オーディオ副帯値のために使用される合成ウィンドウ関数（３７０）の時間逆転または指数逆転版である解析ウィンドウ関数（１９０）を使用するように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、解析ウィンドウ関数の第１部分が、１よりも大きい最大絶対値を有するウィンドウ係数を含むように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、ウィンドウ係数列の全てのウィンドウ係数が実数値ウィンドウ係数であるように構成される。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、時間領域オーディオ入力サンプルフレーム（１２０）がフレーム（１２０）の最初から最新まで延びるＴ個のブロック（１３０）の時間領域オーディオ入力サンプル列を含むように構成され、各ブロックはＮ個の時間領域オーディオ入力サンプルを含み、Ｔ及びＮは正の整数、Ｔは４よりも大きい。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、ウィンドウ処理がフレーム（１２０）の時間領域オーディオ入力サンプルとウィンドウ係数列のウィンドウ係数との素子ごとの掛け算を含むように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、時間領域オーディオ入力サンプルとウィンドウ係数列に基づき、各時間領域オーディオ入力サンプルが素子ごとに解析ウィンドウ関数のウィンドウ係数で掛け算されるように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、時間領域オーディオ入力サンプルフレーム（１２０）の各時間領域オーディオ入力サンプルに対して、正確に一つのウィンドウ処理後のサンプルが生成されるように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、ウィンドウ係数指数ｎ＝（Ｔ−３）・Ｎに対応するウィンドウ係数が−０．１よりも小さい値を有し、ウィンドウ係数列の指数は０〜Ｎ・Ｔ−１の範囲の整数であり、最新の時間領域オーディオ入力サンプルをウィンドウ処理するために使用されるウィンドウ係数は、指数Ｎ・Ｔ−１に対応するウィンドウ係数である。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、ウィンドウ係数列のうち、ウィンドウ係数の第１部分が３／２・Ｎ個のウィンドウ係数を含み、ウィンドウ係数の第２部分が（Ｔ−３／２）・Ｎ個のウィンドウ係数を含むように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、ウィンドウ係数ｃ（ｎ）が付録３の表に示されている関係を満たすように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、ウィンドウ係数ｃ（ｎ）が付録２の表に示されている関係を満たすように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、解析ウィンドウ処理部（１１０）は、ウィンドウ係数ｃ（ｎ）が付録１の表に示されている関係を満たすように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、この装置（１００）は、処理されるべき時間領域オーディオ入力サンプルの現在のフレーム（１２０）が、時間領域オーディオ入力サンプルの直前のフレーム（１２０）の（Ｔ−１）個の後方のブロックを時間領域オーディオ入力サンプルの初期の方向へ１ブロックずつ移動させ、新しい時間領域オーディオサンプルのブロック（２２０）を、現在のフレーム（１２０）の最新の時間領域オーディオ入力サンプルを含むブロックとして追加することによって生成されるように、構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、この装置（１００）は、時間またはサンプル指数ｎ＝３２，…，３１９の場合、処理されるべき時間領域オーディオ入力サンプルｘ（ｎ）の現在のフレーム（１２０）が、時間領域オーディオ入力サンプルの直前のフレーム（１２０）の時間領域オーディオ入力サンプルｘ_prev（ｎ）を以下の式に基づき移動することにより生成される。

この装置（１００）はさらに、時間またはサンプル指数ｎ＝３１から始まる時間領域オーディオ入力サンプルｘ（ｎ）の現在のフレーム（１２０）のために、時間またはサンプル指数ｎが小さくなっていく次にくる時間領域オーディオ入力サンプルの順番に基づき、次にくる３２個の時間領域オーディオ入力サンプルを含ませることにより、時間領域オーディオ入力サンプルの現在のフレーム（１２０）の時間領域オーディオ入力サンプルｘ（ｎ）を生成するように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、一つのウィンドウ処理後サンプルフレーム（１５０）に基づく全ての副帯値がそのウィンドウ処理後サンプルフレーム（１５０）のウィンドウ処理後のサンプルのスペクトル表示として表されるように、計算機（１７０）はオーディオ副帯値を生成するのに適合した時間／周波数変換機を有している。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、時間／周波数変換機は複合値または実数値オーディオ副帯値を生成するよう構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、計算機（１７０）は、一つの時間領域オーディオ入力サンプルブロック（１３０）の各時間領域オーディオ入力サンプルに対して、一つのオーディオ副帯値を算出するよう構成され、各オーディオ副帯値の算出または一つの時間領域オーディオ入力サンプルブロック（１３０）の時間領域オーディオ入力サンプルのそれぞれの計算は、ウィンドウ処理後フレーム（１５０）のウィンドウ処理後のサンプルに基づいている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、計算機（１７０）は、ウィンドウ処理後のサンプル（１５０）を各副帯値のための調和振動関数で掛け算し、掛け算されたウィンドウ処理後のサンプルを合計することで、オーディオ副帯値を算出するように構成され、調和振動関数の周波数は副帯値のうちの対応する副帯の中心周波数に基づいている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、計算機（１７０）は、調和振動関数が複合指数関数、正弦関数または余弦関数であるように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、計算機（１７０）は、ｎ＝０，…，６３、ｋ＝０，…，３１の場合、以下の式に基づきオーディオ副帯値ｗ_klを算出する。

ｚ（ｎ）は指数ｎに対応するウィンドウ処理後のサンプルであり、ｋは副帯指数であり、ｌはオーディオ副帯値ブロック（１８０）の指数であり、ｆ_osc（ｘ）は実数値変数ｘに応じた振動関数である。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、計算機（１７０）は、振動関数ｆ_osc（ｘ）は以下の式のうちのいずれかである。

ｉは仮想単位である。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、この装置（１００）は、実数値時間領域オーディオ入力サンプルのフレーム（１２０）を処理するように構成されている。

本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置において、この装置（１００）は、オーディオ帯域値と共に使用されるべき合成ウィンドウ関数（３７０）を示す信号またはオーディオ副帯値を生成するために使用される解析ウィンドウ関数（１９０）を示す信号を提供するように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置は、オーディオ副帯チャンネルのオーディオ副帯値から、中間時間領域サンプル列（３３０）を算出する計算機（３１０）を有し、この列は初期の中間時間領域サンプルと後期の中間時間領域サンプルを含む。また、この装置は、ウィンドウ処理された中間時間領域サンプルを得るために、中間時間領域サンプル列（３３０）に対して、ウィンドウ係数列を含む合成ウィンドウ関数（３７０）を使用してウィンドウ処理を行う合成ウィンドウ処理部（３６０）を有し、この合成ウィンドウ関数（３７０）はウィンドウ係数列の第１部分を含むウィンドウ係数第１グループ（４２０）とウィンドウ係数列の第２部分を含むウィンドウ係数第２グループ（４３０）を含み、第１部分は第２部分よりも少ない数のウィンドウ係数を含み、第１部分のウィンドウ係数のエネルギー値は第２部分のウィンドウ係数のエネルギー値よりも高く、ウィンドウ係数第１グループは後期の中間時間領域サンプルを処理するのに使用され、ウィンドウ係数第２グループは初期の中間時間領域サンプルを処理するのに使用される。この装置は、さらに、時間領域サンプルを得るために、ウィンドウ処理後の中間時間領域サンプルを処理する重複加算出力部（４００）を有する。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、第１部分のウィンドウ係数のエネルギー値が合成ウィンドウ関数（３７０）の全てのウィンドウ係数のエネルギー値の２／３以上であり、第２部分のウィンドウ係数のエネルギー値が合成ウィンドウ関数の全てのウィンドウ係数のエネルギー値の１／３以下であるように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、第１部分に含まれるウィンドウ係数がウィンドウ係数列のウィンドウ係数の総合計の１／３以下の個数であり、第２部分に含まれるウィンドウ係数がウィンドウ係数列のウィンドウ係数の総合計の２／３以上の個数であるように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、合成ウィンドウ関数（３７０）のウィンドウ係数の中心点が第１部分のウィンドウ係数の指数範囲の実数値に相当するように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、合成ウィンドウ関数が、最新の中間時間領域オーディオサンプルをウィンドウ処理するのに使用されるウィンドウ係数列の一つのウィンドウ係数から、合成ウィンドウ関数の全てのウィンドウ係数のうちで最大の絶対値を有するウィンドウ係数までの、厳密に単調な増加を有するように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、合成ウィンドウ関数（３７０）が振動挙動を有するように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、指数ｎ＝（Ｔ−１）・Ｎに対応するウィンドウ係数が０．９〜１．１の範囲の絶対値を有し、ウィンドウ係数列の指数ｎは０〜Ｎ・Ｔ−１の範囲の整数であり、最新の中間時間領域オーディオ入力サンプルをウィンドウ処理するのに使用されるウィンドウ係数は、指数ｎ＝０に対応するウィンドウ係数であり、Ｔは中間時間領域オーディオ入力サンプルのフレーム（３３０）に含まれるブロックの数を示す４よりも大きい整数であり、この装置（３００）は、Ｎ個の時間領域オーディオサンプルを含む時間領域オーディオサンプルブロック（４１０）を生成するように構成され、Ｎは正の整数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、指数ｎ＝０に対応するウィンドウ係数が０．０２以下の絶対値を有するように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、指数ｎ＝３Ｎに対応するウィンドウ係数が−０．１よりも小さくなるように構成され、この装置（３００）は、Ｎ個の時間領域オーディオサンプルを含む時間領域オーディオサンプルブロック（４１０）を生成するように構成され、Ｎは正の整数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、ウィンドウ処理が、ウィンドウ処理後のフレームのウィンドウ処理後のサンプルｚ（ｎ）を得るために、以下の式に基づき中間時間領域サンプル列の中間時間領域サンプルｇ（ｎ）の掛け算をすることを含む。

ｎは０，…，Ｔ・Ｎ−１である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、ウィンドウ係数ｃ（ｎ）が付録４の表に示されている関係を満たすように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、この装置（３００）は、オーディオ副帯値を生成するために使用される解析ウィンドウ関数（１９０）の時間逆転または指数逆転版である合成ウィンドウ関数（３７０）を使用するように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、この装置（３００）は、Ｎ個の時間領域オーディオ入力サンプルを含む時間領域オーディオサンプルブロック（４１０）を生成するように構成され、Ｎは正の整数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、この装置（３００）は、Ｎ個のオーディオ副帯値を含むオーディオ副帯値ブロック（３２０）に基づき時間領域オーディオサンプルを生成するよう構成され、計算機（３１０）は、Ｔ・Ｎ個の中間時間領域オーディオサンプルを含む中間時間領域オーディオサンプル列（３３０）を算出するように構成され、Ｔは正の整数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、合成ウィンドウ関数がウィンドウ係数列に関して非対称であるように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、第１部分が、合成ウィンドウ関数の全てのウィンドウ係数のうちの１よりも大きい絶対値を有する最大値を含むように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、第１部分が３／２・Ｎ個のウィンドウ係数を含み、第２部分が（Ｔ−３／２）・Ｎ個のウィンドウ係数を含むよう構成され、Ｔは中間時間領域サンプルブロック（３３０）に含まれるブロック３４０の個数を示す４以上の指数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、中間時間領域サンプル列のウィンドウ処理が、中間時間領域サンプルとウィンドウ係数の素子ごとの掛け算を含むように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、中間時間領域サンプル列とウィンドウ係数列に基づき、各中間時間領域サンプルが素子ごとに合成ウィンドウ関数（３７０）のウィンドウ係数で掛け算されるように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、合成ウィンドウ関数のウィンドウ係数（３７０）が実数値であるように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、ウィンドウ係数ｃ（ｎ）が付録３の表に示されている関係を満たすように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、ウィンドウ係数ｃ（ｎ）が付録２の表に示されている関係を満たすように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、合成ウィンドウ処理部（３６０）は、ウィンドウ係数ｃ（ｎ）が付録１の表に示されている関係を満たすように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、計算機（３１０）は、オーディオ副帯値を調和振動関数で掛け算し、掛け算されたオーディオ副帯値を合計することで、中間時間領域サンプル列の中間時間領域サンプルを算出するように構成され、調和振動関数の周波数は対応する副帯の中心周波数に基づいている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、計算機（３１０）は、調和振動関数が複合指数関数、正弦関数または余弦関数であるように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、計算機（３１０）は、複合値または実数値オーディオ副帯値に基づき、実数値中間時間領域サンプルを算出するように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、計算機（３１０）は、実数値中間時間領域サンプルｚ（ｉ，ｎ）を以下の式に基づき算出するように構成されている。

整数ｎが０〜Ｎの範囲であり、Ｒｅ（ｘ）は複合値ｘの実数部分であり、π＝３．１４…は円周率である。ｆ_osc（ｘ）は調和振動関数であり、計算機に与えられるオーディオ副帯値が複合値である場合、以下の通りである。

ｉは仮想単位である。計算機（３１０）に与えられるオーディオ副帯値が実数値である場合、ｆ_osc（ｘ）は以下の通りである。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、計算機（３１０）は、中間時間領域サンプル列を生成するのに適合した周波数／時間変換機を有し、計算機（３１０）に与えられたオーディオ副帯値は中間時間領域サンプル列としてスペクトル表示される。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、周波数／時間変換機は、複合値または実数値オーディオ副帯値に基づき中間時間領域サンプル列を生成するように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、計算機（３１０）は、整数ｎが２０Ｎ−１〜２Ｎの範囲である場合、以下の式に基づき、オーディオ副帯値Ｘ（ｋ）から中間時間領域サンプル列ｇ（ｎ）を算出するように構成されている。

整数ｎが０〜２Ｎ−１の範囲の場合、以下の式に基づき算出される。

整数ｊが０〜４の範囲であり、整数ｋが０〜Ｎ−１の場合、以下の式に基づき算出される。

Ｎはオーディオ副帯値の個数つまり時間領域オーディオサンプルの個数を示し、ｖは実数値ベクトルであり、Ｖ_prevは直前に生成された時間領域オーディオサンプルの実数値ベクトルｖであり、ｉは仮想単位であり、πは円周率である。

Ｎはオーディオ副帯値の個数つまり時間領域オーディオサンプルの個数を示し、ｖは実数値ベクトルであり、Ｖ_prevは直前に生成された時間領域オーディオサンプルの実数値ベクトルｖであり、πは円周率である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、重複加算出力部（４００）は、ウィンドウ処理後の中間時間領域サンプルを重複方法でＴ個の連続するオーディオ副帯値ブロック（３２０）に基づき処理するように構成されている。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、重複加算出力部（４００）は、時間領域サンプルｏｕｔ₁（ｎ）を以下の式に基づき出力するように構成されている。

ｎはサンプル指数を示す整数であり、ｚ_ｌ，ｎはサンプル指数ｎと０〜Ｔ−１の範囲のフレーム指数または列指数ｌに対応するウィンドウ処理後の中間時間領域サンプルであり、ｌ＝０は最新のフレームまたは列に相当し、小さいｌの値は以前に生成されたフレームまたは列に相当する。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、重複加算出力部（４００）は、時間領域サンプルｏｕｔ（ｋ）を以下の式に基づき出力するように構成されている。

ｗはウィンドウ処理後の中間時間領域サンプルを含むベクトルであり、ｋは０〜Ｎ−１の範囲の指数を示す整数である。

本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置において、この装置（３００）は、オーディオ副帯値を生成するために使用された解析ウィンドウ関数（１９０）を示す信号または時間領域オーディオサンプルを生成するのに使用されるべき合成ウィンドウ関数（３７０）を示す信号を受信するように構成されている。

本発明の一実施形態によると、エンコーダ（５１０）は、本発明の一実施形態に係るオーディオ副帯チャンネルのオーディオ副帯値を生成する装置（５６０）を含む。

本発明の一実施形態によると、エンコーダ（５１０）はさらに、オーディオ副帯チャンネルのオーディオ副帯値を生成する装置（５６０）に接続され、装置（５６０）によって出力されたオーディオ副帯値を量子化・符号化し、量子化及び符号化されたオーディオ副帯値を出力するように構成されている量子化・符号化部（５７０）を含む。

本発明の一実施形態によると、デコーダ（５８０）は、本発明の一実施形態に係る時間領域オーディオサンプルを生成する装置（６００）を含む。

本発明の一実施形態によると、デコーダ（５８０）はさらに、オーディオ副帯値を生成する装置（５６０）に接続され、符号化・量子化されたオーディオ副帯値を受信するように構成され、時間領域オーディオサンプルを生成する装置に接続され、復号化・復量子化されたオーディオ副帯値をオーディオ副帯値として装置（６００）に提供するように構成された復量子化・復号化部（５９０）を含む。

本発明の一実施形態によると、ＳＢＲエンコーダ（５２０）は、ＳＢＲエンコーダ（５２０）に与えられた時間領域オーディオ入力サンプルフレームに基づき、オーディオ副帯チャンネルのオーディオ副帯値を生成する装置（５３０）、及びオーディオ副帯値を生成する装置（５３０）に接続され、オーディオ副帯値に基づきＳＢＲパラメータを抜粋、出力するＳＢＲパラメータ抜粋モジュール（５４０）を含む。

本発明の一実施形態によると、システム（６１０）は、システム（６１０）に与えられた時間領域オーディオ入力サンプルフレームに基づき、オーディオ副帯値を生成する装置（６２０）、及びオーディオ副帯値生成装置（６２０）によって生成されたオーディオ副帯値に基づき、時間領域オーディオサンプルを生成する装置（６４０）を含む。

本発明の一実施形態によると、システム（６１０）はＳＢＲデコーダを含む。

本発明の一実施形態によると、システムはさらに、オーディオ副帯値を生成する装置（６２０）と時間領域オーディオサンプルを生成する装置（６４０）との間に相互接続され、ＳＢＲデータを受信し、ＳＢＲデータとオーディオ副帯値生成装置（６２０）からのオーディオ副帯値に基づきオーディオ副帯値を修正または加算するように構成されたＨＦ生成部（６３０）を含む。

本発明の実施形態に係る全ての装置及び方法に関して、実施の詳細により、付録１，３の表に示されている値に基づくウィンドウ係数を得るために、指数１２８〜２５５，３８４〜５１１に対応するウィンドウ係数に関する符号変換（比率−１の掛け算）がさらに実行されてもよい。つまり、ウィンドウ関数のウィンドウ係数は付録１の表に示されているウィンドウ係数に基づくものである。図面に示されているウィンドウ関数のウィンドウ係数を得るために、指数０〜１２７，２５６〜３８３，５１２〜６３９に対応する表中のウィンドウ係数が（＋１）で掛けられ（つまり符号変換は行われない）、指数１２８〜２５５，３８４〜５１１に対応するウィンドウ係数は（−１）で掛けられる（つまり符号変換が行われる）必要がある。付録３の表に示されている関係をこのように扱う必要がある。

さらなる遅延、要因、付加的な係数の導入及び別の簡単な関数の導入も、式に基づく本応用の構造に含まれると理解されるべきである。さらに、簡単な定数、定加数などは削除してもよい。また、代数変換、同値変換及び近似式（例えばテイラー近似式）は式の結果を全くあるいは意義深く変えることはない。換言すれば、わずかな変更や変換が結果において本質的に同じものとなるならば、それらは、式に基づいていると考えられる。

以上、本発明を特に実施形態に関して説明してきたが、当業者にとっては、本発明の要旨の範囲内での形や詳細における多様な変更が可能である。これらの変更は、ここで開示し、以下のクレームにより理解される広い概念から離れない限り、本発明の別の実施形態として理解すべきである。

オーディオ副帯値を生成する装置の一実施形態を示すブロック図である。時間領域オーディオサンプルを生成する装置の一実施形態を示すブロック図である。時間領域オーディオサンプルを生成する装置としての本発明の一実施形態に係る基本原理の説明図である。本発明の一実施形態に係るウィンドウ係数の補間の概念の説明図である。正弦ウィンドウ関数の場合におけるウィンドウ係数の補間の説明図である。ＳＢＲデコーダとＳＢＲエンコーダを含む本発明の一実施形態のブロック図である。ＳＢＲシステムの遅延源の説明図である。オーディオ副帯値を生成する方法の一実施形態を示すフローチャートである。図７ａに示した方法の実施形態の一ステップの説明図である。オーディオ副帯値を生成する方法の一実施形態を示すフローチャートである。時間領域サンプルを生成する方法の比較例を示すフローチャートである。時間領域サンプルを生成する方法の比較例を示すフローチャートである。時間領域サンプルを生成する方法の一実施形態を示すフローチャートである。時間領域サンプルを生成する方法の他の実施形態を示すフローチャートである。オーディオ副帯値を生成する方法の比較例の可能な実行を示す。オーディオ副帯値を生成する方法の一実施形態の可能な実行を示す。時間領域サンプルを生成する方法の比較例の可能な実行を示す。時間領域サンプルを生成する方法の比較例の別の可能な実行を示す。本発明の一実施形態に係る合成ウィンドウ関数と正弦ウィンドウ関数との比較を示す。本発明の実施形態に係る合成ウィンドウ関数とＳＢＲＱＭＦプロトタイプフィルター関数との比較を示す。図１２に示したウィンドウ関数とＳＢＲＱＭＦプロトタイプフィルター関数によって生じる遅延の違いを示す。従来のＡＡＣ−ＬＤ＋ＳＢＲコーデックと本発明の実施形態を含むＡＡＣ−ＥＬＤコーデックの遅延への影響の違いを示す表である。異なるコーデックの異なる部分の遅延に関する詳細を含む別の表である。本発明の一実施形態に係るウィンドウ関数に基づく装置と正弦ウィンドウ関数に基づく装置の周波数応答の比較を示す。図１５ａに示す周波数応答の一部拡大図である。四つの異なるウィンドウ関数の比較を示す。図１６ａに示す周波数応答の一部拡大図である。二つの異なるウィンドウ関数の周波数応答の比較を示し、一つは本発明に係るウィンドウ関数であり、他方は対称ウィンドウ関数である。人の耳の一般的な一時的マスキング特性を示す概略図である。元々のオーディオ時間信号、ＨＥＡＡＣコーデックにより生成された時間信号、及び本発明の一実施形態を含むコーデックによる時間信号の比較を示す。

Claims

オーディオ副帯チャンネルのオーディオ副帯値を生成する装置であり、以下のものを含む、
ウィンドウ処理後のサンプルを得るために、初期のサンプルから後期のサンプルに至る時間列にある時間領域入力サンプルのフレーム（１２０）を、ウィンドウ係数列を含む解析ウィンドウ関数（１９０）を使用してウィンドウ処理するための解析ウィンドウ処理部（１１０）であり、該解析ウィンドウ関数は第１の個数のウィンドウ係数を含み、該第１の個数のウィンドウ係数は、より多い第２の個数のウィンドウ係数を有する列を含むより大きいウィンドウ関数から導き出される、
前記ウィンドウ関数のウィンドウ係数は、前記より大きいウィンドウ関数のウィンドウ係数の補間により、導き出され、
前記第２の個数は偶数である、及び
前記ウィンドウ処理後のサンプルを使用して、オーディオ帯域値を算出するための計算機（１７０）。
請求項１に記載の装置（１００）であり、該装置（１００）は、前記ウィンドウ関数のウィンドウ係数を得るために、より大きいウィンドウ関数のウィンドウ係数を補間するように構成されている。
請求項１または２に記載の装置（１００）であり、該装置（１００）または前記解析ウィンドウ処理部（１１０）は、前記ウィンドウ関数のウィンドウ係数が直線的に補間されるように構成されている。
請求項１、２または３に記載の装置（１００）であり、該装置（１００）または前記解析ウィンドウ処理部（１１０）は、前記ウィンドウ関数の一つのウィンドウ係数を得るために、前記解析ウィンドウ関数のウィンドウ係数が、前記より大きいウィンドウ関数のウィンドウ係数列に応じて、より大きいウィンドウ関数の二つの連続するウィンドウ係数に基づき、補間されるように構成されている。
請求項１、２、３または４に記載の装置（１００）であり、該装置（１００）または前記解析ウィンドウ処理部（１１０）は、以下の式に基づき、前記解析ウィンドウ関数のウィンドウ係数ｃ（ｎ）を得るように構成されている、

ｎは該ウィンドウ係数ｃ（ｎ）の指数を示す整数であり、ｃ₂（ｎ）は前記より大きいウィンドウ関数のウィンドウ係数である。
請求項５に記載の装置（１００）であり、該装置（１００）または前記解析ウィンドウ処理部（１１０）は、前記より大きいウィンドウ関数のウィンドウ係数ｃ₂（ｎ）が付録４の表に示されている関係に従うように構成されている。
請求項１、２、３、４、５または６に記載の装置（１００）であり、前記解析ウィンドウ処理部（１１０）は、ウィンドウ処理が、ウィンドウ処理後のサンプルｘ（ｎ）のウィンドウ処理後フレームを得るための、以下の式に基づく前記フレーム（１２０）の時間領域オーディオ入力サンプルｘ（ｎ）の掛け算を含むように構成されている、

ｎは０〜Ｔ・Ｎ−１の範囲でウィンドウ係数列の指数を示す整数であり、ｃ（ｎ）は指数ｎに対応する前記解析ウィンドウ関数のウィンドウ係数であり、ｘ（Ｎ・Ｔ−１）は時間領域オーディオ入力サンプルフレーム（１２０）の最新の時間領域オーディオ入力サンプルであり、該解析ウィンドウ処理部（１１０）は、該時間領域オーディオ入力サンプルフレーム（１２０）が、フレーム（１２０）の最初の時間領域オーディオ入力サンプルから最新の時間領域オーディオ入力サンプルに至る時間領域オーディオ入力サンプルのＴ個のブロック（１３０）の列を含むように構成され、各ブロックはＮ個の時間領域オーディオ入力サンプルを含み、Ｔ及びＮは正の整数であり、Ｔは４よりも大きい。
請求項１、２、３、４、５、６または７に記載の装置（１００）であり、前記解析ウィンドウ処理部（１１０）は、前記解析ウィンドウ関数（１９０）が前記ウィンドウ係数列の第１部分を含むウィンドウ係数第１グループ（２００）及び前記ウィンドウ係数列の第２部分を含むウィンドウ係数第２グループ（２１０）を有するように構成され、該第１部分は該第２部分よりも少ないウィンドウ係数を含み、該第１部分のウィンドウ係数のエネルギー値は該第２部分のウィンドウ係数のエネルギー値よりも高く、該ウィンドウ係数第１グループは後期の時間領域サンプルをウィンドウ処理するために使用され、該ウィンドウ係数第２グループは初期の時間領域サンプルをウィンドウ処理するために使用される。
請求項１、２、３、４、５、６、７または８に記載の装置（１００）であり、該装置（１００）は、前記オーディオ副帯値のために使用されるべき合成関数（３７０）の時間逆転版または指数逆転版である解析ウィンドウ関数（１９０）を使用するように構成されている。
請求項１、２、３、４、５、６、７、８または９に記載の装置（１００）であり、該解析ウィンドウ処理部（１１０）は、前記より大きいウィンドウ関数が前記ウィンドウ係数列に関して非対称であるように構成されている。
時間領域サンプルを生成する装置（３００）であり、以下のものを含む、
オーディオ副帯チャンネルのオーディオ副帯値から中間時間領域サンプル列（３３０）を算出するための計算機（３１０）であり、該列は初期の中間時間領域サンプルと後期の中間時間領域サンプルを含む、
ウィンドウ処理後の中間時間領域サンプルを得るために、前記中間時間領域サンプル列（３３０）を、ウィンドウ係数列を含む合成ウィンドウ関数（３７０）を使用してウィンドウ処理するための合成ウィンドウ処理部（３６０）であり、該合成ウィンドウ関数は第１の個数のウィンドウ係数を含み、該第１の個数のウィンドウ係数は、より多い第２の個数のウィンドウ係数を有する列を含むより大きいウィンドウ関数から導き出される、
前記ウィンドウ関数のウィンドウ係数は、前記より大きいウィンドウ関数のウィンドウ係数の補間により、導き出され、
前記第２の個数は偶数である、及び
時間領域サンプルを得るために、前記ウィンドウ処理後の中間時間領域サンプルを処理するための重複加算出力部（４００）。
請求項１１に記載の装置（３００）であり、該装置（３００）は、前記ウィンドウ関数のウィンドウ係数を得るために、前記より大きいウィンドウ関数のウィンドウ係数を補間するように構成されている。
請求項１１または１２に記載の装置（３００）であり、該装置（３００）は、前記合成ウィンドウ関数のウィンドウ係数が直線的に補間されるように構成されている。
請求項１１、１２または１３に記載の装置（３００）であり、該装置（３００）は、前記ウィンドウ関数の一つのウィンドウ係数を得るために、前記合成ウィンドウ関数のウィンドウ係数が、前記より大きいウィンドウ関数のウィンドウ係数列に応じて、より大きいウィンドウ関数の二つの連続するウィンドウ係数に基づき、補間されるように構成されている。
請求項１１、１２、１３または１４に記載の装置（３００）であり、該装置（３００）は、以下の式に基づき、前記合成ウィンドウ関数のウィンドウ係数ｃ（ｎ）を得るように構成されている、

ｃ₂（ｎ）は、指数ｎに対応する前記より大きいウィンドウ関数のウィンドウ係数である。
請求項１５に記載の装置（３００）であり、該装置（３００）は、ウィンドウ係数ｃ₂（ｎ）が付録４の表に示されている関係を満足するように構成されている。
請求項１１、１２、１３、１４、１５または１６に記載の装置（３００）であり、前記合成ウィンドウ処理部（３６０）は、ウィンドウ処理が、ウィンドウ処理後のサンプルｚ（ｎ）のウィンドウ処理後フレーム（３８０）を得るための、以下の式に基づく前記中間時間領域サンプル列の中間時間サンプルｇ（ｎ）の掛け算を含むように構成されている、

ｎ＝０，…，Ｔ・Ｎ−１である。
請求項１１、１２、１３、１４、１５、１６または１７に記載の装置（３００）であり、前記合成ウィンドウ処理部（３６０）は、前記合成ウィンドウ処理（３７０）が前記ウィンドウ係数列の第１部分を含むウィンドウ係数第１グループ（４２０）及び前記ウィンドウ係数列の第２部分を含むウィンドウ係数第２グループ（４３０）を有するように構成され、該第１部分は該第２部分よりも少ないウィンドウ係数を含み、該第１部分のウィンドウ係数のエネルギー値は該第２部分のウィンドウ係数のエネルギー値よりも高く、該ウィンドウ係数第１グループは後期の中間時間領域サンプルをウィンドウ処理するために使用され、該ウィンドウ係数第２グループは初期の中間時間領域サンプルをウィンドウ処理するために使用される。
請求項１１、１２、１３、１４、１５、１６、１７または１８に記載の装置（３００）であり、該装置（３００）は、前記オーディオ副帯値を生成するために使用される解析関数（１９０）の時間逆転版または指数逆転版である合成ウィンドウ関数（３７０）を使用するように構成されている。
請求項１１、１２、１３、１４、１５、１６、１７、１８または１９に記載の装置（３００）であり、前記合成ウィンドウ処理部（３６０）は、前記より大きいウィンドウ関数がウィンドウ係数列に関して非対称であるように構成されている。
オーディオ副帯チャンネルのオーディオ副帯値を生成する方法であり、以下のステップを含む、
ウィンドウ処理後のサンプルを得るために、初期のサンプルから後期のサンプルに至る時間列にある時間領域入力サンプルのフレームを、解析ウィンドウ関数を使用してウィンドウ処理するステップであり、該解析ウィンドウ関数は第１の個数のウィンドウ係数を含み、該第１の個数のウィンドウ係数は、より多い第２の個数のウィンドウ係数を有する列を含むより大きいウィンドウ関数から導き出される、
前記ウィンドウ関数のウィンドウ係数は、前記より大きいウィンドウ関数のウィンドウ係数の補間により、導き出され、
前記第２の個数は偶数である、及び
前記ウィンドウ処理後のサンプルを使用して、オーディオ帯域値を算出するステップ。
時間領域オーディオサンプルを生成する方法であり、以下のステップを含む、
オーディオ副帯チャンネルのオーディオ副帯値から中間時間領域サンプル列を算出するステップであり、該列は初期の中間時間領域サンプルと後期の中間時間領域サンプルを含む、
ウィンドウ処理後の中間時間領域サンプルを得るために、前記中間時間領域サンプル列を、合成ウィンドウ関数を使用してウィンドウ処理するステップであり、該合成ウィンドウ関数は第１の個数のウィンドウ係数を含み、該第１の個数のウィンドウ係数は、より多い第２の個数のウィンドウ係数を有する列を含むより大きいウィンドウ関数から導き出される、
前記ウィンドウ関数のウィンドウ係数は、前記より大きいウィンドウ関数のウィンドウ係数の補間により導き出され、
前記第２の個数は偶数である、及び
時間領域サンプルを得るために、前記ウィンドウ処理後の中間時間領域サンプルを重複加算するステップ。
プロセッサで起動された際、請求項２１または２２に記載の方法を実行するためのプログラムコードを有するプログラム。