JP5247937B2

JP5247937B2 - オーディオ信号符号器、オーディオ信号復号器、エイリアシング消去を用いたオーディオ信号の符号化又は復号化方法

Info

Publication number: JP5247937B2
Application number: JP2012534673A
Authority: JP
Inventors: ブルーノベセッテ; マックスノイエンドルフ; ラルフガイガー; フィリッペグールネイ; ロッホレフェーブレ; ベルンハルトグリル; ジェレミーレコンテ; ステファンバイエル; ニコラスレッテルバッハ; ラルスヴィレモース; レドワンサラミ; ブリンカーアルベルツスツェーデン
Original assignee: Dolby International AB
Current assignee: Dolby International AB
Priority date: 2009-10-20
Filing date: 2010-10-19
Publication date: 2013-07-24
Anticipated expiration: 2030-10-19
Also published as: US8484038B2; EP4362014A1; US20120271644A1; CA2778382C; BR112012009447B1; JP2013508765A; ZA201203608B; EP2491556B1; RU2591011C2; CN102884574B; EP2491556A1; CA2778382A1; AR078704A1; KR20120128123A; CN102884574A; AU2010309838A1; WO2011048117A1; MX2012004648A; EP4358082A1; TW201129970A

Description

本発明の実施形態は、オーディオコンテンツの符号化された表現に基づいて、オーディオコンテンツの復号化された表現を生成するオーディオ信号復号器を提供する。

本発明の実施形態は、オーディオコンテンツの入力表現に基づいて、スペクトル係数の第１セットとエイリアシング消去刺激信号（aliasing-cancellation stimulus signal）の表現と複数の線形予測ドメインパラメータとを含む、オーディオコンテンツの符号化された表現を生成するためのオーディオ信号符号器を提供する。

本発明の実施形態は、オーディオコンテンツの符号化された表現に基づいて、オーディオコンテンツの復号化された表現を生成する方法を提供する。

本発明の実施形態は、オーディオコンテンツの入力表現に基づいて、オーディオコンテンツの符号化された表現を生成する方法を提供する。

本発明の実施形態は、上述した方法の一つを実行させるコンピュータプログラムを提供する。

本発明の実施形態は、統一されたスピーチ及びオーディオ符号化(unified-speech-and-audio-coding)（省略形はＵＳＡＣとして示される）窓処理(windowing)とフレーム遷移(frame transitions)との統合のための概念を提供する。

以下に、本発明及びその利点についての理解を促すため、本発明のある背景について説明する。

過去１０年において、オーディオコンテンツをデジタルで記憶して配給する可能性を創造することに対し、大きな努力が注がれてきた。この道筋における１つの重要な成果は、国際標準ＩＳＯ／ＩＥＣ１４４９６−３．である。この標準のＰａｒｔ３はオーディオコンテンツの符号化及び復号化に関するものであり、Ｐａｒｔ３のｓｕｂ−ｐａｒｔ４は一般的なオーディオ符号化に関している。ＩＳＯ／ＩＥＣ１４４９６−３, ｐａｒｔ３，ｓｕｂ−ｐａｒｔ４は一般的なオーディオ符号化の符号化及び復号化の概念を定義する。加えて、品質を向上させ及び／又は必要なビットレートを低減させるために、更なる改良が提案されて来た。さらに、周波数ドメインベースのオーディオ符号器のパーフォーマンスは、スピーチを含むオーディオコンテンツにとっては最適ではないことが分かってきた。近年、言葉即ちスピーチの符号化とオーディオ符号化との両方からの技術を効果的に結合した、統一されたスピーチ及びオーディオコーデックが提案されてきた。詳細については、非特許文献１を参照されたい。

"A Novel Scheme for Low Bitrate Unified Speech and Audio Coding _ MPEG-RM0"of M.Neuendorf et al.(presented at the 126th Convention of the Audio Engineering Society, May 7-10, 2009, Munich, Germany) M. Xie and J.-P. Adoul,"Embedded algebraic vector quantization (EAVQ) with application to wideband audio coding,"IEEE International Conference on Acoustics, Speech, and Signal Processing (ICASSP), Atlanta, GA, USA, vol. 1, pp. 240-243, 1996. ISO/IEC JTC1/SC29/WG11, MPEG2009/M16688, June-July 2009, London, United Kingdom, "Alternatives for windowing in USAC"

前述のようなオーディオ符号器においては、いくつかのオーディオフレームは周波数ドメインで符号化され、いくつかのオーディオフレームは線形予測ドメインで符号化される。

しかし、有意な量のビットレートを犠牲にせずに、異なるドメインで符号化されたフレーム間の遷移を達成することは難しいことが分かってきた。

そこで、スピーチと一般的なオーディオとの両方を含むオーディオコンテンツを符号化及び復号化するための概念であって、異なるモードを使用して符号化された部分の間の遷移を効果的に実現させる概念を創造することが求められている。

本発明の実施形態は、オーディオコンテンツの符号化された表現に基づいて、オーディオコンテンツの復号化された表現を生成するオーディオ信号復号器を提供するものである。このオーディオ復号器は、変換ドメイン経路（例えば変換符号化励起線形予測ドメイン経路(transform-coded excitation liner-prediction-domain-path)）を含み、その変換ドメイン経路は、スペクトル係数の第１セットとエイリアシング消去刺激信号の表現と複数の線形予測ドメインパラメータ（例えば線形予測符号化フィルタ係数(linear-prediction-coding filter coefficients)）とに基づいて、ある変換ドメインモードで符号化されたオーディオコンテンツの時間ドメイン表現を得るよう構成されている。前記変換ドメイン経路は、線形予測ドメインパラメータの少なくとも１つのサブセットに依存して、スペクトル係数の（第１の）セットに対するスペクトル成形を適用し、そのスペクトル係数の第１セットのスペクトル的に成形されたバージョンを得る、スペクトル処理器を含む。前記変換ドメイン経路はまた、そのスペクトル係数の第１セットのスペクトル的に成形されたバージョンに基づいて、オーディオコンテンツの時間ドメイン表現を得る、（第１の）周波数ドメイン／時間ドメイン変換器を含む。変換ドメイン経路は、前記線形予測ドメインパラメータの少なくとも１つのサブセットに依存してエイリアシング消去刺激信号をフィルタ処理し、そのエイリアシング消去刺激信号からエイリアシング消去合成信号を導出する、エイリアシング消去刺激フィルタをさらに含む。前記変換ドメイン経路は、オーディオコンテンツの時間ドメイン表現とエイリアシング消去合成信号又はその後処理済のバージョンとを結合し、エイリアシングが低減された時間ドメイン信号を得る結合器をさらに含む。

本発明の実施形態は、次のような知見に基づく。即ち、スペクトル係数の第１セットについてスペクトル係数のスペクトル成形を周波数ドメインで実行し、かつエイリアシング消去刺激信号の時間ドメインでのフィルタ処理によってエイリアシング消去合成信号を計算するオーディオ復号器であって、前記スペクトル係数のスペクトル成形と前記エイリアシング消去刺激信号の時間ドメインフィルタ処理との両方を線形予測ドメインパラメータに依存して実行するオーディオ復号器は、異なるノイズ成形を用いて符号化されたオーディオ信号の部分（例えばフレーム）からの遷移又はその部分への遷移に対して良好に適合するという知見である。そのため、マルチモード・オーディオ信号符号化の異なるモードで符号化されたオーディオ信号の（例えばオーバーラップしているか又はオーバーラップしていないフレーム間の）遷移は、上述のようなオーディオ信号復号器により、良好な聴覚的品質と適度なオーバーヘッドでレンダリング可能となる。

例えば、係数の第１セットのスペクトル成形を周波数ドメインにおいて実行すれば、変換ドメインにおいて異なるノイズ成形概念を用いて符号化されたオーディオコンテンツの部分（例えばフレーム）の間の遷移が可能になり、このとき、異なるノイズ成形方法（例えばスケールファクタベースのノイズ成形や線形予測ドメインパラメータベースのノイズ成形など）を用いて符号化されたオーディオコンテンツの異なる部分の間で、エイリアシング消去を良好な効率で達成できる。さらに、上述した概念は、（例えば１つは変換ドメインで、他の１つは代数符号励起線形予測ドメイン（algebraic-code-excited-linear-prediction-domain）であるような）異なるドメインで符号化されたオーディオコンテンツの部分（例えばフレーム）の間で、エイリアシング・アーチファクトを効率的に低減させることができる。（例えば変換符号化励起線形予測ドメインモードで符号化されていても良い）オーディオコンテンツの現時点の部分のノイズ成形が、たとえ時間ドメインフィルタ処理ではなく周波数ドメインで実行された場合でも、エイリアシング消去刺激信号の時間ドメインフィルタ処理を使用することで、代数符号励起線形予測モードで符号化されたオーディオコンテンツのある部分からの又はその部分への遷移におけるエイリアシング消去が可能になる。

要約すれば、本発明の実施形態は、必要とされるサイド情報と、３つの異なるモード（例えば周波数ドメインモード、変換符号化励起線形予測ドメインモード、及び代数符号励起線形予測モード）で符号化されたオーディオコンテンツの部分間の遷移における知覚的品質と、の間における良好な妥協点をもたらす。

本発明の好適な実施形態においては、オーディオ信号復号器は、複数の符号化モードの間の切替を実行するよう構成されたマルチモードのオーディオ信号復号器である。この場合、変換ドメインの分枝は、オーディオコンテンツのある部分のためのエイリアシング消去合成信号を選択的に取得するよう構成されており、その部分とは、エイリアシング消去・オーバーラップ加算操作を許可しないようなオーディオコンテンツの先行部分に続いているか、又は、エイリアシング消去・オーバーラップ加算操作を許可しないようなオーディオコンテンツの部分を後続部分として持つ部分である。スペクトル係数の第１セットをスペクトル成形することで実行されるノイズ成形の適用により、変換ドメインで（例えばスケールファクタベースのノイズ成形概念及び線形予測ドメインパラメータベースのノイズ成形概念などの）異なるノイズ成形概念を使用して符号化されたオーディオコンテンツ部分間における、エイリアシング消去信号を使用しない遷移が可能になる。なぜなら、スペクトル成形の後で第１の周波数ドメイン／時間ドメイン変換器を使用することで、たとえ連続するオーディオフレーム間で異なるノイズ成形の手法が使用されても、変換ドメインで符号化された連続するフレーム間の効率的なエイリアシング消去が可能となるからである。そのため、非変換ドメイン（例えば代数符号励起線形予測モード）で符号化されたオーディオコンテンツの一部分からの又は一部分への変換だけのためにエイリアシング消去合成信号を選択的に取得することで、ビットレート効率化を達成できる。

本発明の好適な実施形態においては、オーディオ信号復号器は、変換符号化励起情報及び線形予測ドメインパラメータ情報を使用する変換符号化励起線形予測ドメインモードと、スペクトル係数情報及びスケールファクタ情報を使用する周波数ドメインモードとの間での切替を実行する。この場合、前記変換ドメイン経路は、変換符号化励起情報に基づいてスペクトル係数の第１セットを取得し、線形予測ドメインパラメータ情報に基づいて線形予測ドメインパラメータを取得する。オーディオ信号復号器は、スペクトル係数情報によって記述されたスペクトル係数の周波数ドメインモードの１セットに基づき、さらにスケールファクタ情報によって記述されたスケールファクタの１セットに依存して、周波数ドメインモードで符号化されたオーディオコンテンツの時間ドメイン表現を取得する、周波数ドメイン経路を含む。周波数ドメイン経路は、スペクトル係数の周波数ドメインモードの前記１セット又はそのセットの前処理済のバージョンに対し、スケールファクタに依存するスペクトル成形を適用し、スペクトル係数のスペクトル的に成形された周波数ドメインモードの１セットを取得する、スペクトル処理器を含む。周波数ドメイン経路は、そのスペクトル係数のスペクトル的に成形された周波数ドメインモードの前記１セットに基づいて、オーディオコンテンツの時間ドメイン表現を取得する、周波数ドメイン／時間ドメイン変換器をさらに含む。オーディオ信号復号器は、オーディオコンテンツの２つの連続する部分の時間ドメイン表現であって、その連続する部分のうちの１つが変換符号化励起線形予測ドメインモードで符号化されており、他の１つが周波数ドメインモードで符号化されているような２つの連続する部分の時間ドメイン表現が、周波数ドメインから時間ドメインへの変換に起因する時間ドメインエイリアシングを消去するための時間的オーバーラップを含むよう構成されている。

上述したように、本発明の概念は、オーディオコンテンツの変換符号化励起線形予測ドメインモードで符号化された部分と周波数ドメインで符号化された部分との間の遷移に良好に適している。変換符号化励起線形予測ドメインモードにおいては、周波数ドメインでスペクトル成形が実行されるという事実から、非常に高品質のエイリアシング消去が達成される。

本発明の好適な実施形態においては、オーディオ信号復号器は、変換符号化励起情報及び線形予測ドメインパラメータ情報を使用する変換符号化励起線形予測ドメインモードと、代数符号励起情報及び線形予測ドメインパラメータ情報を使用する代数符号励起線形予測モードとの間の切替を実行する。この場合、前記変換ドメイン経路は、変換符号化励起情報に基づいてスペクトル係数の第１セットを取得し、線形予測ドメインパラメータ情報に基づいて線形予測ドメインパラメータを取得する。オーディオ信号復号器は、代数符号励起情報及び線形予測ドメインパラメータ情報に基づいて、代数符号励起線形予測（以後は省略形のＡＣＥＬＰでも示す）モードで符号化されたオーディオコンテンツの時間ドメイン表現を取得する、代数符号励起線形予測経路を含む。この場合、ＡＣＥＬＰ経路は、代数符号励起情報に基づいて時間ドメイン励起信号を提供するＡＣＥＬＰ励起処理器と、時間ドメインフィルタ処理を実行する合成フィルタとを含み、この合成フィルタは、時間ドメイン励起信号に基づいて、さらに線形予測ドメインパラメータ情報に基づき取得された線形予測ドメインフィルタ係数に依存して、再構築された信号を提供する。変換ドメイン経路は、ＡＣＥＬＰモードで符号化されたオーディオコンテンツの一部分に続く、変換符号化励起線形予測ドメインモードで符号化されたオーディオコンテンツの一部分と、ＡＣＥＬＰモードで符号化されたオーディオコンテンツの一部分に先行する、変換符号化励起線形予測ドメインモードで符号化されたオーディオコンテンツの一部分と、のために、エイリアシング消去合成信号を選択的に提供する。エイリアシング消去合成信号は、変換符号化励起線形予測ドメイン（以後は省略形のＴＣＸ−ＬＰＤでも示す）モードで符号化された部分（例えばフレーム）と、ＡＣＥＬＰモードで符号化された部分との間の遷移に非常に適していることが分かってきた。

本発明の好適な実施形態においては、エイリアシング消去刺激フィルタは、ＡＣＥＬＰモードで符号化されたオーディオコンテンツの一部分に続く、ＴＣＸ−ＬＰＤモードで符号化されたオーディオコンテンツの一部分については、第１の周波数ドメイン／時間ドメイン変換器の左側エイリアシング折り返し点(folding point)に対応する線形予測ドメインフィルタパラメータに依存して、エイリアシング消去刺激信号をフィルタ処理するよう構成されている。エイリアシング消去刺激フィルタは、ＡＣＥＬＰモードで符号化されたオーディオコンテンツの一部分に先行する、変換符号化励起線形予測ドメインモードで符号化されたオーディオコンテンツの一部分については、第１の周波数ドメイン／時間ドメイン変換器の右側エイリアシング折り返し点に対応する線形予測ドメインフィルタパラメータに依存して、エイリアシング消去刺激信号をフィルタ処理する。エイリアシング折り返し点に対応する線形予測ドメインフィルタパラメータを適用することで、非常に効率的なエイリアシング消去が得られる。また、エイリアシング折り返し点に対応する線形予測ドメインフィルタパラメータは一般的に簡単に取得できる。なぜなら、エイリアシング折り返し点は大抵１つのフレームから次のフレームへの遷移にあり、そのような線形予測ドメインフィルタパラメータを伝送することがいずれにしても必要となるからである。従って、オーバーヘッドは最小に維持される。

本発明の他の実施形態においては、オーディオ信号復号器は、エイリアシング消去合成信号を提供するためにエイリアシング消去刺激フィルタのメモリ値をゼロに初期化し、さらに、エイリアシング消去刺激信号のＭ個のサンプルをエイリアシング消去刺激フィルタへと送ることで、エイリアシング消去合成信号の対応する非ゼロの入力応答サンプルを取得し、更にはエイリアシング消去合成信号の複数のゼロ入力応答サンプルを取得する。結合器は、好適にはオーディオコンテンツの時間ドメイン表現を非ゼロ入力応答サンプル及び後続のゼロ入力応答サンプルと結合し、ＡＣＥＬＰモードで符号化されたオーディオコンテンツの部分からそのＡＣＥＬＰモードで符号化されたオーディオコンテンツの部分に続くＴＣＸ−ＬＰＤモードで符号化されたオーディオコンテンツの部分への遷移において、エイリアシング低減済み時間ドメイン信号を取得するよう構成されている。非ゼロの入力応答サンプルとゼロ入力応答サンプルとの両方を役立てることで、エイリアシング消去刺激フィルタを十分に利用することができる。さらに、エイリアシング消去刺激信号の必要なサンプル数を最低限に維持しながら、非常に滑らかなエイリアシング消去合成信号を得ることができる。さらに、上述の概念を使用することで、典型的なエイリアシング・アーチファクトに対してエイリアシング消去合成信号のある形が良好に適合することが分かって来た。そのため、符号化の効率とエイリアシング消去との間での良好な妥協点を得ることができる。

本発明の好適な実施形態においては、オーディオ信号復号器は、ＡＣＥＬＰモードを使用して得られた時間ドメイン表現の少なくとも一部分の窓処理されかつ折り返されたバージョンと、ＴＣＸ−ＬＰＤモードを使用して得られたオーディオコンテンツの後続の部分の時間ドメイン表現とを結合し、少なくとも部分的にエイリアシングを消去する。エイリアシング消去合成信号の生成に加えてそのようなエイリアシング消去メカニズムを使用することで、ビットレート効率が非常に良い方法でエイリアシング消去を達成できる可能性があることが分かって来た。特に、エイリアシング消去において、もしエイリアシング消去合成信号がＡＣＥＬＰモードを使用して得られた時間ドメイン表現の少なくとも一部分の窓処理されかつ折り返されたバージョンに基づいている場合には、必要とされるエイリアシング消去刺激信号を高い効率で符号化することができる。

本発明の好適な実施形態においては、オーディオ信号復号器は、ＡＣＥＬＰ分枝の合成フィルタのゼロ・インパルス応答の窓処理済みバージョンと、ＴＣＸ−ＬＰＤモードを使用して得られたオーディオコンテンツの後続の部分の時間ドメイン表現とを結合し、少なくとも部分的にエイリアシングを消去する。そのようなゼロ・インパルス応答の使用は、エイリアシング消去刺激信号の符号化効率を向上させることに役立つ可能性もあることが分かって来た。なぜなら、ＡＣＥＬＰ分枝の合成フィルタのゼロ・インパルス応答は、典型的に、オーディオコンテンツのＴＣＸ−ＬＰＤ符号化された部分におけるエイリアシングの少なくとも一部を消去するからである。従って、エイリアシング消去合成信号のエネルギーは低減され、その結果、エイリアシング消去刺激信号のエネルギーが低減される。しかし、より小さなエネルギーで信号を符号化することは、一般的にはより低いビットレート条件でも可能となる。

本発明の好適な実施形態においては、オーディオ信号復号器は、ラップされた周波数ドメイン／時間ドメイン変換が使用されるＴＣＸ−ＬＰＤモードと、ラップされた周波数ドメイン／時間ドメイン変換が使用される周波数ドメインモードと、代数符号励起線形予測モードとの間の切替を実行する。この場合、オーディオ信号復号器は、ＴＣＸ−ＬＰＤモードで符号化されたオーディオコンテンツの一部分と周波数ドメインモードで符号化されたオーディオコンテンツの一部分との間の遷移において、オーディオコンテンツの連続するオーバーラップ部分の時間ドメインサンプルの間でオーバーラップ加算操作を実行することにより、少なくとも部分的にエイリアシングを消去する。さらに、オーディオ信号復号器は、ＴＣＸ−ＬＰＤモードで符号化されたオーディオコンテンツの一部分とＡＣＥＬＰモードで符号化されたオーディオコンテンツの一部分との間の遷移において、エイリアシング消去合成信号を使用して、少なくとも部分的にエイリアシングを消去する。そのオーディオ信号復号器は、異なる操作モードの間の切換に良好に適合し、エイリアシングが非常に効率的に解消することが分かって来た。

本発明の好適な実施形態では、オーディオ信号復号器は、変換ドメイン経路（例えばＴＣＸ−ＬＰＤ経路）の第１の周波数ドメイン／時間ドメイン変換器により提供される時間ドメイン表現のゲインスケーリングと、エイリアシング消去刺激信号又はエイリアシング消去合成信号のゲインスケーリングとに対し、共通のゲイン値を適用するよう構成されている。このように、第１の周波数ドメイン／時間ドメイン変換器により提供される時間ドメイン表現のスケーリングと、エイリアシング消去刺激信号又はエイリアシング消去合成信号のスケーリングとの両方に対し、この共通のゲイン値を再利用することで、異なるモードで符号化されたオーディオコンテンツの部分の間の遷移において必要とされるビットレートの削減が可能になる事実が分かって来た。異なるモードで符号化されたオーディオコンテンツの部分の間の遷移の環境において、エイリアシング消去刺激信号の符号化によってビットレートの必要条件が増大してしまう点を考えると、この事実は非常に重要である。

本発明の好適な実施形態では、オーディオ信号復号器は、線形予測ドメインパラメータの少なくとも１つのサブセットに依存してスペクトル成形を実行することに加え、スペクトル係数の第１セットの少なくとも１つのサブセットに対してスペクトル逆成形(de-shaping)を適用する。この場合、オーディオ信号復号器は、エイリアシング消去刺激信号が導出されたエイリアシング消去スペクトル係数のセットの少なくとも１つのサブセットに対し、スペクトル逆成形を適用するよう構成されている。スペクトル係数の第１セットと、エイリアシング消去刺激信号が導出されたエイリアシング消去スペクトル係数と、の両方に対してスペクトル逆成形を適用することで、エイリアシング消去合成信号は、第１の周波数ドメイン／時間ドメイン変換器により提供される「主たる」オーディオコンテンツ信号に対して良好に適合することが保証される。これによりまた、エイリアシング消去刺激信号の符号化効率が向上する。

本発明の好適な実施形態では、オーディオ信号復号器は、エイリアシング消去刺激信号を表現するスペクトル係数のセットに依存してエイリアシング消去刺激信号の時間ドメイン表現を得る、第２の周波数ドメイン／時間ドメイン変換器を含む。この場合、第１の周波数ドメイン／時間ドメイン変換器は、時間ドメインエイリアシングを含むラップされた変換を実行するよう構成され、第２の周波数ドメイン／時間ドメイン変換器は、ラップされていない変換を実行するよう構成されている。従って、「主たる」信号合成にとっては、ラップされた変換を使用することで、高い符号化効率を維持できる。しかし、エイリアシング消去は、周波数から時間ドメインへのラップされていない追加的な変換を使用して達成される。しかし、周波数ドメインから時間ドメインへのラップされた変換と、周波数ドメインから時間ドメインへのラップされていない変換との組み合わせは、周波数ドメインから時間ドメインへのラップされていない単一の遷移よりも効果的な遷移の符号化を可能にする。

本発明の好適な実施形態は、オーディオコンテンツの入力表現に基づいて、スペクトル係数の第１セットとエイリアシング消去刺激信号の表現と複数の線形予測ドメインパラメータとを含むオーディオコンテンツの符号化された表現を生成する、オーディオ信号符号器を提供する。前記オーディオ信号符号器は、オーディオコンテンツの入力表現を処理してオーディオコンテンツの周波数ドメイン表現を取得する、時間ドメイン／周波数ドメイン変換器を含む。前記オーディオ信号符号器は、線形予測ドメインで符号化されるべきオーディオコンテンツの一部のための線形予測ドメインパラメータの１セットに依存して、スペクトル係数の１セット又はその前処理済バージョンに対してスペクトル成形を適用し、オーディオコンテンツのスペクトル的に成形された周波数ドメインの表現を取得する、スペクトル処理器をさらに含む。前記オーディオ信号復号器は、線形予測ドメインパラメータの少なくとも１つのサブセットに依存するエイリアシング消去刺激信号のフィルタ処理が、オーディオ信号復号器内でエイリアシング・アーチファクトを消去するためのエイリアシング消去合成信号をもたらすように、エイリアシング消去刺激信号の表現を提供する、エイリアシング消去情報提供器をさらに含む。

ここで述べるオーディオ信号符号器は、上述したオーディオ信号符号器との協働に良好に適合している。特に、このオーディオ信号符号器は、異なるモードで符号化されたオーディオコンテンツの一部分（例えばフレームやサブフレーム）の間の遷移におけるエイリアシングを消去するために必要とされるビットレートオーバーヘッドが適度に小さく維持された、オーディオコンテンツの表現を提供するよう構成されている。

本発明に従う他の実施形態は、オーディオコンテンツの復号化された表現を生成する方法と、オーディオコンテンツの符号化された表現を生成する方法とを提供する。それらの方法は、上述した装置と同じ考えに基づくものである。

本発明に従う他の実施形態は、上述の方法の１つを実行するコンピュータプログラムを提供する。そのコンピュータプログラムも同じ考えに基づくものである。

本発明の実施例を、添付の図面を参照しながら以下に説明する。
本発明の一実施形態に従うオーディオ信号符号器のブロック図である。本発明の一実施形態に従うオーディオ信号復号器の前半部分のブロック図である。本発明の一実施形態に従うオーディオ信号復号器の後半部分のブロック図である。統一されたスピーチ及びオーディオ符号化（ＵＳＡＣ）草案標準の作業中の草案４に従う参照オーディオ信号復号器のブロック図である。本発明の他の実施形態に従うオーディオ信号復号器のブロック図である。（ＵＳＡＣ）草案標準の作業中の草案４に従う参照用の窓遷移のグラフィック表現を示す。本発明の一実施形態に従うオーディオ信号符号化で使用可能な窓遷移の概略図である。本発明の一実施形態に従うオーディオ信号符号器又は本発明の一実施形態に従うオーディオ信号復号器で使用される、全ての窓のタイプについての大要を示す概略図である。本発明の一実施形態に従うオーディオ信号符号器又は本発明の一実施形態に従うオーディオ信号復号器で使用可能な、許可された窓シーケンスを示す表である。本発明の一実施形態に従うオーディオ信号符号器の第１部分の詳細なブロック図である。本発明の一実施形態に従うオーディオ信号符号器の第２部分の詳細なブロック図である。本発明の一実施形態に従うオーディオ信号符号器の第３部分の詳細なブロック図である。本発明の一実施形態に従うオーディオ信号符号器の第４部分の詳細なブロック図である。本発明の一実施形態に従うオーディオ信号復号器の第１部分の詳細なブロック図である。本発明の一実施形態に従うオーディオ信号復号器の第２部分の詳細なブロック図である。本発明の一実施形態に従うオーディオ信号復号器の第３部分の詳細なブロック図である。本発明の一実施形態に従うオーディオ信号復号器の第４部分の詳細なブロック図である。ＡＣＥＬＰからの又はＡＣＥＬＰへの遷移のための、前方エイリアシング消去（ＦＡＣ：forward-aliasing-cancellation）復号化操作を示す概略図である。符号器におけるＦＡＣ目標の計算を示す概略図である。周波数ドメインノイズ成形（ＦＤＮＳ）におけるＦＡＣ目標の量子化を示す概略図である。重み付き代数ＬＰＣ逆量子化器の原理を示す概略図である。周波数ドメイン・チャネルストリーム“fd_channel_stream()”のシンタックスを示す図である。線形予測ドメイン・チャネルストリーム“lpc_channel_stream()”のシンタックスの前半を示す図である。線形予測ドメイン・チャネルストリーム“lpc_channel_stream()”のシンタックスの後半を示す図である。前方エイリアシング消去データ“fac_data()”のシンタックスを示す図である。

１．図１に従うオーディオ信号符号器
図１は本発明の一実施形態に従うオーディオ信号符号器１００のブロック図である。オーディオ信号符号器１００はオーディオコンテンツ１１０の入力表現を受信し、それを基に、オーディオコンテンツの符号化された表現１１２を提供するよう構成されている。オーディオコンテンツの符号化された表現１１２は、スペクトル係数の第１セット１１２ａと、複数の線形予測ドメインパラメータ１１２ｂと、エイリアシング消去刺激信号の表現１１２ｃとを含む。

オーディオ信号符号器１００は、オーディオコンテンツの入力表現１１０（又は同等的にその前処理済バージョン１１０’）を処理し、（スペクトル係数の１セットの形式でも良い）オーディオコンテンツの周波数ドメイン表現１２２を取得するよう構成されている。

オーディオ信号符号器１００は、線形予測ドメインで符号化されるべきオーディオコンテンツの一部分のための線形予測ドメインパラメータの１セット１４０に依存して、オーディオコンテンツの周波数ドメイン表現１２２又はその前処理済バージョン１２２’に対してスペクトル成形を適用し、オーディオコンテンツのスペクトル的に成形された周波数ドメイン表現１３２を取得する、スペクトル処理手段１３０をさらに含む。スペクトル係数の第１セット１１２ａは、オーディオコンテンツのスペクトル的に成形された周波数ドメイン表現１３２と同じでも良く、又は、オーディオコンテンツのスペクトル的に成形された周波数ドメイン表現１３２から導出されたものでも良い。

オーディオ信号符号器１００はエイリアシング消去情報提供手段１５０をさらに含み、この情報提供手段１５０は、線形予測ドメインパラメータ１４０の少なくとも１つのサブセットに依存するエイリアシング消去刺激信号の処理が、オーディオ信号復号器内でエイリアシング・アーチファクトを消去するためのエイリアシング消去合成信号をもたらすような、エイリアシング消去刺激信号の表現１１２ｃを提供するよう構成されている。

線形予測ドメインパラメータ１１２ｂは、例えば線形予測ドメインパラメータ１４０と同じでも良いことに留意すべきである。

オーディオ信号符号器１００は、たとえオーディオコンテンツの異なる部分（例えばフレームやサブフレーム）が異なるモードで符号化されている場合でも、オーディオコンテンツの再構築に良好に適合するような情報を提供する。線形予測ドメイン、例えば変換符号化励起線形予測ドメインモードで符号化されたオーディオコンテンツの部分については、時間ドメインから周波数ドメインへの変換後に、ノイズ成形を伴いかつ比較的小さなビットレートを用いたオーディオコンテンツの量子化を可能にするような、スペクトル成形が実行される。そのため、前記線形予測ドメインで符号化されたオーディオコンテンツの一部分であって、その前又は後に周波数ドメインモードで符号化されたオーディオコンテンツの一部分を有するような部分の、エイリアシングを消去するオーバーラップ加算が可能になる。線形予測ドメインパラメータ１４０をスペクトル成形に使用することで、スピーチ状のオーディオコンテンツに対してスペクトル成形が良好に適合し、その結果、スピーチ状のオーディオコンテンツについて特に良好な符号化効率が得られる。さらに、エイリアシング消去刺激信号の表現は、代数符号励起線形予測モードで符号化されたオーディオコンテンツの一部分（例えばフレームやサブフレーム）からの又はそのような一部分への遷移において、効率的なエイリアシング消去を可能にする。線形予測ドメインパラメータに依存してエイリアシング消去刺激信号の表現を提供することで、エイリアシング消去刺激信号の特に効率的な表現が得られ、その表現は、復号器側において、復号器ではいずれにしても既知である線形予測ドメインパラメータを考慮に入れて復号化されることができる。

要約すれば、オーディオ信号符号器１００は、異なるモードで符号化されたオーディオコンテンツの部分の間の遷移を可能とすることに良好に適合し、しかも、特にコンパクトな形式でエイリアシング消去情報を提供することが可能である。

２．図２に従うオーディオ信号復号器
図２は本発明の一実施形態に従うオーディオ信号復号器２００のブロック概略図である。オーディオ信号復号器２００はオーディオコンテンツの符号化された表現２１０を受信して、それを基に、例えばエイリアシング低減済み時間ドメイン信号の形式でオーディオコンテンツの復号化された表現２１２を提供する。

オーディオ信号復号器２００は、スペクトル係数の（第１の）セット２２０とエイリアシング消去刺激信号の表現２２４と複数の線形予測ドメインパラメータ２２２とに基づいて、変換ドメインモードで符号化されたオーディオコンテンツの時間ドメイン表現２１２を取得する、変換ドメイン経路（例えば変換符号化励起線形予測ドメイン経路）を含む。前記変換ドメイン経路は、線形予測ドメインパラメータ２２２の少なくとも１つのサブセットに依存して、スペクトル係数の（第１の）セット２２０に対してスペクトル成形を適用し、スペクトル係数の第１セット２２０のスペクトル的に成形されたバージョン２３２を取得する、スペクトル処理手段２３０を含む。前記変換ドメイン経路は、スペクトル係数の（第１の）セット２２０のスペクトル的に成形されたバージョン２３２に基づいて、オーディオコンテンツの時間ドメイン表現２４２を得る、（第１の）周波数ドメイン／時間ドメイン変換手段２４０をさらに含む。前記変換ドメイン経路は、線形予測ドメインパラメータ２２２の少なくとも１つのサブセットに依存して、（符号２２４で示す）エイリアシング消去刺激信号をフィルタ処理し、エイリアシング消去刺激信号からエイリアシング消去合成信号２５２を得る、エイリアシング消去刺激フィルタ２５０をさらに含む。変換ドメイン経路は、オーディオコンテンツの時間ドメイン表現２４２（又は同等的に、その後処理済バージョン２４２’）とエイリアシング消去合成信号２５２（又は同等的に、その後処理済バージョン２５２’）とを結合して、エイリアシング低減済み時間ドメイン信号２１２を得る、結合手段２６０をさらに含む。

オーディオ信号復号器２００は、例えばスケーリング及び／又は周波数ドメイン・ノイズ成形を実行するスペクトル処理手段２３０の設定を、線形予測ドメインパラメータ２２２の少なくとも１つのサブセットから導出するための任意の処理２７０を含む。

オーディオ信号復号器２００は、エイリアシング消去刺激フィルタ２５０の設定を導出するよう構成された任意の処理２８０をさらに含み、そのエイリアシング消去刺激信号２５０は、例えば線形予測ドメインパラメータ２２２の少なくとも１つのサブセットから、エイリアシング消去合成信号２５２を合成するための合成フィルタ処理を実行しても良い。

オーディオ信号復号器２００は、オーディオコンテンツを表現しかつ周波数ドメインの操作モードで得られた時間ドメイン信号と、オーディオコンテンツを表現しかつＡＣＥＬＰの操作モードで得られた時間ドメイン信号と、の両方に対する結合に良好に適合するような、エイリアシング低減済み時間ドメイン信号２１２を提供するよう構成されている。（図２では示されない周波数ドメイン経路を用いた）周波数ドメインの操作モードを使用して復号化されたオーディオコンテンツの部分（例えばフレーム）と、図２の変換ドメイン経路を使用して復号化されたオーディオコンテンツの部分（例えばフレーム又はサブフレーム）と、の間においては、特に良好なオーバーラップ加算特性が存在する。なぜなら、スペクトル処理手段２３０により、周波数ドメインで、即ち周波数ドメイン／時間ドメイン変換２４０の前に、ノイズ成形が実行されるからである。さらに、図２の変換ドメイン経路を使用して復号化されたオーディオコンテンツの部分（例えばフレーム又はサブフレーム）と、ＡＣＥＬＰ復号化経路を使用して復号化されたオーディオコンテンツの部分（例えばフレーム又はサブフレーム）との間においても、特に良好なエイリアシング消去が得られる。なぜなら、線形予測ドメインパラメータに依存するエイリアシング消去刺激信号のフィルタ処理に基づいて、エイリアシング消去合成信号２５２が提供されたからである。このようにして得られたエイリアシング消去合成信号２５２は、ＴＣＸ−ＬＰＤモードで符号化されたオーディオコンテンツの一部分と、ＡＣＥＬＰモードで符号化されたオーディオコンテンツの一部分との間の遷移において発生するエイリアシング・アーチファクトに対して一般的に良好に適合する。オーディオ信号復号化の操作に関する更なる任意の詳細について、以下に説明する。

３．図３ａと図３ｂに従う切替型オーディオ復号器
以下に、図３ａと図３ｂを参照しながらマルチモード・オーディオ信号復号器の概念を簡単に説明する。

３．１図３ａに従うオーディオ信号復号器３００
図３ａは参照マルチモード・オーディオ信号復号器のブロック概略図であり、図３ｂは本発明の一実施形態に従うマルチモード・オーディオ信号復号器のブロック概略図である。換言すれば、図３ａは（例えばＵＳＡＣ草案標準の作業中の草案４に従う）参照システムの基本的な復号器信号フローを示し、図３ｂは本発明の一実施形態に従う提案システムの基本的な復号器信号フローを示す。

オーディオ信号復号器３００を、まず図３ａを参照しながら説明する。オーディオ信号復号器３００は、入力ビットストリームを受信してそのビットストリーム内に含まれた情報を処理分枝の適切な処理ユニットへと提供するよう構成された、ビットマルチプレクサ３１０を含む。

オーディオ信号復号器３００は周波数ドメインモード経路３２０を備え、その経路３２０は、スケールファクタ情報３２２と符号化されたスペクトル係数情報３２４とを受け取り、それらを基にして、周波数ドメインモードで符号化されたオーディオフレームの時間ドメイン表現３２６を生成する。オーディオ信号復号器３００は変換符号化励起線形予測ドメイン経路３３０をさらに備え、その経路３３０は、符号化された変換符号化励起情報３３２と、線形予測係数情報３３４（線形予測符号化情報、線形予測ドメイン情報又は線形予測符号化フィルタ情報とも称される）とを受け取り、それらを基にして、変換符号化励起線形予測ドメイン（ＴＣＸ−ＬＰＤ）モードで符号化されたオーディオフレーム又はオーディオサブフレームの時間ドメイン表現３３６を生成する。オーディオ信号復号器３００は代数符号励起線形予測（ＡＣＥＬＰ）経路３４０をさらに備え、この経路３４０は、符号化された励起情報３４２と、線形予測符号化情報３４４（線形予測係数情報、線形予測ドメイン情報又は線形予測符号化フィルタ情報とも称される）とを受け取り、それらを基にして、ＡＣＥＬＰモードで符号化されたオーディオフレーム又はサブフレームの表現として、時間ドメインの線形予測符号化情報３４６を生成する。オーディオ信号復号器３００は遷移窓処理手段（transition windowing）３５０をさらに備え、この処理手段３５０は、オーディオコンテンツの異なるモードで符号化されたフレーム又はサブフレームの時間ドメイン表現３２６、３３６、３４６を受け取り、それら時間ドメイン表現をある遷移窓処理を用いて結合するよう構成されている。

周波数ドメイン経路３２０は、符号化されたスペクトル表現３２４を復号化して復号化済みスペクトル表現３２０ｂを取得する算術復号手段３２０ａと、その復号化済みスペクトル表現３２０ｂを基にして逆量子化されたスペクトル表現３２０ｄを得る逆量子化手段３２０ｃと、その逆量子化されたスペクトル表現３２０ｄをスケールファクタに依存してスケールし、スケールされたスペクトル表現３２０ｆを得るスケール手段３２０ｅと、そのスケールされたスペクトル表現３２０ｆを基にして時間ドメイン表現３２６を得る（逆）変形離散コサイン変換手段３２０ｇと、を含む。

ＴＣＸ−ＬＰＤ分枝３３０は、符号化されたスペクトル表現３３２を基にして復号化済みスペクトル表現３３０ｂを得る算術復号手段３３０ａと、その復号化済みスペクトル表現３３０ｂを基にして逆量子化されたスペクトル表現３３０ｄを提供する逆量子化手段３３０ｃと、その逆量子化されたスペクトル表現３３０ｄを基にして励起信号３３０ｆを提供する（逆）変形離散コサイン変換手段３３０ｅと、その励起信号３３０ｆと（時には線形予測ドメインフィルタ係数とも称される）線形予測符号化フィルタ係数３３４とを基にして時間ドメイン表現３３６を提供する線形予測符号化合成フィルタ３３０ｇと、を含む。

ＡＣＥＬＰ分枝３４０は、符号化された励起信号３４２に基づいてＡＣＥＬＰ励起信号３４０ｂを提供するＡＣＥＬＰ励起処理手段３４０ａと、そのＡＣＥＬＰ励起信号３４０ｂ及び線形予測符号化フィルタ係数３４４に基づいて時間ドメイン表現３４６を提供する線形予測符号化合成フィルタ３４０ｃと、を含む。

３．２図４に従う遷移窓処理
図４を参照しながら、遷移窓処理３５０についてさらに詳細に説明する。まず、オーディオ信号復号器３００の一般的なフレーミング構造を説明する。しかし、微小な差異しかない非常に良く似たフレーミング構造、又は同一の一般的フレーミング構造が、本明細書で説明する他のオーディオ信号符号器又は復号器において使用されることに留意すべきである。また、オーディオフレームは典型的にはＮ個のサンプルの長さを持ち、そのＮは２０４８と同一であっても良いことにも留意すべきである。オーディオコンテンツの連続するフレームは、およそ５０％の割合で、例えばＮ／２個のオーディオサンプル分だけオーバーラップしていても良い。オーディオフレームは、１つのオーディオフレームのＮ個の時間ドメインサンプルが、例えばＮ／２個のスペクトル係数からなる１セットによって表現されるように、周波数ドメインで符号化されても良い。代替的に、１つのオーディオフレームのＮ個の時間ドメインサンプルが、複数のセット、例えば各１２８個のスペクトル係数からなる例えば８つのセットによって表現されても良い。それにより、一層高い時間的分解能を得ることができる。

もし１つのオーディオフレームのＮ個の時間ドメインサンプルがスペクトル係数の単一のセットを用いて周波数ドメインモードで符号化された場合には、逆変形離散コサイン変換３２０ｇによって提供される時間ドメインサンプル３２６に対し、例えば所謂“ＳＴＯＰ＿ＳＴＡＲＴ”窓、“ＡＡＣＬｏｎｇ”窓、“ＡＡＣＳｔａｒｔ”窓、又は“ＡＡＣＳｔｏｐ”窓のような単一の窓が適用されても良い。反対に、もし１つのオーディオフレームのＮ個の時間ドメインサンプルがスペクトル係数の複数のセットを用いて符号化された場合には、スペクトル係数の異なるセットを使用して取得された時間ドメイン表現を窓処理するために、複数の短い窓、例えばタイプ“ＡＡＣＳｈｏｒｔ”などが適用されても良い。例えば、単一のオーディオフレームに関連したスペクトル係数の個別のセットに基づいて取得された各時間ドメイン表現に対し、別個の短い窓が適用されても良い。

線形予測ドメインモードで符号化されたオーディオフレームは、、時には「フレーム」とも称される複数のサブフレームへとサブ分割されても良い。サブフレームの各々は、ＴＣＸ−ＬＰＤモード又はＡＣＥＬＰモードで符号化されても良い。但し、ＴＣＸ−ＬＰＤモードにおいては、２個のサブフレーム又は４個のサブフレームでさえも、変換符号化励起を記述するスペクトル係数の単一のセットを用いて一緒に符号化されても良い。

ＴＣＸ−ＬＰＤモードで符号化された１つのサブフレーム（又は２個若しくは４個のサブフレームからなる一群）は、スペクトル係数の１セットと、線形予測符号化フィルタ係数の１つ又は複数のセットとにより表現されても良い。ＡＣＥＬＰドメインで符号化されたオーディオコンテンツの１つのサブフレームは、符号化されたＡＣＥＬＰ励起信号と、線形予測符号化フィルタ係数の１つ又は複数のセットとにより表現されても良い。

図４を参照しながら、フレーム又はサブフレーム間の遷移の構成を説明する。図４に示す概略図では、横軸４０２ａ−４０２ｉはオーディオサンプルに関する時間を示し、縦軸４０４ａ−４０４ｉは窓関数及び／又は時間ドメインサンプルが供給される時間領域(temporal regions)を示す。

参照番号４１０では、周波数ドメイン（ＦＤ）で符号化された２つのオーバーラップしているフレーム間の遷移を示す。参照番号４２０では、ＡＣＥＬＰモードで符号化されたサブフレームから周波数ドメインモードで符号化されたフレームへの遷移を示す。参照番号４３０では、（“ｗＬＰＴ”モードとしても称される）ＴＣＸ−ＬＰＤモードで符号化されたフレーム（又はサブフレーム）から周波数ドメインモードで符号化されたフレームへの遷移を示す。参照番号４４０では、周波数ドメインモードで符号化されたフレームからＡＣＥＬＰモードで符号化されたサブフレームへの遷移を示す。参照番号４５０では、ＡＣＥＬＰモードで符号化されたサブフレーム同士間の遷移を示す。参照番号４６０では、ＴＣＸ−ＬＰＤモードで符号化されたサブフレームからＡＣＥＬＰモードで符号化されたサブフレームへの遷移を示す。参照番号４７０では、周波数ドメインモードで符号化されたフレームからＴＣＸ−ＬＰＤモードで符号化されたサブフレームへの遷移を示す。参照番号４８０では、ＡＣＥＬＰモードで符号化されたサブフレームからＴＣＸ−ＬＰＤモードで符号化されたサブフレームへの遷移を示す。参照番号４９０では、ＴＣＸ−ＬＰＤモードで符号化されたサブフレーム同士間の遷移を示す。

興味深いことに、参照番号４３０で示されたＴＣＸ−ＬＰＤモードから周波数ドメインモードへの遷移は、復号器に伝送された情報の一部が捨てられたという事実から、幾分かは非効率的、又はＴＣＸ−ＬＰＤに関して非常に非効率的とも言える。同様に、参照番号４６０と４８０で示されたＡＣＥＬＰモードとＴＣＸ−ＬＰＤモードとの間の遷移も、復号器に伝送された情報の一部が捨てられたという事実から、非効率的に構成されている。

３．３図３ｂに従うオーディオ信号復号器３６０
以下に、本発明の実施形態に従うオーディオ信号復号器３６０について説明する。

オーディオ信号復号器３６０は、オーディオコンテンツのビットストリーム表現３６１を受信し、それに基づいてオーディオ信号復号器３６０の異なる分枝へと情報要素を提供するよう構成された、ビットストリームマルチプレクサ又はビットストリームパーサ３６２を備えている。

オーディオ信号復号器３６０は周波数ドメイン分枝３７０を含み、その分枝３７０は、符号化済みスケールファクタ情報３７２と符号化されたスペクトル情報３７４とをビットストリームマルチプレクサ３６２から受け取り、それらを基にして、周波数ドメインモードで符号化されたフレームの時間ドメイン表現３７６を提供する。オーディオ信号復号器３６０はＴＣＸ−ＬＰＤ経路３８０をさらに備え、その経路３８０は、符号化済みスペクトル係数３８２と符号化済み線形予測符号化フィルタ係数３８４とを受け取り、それらを基にして、ＴＣＸ−ＬＰＤモードで符号化されたオーディオフレーム又はオーディオサブフレームの時間ドメイン表現３８６を提供する。

オーディオ信号復号器３６０はＡＣＥＬＰ経路３９０をさらに備え、この経路３９０は、符号化されたＡＣＥＬＰ励起信号３９２と符号化済み線形予測符号化フィルタ係数３９４とを受け取り、それらを基にして、ＡＣＥＬＰモードで符号化されたオーディオサブフレームの時間ドメイン表現３９６を提供する。

オーディオ信号復号器３６０は遷移窓処理手段３９８をさらに備え、その処理手段３９８は、異なるモードで符号化されたフレーム及びサブフレームの時間ドメイン表現３７６、３８６、３９６に対して適切な遷移窓処理を適用し、連続的なオーディオ信号を導出するよう構成されている。

ここで、周波数ドメイン分枝３７０は、その全般的な構造と機能において周波数ドメイン分枝３２０と同じであっても良い。但し、周波数ドメイン分枝３７０が別の又は追加的なエイリアシング消去のメカニズムを有しても良い。さらに、ＡＣＥＬＰ分枝３９０は、その全般的な構造と機能においてＡＣＥＬＰ分枝３４０と同じであっても良く、上述の説明がここでも適用される。

一方、ＴＣＸ−ＬＰＤ分枝３８０は、逆変形離散コサイン変換の前にノイズ成形が実行されるという点で、ＴＣＸ−ＬＰＤ分枝３３０と異なる。さらに、ＴＣＸ−ＬＰＤ分枝３８０は追加的なエイリアシング消去機能を含む。

ＴＣＸ−ＬＰＤ分枝３８０は、符号化されたスペクトル表現３８２を受け取り、それに基づいて復号化済みスペクトル表現３８０ｂを提供する算術復号手段３８０ａを含む。ＴＣＸ−ＬＰＤ分枝３８０は、その復号化済みスペクトル表現３８０ｂを受け取り、それに基づいて逆量子化されたスペクトル表現３８０ｄを提供する逆量子化手段３８０ｃをさらに含む。ＴＣＸ−ＬＰＤ分枝３８０はスケーリング及び／又は周波数ドメイン・ノイズ成形手段３８０ｅをさらに含み、そのノイズ成形手段３８０ｅは、逆量子化されたスペクトル表現３８０ｄとスペクトル成形情報３８０ｆとを受け取り、それらを基にして、スペクトル的に成形されたスペクトル表現３８０ｇを生成し、逆変形離散コサイン変換手段３８０ｈへと提供する。この逆変形離散コサイン変換手段３８０ｈは、スペクトル的に成形されたスペクトル表現３８０ｇを基にして、時間ドメイン表現３８６を提供する。ＴＣＸ−ＬＰＤ分枝３８０は、線形予測係数から周波数ドメインへの変換手段３８０ｉをさらに含み、この変換手段３８０ｉは、線形予測符号化フィルタ係数３８４を基にしてスペクトルスケーリング情報３８０ｆを提供するものである。

オーディオ復号器３６０の機能に関し、周波数ドメイン分枝３７０とＴＣＸ−ＬＰＤ分枝３８０とは、算術復号化と逆量子化とスペクトルスケーリングと逆変形離散コサイン変換とを同じ処理順序で含む処理系列をそれぞれ有しているという点において、類似度が高いと言える。従って、周波数ドメイン分枝３７０の出力信号３７６とＴＣＸ−ＬＰＤ分枝３８０の出力信号３８６とは、逆変形離散コサイン変換の（遷移窓処理を除く）フィルタ処理されていない出力信号であっても良いという点で、類似度が高いと言える。そのため、時間ドメイン信号３７６と３８６は、オーバーラップ加算操作に対して良好に適合しており、オーバーラップ加算操作によって時間ドメインエイリアシング消去が達成される。このように、周波数ドメインで符号化されたオーディオフレームとＴＣＸ−ＬＰＤモードで符号化されたオーディオフレーム又はオーディオサブフレームとの間の遷移は、追加的なエイリアシング消去情報を必要とせず、またどの情報を捨てることもなく、単純なオーバーラップ加算操作によって効率的に実行することができる。従って、最小量のサイド情報で十分となる。

周波数ドメイン経路３７０においてスケールファクタ情報に依存して実行される、逆量子化済スペクトル表現のスケーリングは、符号器側の量子化と復号器側の逆量子化３２０ｃとに起因する量子化ノイズのノイズ成形を効果的にもたらす。このノイズ成形は、例えば音楽信号のような一般的なオーディオ信号に良好に適合する。対照的に、線形予測符号化フィルタ係数に依存して実行される、スケーリング及び／又は周波数ドメインノイズ成形３８０ｅは、符号器側の量子化と復号器側の逆量子化３８０ｃとに起因する量子化ノイズのノイズ成形を効果的にもたらす。このノイズ成形は、スピーチ状のオーディオ信号に良好に適合する。従って、周波数ドメイン分枝３７０とＴＣＸ−ＬＰＤ分枝３８０との違いは、周波数ドメインで異なるノイズ成形が適用されるという点だけであり、その結果、周波数ドメイン分枝３７０を使用する場合には一般的なオーディオ信号にとって符号化効率（又はオーディオ品質）が特に良好となり、ＴＣＸ−ＬＰＤ分枝３８０を使用する場合にはスピーチ状のオーディオ信号にとって符号化効率又はオーディオ品質が特に高くなる。

ＴＣＸ−ＬＰＤ分枝３８０は、ＴＣＸ−ＬＰＤモードとＡＣＥＬＰモードで符号化されたオーディオフレーム又はオーディオサブフレームの間における遷移のために、好適には追加のエイリアシング消去メカニズムを含む。以下に詳細を説明する。

３．４図５に従う遷移窓処理
図５は、想定される窓処理スキームの例を図式的に表現したものであり、本発明に従うオーディオ信号復号器３６０又は他の任意のオーディオ信号符号器及び復号器に対して適用可能である。図５は、異なるモードで符号化されたフレーム又はサブフレーム間で起こり得る遷移における窓処理を表す。横軸５０２ａ−５０２ｉはオーディオサンプルに関する時間を示し、縦軸５０４ａ−５０４ｉは窓関数又はオーディオコンテンツの時間ドメイン表現を提供するサブフレームを示す。

参照番号５１０は、周波数ドメインモードで符号化された連続するフレーム間の遷移を示す。図から分かるように、1番目のフレームの右半分のために（例えば逆変形離散コサイン変換（ＭＤＣＴ）３２０ｇによって）供給された時間ドメインサンプルは、例えば窓タイプ“ＡＡＣＬｏｎｇ”又は窓タイプ“ＡＡＣＳｔｏｐ”の窓関数であっても良い、ある窓関数の右半分５１２によって窓処理される。同様に、後続の２番目のフレームの左半分のために（例えばＭＤＣＴ３２０ｇによって）供給された時間ドメインサンプルは、例えば窓タイプ“ＡＡＣＬｏｎｇ”又は窓タイプ“ＡＡＣＳｔａｒｔ”の窓関数であっても良い、ある窓関数の左半分５１４を使用して窓処理されても良い。前記右半分５１２は、例えば比較的長い右側の遷移傾斜を持っても良く、後続の窓の左半分５１４は、比較的長い左側の遷移傾斜を持っても良い。１番目のオーディオフレームの時間ドメイン表現の（前記窓の右半分５１２を用いて窓処理された）窓処理済バージョンと、２番目のオーディオフレームの時間ドメイン表現の（前記窓の左半分５１４を用いて窓処理された）窓処理済バージョンとは、オーバーラップされて加算される。従って、ＭＤＣＴから発生するエイリアシングは、効果的に消去される可能性がある。

参照番号５２０は、ＡＣＥＬＰモードで符号化されたサブフレームから周波数ドメインモードで符号化されたフレームへの遷移を示す。このような遷移では、エイリアシング・アーチファクトを低減させるため、前方エイリアシング消去（ＦＡＣ）が適用されても良い。

参照番号５３０は、ＴＣＸ−ＬＰＤモードで符号化されたサブフレームから周波数ドメインモードで符号化されたフレームへの遷移を示す。図から分かるように、ＴＣＸ−ＬＰＤ経路の逆ＭＤＣT３８０ｈにより提供された時間ドメインサンプルに対し、窓関数５３２が適用され、この窓関数５３２は、例えば窓タイプ“ＴＣＸ２５６”，“ＴＣＸ５１２”又は“ＴＣＸ１０２４”の窓関数であっても良い。窓関数５３２は、１２８個の時間ドメインサンプルの長さを持つ右側遷移傾斜５３３を持っていても良い。窓関数５３４は、周波数ドメインモードで符号化された後続のオーディオフレームのために周波数ドメイン経路３７０のＭＤＣＴにより提供された時間ドメインサンプルに対して適用される。この窓関数５３４は、例えば窓タイプ“ＳｔｏｐＳｔａｒｔ”又は“ＡＡＣＳｔｏｐ”の窓関数であっても良く、例えば１２８個の時間ドメインサンプルの長さを持つ左側遷移傾斜５３５を持っていても良い。ＴＣＸ−ＬＰＤモードサブフレームの右側遷移傾斜５３３により窓処理された時間ドメインサンプルと、後続の周波数ドメインモードで符号化されたオーディオフレームの左側遷移傾斜５３５により窓処理された時間ドメインサンプルとが、オーバーラップ加算される。遷移傾斜５３３と５３５とは、ＴＣＸ−ＬＰＤモードで符号化されたサブフレームから後続の周波数ドメインモードで符号化されたサブフレームへの遷移においてエイリアシング消去が得られるように、マッチされる。エイリアシング消去は、逆ＭＤＣＴ３８０ｈを実施する前にスケーリング／周波数ドメイン・ノイズ成形３８０ｅを実施することで可能となる。換言すれば、周波数ドメイン経路３７０の逆ＭＤＣＴ３２０ｇとＴＣＸ−ＬＰＤ経路３８０の逆ＭＤＣＴ３８０ｈとの両方に対し、（例えばスケールファクタに依存するスケーリングやＬＰＣフィルタ係数に依存するスケーリングの形式で）既にノイズ成形がされたスペクトル係数が与えられたという事実によって、エイリアシング消去がもたらされるのである。

参照番号５４０は、周波数ドメインモードで符号化されたオーディオフレームからＡＣＥＬＰモードで符号化されたサブフレームへの遷移を示す。図から分かるように、この遷移におけるエイリアシング・アーチファクトを低減又は除去するために、前方エイリアシング消去（ＦＡＣ）が適用される。

参照番号５５０は、ＡＣＥＬＰモードで符号化された１つのオーディオサブフレームからＡＣＥＬＰモードで符号化された他のオーディオサブフレームへの遷移を示す。いくつかの実施形態のこのような場合では、特別なエイリアシング消去処理は不要となる。

参照番号５６０は、（ｗＬＰＴモードとも示される）ＴＣＸ−ＬＰＤモードで符号化されたサブフレームからＡＣＥＬＰモードで符号化されたサブフレームへの遷移を示す。図から分かるように、ＴＣＸ−ＬＰＤ分枝３８０のＭＤＣT３８０ｈにより提供された時間ドメインサンプルは、例えば窓タイプ“ＴＣＸ２５６”，“ＴＣＸ５１２”又は“ＴＣＸ１０２４”の窓関数であっても良い、窓関数５６２を使用して窓処理される。窓関数５６２は、比較的短い右側遷移傾斜５６３を含む。ＡＣＥＬＰモードで符号化された後続のオーディオサブフレームについて提供された時間ドメインサンプルは、ＴＣＸ−ＬＰＤモードで符号化された先行するオーディオサブフレームについて提供されたオーディオサンプルであって窓関数５６２の右側遷移傾斜５６３によって窓処理されたオーディオサンプルと、部分的な時間的オーバーラップを含む。ＡＣＥＬＰモードで符号化されたオーディオサブフレームについて提供された時間ドメインオーディオサンプルは、参照番号５６４で示すブロックによって示す。

図から分かるように、ＴＣＸ−ＬＰＤモードで符号化されたオーディオフレームからＡＣＥＬＰモードで符号化されたオーディオフレームへの遷移においては、エイリアシング・アーチファクトを低減又は除去するために前方エイリアシング消去信号５６６が追加される。このエイリアシング消去信号５６６の生成に関する詳細は、後述する。

参照番号５７０は、周波数ドメインモードで符号化されたフレームから後続のＴＣＸ−ＬＰＤモードで符号化されたフレームへの遷移を示す。周波数ドメイン経路３７０の逆ＭＤＣＴ３２０ｇによって提供される時間ドメインサンプルは、比較的短い右側遷移傾斜５７３を含む窓関数５７２、例えばタイプ“ＳｔｏｐＳｔａｒｔ”の窓関数又はタイプ “ＡＡＣＳｔｏｐ”の窓関数によって窓処理されても良い。ＴＣＸ−ＬＰＤモードで符号化された後続のオーディオサブフレームについてＴＣＸ−ＬＰＤ分枝３８０の逆ＭＤＣＴ３８０ｈにより提供された時間ドメイン表現は、比較的短い左側遷移傾斜５７５を含む窓関数５７４により窓処理されても良く、その窓関数５７４は、例えば窓タイプ“ＴＣＸ２５６”，“ＴＣＸ５１２”又は“ＴＣＸ１０２４”の窓関数であっても良い。右側遷移傾斜５７３により窓処理された時間ドメインサンプルと左側遷移傾斜５７５により窓処理された時間ドメインサンプルとは、遷移窓処理手段３９８により、エイリアシング・アーチファクトが低減又は除去されるようにオーバーラップ加算される。そのため、周波数ドメインモードで符号化されたオーディオフレームからＴＣＸ−ＬＰＤモードで符号化されたオーディオサブフレームへの遷移を実行するために、追加的なサイド情報は必要でない。

参照番号５８０は、ＡＣＥＬＰモードで符号化されたオーディオフレームから（ｗＬＰＴモードとも示される）ＴＣＸ−ＬＰＤモードで符号化されたオーディオフレームへの遷移を示す。時間ドメインサンプルがＡＣＥＬＰ分枝３９０によって提供される時間領域は、参照番号５８２で示される。ある窓関数５８４が、ＴＣＸ−ＬＰＤ分枝３８０の逆ＭＤＣＴ３８０ｈにより提供された時間ドメインサンプルに対して適用される。窓関数５８４は、例えば窓タイプ“ＴＣＸ２５６”，“ＴＣＸ５１２”又は“ＴＣＸ１０２４”の窓関数であっても良く、比較的短い左側遷移傾斜５８５を含んでいても良い。窓関数５８４のその左側遷移傾斜５８５は、ブロック５８２で表されＡＣＥＬＰ分枝から提供された時間ドメインサンプルと部分的にオーバーラップしている。さらに、ＡＣＥＬＰモードで符号化されたサブフレームからＴＣＸ−ＬＰＤモードで符号化されたサブフレームへの遷移において発生するエイリアシング・アーチファクトを低減又は除去するために、エイリアシング消去信号５８６が提供される。このエイリアシング消去信号５８６の生成に関する詳細は後述する。

参照番号５９０は、ＴＣＸ−ＬＰＤモードで符号化されたオーディオサブフレームからＴＣＸ−ＬＰＤモードで符号化された他のオーディオサブフレームへの遷移を示す。ＴＣＸ−ＬＰＤモードで符号化された１番目のオーディオサブフレームの時間ドメインサンプルは、窓関数５９２を使用して窓処理され、その窓関数５９２は、例えばタイプ“ＴＣＸ２５６”，“ＴＣＸ５１２”又は“ＴＣＸ１０２４”の窓関数であっても良く、比較的短い右側遷移傾斜５９３を含んでいても良い。ＴＣＸ−ＬＰＤ分枝３８０の逆ＭＤＣＴ３８０ｈにより提供され、ＴＣＸ−ＬＰＤモードで符号化された２番目のオーディオサブフレームの時間ドメインオーディオサンプルは、例えば窓関数５９４を使用して窓処理され、その窓関数５９４は、例えば窓タイプ“ＴＣＸ２５６”，“ＴＣＸ５１２”又は“ＴＣＸ１０２４”の窓関数であっても良く、比較的短い左側遷移傾斜５９５を含んでいても良い。右側遷移傾斜５９３を使用して窓処理された時間ドメインサンプルと左側遷移傾斜５９５を使用して窓処理された時間ドメインサンプルとは、遷移窓処理手段３９８によりオーバーラップ加算される。そのため、(逆)ＭＤＣＴ３８０ｈに起因するエイリアシングが低減又は除去される。

４．全ての窓関数タイプの概略
以下に、全ての窓関数タイプの概略を示す。その目的で、様々な窓関数タイプとその特性を図式化して表す図６を参照されたい。図６の表では、縦列６１０は左側遷移傾斜の長さに等しくても良い左側オーバーラップ長を示す。縦列６１２は、変換長すなわち各窓関数によって窓処理された時間ドメイン表現を生成するために使用されるスペクトル係数の個数を示す。縦列６１４は右側遷移傾斜の長さに等しくても良い右側オーバーラップ長を示す。縦列６１６は窓関数の名前を示す。縦列６１８は各窓関数を図式化したものである。

１番目の横列６３０は、タイプ“ＡＡＣＳｈｏｒｔ”の窓関数の特性を示す。２番目の横列６３２は、タイプ“ＴＣＸ２５６”の窓関数の特性を示す。３番目の横列６３４は、タイプ“ＴＣＸ５１２”の窓関数の特性を示す。４番目の横列６３６は、タイプ“ＴＣＸ１０２４”及び“ＳｔｏｐＳｔａｒｔ”の窓関数の特性を示す。５番目の横列６３８は、タイプ“ＡＡＣＬｏｎｇ”の窓関数の特性を示す。６番目の横列６４０は、タイプ“ＡＡＣＳｔａｒｔ”の窓関数の特性を示し、７番目の横列６４２は、タイプ“ＡＡＣＳｔｏｐ”の窓関数の特性を示す。

特に、タイプ“ＴＣＸ２５６”，“ＴＣＸ５１２”及び“ＴＣＸ１０２４”の窓関数の遷移傾斜は、タイプ“ＡＡＣＳｔａｒｔ”の窓関数の右側遷移傾斜、及びタイプ“ＡＡＣＳｔｏｐ”の窓関数の左側遷移傾斜に適合しており、異なるタイプの窓関数を使用して窓処理された時間ドメイン表現をオーバーラップ加算することによって時間ドメイン・エイリアシング消去を可能にする。好適な実施形態においては、同一の左側オーバーラップ長を有する全ての窓関数タイプの左側窓関数傾斜（遷移傾斜）は同一でも良く、同一の右側オーバーラップ長を有する全ての窓関数タイプの右側遷移傾斜は同一でも良い。さらに、同一のオーバーラップ長を有する左側遷移傾斜と右側遷移傾斜とは、ＭＤＣＴエイリアシング消去のための条件を満たし、エイリアシング消去を可能にするよう適合していても良い。

５．許可された窓関数シーケンス
以下に、図７を参照しながら許可された窓関数シーケンスについて説明する。図７は許可された窓関数シーケンスを表で示したものである。図７の表から分かるように、周波数ドメインモードで符号化されたオーディオフレームであってその時間ドメインサンプルがタイプ“ＡＡＣＳｔｏｐ”の窓関数を用いて窓処理されたフレームの次には、周波数ドメインモードで符号化されたオーディオフレームであってその時間ドメインサンプルがタイプ“ＡＡＣＬｏｎｇ”の窓関数か又はタイプ“ＡＡＣＳｔａｒｔ”の窓関数を用いて窓処理されたフレームが続いても良い。

周波数ドメインモードで符号化されたオーディオフレームであって、その時間ドメインサンプルがタイプ“ＡＡＣＬｏｎｇ”の窓関数を用いて窓処理されたフレームの次には、周波数ドメインモードで符号化されたオーディオフレームであって、その時間ドメインサンプルがタイプ“ＡＡＣＬｏｎｇ”又はタイプ“ＡＡＣＳｔａｒｔ”の窓関数を用いて窓処理されたフレームが続いても良い。

線形予測モードで符号化されたオーディオフレームであって、その時間ドメインサンプルがタイプ“ＡＡＣＳｔａｒｔ”の１個の窓関数、タイプ“ＡＡＣＳｈｏｒｔ”の８個の窓関数又はタイプ“ＡＡＣＳｔｏｐＳｔａｒｔ”の１個の窓関数を用いて窓処理されたフレームの次には、周波数ドメインモードで符号化されたオーディオフレームであって、その時間ドメインサンプルがタイプ“ＡＡＣＳｈｏｒｔ”の８個の窓関数、タイプ“ＡＡＣＳｔｏｐ”の１個の窓関数又はタイプ“ＡＡＣＳｔｏｐＳｔａｒｔ”の１個の窓関数を用いて窓処理されたフレームが続いても良い。代替的に、周波数ドメインモードで符号化されたオーディオフレームであって、その時間ドメインサンプルがタイプ“ＡＡＣＳｔａｒｔ”の１個の窓関数、タイプ“ＡＡＣＳｈｏｒｔ”の８個の窓関数又はタイプ“ＡＡＣＳｔｏｐＳｔａｒｔ”の１個の窓関数を用いて窓処理されたフレームの次には、ＴＣＸ−ＬＰＤ（ＬＰＤ−ＴＣＸとも示す）モードで符号化されたオーディオフレーム若しくはサブフレーム、又はＡＣＥＬＰ（ＬＰＤＡＣＥＬＰとも示す）モードで符号化されたオーディオフレーム若しくはサブフレームが続いても良い。

ＴＣＸ−ＬＰＤモードで符号化されたオーディオフレーム又はサブフレームの次には、周波数ドメインモードで符号化されたオーディオフレームであって、その時間ドメインサンプルが８個の“ＡＡＣＳｈｏｒｔ”窓関数、１個の“ＡＡＣＳｔｏｐ”窓関数、１個の“ＡＡＣＳｔｏｐＳｔａｒｔ”窓関数を用いて窓処理されたフレーム、ＴＣＸ−ＬＰＤモードで符号化されたオーディオフレーム若しくはサブフレーム、又はＡＣＥＬＰモードで符号化されたオーディオフレーム若しくはサブフレームが続いても良い。

ＡＣＥＬＰモードで符号化されたオーディオフレームの次には、周波数ドメインモードで符号化されたオーディオフレームであってその時間ドメインサンプルが８個の“ＡＡＣＳｈｏｒｔ”窓関数、１個の“ＡＡＣＳｔｏｐ”窓関数、１個の“ＡＡＣＳｔｏｐＳｔａｒｔ”窓関数を用いて窓処理されたフレーム、ＴＣＸ−ＬＰＤモードで符号化されたオーディオフレーム、又はＡＣＥＬＰモードで符号化されたオーディオフレームが続いても良い。

ＡＣＥＬＰモードで符号化されたオーディオフレームから周波数ドメインモードで符号化されたオーディオフレーム又はＴＣＸ−ＬＰＤモードで符号化されたオーディオフレームへの遷移においては、いわゆる前方エイリアシング消去（ＦＡＣ）が実行される。そのようなフレーム遷移においては、時間ドメイン表現に対してエイリアシング消去合成信号が追加され、その結果、エイリアシング・アーチファクトが低減又は除去される。同様に、周波数ドメインモードで符号化されたフレーム若しくはサブフレームから、又はＴＣＸ−ＬＰＤモードで符号化されたフレーム若しくはサブフレームから、ＡＣＥＬＰモードで符号化されたフレーム若しくはサブフレームへと切り替える時にも、ＦＡＣが実行される。

ＦＡＣに関する詳細については後述する。

６．図８に従うオーディオ信号符号器
以下に、図８を参照しながらマルチモード・オーディオ信号符号器８００について説明する。

オーディオ信号符号器８００は、オーディオコンテンツの入力表現８１０を受け取り、それに基づいてオーディオコンテンツを表現するビットストリーム８１２を提供するよう構成されている。オーディオ信号符号器８００は、異なる操作モード、即ち周波数ドメインモードと変換符号化励起線形予測ドメインモードと代数符号励起線形予測ドメインモードとで操作するよう構成されている。オーディオ信号符号器８００は符号化制御手段８１４を備え、その符号化制御手段８１４は、オーディオコンテンツの一部分を符号化するために、オーディオコンテンツの入力表現８１０の特性及び／又は達成可能な符号化効率若しくは品質に依存して、前記モード内の１つを選択するよう構成されている。

オーディオ信号符号器８００は周波数ドメイン分枝８２０を備え、その周波数ドメイン分枝８２０は、オーディオコンテンツの入力表現８１０を基にして、符号化済みスペクトル係数８２２と、符号化済みスケールファクタ８２４と、任意ではあるが符号化されたエイリアシング消去係数８２６とを提供する。オーディオ信号符号器８００はＴＣＸ−ＬＰＤ分枝８５０をさらに備え、そのＴＣＸ−ＬＰＤ分枝８５０は、オーディオコンテンツの入力表現８１０を基にして、符号化済みスペクトル係数８５２と、符号化済み線形予測ドメインパラメータ８５４と、符号化されたエイリアシング消去係数８５６とを提供する。オーディオ信号符号器８００はＡＣＥＬＰ分枝８８０をさらに備え、そのＡＣＥＬＰ分枝８８０は、オーディオコンテンツの入力表現８１０を基にして、符号化されたＡＣＥＬＰ励起信号８８２と符号化済み線形予測ドメインパラメータ８８４とを提供する。

周波数ドメイン分枝８２０は、オーディオコンテンツの入力表現８１０又はその前処理済バージョンを受け取り、かつそれに基づいてオーディオコンテンツの周波数ドメイン表現８３２を提供する、時間ドメイン／周波数ドメイン変換手段８３０を含む。周波数ドメイン分枝８２０は、オーディオコンテンツの周波数マスキング効果及び／又は時間マスキング効果を評価し、かつそれに基づいてスケールファクタを記述するスケールファクタ情報８３６を提供する、聴覚心理分析手段８３４をさらに含む。周波数ドメイン分枝８２０はスペクトル処理手段８３８をさらに含み、このスペクトル処理手段８３８は、オーディオコンテンツの周波数ドメイン表現８３２とスケールファクタ情報８３６とを受け取り、そのスケールファクタ情報８３６に依存して、周波数ドメイン表現８３２のスペクトル係数に対して周波数依存及び時間依存のスケーリングを適用することで、オーディオコンテンツのスケールされた周波数ドメイン表現８４０を取得する。周波数ドメイン分枝は量子化／符号化手段８４２をさらに含み、この量子化／符号化手段８４２は、スケールされた周波数ドメイン表現８４０を受け取り、そのスケールされた周波数ドメイン表現８４０を基にして量子化及び符号化を実行することで、符号化済みスペクトル係数８２２を取得する。周波数ドメイン分枝８２０は量子化／符号化手段８４４をさらに含み、この量子化／符号化手段８４４は、スケールファクタ情報８３６を受け取り、そのスケールファクタ情報８３６を基にして符号化済みスケールファクタ情報８２４を提供する。任意ではあるが、周波数ドメイン分枝８２０は、エイリアシング消去係数８２６を提供できるエイリアシング消去係数計算手段８４６をさらに含んでも良い。

ＴＣＸ−ＬＰＤ分枝８５０は時間ドメイン／周波数ドメイン変換手段８６０を含み、この変換手段８６０は、オーディオコンテンツの入力表現８１０を受け取り、それに基づいて、オーディオコンテンツの周波数ドメイン表現８６１を提供する。ＴＣＸ−ＬＰＤ分枝８５０は線形予測ドメインパラメータ計算手段８６２をさらに含み、この計算手段８６２は、オーディオコンテンツの入力表現８１０又はその前処理済バージョンを受け取り、そのオーディオコンテンツの入力表現８１０から、１つ又は複数の線形予測ドメインパラメータ（例えば線形予測符号化フィルタ係数）８６３を導出する。ＴＣＸ−ＬＰＤ分枝８５０は線形予測ドメインからスペクトルドメインへの変換手段８６４をさらに含み、この変換手段８６４は、線形予測ドメインパラメータ（例えば線形予測符号化フィルタ係数）８６３を受け取り、それに基づいてスペクトルドメイン表現又は周波数ドメイン表現８６５を提供する。線形予測ドメインパラメータのスペクトルドメイン表現又は周波数ドメイン表現は、例えば周波数ドメイン又はスペクトルドメインで線形予測ドメインパラメータによって定義されたフィルタのフィルタ応答を表現しても良い。ＴＣＸ−ＬＰＤ分枝８５０はスペクトル処理手段８６６をさらに含み、この処理手段８６６は、周波数ドメイン表現８６１又はその前処理済バージョン８６１’と、線形予測ドメインパラメータ８６３の周波数ドメイン表現又はスペクトルドメイン表現とを受け取り、周波数ドメイン表現８６１又はその前処理済バージョン８６１’のスペクトル成形を実行する。ここで、線形予測ドメインパラメータ８６３の周波数ドメイン表現又はスペクトルドメイン表現８６５は、周波数ドメイン表現８６１又はその前処理済バージョン８６１’の様々なスペクトル係数のスケーリングを調整する役割を果たす。このような方法で、スペクトル処理手段８６６は、線形予測ドメインパラメータ８６３に依存して、周波数ドメイン表現８６１又はその前処理済バージョン８６１’のスペクトル的に成形されたバージョン８６７を提供する。ＴＣＸ−ＬＰＤ分枝８５０は、スペクトル的に成形された周波数ドメイン表現８６７を受け取り、それに基づいて符号化済みスペクトル係数８５２を提供する、量子化／符号化手段８６８をさらに含む。ＴＣＸ−ＬＰＤ分枝８５０は、線形予測ドメインパラメータ８６３を受け取り、それに基づいて符号化済み線形予測ドメインパラメータ８５４を提供する、別の量子化／符号化手段８６９をさらに含む。

ＴＣＸ−ＬＰＤ分枝８５０は、符号化済みエイリアシング消去係数８５６を提供するエイリアシング消去係数生成手段をさらに含む。このエイリアシング消去係数生成手段は、符号化済みスペクトル係数８５２に依存し、さらにオーディオコンテンツの入力表現８１０に依存して、エイリアシングエラー情報８７１を計算するエラー計算手段８７０を含む。エラー計算手段８７０は、任意ではあるが、他のメカニズムから提供される追加的なエイリアシング消去要素に関する情報８７２を考慮に入れても良い。エイリアシング消去係数生成手段は、線形予測ドメインパラメータ８６３に依存してエラーフィルタ処理を記述する情報８７３ａを提供する、分析フィルタ計算手段８７３をさらに含む。エイリアシング消去係数生成手段は、エラー分析フィルタ処理手段８７４をさらに含み、このフィルタ処理手段８７４は、エイリアシングエラー情報８７１と分析フィルタ処理情報８７３ａとを受け取り、その分析フィルタ処理情報８７３ａに依存して調整されたエラー分析フィルタ処理をエイリアシングエラー情報８７１に対して適用し、フィルタ処理済のエイリアシングエラー情報８７４ａを取得する。エイリアシング消去係数生成手段は時間ドメイン／周波数ドメイン変換手段８７５をさらに含み、その変換手段８７５は、タイプＩＶの離散コサイン変換の機能を持ち、フィルタ処理済のエイリアシングエラー情報８７４ａを受け取り、それに基づいて、フィルタ処理済のエイリアシングエラー情報８７４ａの周波数ドメイン表現８７５ａを提供する。エイリアシング消去係数生成手段は量子化／符号化手段８７６をさらに含み、その量子化／符号化手段８７６は、周波数ドメイン表現８７５ａを受け取り、その周波数ドメイン表現８７５ａを符号化して符号化済みエイリアシング消去係数８５６を提供する。

エイリアシング消去係数生成手段は、任意ではあるが、エイリアシング消去に対するＡＣＥＬＰ寄与の計算手段８７７をさらに含む。この計算手段８７７は、ＴＣＸ−ＬＰＤモードで符号化されたオーディオフレームに先行するＡＣＥＬＰモードで符号化されたオーディオサブフレームから導出可能なエイリアシング消去への寄与を計算又は推定するよう構成されていても良い。エイリアシング消去に対するＡＣＥＬＰ寄与の計算は、ポストＡＣＥＬＰ合成の計算と、そのポストＡＣＥＬＰ合成の窓処理と、窓処理されたポストＡＣＥＬＰ合成の折り返しとを含み、追加的なエイリアシング消去要素に関する情報８７２であってＡＣＥＬＰモードで符号化された先行するオーディオサブフレームから導出されても良い情報８７２を取得する。加えて又は代替的に、計算手段８７７は、ＡＣＥＬＰモードで符号化された先行するオーディオサブフレームの復号化によって初期化されたフィルタのゼロ入力応答の計算と、そのゼロ入力応答の窓処理とを含み、追加的なエイリアシング消去要素に関する情報８７２を取得しても良い。

以下に、ＡＣＥＬＰ分枝８８０について簡単に説明する。ＡＣＥＬＰ分枝８８０は、オーディオコンテンツの入力表現８１０に基づいて線形予測ドメインパラメータ８９０ａを計算する線形予測ドメインパラメータ計算手段８９０を含む。ＡＣＥＬＰ分枝８８０は、オーディオコンテンツの入力表現８１０と線形予測ドメインパラメータ８９０ａとに依存して、ＡＣＥＬＰ励起情報８９２ａを計算するＡＣＥＬＰ励起計算手段８９２をさらに含む。ＡＣＥＬＰ分枝８８０は、ＡＣＥＬＰ励起情報８９２ａを符号化し、符号化済みＡＣＥＬＰ励起信号８８２を取得する符号化手段８９４をさらに含む。ＡＣＥＬＰ分枝８８０は、線形予測ドメインパラメータ８９０ａを受け取り、それに基づいて符号化済み線形予測ドメインパラメータ８８４を提供する量子化／符号化手段８９６をさらに含む。

オーディオ信号符号器８００は、符号化済みスペクトル係数８２２と、符号化済みスケールファクタ情報８２４と、エイリアシング消去係数８２６と、符号化済みスペクトル係数８５２と、符号化済み線形予測ドメインパラメータ８５４と、符号化済みエイリアシング消去係数８５６と、符号化済みＡＣＥＬＰ励起８８２と、符号化済み線形予測ドメインパラメータ８８４とに基づいて、ビットストリーム８１２を提供するビットストリーム・フォーマッタ８９８をさらに備える。

符号化済みエイリアシング消去係数８５６の生成に関する詳細については、後述する。

７．図９に従うオーディオ信号復号器
以下に、図９に従うオーディオ信号復号器９００について説明する。

図９に従うオーディオ信号復号器９００は、図２に従うオーディオ信号復号器２００及び図３ｂに従うオーディオ信号復号器３６０に類似しており、上述した説明は、このオーディオ信号復号器９００にも当てはまる。

オーディオ信号復号器９００は、ビットストリーム９０１を受け取り、そのビットストリームから抽出される情報を対応する処理経路へと提供するビットマルチプレクサ９０２を備える。

オーディオ信号復号器９００は、符号化済みスペクトル係数９１２と符号化済みスケールファクタ情報９１４とを受け取るよう構成された、周波数ドメイン経路９１０を備える。周波数ドメイン経路９１０は、任意ではあるが、例えば周波数ドメインで符号化されたオーディオフレームとＡＣＥＬＰモードで符号化されたオーディオフレームとの間の遷移においていわゆる前方エイリアシング消去を可能にするような、符号化済みエイリアシング消去係数９１６を受け取るよう構成されている。周波数ドメイン経路９１０は、周波数ドメインモードで符号化されたオーディオフレームのオーディオコンテンツの時間ドメイン表現９１８を提供する。

オーディオ信号復号器９００は、ＴＣＸ−ＬＰＤ分枝９３０を備え、このＴＣＸ−ＬＰＤ分枝９３０は、符号化済みスペクトル係数９３２と、符号化済み線形予測ドメインパラメータ９３４と、符号化済みエイリアシング消去係数９３６とを受け取り、それらを基にして、ＴＣＸ−ＬＰＤモードで符号化されたオーディオフレーム又はサブフレームの時間ドメイン表現を提供するよう構成されている。オーディオ信号復号器９００は、ＡＣＥＬＰ分枝９８０をさらに備え、このＡＣＥＬＰ分枝９８０は、符号化済みＡＣＥＬＰ励起９８２と符号化済み線形予測ドメインパラメータ９８４とを受け取り、それらを基にして、ＡＣＥＬＰモードで符号化されたオーディオフレーム又はオーディオサブフレームの時間ドメイン表現９８６を提供するよう構成されている。

７．１周波数ドメイン経路
以下に、周波数ドメイン経路９１０に関して詳細に説明する。この周波数ドメイン経路がオーディオ復号器３００の周波数ドメイン経路に類似していることに注目すべきであり、ゆえに、上述した説明を参照されたい。周波数ドメイン分枝９１０は、符号化済みスペクトル係数９１２を受け取り、それに基づいて復号化済みスペクトル係数９２０ａを提供する算術復号化手段９２０と、その復号化済みスペクトル係数９２０ａを受け取り、それに基づいて逆量子化されたスペクトル係数９２１ａを提供する逆量子化手段９２１と、を含む。周波数ドメイン分枝９１０は、符号化済みスケールファクタ情報９１４を受け取り、それに基づいて復号化されたスケールファクタ情報９２２ａを提供する、スケールファクタ復号化手段９２２をさらに含む。周波数ドメイン分枝はスケール手段９２３を含み、このスケール手段９２３は、逆量子化されたスペクトル係数９２１ａを受け取り、その逆量子化されたスペクトル係数をスケールファクタ９２２ａに従ってスケールし、スケールされたスペクトル係数９２３ａを取得する。例えば、スケールファクタ９２２ａは複数の周波数帯域のために提供されても良く、スペクトル係数９２１ａの複数の周波数ｂｉｎが各周波数帯域に関連付けられても良い。このようにして、スペクトル係数９２１ａの周波数帯域毎のスケーリングが実行されても良い。従って、１つのオーディオフレームに関連付けられたスケールファクタの個数は、典型的にはそのオーディオフレームに関連付けられたスペクトル係数９２１ａの個数よりも少ない。周波数ドメイン分枝９１０は、逆ＭＤＣＴ９２４をさらに含み、この逆ＭＤＣＴ９２４は、スケールされたスペクトル係数９２３ａを受け取り、それに基づいて、現時点のオーディオフレームのオーディオコンテンツの時間ドメイン表現９２４ａを提供する。周波数ドメイン分枝９１０は、任意ではあるが結合手段９２５をさらに含み、その結合手段９２５は、時間ドメイン表現９２４ａとエイリアシング消去合成信号９２９ａとを結合し、時間ドメイン表現９１８を取得する。しかし、他の幾つかの実施形態においては、結合手段９２５は省略されても良く、その場合は、時間ドメイン表現９２４ａがオーディオコンテンツの時間ドメイン表現９１８として提供される。

エイリアシング消去合成信号９２９ａを提供するために、周波数ドメイン経路９１０は、符号化済みエイリアシング消去係数９１６に基づいて復号化済みのエイリアシング消去係数９２６ｂを提供する復号化手段９２６ａを含み、さらに、その復号化済みエイリアシング消去係数９２６ｂに基づいてスケールされたエイリアシング消去係数９２６ｄを提供するスケール手段９２６ｃを含む。周波数ドメイン経路はタイプＩＶの逆離散コサイン変換手段９２７をさらに含み、この変換手段９２７は、スケールされたエイリアシング消去係数９２６ｄを受け取り、それに基づいてエイリアシング消去刺激信号９２７ａを提供し、そのエイリアシング消去刺激信号９２７ａは合成フィルタ処理手段９２７ｂへと入力される。合成フィルタ処理手段９２７ｂは、エイリアシング消去刺激信号９２７ａに基づいて、さらに合成フィルタ計算手段９２７ｄから提供される合成フィルタ処理係数９２７ｃに依存して、合成フィルタ処理操作を実行し、その合成フィルタ処理の結果としてエイリアシング消去信号９２９ａを取得する。合成フィルタ計算手段９２７ｄは、例えばＴＣＸ−ＬＰＤモードで符号化されたフレーム又はＡＣＥＬＰモードで符号化されたフレームのためのビットストリームの中に提供された線形予測ドメインパラメータから導出されても良い（又はそのような線形予測ドメインパラメータと同一でも良い）線形予測ドメインパラメータに依存して、合成フィルタ係数９２７ｃを提供する。

上述のように、合成フィルタ処理手段９２７ｂはエイリアシング消去合成信号９２９ａを提供することができるが、このエイリアシング消去合成信号９２９ａは、図５内のエイリアシング消去合成信号５２２と同一でも良く、又は図５内のエイリアシング消去合成信号５４２と同一でも良い。

７．２ＴＣＸ−ＬＰＤ経路
以下に、オーディオ信号復号器９００のＴＣＸ−ＬＰＤ経路について簡単に説明し、その後、更なる詳細について説明する。

ＴＣＸ−ＬＰＤ経路９３０は、主信号合成部９４０を備え、この主信号合成部９４０は、符号化済みスペクトル係数９３２と符号化済み線形予測ドメインパラメータ９３４とに基づいて、オーディオフレーム又はオーディオサブフレームのオーディオコンテンツの時間ドメイン表現９４０ａを提供するよう構成されている。ＴＣＸ−ＬＰＤ分枝９３０は後述するようなエイリアシング消去処理手段をさらに備える。

主信号合成部９４０はスペクトル係数の算術復号化手段９４１を含み、この手段９４１では、符号化済みスペクトル係数９３２に基づいて復号化されたスペクトル係数９４１ａを取得する。主信号合成部９４０は逆量子化手段９４２をさらに含み、復号化されたスペクトル係数９４１ａを基にして、逆量子化されたスペクトル係数９４２ａを提供する。任意ではあるが、逆量子化されたスペクトル係数９４２ａに対し、ノイズ充填手段９４３が適用され、ノイズ充填されたスペクトル係数を取得しても良い。逆量子化されノイズ充填されたスペクトル係数９４３ａは、ｒ［ｉ］として示されても良い。逆量子化されノイズ充填されたスペクトル係数９４３ａ，ｒ［ｉ］は、スペクトル逆成形（de-shaping）部９４４によって処理され、スペクトル的に逆成形されたスペクトル係数９４４ａであって時にはｒ［ｉ］としても示される係数を取得しても良い。スケーリング部９４５は周波数ドメイン・ノイズ成形部９４５として構成されても良い。この周波数ドメインノイズ成形部９４５において、スペクトル係数のスペクトル的に成形された１セット９４５ａであって、ｒｒ［ｉ］として示されても良いセットが得られる。周波数ドメイン・ノイズ成形部９４５においては、スペクトル的に成形されたスペクトル係数９４５ａに対するスペクトル的に逆成形されたスペクトル係数９４４ａの寄与は、周波数ドメイン・ノイズ成形パラメータ９４５ｂによって決定されるが、そのパラメータ９４５ｂは、後述する周波数ドメイン・ノイズ成形パラメータ準備手段により提供される。もし、線形予測ドメインパラメータ９３４によって記述される線形予測フィルタの周波数ドメイン応答が、考慮の対象となっている（スペクトル係数のセット９４４ａからの）各スペクトル係数に関連付けられた周波数にとって比較的小さな値を取る場合には、周波数ドメイン・ノイズ成形部９４５によって、スペクトル的に逆成形されたスペクトル係数のセット９４４ａに対し、比較的大きな重みが与えられる。反対に、もし、線形予測ドメインパラメータ９３４によって記述される線形予測フィルタの周波数ドメイン応答が、考慮の対象となっている（セット９４４ａからの）各スペクトル係数に関連付けられた周波数にとって比較的小さな値を取る場合には、周波数ドメイン・ノイズ成形部９４５によって、スペクトル的に逆成形されたスペクトル係数のセット９４４ａに対し、比較的大きな重みが与えられる。そのため、スペクトル的に逆成形されたスペクトル係数９４４ａからスペクトル的に成形されたスペクトル係数９４５ａが導出されるとき、線形予測ドメインパラメータ９３４により定義されたスペクトル成形が周波数ドメインで適用される。

主信号合成部９４０は、スペクトル的に成形されたスペクトル係数９４５ａを受け取り、それに基づいて時間ドメイン表現９４６ａを提供する逆ＭＤＣＴ９４６をさらに含む。この時間ドメイン表現９４６ａに対してゲインスケーリング９４７が適用され、時間ドメイン表現９４６ａからオーディオコンテンツの時間ドメイン表現９４０ａが導出される。このゲインスケーリング９４７ではゲインファクタｇが適用されるが、これは、好適には周波数から独立した（周波数選択的でない）操作である。

主信号合成部９４０は、次のような周波数ドメイン・ノイズ成形パラメータ９４５ｂの処理をさらに含む。周波数ドメイン・ノイズ成形パラメータ９４５ｂを提供する目的で、主信号合成９４０は、符号化済み線形予測ドメインパラメータ９３４に基づいて復号化された線形予測ドメインパラメータ９５０ａを提供する、復号化手段９５０を含む。復号化された線形予測ドメインパラメータ９５０ａは、例えば復号化された線形予測ドメインパラメータの第１セットＬＰＣ１と、線形予測ドメインパラメータの第２セットＬＰＣ２という形式を取っても良い。線形予測ドメインパラメータの第１セットＬＰＣ１は、例えばＴＣＸ−ＬＰＤモードで符号化されたフレーム又はサブフレームの左側遷移と関連付けられても良く、線形予測ドメインパラメータの第２セットＬＰＣ２は、例えばＴＣＸ−ＬＰＤモードで符号化されたフレーム又はサブフレームの右側遷移と関連付けられても良い。復号化された線形予測ドメインパラメータはスペクトル計算手段９５１へと送られ、そのスペクトル計算手段９５１は、線形予測ドメインパラメータ９５０ａによって定義されるインパルス応答の周波数ドメイン表現を提供する。例えば、復号化された線形予測ドメインパラメータ９５０ａの第１セットＬＰＣ１及び第２セットＬＰＣ２に対し、周波数ドメイン係数Ｘ₀［ｋ］の別個のセットが提供されても良い。

ゲイン計算手段９５２は、スペクトル値Ｘ₀［ｋ］をゲイン値へとマップし、ここで、ゲイン値の第１セットｇ₁［ｋ］は線形予測ドメインパラメータの第１セットＬＰＣ１と関連付けられ、ゲイン値の第２セットｇ₂［ｋ］は線形予測ドメインパラメータの第２セットＬＰＣ２と関連付けられる。例えば、ゲイン値は対応する線形予測ドメインパラメータの大きさに対して逆比例の関係であっても良い。フィルタパラメータ計算手段９５３は、ゲイン値９５２ａを受け取り、それに基づいて周波数ドメイン成形９４５のためのフィルタパラメータ９４５ｂを提供しても良い。例えば、フィルタパラメータａ［ｉ］及びｂ［ｉ］が提供されても良い。フィルタパラメータ９４５ｂは、スペクトル的にスケールされたスペクトル係数９４５ａに対するスペクトル的に逆成形されたスペクトル係数９４４ａの寄与を決定する。フィルタパラメータの可能性のある計算に関する詳細は、以下に説明する。

ＴＣＸ−ＬＰＤ分枝９３０は、前方エイリアシング消去合成信号の計算を含み、この計算は２つの分枝を含む。（前方）エイリアシング消去合成信号の生成における第１の分枝は、符号化済みエイリアシング消去係数９３６を受け取り、それに基づいて復号化されたエイリアシング消去係数９６０ａを提供する、復号化手段９６０を含む。復号化されたエイリアシング消去係数９６０ａはゲイン値ｇに依存するスケーリング９６１によりスケールされ、スケールされたエイリアシング消去係数９６１ａが取得される。いくつかの実施形態においては、同じゲイン値ｇが、エイリアシング消去係数９６０ａのスケーリング９６１と逆ＭＤＣＴ９４６によって提供される時間ドメイン信号９４６ａのゲインスケーリング９４７との両方のために使用されても良い。エイリアシング消去合成信号の生成は、スケールされたエイリアシング消去係数９６１ａに対してスペクトル逆成形を適用するスペクトル逆成形部９６２をさらに含み、その結果、ゲインスケールされスペクトル逆成形されたエイリアシング消去係数９６２ａを取得しても良い。スペクトル逆成形部９６２は詳細を後述するスペクトル逆成形部９４４と類似する方法で実行されても良い。ゲインスケールされスペクトル逆成形されたエイリアシング消去係数９６２ａは、参照番号９６３で示すタイプＩＶの逆離散コサイン変換へと入力され、この逆離散コサイン変換９６３は、ゲインスケールされスペクトル的に逆成形されたエイリアシング消去係数９６２ａに基づいて実行される逆離散コサイン変換の結果として、エイリアシング消去刺激信号９６３ａを提供する。合成フィルタ処理手段９６４は、エイリアシング消去刺激信号９６３ａを受け取り、線形予測ドメインパラメータＬＰＣ１及びＬＰＣ２に基づいて合成フィルタ計算部９６５から提供される合成フィルタ係数９６５ａに依存する合成フィルタを使用して、そのエイリアシング消去刺激信号９６３ａを合成フィルタ処理することで、第１の前方エイリアシング消去合成信号９６４ａを提供する。合成フィルタ処理９６４及び合成フィルタ係数９６５ａに関する詳細は、以下に説明する。

第１の前方エイリアシング消去合成信号９６４ａは、結果的にエイリアシング消去係数９３６と線形予測ドメインパラメータとに基づいている。このエイリアシング消去合成信号９６４ａとオーディオコンテンツの時間ドメイン表現９４０ａとの間の良好な整合性は、オーディオコンテンツの時間ドメイン表現９４０ａの準備とエイリアシング消去合成信号９６４の準備との両方において同一のスケーリングファクタｇを適用することと、オーディオコンテンツの時間ドメイン表現９４０ａの準備とエイリアシング消去合成信号９６４の準備との両方において類似の又は同一のスペクトル逆成形９４４、９６２を適用することにより、達成できる。

ＴＣＸ−ＬＰＤ分枝９３０は、先行するＡＣＥＬＰフレーム又はサブフレームに依存する追加的なエイリアシング消去合成信号９７３ａ，９７６ａの準備手段をさらに含む。エイリアシング消去に対するＡＣＥＬＰの寄与の計算手段９７０は、例えばＡＣＥＬＰ分枝９８０及び／又はＡＣＥＬＰ合成フィルタのコンテンツによって提供される時間ドメイン表現９８６のような、ＡＣＥＬＰ情報を受け取るよう構成されている。エイリアシング消去に対するＡＣＥＬＰの寄与の計算手段９７０は、ポストＡＣＥＬＰ合成信号９７１ａの計算部９７１と、ポストＡＣＥＬＰ合成信号９７１ａの窓処理部９７２と、窓処理されたポストＡＣＥＬＰ合成信号９７２ａの折り返し部９７３とを含む。このように、窓処理されたポストＡＣＥＬＰ合成信号９７２ａを折り返すことで、窓処理され折り返されたポストＡＣＥＬＰ合成信号９７３ａが得られる。加えて、エイリアシング消去に対するＡＣＥＬＰの寄与の計算手段９７０は、ゼロ入力応答の計算部９７５をさらに含み、そのゼロ入力応答は、先行するＡＣＥＬＰサブフレームの時間ドメイン表現を合成する合成フィルタのために計算されても良く、その合成フィルタの初期状態は、先行するＡＣＥＬＰサブフレームの末尾におけるＡＣＥＬＰ合成フィルタの状態と同じでも良い。このように得られたゼロ入力応答９７５ａに対して窓処理９７６が適用され、窓処理されたゼロ入力応答９７６ａが得られる。この窓処理されたゼロ入力応答９７６ａに関するさらなる詳細は、後述する。

最後に、オーディオコンテンツの時間ドメイン表現９４０ａと、第１の前方エイリアシング消去合成信号９６４ａと、第２の前方エイリアシング消去合成信号９７３ａと、第３の前方エイリアシング消去合成信号９７６ａと、を結合するための結合９７８が実行される。このようにして、ＴＣＸ−ＬＰＤモードで符号化されたオーディオフレーム又はオーディオサブフレームについての時間ドメイン表現９３８が、結合９７８の結果として提供される。これについての詳細は後述する。

７．３ＡＣＥＬＰ経路
以下に、オーディオ信号復号器９００のＡＣＥＬＰ分枝９８０について簡単に説明する。ＡＣＥＬＰ経路９８０は、符号化済みＡＣＥＬＰ励起信号９８２の復号化９８８を含み、復号化されたＡＣＥＬＰ励起信号９８８ａを得る。次に、励起信号の計算と励起の後処理９８９が実行され、後処理された励起信号９８９ａが得られる。ＡＣＥＬＰ分枝９８０は、線形予測ドメインパラメータ９８４の復号化９９０を含み、復号化された線形予測ドメインパラメータ９９０ａを得る。その線形予測ドメインパラメータ９９０ａに依存して、後処理された励起信号９８９ａに対して合成フィルタ処理９９１が実行され、その結果、合成されたＡＣＥＬＰ信号９９１ａが得られる。合成されたＡＣＥＬＰ信号９９１ａは、次に後処理９９２を用いて処理され、ＡＣＥＬＰモードで符号化されたオーディオサブフレームについての時間ドメイン表現９８６が得られる。

７．４結合
最後に、周波数ドメインモードで符号化されたオーディオフレームについての時間ドメイン表現９１８と、ＴＣＸ−ＬＰＤモードで符号化されたオーディオフレームについての時間ドメイン表現９３８と、ＡＣＥＬＰモードで符号化されたオーディオフレームについての時間ドメイン表現９８６とを結合するための結合９９６が実行され、その結果、オーディオコンテンツの時間ドメイン表現９９８が得られる。

以下に更なる詳細について説明する。

８．符号器と復号器の詳細
８．１ＬＰＣフィルタ
８．１．１ツールの説明
以下に、線形予測符号化フィルタ係数を使用する符号化と復号化に関する詳細を述べる。

ＡＣＥＬＰモードでは、伝送されたパラメータは、ＬＰＣフィルタ９８４と適応型及び固定型コードブック・インデックス９８２と適応型及び固定型コードブック・ゲイン９８２とを含む。

ＴＣＸモードでは、伝送されたパラメータは、ＬＰＣフィルタ９３４とエネルギーパラメータとＭＤＣＴ係数の量子化インデックス９３２とを含む。この章では、ＬＰＣフィルタの例えばＬＰＣフィルタ係数ａ１〜ａ１６，９５０ａ，９９０ａの復号化について説明する。

８．１．２定義
いくつかの定義について、以下に説明する。

パラメータ“ｎｂ＿ｌｐｃ”は、ビットストリーム内での符号化されたＬＰＣパラメータセットの全体数を記述する。

ビットストリーム・パラメータ“ｍｏｄｅ＿ｌｐｃ”は、後続のＬＰＣパラメータセットの符号化モードを記述する。

ビットストリーム・パラメータ“ｌｐｃ［ｋ］［ｘ］”は、セットｋの番号ｘのＬＰＣパラメータを記述する。

ビットストリーム・パラメータ“ｑｎｋ”は、対応するコードブック番号ｎ_kに関連付けられたバイナリコードを記述する。

８．１．３ＬＰＣフィルタの数
ビットストリーム内での符号化されたＬＰＣフィルタの実際の数“ｎｂ＿ｌｐｃ”は、スーパーフレームのＡＣＥＬＰ／ＴＣＸモードの組合せに依存し、ここで１つのスーパーフレームは複数のサブフレームを含む１つのフレームと同じでも良い。ＡＣＥＬＰ／ＴＣＸモードの組合せはフィールド“ｌｐｃ＿ｍｏｄｅ”から抽出され、このフィールド“ｌｐｃ＿ｍｏｄｅ”は次に、スーパーフレームを構成している４つの（サブフレームとも称される）フレームの各々に対して符号化モード“ｍｏｄ［ｋ］”（ここでｋ＝０〜３）を決定する。モード値０はＡＣＥＬＰを、１は短いＴＣＸ（２５６サンプル）を、２は中間サイズのＴＣＸ（５１２サンプル）を、３は長いＴＣＸ（１０２４サンプル）を、それぞれ示す。ここで注目すべきは、ビットフィールド“ｍｏｄｅ”として考えられても良いビットストリームパラメータ“ｌｐｃ＿ｍｏｄｅ”は、線形予測ドメイン・チャネルストリームの１つのスーパーフレーム内の４つのフレームの各々（例えば高圧縮率オーディオ符号化フレーム又はＡＡＣフレームのような、１つの周波数ドメインモード・オーディオフレームに対応する）に対して符号化モードを定義することである。符号化モードはアレイ“ｍｏｄ［］”内に記憶され、０〜３の値を取る。ビットストリームパラメータ“ＬＰＣ＿ｍｏｄｅ”からアレイ“ｍｏｄ［］”へのマッピングは、表７から決定可能である。

アレイ“ｍｏｄ［０．．．３］”に関し、アレイ“ｍｏｄ［］”が各フレーム内のそれぞれの符号化モードを示しているということができる。詳細については、アレイ“ｍｏｄ［］”によって示される符号化モードを記述した表８を参照されたい。

スーパーフレームの１〜４のＬＰＣフィルタに加え、ＬＰＤコアコーデックを用いて符号化された各セグメントの１番目のスーパーフレームのために、任意のＬＰＣフィルタであるＬＰＣ０が伝送される。これは、ＬＰＣ復号化手順に対し、１にセットされたフラグ“ｆｉｒｓｔ＿ｌｐｄ＿ｆｉｒｓｔ”によって示される。

ビットストリーム内でＬＰＣフィルタが通常見つけられる順序は、ＬＰＣ４，任意のＬＰＣ０，ＬＰＣ２，ＬＰＣ１，ＬＰＣ３である。ビットストリーム内の所与のＬＰＣフィルタの存在に関する条件は、表１にまとめられている。

ビットストリームは、ＡＣＥＬＰ／ＴＣＸモードの組合せによって求められるＬＰＣフィルタの各々に対応する量子化インデックスを抽出するために解析される。以下に、ＬＰＣフィルタの１つを復号化するために必要な操作について説明する。

８．１．４逆量子化器の一般原理
復号器９５０又は復号器９９０内で実行されても良いＬＰＣフィルタの逆量子化は、図１３に示すように実行される。ＬＰＣフィルタは線スペクトル周波数（ＬＳＦ）表現を用いて量子化される。８．１．６．章で後述するように、第１ステージの近似がまず計算される。次に、８．１．７章で後述するように、任意の代数ベクトル量子化（ＡＶＱ）精製（refinement）１３３０が計算される。量子化されたＬＳＦべクトルは、第１ステージの近似と逆重み付きＡＶＱ寄与１３４２との加算１３５０により再構築される。ＡＶＱ精製の存在は、８．１．５章で説明するように、ＬＰＣフィルタの実際の量子化モードに依存する。逆量子化されたＬＳＦベクトルは、後にＬＳＰ（線スペクトルペア）パラメータのベクトルへと変換され、さらにその後に補間されて再度ＬＰＣパラメータへと変換される。

８．１．５．ＬＰＣ量子化モードの復号化
復号化９５０又は復号化９９０の一部であっても良い、ＬＰＣ量子化モードの復号化について以下に説明する。

ＬＰＣ４は、常に絶対量子化手法を使用して量子化される。他のＰＬＣフィルタは、ある絶対的な手法か、又は複数の相対量子化手法のうちの１つかを使用して、量子化されることが可能である。これらＬＰＣフィルタのためにビットストリームから抽出された第１情報は量子化モードである。この情報は“ｍｏｄｅ＿ｌｐｃ”と表示され、表２の最終の縦列に示すように可変長バイナリコードを使用してビットストリーム内で信号化される。

８．１．６第１ステージの近似
各ＬＰＣフィルタのために、図１３の第１ステージの近似をどのように計算するかについては、その量子化モードが決定する。

絶対量子化モード（ｍｏｄｅ＿ｌｐｃ＝０）のために、確率論的にＶＱ量子化された第１ステージの近似に対応する８ビットのインデックスがビットストリームから抽出される。次に単純なテーブルルックアップにより、第１ステージの近似１３２０が計算される。

相対量子化モードのために、表２の２番目の縦列に示すように、既に逆量子化されたＬＰＣフィルタを使用して、第１ステージの近似が計算される。例えば、ＬＰＣ０のためには、相対量子化モードは１つだけであり、逆量子化されたＬＰＣ４フィルタがその第１ステージの近似を構成する。ＬＰＣ１のためには、２つの相対量子化モードが可能である。１つ目は逆量子化されたＬＰＣ２がその第１ステージの近似を構成するものであり、２つ目は逆量子化されたＬＰＣ０及びＬＰＣ２フィルタの間の平均がその第１ステージの近似を構成するものである。ＬＰＣ量子化に関連する他の全ての操作のように、第１ステージの近似の計算は線スペクトル周波数（ＬＳＦ）ドメインで行われる。

８．１．７ＡＶＱ精製
８．１．７．１．概略
ビットストリームから抽出される次の情報は、逆量子化されたＬＳＦベクトルを構築するために必要とされるＡＶＱ精製に関連している。しかし、ＬＰＣ１は唯一の例外である。つまり、このフィルタが（ＬＰＣ０＋ＬＰＣ２）／２に対して相対的に符号化されたとき、ビットストリームはＡＶＱ精製を含まない。

ＡＶＱは、ＴＣＸモードのＡＭＲ−ＷＢ＋でスペクトルを量子化するために使用される８次元のＲＥ₈格子べクトル量子化器に基づいている。ＬＰＣフィルタの復号化は、重み付きの残余（residual）ＬＳＦべクトルの２つの８次元サブべクトル

の復号化を含む。

これら２つのサブべクトルについてのＡＶＱ情報は、ビットストリームから抽出される。その情報は、２つの符号化されたコードブック番号“ｑｎ１”及び“ｑｎ２”と、対応するＡＶＱインデックスとを含む。これらのパラメータは、以下のように復号化される。

８．１．７．２コードブック番号の復号化
ＡＶＱ精製を復号化するためにビットストリームから抽出される１番目のパラメータは、上述した２つのサブべクトルの各々のための２つのコードブック番号ｎ_k，ｋ＝１，２である。コードブック番号を符号化する方法は、ＬＰＣフィルタ（ＬＰＣ０〜ＬＰＣ４）と、その量子化モード（絶対又は相対）に依存する。次の表３に示すように、ｎ_kを符号化するために４つの異なる方法がある。ｎ_kのために使用されるコードについての詳細は、以下に述べる。

ｎ_kモード０及び３：
コードブック番号ｎ_kは可変長コードｑｎｋとして以下のように符号化される：
Ｑ₂→ｎ_kのためのコードは００
Ｑ₃→ｎ_kのためのコードは０１
Ｑ₄→ｎ_kのためのコードは１０
その他の場合：ｎ_kのためのコードは１１の後に以下の番号が続く：
Ｑ₅→０
Ｑ₆→１０
Ｑ₀→１１０
Ｑ₇→１１１０
Ｑ₈→１１１１０
など。

ｎ_kモード１：
コードブック番号ｎ_kはユーナリーコードｑｎｋとして以下のように符号化される：
Ｑ₀→ｎ_k のためのユーナリーコードは０
Ｑ₂→ｎ_k のためのユーナリーコードは１０
Ｑ₃→ｎ_k のためのユーナリーコードは１１０
Ｑ₄→ｎ_k のためのユーナリーコードは１１１０
など。

ｎ_kモード２：
コードブック番号ｎ_kは可変長コードｑｎｋとして以下のように符号化される：
Ｑ₂→ｎ_kのためのコードは００
Ｑ₃→ｎ_kのためのコードは０１
Ｑ₄→ｎ_kのためのコードは１０
その他の場合：ｎ_k のためのコードは、１１の後に以下の番号が続く：
Ｑ₀→０
Ｑ₅→１０
Ｑ₆→１１０
など。

８．１．７．３ＡＶＱインデックスの復号化
ＬＰＣフィルタの復号化には、重み付きの残余ＬＳＦべクトルの各量子化されたサブべクトル

を記述する代数ＶＱパラメータの復号化が含まれる。各ブロックＢｋは、上述のように次元８を持つ。各ブロック

のために、３セットのバイナリインデックスが復号器により受け取られる。
ａ）上述したようにエントロピーコード“ｑｎｋ”を使用して伝送されるコードブック番号ｎ_k；
ｂ）格子点ｚを得るために特定のリーダー（leader）に対して何の順列を適用すべきかを示す、いわゆるベースコードブックの中の選択された格子点ｚのランク(rank)Ｉ_k；
ｃ）量子化されたブロック

（格子点）がベースコードブックの中になかった場合には、ボロノイ拡張(Voronoi extension)インデックスべクトルｋの８個のインデックス；このボロノイ拡張インデックスから、拡張べクトルｖが計算できる。インデックスべクトルｋの各要素内のビット数は、インデックスｎ_kのコード値から得られる拡張オーダーｒによって与えられる。ボロノイ拡張のスケーリングファクタＭは、Ｍ＝２^rにより与えられる。

次に、前記スケーリングファクタＭと、ボロノイ拡張べクトルｖ（ＲＥ₈内の格子点）と、ベースコードブック内の格子点ｚ（これもまたＲＥ₈内の格子点）とから、各量子化されスケールされたブロック

が次式により計算される。

ボロノイ拡張が無い場合（即ちｎ_k＜５，Ｍ＝１，及びｚ＝０）、ベースコードブックは非特許文献２に示されたＱ₀，Ｑ₂，Ｑ₃又はＱ₄のいずれかとなる。そのとき、べクトルｋを伝送するために必要なビットは無い。その他の場合として、

が十分な大きさを持つためにボロノイ拡張が使用された場合には、非特許文献２に示されたＱ₃又はＱ₄だけがベースコードブックとして使用される。Ｑ₃又はＱ₄の選択は、コードブック番号ｎ_kの中に内在している。

８．１．７．４．ＬＳＦ重みの計算
符号器においては、ＡＶＱ量子化の前に残余ＬＳＦべクトルの要素に対して次式のような重みが適用される。

ここで、

であり、ＬＳＦ1stは第１ステージの近似を示し、Wは量子化モード(表４)に依存するスケールファクタである。対応する逆重み付け１３４０が復号器において適用され、量子化された残余ＬＳＦベクトルが回復される。

８．１．７．５逆量子化されたＬＳＦべクトルの再構築
最初に、８．１．７．２章及び８．１．７．３章で説明したように復号化された２つのＡＶＱ精製サブべクトル

とを連結して単一の重み付き残余ＬＳＦべクトルを形成し、次に、この重み付き残余ＬＳＦべクトルに対して８．１．７．４章で説明したように計算された重みの逆を適用して残余ＬＳＦべクトルを形成し、次に、再度この残余ＬＳＦべクトルを８．１．６章に示すように計算された第１ステージの近似に対して加算することで、逆量子化されたＬＳＦべクトルが取得される。

８．１．８量子化されたＬＳＦのリオーダー
逆量子化されたＬＳＦはリオーダーされ、それらが使用される前に５０Ｈｚの隣接するＬＳＦ間の最小距離が導入される。

８．１．９ＬＳＰパラメータへの変換
これまで説明してきた逆量子化の手順の結果、ＬＳＦドメインのＬＰＣパラメータのセットがもたらされる。次に、ＬＳＦは、次式を用いてコサインドメイン（ＬＳＰ）へと変換される。
ｑ_i＝ｃｏｓ（ω_i），ｉ＝１，．．．，１６
ここで、ω_iは線スペクトル周波数（ＬＳＦ）である。

８．１．１０ＬＳＰパラメータの補間
各ＡＣＥＬＰフレーム（又はサブフレーム）のために、そのフレームの末尾に対応するただ一つのＬＰＣフィルタが伝送されるが、各サブフレーム（又は１つのサブフレームの一部）内で異なるフィルタ（ＡＣＥＬＰフレーム又はサブフレーム毎に４つのフィルタ）を取得するために線形補間が使用される。この補間は、先行するフレーム（又はサブフレーム）の末尾に対応するＬＰＣフィルタと、（現時点の）ＡＣＥＬＰフレームの末尾に対応するＬＰＣフィルタとの間で実行される。ＬＳＰ^(new)が新たな有効ＬＳＰべクトルを示し、ＬＳＰ^(old)が以前の有効ＬＳＰべクトルを示すとすると、Ｎ_sfr＝４のサブフレームのための補間されたＬＳＰべクトルは、次式で求められる。

補間されたＬＳＰべクトルは、次章で説明するＬＳＰからＬＰへの変換方法を用いて、各サブフレームにおいて異なるＬＰフィルタを計算するために使用される。

８．１．１１ＬＳＰからＬＰへの変換
各サブフレームのために、補間されたＬＳＰ係数はＬＰフィルタ係数ａ_k，９５０ａ，９９０ａへと変換され、それらの係数はサブフレーム内で再構築される信号を合成するために使用される。定義により、１６次のＬＰフィルタのＬＳＰは次の２つの多項式の根である。

これらは次式として表すことができ、

ここで、

であり、このとき、ｑ_i，ｉ＝１，．．．，１６はコサインドメインのＬＳＦであって、ＬＳＰとも称される。ＬＰドメインへの変換は次のように行われる。量子化され補間されたＬＳＰが分かり、上述した式を拡張することで、Ｆ₁（ｚ）及びＦ₂（ｚ）の係数が見つけられる。以下の再帰的な関係式がＦ₁（ｚ）を計算するために使用される。

ここで、初期値ｆ₁（０）＝１であり、ｆ₁（−１）＝０である。Ｆ₂（ｚ）の係数は、ｑ_2i-1をｑ_2iで置き換えることで、同様に計算される。

Ｆ₁（ｚ）とＦ₂（ｚ）との係数が見つけられた後は、Ｆ₁（ｚ）とＦ₂（ｚ）とは、１＋ｚ^-1と１−ｚ^-1とによりそれぞれ乗算され、Ｆ'₁（ｚ）とＦ'₂（ｚ）とが得られる。即ち、

最後に、ＬＰ係数がＦ'₁（ｉ）とＦ'₂（ｉ）とから次式により計算される。

これは、式Ａ（ｚ）＝（Ｆ'₁（ｚ）＋Ｆ'₂（ｚ））／２と、Ｆ'₁（ｚ）及びＦ'₂（ｚ）がそれぞれ対称的及び非対称的な多項式であるという事実を考慮することとから、直接的に導かれる。

８．２．ＡＣＥＬＰ
以下に、エイリアシング消去メカニズムの理解を促すため、オーディオ信号復号器９００のＡＣＥＬＰ分枝９８０によって実行される処理の詳細を説明する。

８．２．１定義
以下に、いくつかの定義を設ける。

ビットストリーム要素“ｍｅａｎ＿ｅｎｅｒｇｙ”は、フレーム毎の量子化された平均励起エネルギーを記述する。ビットストリーム要素“ａｃｂ＿ｉｎｄｅｘ［ｓｆｒ］”は、各サブフレームのための適応型コードブック・インデックスを示す。

ビットストリーム要素“ｌｔｐ＿ｆｉｌｔｅｒｉｎｇ＿ｆｌａｇ［ｓｆｒ］”は、適応型コードブック励起フィルタ処理フラグである。ビットストリーム要素“ｌｃｂ＿ｉｎｄｅｘ［ｓｆｒ］”は、各サブフレームのためのイノベーション・コードブック・インデックスを示す。ビットストリーム要素“ｇａｉｎｓ［ｓｆｒ］”は、励起に対する適応型コードブックとイノベーション・コードブックとの寄与の量子化されたゲインを記述する。

更に、ビットストリーム要素“ｍｅａｎ＿ｅｎｅｒｇｙ”の符号化に関する詳細は、表５を参照されたい。

８．２．２過去のＦＤ合成及びＬＰＣ０を使用したＡＣＥＬＰ励起バッファの設定
以下に、ブロック９９０ｂで実行されても良い、ＡＣＥＬＰ励起バッファの任意の初期化について説明する。

ＦＤからＡＣＥＬＰへの遷移の場合には、ＡＣＥＬＰ励起の復号化の前に、過去の励起バッファｕ（ｎ）と、過去の前置強調された合成(pre-emphasized synthesis)

とが、過去の（ＦＡＣを含む）ＦＤ合成とＬＰＣ０（即ち、フィルタ係数セットＬＰＣ０のＬＰＣフィルタ係数）とを使用して更新される。そのため、前置強調フィルタ（１−０．６８ｚ^-1）を適用することでＦＤ合成が前置強調され、その結果は

に対してコピーされる。結果として得られた前置強調済み合成は、次に分析フィルタ

によりＬＰＣ０を用いて分析され、励起信号ｕ（ｎ）が得られる。

８．２．３ＣＥＬＰ励起の復号化
もしフレーム内のモードがＣＥＬＰモードであれば、励起は、スケールされた適応型コードブックと固定コードブックのべクトルの加算で構成される。各サブフレーム内で、以下のステップを反復することで励起が構築される。

ＣＥＬＰ情報を復号化するために必要な情報は、符号化済みＡＣＥＬＰ励起９８２として考えられても良い。さらに、ＣＥＬＰ励起の復号化は、ＡＣＥＬＰ分枝９８０のブロック９８８と９８９とによって実行されても良いことに留意すべきである。

８．２．３．１ビットストリーム要素“ａｃｂ＿ｉｎｄｅｘ［］”に依存する適応型コードブック励起の復号化
受け取られたピッチインデックス（適応型コードブックインデックス）は、ピッチ・ラグの整数部及び少数部を見つけるために使用される。

最初の適応型コードブック励起べクトルｖ'（ｎ）は、ＦＩＲ補間フィルタを使用してピッチ遅延及び位相（少数部）における過去の励起ｖ（ｎ）を補間することで見つけられる。

適応型コードブック励起は、６４個のサンプルからなるサブフレームサイズのために計算される。受け取られた適応型フィルタインデックス（ｌｔｐ＿ｆｉｌｔｅｒｉｎｇ＿ｆｌａｇ［］）は、次に、フィルタ処理された適応型コードブックが
ｖ（ｎ）＝Ｖ'（ｎ）
であるか、又は
ｖ（ｎ）＝０．１８ｖ'（ｎ）＋０．６４ｖ'（ｎ−１）＋０．１８ｖ'（ｎ−２）
であるかを決定するために使用される。

８．２．３．２ビットストリーム要素“ｉｃｂ＿ｉｎｄｅｘ［］”を使用するイノベーション・コードブック励起の復号化
受け取られた代数コードブックインデックスは、励起パルスの位置及び振幅（符号）を抽出し、次式で代数コードベクトルを見つけるために使用される。

ここで、ｍ_i及びｓ_iは、パルス位置及び符号を示し、Ｍはパルスの数を示す。代数コードべクトルｃ（ｎ）が復号化されれば、ピッチ先鋭化（pitch sharpening）の手順が実行される。まず、そのｃ（ｎ）が次のように定義される前置強調フィルタによってフィルタ処理される。

この前置強調フィルタは、低周波において励起エネルギーを低減させる役割を果たす。次に、以下に定義される伝達関数を持つ適応型前置フィルタによって、周期性強調(periodicity enhancement)が実行される。

ここで、ｎはサブフレームインデックス（ｎ＝０，．．．，６３）であり、Ｔはピッチラグの整数部分Ｔ₀と少数部分Ｔ_0,fracの丸められたバージョンを示し、次式で与えられる。

適応型前置フィルタＦ_p（ｚ）は、発声された信号の場合には人間の聴覚にとって煩わしい次数間高調波(inter-harmonic frequencies)を減衰させることで、スペクトルを色づけ(colors)する。

８．２．３．３ビットストリーム要素“ｇａｉｎｓ［］”で記述される適応型及びイノベーティブ・コードブックゲインの復号化
サブフレーム毎に受け取られた７ビットインデックスは、適応型コードブックゲイン

と、固定コードブックゲイン修正ファクタ

とを、直接的に提供する。次にそのゲイン修正ファクタに対して推定された固定コードブックゲインを乗算することで、その固定コードブックゲインが計算される。推定された固定コードブックゲインｇ'_cは、以下のようにして得られる。まず、平均イノベーションエネルギーが次式により見つけられる。

次に、推定されたゲインＧ’_cのｄＢ値は、次式で見つけられる。

ここで、

は、フレーム毎の復号化された平均励起エネルギーを示す。１フレーム内の平均イノベーティブ励起エネルギー

は、“ｍｅａｎ＿ｅｎｅｒｇｙ”として各フレーム（１８，３０，４２又は５４ｄＢ）毎に２ビットで符号化される。

線形ドメインの予測ゲインは次式により与えられる。

量子化された固定コードブックゲインは次式により与えられる。

８．２．３．４再構築された励起の計算
以下にｎ＝０，．．．，６３のためのステップを示す。全体の励起は、次式により構築される。

ここで、ｃ（ｎ）は、適応型前置フィルタＦ（ｚ）を通じてフィルタ処理した後の固定コードブックからのコードベクトルである。励起信号ｕ'（ｎ）は、適応型コードブックのコンテンツを更新するために使用される。次に励起信号ｕ'（ｎ）は、次章で説明するような後処理を受け、合成フィルタ

の入力で使用される、後処理された励起信号ｕ（ｎ）が得られる。

８．３励起後処理
８．３．１概略
以下に、ブロック９８９で実行されても良い励起信号後処理について説明する。換言すれば、信号合成のために、励起要素の後処理が次のように実行されても良い。

８．３．２ノイズ強調のためのゲイン平滑化
ノイズ内の励起を強調するために、非線形ゲイン平滑化の技術が固定コードブックゲイン

に対して適用される。スピーチセグメントの安定性及び発声(voicing)に基づいて、固定コードブックべクトルのゲインが平滑化され、静的な信号の場合における励起エネルギーの変動が低減される。これにより、静的な背景ノイズの場合における性能が向上する。発声ファクタ(voicing factor)は次式で与えられる。
λ＝０．５（１−r_v）
ただし、
ｒ_v＝(Ｅ_v−Ｅ_c)/(Ｅ_v＋Ｅ_c)
である。ここで、Ｅｖ及びＥｃは、スケールされたピッチコードべクトル及びスケールされたイノベーション・コードべクトルのエネルギーをそれぞれ示す（r_vは信号周期性の値である）。r_vの値は−１から１の間であることから、λの値は０から１の間となることに注意されたい。また、ファクタλは非発声の量に関係し、純粋な発声 (voiced) セグメントは値０に、純粋な非発声 (unvoiced) セグメントは値１になることに注意されたい。

安定性ファクタθは隣接するＬＰフィルタ同士の距離の値に基づいて計算される。つまり、ファクタθはＩＳＦ距離値に関係する。ＩＳＦ距離値は、次式で求められる。

ここで、f_iは現在のフレームのＩＳＦであり、f_i ^(p)は過去のフレームのＩＳＦを示す。安定性ファクタθは次式で求められる。

ＩＳＦ距離値は安定的な信号の場合に小さくなる。θの値はＩＳＦ距離値に対して逆の相関関係があるので、θの値が大きい程、より安定的な信号に対応している。ゲイン平滑化ファクタＳ_mは次式で与えられる。
Ｓ_m＝λθ

Ｓ_mの値は、非発声で安定的な信号、即ち静的な背景ノイズ信号の場合に対して１に近づく。純粋な発声信号又は非安定的な信号に対しては、Ｓ_mの値は０に近づく。固定コードブックゲイン

と、先行するサブフレームからの最初の修正済みゲインｇ_-1によって与えられる閾値と、を比較することで、最初の修正済みゲインｇ₀が計算される。もし

がｇ_-1以上である場合には、ｇ₀は、

を１．５ｄＢ分だけ減少させることで計算される。但し、ｇ₀≧ｇ_-1である。もし

がｇ_{_1}よりも小さい場合には、ｇ₀は、

を１．５ｄＢ分だけ増分させることで計算される。但し、ｇ₀≦ｇ_-1である。

最後に、ゲインは平滑化されたゲインの値によって次式のように更新される。

８．３．３ピッチ強調器（Pitch Enhancer）
ピッチ強調器のスキームは、イノベーション・フィルタを通じて固定コードブック励起をフィルタ処理することで全体の励起ｕ'（ｎ）を修正する。イノベーション・フィルタは、その周波数応答が高周波を強調し、イノベーティブ・コードべクトルの低周波部分のエネルギーを減少させる。また、そのフィルタの係数は、信号内の周期性に関係している。次式の形式を持つフィルタが使用され、

ここで、ｃ_pe＝0.125(1＋ｒ_v)であり、ｒ_vは上述のように
ｒ_v＝(Ｅ_v−Ｅ_c)/(Ｅ_v＋Ｅ_c)
で与えられる周期性ファクタである。フィルタ処理された固定コードブック・コードべクトルは、次式で与えられ、

更新された後処理済の励起は次式で与えられる。

上述した手順は、励起９８９ａ，ｕ（ｎ）を次式のように更新することで、１つのステップにより実行することができる。

８．４合成と後処理
以下に、合成フィルタ処理９９１と後処理９９２とについて説明する。

８．４．１概略
ＬＰ合成は、後処理された励起信号９８９ａ，ｕ（ｎ）をＬＰ合成フィルタ

を通じてフィルタ処理することで実行される。サブフレーム毎の補間されたＬＰフィルタがＬＰ合成フィルタ処理に使用され、サブフレーム内で再構築された信号は次式で与えられる。

合成された信号は、次にフィルタ１／（１−０．６８ｚ^-1）（符号器入力において適用された前置強調フィルタの逆）を通じてフィルタ処理することで、逆強調(de-emphasized)される。

８．４．２合成信号の後処理
ＬＰ合成の後で、再構築された信号は低周波ピッチ強調を用いて後処理される。２帯域分割が使用され、適応型フィルタ処理が低帯域に対してのみ適用される。その結果、合成されたスピーチ信号の第１ハーモニックに近い周波数にほぼ目標付けられた全体後処理が行われる。信号は２つの分枝において処理される。高域側分枝では、復号化済み信号は高域通過フィルタによってフィルタ処理され、高帯域信号Ｓ_Hが生成される。低域側分枝では、復号化済み信号はまず適応型ピッチ強調器により処理され、次に低域通過フィルタによりフィルタ処理され、低帯域の後処理された信号Ｓ_LEFが得られる。その低帯域の後処理された信号と高帯域信号とを加算することで、後処理された復号化済み信号が得られる。ピッチ強調器の目的は、復号化された信号においてハーモニック間のノイズを低減することであり、その目的は、次式で示す伝達関数

を備え、以下の式

に示されたような、時間的に変化する線形フィルタによって達成される。ここで、αはハーモニック間の減衰を制御する係数であり、Ｔは入力信号

のピッチ周期であり、Ｓ_LE（ｎ）はピッチ強調器の出力信号である。パラメータＴ及びαは時間とともに変化し、ピッチトラッキングモジュールによって与えられる。α＝０．５の値の場合、１／（２Ｔ），３／（２Ｔ），５／（２Ｔ）等の周波数において、即ち、１／Ｔ，３／Ｔ，５／Ｔ等のハーモニック周波数間の中央点において、フィルタのゲインは正確に０となる。αが０に近づくにつれて、フィルタによって生成されるハーモニック間の減衰が小さくなる。

後処理を低周波領域に限定する目的で、強調された信号Ｓ_LEは低域通過フィルタ処理されて信号Ｓ_LEFが生成され、この信号Ｓ_LEFと高域通過フィルタ処理されたＳ_Hとが加算されて、後処理された合成信号Ｓ_Eが得られる。

上述した手順に等しい代替的な手順として、高域通過フィルタ処理を不要とする手順も使用される。この手順は、後処理済信号Ｓ_E（ｎ）をＺドメインで次式のように表すことで達成される。

ここで、Ｐ_LT（ｚ）は次式によって与えられる長期間予測フィルタ(long-term predictor filter)の伝達関数

であり、Ｈ_LP（ｚ）は低域通過フィルタの伝達関数である。

従って、この後処理は、合成信号

から、スケールされ低域通過フィルタ処理された長期エラー信号を減算することに等しい。

各サブフレームにおいて受け取られた閉ループピッチラグ（最も近い整数へと丸められた少数ピッチラグ）により、値Ｔが与えられる。ピッチダブリングをチェックする単純なトラッキングが実行される。遅延Ｔ／２で正規化されたピッチ相関が０．９５を超える場合には、値Ｔ／２が後処理の新たなピッチラグとして使用される。

ファクタαは次式で与えられる。

ここで、

は復号化されたピッチゲインである。

ＴＣＸモードにおいて及び周波数ドメイン符号化の間において、αの値はゼロにセットされる。２５個の係数を持つ線形位相ＦＩＲ低域通過フィルタが使用され、そのカットオフ周波数は５Ｆｓ／２５６ｋＨｚ（フィルタ遅延は１２サンプル）である。

８．５ＭＤＣＴベースのＴＣＸ
以下に、ＴＣＸ−ＬＰＤ分枝９３０の主信号合成９４０によって実行される、ＭＤＣＴベースのＴＣＸについて詳細に説明する。

８．５．１ツールの説明
ビットストリームの変数“ｃｏｒｅ＿ｍｏｄｅ”が１に等しいとき、即ち符号化が線形予測ドメインパラメータを使用して行われたことを示し、かつ３つのＴＣＸモードのうちの１つ以上が「線形予測ドメイン」符号化として選択されたとき、即ち、ｍｏｄ［］の４つのアレイエントリーのうちの１つが０よりも大きい場合には、ＭＤＣＴベースのＴＣＸが使用される。そのＭＤＣＴベースのＴＣＸは、算術復号器９４１から量子化されたスペクトル係数９４１ａを受け取る。その量子化されたスペクトル係数９４１ａ（又はその逆量子化されたバージョン９４２ａ）は、まずコンフォートノイズによって充填される（ノイズ充填９４３）。次に、その結果として得られたスペクトル係数９４３ａ（又はそのスペクトル的に逆成形されたバージョン９４４ａ）に対し、ＬＰＣベースの周波数ドメインノイズ成形９４５が適用され、その後、逆ＭＤＣＴ変換９４６が実行されて、時間ドメイン合成信号９４６ａが取得される。

８．５．２定義
いくつかの定義を以下に記載する。変数“ｌｇ”は算術復号器から出力される量子化されたスペクトル係数の数を示し、ビットストリーム要素“ｎｏｉｓｅ＿ｆａｃｔｏｒ”はノイズレベル量子化インデックスを示す。変数“ｎｏｉｓｅｌｅｖｅｌ”は再構築されたスペクトル内に注入されたノイズのレベルを示す。変数“ｎｏｉｓｅ［］”は生成されたノイズのべクトルを示す。ビットストリーム要素“ｇｌｏｂａｌ＿ｇａｉｎ”は、再スケーリングゲイン量子化インデックスを示し、変数“ｇ”は再スケーリングゲインを示す。変数“ｒｍｓ”は合成された時間ドメイン信号ｘ［］の二乗平均平方根（root mean square）を示し、変数“ｘ［］”は合成された時間ドメイン信号を示す。

８．５．３復号化処理
ＭＤＣＴベースのＴＣＸは、ｍｏｄ［］の値により決定される量子化されたスペクトル係数の数であるｌｇを、算術復号器９４１から求める。この値（ｌｇ）は、逆ＭＤＣＴに対して適用される窓関数の長さ及び形状をも定義する。逆ＭＤＣＴ９４６の間又はその後で適用されても良い窓関数は、３つの部分、即ち、Ｌ個のサンプルからなる左側オーバーラップと、Ｍ個のサンプルの１からなる中間部分と、Ｒ個のサンプルからなる右オーバーラップ部分とで構成されている。長さ２^*ｌｇのＭＤＣＴ窓関数を得るために、ＺＬ個のゼロが左側に追加され、ＺＲ個のゼロが右側に追加される。ＳＨＯＲＴ＿ＷＩＮＤＯＷから又はＳＨＯＲＴ＿ＷＩＮＤＯＷへの遷移の場合には、そのＳＨＯＲＴ＿ＷＩＮＤＯＷの短い窓傾斜に適応させるために、対応するオーバーラップ領域Ｌ又はＲは１２８へと減少させる必要があるかもしれない。その結果、領域Ｍとそれに対応するゼロ領域ＺＬ又はＺＲは、それぞれ６４個のサンプル分だけ拡張させる必要があるかもしれない。

逆ＭＤＣＴ９４６の間か又は逆ＭＤＣＴ９４６に続いて適用されても良いＭＤＣＴ窓関数は、次式により与えられる。

表６は、ｍｏｄ［］の関数としてのスペクトル係数の数を示す。

算術復号器９４１から出力される量子化されたスペクトル係数ｑｕａｎｔ［］９４１ａ、又は逆量子化されたスペクトル係数９４２ａは、任意ではあるが、コンフォートノイズ（ノイズ充填９４３）によって充填される。注入されたノイズのレベルは、復号化された変数ｎｏｉｓｅ＿ｆａｃｔｏｒによって次式のように決定される。
noise_level = 0.0625*(8-noise_factor)

次に、−１又は＋１の値をランダムに送るランダム関数ｒａｎｄｏｍ＿ｓｉｇｎ（）を使用して、ノイズべクトルｎｏｉｓｅ［］が計算される。
noise[i] = random_sign()*noise_level

ｑｕａｎｔ［］及びｎｏｉｓｅ［］のべクトルは、ｑｕａｎｔ［］内の８個の連続するゼロのランがｎｏｉｓｅ［］の要素で置き換えられるような方法で結合され、再構築されたスペクトル係数べクトルであるｒ［］９４２ａを形成する。８個の連続する非ゼロのランは次式で検出される。

再構築されたスペクトル９４３ａは、次式で得られる。

スペクトル逆成形９４４は、任意ではあるが、再構築されたスペクトル９４３ａに対し、以下に示すステップに従って適用される。
１．スペクトルの初めの１／４の各８次元ブロックについて、インデックスｍの８次元ブロックのエネルギーＥ_mを計算する。
２．比率Ｒ_m＝ｓｑｒｔ（Ｅ_m／Ｅ_I）を計算する。ここで、Ｉは全てのＥ_mの最大値を持つブロックインデックスである。
３．もしR_m＜0.1ならば、R_m＝0.1にセットする
４．もしR_m＜R_m-1ならば、R_m＝R_m-1にセットする

スペクトルの初めの１／４に属する各８次元ブロックは、次にファクタR_mによって乗算される。その結果、スペクトル的に逆成形されたスペクトル係数９４４ａが取得される。

逆ＭＤＣＴ９４６を適用する前に、ＭＤＣＴブロックの両方の端部（即ち左と右の折り返し点）に対応する、２つの量子化されたＬＰＣフィルタであるＬＰＣ１及びＬＰＣ２（それぞれがフィルタ係数ａ₁〜ａ₁₀によって記述されても良い）が回復され（ブロック９５０）、それらの重み付きバージョンが計算され、それらに対応するデシメートされた（変換長に関わらず６４ポイントの）スペクトル９５１ａが計算される（ブロック９５１）。これらの重み付きＬＰＣスペクトル９５１ａは、ＬＰＣフィルタ係数９５０ａに対してＯＤＦＴ（odd discrete Fourier transform；奇数離散フーリエ変換）を適用することで計算される。ＯＤＦＴを計算する前に、（スペクトル計算９５１で使用された）ＯＤＦＴ周波数ｂｉｎｓが（逆ＭＤＣＴ９４６の）ＭＤＣＴ周波数ｂｉｎｓと完璧に整列するように、ＬＰＣ係数に対して複素変調が適用される。例えば、（例えば時間ドメインフィルタ係数ａ₁〜ａ₁₆によって定義される）所与のＬＰＣフィルタ

の重み付きＬＰＣ合成スペクトル９５１ａは、以下の式で計算される。

ここで、

は、重み付きＬＰＣフィルタの（時間ドメイン）係数であって、次式により与えられる。

ゲインｇ［ｋ］９５２ａは、ＬＰＣ係数のスペクトル表現Ｘ₀［ｋ］，９５１ａから次式により計算できる。

ここで、Ｍ＝６４は計算されたゲインが適用された帯域の個数を示す。

仮に、ｇ１［ｋ］とｇ２［ｋ］，ｋ＝０，．．．，６３がデシメートされたＬＰＣスペクトルであって、上述のように計算された左と右の折り返し点にそれぞれ対応するものであるとすれば、逆ＦＤＮＳ操作９４５は、再構築されたスペクトルｒ［ｉ］，９４４ａを次式のような再帰的なフィルタを使用してフィルタ処理することで構成される。
ｒｒ[i]＝ａ[i]・ｒ[i]＋ｂ[i]・ｒｒ[i-1], i=0...lg,
ここで、ａ［ｉ］とｂ［ｉ］，９４５ｂとは、次式を使用して、左と右のゲインｇ１［ｋ］，ｇ２［ｋ］，９５２ａから導出される。
ａ[i]＝２・ｇ1[k]・ｇ2[k]／(ｇ1[k]＋ｇ2[k]),
ｂ[i]＝(ｇ2[k]−ｇ1[k])／(ｇ1[k]＋ｇ2[k]).

上述の説明では、ＬＰＣスペクトルがデシメートされているという事実を考慮して、変数ｋはｉ／（ｌｇ／６４）に等しい。

再構築されたスペクトルｒｒ［］，９４５ａは、逆ＭＤＣＴ９４６へと送られる。窓処理されていない出力信号であるｘ［］，９４６ａは、ゲインｇによって再スケールされ、そのｇは、次のように復号化された“ｇｌｏｂａｌ＿ｇａｉｎ”インデックスの逆量子化によって得られたものである。

ここで、ｒｍｓは次式で計算される。

再スケールされた合成時間ドメイン信号９４０ａは、次式と同じになる：

再スケーリング後では、窓処理とオーバーラップ加算とが、例えばブロック９７８において適用される。

再構築されたＴＣＸ合成ｘ（ｎ）９３８は、次に任意ではあるが、前置強調フィルタ（１−０．６８ｚ^-1）を通じてフィルタ処理される。結果として得られた前置強調された合成は、次に分析フィルタ

によってフィルタ処理され、励起信号が取得される。計算された励起はＡＣＥＬＰ適応型コードブックを更新し、後続のフレームにおいてＴＣＸからＡＣＥＬＰへの切替を可能にする。その信号は、フィルタ１／（１−０．６８ｚ^-1）を適用し、前置強調された合成を逆強調させることで、最終的に再構築される。分析フィルタ係数はサブフレームベースで補間されていることに注意されたい。

さらに、ＴＣＸ合成の長さは、（オーバーラップを除く）ＴＣＸフレーム長により与えられることにも注意されたい。即ち、１，２又は３のｍｏｄ［］に対し、それぞれ２５６，５１２又は１０２４個のサンプルとなる。

８．６前方エイリアシング消去（ＦＡＣ）のツール
８．６．１前方エイリアシング消去（ＦＡＣ）ツールの説明
以下に、最終的な合成信号を取得するために、ＡＣＥＬＰと（例えば周波数ドメインモード又はＴＣＸ−ＬＰＤモードのような）変換符号化（ＴＣ）との間における遷移の期間中に実行される、前方エイリアシング消去（ＦＡＣ）操作について説明する。ＦＡＣの目的は、ＴＣによって導入されかつ先行の又は後続のＡＣＥＬＰフレームによって消去できないような、時間ドメインエイリアシングを消去することである。ここでのＴＣの概念は、長いブロックと短いブロック（周波数ドメインモード）に亘るＭＣＤＴと、ＭＤＣＴベースのＴＣＸ（ＴＣＸ−ＬＰＤモード）とを含む。

図１０は、ＴＣフレームのための最終的な合成信号を取得するために計算された異なる中間信号を表す。ここに示す例の中では、（例えば周波数ドメインモード又はＴＣＸ−ＬＰＤモードで符号化されたフレーム１０２０である）ＴＣフレームが、その前後の両方を、ＡＣＥＬＰフレーム（フレーム１０１０及び１０３０）に挟まれている。その他の場合（１つのＡＣＥＬＰフレームがありその後に２つ以上のＴＣフレームが続く場合や、２つ以上のＴＣフレームの後に１つのＡＣＥＬＰフレームが続く場合）では、必要な信号だけが計算される。

図１０を参照すれば、前方エイリアシング消去の概略が示されるが、その前方エイリアシング消去はブロック９６０，９６１，９６２，９６３，９６４，９６５，９７０によって実行されることにも留意すべきである。

図１０に示す前方エイリアシング消去復号化操作の図式においては、横軸１０４０ａ，１０４０ｂ，１０４０ｃ，１０４０ｄは、オーディオサンプルについて時間軸を示す。縦軸１０４２ａは、前方エイリアシング消去合成信号の例えば振幅について示す。縦軸１０４２ｂは、例えばＡＣＥＬＰ合成信号及び変換符号化フレーム出力信号のような、符号化されたオーディオコンテンツを表現する信号を記述する。縦軸１０４２ｃは、例えば窓処理されたＡＣＥＬＰゼロインパルス応答及び窓処理され折り返されたＡＣＥＬＰ合成のような、エイリアシング消去に対するＡＣＥＬＰ寄与を示す。縦軸１０４２ｄは、オリジナルドメインにおける合成信号を記述する。

図から分かるように、前方エイリアシング消去合成信号１０５０は、ＡＣＥＬＰモードで符号化されたオーディオフレーム１０１０からＴＣＸ−ＬＰＤモードで符号化されたオーディオフレーム１０２０への遷移において提供される。前方エイリアシング消去合成信号１０５０は、タイプＩＶの逆ＤＣＴ９６３によって提供されるエイリアシング消去刺激信号９６３ａに対して合成フィルタ処理９６４を適用することで得られる。合成フィルタ処理９６４は、線形予測ドメインパラメータ又はＬＰＣフィルタ係数のセットＬＰＣ１から導出される合成フィルタ係数９６５ａに基づいている。図１０から分かるように、（第１）前方エイリアシング消去合成信号の第１部分１０５０ａは、非ゼロエイリアシング消去刺激信号９６３ａに対して合成フィルタ処理９６４によって提供される非ゼロ入力応答であっても良い。しかし、前方エイリアシング消去合成信号１０５０は、エイリアシング消去刺激信号９６３ａのゼロ部分のために合成フィルタ処理９６４によって提供されても良い、ゼロ入力応答部分１０５０ｂをも含む。このように、前方エイリアシング消去合成信号１０５０は、非ゼロ入力応答部分１０５０ａとゼロ入力応答部分１０５０ｂとを含んでも良い。前方エイリアシング消去合成信号１０５０は、好適には、フレーム／サブフレーム１０１０とフレーム／サブフレーム１０２０との間の遷移に関係する、線形予測ドメインパラメータのセットＬＰＣ１に基づいて提供されても良いことに留意すべきである。さらに、別の前方エイリアシング消去合成信号１０５４が、フレーム／サブフレーム１０２０からフレーム／サブフレーム１０３０への遷移において提供される。前方エイリアシング消去合成信号１０５４は、エイリアシング消去刺激信号９６３ａの合成フィルタ処理９６４によって提供されても良く、そのエイリアシング消去刺激信号９６３ａはタイプＩＶの逆ＤＣＴ９６３によってエイリアシング消去係数に基づいて提供される。前方エイリアシング消去合成信号１０５４の準備は、フレーム／サブフレーム１０２０と後続のフレーム／サブフレーム１０３０との間の遷移に関係する、線形予測ドメインパラメータのセットＬＰＣ２に基づいても良いことに留意すべきである。

加えて、追加的なエイリアシング消去合成信号１０６０及び１０６２が、ＡＣＥＬＰフレーム又はサブフレーム１０１０からＴＣＸ−ＬＰＤフレーム又はサブフレーム１０２０への遷移において提供される。例えば、ブロック９７１，９７２，９７３により、ＡＣＥＬＰ合成信号９８６，１０５６の窓処理され折り返されたバージョン９７３ａ，１０６０が提供されても良い。更に、窓処理されたＡＣＥＬＰゼロ入力応答９７６ａ，１０６２が、例えばブロック９７５，９７６によって提供されても良い。例えば、詳細は後述するが、窓処理され折り返されたＡＣＥＬＰ合成信号９７３ａ，１０６０が、ＡＣＥＬＰ合成信号９８６，１０５６を窓処理し、その窓処理の結果の時間的折り返し９７３を適用することで取得されても良い。窓処理されたＡＣＥＬＰゼロ入力応答９７６ａ，１０６２は、ＡＣＥＬＰ合成信号９８６，１０５６を提供するために使用される合成フィルタ９９１に等しい合成フィルタ９７５に対してゼロ入力を提供することで得られても良く、このとき、合成フィルタ９７５の初期状態は、フレーム又はサブフレーム１０１０のＡＣＥＬＰ合成信号９８６，１０５６の準備の最終点における合成フィルタ９９１の状態に等しい。従って、窓処理され折り返されたＡＣＥＬＰ合成信号１０６０は前方エイリアシング消去合成信号９７３ａと等しくても良く、窓処理されたＡＣＥＬＰゼロ入力応答１０６２は前方エイリアシング消去合成信号９７６ａと等しくても良い。

最後に、時間ドメイン表現９４０ａの窓処理済バージョンに等しくても良い変換符号化フレーム出力信号１０５８は、エイリアシング消去を達成するために、前方エイリアシング消去合成信号１０５０，１０５４、及び追加的なＡＣＥＬＰ寄与１０６０，１０６２と結合される。

８．６．２定義
次に、幾つかの定義を示す。ビットストリーム要素“ｆａｃ＿ｇａｉｎ”は、７ビットのゲインインデックスを記述する。ビットストリーム要素“ｎｑ［ｉ］”は、コードブック番号を記述する。シンタックス要素“ＦＡＣ［ｉ］”は、前方エイリアシング消去データを記述する。変数“ｆａｃ＿ｌｅｎｇｔｈ”は、前方エイリアシング消去変換の長さを記述し、タイプ“ＥＩＧＨＴ＿ＳＨＯＲＴ＿ＳＥＱＵＥＮＣＥＳ”の窓関数から及びその窓関数への変換については６４であっても良く、その他の場合には１２８であっても良い。変数“ｕｓｅ＿ｇａｉｎ”は明白なゲイン情報の使用を示す。

８．６．３復号化処理
以下に、復号化処理について説明する。その目的で、異なるステップについて簡単に説明する。

１．ＡＶＱパラメータの復号化（ブロック９６０）
−ＬＰＣフィルタ（８．１章を参照）の符号化のためのツールと同じ代数べクトル量子化（ＡＶＱ）ツールを使用して、ＦＡＣ情報が符号化される。
−ｉ＝０．．．ＦＡＣ変換長のために、
・コードブック番号ｎｑ［ｉ］が修正されたユーナリコードを用いて符号化される。
・対応するＦＡＣデータＦＡＣ［ｉ］が４^*ｎｑ［ｉ］ビットで符号化される。
−ｉ＝０，．．．，ｆａｃ＿ｌｅｎｇｔｈのためのべクトルＦＡＣ［ｉ］が、ビットストリームから抽出される。

２．ＦＡＣデータに対するゲインファクタｇの適用（ブロック９６１）
−ＭＤＣＴベースのＴＣＸ（ｗＬＰＣ）を用いた遷移のために、対応する“ｔｃｘ＿ｃｏｄｉｎｇ”要素のゲインが使用される。
−その他の遷移のために、ゲイン情報“ｆａｃ＿ｇａｉｎ”が（７ビットのスカラー量子化器を用いて符号化された）ビットストリームから回復されている。そのゲイン情報を使用して、ゲインｇはｇ＝１０^fac_gain/28として計算される。

３．ＭＤＣＴベースのＴＣＸとＡＣＥＬＰとの間の遷移の場合には、ＦＡＣスペクトルデータ９６１ａの最初の１／４に対してスペクトル逆成形９６２が適用される。その逆成形ゲインは、８．５．３章で説明したように、対応するＭＤＣＴベースのＴＣＸのために（スペクトル逆成形９４４が使用するように）計算されたものであり、ＦＡＣとＭＤＣＴベースのＴＣＸとの量子化ノイズが同じ形状を持つようになる。

４．ゲインスケールされたＦＡＣデータの逆ＤＣＴ−ＩＶの計算（ブロック９６３）
−ＦＡＣ変換の長さｆａｃ＿ｌｅｎｇｔｈは、デフォルトにより１２８と等しい。
−短いブロックを用いた遷移については、この長さは６４へと低減される。

５．ＦＡＣ合成信号９６４ａを得るために、（例えば合成フィルタ係数９６５ａにより記述される）重み付き合成フィルタ

を適用する（ブロック９６４）。結果として得られた信号は図１０のライン（ａ）に示す。
−重み付き合成フィルタは、折り返し点に対応するＬＰＣフィルタに基づいている。（図１０ではＡＣＥＬＰからＴＣＸ−ＬＰＤへの遷移のためのＬＰＣ１、及びｗＬＰＤＴＣ（ＴＣＸ−ＬＰＤ）からＡＣＥＬＰへの遷移のためのＬＰＣ２、又はＦＤＴＣ（周波数コード変換符号化）からＡＣＥＬＰへの遷移のためのＬＰＣ０として認識されている）。
−同じＬＰＣ重み付けファクタが次のＡＣＥＬＰ操作について使用される。

−ＦＡＣ合成信号９６４ａを計算するために、重み付き合成フィルタ９６４の初期メモリが０に設定される。
−ＡＣＥＬＰからの遷移については、ＦＡＣ合成信号１０５０は、重み付き合成フィルタ（１２８個のサンプル）のゼロ入力応答（ＺＩＲ）１０５０ｂを追加することでさらに拡張される。

６．ＡＣＥＬＰからの遷移の場合には、窓処理されたポストＡＣＥＬＰ合成９７２ａを計算し、（例えば信号９７３ａ又は信号１０６０を得るために）それを折り返し、それに対して窓処理されたＺＩＲ信号（例えば信号９７６ａ又は信号１０６２）を加算する。ＺＩＲ応答はＬＰＣ１を使用して計算される。ｆａｃ＿ｌｅｎｇｔｈのポストＡＣＥＬＰ合成サンプルに対して適用された窓関数は、
sine[n+fac_length]*sine[fac_length-1-n], n=-fac_length ... -1,
であり、ＺＩＲに対して適用された窓関数は、
1-sine[n+fac_length]2, n=0... fac_length-1,
であり、ここで、ｓｉｎｅ［ｎ］はサイン周期の１／４である。
sine[n]＝sin(n*π/(2*fac_length)), n=0... 2*fac_length-1.
結果として得られた信号は、図１０のライン（ｃ）により表現され、ＡＣＥＬＰ寄与（信号寄与１０６０，１０６２）として示される．

７．（図１０内のライン（ｂ）で示す）ＴＣフレームに対し（又は時間ドメイン表現９４０ａの窓処理済バージョンに対し）、ＦＡＣ合成９６４ａ，１０５０を（ＡＣＥＬＰからの遷移の場合にはＡＣＥＬＰ寄与９７３ａ，９７６ａ，１０６０，１０６２とともに）追加することで、合成信号９９８（図１０のライン（ｄ）で示す）を取得できる。

８．７前方エイリアシング消去（ＦＡＣ）符号化処理
以下に、前方エイリアシング消去に必要な情報の符号化に関する詳細を説明する。特に、エイリアシング消去係数９３６の計算及び符号化について説明する。

図１１は、変換符号化（ＴＣ）で符号化されたフレーム１１２０が、その前後をＡＣＥＬＰで符号化されたフレーム１１１０，１１３０で挟まれているときの、符号器における処理ステップを示す。ここで、ＴＣの概念は、ＡＡＣやＭＤＣＴベースのＴＣＸ（ＴＣＸ−ＬＰＤ）の場合のように、長いブロック及び短いブロックに亘るＭＤＣＴを含む。図１１は、時間ドメインマーカー１１４０とフレーム境界１１４２，１１４４とを示す。縦に伸びる点線は、ＴＣで符号化されたフレーム１１２０の始点１１４２及び終点１１４４を示す。ＬＰＣ１とＬＰＣ２とは、２つのＬＰＣフィルタを算出するための分析窓関数の中央を示し、ＬＰＣ１はＴＣで符号化されたフレーム１１２０の始点１１４２において算出されたものであり、ＬＰＣ２は同じフレーム１１２０の終点１１４４において算出されたものである。“ＬＰＣ１”マーカーの左にあるフレーム１１１０は、ＡＣＥＬＰで符号化されたと仮定する。“ＬＰＣ２”マーカーの右にあるフレーム１１３０もまた、ＡＣＥＬＰで符号化されたと仮定する。

図１１には４つのライン１１５０，１１６０，１１７０及び１１８０があり、各ラインは符号器におけるＦＡＣ目標の算出ステップを表している。ここで、各ラインは上側のラインと時間的に整列されていることを理解されたい。

図１１のライン１（１１５０）はオリジナルオーディオ信号を表現し、上述したようにフレーム１１１０、１１２０、１１３０というセグメントを含んでいる。中央のフレーム１１２０は、ＭＤＣＴドメインでＦＤＮＳを用いて符号化されたと仮定し、ＴＣフレームと呼ぶことにする。先行するフレーム１１１０内の信号は、ＡＣＥＬＰモードで符号化されたと仮定する。ＦＡＣは両方の遷移（ＡＣＥＬＰからＴＣへ、及びＴＣからＡＣＥＬＰへの遷移）に関係していることから、ＦＡＣにおける全ての処理を説明するために、このような（ＡＣＥＬＰ、次にＴＣ、次にＡＣＥＬＰという）符号化モードの順序が選択されている。

図１１のライン２（１１６０）は、（復号化アルゴリズムの知識を用いて符号器によって決定されても良い）各フレーム内の復号化された（合成）信号に対応している。ＴＣフレームの始点から終点まで延びる上方の曲線１１６２は、（中央では平坦であって始点及び終点では平坦でないような）窓処理の効果を示す。折り返しの効果は、下方に示すセグメントの始点における曲線１１６４と終点における曲線１１６６によって示す（セグメントの始点には“−”の符号を、セグメントの終点には“＋”の符号を付した）。ＦＡＣは、次にこれらの効果を修正するために使用される。

図１１のライン３（１１７０）は、ＦＡＣの符号化負荷を低減するためにＴＣフレームの始点で使用される、ＡＣＥＬＰ寄与を表す。このＡＣＥＬＰ寄与は２つの部分から構成されている。即ち、（１）先行するフレームの終点からの窓処理され折り返されたＡＣＥＬＰ合成８７７ｆ，１１７０と、（２）ＬＰＣ１フィルタの窓処理されたゼロ入力応答８７７ｊ，１１７２とである。

ここで、窓処理され折り返されたＡＣＥＬＰ合成１１７０は、窓処理され折り返されたＡＣＥＬＰ合成１０６０と等しくても良く、窓処理されたゼロ入力応答１１７２は、窓処理されたＡＣＥＬＰゼロ入力応答１０６２と等しくても良いことに注目すべきである。換言すれば、オーディオ信号符号器は、オーディオ信号復号器（ブロック８６９ａ及び８７７）側において得られるであろう合成の結果１１６２，１１６４，１１６６，１１７０，１１７２を、推定（又は算出）しても良い。

次に、ライン１（１１５０）からライン２（１１６０）とライン３（１１７０）とを単純に引き算することで、ライン４（１１８０）に示すＡＣＥＬＰエラーが得られる（ブロック８７０）。時間ドメインにおけるエラー信号８７１，１１８２の想定される包絡の概略図を、図１１のライン４（１１８０）に示す。ＡＣＥＬＰフレーム（１１１０）のエラーは、時間ドメインにおける振幅ではおよそ平坦だと想定される。次に、（マーカーＬＰＣ１とＬＰＣ２との間の）ＴＣフレーム内のエラーは、図１１内のライン４（１１８０）のセグメント１１８２に示すように、一般的な形状（時間ドメイン包絡）を表すと想定される。

図１１のライン４のＴＣフレームの始点及び終点における窓処理及び時間ドメインエイリアシングの影響を効率的に補償する目的で、さらにＴＣフレームがＦＤＮＳを使用すると仮定して、図１２に従うＦＡＣが適用される。図１２は、この処理をＴＣフレームの左部分（ＡＣＥＬＰからＴＣへの遷移）及び右部分（ＴＣからＡＣＥＬＰへの遷移）の両方に関連して表記していることに注意されたい。

要約すれば、符号化済みエイリアシング消去係数８５６，９３６によって表現される変換符号化フレームエラー８７１，１１８２は、オリジナルドメイン（即ち時間ドメイン）の信号１１５０から、（例えば信号８６９ｂにより示される）変換符号化フレーム出力１１６２，１１６４，１１６６と（例えば信号８７２により示される）ＡＣＥＬＰ寄与１１７０，１１７２との両方を減算することで、取得できる。このようにして、変換符号化フレームエラー信号１１８２が得られる。

以下に、変換符号化フレームエラー８７１，１１８２の符号化について説明する。

まず、重み付けフィルタ８７４，１２１０，Ｗ₁（ｚ）がＬＰＣ１フィルタから算出される。（図１１と図１２ではＦＡＣ目標とも呼ばれる）図１１のライン４（１１８０）上のＴＣフレーム１１２０の始点におけるエラー信号８７１，１１８２は、次にＷ₁（ｚ）を通じてフィルタ処理され、このＷ₁（ｚ）は、図１１のライン４上のＡＣＥＬＰフレーム１１２０の中に、初期状態又はフィルタメモリとしてＡＣＥＬＰエラー８７１，１１８２を有している。図１２の上方に描いたフィルタ８７４，１２１０；Ｗ₁（ｚ）の出力は、次にＤＣＴ−ＩＶ変換８７５，１２２０の入力を形成する。ＤＣＴ−ＩＶ変換８７５，１２２０から出力された変換係数８７５ａ，１２２２は、次に（Ｑ、１２３０によって示す）ＡＶＱツール８７６を用いて量子化され、符号化される。このＡＶＱツールは、ＬＰＣ係数を量子化するために使用されたものと同じである。これらの符号化された係数は復号器へと送られる。ＡＶＱ１２３０の出力は、次に逆ＤＣＴ−ＩＶ９６３，１２４０へと入力され、時間ドメイン信号９６３ａ，１２４２を形成する。この時間ドメイン信号は、次にゼロ・メモリ（ゼロ初期状態）を持つ逆フィルタ９６４，１２５０，１／Ｗ₁（ｚ）を通じてフィルタ処理される。１／Ｗ₁（ｚ）を通じたフィルタ処理は、ＦＡＣ目標の後ろに延びるサンプルに対して、ゼロ入力を使用して、ＦＡＣ目標の長さを超えて拡張させる。フィルタ１２５０，１／Ｗ₁（ｚ）の出力９６４ａ，１２５２はＦＡＣ合成であり、このＦＡＣ合成は、窓処理や時間ドメインエイリアシングの影響を補償するためにＴＣフレームの始点において適用されても良い（例えば信号９４６ａ等の）修正信号である。

ＴＣフレームの終点における窓処理及び時間ドメインエイリアシング修正のための処理について考察すれば、図１２の下方に示す図となる。図１１（ＦＡＣ目標）のライン４上のＴＣフレーム１１２０の終点におけるエラー信号８７１，１１８２ｂは、フィルタ８７４，１２１０’；Ｗ₂（ｚ）を通じてフィルタ処理され、そのフィルタは、初期状態又はフィルタメモリとして、図１１のライン４上のＴＣフレーム１１２０内のエラーを含んでいる。次に、図１２の上方に示し、ＴＣフレームの始点におけるＦＡＣ目標の処理に関係した全ての処理ステップと同様なステップが実行されるが、ＦＡＣ合成におけるＺＩＲ拡張は除外される。

（ローカルＦＡＣ合成を得るために）符号器で適用されたとき、図１２に示す処理が（左から右へと）完全に実行される一方で、復号器側では、図１２に示す処理は受信された復号化済みＤＣＴ−ＩＶ係数から開始するよう適用されるだけであることに注意すべきである。

９．ビットストリーム
以下に、本発明の理解を促すために、ビットストリームについての詳細を説明する。ここで、ビットストリーム内には、有意な量の構成情報(configuration information)が含まれても良いことに留意すべきである。

周波数ドメインモードで符号化されたフレームのオーディオコンテンツは、主に“ｆｄ＿ｃｈａｎｎｅｌ＿ｓｔｒｅａｍ（）”と命名されたビットストリーム要素によって表現される。このビットストリーム要素“ｆｄ＿ｃｈａｎｎｅｌ＿ｓｔｒｅａｍ（）”は、グローバルゲイン情報“ｇｌｏｂａｌ＿ｇａｉｎ”と、符号化されたスケールファクタデータ“ｓｃａｌｅ＿ｆａｃｔｏｒ＿ｄａｔａ（）”と、算術的に符号化されたスペクトルデータ“ａｃ＿ｓｐｅｃｔｒａｌ＿ｄａｔａ”とを含む。加えて、もし先行する（幾つかの実施形態では「スーパーフレーム」とも呼ばれる）フレームが線形予測ドメインモードで符号化されており、その先行するフレームの最後のサブフレームがＡＣＥＬＰモードで符号化されていた場合には、（その場合だけは）、ビットストリーム要素“ｆｄ＿ｃｈａｎｎｅｌ＿ｓｔｒｅａｍ（）”は、（“ｆａｃ＿ｄａｔａ（１）”とも呼ばれる）ゲイン情報を持つ前方エイリアシング消去データを選択的に含む。換言すれば、もし先行するフレーム又はサブフレームがＡＣＥＬＰモードで符号化されていた場合には、周波数ドメインモードのオーディオフレームに対し、ゲイン情報を含む前方エイリアシング消去データが選択的に提供される。この点は有利である。なぜなら、上述したように、ＴＣＸ−ＬＰＤモードで符号化された先行するオーディオフレーム又はオーディオサブフレームと、周波数ドメインモードで符号化された現時点のオーディオフレームとの間で、単なるオーバーラップ加算機能によってエイリアシング消去が達成できるからである。

詳細については、図１４を参照されたい。図１４は、グローバルゲイン情報“ｇｌｏｂａｌ＿ｇａｉｎ”とスケールファクタデータ“ｓｃａｌｅ＿ｆａｃｔｏｒ＿ｄａｔａ（）”と算術的に符号化されたスペクトルデータ“ａｃ＿ｓｐｅｃｔｒａｌ＿ｄａｔａ”とを含む、ビットストリーム要素“ｆｄ＿ｃｈａｎｎｅｌ＿ｓｔｒｅａｍ（）”のシンタックス表現を示す。変数“ｃｏｒｅ＿ｍｏｄｅ＿ｌａｓｔ”は最後のコアモードを記述し、スケールファクタに基づく周波数ドメイン符号化については値０をとり、線形予測ドメインパラメータに基づく符号化（ＴＣＸ−ＬＰＤ又はＡＣＥＬＰ）については値１をとる。変数“ｌａｓｔ＿ｌｐｄ＿ｍｏｄｅ”は最後のフレーム又はサブフレームのＬＰＤモードを記述し、ＡＣＥＬＰモードで符号化されたフレーム又はサブフレームについて値０をとる。

図１５を参照しながら、線形予測ドメインモードで符号化された（「スーパーフレーム」とも呼ばれる）オーディオフレームの情報を符号化する、ビットストリーム要素“ｌｐｄ＿ｃｈａｎｎｅｌ＿ｓｔｒｅａｍ（）”のためのシンタックスを説明する。線形予測ドメインモードで符号化されたオーディオフレーム（「スーパーフレーム」）は、複数のサブフレーム（例えば「スーパーフレーム」との組み合わせにおいては「フレーム」とも呼ばれる）を含んでも良い。そのサブフレーム（又は「フレーム」）は、それらサブフレームの幾つかがＴＣＸ−ＬＰＤモードで符号化され、他のサブフレームがＡＣＥＬＰモードで符号化されるように、異なるタイプのものであっても良い。

ビットストリーム変数“ａｃｅｌｐ＿ｃｏｒｅ＿ｍｏｄｅ”は、ＡＣＥＬＰが使用された場合のビット割り当てスキームを記述する。ビットストリーム要素“ｌｐｄ＿ｍｏｄｅ”は、上述した通りである。変数“ｆｉｒｓｔ＿ｔｃｘ＿ｆｌａｇ”は、ＬＰＤモードで符号化された各フレームの始点において“ｔｒｕｅ”にセットされる。変数“ｆｉｒｓｔ＿ｌｐｄ＿ｆｌａｇ”は、現時点のフレーム又はサブフレームが線形予測符号化ドメインで符号化されたフレーム又はサブフレームのシーケンスの１番目か否かを示すフラグである。変数“ｌａｓｔ＿ｌｐｄ”は、最後のサブフレーム（又はフレーム）が符号化されたモード（ＡＣＥＬＰ；ＴＣＸ２５６；ＴＣＸ５１２；ＴＣＸ１０２４）を記述するために更新される。参照番号１５１０で分かるように、最後のサブフレームがＡＣＥＬＰモード（ｌａｓｔ＿ｌｐｄ＿ｍｏｄｅ＝＝０）で符号化された場合にはＴＣＸ−ＬＰＤモード（ｍｏｄ［ｋ］＞０）で符号化されたサブフレームのために、さらに、先行するサブフレームがＴＣＸ−ＬＰＤモード（ｌａｓｔ＿ｌｐｄ＿ｍｏｄｅ＞０）で符号化された場合にはＡＣＥＬＰモード（ｍｏｄ［ｋ］＝＝０）で符号化されたサブフレームのために、ゲイン情報（“ｆａｃ＿ｄａｔａ＿（０）”）を含まない前方エイリアシング消去データが含まれる。

もし逆に、先行するフレームが周波数ドメインモード（ｃｏｒｅ＿ｍｏｄｅ＿ｌａｓｔ＝０）で符号化され、現時点のフレームの１番目のサブフレームがＡＣＥＬＰモード（ｍｏｄ［０］＝＝０）で符号化される場合には、ゲイン情報（“ｆａｃ＿ｄａｔａ＿（１）”）を含む前方エイリアシング消去データが、ビットストリーム要素“ｌｐｄ＿ｃｈａｎｎｅｌ＿ｓｔｒｅａｍ”内に含まれる。

要約すると、周波数ドメインで符号化されたフレームとＡＣＥＬＰモードで符号化されたフレーム又はサブフレームとの間の直接的な遷移がある場合には、所与の前方エイリアシング消去ゲイン値を持つ前方エイリアシング消去データがビットストリームの中に含まれる。反対に、ＴＣＸ−ＬＰＤモードで符号化されたフレーム又はサブフレームとＡＣＥＬＰモードで符号化されたフレーム又はサブフレームとの間の遷移がある場合には、所与の前方エイリアシング消去ゲイン値を持たない前方エイリアシング消去データがビットストリームの中に含まれる。

図１６では、ビットストリーム要素“ｆａｃ＿ｄａｔａ（）”によって記述される前方エイリアシング消去データのシンタックスを説明する。パラメータ“ｕｓｅＧａｉｎ”は、参照番号１６１０から分かるように、所与の前方エイリアシング消去ゲイン値ビットストリーム要素“ｆａｃ＿ｇａｉｎ”が有るか否かを示す。加えて、そのビットストリーム要素“ｆａｃ＿ｇａｉｎ”は、複数のコードブック番号ビットストリーム要素“ｎｑ［ｉ］”と、幾つかの“ｆａｃ＿ｄａｔａ”ビットストリーム要素“ｆａｃ［ｉ］”とを含む。

前記コードブック番号と前記前方エイリアシング消去データとの復号化については、上述した通りである。

１０．代替的な構成
これまで装置を説明する文脈で幾つかの態様を示してきたが、これらの態様は対応する方法の説明でもあることは明らかであり、そのブロック又は装置が方法ステップ又は方法ステップの特徴に対応することは明らかである。同様に、方法ステップを説明する文脈で示した態様もまた、対応する装置の対応するブロック又は項目若しくは特徴を表している。方法ステップの幾つか又は全ては、例えばマイクロプロセッサ、プログラム可能なコンピュータ、又は電子回路等のハードウエアにより（を使用して）実行されても良い。幾つかの実施形態においては、最も重要な方法ステップの内の１つ又は複数のステップは、そのような装置によって実行されても良い。

本発明の符号化されたオーディオ信号は、デジタル記憶媒体に記憶されても良く、インターネットのような無線伝送媒体や有線伝送媒体などによって伝送されても良い。

所定の構成要件にも依るが、本発明の実施形態は、ハードウエア又はソフトウエアにおいて構成可能である。この構成は、その中に格納される電子的に読み取り可能な制御信号を有し、本発明の各方法が実行されるようにプログラム可能なコンピュータシステムと協働する（又は協働可能な）、デジタル記憶媒体、例えばフレキシブルディスク，ＤＶＤ，ブルーレイ，ＣＤ，ＲＯＭ，ＰＲＯＭ，ＥＰＲＯＭ，ＥＥＰＲＯＭ，フラッシュメモリなどを使用して実行することができる。従って、そのデジタル記憶媒体はコンピュータ読み取り可能であっても良い。

本発明に従う実施形態の幾つかは、上述した方法の１つを実行するようプログラム可能なコンピュータシステムと協働可能で、電子的に読み取り可能な制御信号を有するデータキャリアを含んでも良い。

一般的に、本発明の実施例は、コンピュータプログラム製品として構成することができ、このプログラムコードは当該コンピュータプログラム製品がコンピュータ上で作動するときに、本発明の方法を実行するよう作動する。そのプログラムコードは例えば機械読み取り可能なキャリアに記憶されても良い。

本発明の他の実施形態は、上述した方法の１つを実行するための、機械読み取り可能なキャリアに記憶されたコンピュータプログラムを含む。

換言すれば、本発明の方法のある実施形態は、そのコンピュータプログラムがコンピュータ上で作動するときに、上述した方法の１つを実行するためのプログラムコードを有する、コンピュータプログラムである。

本発明の他の実施形態は、上述した方法の１つを実行するために記憶されたプログラムコードを含む、データキャリア（又はデジタル記憶媒体又はコンピュータ読み取り可能な媒体）である。そのデータキャリア、デジタル記憶媒体又は記憶された媒体は、典型的には有形及び／又は非遷移的である。

本発明の他の実施形態は、上述した方法の１つを実行するためのコンピュータプログラムを表現するデータストリーム又は信号シーケンスである。そのデータストリーム又は信号シーケンスは、例えばインターネットを介するデータ通信接続を介して伝送されるように構成されても良い。

他の実施形態は、上述した方法の１つを実行するように構成又は適用された、例えばコンピュータ又はプログラム可能な論理デバイスのような処理手段を含む。

他の実施形態は、上述した方法の１つを実行するためのコンピュータプログラムをインストールされたコンピュータを含む。

本発明の他の実施形態は、上述した方法の１つを実行するためのコンピュータプログラムを受信器に対して（例えば電子的に又は光学的に）伝送するよう構成された、装置又はシステムを含む。その受信器は、例えばコンピュータ、モバイル装置、メモリ装置又はその類似物であっても良い。その装置又はシステムは、コンピュータプログラムを受信器に対して伝送するためのファイルサーバーを含んでも良い。

幾つかの実施形態においては、（例えば書換え可能ゲートアレイのような）プログラム可能な論理デバイスは、上述した方法の幾つか又は全ての機能を実行するために使用されても良い。幾つかの実施形態では、書換え可能ゲートアレイは、上述した方法の１つを実行するためにマイクロプロセッサと協働しても良い。一般的に、そのような方法は、好適には、任意のハードウエア装置によって実行される。

上述した実施の形態は、本発明の原理を単に例示的に示したにすぎない。本明細書に記載した構成及び詳細について、修正及び変更が可能であることは、当業者にとって明らかである。従って、本発明は、本明細書に実施形態の説明及び解説の目的で提示した具体的詳細によって限定されるものではなく、添付した特許請求の範囲によってのみ限定されるべきである。

１１．結論
以下に、統一されたスピーチ及びオーディオ符号化（ＵＳＡＣ）窓処理とフレーム遷移との統合のための本発明の提案をまとめる。

まず、紹介と背景説明を行う。ＵＳＡＣ参照モデルの（参照デザインとも称される）現時点のデザインは、３つの異なる符号化モジュールから成る（又は含む）。与えられた各オーディオ信号セクション（例えばフレーム又はサブフレーム）のために、そのセクションを符号化／復号化するための１つの符号化モジュール（又は符号化モード）が選択され、その結果、様々な符号化モードがもたらされる。それらのモジュールは作動に違いがあるため、１つのモードから別のモードへの遷移に対しては特別な注意を払う必要がある。過去において、様々な研究によって、符号化モード間のそのような遷移についての修正が提案されて来た。

本発明に従う実施形態は、想定される全体的な窓処理及び遷移スキームを提案する。品質及び体系的な構造の改善にとって非常に有望な証拠を提示しながら、このスキームを完成させる過程において達成された進歩を以下に説明する。

本明細書は、（作業中の草案４に従うデザインとも称される）参照デザインに対して提案された修正をまとめたものであり、その目的は、ＵＳＡＣのためのより柔軟な符号化構造を創造することで、オーバーコーディング(overcoding）を減らし、コーデックの変換符号化されたセクションの複雑性を低減させることである。

多大な費用を要する非臨界サンプリング（オーバーコーディング）を回避するような窓処理スキームを達成するために、次の２つの要素が導入され、これらは本発明の実施形態のいくつかにおいては必須の要素と考えられる。
（１）前方エイリアシング消去（ＦＡＣ）窓処理；及び
（２）（ＴＣＸ、ＴＣＸ−ＬＰＤ又はｗＬＰＴとしても知られる）ＬＰＤコアコーデックにおける変換符号化分枝のための周波数ドメインノイズ成形（ＦＤＮＳ）

両方の技術を組み合わせることで、最小限の必要ビットにおいて高い柔軟性を持って変換長の切替を可能にするような窓処理スキームを使用することができる。

以下に、本発明の実施形態が提供する利点の理解を促す目的で、参照システムの課題について説明する。ＵＳＡＣ草案標準の作業中の草案４に従う参照概念は、ＭＰＥＧサラウンド及び強化されたＳＢＲモジュールから成る（を含む）前／後処理ステージと協働する、切替コアコーデックによって構成されている。その切替コアは、周波数ドメイン（ＦＤ）コーデックと線形予測ドメイン（ＬＰＤ）コーデックとを特徴としている。後者は、ＡＣＥＬＰモジュールと、（「重み付き線形予測変換」（ｗＬＰＴ）又は変換符号化励起（ＴＣＸ）とも称される）重み付きドメインで働く変換符号器とを使用する。これまでに、基本的に異なる符号化原理に起因して、それらのモード間の遷移は特に取り扱いが難しいことが分かってきた。モード同士が効率的に混ざり合うためには、特に注意が必要であることが分かって来た。

以下に、時間ドメインから周波数ドメインへ（ＡＣＥＬＰ←→ｗＬＰT，ＡＣＥＬＰ←→ＦＤ）の遷移において起こる課題について説明する。時間ドメイン符号化から変換ドメイン符号化への遷移は、特に油断ならないことが分かって来た。なぜなら、変換符号化は、ＭＤＣＴにおいて近隣のブロックの変換ドメインエイリアシング消去（ＴＤＡＣ）特性に基づくからである。周波数ドメイン符号化されたブロックを、その隣接したオーバーラップしているブロックからの追加的な情報無しに、その全体を復号化することができないことが分かって来た。

次に、信号ドメインから線形予測ドメインへ（ＦＤ←→ＡＣＥＬＰ，ＦＤ←→ｗＬＰT）の遷移において起こる課題について説明する。線形予測ドメインからの遷移及び線形予測ドメインへの遷移には、異なる量子化ノイズ成形パラダイム間の遷移という意味もある。それらのパラダイムは、聴覚心理的に動機付けられたノイズ成形情報を伝達し適用する方法が異なっており、そのため符号化モードが変化する場所において非連続性を発生させていることが分かって来た。

以下に、ＵＳＡＣ草案標準の作業中の草案４に従う参照概念のフレーム遷移マトリクスに関する詳細を説明する。ＵＳＡＣ参照モデルの混成的な性格から、想定可能な窓処理の遷移は多数存在する。図４に示す縦横３×３列の表は、ＵＳＡＣ草案標準の作業中の草案４の概念に従って現時点で構成されている遷移の概略図を示している。

上述した寄与の各々は、図４の表に示された遷移の１つ又は複数について説明したものである。非均質的な遷移（主対角線上ではない遷移）は、それぞれが異なる特定の処理ステップを適用することに注意すべきであり、その処理ステップとは、臨界サンプリングを達成しようという試みと、ブロッキングアーチファクトの防止と、共通の窓処理スキームの発見と、符号器閉ループモード決定との間における妥協点である。いくつかの場合では、この妥協点は、符号化され伝送されたサンプルを捨てるという損失も生じさせる。

以下に、提案された幾つかのシステム変更について説明する。換言すれば、ＵＳＡＣの作業中の草案４に従う参照概念の改良点について説明する。窓の遷移において指摘された課題に対処するために、本発明に従う実施形態は、ＵＳＡＣ草案標準の作業中の草案４に従う参照システムに沿う概念と比較した場合、現存のシステムに対して２つの修正を導入する。第１の修正は、補足的な前方エイリアシング消去窓を採用することで、時間ドメインから周波数ドメインへの遷移を全般的に改善させることを目的としている。第２の修正は、ＬＰＣ係数に対して変成(transmutation)ステップを導入することで、信号ドメイン及び線形予測ドメインの処理を融合させるものであり、そのステップによってＬＰＣ係数が周波数ドメインに適用可能となる修正である。

以下に、周波数ドメインにおけるＬＰＣの適用を可能にする、周波数ドメインノイズ成形（ＦＤＮＳ）の概念を説明する。このツール（ＦＤＮＳ）の目標は、異なるドメインで働くＭＤＣＴ符号器のＴＤＡＣ（変換ドメイン・エイリアシング消去）処理を可能にするということである。ＵＳＡＣの周波数ドメイン部分のＭＤＣＴが信号ドメインで作動する一方で、参照概念のｗＬＰＴ（又はＴＣＸ）は重み付きのフィルタ処理されたドメインで作動する。参照概念で使用された重み付きのＬＰＣ合成フィルタを、周波数ドメインにおける同等の処理ステップで置き換えることにより、両方の変換符号器のＭＤＣＴが同一のドメインで作動し、量子化ノイズ成形において非連続性を発生させることなくＴＤＡＣが達成できる。

換言すれば、重み付きのＬＰＣ合成フィルタ３３０ｇは、ＬＰＣから周波数ドメインへの変換３８０ｉと組み合わされたスケーリング／周波数ドメインノイズ成形３８０ｅによって置き換えられる。そのため、周波数ドメイン経路３７０のＭＤＣＴ３２０ｇとＴＣＸ−ＬＰＤ分枝３８０のＭＤＣＴ３８０ｈは、同一のドメインで作動し、変換ドメイン・エイリアシング消去（ＴＤＡＣ）が達成される。

以下に、前方エイリアシング消去窓関数（ＦＡＣ窓関数）に関する詳細について説明する。前方エイリアシング消去（ＦＡＣ）窓関数は、既に上述し説明した通りである。この補足的な窓関数は、連続的に作動している変換コードの中で、通常は後続又は先行の窓関数に起因するＴＤＡＣ情報の欠損を補償するものである。ＡＣＥＬＰ時間ドメイン符号器は隣接するフレームに対してオーバーラップを示さないため、ＦＡＣがこの欠損オーバーラップの不足を補償することができる。

ＬＰＣフィルタを周波数ドメインで適用することで、ＬＰＣ符号化経路は、ＡＣＥＬＰ符号化されたセグメントとｗＬＰＴ（ＴＣＸ−ＬＰＤ）符号化されたセグメントとの間における補間されたＬＰＣフィルタ処理の平滑化の影響のうちの一部を失うことが分かって来た。しかし、ＦＡＣは丁度この地点において好適な遷移を可能にするよう設計されていたので、ＦＡＣがそのような影響を補償できることも分かって来た。

ＦＡＣ窓関数とＦＤＮＳとを導入した結果、想定可能な全ての遷移が生来的なオーバーコーディング無しで達成可能となる。

以下に、窓処理スキームに関する幾つかの詳細を説明する。

ＦＡＣ窓関数がＡＣＥＬＰとｗＬＰＴとの間の遷移をどのように融合できるかについては、上述した通りである。更なる詳細については、非特許文献３を参照されたい。

ＦＤＮＳはｗＬＰＴを信号ドメインへとシフトするので、ＦＡＣは、ＡＣＥＬＰからｗＬＰＴへの遷移及びｗＬＰＴからＡＣＥＬＰへの遷移と、ＡＣＥＬＰからＦＤモードへの遷移及びＦＤモードからＡＣＥＬＰへの遷移との両方に対し、全く同一の方法（又は少なくとも類似の方法で）適用可能になる。

同様に、以前にはＦＤ窓関数同士の間又はｗＬＰＴ窓関数同士の間（即ちＦＤからＦＤへの遷移、又はｗＬＰＴからｗＬＰＴへの遷移）だけに限って可能であったようなＴＤＡＣベースの変換符号化遷移が、周波数ドメインからｗＬＰＴへ又はその逆の越境時に適用可能になる。このように、両方の技術の組合せによって、ＡＣＥＬＰフレーミンググリッドの６４個のサンプルが右（時間軸においては「後ろ」）へとシフトできるようになる。その結果、一端部における６４サンプルのオーバーラップ加算と、他端部における特別長い周波数ドメイン変換窓とは、最早不要となる。参照概念と比較したとき、本発明に従う実施形態では、両方の場合において、６４サンプルのオーバーコーディングが防止できる。最も重要なことは、他の全ての遷移がそのままの状態で残り、更なる修正が不要となる点である。

以下に、新たなフレーム遷移マトリクスについて簡単に説明する。図５に、新たなフレーム遷移マトリクスの例を示す。主対角線上の遷移はＵＳＡＣ草案標準の作業中の草案４から変化は無い。他の全ての遷移は、ＦＡＣ窓関数又は周波数ドメインでの単純なＴＤＡＣによって対処できる。幾つかの実施形態においては、上述したスキームのために、隣接する変換ドメイン窓関数の間に２つのオーバーラップ長、即ち１０２４サンプル及び１２８サンプルだけが必要となる。但し、他のオーバーラップ長も想定可能である。

１２．主観的評価
現状の構成において、本発明が提案する新たな技術は品質の点において譲歩するものではないことを示すため、２つのリスニングテストが行われたことに留意されたい。やがて、本発明に従う実施形態が、以前はサンプルが捨てられた場所におけるビット削減によって品質の向上をもたらすことが期待されている。他の副次効果として、モード遷移が非臨界サンプリングによる悪影響から逃れられるため、符号器における分類器制御の柔軟性を大きく高めることができる。

１３．所見
要約すれば、本明細書では、ＵＳＡＣの草案標準の作業中の草案４で使用される現存のスキームと比較して複数の利点を持つ、想定される窓処理と遷移スキームについて説明した。ここで提案された窓処理と遷移スキームは、全ての変換符号化されたフレームにおいて臨界サンプリングを維持し、２の冪でない変換を不要とし、全ての変換符号化されたフレームを適切に整列させる。その提案は２つの新たなツールに基づいている。第１のツールはエイリアシング消去（ＦＡＣ）であり、非特許文献３に説明されている。第２のツールは周波数ドメインノイズ成形（ＦＤＮＳ）であり、量子化ノイズ成形において不連続を発生させずに同一のドメインにおける周波数ドメインフレーム及びｗＬＰＴフレームの処理を可能にする。そのため、ＵＳＡＣ内における全てのモード遷移がこれら２つの基本的ツールを用いて処理可能となり、全ての変換符号化されたモードについて調和のとれた窓処理が可能となる。本発明が提案するツールは、ＵＳＡＣの草案標準の作業中の草案４に従う参照概念と比較して、同等又はそれ以上の品質を提供するという、主観的なテスト結果も本明細書の中で示された。

Claims

オーディオコンテンツの符号化済み表現（２１０；３６１；９０１）に基づいて、そのオーディオコンテンツの復号化済み表現（２１２；３９９；９９８）を提供するオーディオ信号復号器（２００；３６０；９００）であって、
スペクトル係数の第１セット（２２０；３８２；９４４ａ）とエイリアシング消去刺激信号の表現（２２４；９３６）と複数の線形予測ドメインパラメータ（２２２；３８４；９５０ａ）とに基づいて、変換ドメインモードで符号化された前記オーディオコンテンツの一部の時間ドメイン表現（２１２；３８６；９３８）を得るための変換ドメイン経路（２３０；２４０；２５０；２６０；２７０；２８０；３８０；９３０）を備え、
前記変換ドメイン経路は、
前記線形予測ドメインパラメータの少なくとも１つのサブセットに依存して前記スペクトル係数の第１セット（９４４ａ）に対してスペクトル成形を適用し、前記スペクトル係数の第１セットのスペクトル成形済みバージョン（２３２；３８０ｇ；９４５ａ）を得るスペクトル処理器（２３０；３８０ｅ；９４５）と、
前記スペクトル係数の第１セットのスペクトル成形済みバージョンに基づいて前記オーディオコンテンツの時間ドメイン表現を得るための第１の周波数ドメイン／時間ドメイン変換器（２４０；３８０ｈ；９４６）と、
前記線形予測ドメインパラメータ（２２２；３８４；９３４）の少なくとも１つのサブセットに基づいてエイリアシング消去刺激信号（２２４；９６３ａ）をフィルタ処理し、前記エイリアシング消去刺激信号からエイリアシング消去合成信号（２５２；９６４ａ）を導出するエイリアシング消去刺激フィルタ（２５０；９６４）と、
前記オーディオコンテンツの時間ドメイン表現（２４２；９４０ａ）と前記エイリアシング消去合成信号（２５２；９６４）又はその後処理済みバージョンとを結合し、エイリアシング低減済み時間ドメイン信号を得るための結合器（２６０；９７８）と、を含むことを特徴とするオーディオ信号復号器。
請求項１に記載のオーディオ信号復号器において、
前記オーディオ信号復号器は、複数の符号化モードの間で切替可能なマルチモードオーディオ信号復号器であり、
前記変換ドメイン経路（２３０；２４０；２５０；２６０；２７０；２８０；３８０；９３０）は、エイリアシング消去・オーバラップ加算操作を許可しないようなオーディオコンテンツの部分を先行部分（１０１０）として持つオーディオコンテンツの部分（１０２０）、又はエイリアシング消去・オーバラップ加算操作を許可しないようなオーディオコンテンツの部分を後続部分（１０３０）として持つオーディオコンテンツの部分（１０２０）について、前記エイリアシング消去合成信号（２５２；９６４ａ）を選択的に得ることを特徴とする、オーディオ信号復号器。
請求項１又は２に記載のオーディオ信号復号器において、
前記オーディオ信号復号器は、変換符号化励起情報（９３２）及び線形予測ドメインパラメータ情報（９３４）を使用する変換符号化励起線形予測ドメインモードと、スペクト係数情報（９１２）及びスケールファクタ情報（９１４）を使用する周波数ドメインモードとの間で切替を行うものであり、
前記変換ドメイン経路（９３０）は、前記変換符号化励起情報（９３２）に基づいてスペクトル係数の第１セット（９４４ａ）を得ると共に、前記線形予測ドメインパラメータ情報（９３４）に基づいて線形予測ドメインパラメータ（９５０ａ）を得るものであり、
前記オーディオ信号復号器は、前記スペクトル係数情報（９１２）によって記述されたスペクトル係数の周波数ドメインモードの１セット（９２１ａ）に基づいて、かつ前記スケールファクタ情報（９１４）によって記述されたスケールファクタ（９２２）の１セット（９２２ａ）に依存して、前記周波数ドメインモードで符号化されたオーディオコンテンツの時間ドメイン表現（９１８）を得る周波数ドメイン経路（９１０）を備え、
前記周波数ドメイン経路（９１０）は、スペクトル係数の周波数ドメインモードの前記セット（９２１ａ）又はそのセットの前処理済みバージョンに対してスケールファクタの前記セット（９２２ａ）に依存してスペクトル成形を適用し、スペクトル係数のスペクトル的に成形された周波数ドメインモードのセット（９２３ａ）を得るスペクトル処理器（９２３）を含み、
前記周波数ドメイン経路（９１０）は、前記スペクトル係数のスペクトル的に成形された周波数ドメインモードの前記セット（９２３ａ）に基づいて、前記オーディオコンテンツの時間ドメイン表現（９２４）を得る周波数ドメイン／時間ドメイン変換器（９２４ａ）を備え、
前記オーディオコンテンツの２つの連続する部分の時間ドメイン表現であって、その連続する部分のうちの１つが前記変換符号化励起線形予測ドメインモードで符号化されており、他の１つが前記周波数ドメインモードで符号化されているような２つの連続する部分の時間ドメイン表現が、周波数ドメインから時間ドメインへの変換に起因する時間ドメインエイリアシングを消去するための時間的オーバーラップを含むよう構成されていることを特徴とする、オーディオ信号復号器。
請求項１乃至３のいずれかに記載のオーディオ信号復号器において、
前記オーディオ信号復号器は、変換符号化励起情報（９３２）及び線形予測ドメインパラメータ情報（９３４）を使用する変換符号化励起線形予測ドメインモードと、代数符号励起情報（９８２）及び線形予測ドメインパラメータ情報（９８４）を使用する代数符号励起線形予測（ＡＣＥＬＰ）モードとの間で切替を行うものであり、
前記変換ドメイン経路（９３０）は、前記変換符号化励起情報（９３２）に基づいてスペクトル係数の第１セット（９４４ａ）を取得し、かつ前記線形予測ドメインパラメータ情報（９３４）に基づいて線形予測ドメインパラメータ（９５０ａ）を取得するよう構成され、
前記オーディオ信号復号器は、前記代数符号励起情報（９８２）及び前記線形予測ドメインパラメータ情報（９８４）に基づいて、前記ＡＣＥＬＰモードで符号化されたオーディオコンテンツの時間ドメイン表現（９８６）を取得する、代数符号励起線形予測経路（９８０）を備え、
前記代数符号励起線形予測経路（９８０）は、前記代数符号励起情報（９８２）に基づいて時間ドメイン励起信号（９８９ａ）を提供するＡＣＥＬＰ励起処理器（９８８，９８９）と、前記時間ドメイン励起信号（９８９ａ）に基づいて、かつ前記線形予測ドメインパラメータ情報（９８４）に基づいて得られた線形予測ドメインフィルタ係数（９９０ａ）に依存して、再構築された信号（９９１ａ）を提供するよう前記時間ドメイン励起信号の時間ドメインフィルタ処理を実行する合成フィルタ（９９１）とを含み、
前記変換ドメイン経路（９３０）は、前記ＡＣＥＬＰモードで符号化されたオーディオコンテンツの一部分に続く、前記変換符号化励起線形予測ドメインモードで符号化されたオーディオコンテンツの一部分と、前記ＡＣＥＬＰモードで符号化されたオーディオコンテンツの一部分に先行する、前記変換符号化励起線形予測ドメインモードで符号化されたオーディオコンテンツの一部分とのために、前記エイリアシング消去合成信号（９６４）を選択的に提供するよう構成されていることを特徴とする、オーディオ信号復号器。
請求項４に記載のオーディオ信号復号器において、
前記エイリアシング消去刺激フィルタ（９６４）は、前記ＡＣＥＬＰモードで符号化されたオーディオコンテンツの一部分に続く、前記変換符号化励起線形予測ドメインモードで符号化されたオーディオコンテンツの一部分については、前記第１の周波数ドメイン／時間ドメイン変換器（９４６）の左側エイリアシング折り返し点に対応する線形予測ドメインフィルタパラメータ（９５０ａ；ＬＰＣ１）に依存して、前記エイリアシング消去刺激信号（９６３ａ）をフィルタ処理し、
前記エイリアシング消去刺激フィルタ（９６４）は、前記ＡＣＥＬＰモードで符号化されたオーディオコンテンツの一部分に先行する、前記変換符号化励起線形予測ドメインモードで符号化されたオーディオコンテンツの一部分については、前記第１の周波数ドメイン／時間ドメイン変換器（９４６）の右側エイリアシング折り返し点に対応する線形予測ドメインフィルタパラメータ（９５０ａ；ＬＰＣ２）に依存して、前記エイリアシング消去刺激信号（９６３ａ）をフィルタ処理することを特徴とする、オーディオ信号復号器。
請求項４又は５に記載のオーディオ信号復号器において、
前記オーディオ信号復号器は、前記エイリアシング消去合成信号を生成するために前記エイリアシング消去刺激フィルタ（９６４）のメモリ値をゼロに初期化し、さらに前記エイリアシング消去刺激信号のＭ個のサンプルを前記エイリアシング消去刺激フィルタ（９６４）へと供給することで、前記エイリアシング消去合成信号（９６４ａ）の対応する非ゼロ入力応答サンプルを取得し、更に前記エイリアシング消去合成信号の複数のゼロ入力応答サンプルを取得するよう構成され、
前記結合器は、前記オーディオコンテンツの時間ドメイン表現（９４０ａ）を前記非ゼロ入力応答サンプル及び後続のゼロ入力応答サンプルと結合し、前記ＡＣＥＬＰモードで符号化されたオーディオコンテンツの一部分から前記変換符号化励起線形予測ドメインモードで符号化されたオーディオコンテンツの後続部分への遷移において、前記エイリアシング低減済み時間ドメイン信号を取得するよう構成されていることを特徴とする、オーディオ信号復号器。
請求項４乃至６のいずれかに記載のオーディオ信号復号器において、
前記オーディオ信号復号器は、少なくとも部分的にエイリアシングを消去するため、前記ＡＣＥＬＰモードを使用して得られた時間ドメイン表現の少なくとも一部分の窓処理されかつ折り返されたバージョン（９７３ａ；１０６０）と、前記変換符号化励起線形予測ドメインモードを使用して得られたオーディオコンテンツの後続部分の時間ドメイン表現（９４０；１０５０ａ）とを結合する、ことを特徴とするオーディオ信号復号器。
請求項４乃至７のいずれかに記載のオーディオ信号復号器において、
前記オーディオ信号復号器は、少なくとも部分的にエイリアシングを消去するため、前記ＡＣＥＬＰ経路の前記合成フィルタのゼロ入力応答の窓処理済みバージョン（９７６ａ；１０６２）と、前記変換符号化励起線形予測ドメインモードを使用して得られたオーディオコンテンツの後続部分の時間ドメイン表現（９４０ａ；１０５８）とを結合する、ことを特徴とするオーディオ信号復号器。
請求項４乃至８のいずれかに記載のオーディオ信号復号器において、
前記オーディオ信号復号器は、ラップされた周波数ドメイン／時間ドメイン変換が使用される変換符号化励起線形予測ドメインモードと、ラップされた周波数ドメイン／時間ドメイン変換が使用される周波数ドメインモードと、代数符号励起線形予測モードとの間で切替を行うよう構成され、
前記オーディオ信号復号器は、前記変換符号化励起線形予測ドメインモードで符号化されたオーディオコンテンツの一部分と前記周波数ドメインモードで符号化されたオーディオコンテンツの一部分との間の遷移において、オーディオコンテンツの連続するオーバーラップ部分の時間ドメインサンプルの間でオーバーラップ加算操作を実行することにより、少なくとも部分的にエイリアシングを消去するよう構成され、
さらに前記オーディオ信号復号器は、前記変換符号化励起線形予測ドメインモードで符号化されたオーディオコンテンツの一部分と前記代数符号励起線形予測モードで符号化されたオーディオコンテンツの一部分との間の遷移において、前記エイリアシング消去合成信号（９６４ａ）を使用して、少なくとも部分的にエイリアシングを消去するよう構成されている、ことを特徴とするオーディオ信号復号器。
請求項１乃至９のいずれかに記載のオーディオ信号復号器において、
前記オーディオ信号復号器は、前記変換ドメイン経路（９３０）の第１の周波数ドメイン／時間ドメイン変換器（９４６）により提供された時間ドメイン表現（９４６ａ）のゲインスケーリング（９４７）と、前記エイリアシング消去刺激信号（９６３ａ）又は前記エイリアシング消去合成信号（９６４ａ）のゲインスケーリング（９６１）とについて、共通のゲイン値（ｇ）を適用する、ことを特徴とするオーディオ信号復号器。
請求項１乃至１０のいずれかに記載のオーディオ信号復号器において、
前記オーディオ信号復号器は、線形予測ドメインパラメータの少なくとも前記サブセットに依存して実行されるスペクトル成形に加え、スペクトル係数の第１セットの少なくとも１つのサブセットに対してスペクトル逆成形（９４４）を適用し、
前記オーディオ信号復号器は、前記エイリアシング消去刺激信号（９６３ａ）が導出されたエイリアシング消去スペクトル係数のセットの少なくとも１つのサブセットに対しスペクトル逆成形（９６２）を適用する、ことを特徴とするオーディオ信号復号器。
請求項１乃至１１のいずれかに記載のオーディオ信号復号器において、
前記オーディオ信号復号器は、前記エイリアシング消去刺激信号を表現するスペクトル係数（９６０ａ）のセットに依存して前記エイリアシング消去刺激信号（９６３ａ）の時間ドメイン表現を得る、第２の周波数ドメイン／時間ドメイン変換器（９６３）を備え、
前記第１の周波数ドメイン／時間ドメイン変換器は、時間ドメインエイリアシングを含むラップされた変換を実行するよう構成され、
前記第２の周波数ドメイン／時間ドメイン変換器は、ラップされていない変換を実行するよう構成されている、ことを特徴とするオーディオ信号復号器。
請求項１乃至１２のいずれかに記載のオーディオ信号復号器において、
前記エイリアシング消去刺激信号のフィルタリングを調整するために使用された同じ線形予測ドメインパラメータに依存して、スペクトル係数の第１セットに対してスペクトル成形を適用するよう構成されている、ことを特徴とするオーディオ信号復号器。
オーディオコンテンツ１１０の入力表現（１１０；８１０）に基づいて、スペクトル係数の第１セット（１１２ａ；８５２）とエイリアシング消去刺激信号（１１２ｃ；８５６）の表現と複数の線形予測ドメインパラメータ（１１２ｂ；８５４）とを含むオーディオコンテンツの符号化済み表現（１１２；８１２）を提供するオーディオ信号符号器（１００；８００）であって、
前記オーディオコンテンツの入力表現を処理して前記オーディオコンテンツの周波数ドメイン表現（１１２；８６１）を得る時間ドメイン／周波数ドメイン変換器（１２０；８６０）と、
線形予測ドメインで符号化されるべきオーディオコンテンツの一部分のための線形予測ドメインパラメータのセット（１４０；８６３）に依存して、前記オーディオコンテンツの周波数ドメイン表現又はその前処理済みバージョンに対してスペクトル成形を適用し、前記オーディオコンテンツのスペクトル的に成形された周波数ドメイン表現（１３２；８６７）を得るスペクトル処理器（１３０；８６６）と、
エイリアシング消去刺激信号の表現（１１２ｃ；８５６）を提供するエイリアシング消去情報提供器（１５０；８７０；８７４；８７５；８７６）であって、オーディオ信号復号器において前記線形予測ドメインパラメータの少なくとも１つのサブセットに依存して前記エイリアシング消去刺激信号をフィルタ処理することで、エイリアシング・アーチファクトを消去するエイリアシング消去合成信号をもたらすような、エイリアシング消去情報提供器と、
を備えるオーディオ信号符号器。
オーディオコンテンツの符号化済み表現に基づいて、そのオーディオコンテンツの復号化済み表現を提供する方法であって、
スペクトル係数の第１セットとエイリアシング消去刺激信号の表現と複数の線形予測ドメインパラメータとに基づいて、変換ドメインモードで符号化された前記オーディオコンテンツの一部の時間ドメイン表現を得るステップを含み、
前記線形予測ドメインパラメータの少なくとも１つのサブセットに依存して前記スペクトル係数の第１セットに対するスペクトル成形を適用し、前記スペクトル係数の第１セットのスペクトル成形済みバージョンを取得し、
前記スペクトル係数の第１セットのスペクトル成形済みバージョンに基づいて、周波数ドメインから時間ドメインへの変換を適用し、前記オーディオコンテンツの時間ドメイン表現を取得し、
前記線形予測ドメインパラメータの少なくとも１つのサブセットに基づいて前記エイリアシング消去刺激信号をフィルタ処理し、前記エイリアシング消去刺激信号からエイリアシング消去合成信号を導出し、
前記オーディオコンテンツの時間ドメイン表現と前記エイリアシング消去合成信号又はその後処理済みバージョンとを結合し、エイリアシング低減済み時間ドメイン信号を得る、
ことを特徴とする方法。
オーディオコンテンツの入力表現に基づいて、スペクトル係数の第１セットとエイリアシング消去刺激信号の表現と複数の線形予測ドメインパラメータとを含むオーディオコンテンツの符号化済み表現を提供する方法であって、
前記オーディオコンテンツの入力表現を処理して前記オーディオコンテンツの周波数ドメイン表現を得る時間ドメイン／周波数ドメイン変換を実行するステップと、
線形予測ドメインで符号化されるべきオーディオコンテンツの一部分のための線形予測ドメインパラメータのセットに依存して、前記オーディオコンテンツの周波数ドメイン表現又はその前処理済みバージョンに対してスペクトル成形を適用し、前記オーディオコンテンツのスペクトル的に成形された周波数ドメイン表現を得るステップと、
オーディオ信号復号器において前記線形予測ドメインパラメータの少なくとも１つのサブセットに依存して前記エイリアシング消去刺激信号をフィルタ処理することで、エイリアシング・アーチファクトを消去するエイリアシング消去合成信号をもたらすような、エイリアシング消去刺激信号の表現を提供するステップと、
を備える方法。
コンピュータに請求項１５又は１６に記載の方法を実行させる、コンピュータプログラム。