JP2022110116A

JP2022110116A - オーディオエンコーダ、オーディオデコーダ、オーディオ信号を符号化する方法、および符号化されたオーディオ信号を復号化する方法

Info

Publication number: JP2022110116A
Application number: JP2022082087A
Authority: JP
Inventors: エドラー・ベルント; Edler Bernd; ヘルムリッヒ・クリスティアン; Helmrich Christian; ノイエンドルフ・マックス; Neuendorf Max; シュベルト・ベンジャミン; schubert Benjamin
Original assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Current assignee: Fraunhofer Gesellschaft zur Forderung der Angewandten Forschung eV
Priority date: 2015-03-09
Filing date: 2022-05-19
Publication date: 2022-07-28
Also published as: CA2978815C; JP2020038380A; ES2821025T3; ZA202204766B; AU2019203173A1; JP2018511821A; AU2016231220B2; KR20170134475A; CA2978815A1; AU2016231220A1; AR103890A1; US20200227058A1; US10600428B2; BR112017019185B1; PT3268960T; EP3373298C0; AR122219A2; AR122486A2; ZA201706604B; JP6666356B2

Abstract

【課題】より効率的で計算コストが低い実施態様につながる、オーディオ信号を符号化および／または符号化されたオーディオ信号を復号化する方法及び装置を提供する。【解決手段】オーディオ信号を符号化するエンコーダ１００は、変換領域又はフィルタバンク領域１０４において、現在のフレーム１０８＿ｔ０及び少なくとも１つの前のフレーム１０８＿ｔ－１についてのオーディオ信号のスペクトル係数１０６＿ｔ０＿ｆ１から１０６＿ｔ０＿ｆ６を決定し、少なくとも１つのスペクトル係数によって隔てられている複数の個々のスペクトル係数１０６＿ｔ０＿ｆ２又はスペクトル係数グループ１０６＿ｔ０＿ｆ４，１０６＿ｔ０＿ｆ５に対して予測符号化を選択的に適用する。【選択図】図１

Description

実施形態は、オーディオ符号化、詳細には、予測符号化を用いて、オーディオ信号を符号化する方法および装置、ならびに予測復号化を用いて、符号化されたオーディオ信号を復号化する方法および装置に関する。好ましい実施形態は、ピッチ適応型スペクトル予測の方法および装置に関する。さらに好ましい実施形態は、スペクトル領域のフレーム間予測ツールを用いた変換符号化による、トーン性のオーディオ信号の知覚的符号化に関する。

特に低ビットレートにおいて、符号化されたトーン性の信号の品質を向上させるため、最近のオーディオ変換コーダは、非常に長い変換および／または長期予測またはプレ／ポストフィルタリングを使用している。ただし、長い変換は、長いアルゴリズム遅延を暗に示しており、低遅延の通信シナリオには望ましくない。したがって、瞬間的基準ピッチに基づく非常に低遅延の予測器が最近人気を得ている。ＩＥＴＦ（インターネット技術タスクフォース）のＯｐｕｓコーデックは、その周波数領域のＣＥＬＴ（Ｃｏｎｓｔｒａｉｎｅｄ－ＥｎｅｒｇｙＬａｐｐｅｄＴｒａｎｓｆｏｒｍ）符号化パス（Ｊ．Ｍ．Ｖａｌｉｎ，Ｋ．ＶｏｓおよびＴ．Ｔｅｒｒｉｂｅｒｒｙによる「ＤｅｆｉｎｉｔｉｏｎｏｆｔｈｅＯｐｕｓａｕｄｉｏｃｏｄｅｃ」、インターネット技術タスクフォース、技術レポートＲＦＣ６７１６、２０１２年、ｈｔｔｐ：／／ｔｏｏｌｓ．ｉｅｔｆ．ｏｒｇ／ｈｔｍｌ／ｒｆｃ６７１６１）においてピッチ適用型のプレフィルタリングおよびポストフィルタリングを利用しており、また３ＧＰＰ（３ｒｄＧｅｎｅｒａｔｉｏｎＰａｒｔｎｅｒｓｈｉｐＰｒｏｊｅｃｔ）のＥＶＳ（ＥｎｈａｎｃｅｄＶｏｉｃｅＳｅｒｖｉｃｅｓ）コーデックは、変換符号化された信号の知覚的改善のために長期高調波ポストフィルタを提供している（３ＧＰＰＴＳ２６．４４３「ＣｏｄｅｃｆｏｒＥｎｈａｎｃｅｄＶｏｉｃｅＳｅｒｖｉｃｅｓ（ＥＶＳ）」、リリース１２、２０１４年１２月）。これらのアプローチはいずれも、完全に復号化された信号波形上の時間領域内で働き、周波数選択的に（いずれのスキームも、いくつかの周波数に対して、単純なローパスフィルタを選択的に提供するのみである）適用することは難しく、および／または、計算上コストが高い。時間領域の長期予測（ＬＴＰ）またはプレ／ポストフィルタリング（ＰＰＦ）にとって歓迎される代替手段は、結果として、ＭＰＥＧ－２ＡＡＣ（ＩＳＯ／ＩＥＣ１３８１８－７「Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ－Ｐａｒｔ７：ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ（ＡＡＣ）」、２００６年）でサポートされているように周波数領域予測（ＦＤＰ）によって提供される。この方法は、周波数選択性を容易にするものの、以下に記載するとおり、固有のデメリットがある。

Ｊ．Ｍ．Ｖａｌｉｎ，Ｋ．ＶｏｓおよびＴ．Ｔｅｒｒｉｂｅｒｒｙによる「ＤｅｆｉｎｉｔｉｏｎｏｆｔｈｅＯｐｕｓａｕｄｉｏｃｏｄｅｃ」、インターネット技術タスクフォース、技術レポートＲＦＣ６７１６、２０１２年、ｈｔｔｐ：／／ｔｏｏｌｓ．ｉｅｔｆ．ｏｒｇ／ｈｔｍｌ／ｒｆｃ６７１６１３ＧＰＰＴＳ２６．４４３「ＣｏｄｅｃｆｏｒＥｎｈａｎｃｅｄＶｏｉｃｅＳｅｒｖｉｃｅｓ（ＥＶＳ）」、リリース１２、２０１４年１２月

上記に紹介したＦＤＰ手法には、他のツールと比較して２つの欠点がある。第１に、ＦＤＰ手法は、高い計算複雑度を要する。詳細には、少なくとも２回の線形予測符号化が（すなわち、最後の２フレームのチャネル変換ビンから）、すべてのスケールファクタバンドにおける予測の最悪ケースにおいて、各フレームおよびチャネルの数百のスペクトルビンに適用される（ＩＳＯ／ＩＥＣ１３８１８－７「Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ－Ｐａｒｔ７：ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ（ＡＡＣ）」、２００６年）。第２に、ＦＤＰ手法は、限られた全体予測利得を含んでいる。より詳細には、予測可能な高調波のトーン性のスペクトル部の間の、ノイズの多い要素も予測の対象となり、これらのノイズの多い部分は通常予測可能ではないため誤差を引き起こすことから、予測の効率が限られている。

高い複雑性は、予測器の後方適応性に起因する。つまり、各ビンの予測係数は、先に送信されたビンに基づいて計算されなければならないということである。そのため、エンコーダとデコーダとの間の数値的な不正確さは、食い違う予測係数に起因する再構成誤差につながり得る。この問題を克服するため、ｂｉｔｅｘａｃｔな同一の適応が保証されなければならない。さらに、予測器のグループが、あるフレームにおいてディセーブルにされた場合でも、予測係数を最新の状態に保つために、適応は常に行われなければならない。

そのため、前述の課題の少なくとも１つ（例えば両方）を回避し、より効率的で計算コストが低い実施態様につながる、オーディオ信号を符号化および／または符号化されたオーディオ信号を復号化する概念を提供することが本発明の目的である。

独立請求項によって、この問題を解決する。

従属請求項によって、有利な実施態様を扱う。

実施形態は、オーディオ信号を符号化するエンコーダを提供する。エンコーダは、変換領域またはフィルタバンク領域において、オーディオ信号を符号化するように構成され、エンコーダは、現在のフレームおよび少なくとも１つの前のフレームについてのオーディオ信号のスペクトル係数を決定するように構成され、エンコーダは、複数の、個々のスペクトル係数またはスペクトル係数グループに対して、予測符号化を選択的に適用するように構成され、エンコーダは、間隔値を決定するように構成され、エンコーダは、予測符号化が適用される、複数の、個々のスペクトル係数またはスペクトル係数グループを、符号化されたオーディオ信号と共にサイド情報として送信され得る間隔値に基づいて選択するように構成される。

さらなる実施形態は、符号化されたオーディオ信号（例えば、上記のエンコーダで符号化された）を復号化するデコーダを提供する。デコーダは、変換領域またはフィルタバンク領域において、符号化されたオーディオ信号を復号化するように構成され、デコーダは、現在のフレームおよび少なくとも１つの前のフレームについてのオーディオ信号の符号化されたスペクトル係数を得るために、符号化されたオーディオ信号を解析するように構成され、またデコーダは、複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループに対して、予測復号化を選択的に適用するように構成され、デコーダは、予測復号化が適用される複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループを、送信された間隔値に基づいて選択するように構成され得る。

本発明の概念によれば、予測符号化は、選択されたスペクトル係数（のみ）に適用される。予測符号化が適用されるスペクトル係数は、信号特性に応じて選択することができる。例えば、ノイズの多い信号要素に予想符号化を適用しないことによって、予測不可能な、ノイズの多い信号要素を予測することによってもたらされる前述の誤差が回避される。それと同時に、予測符号化が、選択されたスペクトル要素のみに適用されるため、計算複雑度を低減することができる。

例えば、誘導型／適応型のスペクトル領域のフレーム間予測手法と共に変換符号化によって、トーン性のオーディオ信号の知覚符号化を行うことができる（例えば、エンコーダによって）。予測を、例えば、エンコーダからデコーダへの適切なビットストリーム内で例えば間隔値として送ることができる、基本周波数または基本ピッチの、整数倍に位置する高調波信号要素の周辺のスペクトル係数のみに予測を適用することによって、周波数領域予測（ＦＤＰ）の効率を高めることができ、計算複雑度を低減することができる。本発明の実施形態は、好ましくはＭＰＥＧ－Ｈ３Ｄオーディオコーデックに実装または組み込むことができるが、例えばＭＰＥＧ－２ＡＡＣなどの任意のオーディオ変換符号化システムに適用可能である。

さらなる実施形態は、変換領域またはフィルタバンク領域において、オーディオ信号を符号化する方法を提供し、その方法は、
現在のフレームおよび少なくとも１つの前のフレームについてのオーディオ信号のスペクトル係数を決定することと、
間隔値を決定することと、
複数の、個々のスペクトル係数またはスペクトル係数グループに対して、予測符号化を選択的に適用することであって、予測符号化が適用される複数の、個々のスペクトル係数またはスペクトル係数グループは、間隔値に基づいて選択されることと
を含む。

さらなる実施形態は、変換領域またはフィルタバンク領域において、符号化されたオーディオ信号を復号化する方法を提供し、その方法は、
現在のフレームおよび少なくとも１つの前のフレームについてのオーディオ信号の符号化されたスペクトル係数を得るために、符号化されたオーディオ信号を解析することと、
間隔値を得ることと、
複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループに対して、予測復号化を選択的に適用することであって、予測復号化が適用される複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループは、間隔値に基づいて選択されることと
を含む。

本発明の実施形態を、添付図面を参照しつつ以下のとおり本明細書に記載する。

一実施形態に係る、オーディオ信号を符号化するエンコーダの概略ブロック図を示す。一実施形態に係る、現在のフレームについての周波数にわたってプロットされたオーディオ信号の振幅、および予測符号化が適用される、対応する選択されたスペクトル係数を図に示す。現在のフレームについての周波数にわたってプロットされたオーディオ信号の振幅、およびＭＰＥＧ－２ＡＡＣによって予測の対象となる、対応するスペクトル係数を図に示す。一実施形態に係る、符号化されたオーディオ信号を複合化するデコーダの概略ブロック図を示す。一実施形態に係る、オーディオ信号を符号化する方法のフローチャートを示す。一実施形態に係る、符号化されたオーディオ信号を復号化する方法のフローチャートを示す。

同等もしくは相当する要素、または同等もしくは相当する機能性を有する要素は、同等または相当する符号によって以下の記述に示す。

以下の記述において、本発明の実施形態をより詳しく説明するために複数の詳細を説明する。ただし、これらの具体的な詳細がなくても本発明の実施形態を実施し得ることは、当業者には明らかであろう。他の例では、本発明の実施形態を曖昧にしないように、よく知られた構造およびデバイスを、詳細にではなくブロック図の形式で示す。さらに、以下に記載する異なる実施形態の特徴は、特に断りのない限り、互いに組み合わされ得る。

図１は、一実施形態に係る、オーディオ信号１０２を符号化するエンコーダ１００の概略ブロック図を示している。エンコーダ１００は、変換領域またはフィルタバンク領域１０４（例えば、周波数領域またはスペクトル領域）において、オーディオ信号１０２を符号化するように構成され、エンコーダ１００は、現在のフレーム１０８＿ｔ０についてのオーディオ信号１０２のスペクトル係数１０６＿ｔ０＿ｆ１から１０６＿ｔ０＿ｆ６、および少なくとも１つの前のフレーム１０８＿ｔ－１についてのオーディオ信号のスペクトル係数１０６＿ｔ－１＿ｆ１から１０６＿ｔ－１＿ｆ６を決定するように構成される。さらに、エンコーダ１００は、複数の、個々のスペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５に対して、予測符号化を選択的に適用するように構成され、エンコーダ１００は、間隔値を決定するように構成され、エンコーダ１００は、予測符号化が適用される複数の、個々のスペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５を、間隔値に基づいて選択するように構成される。

つまり、エンコーダ１００は、サイド情報として送信された単一の間隔値に基づいて選択された複数の、個々のスペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５に対して、予測符号化を選択的に適用するように構成される。

この間隔値は、その整数倍と共に、予測が適用される、すべてのスペクトル係数グループについて中心を定義する周波数（例えば、（オーディオ信号１０２の）高調波トーンの基本周波数）に対応し得、すなわち、第１のグループはこの周波数の周辺とすることができ、第２のグループはこの周波数掛ける２の周辺を中心とすることができ、第３のグループはこの周波数掛ける３の周辺を中心とすることができる、などである。これらの中心周波数の知識が、対応する正弦波信号成分（例えば、高調波信号の基本および倍音）を予測するための予測係数の計算を可能とする。このように、複雑で誤差が生じやすい、予測係数の後方適応は不要となる。

実施形態において、エンコーダ１００は、フレーム毎に１つの間隔値を決定するように構成することができる。

実施形態において、複数の、個々のスペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５は、少なくとも１つのスペクトル係数１０６＿ｔ０＿ｆ３によって隔てることができる。

実施形態において、エンコーダ１００は、例えば、少なくとも１つのスペクトル係数によって隔てられている、２つの個々のスペクトル係数に対してなど、少なくとも１つのスペクトル係数によって隔てられている複数の個々のスペクトル係数に対して、予測符号化を適用するように構成することができる。さらに、エンコーダ１００は、例えば、少なくとも１つのスペクトル係数によって隔てられている、２つのスペクトル係数グループに対してなど、少なくとも１つのスペクトル係数によって隔てられている複数のスペクトル係数グループ（各グループは、少なくとも２つのスペクトル係数を含む）に対して、予測符号化を適用するように構成することができる。さらに、エンコーダ１００は、例えば、少なくとも１つのスペクトル係数によって隔てられている、少なくとも１つの個々のスペクトル係数および少なくとも１つのスペクトル係数グループに対してなど、少なくとも１つのスペクトル係数によって隔てられている複数の、個々のスペクトル係数および／またはスペクトル係数グループに対して、予測符号化を適用するように構成することができる。

図１に示す例では、エンコーダ１００は、現在のフレーム１０８＿ｔ０について６つのスペクトル係数１０６＿ｔ０＿ｆ１から１０６＿ｔ０＿ｆ６、および前のフレーム１０８＿ｔ－１について６つのスペクトル係数１０６＿ｔ－１＿ｆ１から１０６＿ｔ－１＿ｆ６を決定するように構成される。その結果、エンコーダ１００は、現在のフレームの個々の第２のスペクトル係数１０６＿ｔ０＿ｆ２に対して、および現在のフレーム１０８＿ｔ０の第４および第５のスペクトル係数１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５からなるスペクトル係数グループに対して、予測符号化を選択的に適用するように構成される。分かるように、個々の第２のスペクトル係数１０６＿ｔ０＿ｆ２、ならびに第４および第５のスペクトル係数１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５からなるスペクトル係数グループは、第３のスペクトル係数１０６＿ｔ０＿ｆ３によって互いに隔てられている。

なお、本明細書において「選択的に」という用語は、選択されたスペクトル係数に対して（のみ）、予測符号化を適用することをいう。つまり、予測符号化は、必ずしもすべてのスペクトル係数に対して適用されるのではなく、むしろ、選択された、個々のスペクトル係数またはスペクトル係数グループ、つまり少なくとも１つのスペクトル係数によって互いに隔てることができる、選択された、個々のスペクトル係数および／またはスペクトル係数グループに対してのみ適用される。つまり、予測符号化は、選択された複数の、個々のスペクトル係数またはスペクトル係数グループを、隔てている、少なくとも１つのスペクトル係数についてディセーブルにすることができる。

実施形態において、エンコーダ１００は、現在のフレーム１０８＿ｔ０の複数の、個々のスペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５に対して、前のフレーム１０８＿ｔ－１の、少なくとも、対応する複数の、個々のスペクトル係数１０６＿ｔ－１＿ｆ２またはスペクトル係数グループ１０６＿ｔ－１＿ｆ４および１０６＿ｔ－１＿ｆ５に基づいて、予測符号化を選択的に適用するように構成することができる。

例えば、エンコーダ１００は、現在のフレーム１０８＿ｔ０の複数の、個々の予測されたスペクトル係数１１０＿ｔ０＿ｆ２または予測されたスペクトル係数グループ１１０＿ｔ０＿ｆ４および１１０＿ｔ０＿ｆ５と、現在のフレームの複数の、個々のスペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５（またはその量子化されたバージョン）との間の予測誤差を符号化することによって、現在のフレーム１０８＿ｔ０の複数の、個々のスペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５を、予測符号化するように構成することができる。

図１において、エンコーダ１００は、現在のフレーム１０８＿ｔ０の個々の予測されたスペクトル係数１１０＿ｔ０＿ｆ２と、現在のフレーム１０８＿ｔ０の個々のスペクトル係数１０６＿ｔ０＿ｆ２との間、および現在のフレームの予測されたスペクトル係数グループ１１０＿ｔ０＿ｆ４および１１０＿ｔ０＿ｆ５と、現在のフレームのスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５との間の、予測誤差を符号化することによって、個々のスペクトル係数１０６＿ｔ０＿ｆ２、ならびにスペクトル係数１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５からなるスペクトル係数グループを符号化する。

つまり、第２のスペクトル係数１０６＿ｔ０＿ｆ２は、予測された第２のスペクトル係数１１０＿ｔ０＿ｆ２と（実際の、または決定された）第２のスペクトル係数１０６＿ｔ０＿ｆ２との間の予測誤差（または差分）を符号化することによって符号化され、第４のスペクトル係数１０６＿ｔ０＿ｆ４は、予測された第４のスペクトル係数１１０＿ｔ０＿ｆ４と（実際の、または決定された）第４のスペクトル係数１０６＿ｔ０＿ｆ４との間の予測誤差（または差分）を符号化することによって符号化され、第５のスペクトル係数１０６＿ｔ０＿ｆ５は、予測された第５のスペクトル係数１１０＿ｔ０＿ｆ５と（実際の、または決定された）第５のスペクトル係数１０６＿ｔ０＿ｆ５との間の予測誤差（または差分）を符号化することによって符号化される。

一実施形態において、エンコーダ１００は、現在のフレーム１０８＿ｔ０についての複数の、個々の予測されたスペクトル係数１１０＿ｔ０＿ｆ２または予測されたスペクトル係数グループ１１０＿ｔ０＿ｆ４および１１０＿ｔ０＿ｆ５を、前のフレーム１０８＿ｔ－１の、対応する実際バージョンの複数の、個々のスペクトル係数１０６＿ｔ－１＿ｆ２またはスペクトル係数グループ１０６＿ｔ－１＿ｆ４および１０６＿ｔ－１＿ｆ５によって決定するように構成することができる。

つまり、エンコーダ１００は、上記の決定プロセスにおいて、前のフレーム１０８＿ｔ－１の複数の、個々の実際のスペクトル係数１０６＿ｔ－１＿ｆ２または実際のスペクトル係数グループ１０６＿ｔ－１＿ｆ４および１０６＿ｔ－１＿ｆ５を直接用い得、１０６＿ｔ－１＿ｆ２、１０６＿ｔ－１＿ｆ４および１０６＿ｔ－１＿ｆ５は、前記エンコーダが変換領域またはフィルタバンク領域１０４において働き得るような、エンコーダ１００によって得られたままの、オリジナル、すなわちまだ量子化されていない、スペクトル係数またはスペクトル係数グループを、それぞれ表している。

例えば、エンコーダ１００は、現在のフレーム１０８＿ｔ０の予測された第２のスペクトル係数１１０＿ｔ０＿ｆ２を、前のフレーム１０１０８＿ｔ－１の、対応するまだ量子化されていないバージョンの第２のスペクトル係数１０６＿ｔ－１＿ｆ２に基づいて、現在のフレーム１０８＿ｔ０の予測された第４のスペクトル係数１１０＿ｔ０＿ｆ４を、前のフレーム１０８＿ｔ－１の、対応するまだ量子化されていないバージョンの第４のスペクトル係数１０６＿ｔ－１＿ｆ４に基づいて、また、現在のフレーム１０８＿ｔ０の予測された第５のスペクトル係数１１０＿ｔ０＿ｆ５を、前のフレームの、対応するまだ量子化されていないバージョンの第５のスペクトル係数１０６＿ｔ－１＿ｆ５に基づいて、決定するように構成することができる。

対応するデコーダは、図４と関連して実施形態を後述するが、上記の決定ステップにおいて、前のフレーム１０８＿ｔ－１の、送信された量子化されたバージョンの、複数の個々のスペクトル係数１０６＿ｔ－１＿ｆ２または複数のスペクトル係数グループ１０６＿ｔ－１＿ｆ４および１０６＿ｔ－１＿ｆ５のみを、予測復号化のために使用することができるため、このアプローチによって、予測符号化および復号化スキームは、量子化ノイズの一種の高調波整形を呈することができる。

そのままで、例えば、時間領域において長期予測（ＬＴＰ）によって従来行われたこうした高調波ノイズ整形は、予測符号化にとって主観的に有利とすることができる一方で、場合によっては、復号化されたオーディオ信号に、望ましくない過剰なトーン性が取り込まれることにつながり得るため、好ましくない場合がある。この理由から、対応する復号化と完全にシンクロし、それ自体、可能ないかなる予測利得も引き出すが、量子化ノイズ整形にはつながらない、代わりの予測符号化スキームを以下に記載する。この代わりの符号化実施形態によれば、エンコーダ１００は、現在のフレーム１０８＿ｔ０についての複数の、個々の予測されたスペクトル係数１１０＿ｔ０＿ｆ２または予測されたスペクトル係数グループ１１０＿ｔ０＿ｆ４および１１０＿ｔ０＿ｆ５を、前のフレーム１０８＿ｔ－１の、対応する量子化されたバージョンの複数の、個々のスペクトル係数１０６＿ｔ－１＿ｆ２またはスペクトル係数グループ１０６＿ｔ－１＿ｆ４および１０６＿ｔ－１＿ｆ５を用いて決定するように構成することができる。

例えば、エンコーダ１００は、現在のフレーム１０８＿ｔ０の予測された第２のスペクトル係数１１０＿ｔ０＿ｆ２を、前のフレーム１０８＿ｔ－１の、対応する量子化されたバージョンの第２のスペクトル係数１０６＿ｔ－１＿ｆ２に基づいて、現在のフレーム１０８＿ｔ０の予測された第４のスペクトル係数１１０＿ｔ０＿ｆ４を、前のフレーム１０８＿ｔ－１の、対応する量子化されたバージョンの第４のスペクトル係数１０６＿ｔ－１＿ｆ４に基づいて、また、現在のフレーム１０８＿ｔ０の予測された第５のスペクトル係数１１０＿ｔ０＿ｆ５を、前のフレームの、対応する量子化されたバージョンの第５のスペクトル係数１０６＿ｔ－１＿ｆ５に基づいて決定するように構成することができる。

さらに、エンコーダ１００は、間隔値から予測係数１１２＿ｆ２、１１４＿ｆ２、１１２＿ｆ４、１１４＿ｆ４、１１２＿ｆ５および１１４＿ｆ５を導出するように、そして現在のフレーム１０８＿ｔ０について複数の、個々の予測されたスペクトル係数１１０＿ｔ０＿ｆ２または予測されたスペクトル係数グループ１１０＿ｔ０＿ｆ４および１１０＿ｔ０＿ｆ５を、少なくとも２つの前のフレーム１０８＿ｔ－１および１０８＿ｔ－２の、対応する量子化されたバージョンの複数の、個々のスペクトル係数１０６＿ｔ－１＿ｆ２および１０６＿ｔ－２＿ｆ２またはスペクトル係数グループ１０６＿ｔ－１＿ｆ４，１０６＿ｔ－２＿ｆ４、１０６＿ｔ－１＿ｆ５および１０６＿ｔ－２＿ｆ５を用いて、ならびに導出された予測係数１１２＿ｆ２、１１４＿ｆ２、１１２＿ｆ４、１１４＿ｆ４、１１２＿ｆ５および１１４＿ｆ５を用いて計算するように構成される。

例えば、エンコーダ１００は、第２のスペクトル係数１０６＿ｔ０＿ｆ２についての予測係数１１２＿ｆ２および１１４＿ｆ２を間隔値から導出するように、第４のスペクトル係数１０６＿ｔ０＿ｆ４についての予測係数１１２＿ｆ４および１１４＿ｆ４を間隔値から導出するように、そして、第５のスペクトル係数１０６＿ｔ０＿ｆ５についての予測係数１１２＿ｆ５および１１４＿ｆ５を間隔値から導出するように構成することができる。

例えば、予測係数の導出は、以下の方法で導出することができ、すなわち、間隔値が周波数ｆ０またはその符号化されたバージョンに対応する場合、予測がイネーブルにされる、スペクトル係数のＫ番目のグループの中心周波数は、ｆｃ＝Ｋ＊ｆ０である。サンプリング周波数がｆｓで変換のホップサイズ（連続するフレーム間のシフト）がＮの場合、周波数ｆｃの正弦波信号を前提とするＫ番目のグループにおける理想的な予測係数は以下のとおりである。

ｐ１＝２＊ｃｏｓ（Ｎ＊２＊ｐｉ＊ｆｃ／ｆｓ）およびｐ２＝－１。

例えば、いずれのスペクトル係数１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５も、このグループ内である場合、予測係数は以下のとおりである。

１１２＿ｆ４＝１１２＿ｆ５＝２＊ｃｏｓ（Ｎ＊２＊ｐｉ＊ｆｃ／ｆｓ）および１１４＿ｆ４＝１１４＿ｆ５＝－１。

安定性の理由から、ダンピングファクタｄを導入することができ、結果として以下の修正予測係数が得られる。

１１２＿ｆ４’＝１１２＿ｆ５’＝ｄ＊２＊ｃｏｓ（Ｎ＊２＊ｐｉ＊ｆｃ／ｆｓ）、１１４＿ｆ４’＝１１４＿ｆ５’＝ｄ２。

間隔値は、符号化されたオーディオ信号１２０の中で送信されるため、デコーダは正確に同じ予測係数２１２＿ｆ４＝２１２＿ｆ５＝２＊ｃｏｓ（Ｎ＊２＊ｐｉ＊ｆｃ／ｆｓ）および１１４＿ｆ４＝１１４＿ｆ５＝－１を導出することができる。ダンピングファクタを用いる場合、係数をそれに応じて修正することができる。

図１に示すように、エンコーダ１００は、符号化されたオーディオ信号１２０を提供するように構成することができる。その結果、エンコーダ１００は、符号化されたオーディオ信号１２０に、予測符号化が適用される複数の、個々のスペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５についての、量子化されたバージョンの予測誤差を含むように構成することができる。さらに、エンコーダ１００は、符号化されたオーディオ信号１２０に、予測係数１１２＿ｆ２から１１４＿ｆ５を含まないように構成することができる。

このように、エンコーダ１００は、予測係数１１２＿ｆ２から１１４＿ｆ５のみを、複数の、個々の予測されたスペクトル係数１１０＿ｔ０＿ｆ２または予測されたスペクトル係数グループ１１０＿ｔ０＿ｆ４および１１０＿ｔ０＿ｆ５を、ならびにそこから、個々の予測されたスペクトル係数１１０＿ｔ０＿ｆ２または予測されたスペクトル係数グループ１１０＿ｔ０＿ｆ４および１１０＿ｔ０＿ｆ５と、現在のフレームの個々のスペクトル係数１０６＿ｔ０＿ｆ２または予測されたスペクトル係数グループ１１０＿ｔ０＿ｆ４および１１０＿ｔ０＿ｆ５との間の予測誤差を、計算するために用い得るが、個々のスペクトル係数１０６＿ｔ０＿ｆ４（またはその量子化されたバージョン）またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５（またはその量子化されたバージョン）も、予測係数１１２＿ｆ２から１１４＿ｆ５も、符号化されたオーディオ信号１２０内に提供しないことになる。したがって、デコーダは、実施形態を図４と関連して後述するが、現在のフレームについての複数の、個々の予測されたスペクトル係数または予測されたスペクトル係数グループを計算するために、予測係数１１２＿ｆ２から１１４＿ｆ５を間隔値から導出し得る。

つまり、エンコーダ１００は、予測符号化が適用される複数の、個々のスペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５について、量子化されたバージョンの複数の、個々のスペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５の代わりに、量子化されたバージョンの予測誤差を含む、符号化されたオーディオ信号１２０を提供するように構成することができる。

さらに、エンコーダ１００は、その量子化されたバージョンの予測誤差が、符号化されたオーディオ信号１２０に含まれる、スペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５と、その量子化されたバージョンが、予測符号化を用いずに提供される、スペクトル係数１０６＿ｔ０＿ｆ３またはスペクトル係数グループとが、交互になるように、複数の、個々のスペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５を隔てている、量子化されたバージョンのスペクトル係数１０６＿ｔ０＿ｆ３を含む、符号化されたオーディオ信号１０２を提供するように構成することができる。

実施形態において、エンコーダ１００は、量子化されたバージョンの予測誤差、および、複数の、個々のスペクトル係数１０６＿ｔ０＿ｆ２またはスペクトル係数グループ１０６＿ｔ０＿ｆ４および１０６＿ｔ０＿ｆ５を隔てている、量子化されたバージョンのスペクトル係数１０６＿ｔ０＿ｆ３を、エントロピ符号化するように、そしてエントロピ符号化されたバージョンを、符号化されたオーディオ信号１２０に（その非エントロピ符号化されたバージョンの代わりに）含むようにさらに構成することができる。

図２は、現在のフレーム１０８＿ｔ０について、周波数にわたってプロットされたオーディオ信号１０２の振幅を図に示している。さらに、図２では、オーディオ信号１０２の現在のフレーム１０８＿ｔ０についてエンコーダ１００によって決定された、変換領域またはフィルタバンク領域におけるスペクトル係数を示している。

図２に示すように、エンコーダ１００は、少なくとも１つのスペクトル係数によって隔てられている、複数のスペクトル係数グループ１１６＿１から１１６＿６に対して、予測符号化を選択的に適用するように構成することができる。詳細には、図２に示す実施形態において、エンコーダ１００は、６つのスペクトル係数グループ１１６＿１から１１６＿６に対して、予測符号化を選択的に適用し、最初の５つのスペクトル係数グループ１１６＿１から１１６＿５のそれぞれは、３つのスペクトル係数を含み（例えば、第２のグループ１１６＿２は、スペクトル係数１０６＿ｔ０＿ｆ８、１０６＿ｔ０＿ｆ９および１０６＿ｔ０＿ｆ１０を含む）、第６のスペクトル係数グループ１１６＿６は、２つのスペクトル係数を含む。その結果、６つのスペクトル係数グループ１１６＿１から１１６＿６は、予測符号化が適用されない、（５つの）スペクトル係数グループ１１８＿１から１１８＿５によって隔てられている。

つまり、図２に示すように、エンコーダ１００は、予測符号化が適用されるスペクトル係数グループ１１６＿１から１１６＿６と、予測符号化が適用されないスペクトル係数グループ１１８＿１から１１８＿５とが、交互になるように、スペクトル係数グループ１１６＿１から１１０＿６に対して、予測符号化を選択的に適用するように構成することができる。

実施形態において、エンコーダ１００は、間隔値（図２において矢印１２２＿１および１２２＿２で示される）を決定するように構成することができ、エンコーダ１００は、予測符号化が適用される、複数のスペクトル係数グループ１１６＿１から１１６＿６（または複数の個々のスペクトル係数）を、間隔値に基づいて選択するように構成することができる。

間隔値は、例えば、オーディオ信号のピーク１２４＿１および１２４＿２など、オーディオ信号１０２の２つの特徴周波数の間の間隔（または距離）とすることができる。さらに、間隔値は、オーディオ信号の２つの特徴周波数の間の間隔を近似する、整数のスペクトル係数（またはスペクトル係数のインデックス）とすることができる。もちろん、間隔値は、オーディオ信号の２つの特徴周波数の間の間隔を表す、整数のスペクトル係数の実数または分数もしくは倍数とすることもできる。

実施形態において、エンコーダ１００は、オーディオ信号（１０２）の瞬間的基本周波数を決定するように、そして瞬間的基本周波数またはその分数もしくは倍数から間隔値を導出するように構成することができる。

例えば、オーディオ信号１０２の第１のピーク１２４＿１は、オーディオ信号１０２の瞬間的基本周波数（またはピッチ、または第１高調波）とすることができる。そのため、エンコーダ１００は、オーディオ信号１０２の瞬間的基本周波数を決定するように、そして瞬間的基本周波数またはその分数もしくは倍数から間隔値を導出するように構成することができる。その場合、間隔値は、オーディオ信号１０２の瞬間的基本周波数１２４＿１と第２高調波１２４＿２との間の間隔を近似する整数のスペクトル係数（またはその分数もしくは倍数）とすることができる。

もちろん、オーディオ信号１０２は、２つを超える高調波を含み得る。例えば、図２に示すオーディオ信号１０２は、オーディオ信号１０２が瞬間的基本周波数の整数倍すべてにおいて高調波を含むように、スペクトル的に分布した６つの高調波１２４＿１から１２４＿６を含む。もちろん、オーディオ信号１０２が、第１、第３および第５高調波など、高調波のすべてはなく一部のみを含むということも可能である。

実施形態において、エンコーダ１００は、予測符号化のために、間隔値によって定義された高調波グリッドによりスペクトル的に配置されたスペクトル係数グループ１１６＿１から１１６＿６（または個々のスペクトル係数）を選択するように構成することができる。その結果、間隔値によって定義された高調波グリッドは、オーディオ信号１０２の中の高調波の周期的なスペクトル分布（等距離間隔）を表す。つまり、間隔値によって定義された高調波グリッドは、オーディオ信号の高調波の等間隔距離を表す一連の間隔値とすることができる。

さらに、エンコーダ１００は、そのスペクトルインデックスが、予測符号化のために、間隔値に基づいて導出された複数のスペクトルインデックスと、等しいかまたはその周辺の範囲（例えば、所定の、また可変の）内に収まる、スペクトル係数（例えば、そうしたスペクトル係数のみ）を選択するように構成することができる。

間隔値から、オーディオ信号１０２の高調波を表す、スペクトル係数のインデックス（または番号）を導出することができる。例えば、第４のスペクトル係数１０６＿ｔ０＿ｆ４がオーディオ信号１０２の瞬間的基本周波数を表していると仮定し、間隔値が５であると仮定すると、インデックス９を有するスペクトル係数は、間隔値に基づいて導出することができる。図２で分かるように、そのように導出された、インデックス９を有するスペクトル係数、すなわち第９のスペクトル係数１０６＿ｔ０＿ｆ９は、第２高調波を表す。同様に、インデックス１４、１９、２４および２９を有するスペクトル係数を導出することができ、第３から第６高調波１２４＿３から１２４＿６を表す。ただし、間隔値に基づいて導出された複数のスペクトルインデックスに等しいインデックスを有するスペクトル係数のみでなく、間隔値に基づいて導出された複数のスペクトルインデックス周辺の所定の範囲内のインデックスを有するスペクトル係数も予測符号化され得る。例えば、図２に示すように、複数の個々のスペクトル係数ではなく、むしろ複数のスペクトル係数グループが予測符号化のために選択されるように、範囲は３とすることができる。

さらに、エンコーダ１００は、予測符号化が適用されるスペクトル係数グループ１１６＿１から１１６＿６（または複数の個々のスペクトル係数）と、予測符号化が適用されるスペクトル係数グループ（または複数の個々のスペクトル係数）を隔てているスペクトル係数とが、＋／－１スペクトル係数の許容範囲を伴った周期で周期的に交互になるように、予測符号化が適用される、スペクトル係数グループ１１６＿１から１１６＿６（または複数の個々のスペクトル係数）を選択するように構成することができる。＋／－１スペクトル係数の許容範囲は、オーディオ信号１０２の２つの高調波間の距離が、整数の間隔値（スペクトル係数のインデックスまたは番号に関する整数）に等しくなく、むしろその分数または倍数に等しい場合に、必要とされ得る。このことは、矢印１２２＿１から１２２＿６が、対応するスペクトル係数の中央または中央部を必ずしも正確に指していないことから、図２でも分かる。

つまり、オーディオ信号１０２は、少なくとも２つの高調波信号要素１２４＿１から１２４＿６を含み、エンコーダ１００は、オーディオ信号１０２の少なくとも２つの高調波信号要素１２４＿１から１２４＿６、または少なくとも２つの高調波信号要素１２４＿１から１２４＿６の周辺のスペクトル環境を表す、複数のスペクトル係数グループ１１６＿１から１１６＿６（または個々のスペクトル係数）に対して、予測符号化を選択的に適用するように構成することができる。少なくとも２つの高調波信号要素１２４＿１から１２４＿６の周辺のスペクトル環境は、例えば、＋／－１、２、３、４，または５スペクトル要素とすることができる。

その結果、エンコーダ１００は、オーディオ信号１０２の、少なくとも２つの高調波信号要素１２４＿１から１２４＿６、または少なくとも２つの高調波信号要素１２４＿１から１２４＿６のスペクトル環境を表していない、スペクトル係数グループ１１８＿１から１１８＿５（または複数の個々のスペクトル係数）に対して、予測符号化を適用しないように構成することができる。つまり、エンコーダ１００は、信号高調波１２４＿１から１２４＿６の間の非トーン性の背景ノイズに属する、複数のスペクトル係数グループ１１８＿１から１１８＿５（または個々のスペクトル係数）に対して、予測符号化を適用しないように構成することができる。

さらに、エンコーダ１００は、オーディオ信号１０２の少なくとも２つの高調波信号要素１２４＿１から１２４＿６の間のスペクトル間隔を示す高調波間隔値であって、オーディオ信号１０２の少なくとも２つの高調波信号要素１２４＿１から１２４＿６を表す複数の、個々のスペクトル係数またはスペクトル係数グループを示す高調波間隔値を決定するように構成することができる。

さらに、エンコーダ１００は、符号化されたオーディオ信号１２０が、間隔値（例えば、フレーム毎に１つの間隔値）、または（その代わりに）パラメータから間隔値を直接導出することができるパラメータを含むような、符号化されたオーディオ信号１２０を提供するように構成することができる。

本発明の実施形態は、いずれもが完全にシンクロした形で働くことができるようにエンコーダ（トランスミッタ）１００からそれぞれのデコーダ（レシーバ）へ送られた高調波間隔値を、ＦＤＰプロセスに導入することによって、ＦＤＰ手法の前述の２つの課題を取り扱う。前記高調波間隔値は、符号化される予定のフレームと関連付けられている１つまたは複数のスペクトルの瞬間的基本周波数（またはピッチ）のインジケータとしての役割を果たし得、どのスペクトルビン（スペクトル係数）が予測されるものとするかを特定する。より詳細には、基準ピッチ（高調波間隔値によって定義されるように）の整数倍に（インデックス化という点で）位置する高調波信号要素周辺のスペクトル係数のみが、予測の対象となるものとする。図２および図３は、単純な例によって、このピッチ適応型の予測アプローチを説明しており、図３は、ＭＰＥＧ－２ＡＡＣにおける最先端の予測器の働きを示しており、高調波グリッド周辺のみで予測するのではなく、ある終了周波数より低いあらゆるスペクトルビンを予測の対象としており、また図２は、高調波間隔グリッドに近い「トーン性の」ビンにのみ予測を行うように統合された一実施形態に係る、修正された同じ予測器を表している。

図２と図３を比較することによって、一実施形態に係る修正の２つの利点が明らかになり、すなわち、（１）予測プロセスに含まれるスペクトルビンがずっと少なく、複雑度を低減する（与えられた例では、ビンの５分の３のみが予測されるため、４０％を）、および（２）信号高調波の間の非トーン性の背景ノイズに属するビンは、予測による影響を受けず、これによって予測効率が増加するはずである。

なお、高調波間隔値は、入力信号の実際の瞬間的ピッチに対応している必要は必ずしもなく、それによって予測プロセスの効率の全体的な向上をもたらす場合には、真のピッチの分数または倍数を表すことができる。また、高調波間隔値は、ビンインデックス化またはバンド幅単位の整数倍を反映する必要はなく、前記単位の分数を含み得ることを強調しなければならない。

続いて、ＭＰＥＧスタイルのオーディオコーダでの好ましい実施態様について記載する。

好ましくは、ピッチ適応型の予測は、ＭＰＥＧ－２ＡＡＣ（ＩＳＯ／ＩＥＣ１３８１８－７「Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ－Ｐａｒｔ７：ＡｄｖａｎｃｅｄＡｕｄｉｏＣｏｄｉｎｇ（ＡＡＣ）」、２００６年）に組み込まれるか、または、ＡＡＣにおけるのと類似の予測器を利用して、ＭＰＥＧ－Ｈ３Ｄオーディオコーデック（ＩＳＯ／ＩＥＣ２３００８－３「Ｉｎｆｏｒｍａｔｉｏｎｔｅｃｈｎｏｌｏｇｙ－Ｈｉｇｈｅｆｆｉｃｉｅｎｃｙｃｏｄｉｎｇ，ｐａｒｔ３：３Ｄａｕｄｉｏ」、２０１５年）に組み込まれる。詳細には、１ビットのフラグを、単独で符号化されない各フレームおよびチャネルについて（単独のフレームチャネルについては、単独性を確実にするために予測をディセーブルにすることができるため、フラグは送信されない）、それぞれのビットストリームに書き込み、および読み出しすることができる。フラグが１に設定された場合、もう８ビットを読み書きすることができる。この８ビットは、与えられたフレームおよびチャネルについての量子化されたバージョンの高調波周波間隔値（例えば、高調波間隔に対するインデックス）を表す。量子化されたバージョンから線形または非線形のいずれかのマッピング関数を用いて導出された間隔値を使用して、図２に示す一実施形態に係る方法で予測プロセスを実行することができる。好ましくは、高調波グリッド周辺の最大距離１．５ビンの範囲内に位置するビンのみが予測の対象となる。例えば、高調波間隔値がビンインデックス４７．１１にある高調波ラインを示す場合、インデックス４６、４７および４８にあるビンのみが予測される。ただし、前記最大距離は、高周波間隔値に基づいて、すべてのチャネルおよびフレームについて先験的に固定されるか、または各フレームおよびチャネルについて別々に固定されるかのいずれか、異なって規定される可能性がある。

図４は、符号化されたオーディオ信号１２０を複合化するデコーダ２００の概略ブロック図を示す。デコーダ２００は、変換領域またはフィルタバンク領域２０４において、符号化されたオーディオ信号１２０を復号化するように構成され、デコーダ２００は、現在のフレーム２０８＿ｔ０についてのオーディオ信号の、符号化されたスペクトル係数２０６＿ｔ０＿ｆ１から２０６＿ｔ０＿ｆ６、および少なくとも１つの前のフレーム２０８＿ｔ－１についての符号化されたスペクトル係数２０６＿ｔ－１＿ｆ０から２０６＿ｔ－１＿ｆ６を得るために、符号化されたオーディオ信号１２０を解析するように構成され、またデコーダ２００は、少なくとも１つの符号化されたスペクトル係数によって隔てられている複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループに対して、予測復号化を選択的に適用するように構成される。

実施形態において、デコーダ２００は、例えば、少なくとも１つの符号化されたスペクトル係数によって隔てられている、２つの個々の符号化されたスペクトル係数に対してなど、少なくとも１つの符号化されたスペクトル係数によって隔てられている複数の個々の符号化されたスペクトル係数に対して、予測復号化を適用するように構成することができる。さらに、デコーダ２００は、例えば、少なくとも１つの符号化されたスペクトル係数によって隔てられている、符号化された２つのスペクトル係数グループに対してなど、少なくとも１つの符号化されたスペクトル係数によって隔てられている、符号化された複数のスペクトル係数グループ（グループのそれぞれは、少なくとも２つの符号化されたスペクトル係数を含む）に対して、予測復号化を適用するように構成することができる。さらに、デコーダ２００は、例えば、少なくとも１つの符号化されたスペクトル係数によって隔てられている、少なくとも１つの個々の符号化されたスペクトル係数および符号化された少なくとも１つのスペクトル係数グループに対してなど、少なくとも１つの符号化されたスペクトル係数によって隔てられている複数の、個々の符号化されたスペクトル係数および／または符号化されたスペクトル係数グループに対して、予測復号化を適用するように構成することができる。

図４に示す例では、デコーダ２００は、現在のフレーム２０８＿ｔ０についての６つの符号化されたスペクトル係数２０６＿ｔ０＿ｆ１から２０６＿ｔ０＿ｆ６、および前のフレーム２０８＿ｔ－１についての６つの符号化されたスペクトル係数２０６＿ｔ－１＿ｆ１から２０６＿ｔ－１＿ｆ６を決定するように構成される。その結果、デコーダ２００は、現在のフレームの個々の符号化された第２のスペクトル係数２０６＿ｔ０＿ｆ２に対して、および現在のフレーム２０８＿ｔ０の符号化された第４および第５のスペクトル係数２０６＿ｔ０＿ｆ４および２０６＿ｔ０＿ｆ５からなる符号化されたスペクトル係数グループに対して、予測復号化を選択的に適用するように構成される。分かるように、個々の符号化された第２のスペクトル係数２０６＿ｔ０＿ｆ２と、符号化された第４および第５のスペクトル係数２０６＿ｔ０＿ｆ４および２０６＿ｔ０＿ｆ５からなる符号化されたスペクトル係数グループは、符号化された第３のスペクトル係数２０６＿ｔ０＿ｆ３によって互いに隔てられている。

なお、本明細書において「選択的に」という用語は、選択された符号化されたスペクトル係数に対して（のみ）、予測復号化を適用することをいう。つまり、予測復号化は、すべての符号化されたスペクトル係数に対して適用されるのではなく、むしろ、選択された個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループ、つまり少なくとも１つの符号化されたスペクトル係数によって互いに隔てられている、選択された、個々の符号化されたスペクトル係数および／または符号化されたスペクトル係数グループに対してのみ適用される。つまり、予測復号化は、選択された複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループを隔てている、少なくとも１つの符号化されたスペクトル係数に対して適用されない。

実施形態において、デコーダ２００は、個々の符号化されたスペクトル係数２０６＿ｔ０＿ｆ２またはスペクトル係数グループ２０６＿ｔ０＿ｆ４および２０６＿ｔ０＿ｆ５を隔てている、少なくとも１つの符号化されたスペクトル係数２０６＿ｔ０＿ｆ３に対して、予測復号化を適用しないように構成することができる。

デコーダ２００は、予測復号化が適用される予定のスペクトル係数２０６＿ｔ０＿ｆ２、２０１６＿ｔ０＿ｆ４および２０６＿ｔ０＿ｆ５についての量子化された予測誤差、および予測符号化が適用されない予定の少なくとも１つのスペクトル係数についての量子化されたスペクトル係数２０６＿ｔ０＿ｆ３を得るために、符号化されたスペクトル係数をエントロピ復号化するように構成することができる。その結果、デコーダ２００は、現在のフレーム２０８＿ｔ０について、予測復号化が適用される符号化されたスペクトル係数２０６＿ｔ０＿ｆ２、２０６＿ｔ０＿ｆ４および２０６＿ｔ０＿ｆ５と関連付けられている、復号化されたスペクトル係数を得るために、複数の、個々の予測されたスペクトル係数２１０＿ｔ０＿ｆ２または予測されたスペクトル係数グループ２１０＿ｔ０＿ｆ４および２１０＿ｔ０＿ｆ５に対して、量子化された予測誤差を適用するように構成することができる。

例えば、デコーダ２００は、符号化された第２のスペクトル係数２０６＿ｔ０＿ｆ２と関連付けられている、復号化された第２のスペクトル係数を得るために、量子化された第２のスペクトル係数２０６＿ｔ０＿ｆ２についての量子化された第２の予測誤差を得るように、そして予測された第２のスペクトル係数２１０＿ｔ０＿ｆ２に対して、量子化された第２の予測誤差を適用するように構成することができ、デコーダ２００は、符号化された第４のスペクトル係数２０６＿ｔ０＿ｆ４と関連付けられている復号化された第４のスペクトル係数を得るために、量子化された第４のスペクトル係数２０６＿ｔ０＿ｆ４についての量子化された第４の予測誤差を得るように、そして予測された第４のスペクトル係数２１０＿ｔ０＿ｆ４に対して、量子化された第４の予測誤差を適用するように構成することができ、デコーダ２００は、符号化された第５のスペクトル係数２０６＿ｔ０＿ｆ５と関連付けられている復号化された第５のスペクトル係数を得るために、量子化された第５のスペクトル係数２０６＿ｔ０＿ｆ５についての量子化された第５の予測誤差を得るように、そして予測された第５のスペクトル係数２１０＿ｔ０＿ｆ５に対して、量子化された第５の予測誤差を適用するように構成することができる。

さらに、デコーダ２００は、現在のフレーム２０８＿ｔ０についての複数の、個々の予測されたスペクトル係数２１０＿ｔ０＿ｆ２または予測されたスペクトル係数グループ２１０＿ｔ０＿ｆ４および２１０＿ｔ０＿ｆ５を、前のフレーム２０８＿ｔ－１の、対応する複数の、個々の符号化されたスペクトル係数２０６＿ｔ－１＿ｆ２（例えば、複数の個々の符号化されたスペクトル係数２０６＿ｔ－１＿ｆ２と関連付けられている、複数の先に復号化されたスペクトル係数を用いて）または符号化されたスペクトル係数グループ２０６＿ｔ－１＿ｆ４および２０６＿ｔ－１＿ｆ５（例えば、符号化されたスペクトル係数の２０６＿ｔ－１＿ｆ４および２０６＿ｔ－１＿ｆ５と関連付けられている、先に復号化されたスペクトル係数グループを用いて）に基づいて決定するように構成することができる。

例えば、デコーダ２００は、現在のフレーム２０８＿ｔ０の予測された第２のスペクトル係数２１０＿ｔ０＿ｆ２を、前のフレーム２０８＿ｔ－１の、符号化された第２のスペクトル係数２０６＿ｔ－１＿ｆ２と関連付けられている、先に復号化された（量子化された）第２のスペクトル係数を用いて、現在のフレーム２０８＿ｔ０の予測された第４のスペクトル係数２１０＿ｔ０＿ｆ４を、前のフレーム２０８＿ｔ－１の、符号化された第４のスペクトル係数２０６＿ｔ－１＿ｆ４と関連付けられている、先に復号化された（量子化された）第４のスペクトル係数を用いて、また、現在のフレーム２０８＿ｔ０の予測された第５のスペクトル係数２１０＿ｔ０＿ｆ５を、前のフレーム２０８＿ｔ－１の、符号化された第５のスペクトル係数２０６＿ｔ－１＿ｆ５と関連付けられている、先に復号化された（量子化された）第５のスペクトル係数を用いて決定するように構成することができる。

さらに、デコーダ２００は、間隔値から予測係数を導出するように構成することができ、デコーダ２００は、現在のフレーム２０８＿ｔ０についての複数の、個々の予測されたスペクトル係数２１０＿ｔ０＿ｆ２または予測されたスペクトル係数グループ２１０＿ｔ０＿ｆ４および２１０＿ｔ０＿ｆ５を、少なくとも２つの前のフレーム２０８＿ｔ－１および２０８＿ｔ－２の、対応する複数の、先に複合化された個々のスペクトル係数または先に複合化されたスペクトル係数グループを用いて、および導出された予測係数を用いて計算するように構成することができる。

例えば、デコーダ２００は、符号化された第２のスペクトル係数２０６＿ｔ０＿ｆ２についての予測係数２１２＿ｆ２および２１４＿ｆ２を、間隔値から導出し、符号化された第４のスペクトル係数２０６＿ｔ０＿ｆ４についての予測係数２１２＿ｆ４および２１４＿ｆ４を、間隔値から導出するように、そして符号化された第５のスペクトル係数２０６＿ｔ０＿ｆ５についての予測係数２１２＿ｆ５および２１４＿ｆ５を、間隔値から導出するように構成することができる。

なお、デコーダ２００は、予測複合化が適用される複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループについての、複数の、個々の量子化されたスペクトル係数または量子化されたスペクトル係数グループの代わりに、量子化された予測誤差を得るために、符号化されたオーディオ信号１２０を複合化するように構成することができる。

さらに、デコーダ２００は、量子化された予測誤差がそれのために得られる、符号化されたスペクトル係数２０６＿ｔ０＿ｆ２または符号化されたスペクトル係数グループ２０６＿ｔ０＿ｆ４および２０６＿ｔ０＿ｆ５と、量子化されたスペクトル係数がそれのために得られる、符号化されたスペクトル係数２０６＿ｔ０＿ｆ３または符号化されたスペクトル係数グループとが、交互になるように、複数の、個々のスペクトル係数またはスペクトル係数グループを隔てている、量子化されたスペクトル係数を得るために、符号化されたオーディオ信号１２０を復号化するように構成することができる。

デコーダ２００は、復号化されたオーディオ信号２２０を、予測復号化が適用される符号化されたスペクトル係数２０６＿ｔ０＿ｆ２、２０６＿ｔ０＿ｆ４および２０６＿ｔ０＿ｆ５と関連付けられている、復号化されたスペクトル係数を用いて、ならびに予測復号化が適用されない符号化されたスペクトル係数２０６＿ｔ０＿ｆ１、２０６＿ｔ０＿ｆ３および２０６＿ｔ０＿ｆ６と関連付けられている、エントロピ復号化されたスペクトル係数を用いて提供するように構成することができる。

実施形態において、デコーダ２００は、間隔値を得るように構成することができ、デコーダ２００は、予測復号化が適用される複数の、個々の符号化されたスペクトル係数２０６＿ｔ０＿ｆ２または符号化されたスペクトル係数グループ２０６＿ｔ０＿ｆ４および２０６＿ｔ０＿ｆ５を、間隔値に基づいて選択するように構成することができる。

対応するエンコーダ１００の記述と関連してすでに上述したように、間隔値は、例えば、オーディオ信号の２つの特徴周波数の間の間隔（または距離）とすることができる。さらに、間隔値は、オーディオ信号の２つの特徴周波数の間の間隔を近似する、整数のスペクトル係数（またはスペクトル係数のインデックス）とすることができる。もちろん、間隔値は、オーディオ信号の２つの特徴周波数の間の間隔を表す、整数のスペクトル係数の分数もしくは倍数とすることもできる。

デコーダ２００は、予測復号化のために、間隔値によって定義された高調波グリッドによりスペクトル的に配置された、個々のスペクトル係数またはスペクトル係数グループを選択するように構成することができる。間隔値によって定義された高調波グリッドは、オーディオ信号１０２の中の高調波の周期的なスペクトル分布（等距離間隔）を表し得る。つまり、間隔値によって定義された高調波グリッドは、オーディオ信号１０２の高調波の等距離間隔を表す一連の間隔値とすることができる。

さらに、デコーダ２００は、そのスペクトルインデックスが、予測符号化のために、間隔値に基づいて導出された複数のスペクトルインデックスと、等しいかまたはその周辺の範囲（例えば、所定の、また可変の範囲）内に収まる、スペクトル係数（例えば、そうしたスペクトル係数のみ）を選択するように構成することができる。その結果、デコーダ２００は、間隔値に応じて範囲の幅を設定するように構成することができる。

実施形態において、符号化されたオーディオ信号は、間隔値またはその符号化されたバージョンを含み（例えば、それから間隔値を直接導出することができるパラメータ）、デコーダ２００は、間隔値を得るために、符号化されたオーディオ信号から間隔値またはその符号化されたバージョンを抽出するように構成することができる。

代替方法として、デコーダ２００は、それ自体で間隔値を決定するように、すなわち、符号化されたオーディオ信号が間隔値を含まないように、構成することができる。その場合、デコーダ２００は、（オーディオ信号１０２を表す符号化されたオーディオ信号１２０の）瞬間的基本周波数を決定するように、そして瞬間的基本周波数またはその分数もしくは倍数から間隔値を導出するように構成することができる。

実施形態において、デコーダ２００は、予測復号化が適用される複数の、個々のスペクトル係数またはスペクトル係数グループと、予測復号化が適用される複数の、個々のスペクトル係数またはスペクトル係数グループを隔てている、スペクトル係数とが、＋／－１スペクトル係数の許容範囲を伴った周期で周期的に交互になるように、予測復号化が適用される複数の、個々のスペクトル係数またはスペクトル係数グループを選択するように構成することができる。

実施形態において、符号化されたオーディオ信号１２０によって表されたオーディオ信号１０２は、少なくとも２つの高調波信号要素を含み、デコーダ２００は、オーディオ信号１０２の少なくとも２つの高調波信号要素または少なくとも２つの高調波信号要素の周辺のスペクトル環境を表す複数の、個々の符号化されたスペクトル係数２０６＿ｔ０＿ｆ２または符号化されたスペクトル係数グループ２０６＿ｔ０＿ｆ４および２０６＿ｔ０＿ｆ５に対して、予測復号化を選択的に適用するように構成される。少なくとも２つの高調波信号要素の周辺のスペクトル環境は、例えば、＋／－１、２、３、４，または５スペクトル要素とすることができる。

その結果、デコーダ２００は、少なくとも２つの高調波信号要素を特定するように、そして特定された高調波信号要素と関連付けられている、例えば、特定された高調波信号要素を表すか、または特定された高調波信号要素を囲む）複数の、個々の符号化されたスペクトル係数２０６＿ｔ０＿ｆ２または符号化されたスペクトル係数グループ２０６＿ｔ０＿ｆ４および２０６＿ｔ０＿ｆ５に対して、予測復号化を選択的に適用するように構成することができる。

代替方法として、符号化されたオーディオ信号１２０は、少なくとも２つの高調波信号要素を特定する情報（例えば、間隔値）を含み得る。その場合、デコーダ２００は、特定された高調波信号要素と関連付けられている、例えば、特定された高調波信号要素を表すか、または特定された高調波信号要素を囲む）複数の、個々の符号化されたスペクトル係数２０６＿ｔ０＿ｆ２または符号化されたスペクトル係数グループ２０６＿ｔ０＿ｆ４および２０６＿ｔ０＿ｆ５に対して、予測復号化を選択的に適用するように構成することができる。

上記の代替方法の両方において、デコーダ２００は、オーディオ信号１０２の少なくとも２つの高調波信号要素または少なくとも２つの高調波信号要素のスペクトル環境を表していない複数の、個々の符号化されたスペクトル係数２０６＿ｔ０＿ｆ３、２０６＿ｔ０＿ｆ１および２０６＿ｔ０＿ｆ６、または符号化されたスペクトル係数グループに対して、予測復号化を適用しないように構成することができる。

つまり、デコーダ２００は、オーディオ信号１０２の信号高調波間の非トーン性の背景ノイズに属する複数の、個々の符号化されたスペクトル係数２０６＿ｔ０＿ｆ３、２０６＿ｔ０＿ｆ１、２０６＿ｔ０＿ｆ６、または符号化されたスペクトル係数グループに対して、予測復号化を適用しないように構成することができる。

図５は、一実施形態に係る、オーディオ信号を符号化する方法３００のフローチャートを示す。方法３００は、現在のフレームおよび少なくとも１つの前のフレームについてのオーディオ信号のスペクトル係数を決定するステップ３０２と、少なくとも１つのスペクトル係数によって隔てられている複数の、個々のスペクトル係数またはスペクトル係数グループに対して、予測符号化を選択的に適用するステップ３０４を含む。

図６は、一実施形態に係る、符号化されたオーディオ信号を復号化する方法４００のフローチャートを示す。方法４００は、現在のフレームおよび少なくとも１つの前のフレームについてのオーディオ信号の符号化されたスペクトル係数を得るために、符号化されたオーディオ信号を解析するステップ４０２と、少なくとも１つの符号化されたスペクトル係数によって隔てられている複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループに対して、予測復号化を選択的に適用するステップ４０４を含む。

いくつかの態様を、一装置との関連で記載してきたが、これらの態様は、対応する方法の記述も表していることは明らかであり、ブロックまたはデバイスが、方法ステップまたは方法ステップの特徴に対応する。同様に、方法ステップとの関連で記載された態様は、対応する装置の対応するブロックまたはアイテムまたは特徴の記述も表している。方法ステップの一部またはすべては、例えばマイクロプロセッサ、プログラマブルコンピュータまたは電子回路のようなハードウェア装置によって（または、を用いて）実行され得る。いくつかの実施形態において、１つまたは複数の最も重要な方法ステップが、こうした装置によって実行され得る。

本発明に関する符号化されたオーディオ信号は、デジタル記憶媒体に記憶することができ、またはインターネットなどの無線伝送媒体もしくは有線伝送媒体などの伝送媒体上で伝送することができる。

特定の実施要件に応じて、本発明の実施形態は、ハードウェアまたはソフトウェアで実施することができる。例えば、フロッピディスク、ＤＶＤ、ブルーレイ、ＣＤ、ＲＯＭ、ＰＲＯＭ、ＥＰＲＯＭ、ＥＥＰＲＯＭまたはフレッシュメモリなど、その上に記憶された電子的に読み取り可能な制御信号を有し、それぞれの方法が実行されるようにプログラマブル・コンピュータ・システムと連携する（または連携可能な）、デジタル記憶媒体を用いて実施することができる。そのため、デジタル記憶媒体は、コンピュータ読み取り可能であり得る。

本発明に係るいくつかの実施形態は、電子的に読み取り可能な制御信号を有するデータキャリアを含み、データキャリアは、本明細書に記載された方法の１つが実行されるように、プログラマブル・コンピュータ・システムと連携することができる。

一般に、本発明の実施形態は、プログラムコードを伴ったコンピュータプログラム製品として実施することができ、プログラムコードは、そのコンピュータプログラム製品をコンピュータ上で実行させたときに、方法の１つを実行するために働く。プログラムコードは、例えば機械読み取り可能なキャリア上に記憶され得る。

別の実施形態は、機械読み取り可能なキャリア上に記憶された、本明細書に記載された方法の１つを実行するためのコンピュータプログラムを含む。

つまり、本発明に関する方法の実施形態は、結果として、そのコンピュータプログラムをコンピュータ上で実行させたときに、本明細書に記載された方法の１つを実行するためのプログラムコードを有するコンピュータプログラムである。

本発明に関する方法のさらなる実施形態は、結果として、本明細書に記載された方法の１つを実行するためのコンピュータプログラムをその上に含むデータキャリア（またはデジタル記憶媒体、またはコンピュータ読み取り可能な媒体）である。データキャリア、デジタル記憶媒体または被記録媒体は、通常は、有形および／または非遷移性である。

本発明に関する方法のさらなる実施形態は、結果として、本明細書に記載された方法の１つを実行するためのコンピュータプログラムを表すデータストリームまたは一連の信号である。データストリームまたは一連の信号は、例えばインターネットを介した、データ通信接続を介して伝送されるように、例えば構成され得る。

さらなる実施形態は、本明細書に記載された方法の１つを実行するように構成または適合された処理手段、例えばコンピュータ、またはプログラマブル・ロジック・デバイスを含む。

さらなる実施形態は、本明細書に記載された方法の１つを実行するためのコンピュータプログラムをその上にインストールしたコンピュータを含む。

本発明に係るさらなる実施形態は、本明細書に記載された方法の１つを実行するためのコンピュータプログラムをレシーバへ送信（例えば、電子的または光学的に）するように構成された装置またはシステムを含む。レシーバは、例えば、コンピュータ、モバイルデバイス、メモリデバイスなどであり得る。装置またはシステムは、例えば、コンピュータプログラムをレシーバへ送信するためのファイルサーバを含み得る。

いくつかの実施形態において、プログラマブル・ロジック・デバイス（例えば、フィールド・プログラマブル・ゲート・アレイ）が、本明細書に記載された方法の機能性の一部またはすべてを実行するために用いられ得る。いくつかの実施形態において、本明細書に記載され方法の１つを実行するために、フィールド・プログラマブル・ゲート・アレイは、マイクロプロセッサと連携し得る。一般に、方法は、任意のハードウェア装置によって実行されることが好ましい。

本明細書に記載された装置は、ハードウェア装置を用いて、またはコンピュータを用いて、またはハードウェア装置およびコンピュータの組合せを用いて実施され得る。

本明細書に記載された方法は、ハードウェア装置を用いて、またはコンピュータを用いて、またはハードウェア装置およびコンピュータの組合せを用いて実行され得る。

上記の実施形態は、本発明の原理についての例示に過ぎない。本明細書に記載された構成および詳細の修正および変形が、他の当業者にとって明らかであろうことが分かる。結果として、本明細書の実施形態の記述および説明によって表された特定の詳細によってではなく、添付の特許請求の範囲によってのみ制限されることを意図している。

Claims

オーディオ信号（１０２）を符号化するエンコーダ（１００）であって、前記エンコーダ（１００）は、変換領域またはフィルタバンク領域（１０４）において、前記オーディオ信号（１０２）を符号化するように構成され、前記エンコーダは、現在のフレーム（１０８＿ｔ０）および少なくとも１つの前のフレーム（１０８＿ｔ－１）についての前記オーディオ信号（１０２）のスペクトル係数（１０６＿ｔ０＿ｆ１：１０６＿ｔ０＿ｆ６；１０６＿ｔ－１＿ｆ１：１０６＿ｔ－１＿ｆ６）を決定するように構成され、前記エンコーダ（１００）は、複数の、個々のスペクトル係数（１０６＿ｔ０＿ｆ２）またはスペクトル係数グループ（１０６＿ｔ０＿ｆ４，１０６＿ｔ０＿ｆ５）に対して、予測符号化を選択的に適用するように構成され、前記エンコーダ（１００）は、間隔値を決定するように構成され、前記エンコーダ（１００）は、予測符号化が適用される前記複数の、個々のスペクトル係数（１０６＿ｔ０＿ｆ２）またはスペクトル係数グループ（１０６＿ｔ０＿ｆ４，１０６＿ｔ０＿ｆ５）を、前記間隔値に基づいて選択するように構成される、エンコーダ。
前記間隔値は、高調波間の間隔を表す高調波間隔値である、請求項１に記載のエンコーダ（１００）。
前記複数の、個々のスペクトル係数（１０６＿ｔ０＿ｆ２）またはスペクトル係数グループ（１０６＿ｔ０＿ｆ４，１０６＿ｔ０＿ｆ５）は、少なくとも１つのスペクトル係数（１０６＿ｔ０＿ｆ３）によって隔てられている、請求項１または２に記載のエンコーダ（１００）。
前記予測符号化は、前記個々のスペクトル係数（１０６＿ｔ０＿ｆ２）または前記スペクトル係数グループ（１０６＿ｔ０＿ｆ４，１０６＿ｔ０＿ｆ５）を隔てている、前記少なくとも１つのスペクトル係数（１０６＿ｔ０＿ｆ３）に適用されない、請求項３に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、前記現在のフレームの複数の、個々の予測されたスペクトル係数（１１０＿ｔ０＿ｆ２）または予測されたスペクトル係数グループ（１１０＿ｔ０＿ｆ４，１１０＿ｔ０＿ｆ５）と、前記現在のフレーム（１０８＿ｔ０）の前記複数の、個々のスペクトル係数（１０６＿ｔ０＿ｆ２）またはスペクトル係数グループ（１０６＿ｔ０＿ｆ４，１０６＿ｔ０＿ｆ５）との間の予測誤差を符号化することによって、前記現在のフレーム（１０８＿ｔ０）の前記複数の、個々のスペクトル係数（１０６＿ｔ０＿ｆ２）または前記スペクトル係数グループ（１０６＿ｔ０＿ｆ４，１０６＿ｔ０＿ｆ５）を、予測符号化するように構成される、請求項１から４のいずれか一項に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、前記間隔値から予測係数を導出するように構成され、前記エンコーダ（１００）は、前記現在のフレーム（１０８＿ｔ０）についての前記複数の、個々の予測されたスペクトル係数（１１０＿ｔ０＿ｆ２）または予測されたスペクトル係数グループ（１１０＿ｔ０＿ｆ４，１１０＿ｔ０＿ｆ５）を、少なくとも２つの前のフレーム（１０８＿ｔ－２，１０８＿ｔ－１）の、対応する複数の、個々のスペクトル係数（１０６＿ｔ－２＿ｆ２，１０６＿ｔ－１＿ｆ２）または対応するスペクトル係数グループ（１０６＿ｔ－２＿ｆ４，１０６＿ｔ－１＿ｆ４；１０６＿ｔ－２＿ｆ５，１０６＿ｔ－１＿ｆ５）を用いて、および前記導出された予測係数を用いて計算するように構成される、請求項５に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、前記現在のフレーム（１０８＿ｔ０）についての前記複数の、個々の予測されたスペクトル係数（１１０＿ｔ０＿ｆ２）または予測されたスペクトル係数グループ（１１０＿ｔ０＿ｆ４，１１０＿ｔ０＿ｆ４）を、前記前のフレーム（１０８＿ｔ－１）の、対応する量子化されたバージョンの前記複数の、個々のスペクトル係数（１０６＿ｔ－１＿ｆ２）または前記スペクトル係数グループ（１０６＿ｔ－１＿ｆ４，１０６＿ｔ－１＿ｆ５）を用いて決定するように構成される、請求項５に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、前記間隔値から予測係数を導出するように構成され、前記エンコーダ（１００）は、前記現在のフレーム（１０８＿ｔ０）についての前記複数の、個々の予測されたスペクトル係数（１１０＿ｔ０＿ｆ２）または予測されたスペクトル係数グループ（１１０＿ｔ０＿ｆ４，１１０＿ｔ０＿ｆ５）を、少なくとも２つの前のフレーム（１０８＿ｔ－２，１０８＿ｔ－１）の、対応する量子化されたバージョンの前記複数の、個々のスペクトル係数（１０６＿ｔ－２＿ｆ２，１０６＿ｔ－１＿ｆ２）または前記スペクトル係数グループ（１０６＿ｔ－２＿ｆ４，１０６＿ｔ－１＿ｆ４；１０６＿ｔ－２＿ｆ５，１０６＿ｔ－１＿ｆ５）を用いて、および前記導出された予測係数を用いて計算するように構成される、請求項７に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、符号化されたオーディオ信号（１２０）を提供するように構成され、前記符号化されたオーディオ信号（１２０）は、前記予測係数も、その符号化されたバージョンも含まない、請求項６または８に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、符号化されたオーディオ信号（１２０）を提供するように構成され、前記符号化されたオーディオ信号（１２０）は、予測符号化が適用される前記複数の、個々のスペクトル係数またはスペクトル係数グループについての量子化されたバージョンの前記複数の、個々のスペクトル係数（１０６＿ｔ０＿ｆ２）または前記スペクトル係数グループ（１０６＿ｔ０＿ｆ４，１０６＿ｔ０＿ｆ５）の代わりに、量子化されたバージョンの前記予測誤差を含む、請求項５から９のいずれか一項に記載のエンコーダ（１００）。
前記符号化されたオーディオ信号（１２０）は、その量子化されたバージョンの前記予測誤差が前記符号化されたオーディオ信号（１２０）に含まれるスペクトル係数（１０６＿ｔ０＿ｆ２）またはスペクトル係数グループ（１０６＿ｔ０＿ｆ４，１０６＿ｔ０＿ｆ５）と、予測符号化を用いずにその量子化されたバージョンが提供されるスペクトル係数（１０６＿ｔ０＿ｆ１，１０６＿ｔ０＿ｆ３，１０６＿ｔ０＿ｆ６）またはスペクトル係数グループとが、交互になるように、予測符号化が適用されない量子化されたバージョンの前記スペクトル係数（１０６＿ｔ０＿ｆ３）を含む、請求項１０に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、前記オーディオ信号（１０２）の瞬間的基本周波数を決定するように、そして前記瞬間的基本周波数またはその分数もしくは倍数から前記間隔値を導出するように構成される、請求項１から１１のいずれか一項に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、予測符号化のために、前記間隔値によって定義された高調波グリッドによりスペクトル的に配置された、個々のスペクトル係数またはスペクトル係数グループ（１１６＿１：１１６＿６）を選択するように構成される、請求項１から１２のいずれか一項に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、そのスペクトルインデックスが、予測符号化のために、前記間隔値に基づいて導出された複数のスペクトルインデックスと、等しいかまたはその周辺の範囲内に収まる、スペクトル係数を選択するように構成される、請求項１から１２のいずれか一項に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、前記間隔値に応じて前記範囲の幅を設定するように構成される、請求項１４に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、予測符号化が適用される前記複数の、個々のスペクトル係数またはスペクトル係数グループ（１１６＿１：１１６＿６）と、予測符号化が適用されない前記スペクトル係数またはスペクトル係数グループ（１１８＿１：１１８＿５）とが、＋／－１スペクトル係数の許容範囲を伴った周期で周期的に交互になるように、予測符号化が適用される前記複数の、個々のスペクトル係数またはスペクトル係数グループ（１１６＿１：１１６＿６）を選択するように構成される、請求項１から１５のいずれか一項に記載のエンコーダ（１００）。
前記オーディオ信号（１０２）は、少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）を含み、前記エンコーダ（１００）は、前記オーディオ信号（１０２）の前記少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）または前記少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）の周辺のスペクトル環境を表す複数の、個々のスペクトル係数またはスペクトル係数グループ（１１６＿１：１１６＿６）に対して、予測符号化を選択的に適用するように構成される、請求項１から１６のいずれか一項に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、前記オーディオ信号（１０２）の前記少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）または前記少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）のスペクトル環境を表していない複数の、個々のスペクトル係数またはスペクトル係数グループ（１１８＿１：１１８＿５）に対して、予測符号化を適用しないように構成される、請求項１７に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、信号高調波（１２４＿１：１２４＿６）の間の非トーン性の背景ノイズに属する複数の、個々のスペクトル係数またはスペクトル係数グループ（１１８＿１：１１８＿５）に対して、予測符号化を適用しないように構成される、請求項１７または１８に記載のエンコーダ（１００）。
前記間隔値は、前記オーディオ信号（１０２）の前記少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）間のスペクトル間隔を示す高調波間隔値であり、前記高調波間隔値は、前記オーディオ信号（１０２）の前記少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）を表す複数の、個々のスペクトル係数またはスペクトル係数グループ（１１６＿１：１１６＿６）を示す、請求項１７から１９のいずれか一項に記載のエンコーダ（１００）。
前記エンコーダ（１００）は、符号化されたオーディオ信号（１２０）を提供するように構成され、前記エンコーダ（１００）は、前記符号化されたオーディオ信号（１２０）に前記間隔値またはその符号化されたバージョンを含むように構成される、請求項１から２０のいずれか一項に記載のエンコーダ（１００）。
前記スペクトル係数は、スペクトルビンである、請求項１から２１のいずれか一項に記載のエンコーダ（１００）。
符号化されたオーディオ信号（１２０）を複合化するデコーダ（２００）であって、前記デコーダ（２００）は、変換領域またはフィルタバンク領域（２０４）において、前記符号化されたオーディオ信号（１２０）を復号化するように構成され、前記デコーダ（２００）は、現在のフレーム（２０８＿ｔ０）および少なくとも１つの前のフレーム（２０８＿ｔ－１）についての前記オーディオ信号（１２０）の符号化されたスペクトル係数（２０６＿ｔ０＿ｆ１：２０６＿ｔ０＿ｆ６；２０６＿ｔ－１＿ｆ１：２０６＿ｔ－１＿ｆ６）を得るために、前記符号化されたオーディオ信号（１２０）を解析するように構成され、前記デコーダ（２００）は、複数の、個々の符号化されたスペクトル係数（２０６＿ｔ０＿ｆ２）または符号化されたスペクトル係数グループ（２０６＿ｔ０＿ｆ４，２０６＿ｔ０＿ｆ５）に対して、予測復号化を選択的に適用するように構成され、前記デコーダ（２００）は、間隔値を得るように構成され、前記デコーダ（２００）は、予測復号化が適用される前記複数の、個々の符号化されたスペクトル係数（２０６＿ｔ０＿ｆ２）または符号化されたスペクトル係数グループ（２０６＿ｔ０＿ｆ４，２０６＿ｔ０＿ｆ５）を、前記間隔値に基づいて選択するように構成される、デコーダ。
前記間隔値は、高調波間の間隔を表す高調波間隔値である、請求項２３に記載のデコーダ（２００）。
前記複数の、個々の符号化されたスペクトル係数（２０６＿ｔ０＿ｆ２）または符号化されたスペクトル係数グループ（２０６＿ｔ０＿ｆ４，２０６＿ｔ０＿ｆ５）は、少なくとも１つの符号化されたスペクトル係数（２０６＿ｔ０＿ｆ３）によって隔てられている、請求項２４に記載のデコーダ（２００）。
前記予測複合化は、前記個々のスペクトル係数（２０６＿ｔ０＿ｆ２）または前記スペクトル係数グループ（２０６＿ｔ０＿ｆ４，２０６＿ｔ０＿ｆ５）を隔てている、少なくとも１つのスペクトル係数（２０６＿ｔ０＿ｆ３）に適用されない、請求項２５に記載のデコーダ（２００）。
前記デコーダ（２００）は、予測複合化が適用される予定の前記スペクトル係数（２０６＿ｔ０＿ｆ２，２０６＿ｔ０＿ｆ４，２０６＿ｔ０＿ｆ５）についての量子化された予測誤差、および予測複合化が適用されない予定のスペクトル係数（２０６＿ｔ０＿ｆ３）についての量子化されたスペクトル係数を得るために、前記符号化されたスペクトル係数をエントロピ復号化するように構成され、
前記デコーダ（２００）は、前記現在のフレーム（２０８＿ｔ０）について、予測複合化が適用される前記符号化されたスペクトル係数（２０６＿ｔ０＿ｆ２，２０６＿ｔ０＿ｆ４，２０６＿ｔ０＿ｆ５）と関連付けられている復号化されたスペクトル係数を得るために、複数の、個々の予測されたスペクトル係数（２１０＿ｔ０＿ｆ２）または予測されたスペクトル係数グループ（２１０＿ｔ０＿ｆ４，２１０＿ｔ０＿ｆ５）に対して、前記量子化された予測誤差を適用するように構成される、請求項２４から２６のいずれか一項に記載のデコーダ（２００）。
前記デコーダ（２００）は、前記現在のフレーム（２０８＿ｔ０）についての前記複数の、個々の予測されたスペクトル係数（２１０＿ｔ０＿ｆ２）または予測されたスペクトル係数グループ（２１０＿ｔ０＿ｆ４，２１０＿ｔ０＿ｆ５）を、前記前のフレーム（２０８＿ｔ－１）の、対応する複数の、前記個々の符号化されたスペクトル係数（２０６＿ｔ－１＿ｆ２）または符号化されたスペクトル係数グループ（２０６＿ｔ－１＿ｆ４，２０６＿ｔ－１＿ｆ５）に基づいて決定するように構成される、請求項２７に記載のデコーダ（２００）。
前記デコーダ（２００）は、前記間隔値から予測係数を導出するように構成され、前記デコーダ（２００）は、前記現在のフレーム（２０８＿ｔ０）についての前記複数の、個々の予測されたスペクトル係数（２１０＿ｔ０＿ｆ２）または予測されたスペクトル係数グループ（２１０＿ｔ０＿ｆ４，２１０＿ｔ０＿ｆ５）を、少なくとも２つの前のフレームの、対応する複数の、先に複合化された個々のスペクトル係数または先に複合化されたスペクトル係数グループを用いて、および前記導出された予測係数を用いて計算するように構成される、請求項２８に記載のデコーダ（２００）
前記デコーダ（２００）は、予測複合化が適用される前記複数の、個々の符号化されたスペクトル係数（２０６＿ｔ０＿ｆ２）または符号化されたスペクトル係数グループ（２０６＿ｔ０＿ｆ４，２０６＿ｔ０＿ｆ５）についての複数の、個々の量子化されたスペクトル係数または量子化されたスペクトル係数グループの代わりに、量子化された予測誤差を得るために、前記符号化されたオーディオ信号（１２０）を複合化するように構成される、請求項２４から２９のいずれか一項に記載のデコーダ（２００）。
前記デコーダは、量子化された予測誤差がそれのために得られる、符号化されたスペクトル係数（２０６＿ｔ０＿ｆ２）または符号化されたスペクトル係数グループ（２０６＿ｔ０＿ｆ４，２０６＿ｔ０＿ｆ５）と、量子化されたスペクトル係数がそれのために得られる、符号化されたスペクトル係数（２０６＿ｔ０＿ｆ３）または符号化されたスペクトル係数グループとが、交互になるように、予測符号化が適用されない符号化されたスペクトル係数（２０６＿ｔ０＿ｆ３）についての量子化されたスペクトル係数を得るために、前記符号化されたオーディオ信号（１２０）を復号化するように構成される、請求項３０に記載のデコーダ（２００）。
前記デコーダ（２００）は、予測符号化のために、前記間隔値によって定義された高調波グリッドによりスペクトル的に配置された、個々のスペクトル係数（２０６＿ｔ０＿ｆ２）またはスペクトル係数グループ（２０６＿ｔ０＿ｆ４，２０６＿ｔ０＿ｆ５）を選択するように構成される、請求項２２から２９のいずれか一項に記載のデコーダ（２００）。
前記デコーダ（２００）は、そのスペクトルインデックスが、予測復号化のために、前記間隔値に基づいて導出された複数のスペクトルインデックスと、等しいかまたは周辺の範囲内に収まる、スペクトル係数を選択するように構成される、請求項２４から３２のいずれか一項に記載のデコーダ（２００）。
前記デコーダ（２００）は、前記間隔値に応じて前記範囲の幅を設定する、請求項３３に記載のデコーダ（２００）。
前記符号化されたオーディオ信号（１２０）は、前記間隔値またはその符号化されたバージョンを含み、前記デコーダ（２００）は、前記間隔値を得るために、前記符号化されたオーディオ信号（１２０）から前記間隔値または前記その符号化されたバージョンを抽出するように構成される、請求項２４から３４のいずれか一項に記載のデコーダ（２００）。
前記デコーダ（２００）は、前記間隔値を決定するように構成される、請求項２４から３４のいずれか一項に記載のデコーダ（２００）。
前記デコーダ（２００）は、瞬間的基本周波数を決定するように、そして前記瞬間的基本周波数またはその分数もしくは倍数から前記間隔値を導出するように構成される、請求項３６に記載のデコーダ（２００）。
前記デコーダ（２００）は、予測復号化が適用される前記複数の、個々のスペクトル係数（２０６＿ｔ０＿ｆ２）またはスペクトル係数グループ（２０６＿ｔ０＿ｆ４、２０６＿ｔ０＿ｆ５）と、予測復号化が適用されない前記スペクトル係数（２０６＿ｔ０＿ｆ３）とが、＋／－１スペクトル係数の許容範囲を伴った周期で周期的に交互になるように、予測復号化が適用される前記複数の、個々のスペクトル係数（２０６＿ｔ０＿ｆ２）またはスペクトル係数グループ（２０６＿ｔ０＿ｆ４、２０６＿ｔ０＿ｆ５）を選択するように構成される、請求項２４から３７のいずれか一項に記載のデコーダ（２００）。
前記符号化されたオーディオ信号（１２０）によって表された前記オーディオ信号（１０２）は、少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）を含み、前記デコーダ（２００）は、前記オーディオ信号（１０２）の前記少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）または前記少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）の周辺のスペクトル環境を表す複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループに対して、予測復号化を選択的に適用するように構成される、請求項２４から３８のいずれか一項に記載のデコーダ（２００）。
前記デコーダ（２００）は、前記少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）を特定するように、そして前記特定された高調波信号要素（１２４＿１：１２４＿６）と関連付けられている複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループに対して、予測復号化を選択的に適用するように構成される、請求項３９に記載のデコーダ（２００）。
前記符号化されたオーディオ信号（１２０）は、前記間隔値またはその符号化されたバージョンを含み、前記間隔値は、前記少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）を特定し、前記デコーダ（２００）は、前記特定された高調波信号要素（１２４＿１：１２４＿６）と関連付けられている複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループに対して、予測復号化を選択的に適用するように構成される、請求項３９に記載のデコーダ（２００）。
前記デコーダ（２００）は、前記オーディオ信号の前記少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）または前記少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）のスペクトル環境を表していない複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループに対して、予測復号化を適用しないように構成される、請求項３９から４１のいずれか一項に記載のデコーダ（２００）。
前記デコーダ（２００）は、前記オーディオ信号の信号高調波（１２４＿１：１２４＿６）の間の非トーン性の背景ノイズに属する複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループに対して、予測復号化を適用しないように構成される、請求項３９から４２のいずれか一項に記載のデコーダ（２００）。
前記符号化されたオーディオ信号（１２０）は、前記間隔値またはその符号化されたバージョンを含み、前記間隔値は、高調波間隔値であり、前記高調波間隔値は、前記オーディオ信号（１０２）の少なくとも２つの高調波信号要素（１２４＿１：１２４＿６）を表す複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループを示す、請求項２４から４３のいずれか一項に記載のデコーダ（２００）。
前記スペクトル係数は、スペクトルビンである、請求項２４から４４のいずれか一項に記載のデコーダ（２００）。
変換領域またはフィルタバンク領域において、オーディオ信号を符号化する方法（３００）であって、前記方法は、
現在のフレームおよび少なくとも１つの前のフレームについての前記オーディオ信号のスペクトル係数を決定すること（３０２）と、
間隔値を決定することと、
複数の、個々のスペクトル係数またはスペクトル係数グループに対して、予測符号化を選択的に適用すること（３０４）であって、予測符号化が適用される前記複数の、個々のスペクトル係数またはスペクトル係数グループは、前記間隔値に基づいて選択されることと
を含む、方法。
変換領域またはフィルタバンク領域において、符号化されたオーディオ信号を復号化する方法（４００）であって、前記方法は、
現在のフレームおよび少なくとも１つの前のフレームについての前記オーディオ信号の符号化されたスペクトル係数を得るために、前記符号化されたオーディオ信号を解析すること（４０２）と、
間隔値を得ることと、
複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループに対して、予測復号化を選択的に適用すること（４０４）であって、予測復号化が適用される前記複数の、個々の符号化されたスペクトル係数または符号化されたスペクトル係数グループは、前記間隔値に基づいて選択されることと
を含む、方法。
請求項４６または４７に記載の方法を実行するためのコンピュータプログラム。
オーディオ信号（１０２）を符号化するエンコーダ（１００）であって、前記エンコーダ（１００）は、変換領域またはフィルタバンク領域（１０４）において、前記オーディオ信号（１０２）を符号化するように構成され、前記エンコーダは、現在のフレーム（１０８＿ｔ０）および少なくとも１つの前のフレーム（１０８＿ｔ－１）についての前記オーディオ信号（１０２）のスペクトル係数（１０６＿ｔ０＿ｆ１：１０６＿ｔ０＿ｆ６；１０６＿ｔ－１＿ｆ１：１０６＿ｔ－１＿ｆ６）を決定するように構成され、前記エンコーダ（１００）は、複数の、個々のスペクトル係数（１０６＿ｔ０＿ｆ２）またはスペクトル係数グループ（１０６＿ｔ０＿ｆ４，１０６＿ｔ０＿ｆ５）に対して、予測符号化を選択的に適用するように構成され、前記エンコーダ（１００）は、間隔値を決定するように構成され、前記エンコーダ（１００）は、予測符号化が適用される前記複数の、個々のスペクトル係数（１０６＿ｔ０＿ｆ２）またはスペクトル係数グループ（１０６＿ｔ０＿ｆ４，１０６＿ｔ０＿ｆ５）を、前記間隔値に基づいて選択するように構成され、
前記エンコーダ（１００）は、予測符号化のために、前記間隔値によって定義された高調波グリッドによりスペクトル的に配置された、個々のスペクトル係数またはスペクトル係数グループ（１１６＿１：１１６＿６）を選択するように構成される、エンコーダ。
符号化されたオーディオ信号（１２０）を復号化するデコーダ（２００）であって、前記デコーダ（２００）は、変換領域またはフィルタバンク領域（２０４）において、前記符号化されたオーディオ信号（１２０）を復号化するように構成され、前記デコーダ（２００）は、現在のフレーム（２０８＿ｔ０）および少なくとも１つの前のフレーム（２０８＿ｔ－１）についての前記オーディオ信号（１２０）の符号化されたスペクトル係数（２０６＿ｔ０＿ｆ１：２０６＿ｔ０＿ｆ６；２０６＿ｔ－１＿ｆ１：２０６＿ｔ－１＿ｆ６）を得るために、前記符号化されたオーディオ信号（１２０）を解析するように構成され、前記デコーダ（２００）は、複数の、個々の符号化されたスペクトル係数（２０６＿ｔ０＿ｆ２）または符号化されたスペクトル係数グループ（２０６＿ｔ０＿ｆ４：２０６＿ｔ０＿ｆ５）に対して、予測復号化を選択的に適用するように構成され、前記デコーダ（２００）は、間隔値を得るように構成され、前記デコーダ（２００）は、予測復号化が適用される前記複数の、個々の符号化されたスペクトル係数（２０６＿ｔ０＿ｆ２）または符号化されたスペクトル係数グループ（２０６＿ｔ０＿ｆ４，２０６＿ｔ０＿ｆ５）を、前記間隔値に基づいて選択するように構成され、
前記デコーダ（２００）は、予測復号化のために、前記間隔値によって定義された高調波グリッドによりスペクトル的に配置された、個々のスペクトル係数（２０６＿ｔ０＿ｆ２）またはスペクトル係数グループ（２０６＿ｔ０＿ｆ４，２０６＿ｔ０＿ｆ５）を選択するように構成される、デコーダ。