JP7371133B2

JP7371133B2 - 時間反転されたオーディオサブフレームエラー隠蔽

Info

Publication number: JP7371133B2
Application number: JP2021573331A
Authority: JP
Inventors: エリクノーベル，; アシュア，チャムラーンモラディ
Original assignee: テレフオンアクチーボラゲットエルエムエリクソン（パブル）
Priority date: 2019-06-13
Filing date: 2020-05-25
Publication date: 2023-10-30
Anticipated expiration: 2040-05-25
Also published as: JP2022536158A; CN113950719A; EP3984026A1; BR112021021928A2; CO2021016704A2; JP2024012337A; WO2020249380A1; US20240221760A1; US20220246156A1; US11967327B2

Description

本開示は、全般的には通信に関し、より詳細には、モノラル、ステレオ、またはマルチチャネルオーディオエンコーディングおよびデコーディングに関するパケットロス隠蔽を制御するための方法および装置に関する。

現代の電気通信サービスは、一般にエンドユーザどうしの間における信頼できる接続を提供する。しかしながら、そのようなサービスは依然として、変動するチャネル状況を取り扱う必要があり、そうしたチャネル状況では、たとえばネットワークの混雑または貧弱なセルカバレッジに起因して、ときおりデータパケットが失われる場合がある。送信エラーおよび失われるパッケージの問題を克服するために、電気通信サービスは、パケットロス隠蔽技術（ＰＬＣ）を利用することが可能である。貧弱な接続、ネットワークの混雑などに起因してデータパケットが失われるケースにおいては、受信機側における失われたパケットの欠落している情報は、デコーダにおいて合成信号によって代用されることが可能である。ＰＬＣ技術は、しばしばデコーダに密接に結び付けられている場合があり、この場合には、内部状態を使用して、パケットロスをカバーするために信号の継続または外挿をもたらすことが可能である。さまざまな信号タイプに関していくつかのオペレーティングモードを有するマルチモードコーデックに関しては、隠蔽を取り扱うためのいくつかのＰＬＣテクノロジーがある場合が多い。フレームエラー隠蔽（ＦＥＣ）、フレームロス隠蔽（ＦＬＣ）、およびエラー隠蔽ユニット（ＥＣＵ）を含む、パケットロス隠蔽技術に使用される多くの異なる用語がある。

線形予測（ＬＰ）ベースの音声コーディングモードに関しては、ＰＬＣは、推定されたフレーム末尾のピッチ情報と、前のフレームのピッチサイクルの複製とを使用した声門パルス位置の調整に基づくことが可能である［１］。長期予測子（ＬＴＰ）のゲインは、連続した失われたフレームの数と、最後の良好な、すなわちエラーのないフレームの安定性とに応じたスピードでゼロへ収束する［２］。周波数ドメイン（ＦＤ）ベースのコーディングモードは、音楽などの一般的なまたは複雑な信号を取り扱うように設計されている。最後の受信されたフレームの特徴に応じて、さまざまな技術が使用されることが可能である。そのような分析は、検知された音色成分の数と、信号の周期性とを含むことが可能である。活発な発話または単一の楽器の音楽などの高度に周期的な信号中にフレームロスが生じる場合には、ＬＰベースのＰＬＣに類似した時間ドメインＰＬＣが適している可能性がある。このケースにおいては、ＦＤＰＬＣは、最後の受信されたフレームに基づいてＬＰパラメータおよび励起信号を推定することによってＬＰデコーダを模倣することが可能である［２］。失われたフレームが、非周期的なまたはノイズのような信号中に生じるケースにおいては、最後の受信されたフレームは、スペクトルドメインにおいて繰り返されることが可能であり、この場合、繰り返される信号の金属音を低減するために、係数どうしが掛け合わされてランダムサイン信号となる。定常的な音色信号に関しては、検知された音色成分の予測および外挿に基づくアプローチを使用することが有利であるとわかっている。上述の技術に関するさらなる詳細については、［１］［２］［３］において見出すことが可能である。

周波数ドメインにおいて機能する一般的なエラー隠蔽方法が、位相ＥＣＵ（エラー隠蔽ユニット）である［４］。位相ＥＣＵは、以前にデコードされ再構築された時間ドメイン信号のバッファ上で機能するスタンドアロンのツールである。位相ＥＣＵのフレームワークは、正弦波分析および合成パラダイムに基づく。この方法においては、最後の良好なフレームの正弦波成分が抽出されて位相シフトされることが可能である。フレームが失われた場合には、過去のデコードされた合成からＤＦＴ（離散フーリエ変換）ドメインにおいて正弦波周波数が取得される。最初に、マグニチュードスペクトル平面のピークを見出すことによって、対応する周波数ビンが識別される。次いで、ピーク周波数ビンを使用して、それらのピークの分数周波数が推定される。隣り合うピークとともにそれらのピークに対応する周波数ビンは、分数周波数を使用して位相シフトされる。フレームの残りに関しては、位相がランダム化されている間、過去の合成の大きさが保持される。バーストエラーも、推定された信号が、それをゼロへ収束させることによってスムーズにミュートされるように取り扱われる。位相ＥＣＵについてのさらなる詳細に関しては、［４］において見出すことが可能である。

位相ＥＣＵのコンセプトは、周波数ドメインにおいて動作するデコーダにおいて使用されることが可能である。このコンセプトは、図１において示されているような、周波数ドメインにおいてデコーディングを実行するエンコーディング／デコーディングシステムと、図２において示されているようなさらなる周波数ドメイン処理を用いて時間ドメインデコーディングを実行するデコーダも含む。図１においては、時間ドメイン入力オーディオ信号（サブ）フレームが、１００でウィンドウ処理され、ＤＦＴ１０１によって周波数ドメインへ変換される。エンコーダ１０２が、周波数ドメインにおいてエンコーディングを実行し、送信１０３のためのエンコードされたパラメータを提供する。デコーダ１０４が、受信されたフレームをデコードするか、またはフレームロスのケースにおいてＰＬＣ１０９を適用する。隠蔽フレームの構築において、ＰＬＣは、以前にデコードされたフレームのメモリ１０８を使用することが可能である。デコードされたまたは隠蔽されたフレームは、逆ＤＦＴ１１０によって時間ドメインへ変換され、出力オーディオ信号は次いで、オーバーラップ加算演算１１１によって再構築される。図２は、エンコーダとデコーダとのペアを示しており、この場合、デコーダは、周波数ドメイン処理を容易にするためにＤＦＴ変換を適用する。受信されてデコードされた時間ドメイン信号は、最初に１０５で（サブ）フレームごとにウィンドウ処理され、次いで周波数ドメイン処理１０７のためにＤＦＴ１０６によって周波数ドメインへ変換され、周波数ドメイン処理１０７は、（フレームロスのケースにおける）ＰＬＣ１０９の前または後のいずれかに行われることが可能である。

それぞれのフレームに関して周波数ドメインスペクトルが既に生成されているので、最後のデコードされたスペクトルをメモリに単に格納することによって、位相ＥＣＵのための原材料が容易に取得されることが可能である。しかしながら、デコードされたスペクトルどうしが、別々のウィンドウ処理関数を伴う時間ドメイン信号のフレームどうしに対応する場合には（図１を参照）、アルゴリズムの効率が低減される可能性がある。これが発生する可能性があるのは、デコーダが、たとえば、より高い時間分解能を必要とする過渡音を取り扱うために、合成フレームをより短いサブフレームへと分割する場合である。良好な結果を達成するためには、ＥＣＵは、それぞれのフレームに関して望ましいウィンドウ形状を生成するべきであり、さもないと、それぞれのフレーム境界に遷移アーチファクトがある可能性がある。１つのソリューションは、特定のウィンドウに対応するそれぞれのフレームのスペクトルを格納し、それらに個々にＥＣＵを適用することである。別のソリューションは、ＥＣＵに関する単一のスペクトルを格納し、時間ドメインにおいてウィンドウ処理を補正することであり得る。これは、逆のウィンドウを適用してから、望ましい形状を有するウィンドウを再適用することによって実施されることが可能である。これらのソリューションは、以降で論じられているいくつかの欠点を有する。

周波数ドメインＥＣＵを個々のサブフレーム上に適用することに伴う１つの欠点は、失われたフレーム中にそれぞれのサブフレームに関して複製されることになるサブフレームどうしの間に違いがある場合があるということである。連続したフレームロスに関しては、これは、繰り返すアーチファクトにつながる場合がある。なぜなら、それぞれのサブフレームが、わずかに異なるスペクトルシグネチャを有する場合があるからである。別の問題は、メモリ要件が増大されるということである。なぜなら、それぞれのサブフレームのスペクトルが格納される必要があるからである。

ウィンドウ処理が逆にされて再適用されるウィンドウ是正ソリューションは、別々のスペクトルシグネチャの問題を克服する。なぜなら、ＥＣＵは、単一のサブフレームに基づくことが可能であるからである。しかしながら、逆にされたウィンドウを適用してから新たなウィンドウを適用することは、それぞれのサンプルに関する除算および乗算を含み、この場合、除算は、計算の面で複雑な演算であり、計算の面で費用がかかる。このソリューションは、事前に算出された是正ウィンドウをメモリに格納することによって改善されることが可能であるが、これは、必要とされるテーブルメモリを増大させることになる。ＥＣＵがスペクトルの下位部分上に適用されるケースにおいては、フルスペクトルが是正されることをさらに必要とする場合がある。なぜなら、フルスペクトルは、同じウィンドウ形状を有する必要があるからである。

第１の態様によれば、デコーディングデバイスにおいてオーディオ信号の隠蔽オーディオサブフレームを生成するための方法が示される。この方法は、サブフレームベースで周波数スペクトルを生成することであって、オーディオ信号の連続したサブフレームが、それらの連続したサブフレームのうちの第１のサブフレームの適用されたウィンドウ形状がそれらの連続したサブフレームのうちの第２のサブフレームのミラーリングされたバージョンまたは時間反転されたバージョンであるという特性を有する、周波数スペクトルを生成することを含む。この方法はさらに、以前に受信されたオーディオ信号の信号スペクトルのピークを分数周波数スケールで検知することと、ピークのうちのそれぞれの位相を推定することと、時間反転された位相調整を施されたピークを形成するために、推定された位相に基づいて信号スペクトルのピークに適用するための時間反転された位相調整を導出することとを含む。この方法はさらに、時間反転を隠蔽オーディオサブフレームに適用することを含む。

提供される潜在的な利点は、反転時間合成を適用することによって単一のサブフレームスペクトルからマルチサブフレームＥＣＵが生成されるということである。この生成は、サブフレームウィンドウどうしが互いの時間反転されたバージョンであるケースに適している場合がある。単一の格納されているデコードされたフレームからすべてのＥＣＵフレームを生成することは、メモリフットプリントおよび計算の面での複雑さを最小に保ちながら、サブフレームどうしが同様のスペクトルシグネチャを有することを確実にする。

第２の態様によれば、オーディオ信号の隠蔽オーディオサブフレームを生成するように設定されているデコーダデバイスが示される。このデコーダデバイスは、サブフレームベースで周波数スペクトルを生成することであって、オーディオ信号の連続したサブフレームが、それらの連続したサブフレームのうちの第１のサブフレームの適用されたウィンドウ形状がそれらの連続したサブフレームのうちの第２のサブフレームのミラーリングされたバージョンまたは時間反転されたバージョンであるという特性を有する、周波数スペクトルを生成することを行うように設定されている。このデコーダデバイスはさらに、以前に受信されたオーディオ信号の信号スペクトルのピークを分数周波数スケールで検知するように、およびピークのうちのそれぞれの位相を推定するように設定されている。このデコーダデバイスはさらに、推定された位相に基づいて信号スペクトルのピークに適用するための時間反転された位相調整を導出するように、および時間反転された位相調整を信号スペクトルのピークに適用することによって、時間反転された位相調整を施されたピークを形成するように設定されている。このデコーダデバイスはさらに、時間反転を隠蔽オーディオサブフレームに適用するように設定されている。

第３の態様によれば、コンピュータプログラムが提供される。このコンピュータプログラムは、通信ネットワークにおいて動作するように設定されているデコーダデバイスの処理回路によって実行されることになるプログラムコードを含み、それによってそのプログラムコードの実行は、第１の態様によるオペレーションをデコーダデバイスに実行させる。

第４の態様によれば、コンピュータプログラム製品が提供される。このコンピュータプログラム製品は、通信ネットワークにおいて動作するように設定されているデコーダデバイスの処理回路によって実行されることになるプログラムコードを含む非一時的ストレージメディアを含み、それによってそのプログラムコードの実行は、第１の態様によるオペレーションをデコーダデバイスに実行させる。

第５の態様によれば、デコーディングデバイスにおいてオーディオ信号に関する隠蔽オーディオサブフレームを生成するための方法が提供される。この方法は、サブフレームベースで周波数スペクトルを生成することであって、オーディオ信号の連続したサブフレームが、それらの連続したサブフレームのうちの第１のサブフレームの適用されたウィンドウ形状がそれらの連続したサブフレームのうちの第２のサブフレームのミラーリングされたバージョンまたは時間反転されたバージョンであるという特性を有する、周波数スペクトルを生成することを含む。第１の２つの連続したサブフレームのうちの第２のサブフレームに対応する信号スペクトルが格納される。この方法はさらに、第２の２つの連続したサブフレームに関する不良フレームインジケータを受信することを含む。この方法はさらに、信号スペクトルを取得することと、信号スペクトルのピークを分数周波数スケールで検知することと、ピークのうちのそれぞれの位相を推定することと、推定された位相に基づいて、第２の２つの連続したサブフレームのうちの第１のサブフレームに関して格納されているスペクトルのピークに適用するための時間反転された位相調整を導出することとを含む。この方法はさらに、時間反転された位相調整を信号スペクトルのピークに適用して、時間反転された位相調整を施されたピークを形成することを含む。この方法はさらに、時間反転を隠蔽オーディオサブフレームに適用することと、時間反転された位相調整を施されたピークを信号スペクトルのノイズスペクトルと組み合わせて、第２の２つの連続したサブフレームのうちの第１のサブフレームに関する組み合わされたスペクトルを形成することと、組み合わされたスペクトルに基づいて、合成された隠蔽オーディオサブフレームを生成することとを含む。

第６の態様によれば、オーディオ信号の隠蔽オーディオサブフレームを生成するように設定されているデコーダデバイスが示される。このデコーダデバイスは、処理回路と、その処理回路と動作可能に結合されているメモリであって、命令を含み、その命令が、処理回路によって実行されたときに、第１または第５の態様によるオペレーションをデコーダデバイスに実行させる、メモリとを含む。

第７の態様によれば、デコーダデバイスが提供される。このデコーダデバイスは、オーディオ信号の隠蔽オーディオサブフレームを生成するように設定されており、このデコーダデバイスは、第５の態様による方法を実行するように適合されている。

第８の態様によれば、コンピュータプログラムが提供される。このコンピュータプログラムは、通信ネットワークにおいて動作するように設定されているデコーダデバイスの処理回路によって実行されることになるプログラムコードを含み、それによってそのプログラムコードの実行は、第５の態様によるオペレーションをデコーダデバイスに実行させる。

第９の態様によれば、コンピュータプログラム製品が提供される。このコンピュータプログラム製品は、通信ネットワークにおいて動作するように設定されているデコーダデバイスの処理回路によって実行されることになるプログラムコードを含む非一時的ストレージメディアを含み、それによってそのプログラムコードの実行は、第５の態様によるオペレーションをデコーダデバイスに実行させる。

本開示のさらなる理解を提供するために含まれ、本出願に組み込まれ、その一部を構成する添付の図面は、特定の非限定的な実施形態を示している。

エンコーダとデコーダとのペアを示すブロック図であり、この場合、エンコーディングはＤＦＴドメインで行われる。エンコーダとデコーダとのペアを示すブロック図であり、この場合、デコーダは、周波数ドメイン処理を容易にするためにＤＦＴ変換を適用する。デコーダの２つのサブフレームウィンドウの図であり、この場合、第２のサブフレーム上に適用されたウィンドウは、第１のサブフレーム上に適用されたウィンドウの時間反転されたまたはミラーリングされたバージョンである。いくつかの実施形態による、位相推定を実行し、時間反転位相計算機を使用して反転時間でＥＣＵ合成を適用するＰＬＣ方法を含むエンコーダ／デコーダシステムを示すブロック図である。いくつかの実施形態による、時間反転ＥＣＵ合成を実行するデコーダデバイスのオペレーションを示すフローチャートである。いくつかの実施形態による、正弦波上の時間反転ウィンドウの図である。いくつかの実施形態による、反転時間ウィンドウが複素平面におけるＤＦＴ係数にどのように影響を与えるかの図である。いくつかの実施形態によるφ_ε対周波数ｆの図である。いくつかの実施形態によるデコーダデバイスを示すブロック図である。いくつかの実施形態によるデコーダデバイスのオペレーションを示すフローチャートである。いくつかの実施形態によるデコーダデバイスのオペレーションを示すフローチャートである。

次いで本開示の態様が、以降で添付の図面を参照しながら、より完全に記述され、添付の図面においては、実施形態の例が示されている。しかしながら、実施形態は、多くの異なる形態で具体化されることが可能であり、本明細書において示されている実施形態に限定されるものとして解釈されるべきではない。むしろ、これらの実施形態は、本開示が徹底的で完全なものになるように、およびこれらの実施形態の範囲を当業者に完全に伝えることになるように提供されている。これらの実施形態は相互に排他的ではないということにも留意されたい。一実施形態からの構成要素は、別の実施形態において存在する／使用されると暗黙のうちに想定されることが可能である。

以降の記述は、開示されている主題のさまざまな実施形態を提示している。これらの実施形態は、教示上の例として提示されており、開示されている主題の範囲を限定するものとして解釈されるべきではない。たとえば、記述されている実施形態の特定の詳細は、記述されている主題の範囲から逸脱することなく、修正されること、省略されること、または拡張されることが可能である。

図９は、実施形態による、無線通信を提供するように設定されているデコーダデバイス９００（これは、モバイル端末、モバイル通信端末、無線通信デバイス、無線端末、無線通信端末、ユーザ機器（ＵＥ）、ユーザ機器ノード／端末／デバイスなどの一部であることが可能である）の要素を示すブロック図である。示されているように、デコーダ９００は、その他のデバイス／エンティティー／機能などとの通信を提供するように設定されているネットワークインターフェース回路９０６（ネットワークインターフェースとも呼ばれる）を含むことが可能である。デコーダ９００は、ネットワークインターフェース回路９０６に動作可能に結合されているプロセッサ回路９０２（プロセッサとも呼ばれる）と、プロセッサ回路に動作可能に結合されているメモリ回路９０４（メモリとも呼ばれる）とを含むことも可能である。メモリ回路９０４は、コンピュータ可読プログラムコードを含むことが可能であり、そのコンピュータ可読プログラムコードは、プロセッサ回路９０２によって実行されたときに、本明細書において開示されている実施形態によるオペレーションをプロセッサ回路に実行させる。

その他の実施形態によれば、プロセッサ回路９０２は、メモリを含むように規定されることが可能であり、それによって、別個のメモリ回路は必要とされない。本明細書において論じられているように、デコーダ９００のオペレーションは、プロセッサ９０２および／またはネットワークインターフェース９０６によって実行されることが可能である。たとえば、プロセッサ９０２は、マルチチャネルオーディオプレーヤへ通信を送信するように、および／またはエンコーダノード、デポジトリサーバ等などの１つもしくは複数のその他のネットワークノード／エンティティー／サーバからネットワークインターフェース９０６を通じて通信を受信するようにネットワークインターフェース９０６を制御することが可能である。その上、モジュールがメモリ９０４に格納されることが可能であり、これらのモジュールは、命令を提供することが可能であり、それによって、モジュールの命令がプロセッサ９０２によって実行されたときに、プロセッサ９０２は、それぞれのオペレーションを実行する。

以降に続く記述においては、実施形態を記述するためにサブフレーム表記が使用されることになる。ここで、サブフレームとは、より大きなフレームの一部を意味し、この場合、より大きなフレームは、サブフレームのセットから構成されている。記述されている実施形態は、フレーム表記を伴って使用されることも可能である。言い換えれば、サブフレームは、本明細書において記述されているのと同じウィンドウ形状を有するフレームのグループを形成することが可能であり、サブフレームは、より大きなフレームの一部である必要はない。

デコーディング方法がサブフレームベースで周波数スペクトルを生成する場合のエンコーダとデコーダとのペアのうちのデコーダを考えていただきたい。連続したサブフレームは、図３において示されているように、適用されたウィンドウ形状が互いのミラーリングされたまたは時間反転されたバージョンであるという特性を有する場合があり、この場合、サブフレーム２は、サブフレーム１のミラーリングされたまたは時間反転されたバージョンである。デコーダは、それぞれのフレームｍに関して、再構築されたサブフレーム

のスペクトルを取得する。ある実施形態においては、サブフレームスペクトルは、再構築された時間ドメイン合成

から取得されることが可能であり、この場合、ｎはサンプルインデックスである。図２における破線の枠は、周波数ドメイン処理がメモリおよびＰＬＣモジュールの前または後のいずれかに行われることが可能であるということを示している。サブフレームウィンドウ処理関数ｗ_１（ｎ）およびｗ_２（ｎ）を用いて

に乗算を行い、

に従ってＤＦＴ変換を適用することによって、スペクトルが取得されることが可能であり、この場合、Ｎは、サブフレームウィンドウの長さを示し、Ｎ_{ｓｔｅｐ１２}は、第１および第２のサブフレームの始点間のサンプルどうしにおける距離である。サブフレームウィンドウ処理関数ｗ_１（ｎ）およびｗ_２（ｎ）は、互いのミラーリングされたまたは時間反転されたバージョンである。ここで、サブフレームスペクトルは、図２において概説されているシステムと同様に、デコーダ時間ドメイン合成から取得される。それらの実施形態は、図１において概説されているように、デコーダが直接サブフレームスペクトルを再構築するシステムに関して等しく適用可能であるということに留意されたい。それぞれの正しく受信されデコードされたオーディオフレームｍに関して、第２のサブフレーム

に対応するスペクトルがメモリに格納される。

正しく受信されたフレームに関して、デコーダデバイス９００は、周波数ドメイン処理ステップを実行することを進めて、逆ＤＦＴ変換を実行し、オーバーラップ加算戦略を使用して出力オーディオを再構築することが可能である。欠落しているまたは破損したフレームは、接続を取り扱うトランスポートレイヤによって識別されることが可能であり、フラグの形式であることが可能である不良フレームインジケータ（ＢＦＩ）を通じて「不良フレーム」としてデコーダへシグナリングされる。デコーダデバイス９００が、不良フレームインジケータ（ＢＦＩ）を通じて不良フレームを検知した場合には、ＰＬＣアルゴリズムがアクティブ化される。ＰＬＣは位相ＥＣＵの原理に従う［４］。格納されたスペクトル

は、ピークを分数周波数スケールで検知するピーク検知器アルゴリズムへ入力される。ピークのセット
F={f_i},i=1,2,…N_peaks
が検知されることが可能であり、それらは、それらの推定された分数周波数ｆ_ｉによって表され、この場合、Ｎ_{ｐｅａｋｓ}は、検知されたピークの数である。正弦波コーディングパラダイムと同様に、スペクトルのピークは、特定の振幅、周波数、および位相を伴う正弦波を用いてモデル化される。分数周波数は、ＤＦＴビンの分数として表されることが可能であり、それによって、たとえばナイキスト周波数は、ｆ＝Ｎ／２＋１で見出される。それぞれのピークは、そのピークを表す周波数ビンの数に関連付けられることが可能である。これらは、

のように、分数周波数を最も近い整数に丸めて、隣り合うビン、たとえば、それぞれの側のＮ_ｎｅａｒ個のピークを含めることによって見出され、この場合、［・］は、丸め演算を表し、Ｇ_ｉは、周波数ｆ_ｉでのピークを表すビンのグループである。Ｎ_ｎｅａｒという数は、システムを設計する際に特定されることが可能である調整定数である。より大きなＮ_ｎｅａｒは、それぞれのピーク表示におけるさらに高い精度を提供するが、モデル化されることが可能であるピークどうしの間におけるさらに大きな距離ももたらす。Ｎ_ｎｅａｒに関する適切な値は、１または２である場合がある。隠蔽スペクトル

のピークは、ビンのこれらのグループを使用することによって形成されることが可能であり、この場合、それぞれのグループに位相調整が適用されている。位相調整は、最後の正しく受信されデコードされたフレームと隠蔽フレームとの間において周波数が同じままであると想定して、基礎をなす正弦波における位相での変化を考慮する。位相調整は、前のフレームの分析フレームと、現在のフレームが開始するであろう場所との間における分数周波数およびサンプル数に基づく。図３において示されているように、このサンプル数は、最後の受信されたフレームの第２のサブフレームの始まりと、第１のＥＣＵフレームの第１のサブフレームの始まりとの間におけるＮ_{ｓｔｅｐ２１}、および最後の受信されたフレームの第１のサブフレームと、第１のＥＣＵフレームの第１のサブフレームとの間におけるＮ_ｆｕｌｌである。Ｎ_ｆｕｌｌはまた、最後の受信されたフレームの第２のサブフレームと、第１のＥＣＵフレームの第２のサブフレームとの間における距離を与えるということに留意されたい。

図４は、以降で記述されている実施形態による、ＰＬＣブロック１０９が位相推定器１１２を使用して位相推定を実行し、時間反転位相計算機１１３を使用して反転時間でＥＣＵ合成を適用するエンコーダ／デコーダシステムを示している。

図５は、以降で記述されている時間反転ＥＣＵ合成のステップを示すフローチャートである。第１のサブフレームの隠蔽のために、ＥＣＵ合成が反転時間で行われて、望ましいウィンドウ形状を取得することが可能である。ピークｉに関する第１のサブフレームに関する位相調整、または位相補正または位相進行（これらの用語は、この記述の全体を通じて言い換え可能に使用される）は、
Δφ_i=-2φ_i-2πf_i (N+N_step21+(N_lost-1)N_full)/N
として書かれることが可能であり、この場合、Ｎ_ｌｏｓｔは、連続した失われたフレームの数を示し、φ_ｉは、周波数ｆ_ｉでの正弦波の位相を示す。（Ｎ_ｌｏｓｔ－１）Ｎ_ｆｕｌｌという項は、バーストエラーに関する位相進行を取り扱い、この場合、ステップは、フルフレームのフレーム長Ｎ_ｆｕｌｌでインクリメントされる。第１の失われたフレームに関しては、Ｎ_ｌｏｓｔ＝１である。スペクトル

の周波数ビンを中心とする周波数に関しては、位相φ_ｉは、単に角度

を抽出することによって容易に利用可能であり、この場合、ｋ_ｉ＝［ｆ_ｉ］である。

一般には、周波数ｆ_ｉは分数であり、オペレーション５０１において位相が推定される必要がある。１つの推定方法は、位相スペクトルの線形補間を使用することである。

この場合、

は、それぞれ切り捨ておよび切り上げのための演算子を表す。しかしながら、この推定方法は不安定であることが判明した。この推定方法はさらに、２相抽出を必要とし、これは、ａ＋ｂｉという標準形式での複素数を用いてスペクトルが表されるケースにおいて、計算の面で複雑なａｒｃｔａｎ関数を必要とする。計算の面での比較的低い複雑さで信頼できると判明した別の位相推定は、

f_frac=f_i-k_i
であり、この場合、ｆ_ｆｒａｃは丸め誤差であり、φ_Ｃは、適用されるウィンドウ形状に依存する調整定数である。この実施形態のウィンドウ形状に関しては、適切な値はφ_Ｃ＝０．３３であると判明した。別のウィンドウ形状に関しては、適切な値はφ_Ｃ＝０．４８であると判明した。一般には、適切な値は［０．１，０．７］の範囲で見つかることが可能であると予想される。
オペレーション５０２において、時間反転された位相調整Δφ_ｉが、上で説明されているように導出される。

隠蔽スペクトルのピークは、オペレーション５０３において、格納されているスペクトルに位相調整を適用することによって形成されることが可能である。

アスタリスク「＊」は、複素共役を示し、これは、オペレーション５０４において信号の時間反転を与える。これは、第１のＥＣＵサブフレームの時間反転をもたらす。逆ＤＦＴの後に時間ドメインにおいて反転を実行することが可能である場合もあるということに留意されたい。しかしながら、

が完全なスペクトルの一部を表すだけである場合、これは、残りのスペクトルが、たとえばＤＦＴ分析の前に時間反転によって前処理されることを必要とする。

ピークビンＧ_ｉによって占められていない

の残りのビンは、ノイズスペクトルまたはスペクトルのノイズ成分と呼ばれる場合がある。それらは、ランダムな位相が適用されている状態の格納されているスペクトルの係数を使用して投入されることが可能であり、

この場合、φ_ｒａｎｄはランダムな位相の値を示す。残りのビンは、信号の望ましい特性、たとえばマルチチャネルデコーダシステムにおける第２のチャネルとの相関を保持するスペクトル係数を用いて投入されることも可能である。オペレーション５０５において、ピークスペクトル

（この場合、ｋ∈Ｇ_ｉ）が、ノイズスペクトル

（この場合、

）と組み合わされて、組み合わされたスペクトルを形成する。

ノイズが時間ドメインにおいて生成されて、ウィンドウ処理され変換される実施形態においては、ピーク成分のウィンドウ処理およびピークスペクトルとの組合せを一致させるためのノイズの時間反転が、上述されている時間反転を適用する前に実行されるべきである。

通常の（反転されていない）時間で合成される第２のサブフレームの生成に関しては、普通の位相調整が使用されることが可能である。
Δφ_i=2πf_iN_fullN_lost/N

第２のサブフレームに関するＥＣＵ合成は、第１のサブフレームと同様に形成されることが可能であるが、ピーク係数についての複素共役を省略している。

組み合わされた隠蔽スペクトルがオペレーション５０５において生成されると、組み合わされた隠蔽スペクトルは、逆ＤＦＴと、出力オーディオ信号をもたらすオーバーラップ加算演算とを含む、オペレーション５０６における後続の処理ステップへ供給されることが可能である。

出力オーディオ信号は、再生のためにラウドスピーカーなどの１つまたは複数のスピーカーへ送信されることが可能である。それらのスピーカーは、デコーディングデバイスの一部であること、別個のデバイス、または別のデバイスの一部であることが可能である。

時間反転ＥＣＵ合成のための位相補正式の導出
正弦波成分の開始位相がφ_０であり、正弦波の周波数がｆであると想定されたい。Ｎ_ｓｔｅｐ個のサンプルだけ進んだ後の正弦波の望ましい位相φ_１は、下記のとおりである。
φ₁=φ₀+2πfN_step/N

正弦波の時間反転された継続に関しては、複素共役を適用することによって、または単に負の位相－φ_１を取ることによって、位相が実軸においてミラーリングされる必要がある。この位相角は、現在ではＥＣＵ合成フレームの終点を表すので、望ましい開始位相φ_２に達するためには、位相が分析フレームの長さだけ巻き戻される必要がある。
φ₂=-φ₁-2πf(N-1)/N

位相補正Δφを取得するためには、開始位相が差し引かれる必要があり、すなわち、下記のとおりである。
φ₀+Δφ=φ₂⇒Δφ=φ₂-φ₀

φ_２を置き換えると、下記が与えられる。
Δφ=-2φ₀-2πf(N_step+N-1)/N

連続したフレームロス（バーストロス）に関する数列を付加するために、フルフレームどうしの始点の間におけるサンプルの数に対応する係数が付加されることが可能である、Ｎ_{ｏｆｆｓｅｔ}＝（Ｎ_ｌｏｓｔ－１）Ｎ_ｆｕｌｌ。これは、最終的な位相補正を提供する。
Δφ=-2φ₀-2πf(N+N_step-1+(N_lost-1)N_full)/N,

複素共役を１サンプルの循環シフトとともに使用することによって、望ましい時間反転がＤＦＴドメインにおいて達成されることが可能である。この循環シフトは、最終的な位相補正に含まれ得る２πｋ／Ｎの位相補正を伴って実施されることが可能である。
Δφ=-2φ₀-2πf(N+N_step-1+(N_lost-1)N_full)/N+2πk/N

単一のピークを表す係数に関しては、循環シフトの周波数ビンｋは、分数周波数ｋ≒ｆで近似されることが可能であり、位相補正は、下記へ簡略化されることが可能である。
Δφ=-2φ₀-2πf(N+N_step-1+(N_lost-1)N_full)/N+2πf/N=
-2φ₀-2πf(N+N_step+(N_lost-1)N_full)/N

ウィンドウは、Ｎ＝Ｎ_ｆｕｌｌであるように設計されることが可能であり、そのケースにおいては、式は、下記へさらに簡略化されることが可能である。
Δφ=-2φ₀-2πf(N_step+N_lost・N)/N

反転時間ＥＣＵ合成の代替実施形態
別の実施形態においては、位相補正は、２つのステップで行われる。位相は、第１のステップにおいて、ウィンドウの不一致を無視して進められる。

第２のステップにおいて、位相を－φ_ｍだけ戻し、複素共役を適用し、φ_ｍで位相を復元することによって、ウィンドウ処理の時間反転が達成されることが可能である。

このオペレーションに関する動機は、図６において示されているような正弦波上での時間反転ウィンドウの影響を調べることによって見出されることが可能である。図６においては、上段のプロットは、第１の方向に適用されたウィンドウを示しており、下段のプロットは、反対の方向に適用されたウィンドウを示している。正弦波を表す３つの係数が、図７において示されており、これは、反転時間ウィンドウが複素平面におけるＤＦＴ係数にどのように影響を与えるかを示している。図６の上段のプロットにおける正弦波に近似する３つのＤＦＴ係数は、円でマークされており、その一方で、図６の下段のプロットの対応する係数は、星でマークされている。ひし形は、正弦波の元の位相の位置を示しており、破線は、時間反転ウィンドウの係数が投影される際に経由する観測されるミラーリング平面を示している。時間反転ウィンドウは、角度φ_ｍでのミラーリング平面における係数のミラーリングを提供する。
φ_m=φ₀+φ_frac

実験を通じて、φ_ｆｒａｃは、下記のように表されることが可能であるということが判明した。
φ_frac=πf_frac
f_frac=f_i-k_i
k_i=[f_i]
この場合、［・］は、丸め演算を示す。正の角度として表されるφ_εは、ｆ_ｆｒａｃとの線形関係によって近似されることが可能であるということも判明した。図８においては、角度φ_εは、周波数ｆの関数として表されている。図８のノコギリ歯形状を観察すると、φ_εの良好な近似値は、下記のとおりであると判明した。
φ_ε=-f_fracφ_C
この場合、φ_Ｃは定数である。一実施形態においては、φ_Ｃは、φ_Ｃ＝０．３３に設定されることが可能であり、これは、ごく近い近似値を生み出す。φ_０は、明示的には知られていないので、φ_ｍの交互近似が、下記のように書かれることが可能である。

この場合、

は、最初の位相調整ステップの後の丸められた周波数ビンｋ_ｉで見出された最大ピーク係数の位相である。

ミラーリング平面を実軸と位置合わせし、複素共役を適用し、位相を再び戻すオペレーションは、成形された正弦波の位相を、複素共役に対して中立である位相位置（０またはπ）に調整し、それによって、信号の時間的形状を反転させるだけですむこととして理解されることが可能である。２つのステップのアプローチは、前に記述されている実施形態よりも計算の面で複雑である。しかしながら観測は、φ_０の近似値につながる可能性もある。φ_０は下記のように表されることが可能であるということが図７から理解されることが可能である。

これは、上で使用されている位相近似である。

次いで、いくつかの実施形態に従って、図１０のフローチャートを参照しながら、（図９のブロック図の構造を使用して実施される）デコーダデバイス９００のオペレーションが論じられる。たとえば、モジュールは、図９のメモリ９０４に格納されることが可能であり、これらのモジュールは、命令を提供することが可能であり、それによって、モジュールの命令がそれぞれのデコーダデバイス処理回路９０２によって実行されたときに、処理回路９０２は、フローチャートのそれぞれのオペレーションを実行する。

オペレーション１０００において、処理回路９０２は、サブフレームベースで周波数スペクトルを生成し、このとき、オーディオ信号の連続したサブフレームは、それらの連続したサブフレームのうちの第１のサブフレームの適用されたウィンドウ形状がそれらの連続したサブフレームのうちの第２のサブフレームのミラーリングされたバージョンまたは時間反転されたバージョンであるという特性を有する。たとえば、第１の２つの連続したサブフレームのそれぞれのサブフレームに関する周波数スペクトルを生成することは、下記を特定することを含む。

この場合、Ｎは、サブフレームウィンドウの長さを示し、サブフレームウィンドウ処理関数ｗ_１（ｎ）は、連続したサブフレームのうちの第１のサブフレーム

に関するサブフレームウィンドウ処理関数であり、ｗ_２（ｎ）は、連続したサブフレームのうちの第２のサブフレーム

に関するサブフレームウィンドウ処理関数であり、Ｎ_{ｓｔｅｐ１２}は、第１の２つの連続したサブフレームのうちの第１のサブフレームと、第１の２つの連続したサブフレームのうちの第２のサブフレームとの間におけるサンプル数である。

オペレーション１００２において、処理回路９０２は、不良フレームインジケータ（ＢＦＩ）が受信されているかどうかを特定する。不良フレームインジケータは、オーディオフレームが失われているまたは破損しているという表示を提供する。

オペレーション１００４において、処理回路９０２は、それぞれの正しくデコードされたオーディオフレームに関して、第２のサブフレームに対応するスペクトルをメモリに格納する。たとえば、正しくデコードされたフレームｍに関して、第２のサブフレーム

に対応するスペクトルは、

など、メモリに格納される。正しく受信されたフレームに関して、デコーダデバイス９００は、上述され図４において示されているように、周波数ドメイン処理ステップを実行することを進めて、逆ＤＦＴ変換を実行し、オーバーラップ加算戦略を使用して出力オーディオを再構築することが可能である。オーバーラップ加算の原理は、サブフレームおよびフレームの両方に関して同じであるということに留意されたい。フレームの作成は、サブフレーム上にオーバーラップ加算を適用することを必要とし、その一方で最終的な出力フレームは、フレームどうしの間におけるオーバーラップ加算演算の結果である。

処理回路９０２が、オペレーション１００２において不良フレームインジケータ（ＢＦＩ）を通じて不良フレームを検知した場合には、ＰＬＣオペレーション１００６～１０３０が実行される。

オペレーション１００６において、処理回路９０２は、以前に正しくデコードされ処理された第１の２つの連続したサブフレームのうちの第２のサブフレームに対応する信号スペクトルを取得する。たとえば、処理回路９０２は、デコーディングデバイスのメモリ９０４から信号スペクトルを取得することが可能である。

オペレーション１００８において、処理回路９０２は、オーディオ信号の以前に受信されたオーディオフレームの信号スペクトルのピークを分数周波数スケールで検知し、以前に受信されたそのオーディオフレームは、不良フレームインジケータを受信する前に受信された。

オペレーション１０１０において、処理回路９０２は、隠蔽フレームが２つの連続したサブフレームのうちの第１のサブフレーム用であるかどうかを特定する。

隠蔽フレームが第１のサブフレーム用である場合には、オペレーション１０１２において、処理回路９０２は、ピークのうちのそれぞれの位相を推定する。一実施形態においては、下記に従って、時間反転された位相補正を施されたピークのピークに関する位相推定を計算する。

この場合、φ_ｉは、周波数ｆ_ｉでの推定された位相であり、

は、周波数ビンｋ_ｉでのスペクトル

の角度であり、ｆ_ｆｒａｃは丸め誤差であり、φ_Ｃは調整定数であり、ｋ_ｉは［ｆ_ｉ］である。調整定数φ_Ｃは、０．１と０．７との間における範囲の値であることが可能である。

オペレーション１０１４において、処理回路９０２は、推定された位相に基づいて信号スペクトルのピークに適用するための時間反転された位相補正を導出する。

オペレーション１０１６において、処理回路９０２は、時間反転された位相補正を信号スペクトルのピークに適用して、時間反転された位相補正を施されたピークを形成する。

オペレーション１０１８において、処理回路９０２は、時間反転を隠蔽オーディオサブフレームに適用する。一実施形態においては、時間反転は、複素共役を隠蔽オーディオサブフレームに適用することによって適用されることが可能である。

オペレーション１０２０において、処理回路９０２は、時間反転された位相補正を施されたピークを信号スペクトルのノイズスペクトルと組み合わせて、隠蔽オーディオサブフレームの組み合わされたスペクトルを形成する。

図１１に目を向けると、一実施形態においては、１０１６および１０１８は、オペレーション１１００において処理回路９０２がそれぞれのピークを複数のピーク周波数ビンに関連付けることによって実行されることが可能である。関連付けを行う処理回路９０２は、オペレーション１１０２において、時間反転された位相補正をそれらの複数の周波数ビンのそれぞれに適用することによって、時間反転された位相補正を適用することが可能である。オペレーション１１０４において、ランダムな位相が適用されている状態の信号スペクトルの係数を使用して、残りのビンが投入される。

図１０へ戻ると、オペレーション１０２２において、処理回路９０２は、組み合わされたスペクトルに基づいて、合成された隠蔽オーディオサブフレームを生成する。

隠蔽フレームが、オペレーション１０１０において特定された際に第１のサブフレーム用ではない場合には、処理回路９０２は、少なくとも２つの連続した隠蔽サブフレームのうちの第２の隠蔽サブフレームに関する信号スペクトルのピークに適用するための時間反転されていない位相補正をオペレーション１０２４において導出する。

オペレーション１０２６において、処理回路９０２は、時間反転されていない位相補正を第２のサブフレームに関する信号スペクトルのピークに適用して、時間反転されていない位相補正を施されたピークを形成する。

オペレーション１０２８において、処理回路９０２は、時間反転されていない位相補正を施されたピークを信号スペクトルのノイズスペクトルと組み合わせて、第２の隠蔽サブフレームに関する組み合わされたスペクトルを形成する。

オペレーション１０３０において、処理回路９０２は、組み合わされたスペクトルに基づいて第２の合成された隠蔽オーディオサブフレームを生成する。

図１１に目を向けると、一実施形態においては、１０２６および１０２８は、オペレーション１１００において処理回路９０２がそれぞれのピークを複数のピーク周波数ビンに関連付けることによって実行されることが可能である。関連付けを行う処理回路９０２は、オペレーション１１０２において、時間反転されていない位相補正をそれらの複数の周波数ビンのそれぞれに適用することによって、時間反転されていない位相補正を適用することが可能である。オペレーション１１０４において、ランダムな位相が適用されている状態の信号スペクトルの係数を使用して、残りのビンが投入される。

図１０のフローチャートからのさまざまなオペレーションは、デコーダデバイスおよび関連した方法のいくつかの実施形態に関しては任意選択であることが可能である。（以降に示されている）例示的な実施形態１の方法に関しては、たとえば、図１０のブロック１００４および１０２２～１０３０のオペレーションは任意選択であることが可能である。（以降に示されている）例示的な実施形態１９の方法に関しては、たとえば、図１０のブロック１０１０および１０２２～１０３０のオペレーションは任意選択であることが可能である。

例示的な実施形態が、以降で論じられている。

１．デコーディングデバイスにおいてオーディオ信号の隠蔽オーディオサブフレームを生成する方法であって、
サブフレームベースで周波数スペクトルを生成すること（１０００）であって、オーディオ信号の連続したサブフレームが、それらの連続したサブフレームのうちの第１のサブフレームの適用されたウィンドウ形状がそれらの連続したサブフレームのうちの第２のサブフレームのミラーリングされたバージョンまたは時間反転されたバージョンであるという特性を有する、周波数スペクトルを生成すること（１０００）と、
不良フレームインジケータを受信すること（１００２）と、
オーディオ信号の以前に受信されたオーディオフレームの信号スペクトルのピークを分数周波数スケールで検知すること（１００８）であって、以前に受信されたそのオーディオフレームが、不良フレームインジケータを受信する前に受信された、分数周波数スケールで検知すること（１００８）と、
ピークのうちのそれぞれの位相を推定すること（１０１２）と、
推定された位相に基づいて信号スペクトルのピークに適用するための時間反転された位相補正を導出すること（１０１４）と、
時間反転された位相補正を信号スペクトルのピークに適用して、時間反転された位相補正を施されたピークを形成すること（１０１６）と、
時間反転を隠蔽オーディオサブフレームに適用すること（１０１８）と、
時間反転された位相補正を施されたピークを信号スペクトルのノイズスペクトルと組み合わせて、隠蔽オーディオサブフレームに関する組み合わされたスペクトルを形成すること（１０２０）と、
組み合わされたスペクトルに基づいて、合成された隠蔽オーディオサブフレームを生成すること（１０２２）とを含む方法。

２．合成された隠蔽オーディオフレームが、少なくとも２つの連続した隠蔽サブフレームを含み、時間反転された位相補正を導出すること、時間反転された位相補正を適用すること、時間反転を適用すること、および時間反転された位相補正を施されたピークを組み合わせることが、少なくとも２つの連続した隠蔽サブフレームのうちの第１の隠蔽サブフレームに関して実行され、この方法がさらに、
少なくとも２つの連続した隠蔽サブフレームのうちの第２の隠蔽サブフレームに関する信号スペクトルのピークに適用するための時間反転されていない位相補正を導出すること（１０２４）と、
時間反転されていない位相補正を第２のサブフレームに関する信号スペクトルのピークに適用して、時間反転されていない位相補正を施されたピークを形成すること（１０２６）と、
時間反転されていない位相補正を施されたピークを信号スペクトルのノイズスペクトルと組み合わせて、第２の隠蔽サブフレームに関する組み合わされたスペクトルを形成すること（１０２８）と、
組み合わされたスペクトルに基づいて第２の合成された隠蔽オーディオサブフレームを生成すること（１０３０）とを含む、実施形態１の方法。

３．隠蔽オーディオサブフレームが、失われたオーディオフレームおよび破損したオーディオフレームのうちの一方に関する隠蔽オーディオサブフレームを含む、実施形態１または２の方法。

４．不良フレームインジケータが、オーディオフレームが失われているかまたは破損しているという表示を提供する、実施形態１から３のいずれか１つの方法。

５．以前に受信されたオーディオ信号フレームの信号スペクトルをデコーダのメモリから取得することをさらに含む、実施形態１から４のいずれか１つの方法。

６．時間反転を適用することが、隠蔽オーディオサブフレームに複素共役を適用することを含む、実施形態１から５のいずれか１つの方法。

７．複数のピークのうちのそれぞれのピークを、ピークを表す複数のピーク周波数ビンに関連付けること（１１００）
をさらに含む、実施形態１から６のいずれか１つの方法。

８．複数のピークのうちのそれぞれのピークに関して、時間反転された位相補正および時間反転されていない位相補正のうちの一方がピークに適用される（１１０２）、実施形態７の方法。

９．ランダムな位相が適用されている状態の格納されている信号スペクトルの係数を使用して信号スペクトルの残りのビンを投入すること（１１０４）
をさらに含む、実施形態８のいずれか１つの方法。

１０．ピークのうちのそれぞれの位相を推定することが、
下記に従って、時間反転された位相補正を施されたピークのピークに関する位相推定を計算することを含み、

この場合、φ_ｉが、周波数ｆ_ｉでの推定された位相であり、

が、周波数ビンｋ_ｉでのスペクトル

の角度であり、ｆ_ｆｒａｃが丸め誤差であり、φ_Ｃが調整定数であり、ｋ_ｉが［ｆ_ｉ］である、実施形態１から９のいずれか１つの方法。

１１． φ_Ｃが、０．１と０．７との間における範囲の値を有する、実施形態１０の方法。

１２．時間反転されていない位相補正を施されたピークに関する位相推定を計算することが、下記に従って計算され、
Δφ_i=2πf_iN_fullN_lost/N
この場合、Δφ_ｉが、周波数ｆ_ｉでの正弦波の位相補正を示し、Ｎ_ｆｕｌｌが、２つのフレームの間におけるサンプル数を示し、Ｎ_ｌｏｓｔが、連続した失われたフレームの数を示し、Ｎが、サブフレームウィンドウの長さを示す、実施形態１０の方法。

１３．ランダムな位相を信号スペクトルのノイズスペクトルに適用することをさらに含む、実施形態１から１２のいずれか１つの方法。

１４．ランダムな位相をノイズスペクトルに適用することが、時間反転されていない位相調整を施されたピークをノイズスペクトルと組み合わせる前にランダムな位相をノイズスペクトルに適用することを含む、実施形態１３の方法。

１５．受信されたオーディオ信号の隠蔽オーディオサブフレームを生成するように設定されているデコーダデバイス（９００）であって、デコーディングデバイスのデコーディング方法が、サブフレームベースで周波数スペクトルを生成し、この場合、連続したサブフレームどうしが、適用されたウィンドウ形状が互いのミラーリングされたバージョンまたは時間反転されたバージョンであるという特性を有し、このデコーダデバイスが、
処理回路（９０２）と、
その処理回路と結合されているメモリ（９０４）であって、命令を含み、それらの命令が、処理回路によって実行されたときに、実施形態１から１４のいずれか１つによるオペレーションをデコーダデバイスに実行させる、メモリ（９０４）とを含むデコーダデバイス（９００）。

１６．受信されたオーディオ信号の隠蔽オーディオサブフレームを生成するように設定されているデコーダデバイス（９００）であって、デコーディングデバイスのデコーディング方法が、サブフレームベースで周波数スペクトルを生成し、この場合、連続したサブフレームどうしが、適用されたウィンドウ形状が互いのミラーリングされたバージョンまたは時間反転されたバージョンであるという特性を有し、このデコーダデバイスが、実施形態１から１４のいずれか１つに従って実行するように適合されているデコーダデバイス（９００）。

１７．通信ネットワークにおいて動作するように設定されているデコーダデバイス（９００）の処理回路（９０２）によって実行されることになるプログラムコードを含むコンピュータプログラムであって、それによってそのプログラムコードの実行が、実施形態１から１４のいずれか１つによるオペレーションをデコーダデバイス（９００）に実行させる、コンピュータプログラム。

１８．通信ネットワークにおいて動作するように設定されているデコーダデバイス（９００）の処理回路（９０２）によって実行されることになるプログラムコードを含む非一時的ストレージメディアを含むコンピュータプログラム製品であって、それによってそのプログラムコードの実行が、実施形態１から１４のいずれか１つによるオペレーションをデコーダデバイス（９００）に実行させる、コンピュータプログラム製品。

１９．デコーディングデバイスにおいてオーディオ信号に関する隠蔽オーディオサブフレームを生成する方法であって、
サブフレームベースで周波数スペクトルを生成すること（１０００）であって、オーディオ信号の連続したサブフレームが、それらの連続したサブフレームのうちの第１のサブフレームの適用されたウィンドウ形状がそれらの連続したサブフレームのうちの第２のサブフレームのミラーリングされたバージョンまたは時間反転されたバージョンであるという特性を有する、周波数スペクトルを生成すること（１０００）と、
第１の２つの連続したサブフレームのうちの第２のサブフレームに対応する信号スペクトルを格納すること（１００４）と、
第２の２つの連続したサブフレームに関する不良フレームインジケータを受信すること（１００２）と、
信号スペクトルを取得すること（１００６）と、
信号スペクトルのピークを分数周波数スケールで検知すること（１００８）と、
ピークのうちのそれぞれの位相を推定すること（１０１２）と、
推定された位相に基づいて、第２の２つの連続したサブフレームのうちの第１のサブフレームに関して格納されているスペクトルのピークに適用するための時間反転された位相補正を導出すること（１０１４）と、
時間反転された位相補正を信号スペクトルのピークに適用して、時間反転された位相補正を施されたピークを形成すること（１０１６）と、
時間反転を隠蔽オーディオサブフレームに適用すること（１０１８）と、
時間反転された位相補正を施されたピークを信号スペクトルのノイズスペクトルと組み合わせて、第２の２つの連続したサブフレームのうちの第１のサブフレームに関する組み合わされたスペクトルを形成すること（１０２０）と、
組み合わされたスペクトルに基づいて、合成された隠蔽オーディオサブフレームを生成すること（１０２２）とを含む方法。

２０．合成された隠蔽オーディオフレームが、少なくとも２つの連続した隠蔽サブフレームを含み、時間反転された位相補正を導出すること、時間反転された位相補正を適用すること、および時間反転された位相補正を施されたピークを組み合わせることが、少なくとも２つの連続した隠蔽サブフレームのうちの第１の隠蔽サブフレームに関して実行され、この方法がさらに、
第２の２つの連続したサブフレームのうちの第２のサブフレームに関する信号スペクトルのピークに適用するための時間反転されていない位相補正を導出すること（１０２４）と、
時間反転されていない位相補正を第２の２つの連続したサブフレームのうちの第２のサブフレームに関する信号スペクトルのピークに適用して、時間反転されていない位相補正を施されたピークを形成すること（１０２６）と、
時間反転されていないオーディオサブフレームを信号スペクトルのノイズスペクトルと組み合わせて、第２の２つの連続したサブフレームのうちの第２のサブフレームに関する第２の組み合わされたスペクトルを形成すること（１０２８）と、
第２の組み合わされたスペクトルに基づいて第２の合成されたオーディオサブフレームを生成すること（１０３０）とを含む、実施形態１９の方法。

２１．隠蔽オーディオサブフレームが、失われたオーディオフレームおよび破損したオーディオフレームのうちの一方に関する隠蔽オーディオサブフレームを含む、実施形態１９または２０の方法。

２２．不良フレームインジケータが、オーディオフレームが失われているかまたは破損しているという表示を提供する、実施形態１９から２１のいずれか１つの方法。

２３．信号スペクトルをデコーダのメモリから取得することをさらに含む、実施形態１９から２２のいずれか１つの方法。

２４．時間反転を適用することが、隠蔽オーディオサブフレームに複素共役を適用することを含む、実施形態１９から２３のいずれか１つの方法。

２５．それぞれのピークを、ピークを表す複数のピーク周波数ビンに関連付けること
をさらに含む、実施形態１８から２４のいずれか１つの方法。

２６．複数のピークのうちのそれぞれのピークに関して、時間反転された位相補正および時間反転されていない位相補正のうちの一方をピークに適用することをさらに含む、実施形態２５の方法。

２７．ランダムな位相が適用されている状態の格納されているスペクトルの係数を使用して信号スペクトルの残りのビンを投入すること
をさらに含む、実施形態２６のいずれか１つの方法。

２８．位相を推定することが、
下記に従って、時間反転された位相補正を施されたピークに関する位相推定を計算することを含み、

f_frac=f_i-k_i
この場合、φ_ｉが、周波数ｆ_ｉでの推定された位相であり、

が、周波数ｆ_ｉでのスペクトル

の角度であり、ｆ_ｆｒａｃが丸め誤差であり、φ_Ｃが調整定数であり、ｋ_ｉが［ｆ_ｉ］である、実施形態１９から２７のいずれか１つの方法。

２９． φ_Ｃが、０．１と０．７との間における範囲の値を有する、実施形態２８の方法。

３０．時間反転されていない位相補正を施されたピークに関する位相推定を下記に従って計算することをさらに含み、
Δφ_i=2πf_iN_fullN_lost/N
この場合、Δφ_ｉが、周波数ｆ_ｉでの正弦波の位相補正を示し、Ｎ_ｆｕｌｌが、２つのフレームの間におけるフレームサンプル数を示し、Ｎ_ｌｏｓｔが、連続した失われたフレームの数を示し、Ｎが、サブフレームウィンドウの長さを示す、実施形態２８の方法。

３１．第１の２つの連続したサブフレームのそれぞれのサブフレームに関する周波数スペクトルを生成することが、下記を特定することを含み、

この場合、Ｎが、サブフレームウィンドウの長さを示し、サブフレームウィンドウ処理関数ｗ_１（ｎ）が、連続したサブフレームのうちの第１のサブフレーム

に関するサブフレームウィンドウ処理関数であり、ｗ_２（ｎ）が、連続したサブフレームのうちの第２のサブフレーム

に関するサブフレームウィンドウ処理関数であり、Ｎ_{ｓｔｅｐ１２}が、第１の２つの連続したサブフレームのうちの第１のサブフレームと、第１の２つの連続したサブフレームのうちの第２のサブフレームとの間におけるサンプル数である、実施形態１９から３０のいずれか１つの方法。

３２．ランダムな位相を信号スペクトルのノイズスペクトルに適用することをさらに含む、実施形態１９から３１のいずれか１つの方法。

３３．ランダムな位相をノイズスペクトルに適用することが、時間反転されていない位相調整を施されたピークをノイズスペクトルと組み合わせる前にランダムな位相をノイズスペクトルに適用することを含む、実施形態３２の方法。

３４．受信されたオーディオ信号の隠蔽オーディオサブフレームを生成するように設定されているデコーダデバイス（９００）であって、デコーディングデバイスのデコーディング方法が、サブフレームベースで周波数スペクトルを生成し、この場合、連続したサブフレームどうしが、適用されたウィンドウ形状が互いのミラーリングされたバージョンまたは時間反転されたバージョンであるという特性を有し、このデコーダデバイスが、
処理回路（９０２）と、
その処理回路と結合されているメモリ（９０４）であって、命令を含み、それらの命令が、処理回路によって実行されたときに、実施形態１９から３３のいずれか１つによるオペレーションをデコーダデバイスに実行させる、メモリ（９０４）とを含むデコーダデバイス（９００）。

３５．受信されたオーディオ信号の隠蔽オーディオサブフレームを生成するように設定されているデコーダデバイス（９００）であって、デコーディングデバイス（９００）のデコーディング方法が、サブフレームベースで周波数スペクトルを生成し、この場合、連続したサブフレームどうしが、適用されたウィンドウ形状が互いのミラーリングされたバージョンまたは時間反転されたバージョンであるという特性を有し、このデコーダデバイスが、実施形態１９から３３のいずれか１つに従って実行するように適合されているデコーダデバイス（９００）。

３６．通信ネットワークにおいて動作するように設定されているデコーダデバイス（９００）の処理回路（９０２）によって実行されることになるプログラムコードを含むコンピュータプログラムであって、それによってそのプログラムコードの実行が、実施形態１９から３３のいずれか１つによるオペレーションをデコーダデバイス（９００）に実行させる、コンピュータプログラム。

３７．通信ネットワークにおいて動作するように設定されているデコーダデバイス（９００）の処理回路（９０２）によって実行されることになるプログラムコードを含む非一時的ストレージメディアを含むコンピュータプログラム製品であって、それによってそのプログラムコードの実行が、実施形態１９から３３のいずれか１つによるオペレーションをデコーダデバイス（９００）に実行させる、コンピュータプログラム製品。

本開示において使用されているさまざまな略語／頭字語に関して、以降に説明が提供されている。
略語説明
ＤＦＴ離散フーリエ変換
ＩＤＦＴ逆離散フーリエ変換
ＬＰ線形予測
ＰＬＣパケットロス隠蔽
ＥＣＵエラー隠蔽ユニット
ＦＥＣフレームエラー補正／隠蔽

参考文献は、下記のとおり明らかにされている。
[1] T. Vaillancourt, M. Jelinek, R. Salami and R. Lefebvre, "Efficient Frame Erasure Concealment in Predictive Speech Codecs using Glottal Pulse Resynchronisation," 2007 IEEE International Conference on Acoustics, Speech and Signal Processing - ICASSP '07, Honolulu, HI, 2007, pp. IV-1113-IV-1116.
[2] J. Lecomte et al., "Packet-loss concealment technology advances in EVS," 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brisbane, QLD, 2015, pp. 5708-5712.
[3] 3GPP TS 26.447, Codec for Enhanced Voice Services (EVS); Error Concealment of Lost Packets (Release 12)
[4] S. Bruhn, E. Norvell, J. Svedberg and S. Sverrisson, "A novel sinusoidal approach to audio signal frame loss concealment and its application in the new evs codec standard," 2015 IEEE International Conference on Acoustics, Speech and Signal Processing (ICASSP), Brisbane, QLD, 2015, pp. 5142-5146.

一般に、本明細書において使用されているすべての用語は、関連する技術分野におけるそれらの通常の意味に従って解釈されるべきである（ただし、異なる意味が明確に与えられている場合、および／またはその用語が使用されている文脈から暗示されている場合は除く）。要素、装置、コンポーネント、手段、ステップなどへのすべての言及は、別段の明示がない限り、要素、装置、コンポーネント、手段、ステップなどの少なくとも１つの例に言及するものとしてオープンに解釈されるべきである。本明細書において開示されているいずれの方法のステップも、開示されている厳密な順序で実行される必要はない（ただし、あるステップが別のステップに後続または先行するものとして明示的に記述されている場合、および／または、あるステップが別のステップに後続または先行しなければならないということが黙示的である場合は除く）。本明細書において開示されている実施形態のうちのいずれかのいずれの特徴も、適切な場合は常に、任意のその他の実施形態に適用されることが可能である。同様に、それらの実施形態のうちのいずれかのいずれの利点も、任意のその他の実施形態に当てはまることが可能であり、その逆もまた同様である。含まれている実施形態のその他の目的、特徴、および利点は、以降の記述から明らかであろう。

さまざまな実施形態の上述の記述においては、本明細書において使用されている用語は、特定の実施形態を記述するという目的のためのものにすぎず、限定的であることを意図されているものではないということを理解されたい。別段の規定がなされていない限り、本明細書において使用されている（技術用語および科学用語を含む）すべての用語は、本開示が属する技術分野における標準的な技術者によって一般的に理解されるのと同じ意味を有する。一般に使用されている辞書において規定されている用語などの用語は、本明細書および関連する技術分野のコンテキストにおけるそれらの用語の意味と矛盾しない意味を有するものと解釈されるべきであり、理想化された意味または過度に正式な意味に解釈されることはない（ただし、そのような規定が本明細書において明確になされている場合は除く）ということがさらに理解されるであろう。

ある要素が、別の要素に「接続されている」、「結合されている」、「応答している」、またはそれらの変形であると言及されている場合には、その要素は、存在している可能性のあるその他の要素または介在する要素に直接接続されていること、結合されていること、または応答していることが可能である。対照的に、ある要素が、別の要素に「直接接続されている」、「直接結合されている」、「直接応答している」、またはそれらの変形であると言及されている場合には、存在している介在する要素はない。同様の数字は、全体を通じて同様の要素を指す。さらに、本明細書において使用されている「結合されている」、「接続されている」、「応答している」、またはそれらの変形は、無線で結合されていること、接続されていること、または応答していることを含むことが可能である。本明細書において使用される際には、単数形の「ａ」、「ａｎ」、および「ｔｈｅ」は、複数形も含むことを意図されている（ただし、そうではないことを文脈が明らかに示している場合は除く）。よく知られている機能または構造は、簡潔さおよび／または明確さのために詳細には記述されていない場合がある。「および／または」という用語は、関連付けられている列挙されたアイテムのうちの１つまたは複数のありとあらゆる組合せを含む。

第１、第２、第３などの用語が、さまざまな要素／オペレーションを記述するために本明細書において使用されている場合があるが、これらの要素／オペレーションは、これらの用語によって限定されるべきではないということが理解されるであろう。これらの用語は、１つの要素／オペレーションを別の要素／オペレーションから区別するために使用されているにすぎない。したがって、いくつかの実施形態における第１の要素／オペレーションは、本開示の教示から逸脱することなく、その他の実施形態における第２の要素／オペレーションと呼ばれることが可能である。同じ参照番号または同じ参照指定子は、本明細書の全体を通じて同じまたは同様の要素を示す。

本明細書において使用される際には、「ｃｏｍｐｒｉｓｅ」、「ｃｏｍｐｒｉｓｉｎｇ」、「ｃｏｍｐｒｉｓｅｓ」、「ｉｎｃｌｕｄｅ」、「ｉｎｃｌｕｄｉｎｇ」、「ｉｎｃｌｕｄｅｓ」、「ｈａｖｅ」、「ｈａｓ」、「ｈａｖｉｎｇ」という用語、またはそれらの変形は、オープンエンドであり、１つまたは複数の述べられている特徴、完全体、要素、ステップ、コンポーネント、または機能を含むが、１つまたは複数のその他の特徴、完全体、要素、ステップ、コンポーネント、機能、またはそれらのグループの存在または追加を除外するものではない。さらに、本明細書において使用される際には、ラテン語のフレーズ「ｅｘｅｍｐｌｉｇｒａｔｉａ」に由来する一般的な略語「ｅ．ｇ．」は、前述されているアイテムの一般的な１つまたは複数の例を紹介または指定するために使用されることが可能であり、そのようなアイテムの限定であることを意図されているものではない。ラテン語のフレーズ「ｉｄｅｓｔ」に由来する一般的な略語「ｉ．ｅ．」は、より全般的な列挙から特定のアイテムを指定するために使用されることが可能である。

本明細書においては、コンピュータ実施方法、装置（システムおよび／もしくはデバイス）、ならびに／またはコンピュータプログラム製品のブロック図および／またはフローチャート図を参照しながら、例示的な実施形態が記述されている。ブロック図および／またはフローチャート図のブロック、ならびにブロック図および／またはフローチャート図におけるブロックの組合せは、１つまたは複数のコンピュータ回路によって実行されるコンピュータプログラム命令によって実施されることが可能であるということが理解される。これらのコンピュータプログラム命令は、汎用コンピュータ回路、専用コンピュータ回路、および／またはその他のプログラム可能なデータ処理回路のプロセッサ回路に提供されて、マシンを生み出すことが可能であり、それによって、コンピュータおよび／またはその他のプログラム可能なデータ処理装置のプロセッサを介して実行する命令が、トランジスタ、メモリロケーションに格納されている値、およびそのような回路内のその他のハードウェアコンポーネントを変換および制御して、ブロック図および／または１つもしくは複数のフローチャートブロックにおいて指定されている機能／行為を実施し、そしてそれによって、ブロック図および／またはフローチャートブロックにおいて指定されている機能／行為を実施するための手段（機能性）および／または構造を作成する。

これらのコンピュータプログラム命令は、特定の様式で機能するようにコンピュータまたはその他のプログラム可能なデータ処理装置に指示することができる有形のコンピュータ可読メディアに格納されることも可能であり、それによって、そのコンピュータ可読メディアに格納されているそれらの命令は、ブロック図および／または１つもしくは複数のフローチャートブロックにおいて指定されている機能／行為を実施する命令を含む製品を生み出す。したがって本開示の実施形態は、ハードウェアで、および／または、デジタル信号プロセッサなどのプロセッサ上で稼働するソフトウェア（ファームウェア、常駐ソフトウェア、マイクロコードなどを含む）で具体化されることが可能であり、これらは、まとめて「回路」、「モジュール」、またはそれらの変形と呼ばれる場合がある。

いくつかの代替実施態様においては、ブロックにおいて記載されている機能／行為が、フローチャートにおいて記載されている順序から外れて発生する場合があるということにも留意されたい。たとえば、連続して示されている２つのブロックは、実際には実質的に同時に実行されることが可能であり、またはそれらのブロックは、含まれている機能性／行為に応じて、場合によっては反対の順序で実行されることが可能である。その上、フローチャートおよび／もしくはブロック図の所与のブロックの機能性は、複数のブロックへと分離されることが可能であり、ならびに／またはフローチャートおよび／もしくはブロック図の２つ以上のブロックの機能性は、少なくとも部分的に統合されることが可能である。最後に、実施形態の範囲から逸脱することなく、示されているブロックどうしの間にその他のブロックが付加／挿入されることが可能であり、および／またはブロック／オペレーションが省略されることが可能である。その上、図のうちのいくつかは、通信の主要な方向を示すために通信パス上に矢印を含むが、示されている矢印とは反対の方向に通信が発生することが可能であるということを理解されたい。

本開示の原理から実質的に逸脱することなく、実施形態に対して多くの変形および修正が行われることが可能である。すべてのそのような変形および修正は、本明細書においては本開示の範囲内に含まれることを意図されている。したがって、上で開示されている主題は、限定的ではなく例示的であるとみなされるべきであり、実施形態の例は、本開示の趣旨および範囲内に収まるすべてのそのような修正、強化、およびその他の実施形態をカバーすることを意図されている。それゆえに、法律によって認められる最大の範囲まで、本開示の範囲は、実施形態およびそれらの均等物の例を含む本開示の最も広い許容可能な解釈によって特定されるべきであり、前述の詳細な記述によって制限または限定されることはない。

Claims

デコーディングデバイスにおいてオーディオ信号の隠蔽オーディオサブフレームを生成する方法であって、
前記オーディオ信号の連続したサブフレームが、前記連続したサブフレームのうちの第１のサブフレームの適用されたウィンドウ形状が前記連続したサブフレームのうちの第２のサブフレームのミラーリングされたバージョンまたは時間反転されたバージョンであるという特性を有するとき、サブフレームベースで周波数スペクトルを生成すること（１０００）と、
以前に受信されたオーディオ信号の信号スペクトルのピークを分数周波数スケールで検知すること（１００８）と、
前記ピークのうちのそれぞれの位相を推定すること（１０１２）と、
推定された前記位相に基づいて前記信号スペクトルの前記ピークに適用するための時間反転された位相調整を導出すること（１０１４）と、
前記時間反転された位相調整を前記信号スペクトルの前記ピークに適用して、時間反転された位相調整を施されたピークを形成すること（１０１６）と、
時間反転を前記隠蔽オーディオサブフレームに適用すること（１０１８）とを含む方法。
前記時間反転された位相調整を施されたピークを前記信号スペクトルのノイズスペクトルと組み合わせて、前記隠蔽オーディオサブフレームに関する組み合わされたスペクトルを形成すること（１０２０）と、
前記組み合わされたスペクトルに基づいて、合成された隠蔽オーディオサブフレームを生成すること（１０２２）と
をさらに含む、請求項１に記載の方法。
合成された隠蔽オーディオフレームが、少なくとも２つの連続した隠蔽サブフレームを含み、前記時間反転された位相調整を導出すること、前記時間反転された位相調整を適用すること、前記時間反転を適用すること、および前記時間反転された位相調整を施されたピークを組み合わせることが、前記少なくとも２つの連続した隠蔽サブフレームのうちの第１の隠蔽サブフレームに関して実行され、前記方法がさらに、
前記少なくとも２つの連続した隠蔽サブフレームのうちの第２の隠蔽サブフレームに関する前記信号スペクトルの前記ピークに適用するための時間反転されていない位相調整を導出すること（１０２４）と、
前記時間反転されていない位相調整を前記第２のサブフレームに関する前記信号スペクトルの前記ピークに適用して、時間反転されていない位相調整を施されたピークを形成すること（１０２６）と、
前記時間反転されていない位相調整を施されたピークを前記信号スペクトルのノイズスペクトルと組み合わせて、前記第２の隠蔽サブフレームに関する組み合わされたスペクトルを形成すること（１０２８）と、
前記組み合わされたスペクトルに基づいて第２の合成された隠蔽オーディオサブフレームを生成すること（１０３０）とを含む、請求項１または２に記載の方法。
前記以前に受信されたオーディオ信号の前記信号スペクトルを前記デコーディングデバイスのメモリから取得すること（１００６）をさらに含む、請求項１から３のいずれか一項に記載の方法。
前記時間反転を適用することが、前記時間反転された位相調整を施されたピークに複素共役を適用することを含む、請求項１から４のいずれか一項に記載の方法。
検知された前記ピークのうちのそれぞれのピークを、前記ピークを表す複数のピーク周波数ビンに関連付けること（１１００）をさらに含む、請求項１から５のいずれか一項に記載の方法。
前記複数のピーク周波数ビンのうちのそれぞれのピーク周波数ビンに関して、前記時間反転された位相調整および時間反転されていない前記位相調整のうちの一方が前記ピーク周波数ビンに適用される（１１０２）、請求項６に記載の方法。
格納されている前記信号スペクトルの係数を使用して前記信号スペクトルの残りのビンを投入すること（１１０４）であって、前記スペクトル係数が前記信号の望ましい特性を保持する、残りのビンを投入すること（１１０４）
をさらに含む、請求項７に記載の方法。
前記望ましい特性が、マルチチャネルデコーダシステムにおける第２のチャネルとの相関を含む、請求項８に記載の方法。
前記ピークのうちのそれぞれの前記位相を推定することが、
下記に従って、前記時間反転された位相調整を施されたピークの前記ピークに関する位相推定を計算することを含み、

f_frac=f_i-k_i

この場合、φ_ｉが、周波数ｆ_ｉでの推定された位相であり、

が、周波数ビンｋ_ｉでのスペクトル

の角度であり、ｆ_ｆｒａｃが丸め誤差であり、φ_Ｃが調整定数であり、ｋ_ｉが［ｆ_ｉ］である、請求項１から９のいずれか一項に記載の方法。
時間反転された前記隠蔽オーディオサブフレームの前記ピークに関する位相調整Δφが、
Δφ=-2φ ₀ -2πf(N _step +N _lost ・N)/N
に従って計算され、この場合、φ ₀ はピークの位相であり、fはピークの周波数であり、N _lost は連続した失われたフレームの数を示し、Nはサブフレームの長さを示し、N _step は分析サブフレームと隠蔽サブフレームの始点間のサンプルどうしにおける距離である、請求項１０に記載の方法。
オーディオ信号の隠蔽オーディオサブフレームを生成するように設定されているデコーダデバイス（９００）であって、
前記オーディオ信号の連続したサブフレームが、前記連続したサブフレームのうちの第１のサブフレームの適用されたウィンドウ形状が前記連続したサブフレームのうちの第２のサブフレームのミラーリングされたバージョンまたは時間反転されたバージョンであるという特性を有するとき、サブフレームベースで周波数スペクトルを生成することと、
以前に受信されたオーディオ信号の信号スペクトルのピークを分数周波数スケールで検知することと、
前記ピークのうちのそれぞれの位相を推定することと、
推定された前記位相に基づいて前記信号スペクトルの前記ピークに適用するための時間反転された位相調整を導出することと、
前記時間反転された位相調整を前記信号スペクトルの前記ピークに適用して、時間反転された位相調整を施されたピークを形成することと、
時間反転を前記隠蔽オーディオサブフレームに適用することとを行うように適合されているデコーダデバイス（９００）。
前記時間反転された位相調整を施されたピークを前記信号スペクトルのノイズスペクトルと組み合わせて、前記隠蔽オーディオサブフレームに関する組み合わされたスペクトルを形成することと、
前記組み合わされたスペクトルに基づいて、合成された隠蔽オーディオサブフレームを生成することと
を行うようにさらに適合されている、請求項１２に記載のデコーダデバイス。
合成された隠蔽オーディオフレームが、少なくとも２つの連続した隠蔽サブフレームを含み、前記時間反転された位相調整を導出すること、前記時間反転された位相調整を適用すること、前記時間反転を適用すること、および前記時間反転された位相調整を施されたピークを組み合わせることが、前記少なくとも２つの連続した隠蔽サブフレームのうちの第１の隠蔽サブフレームに関して実行され、前記デコーダデバイスがさらに、
前記少なくとも２つの連続した隠蔽サブフレームのうちの第２の隠蔽サブフレームに関する前記信号スペクトルの前記ピークに適用するための時間反転されていない位相調整を導出することと、
前記時間反転されていない位相調整を前記第２のサブフレームに関する前記信号スペクトルの前記ピークに適用して、時間反転されていない位相調整を施されたピークを形成することと、
前記時間反転されていない位相調整を施されたピークを前記信号スペクトルのノイズスペクトルと組み合わせて、前記第２の隠蔽サブフレームに関する組み合わされたスペクトルを形成することと、
前記組み合わされたスペクトルに基づいて第２の合成された隠蔽オーディオサブフレームを生成することとを行うように適合されている、請求項１２または１３に記載のデコーダデバイス。
前記以前に受信されたオーディオ信号の前記信号スペクトルを前記デコーダデバイスのメモリから取得するようにさらに適合されている、請求項１２から１４のいずれか一項に記載のデコーダデバイス。
前記時間反転された位相調整を施されたピークに複素共役を適用することによって前記時間反転を適用するように適合されている、請求項１２から１５のいずれか一項に記載のデコーダデバイス。
検知された前記ピークのうちのそれぞれのピークを、前記ピークを表す複数のピーク周波数ビンに関連付けるようにさらに適合されている、請求項１２から１６のいずれか一項に記載のデコーダデバイス。
前記時間反転された位相調整および時間反転されていない前記位相調整のうちの一方を前記複数のピーク周波数ビンのうちのそれぞれのピーク周波数ビンに適用するようにさらに適合されている、請求項１７に記載のデコーダデバイス。
格納されている前記信号スペクトルの係数を使用して前記信号スペクトルの残りのビンを投入することであって、前記スペクトル係数が前記信号の望ましい特性を保持する、残りのビンを投入すること
を行うようにさらに適合されている、請求項１８に記載のデコーダデバイス。
前記望ましい特性が、マルチチャネルデコーダシステムにおける第２のチャネルとの相関を含む、請求項１９に記載のデコーダデバイス。
下記に従って、前記時間反転された位相調整を施されたピークの前記ピークに関する位相推定を計算することによって前記ピークのうちのそれぞれの前記位相を推定するように適合されており、

f_frac=f_i-k_i

この場合、φ_ｉが、周波数ｆ_ｉでの推定された位相であり、

が、周波数ビンｋ_ｉでのスペクトル

の角度であり、ｆ_ｆｒａｃが丸め誤差であり、φ_Ｃが調整定数であり、ｋ_ｉが［ｆ_ｉ］である、請求項１２から２０のいずれか一項に記載のデコーダデバイス。
時間反転された前記隠蔽オーディオサブフレームの前記ピークに関する位相調整Δφを
Δφ=-2φ ₀ -2πf(N _step +N _lost ・N)/N
に従って計算するように適合されており、この場合、φ ₀ はピークの位相であり、fはピークの周波数であり、N _lost は連続した失われたフレームの数を示し、Nはサブフレームの長さを示し、N _step は分析サブフレームと隠蔽サブフレームの始点間のサンプルどうしにおける距離である、請求項２１に記載のデコーダデバイス。