JP6490715B2

JP6490715B2 - フレーム喪失隠蔽のための方法、受信エンティティ、及びコンピュータプログラム

Info

Publication number: JP6490715B2
Application number: JP2016567382A
Authority: JP
Inventors: ステファンブルーン，
Original assignee: テレフオンアクチーボラゲットエルエムエリクソン（パブル）
Priority date: 2014-06-13
Filing date: 2015-06-08
Publication date: 2019-03-27
Anticipated expiration: 2035-06-08
Also published as: EP3664086A1; JP6983950B2; JP2020166286A; CN111312261A; US20160284356A1; MX2018015154A; MX361844B; JP6714741B2; SG10201801910SA; EP3367380B1; EP3367380A1; EP3664086B1; WO2015190985A1; US11100936B2; CN111292755B; US20230368802A1; US10529341B2; US20200118573A1; BR112016027898B1; BR112016027898A8

Description

本開示は、音声符号化、及び、伝送誤りの場合に喪失した、消去された又は劣化した信号についての置換としての受信機における代理信号の生成に関する。ここで説明される技術は、コーデックとデコーダとの少なくともいずれかの一部でありうるが、復号器の後の信号改善モジュールにおいて実装されてもよい。本技術は、受信機における利益を伴って用いられうる。

特に、ここで提示される実施形態は、フレーム喪失の隠蔽に関し、具体的には、フレーム喪失の隠蔽のための方法、受信エンティティ、コンピュータプログラム、及びコンピュータプログラムプロダクトに関する。

多くの現代の通信システムは、フレームにおいて会話及び音声信号を送信し、これは、送信側が、まず、例えば送信パケットにおける論理ユニットとしてその後に符号化されると共に送信される例えば２０〜４０ｍｓの短いセグメント又はフレームを構成することを意味する。受信機は、これらのユニットのそれぞれを復号して、その後に再構成された信号サンプルの連続する系列として出力される、対応する信号フレームを再構成する。符号化の前には、一般に、マイクからの会話又は音声信号を音声サンプルの系列に変換するアナログ−デジタル（Ａ／Ｄ）変換がある。逆に、受信の最後では、スピーカ再生のために再構成されたデジタル信号サンプルの系列を時間的に連続するアナログ信号へ変換する最終的なデジタル−アナログ（Ｄ／Ａ）変換がある。

しかしながら、任意のこのような会話及び音声信号のための伝送システムは、伝送誤りを被りうる。これは、１つまたは数個の伝送されたフレームが受信機において再構成のために利用可能でないという状況を引き起こしうる。その場合、復号器は、消去された、すなわち利用可能でないフレームのそれぞれについて、代理信号を生成する必要がある。これは、受信機側の信号復号器の、いわゆるフレーム喪失又は誤り隠蔽部において行われる。フレーム喪失隠蔽の目的は、フレーム喪失を可能な限り聞き取れないようにし、したがって、再構成された信号品質におけるフレーム喪失の影響を可能な限り軽減することである。

音声に対する１つの新しいフレーム喪失隠蔽方法は、いわゆる「ＰｈａｓｅＥＣＵ」である。これは、信号が音楽信号である場合に、パケット又はフレーム喪失の後に、特に高い品質の復元された音声信号を提供する方法である。フレーム喪失の例えば（統計の）特性に応じて、Ｐｈａｓｅ−ＥＣＵタイプのフレーム喪失隠蔽方法の振る舞いを制御する事前のアプリケーションにおいて開示される制御方法も存在する。

フレーム喪失のバースト性が、ＰｈａｓｅＥＣＵのようなフレーム喪失隠蔽方法を調整することができる制御方法における１つの指標として用いられる。一般的な用語において、フレーム喪失のバースト性は、いくつかのフレーム喪失が連続して生じ、フレーム喪失隠蔽方法が、その動作について有効な直近で復号された信号部分を用いるのが難しくすることを意味する。より具体的には、通常の最先端のフレーム喪失のバースト性の指標は、観測された連続するフレーム喪失の数ｎである。この数は、新しいフレーム喪失のそれぞれに応じて１だけインクリメントされ、有効なフレームの受信に応じて、ゼロにリセットされるカウンタにおいて保持されうる。

フレーム喪失のバースト性に応じてＰｈａｓｅＥＣＵのようなフレーム喪失隠蔽方法の具体的な適応方法は、代理フレームスペクトルＺ(ｍ)の位相又はスペクトル振幅の周波数選択的な調整であり、ｍは離散フーリエ変換（ＤＦＴ）のような周波数領域変換の周波数インデクスである。振幅適応は、フレーム喪失バーストカウンタｎが増えるとインデクスｍにおける周波数変換係数を０に向けてスケーリングする減衰係数α(ｍ)を用いて、行われる。位相適応は、インデクスｍにおける周波数変換係数の、（増加するランダム位相要素θ’(ｍ)を用いた）位相の追加のランダム化を拡大することを通じて行われる。

したがって、ＰｈａｓｅＥＣＵのオリジナルの代理フレームスペクトルがＺ(ｍ)＝Ｙ(ｍ)・ｅ^jθkなどの式に従う場合、適応された代理フレームスペクトルは、Ｚ(ｍ)＝α(ｍ)・Ｙ(ｍ)・ｅ^{j(θk+θ'(ｍ))}のような式に従う。

ここでは、ｋ＝１、…、Ｋを伴う位相θ_kはインデクスｍ及びＰｈａｓｅＥＣＵ方法によって特定されるＫ個のスペクトルピークの関数であり、Ｙ(ｍ)は、先に受信した音声信号のフレームの周波数領域表現（スペクトル）である。

バーストフレーム喪失の状況におけるＰｈａｓｅＥＣＵの上述の適応方法の利点によらず、非常に長い喪失バーストの場合、例えば、５以上のｎの場合に、なおも品質に不十分な点がある。その場合、再構成された音声信号の品質は、例えば、実行された位相のランダム化によらずに、音調のアーチファクトを被りうる。同時に、振幅の減衰を強化することは、これらの可聴性の欠点を低減しうる。しかしながら、信号の減衰は、長いフレーム喪失バーストに対して、ミュート又は信号のドロップアウトと受け取られうる。これは、このような信号が強すぎるレベルの変動に敏感であるため、この場合もやはり、例えば音楽又は会話信号の環境雑音の全体の品質に影響しうる。

したがって、改善されたフレーム喪失隠蔽に対する必要性がなおも存在する。

ここでの実施形態の目的は、効果的なフレーム喪失の隠蔽を提供することである。

第１の態様によれば、フレーム喪失隠蔽のための方法が提示される。本方法は、受信エンティティによって実行される。本方法は、失われたフレームに対する代理フレームを構成することに関連して、代理フレームに対して雑音要素を加えることを含む。雑音要素は、先に受信されたフレームにおける信号の低分解能（low-resolution）空間表現に対応する周波数特性を有する。

これは、有利に、効果的なフレーム喪失の隠蔽を提供する。

第２の態様によれば、フレーム喪失隠蔽のための受信エンティティが提示される。受信エンティティは、処理回路を有する。処理回路は、受信エンティティに一連の処理を実行させるように構成される。一連の処理は、失われたフレームに対する代理フレームを構成することに関連して、代理フレームに対して雑音要素を加えることを含む。雑音要素は、先に受信されたフレームにおける信号の低分解能空間表現に対応する周波数特性を有する。

第３の態様によれば、フレーム喪失隠蔽のためのコンピュータプログラムが提示され、コンピュータプログラムは、受信エンティティで動作するときに、受信エンティティに第１の態様による方法を実行させるコンピュータプログラムコードを含む。

第４の態様によれば、第３の態様によるコンピュータプログラムを含んだコンピュータプログラムプロダクトおよびそのコンピュータプログラムが格納されるコンピュータ読み出し可能手段が提示される。

第１、第２、第３、及び第４の態様の任意の特徴が、適切であれば、任意の他の態様に適用されうることに留意すべきである。同様に、第１の態様の任意の利点は、第２、第３、および／または第４の態様のそれぞれに、そしてその逆に、等しく適用しうる。含まれている実施形態の他の目的、特徴及び利点は、以下の詳細な開示から、添付の独立請求項及び図面から、明らかとなる。

一般に、特許請求の範囲で用いられる全ての用語は、ここで別途明示的に定義されない限り、技術分野における通常の意味に従って解釈されるべきである。「要素（element）、装置、コンポーネント、手段、ステップ等」に対する全ての参照は、明示的に別途言及されない限りは、要素、装置、コンポーネント、手段、ステップ等の少なくともいずれかの例を参照するようにオープンに解釈されるべきである。ここで開示される任意の方法のステップは、明示的に言及されない限りは、開示された正確な順序で実行される必要はない。

ここで、添付の図面を参照しながら、例として、発明の概要について説明する。

実施形態による通信システムを説明する模式図である。実施形態による受信エンティティの機能部を示す模式図である。実施形態による代理フレームの挿入を概略的に説明する図である。実施形態による受信エンティティの機能部を示す模式図である。実施形態による方法のフローチャートである。実施形態による方法のフローチャートである。実施形態による方法のフローチャートである。実施形態による受信エンティティの機能部を示す模式図である。実施形態による受信エンティティの機能モジュールを示す模式図である。実施形態によるコンピュータ可読手段を含んだコンピュータプログラムプロダクトの一例を示す図である。

ここで、発明の概要の所定の実施形態が示されている添付の図面を参照して、発明の概要についてより十分に説明する。しかしながら、この発明の概要は、多くの異なる形式で具現化されてもよいのであってここで説明される実施形態に限定するように解釈されるべきではなく、むしろ、これらの具現化が、本開示は徹底的かつ完全であるように例として提供され、当業者に対して発明の概要の範囲を十分に伝えるだろう。説明の全体を通じて、同様の番号が同様の要素を参照する。破線で示されるステップ又は特徴は、オプションとして取り扱われるべきである。

上述のように、ここで提示される実施形態は、フレーム喪失隠蔽に関し、特に、フレーム喪失隠蔽のための方法、受信エンティティ、コンピュータプログラム、及びコンピュータプログラムプロダクトに関する。

図１は、送信（ＴＸ）エンティティ１０１が、チャネル１０２を介して受信（ＲＸ）エンティティ１０３と通信している通信システム１００を概略的に図解している。チャネル１０２がＴＸエンティティ１０１によってＲＸエンティティ１０３へ送信されたフレーム又はパケットを失わせるものとする。受信エンティティは、会話又は音楽などのオーディオを復号するように動作可能であると共に、例えば通信システム１００において、他のノード又はエンティティと通信するように動作可能であるものとする。受信エンティティは、コーデック、復号器、無線機器、又は固定機器でありえ、実際に、オーディオ信号のためのバーストフレームエラーを取り扱うことができることが望ましい任意の種類のユニットであってもよい。例えば、有線と無線との少なくともいずれかの通信及びオーディオの復号を実行可能なスマートフォン、タブレット、コンピュータ又は任意の他の機器でありうる。受信機エンティティは、例えば受信ノード又は受信装置と表記されうる。

図２は、フレーム喪失を処理するように構成された既知のＲＸエンティティ２００の機能モジュールを概略的に図解している。入力ビットストリームは再構成された信号を形成するために復号器２０１によって復号され、フレーム喪失が検出されなかった場合、この再構成された信号がＲＸエンティティ２００から出力として提供される。復号器２０１によって生成された再構成された信号は、一時記憶のためにバッファ２０２にも入力される。バッファリングされた再構成信号の正弦解析が正弦解析器２０３によって実行され、バッファリングされた再構成信号の位相展開が位相展開部２０４によって実行され、その後、フレームが喪失した場合にＲＸエンティティ２００から出力される代理再構成信号を生成するために、その結果の信号が正弦波合成器２０５に入力される。ＲＸエンティティ２００の動作のさらなる詳細については以下で提供される。

図３は、（ａ）、（ｂ）、（ｃ）及び（ｄ）において、フレームが喪失した場合に、代理フレームを生成して挿入する処理の４つの段階を概略的に図解している。図３（ａ）は、先に受信された信号３０１の一部を概略的に図解している。３０３においてウィンドウが概略的に図解されている。ウィンドウ３０３は、先に受信された信号３０１のフレーム、いわゆるプロトタイプフレーム３０４を抽出するために用いられ、先に受信された信号３０１の中間部分は、ウィンドウ３０３が１に等しくプロトタイプフレーム３０４と同一であるため可視でない。図３（ｂ）は、図３（ａ）におけるプロトタイプフレームの離散フーリエ変換（ＤＦＴ）を用いた振幅スペクトルを概略的に図解しており、ここでは２つの周波数ピークｆ_k及びｆ_k+1が特定されている。図３（ｃ）は、生成された代理フレームの周波数スペクトルを概略的に図解しており、ここでは、ピーク周辺の相が適切に展開され、プロトタイプフレームの振幅スペクトルは保たれている。図３（ｄ）は、挿入されている、生成された代理フレーム３０５を概略的に図解している。

フレーム喪失隠蔽のための上で開示した機構を考慮して、ランダム化にもかかわらず、代理フレームスペクトルの強すぎる周期性と鋭すぎるスペクトルピークによって、音調のアーチファクトが生じることが気づかれている。

また、タイプＰｈａｓｅＥＣＵのフレーム喪失隠蔽の適応方法と併せて説明される機構が、周波数又は時間領域において、失われたフレームに対する代理信号を生成する他のフレーム隠蔽方法に対しても代表的であることが注目に値する。したがって、長いバーストの喪失した又は壊れたフレームの場合に、フレーム喪失隠蔽のための包括的な機構を提供することが望ましいかもしれない。

効果的なフレーム喪失隠蔽を提供することのほかに、最小の計算の複雑性を伴って、また、最小の記憶装置の要求を伴って、実装可能な機構を発見することも望ましいかもしれない。

ここで開示される実施形態の少なくとも一部は、雑音信号を伴う一次的なフレーム喪失隠蔽方法の代理信号を徐々に重ね合わせることに基づき、ここで、雑音信号の周波数特性は、先に正しく受信された信号（「良好なフレーム」）の低分解能スペクトル表現である。

ここで、実施形態に従い、受信エンティティによって実行されるようなフレーム喪失隠蔽のための方法を開示する図６のフローチャートを参照する。

受信エンティティは、ステップＳ２０８において、失われたフレームのための代理フレームスペクトルを構成することと関連して、雑音要素を、代理フレームに加算するように構成される。雑音要素は、先に受信されたフレームにおける信号の低分解能スペクトル表現に対応する周波数特性を有する。

この点において、ステップＳ２０８における加算が周波数領域で実行される場合、雑音要素は、すでに生成されている代理フレームのスペクトルに加算されるように取り扱われてもよく、したがって、雑音要素が加算されている代理フレームは、二次的な又はさらなる代理フレームとして取り扱われうる。このように、二次的な代理フレームは、一時的な代理フレームと雑音要素とからなる。これらのコンポーネントは、同様にして、周波数コンポーネントからなる。

１つの実施形態によれば、雑音要素を代理フレームに加算するステップＳ２０８は、バーストエラー長ｎが、第１の閾値Ｔ１を超えることを確認することを含む。第１の閾値の一例は、Ｔ１≧２と設定されるものである。

ここで、さらなる実施形態に従って、受信エンティティによって実行されるようなフレーム喪失隠蔽のための方法を開示する図７のフローチャートを参照する。

第１の好ましい実施形態によれば、失われたフレームに対する代理信号が、一次的なフレーム喪失隠蔽方法によって生成されて、雑音信号と重ねあわされる。連続したフレーム喪失の数が増えることに伴って、一次的なフレーム喪失隠蔽の代理信号が、好ましくはバーストフレーム喪失の場合の一次的なフレーム喪失隠蔽方法の弱める振る舞いに従って、徐々に減衰される。同時に、フレーム喪失隠蔽方法の弱める振る舞いによるフレームのエネルギーの損失が、先に受信された信号のフレーム、例えば最後に正しく受信されたフレームのような同様のスペクトル特性を有する雑音信号の加算を通じて補償される。

したがって、雑音要素と代理フレームのスペクトルは、雑音要素が、徐々に連続して失われたフレームの数に応じて振幅を増加させて、代理フレームのスペクトルに重ね合わされるように、連続して失われたフレームの数に依存するスケール係数を用いてスケーリングされうる。

以下でさらに開示するように、代理フレームのスペクトルは、減衰係数α(ｍ)によって徐々に減衰される。

代理フレームのスペクトル及び雑音要素は、周波数領域で重ね合わされうる。代わりに、低分解能スペクトル表現は線形予測符号（ＬＰＣ）パラメータのセットに基づき、したがって、雑音要素が時間領域で重ね合わされてもよい。どのようにＬＰＣパラメータを適用するかのさらなる開示については以下を参照されたい。

より具体的には、一次的なフレーム喪失隠蔽方法は、上述のバースト喪失に応答して適応特性を有するＰｈａｓｅＥＣＵタイプの方法でありうる。すなわち、代理フレームのコンポーネントが、ＰｈａｓｅＥＣＵなどの一次的なフレーム喪失隠蔽方法によって導出されうる。

その場合、一次的なフレーム喪失隠蔽方法によって生成される信号は、Ｚ(ｍ)＝α(ｍ)・Ｙ(ｍ)・ｅ^{j(θk+θ'(ｍ))}のタイプであり、ここで、α(ｍ)及びθ'(ｍ)は、振幅減衰及び位相ランダム化の項である。すなわち、代理フレームのスペクトルは位相を有し、その位相は、ランダム位相値θ'(ｍ)と重ね合わされうる。

また、上述のように、ｋ＝１、…、Ｋを伴う位相θkは、インデクスｍとＰｈａｓｅＥＣＵ方法によって特定されるＫ個のスペクトルのピークとの関数であり、Ｙ(ｍ)は、先に受信されたオーディオ信号のフレームの周波数領域表現（スペクトル）である。

ここで示唆されるように、このスペクトルは、その後、合成されたコンポーネントβ(ｍ)・Ｙ'(ｍ)・ｅ^jη(ｍ)を生じさせる加法雑音要素β(ｍ)・ｅ^jη(ｍ)によって変形されてもよく、ここで、Ｙ'(ｍ)は、先に受信された「良好なフレーム」、すなわち少なくとも相対的に正しく受信された信号のフレームの、振幅スペクトル表現である。それにより、雑音要素に、ランダム位相値η(ｍ)が与えられうる。

この方法において、スペクトルのインデクスｍに対するスペクトル係数は、式：
Ｚ(ｍ)＝α(ｍ)・Ｙ(ｍ)・ｅ^{j(θk+θ'(ｍ))}＋β(ｍ)・Ｙ'(ｍ)・ｅ^jη(ｍ)
に従う。ここで、β(ｍ)は、振幅スケーリング係数であり、η(ｍ)はランダム位相である。したがって、加法雑音要素は、振幅スペクトルのスケーリングされたランダム位相スペクトル係数Ｙ'(ｍ)からなる。本発明によれば、β(ｍ)は、一次的なフレーム喪失隠蔽の代理フレームのスペクトルのスペクトル係数Ｙ(ｍ)に減衰係数α(ｍ)を適用する場合に、エネルギーの損失を補償するように選択されうる。したがって、受信エンティティは、オプションのステップＳ２０４において、β(ｍ)が代理フレームのスペクトルに対して減衰係数α(ｍ)を適用した結果のエネルギーの損失を補償するように、雑音要素に対する振幅スケーリング係数β(ｍ)を決定するように構成されてもよい。

ランダム位相項が上式の２つの加算項α(ｍ)・Ｙ(ｍ)・ｅ^{j(θk+θ'(ｍ))}及びβ(ｍ)・Ｙ'(ｍ)・ｅ^jη(ｍ)を無相関化するという前提において、β(ｍ)は、例えば、
β(ｍ)＝√（１−α²(ｍ)）
のように決定されうる。

鋭すぎるスペクトルのピークから生じる音調のアーチファクトを伴う上述の問題を避けるために、バーストフレーム喪失の前の信号の全体の周波数特性をなおも維持する一方で、振幅スペクトルの表現Ｙ'(ｍ)は、低分解能の表現である。振幅スペクトルの非常に適した低分解能表現が、先に受信された信号のフレーム、例えば正しく受信されたフレーム、「良好な」フレーム、の振幅スペクトル|Ｙ(ｍ)|を周波数グループに関して平均化することにより得られることが見出されている。受信エンティティは、オプションのステップＳ２０２ａにおいて、先に受信されたフレームにおける信号の振幅スペクトルを周波数グループに関して平均化することにより、振幅スペクトルの低分解能表現を得るように構成されうる。低分解能スペクトル表現は、先に受信されたフレームにおける信号の振幅スペクトルに基づきうる。

Ｉ_k＝［ｍ_k-1＋１、…、ｍ_k］がｍ_k-1＋１からｍ_kまでのＤＦＴビン（bins）をカバーするｋ（ｋ＝１、…、Ｋ）番目の区間を特定するものとすると、これらの区間は、Ｋ個の周波数帯域を定義する。そして、帯域ｋに対する周波数グループに関しての平均化は、その帯域内でのスペクトルの係数の振幅の二乗を平均化して、その平方根を計算すること：

によって行われうる。ここで|Ｉ_k|は、周波数グループｋのサイズ、すなわち、含められる周波数ビンの数を表す。区間Ｉ_k＝［ｍ_k-1＋１、…、ｍ_k］は、ｆ_sがオーディオサンプリングをＮが使用される周波数領域変換のブロック長を表す場合の、周波数周波数帯域Ｂ_k＝［(ｍ_k-1＋１)・ｆ_s／Ｎ、…、ｍ_k・ｆ_s／Ｎ］に対応することが留意されるべきである。

周波数帯域サイズ又は幅に対する例示の適切な選択は、いずれも、それらを例えば数百ＭＨｚの幅を有する等しいサイズとすることである。別の例示の方法は、周波数帯域幅を人間の聴覚に重要な帯域のサイズに従わせる、すなわち、人間の聴覚系の周波数分解能にそれらを関連付けることである。すなわち、周波数グループに関しての平均化の間に用いられるグループの幅は、人間の聴覚に重要な帯域に従いうる。これは、１ｋＨｚまでの周波数に対して周波数帯域幅を等しくし、１ｋＨｚより上では指数的にそれらを増やすことをおおよそ意味する。指数的な増加は、例えば、帯域インデクスｋが増加する場合に周波数帯域を倍にすることを意味する。

低分解能な振幅スペクトル係数Ｙ'_kを計算するさらなる例示の具体的な実施形態は、先に受信された信号の多数（multitude）ｎの低分解能の周波数領域変換に基づくものである。したがって、受信エンティティは、オプションのステップＳ２０２ｂにおいて、先に受信されたフレームにおける信号の多数ｎの低分解能な周波数領域変換を周波数グループに関して平均化することにより、この振幅スペクトルの低分解能な表現を得るように構成されうる。ｎの例示の適切な選択はｎ＝２である。

この実施形態によれば、まず、先に受信された信号のフレームの、例えばもっとも最近に受信された良好なフレームの、左部分（サブフレーム）及び右部分（サブフレーム）の二乗された振幅スペクトルが計算される。ここでのフレームは伝送に用いられるオーディオセグメント又はフレームのサイズでありえ、又は、フレームは、いくつかの他のサイズ、例えば再構成された信号から異なる長さを有する独自のフレームを構成しうるＰｈａｓｅＥＣＵによって構成されて使用されるサイズでありうる。これらの低分解能の変換のブロック長Ｎ_partは、一次的なフレーム喪失隠蔽方法の元のフレームサイズの一部（例えば１／４）でありうる。そして、次に、左および右のサブフレームからの二乗されたスペクトル振幅を周波数グループに関して平均化し、最後にその平方根

を計算することによって、周波数グループに関しての低分解能な振幅スペクトル係数が計算される。低分解能な振幅スペクトル係数Ｙ'(ｍ)が、その後、Ｋ個の周波数グループの代表値から得られる：
Ｙ'(ｍ)＝Ｙ'_k、ただしｍ∈Ｉ_k、ｋ＝１、…、Ｋ
低分解能な振幅スペクトル係数Ｙ'_kを計算するこのアプローチに伴う様々な利点がある；２つの短い周波数領域変換の使用は、大きいブロック長の単一の周波数領域変換より、計算の複雑性の観点で好ましい。さらに、平均化は、スペクトルの推定値を安定化させる、すなわち、達成可能な品質に影響を与えうる統計上の変動を減らす。先に言及したＰｈａｓｅＥＣＵコントローラと併せて本実施形態を適用する際の特定の利点は、それが、先に受信された信号のフレーム、「良好なフレーム」における一次的な状態の検出に関連するスペクトル解析に依存しうることである。これは、本発明に関連付けられた計算のオーバーヘッドをさらに減らす。

本実施形態が、Ｋ個の値のみを用いて低分解能のスペクトルを表現することを可能とし、ここでＫは実質的に例えば７又は８程度に低くすることができるため、最小の記憶装置の要求を伴う機構を提供するとの目的も達成される。

さらに、雑音信号を用いた周波数グループに関しての重ね合わせが所定の度合いの低域通過特性を与える場合、長い喪失バーストの場合の再構成されたオーディオ信号の品質がさらに改善されうることが判明している。したがって、低域通過特性が、低分解能スペクトル表現に与えられうる。

このような特性は、代理信号内の不快な高周波数雑音を効果的に防ぐ。より具体的には、これは、より高い周波数に対する雑音信号の係数λ(ｍ)を通じた追加の減衰を導入することにより達成される。上述の雑音スケーリング係数β(ｍ)の計算と比較すると、この係数は、ここでは、
β(ｍ)＝λ(ｍ)・√（１−α²(ｍ)）
に従って計算される。

ここで、係数λ(ｍ)は、小さいｍに対して１に等しく、大きいｍに対しては１より小さくてもよい。すなわち、β(ｍ)は、λ(ｍ)が周波数依存の減衰係数である場合にβ(ｍ)＝λ(ｍ)・√（１−α²(ｍ)）のように決定されうる。例えば、λ(ｍ)は閾値より低いｍに対して１に等しくてもよく、そして、λ(ｍ)はこの閾値を上回るｍに対しては１より小さくてもよい。

好ましくはスケーリング係数α(ｍ)及びβ(ｍ)が周波数グループに関して定数であることに留意されたい。これは、複雑度と記憶装置の要求を低減するのに役立つ。その場合、係数λは、以下の式：
β_k＝λ_k√（１−α_k ²）
に従って、周波数グループに関して適用される。

λ_kを、それが８０００Ｈｚを超える周波数帯域に対して０．１であり、４０００Ｈｚ〜８０００Ｈｚの周波数帯域に対して０．５となるように設定することが有益であることも判明している。より低い周波数帯域に対して、λ_kは１に等しい。他の値も可能である。

雑音信号との一次的なフレーム喪失隠蔽方法の代理信号の重ね合わせを伴う提案方法の品質の利点によらず、例えば（２００ｍｓ以上に対応する）ｎ＞１０の非常に長いフレーム喪失バーストに対してミュート特性を実行することが有益であることがさらに判明している。したがって、受信エンティティは、オプションのステップＳ２０６において、バースト誤り長ｎが、少なくとも第１の閾値Ｔ１と同じ大きさの第２の閾値を超える場合に、Ｔ２長期減衰係数γをβ(ｍ)に適用するように構成されうる。一例によれば、Ｔ２≧１０である。

より詳細には、雑音信号が持続する場合、合成は、聴取者に対して耳障りでありうる。したがって、この問題を解決するために、加法雑音信号は、例えばｎ＝１０より長いバーストの喪失から始まって減衰されうる。具体的には、さらなる長期減衰係数γ（例えばγ＝０．５）及び閾値ｔｈｒｅｓｈが導入され、それを用いて、喪失バースト長ｎがｔｈｒｅｓｈを超える場合に雑音信号が減衰される。これは、雑音スケーリング係数の以下の変形：
β_γ(ｍ)＝γ^{max(0, n-thresh)}・β(ｍ)
を引き起こす。その変形によって得られる特性は、ｎが閾値を超える場合に、雑音信号がγ^n-threshを用いて減衰させられることである。例として、ｎ＝２０（４００ｍｓ）、及び、γ＝０．５並びにＴ２＝ｔｈｒｅｓｈ＝１０とすると、雑音信号は約１／１０００にスケールダウンさせられる。

上述の実施形態におけるように、本処理は周波数グループに関して行われうることに、再度留意すべきである。

まとめると、少なくとも一部の実施形態によれば、Ｚ(ｍ)は代理フレームのスペクトルを表現し、このスペクトルは、プロトタイプフレーム、すなわち、先に受信された信号のフレームのスペクトルＹ(ｍ)に基づいて、ＰｈａｓｅＥＣＵなどの一次的なフレーム喪失隠蔽方法の使用によって生成される。

長い喪失バーストに対して、説明されるコントローラを用いたオリジナルのＰｈａｓｅＥＣＵは、本質的に、このスペクトルを減衰させ、位相をランダム化する。非常に大きいｎに対して、これは、生成された信号が完全にミュートされることを意味する。

ここで開示されるように、この減衰は、適切な量のスペクトル的にシェイピングした雑音を加算することによって補償される。したがって、ｎ＞５であっても、信号のレベルは基本的には不変である。きわめて長い喪失バースト、例えばｎ＞１０に対しては、実施形態は、この加法雑音を減衰させる／ミュートすることを含む。

さらなる実施形態によれば、加法低分解能雑音信号のスペクトルＹ'(ｍ)は、ＬＰＣパラメータのセットによって表現されることができ、したがって、この場合のスペクトルは、これらのＬＰＣパラメータを係数として伴うＬＰＣ合成のスペクトルに対応する。一次的ＰＬＣ手法がＰｈａｓｅＥＣＵタイプのものではなく、例えば時間領域において動作する方法である場合に、このような実施形態が好適でありうる。また、その場合、加法低分解能雑音信号スペクトルＹ'(ｍ)に対応する時間信号は、このＬＰＣ係数を伴う合成フィルタを通じて白色雑音をフィルタリングすることにより、時間領域において生成されることが好ましいかもしれない。

ステップＳ２０８におけるような代理フレームへの雑音要素の加算は、例えば、周波数領域または時間領域もしくはさらなる等価の信号領域のいずれかにおいて、実行されうる。例えば、その中で一次的なフレーム喪失隠蔽方法が動作しうる直交ミラーフィルタ（ＱＭＦ）又はサブバンドフィルタ領域などの信号領域が存在する。このような場合、これらの信号領域において、説明した低分解能雑音信号スペクトルＹ'(ｍ)に対応する加法雑音信号を生成することが好適でありうる。雑音信号が加算される信号領域の違いは別として、上述の実施形態は適用可能なままである。

ここで、１つの特定の実施形態に従って受信エンティティによって実行されるようなフレーム喪失隠蔽のための方法を開示する図５のフローチャートを参照する。

動作Ｓ１０１において、雑音要素が決定されうる。ここで、雑音要素の周波数特性は、先に受信された信号のフレームの低分解能スペクトル表現である。雑音要素は、例えば、β(ｍ)が振幅スケーリング係数でありη(ｍ)がランダム位相でありえ、Ｙ'(ｍ)が先に受信された「良好なフレーム」の振幅スペクトルでありうる場合に、β(ｍ)・Ｙ'(ｍ)・ｅ^jη(ｍ)のように構成され、表記されうる。

オプションの動作Ｓ１０３において、失われた又は誤っているフレームの数（ｎ）が閾値を超えているか否かが判定されうる。閾値は、例えば、８、９、１０又は１１フレームでありうる。ｎが閾値より低い場合、動作Ｓ１０４において、雑音要素が代理フレームのスペクトルＺに加算される。代理フレームのスペクトルＺは、例えばＰｈａｓｅＥＣＵなどの一次的なフレーム喪失隠蔽方法によって導出されうる。失われたフレームの数ｎが閾値を超える場合、減衰係数γが雑音要素に適用されうる。減衰係数は、所定の周波数範囲内において定数でありうる。減衰係数γを適用した場合、雑音要素は、動作Ｓ１０４において、代理フレームのスペクトルＺに加算されうる。

ここで説明される実施形態は、図４、８及び９を参照して後述する受信エンティティ又は受信ノードにも関する。受信エンティティについては、不必要な繰り返しを避けるために手短に説明する。

受信エンティティは、ここで説明される実施形態の１つ以上を実行するように構成されうる。

図４は、実施形態による受信エンティティ４００の機能モジュールを概略的に開示している。受信エンティティ４００は、信号パス４１０に沿って受信された信号においてフレーム喪失を検出するように構成されるフレーム喪失検出器４０１を有する。フレーム喪失検出器は、低分解能表現生成器４０２及び代理フレーム生成器４０３にインタフェース接続する。低分解能表現生成器４０２は、先に受信されたフレームにおける信号の低分解能スペクトル表現を生成するように構成される。代理フレーム生成器４０３は、ＰｈａｓｅＥＣＵなどの既知の機構に従って、代理フレームを生成するように構成される。機能ブロック４０４及び４０５は、上述のスケーリング係数β、γ及びαを用いた、低分解能表現生成器４０２及び代理フレーム生成器４０３によって生成される信号のスケーリングをそれぞれ表している。機能ブロック４０６及び４０７は、このようにスケーリングされた信号を、上述の位相値η及びθ'を用いて重ね合わせることを表している。機能ブロック４０８は、このように生成された雑音要素を代理フレームに加算するための加算器を表している。機能ブロック４０９は、失われたフレームを生成された代理フレームで置き換えるための、フレーム喪失検出器４０１によって制御されるスイッチを表している。上述のように、ステップＳ２０８における加算などの動作が実行されうる多数の領域が存在する。したがって、任意の上述の機能ブロックは、これらの領域のいずれかでの動作を実行するように構成されうる。

以下では、バーストフレーム誤りの対処のための上述の方法の実行を可能とするように適合された例示の受信エンティティ８００について、図８を参照しながら説明する。

ここで示唆されるソリューションに主として関連する受信エンティティの部分は、破線によって囲まれる構成８０１として図解されている。受信エンティティのその構成及び場合によっては他の部分は、上述の、そして図５、６、７において図解される手順の１つ以上の実行を可能とするように適合されている。受信エンティティ８００は、受信エンティティが動作可能な通信標準又はプロトコルに従う無線と有線との少なくともいずれかの通信のための従来の手段を有すると考えてもよい通信部８０２を介して、他のエンティティと通信するように図解されている。構成と受信エンティティとの少なくともいずれかは、さらに、例えば会話と音楽の少なくともいずれかなどのオーディオのデコーディングに関する信号処理などの、例えば普通の受信エンティティ機能を提供するための他の機能部８０７を有しうる。

受信エンティティのその構成部分は、以下のように実装されるか説明されるかのいずれかでありうる：

本構成は、プロセッサなどの処理手段８０３及び命令を記憶するためのメモリ８０４を含む。メモリは、処理手段によって実行される場合に受信エンティティ又は構成にここで開示されるような方法を実行させる、コンピュータプログラム８０５の形式の命令を含む。

受信エンティティ８００の別の実施形態を図９に示す。図９は、オーディオ信号をデコードするように動作可能な受信エンティティ９００を図解している。

構成９０１は、以下のように実装されるか概略的に説明されるかの少なくともいずれかでありうる。構成９０１は、先に受信された信号のフレームの低分解能スペクトル表現の周波数特性を用いて雑音要素を決定するように構成され、振幅スケーリング係数を決定するための決定部９０３を有しうる。本構成は、さらに、その雑音要素を代理フレームのスペクトルに加算するように構成される加算部９０４を有しうる。本構成は、さらに、先に受信されたフレームにおける信号の振幅スペクトルの低分解能表現を取得するように構成される取得部９１０を有しうる。本構成は、さらに、長期減衰係数を適用するように構成される適用部９１１を有しうる。受信エンティティは、例えば雑音要素に対するスケーリング係数β(ｍ)を決定するために構成されるさらなるユニット９０７を有しうる。受信エンティティ９００は、さらに、通信部８０２のような機能性を伴う送信器（ＴＸ）９０８及び受信器（ＲＸ）９０９を有する通信部９０２を有する。受信エンティティ９００は、さらに、メモリ８０４のような機能性を伴うメモリ９０６を有する。

上述の構成におけるユニット又はモジュールは、例えば、プロセッサもしくはマイクロプロセッサと適切なソフトウェアおよびそれを記憶するためのメモリ、上述の動作を実行するように構成された、そして例えば図８において図解された、プログラマブル論理デバイス（ＰＬＤ）又は他の電子コンポーネント又は処理回路、の１つ以上により、実装されうる。すなわち、上述の構成におけるユニット又はモジュールは、アナログ回路とデジタル回路との組み合わせと、例えばメモリに記憶されたソフトウェアおよび／又はファームウェアを伴って構成される１つ以上のプロセッサと、の少なくともいずれかによって実装されうる。１つ以上のこれらのプロセッサ及び他のデジタルハードウェアは、単一の特定用途向け集積回路（ＡＳＩＣ）に含まれてもよく、又はいくつかのプロセッサ及び様々なデジタルハードウェアは、個別にパッケージングされるにしてもシステムオンチップ（ＳｏＣ）にアセンブルされるにしても、いくつかの別個のコンポーネントに分散されてもよい。

図１０は、コンピュータ可読手段１００１を有するコンピュータプログラムプロダクト１０００の例を示している。このコンピュータ可読手段１００１に、コンピュータプログラム１００２が記憶されることができ、このコンピュータプログラム１００２は、処理回路８０３及び通信部８０２及び記憶媒体８０４などのそれに動作可能に接続されるエンティティ及びデバイスに、ここで説明される実施形態に従う方法を実行させることができる。このように、コンピュータプログラム１００２とコンピュータプログラムプロダクト１００１との少なくともいずれかは、ここで開示された任意のステップを実行するための手段を提供しうる。

図１０の例では、コンピュータプログラムプロダクト１００１は、ＣＤ（コンパクトディスク）又はＤＶＤ（デジタル多目的ディスク）又はブルーレイディスクなどの光学ディスクとして図解されている。コンピュータプログラムプロダクト１００１は、ランダムアクセスメモリ（ＲＡＭ）、読み出し専用メモリ（ＲＯＭ）、消去可能なプログラマブル読み出し専用メモリ（ＥＰＲＯＭ）、又は電気的に消去可能なプログラマブル読み出し専用メモリ（ＥＥＰＲＯＭ）などのメモリとして、そして、より具体的には、ＵＳＢ（ユニバーサルシリアルバス）メモリ又はコンパクトフラッシュメモリなどのフラッシュメモリなど、外部メモリにおけるデバイスの不揮発記憶媒体として具現化されうる。このように、ここではコンピュータプログラム１００２が描画された光学ディスク上のトラックとして概略的に示されているが、コンピュータプログラム１００２は、コンピュータプログラムプロダクト１００１に適した任意の方法で記憶されうる。

可能な特徴及び実施形態のいくつかの定義について、図５のフローチャートを部分的に参照して、概説する。

フレーム喪失隠蔽を改善する又はバーストフレーム誤りの対処のための受信エンティティによって実行される方法であって、代理フレームのスペクトルＺを構成することと関連して、
雑音要素を代理フレームのスペクトルＺに加算すること（動作１０４）を含み、ここで、雑音要素の周波数特性は先に受信された信号のフレームの低分解能スペクトル表現である、方法。

可能な実施形態において、低分解能スペクトル表現は、先に受信された信号のフレームの振幅スペクトルに基づく。振幅スペクトルの低分解能表現は、例えば先に受信された信号のフレームの振幅スペクトルを周波数グループに関して平均化することにより、取得されうる。代わりに、振幅スペクトルの低分解能表現は、多数ｎの先に受信された信号の低分解能周波数領域変換に基づいてもよい。

可能な実施形態において、低分解能スペクトル表現は、線形予測符号化（ＬＰＣ）パラメータのセットに基づく。

代理フレームのスペクトルＺが減衰係数α(ｍ)によって徐々に減衰させられる可能な実施形態において、本方法は、雑音要素のための振幅スケーリング係数β(ｍ)を、β(ｍ)が減衰係数α(ｍ)の適用の結果として生じるエネルギーの損失を補償するように、決定することを含む。β(ｍ)は、例えば、
β(ｍ)＝√（１−α²(ｍ)）
のように決定されうる。

可能な実施形態において、β(ｍ)は、β(ｍ)＝λ(ｍ)√（１−α²(ｍ)）のように導出され、ここで係数λ(ｍ)は、雑音信号の所定の周波数、例えばより高い周波数に対する減衰係数である。λ(ｍ)は、小さいｍに対して１に等しく、大きいｍに対して１より小さくてもよい。

可能な実施形態において、スケーリング係数α(ｍ)及びβ(ｍ)は、周波数グループに関して定数である。

可能な実施形態において、方法は、バースト誤り長が閾値を超えた場合に減衰係数（γ）を適用すること（動作１０３）を含む。

代理フレームのスペクトルＺは、ＰｈａｓｅＥＣＵなどの一次的なフレーム喪失隠蔽方法によって導出されうる。

異なる実施形態が、任意の適切な方法で組み合わせられうる。

以下では、用語「ＰｈａｓｅＥＣＵ」について明示的に言及しないが、フレーム喪失隠蔽方法ＰｈａｓｅＥＣＵの事例的な実施形態の情報を提供する。ここでは、ＰｈａｓｅＥＣＵについては、雑音要素を加算する前のＺの導出のための、一次的なフレーム喪失隠蔽方法の観点で言及している。

ここで説明される後の実施形態の概要は、
−先に受信され又は再構成されたオーディオ信号の少なくとも一部の、オーディオ信号の正弦波成分の周波数を特定することを含んだ正弦解析を実行することと、
−先に受信され又は再構成されたオーディオ信号のセグメントであって、失われたフレームに対する代理フレームを生成するためにプロトタイプフレームとして用いられるセグメントに、正弦波モデルを適用することと、
−対応する特定された周波数に応答して、失われたオーディオフレームのタイムインスタンスに至るまでのプロトタイプフレームの正弦波要素の時間展開を含む代理フレームを生成することと、
による失われたオーディオフレームの隠蔽を含む。

正弦解析
実施形態に係るフレーム喪失隠蔽は、先に受信された又は再構成されたオーディオ信号の一部の正弦解析を含む。この正弦解析の目的は、その信号の主たる正弦波成分すなわち正弦曲線の周波数を発見することである。これにより、根底にある前提は、オーディオ信号が正弦波モデルによって生成されたこと、又はそれが限られた数の個別の正弦波からなること、すなわち、それが以下の種類の複数の正弦波信号であることである：

この等式において、Ｋは、信号が構成されると仮定される正弦曲線の数である。インデクスｋ＝１…Ｋを有する正弦曲線のそれぞれについて、ａ_kは振幅であり、ｆ_kは周波数であり、φ_kは位相である。サンプリング周波数がｆ_sによって表記されており、時間離散信号サンプルの時間インデクスは、ｎによってｓ(ｎ)で表記されている。

正弦曲線の厳密な周波数を可能な限り発見することは有益であり、又は、非常に重要でありうる。理想的な正弦波信号は、線周波数ｆ_kの線スペクトルを有しうるところ、その真の値を発見するには、原理的に無限の測定時間が必要となる。したがって、ここで説明される実施形態による制限解析で用いられる信号セグメントに対応する短い測定期間に基づいては、それらは推定することしかできないため、実際には、これらの周波数を発見するのは困難である。この信号セグメントを、以下では、解析フレームと呼ぶ。別の困難性は、信号が実際には時変である場合があり、これが上式のパラメータの測定が時間に対して変動することを意味することである。したがって、一方では測定をより正確にする長い解析フレームを用いることが望ましく、他方では起こりうる信号の変動により良く対処するために、短い測定期間が必要となるであろう。良好なトレードオフは、例えば２０〜４０ｍｓのオーダの解析フレーム長を用いることである。

好ましい実施形態によると、正弦曲線の周波数ｆ_kは、解析フレームの周波数領域解析によって特定される。この目的で、解析フレームは、例えば、ＤＦＴ（離散フーリエ変換）又はＤＣＴ（離散コサイン変換）又は同様の周波数領域変換を用いて、周波数領域に変換される。解析フレームのＤＦＴが用いられる場合、離散周波数インデクスｍにおけるスペクトルＸ(ｍ)は、

によって与えられる。この式において、ｗ(ｎ)は、長さＬの解析フレームが抽出されて重み付けされるウィンドウ関数を表しており、ｊは虚数単位であり、ｅは指数関数である。

通常のウィンドウ関数は、ｎ∈［０…Ｌ−１］に対して１に等しく他の場合は０の矩形ウィンドウである。先に受信されたオーディオ信号の時間インデクスが、時間インデクスｎ＝０…Ｌ−１によってプロトタイプフレームが参照されるように設定されるものとする。スペクトル解析により適しうる他のウィンドウ関数は、例えば、ハミング、ハニング、カイザー、又はブラックマンである。

他のウィンドウ関数は、ハミングウィンドウと矩形ウィンドウの組み合わせである。このようなウィンドウは、長さＬ１のハミングウィンドウの左半分のような立ち上がりエッジと、長さＬ１のハミングウィンドウの右半分のような立ち下がりエッジと、その立ち上がり及び立ち下がりエッジの間の長さＬ−Ｌ１に対して１に等しいウィンドウを有しうる。

ウィンドウイングされた解析フレームの振幅スペクトルのピーク|Ｘ(ｍ)|は、要求される正弦は周波数ｆ_kの近似を構成する。しかしながら、この近似の精度はＤＦＴの周波数間隔によって制限される。ブロック長ＬのＤＦＴを用いると、精度はｆ_s／２Ｌに制限される。

その一方で、この精度のレベルは、ここで説明される実施形態による方法の範囲において低すぎるかもしれず、以下の考察の結果に基づいて、改善された精度を得る事ができる。

ウィンドウイングされた解析フレームのスペクトルは、正弦波モデル信号の線スペクトルＳ(Ω)を用いてウィンドウ関数のスペクトルの畳み込みによって与えられ、その後、ＤＦＴの格子点でサンプリングされる：

この式において、δは、ディラックのデルタ関数を表しており、シンボル＊は、畳み込み操作を表している。正弦波モデル信号のスペクトル表現を用いて、これは、

と書くことができる。したがって、サンプリングされたスペクトルは、ｍ＝０…Ｌ−１を伴って、

によって与えられる。これに基づいて、解析フレームの振幅スペクトルにおいて観測されるピークは、Ｋ個の正弦曲線を伴うウィンドウイングされた正弦波信号から生じ、ここで、真の正弦曲線周波数がそのピークの近傍で発見される。したがって、正弦波成分の周波数の特定は、さらに、使用される周波数領域変換に関するスペクトルのピークの近傍における周波数の特定を含みうる。

ｍ_kが観測されたｋ番目のピークのＤＦＴインデクス（格子点）であるものとすると、対応する周波数は、ｆ'_k＝ｍ_k・ｆ_s／Ｌであり、これは、真の正弦波周波数ｆ_kの近似として取り扱われうる。真の正弦曲線周波数ｆ_kは、区間［(ｍ_k−１／２)・ｆ_s／Ｌ，(ｍ_k＋１／２)・ｆ_s／Ｌ］の区間内にあると想定されうる。

明確性のため、ウィンドウ関数のスペクトルの正弦波モデル信号の線スペクトルのスペクトルとの畳み込みが、ウィンドウ関数スペクトルの周波数シフトされた複数のバージョンの重ね合わせとして理解されうること、それによりシフト周波数が正弦曲線の周波数であることが留意される。この重ね合わせは、その後、ＤＦＴの格子点においてサンプリングされる。

上述の議論に基づいて、真の正弦波周波数のより良好な近似値が、使用される周波数領域変換の周波数分解能より大きくなるようにサーチの分解能を増やすことによって、発見されてもよい。

このように、正弦波成分の周波数の特定は、好ましくは、使用される周波数変換の周波数分解能より高い分解能を用いて実行され、その特定は、さらに、補間を含みうる。

正弦曲線の周波数ｆ_kのより良好な近似値を発見する一例における好適な例は、放物線補間を適用することである。１つのアプローチは、ピークを囲むＤＦＴ振幅スペクトルの格子点を通過する放物線を適合させ、その放物線の極大値に属する個別の周波数を計算することであり、放物線の次数の例示の適切な選択は２である。より詳細には、以下の手順が適用されうる。

１）ウィンドウイングされた解析フレームのＤＦＴのピークを特定する。ピークの探索は、ピークの数Ｋと、そのピークの対応するＤＦＴインデクスとを導出する。ピークの探索は、通常、ＤＦＴ振幅スペクトルまたは対数ＤＦＴ振幅スペクトル上でなされうる。

２）対応するＤＦＴインデクスｍ_kを有する各ピークｋ（ｋ＝１…Ｋ）に対して、ｌｏｇが対数演算子を表すとするときに、３つの点｛Ｐ₁；Ｐ₂；Ｐ₃｝＝｛(ｍ_k−１、ｌｏｇ(|Ｘ(ｍ_k−１)|)；(ｍ_k、ｌｏｇ(|X(ｍ_k)|)；(ｍ_k＋１、ｌｏｇ(|Ｘ(ｍ_k＋１)|)｝を通過する放物線を適合させる。これは、

によって定められる放物線の放物線係数ｂ_k(０)、ｂ_k(１)、ｂ_k(２)をもたらす。

３）Ｋ個の放物線のそれぞれについて、ｆ'_k＝ｍ'_k・ｆ_s／Ｌが正弦曲線周波数ｆ_kに対する近似値として用いられる場合の、その放物線がその最大値を有する値ｑに対応する補間周波数インデクスｍ'_kを計算する。

正弦波モデルの適用
実施形態にかかるフレーム喪失隠蔽処理を実行するための正弦波モデルの適用は、以下のように説明されうる。

符号化された信号の所与のセグメントを、対応する符号化された情報が利用可能でないため、すなわち、フレームが失われたために、復号器によって再構成できない場合、このセグメントに先立つ信号の利用可能な部分が、プロトタイプフレームとして使用されうる。ｎ＝０…Ｎ−１のｙ(ｎ)が利用できず、それに対して代理フレームｚ(ｎ)が生成されなければならないセグメントであり、ｎ＜０のｙ(ｎ)が利用可能な先に復号された信号である場合、長さＬ及び開始インデクスｎ_-1の利用可能な信号のプロトタイプフレームが、ウィンドウ関数ｗ(ｎ)を用いて抽出され、例えばＤＦＴを用いて、周波数領域に変換される：

ウィンドウ関数は、正弦解析における上述のウィンドウ関数の１つでありうる。好ましくは、計算の複雑性を抑えるために、周波数変換されたフレームは、正弦解析の間に用いられるものと同一であるべきである。

次のステップにおいて、正弦波モデルの仮定が適用される。正弦波モデルの仮定に従って、プロトタイプフレームのＤＦＴは、以下のように書くことができる：

この式については、解析部分においても使用されたものであり、上で詳細に説明している。

次に、使用されるウィンドウ関数のスペクトルが、ゼロに近い周波数範囲においてのみ十分な寄与をすることが実現される。ウィンドウ関数の振幅スペクトルは、ゼロに近い及びその他の小さい周波数（サンプリング周波数の半分に対応する−πからπまでの正規化周波数の範囲内）に対して大きい。したがって、近似値として、ウィンドウスペクトルＷ(ｍ)がある区間に対してのみ非ゼロであることが想定される。

Ｍ＝［−ｍ_min、ｍ_max］であり、ｍ_min及びｍ_maxは小さい正数である。具体的には、ウィンドウ関数スペクトルの近似値は、各ｋに対して、上の式におけるシフトされたウィンドウスペクトルの寄与が厳密にオーバーラップしないように、使用される。したがって、上の式において、各周波数インデクスに対して、最大値においてのみ、１つの加数からの、すなわち、１つのシフトされたウィンドウスペクトルからの寄与が存在する。これは、上の式が以下の近似式まで縮小することを意味する：
非負のｍ∈Ｍ_k及び各ｋに対して、

である。

ここで、Ｍ_kは、整数間隔を表し、Ｍ_k＝［ｒｏｕｎｄ（ｆ_k・Ｌ／ｆ_s）−ｍ_{min, k}、ｒｏｕｎｄ（ｆ_k・Ｌ／ｆ_s）＋ｍ_{max, k}］であり、ｍ_{min, k}及びｍ_{max, k}は、間隔がオーバーラップしないような上述の制約を満たす。ｍ_{min, k}及びｍ_{max, k}の適切な選択は、それらを小さい整数値、例えばδ＝３に設定することである。その一方で、２つの隣接する正弦曲線周波数ｆ_k及びｆ_k+1に関連するＤＦＴインデクスが２δより小さい場合、δは、間隔がオーバーラップしないことを確実にするように、ｆｌｏｏｒ((ｒｏｕｎｄ(ｆ_k+1・Ｌ／ｆ_s)−ｒｏｕｎｄ(ｆ_k・Ｌ／ｆ_s))／２)に設定される。関数ｆｌｏｏｒ(・)は、関数変数に対して、それ以下の最も近い整数である。

本実施形態にかかる次のステップは、上の式に従って正弦波モデルを適用して、時間においてＫ個の正弦曲線を展開することである。プロトタイプフレームの時間インデクスと比較して、消えたセグメントの時間インデクスがｎ_-1サンプルだけ異なる仮定は、正弦曲線の位相がθ_k＝２πｆ_kｎ_-1／ｆ_sだけ進むことを意味する。

したがって、展開された正弦波モデルＤＦＴスペクトルは、

によって与えられる。

近似値であって、それによってシフトされたウィンドウ関数のスペクトルがオーバーラップしない近似値を再度適用することによって、非負のｍ∈Ｍ_k及び各ｋに対して、Ｙ'₀＝(ａ_k／２)・Ｗ(２π(ｍ／Ｌ−ｆ_k／ｆ_s))・ｅ^j(φk+θk)が与えられる。

プロトタイプフレームのＤＦＴＹ_-1(ｍ)を、展開された正弦波モデルのＤＦＴＹ₀(ｍ)と、近似値を用いて比較すると、位相が各ｍ∈Ｍ_kに対してθ_k＝２π・ｆ_kｎ_-1／ｆ_sだけシフトされる一方で振幅スペクトルが変化しないままであることが分かる。

したがって、代理フレームは、非負のｍ∈Ｍ_k及び各ｋに対して、Ｚ(ｍ)＝Ｙ(ｍ)・ｅ^jθkとする場合の、ｚ(ｎ)＝ＩＤＦＴ｛Ｚ(ｍ)｝によって計算されうる。

特定の実施形態は、いずれの間隔Ｍ_kにも属しないＤＦＴインデクスに対する位相ランダム化に対処する。上述のように、間隔Ｍ_k（ｋ＝１…Ｋ）は、それらが厳格にオーバーラップしないように、設定されなければならず、それは、間隔のサイズを制御するあるパラメータδを用いて行われる。２つの隣接する正弦曲線の周波数距離に関してδが小さいことがありうる。したがって、その場合、２つの間隔の間にギャップがあることが起こる。このため、対応するＤＦＴインデクスｍに対して、上述の式Ｚ(ｍ)＝Ｙ(ｍ)・ｅ^jθkに従って、位相シフトが定義されない。この実施形態による適切な選択は、これらのインデクスに対する位相をランダム化し、関数ｒａｎｄ(・)があるランダム数を返す場合に、Ｚ(ｍ)＝Ｙ(ｍ)・ｅ^{j2πrand(・)}を与えることである。

１つのステップにおいて、先に受信されたまたは再構成されたオーディオ信号の一部の正弦解析が実行され、ここで、正弦解析は、オーディオ信号の正弦波成分、すなわち正弦曲線の周波数を特定することを含む。次に、１つのステップにおいて、先に受信されたまたは再構成されたオーディオ信号のセグメントに正弦波モデルが適用され、ここで、失われたオーディオフレームに対する代理フレームを生成するために、プロトタイプフレームとしてこのセグメントが用いられ、１つのステップにおいて、対応する特定された周波数に応答して、失われたオーディオフレームに対する代理フレームが生成され、これは、失われたオーディオフレームの時間インスタンスまでのプロトタイプフレームの正弦波成分すなわち正弦曲線の時間展開を含む。

更なる実施形態によれば、オーディオ信号が有限数の別個の正弦波成分からなり、正弦解析が周波数領域で実行されるものとする。さらに、正弦波成分の周波数の特定は、使用される周波数変換に関するスペクトルのピークの近傍の周波数を特定することを含みうる。

例示の実施形態によれば、正弦波成分の周波数の特定が、使用される周波数変換の分解能より高い分解能を用いて実行され、その特定は、さらに、例えば放物線タイプの補間を含みうる。

例示の実施形態によれば、方法は、ウィンドウ関数を用いて先に受信された又は再構成された利用可能な信号からプロトタイプフレームを抽出することを含み、抽出されたプロトタイプフレームは、周波数領域に変換されうる。

更なる実施形態は、近似されたウィンドウ関数スペクトルの厳格にオーバーラップしない部分から代理フレームのスペクトルが構成されるように、ウィンドウ関数のスペクトルの近似を含む。

更なる例示の実施形態によれば、方法は、各正弦波成分の周波数に応じて、また、失われたオーディオフレームとプロトタイプフレームとの間の時間差に応じて、正弦波成分の位相を進めることによって、プロトタイプフレームの周波数スペクトルの正弦波成分を時間展開することと、正弦波周波数ｆ_k及び失われたオーディオフレームとプロトタイプフレームとの時間差に比例する位相シフトによって、正弦波ｋの近傍における間隔Ｍ_kに含まれるプロトタイプフレームのスペクトル係数を変更することとを含む。

更なる実施形態は、特定された正弦曲線に属しないプロトタイプフレームのスペクトル係数の位相をランダム位相だけ変更すること、または、特定された正弦曲線の近傍に関する間隔のいずれにも含まれないプロトタイプフレームのスペクトル係数の位相をランダム値だけ変更することを含む。

実施形態は、さらに、プロトタイプフレームの周波数スペクトルの逆周波数変換を含む。

より具体的には、更なる実施形態に係るオーディオフレーム喪失隠蔽方法は、以下のステップを含む：

１）利用可能な、先に合成された信号のセグメントを解析し、正弦波モデルの構成正弦波周波数ｆ_kを取得する。

２）利用可能な先に合成された信号からプロトタイプフレームｙ_-1を抽出し、そのフレームのＤＦＴを計算する。

３）正弦波周波数ｆ_kとプロトタイプフレームと代理フレームとの間の時間アドバンスｎ_-1とに応じて、各正弦曲線ｋに対する位相シフトθ_kを計算する。

４）各正弦曲線ｋに対して、正弦曲線周波数ｆ_kの周囲の近傍に関するＤＦＴインデクスに対して選択的にθ_kを用いて、プロトタイプフレームＤＦＴの位相を進める。

５）４）で得られたスペクトルの逆ＤＦＴを計算する。

上述の実施形態は、さらに、以下の仮定によって説明されうる：

ａ）信号が有限数の正弦曲線によって表現可能である仮定。

ｂ）代理フレームは、より早いある瞬間と比較して、時間において展開されたこれらの正弦曲線によって十分に良好に表現される仮定。

ｃ）代理フレームのスペクトルを、周波数シフトされたウィンドウ関数スペクトルのオーバーラップしない部分によって、作り上げることができ、シフト周波数は正弦曲線周波数であるような、ウィンドウ関数のスペクトルの近似の仮定。

ＰｈａｓｅＥＣＵの更なる作りこみに関する情報が以下提示される：

ここで説明される実施形態の概要は、以下、
−先に受信され又は再構成されるオーディオ信号の少なくとも一部の、オーディオ信号の正弦波成分の周波数を特定することを含んだ正弦解析を実行することと、
−失われたフレームに対する代理フレームを生成するために、プロトタイプフレームとして用いられるセグメントであって、先に受信され又は再構成されるオーディオ信号のセグメントに正弦波モデルを適用することと、
−失われたオーディオフレームに対する代理フレームを生成することであって、これは対応する特定された周波数に基づく、失われたオーディオフレームのタイムインスタンスまでのプロトタイプフレームの正弦波成分の時間展開を含み、
−周波数の特定において、メインローブ近似とハーモニックエンハンスメントとフレーム間エンハンスメントとの少なくとも１つを含んだ向上した周波数推定の少なくとも１つと、オーディオ信号の調性に応じた代理フレームの生成の適合と、を実行することと、
によって失われたオーディオフレームを隠蔽することを含む。

ここで説明される実施形態は、向上した周波数推定を含む。これは、例えば、メインローブ近似、ハーモニックエンハンスメント、またはフレーム間エンハンスメントを用いて実装されてもよく、それらの３つの選択肢の実施形態について後述する。

メインローブ近似
上述の放物線補間を伴う１つの制限は、使用される放物線はウィンドウ関数の振幅スペクトル|Ｗ(Ω)|のメインローブの形状を近似しないことから生じる。ソリューションとして、この実施形態は、ピークを取り囲むＤＦＴ振幅スペクトルの格子点を通じて|Ｗ(２π・ｑ／Ｌ)|のメインローブを近似する関数Ｐ(ｑ)を適合させ、関数の極大値に属しない個別の周波数を計算する。関数Ｐ(ｑ)は、ウィンドウ関数の周波数シフトされた振幅スペクトル|Ｗ(２π・(ｑ−ｑ')／Ｌ)|と同一でありうる。しかしながら、計算を簡単にするために、むしろ、例えば関数の極大値の簡単な計算を可能とする多項式であるべきである。以下の詳細な手順が適用される：

１．ウィンドウイングされた解析フレームのＤＦＴのピークを特定する。ピークの探索は、ピークの数Ｋとピークの対応するＤＦＴインデクスを導出する。ピークの探索は、通常、ＤＦＴ振幅スペクトル又は対数ＤＦＴ振幅スペクトルにおいてなされうる。

２．所与の間隔(ｑ₁、ｑ₂)に対して、ウィンドウ関数の振幅スペクトル|Ｗ(２π・ｑ／Ｌ)|又は対数振幅スペクトルｌｏｇ|Ｗ(２π・ｑ／Ｌ)|を近似する関数Ｐ(ｑ)を導出する。

３．対応するＤＦＴインデクスを有する（ｋ＝１…Ｋでの）各ピークｋに対して、ウィンドウイングされた正弦波信号のスペクトルの予想される真のピークを囲む２つのＤＦＴ格子点を通じて、ｍ_kを周波数シフトされた関数Ｐ(ｑ−ｑ'_k)に合わせる。したがって、対数振幅スペクトルで操作する場合に対して、|Ｘ(ｍ_k−１)|が|Ｘ(ｍ_k＋１)|より大きい場合は点｛Ｐ₁；Ｐ₂｝＝｛(ｍ_k−１、ｌｏｇ(|Ｘ(ｍ_k−１)|))；(ｍ_k、ｌｏｇ(|Ｘ(ｍ_k)|))｝を通じて、その他の場合は点｛Ｐ₁；Ｐ₂｝＝｛(ｍ_k、ｌｏｇ(|Ｘ(ｍ_k)|))；(ｍ_k＋１、ｌｏｇ(|Ｘ(ｍ_k＋１)|))｝を通じて、Ｐ(ｑ−ｑ'_k)を適合させる。対数ではなく線形の振幅スペクトルで操作する別の例に対して、|Ｘ(ｍ_k−１)|が|Ｘ(ｍ_k＋１)|より大きい場合は点｛Ｐ₁；Ｐ₂｝＝｛(ｍ_k−１、|Ｘ(ｍ_k−１)|)；(ｍ_k、|Ｘ(ｍ_k)|)｝を通じて、その他の場合は点｛Ｐ₁；Ｐ₂｝＝｛(ｍ_k、|Ｘ(ｍ_k)|)；(ｍ_k＋１、|Ｘ(ｍ_k＋１)|)｝を通じて、Ｐ(ｑ−ｑ'_k)を適合させる。Ｐ(ｑ)は、簡単のため、次数が２又は４のいずれかの多項式が選ばれうる。これは、ステップ２における近似値を単純な線形退行計算に、そしてｑ'_kの計算を簡単にする。間隔(ｑ₁、ｑ₂)は、固定されるとともにすべてのピークに対して同一の、例えば(ｑ₁、ｑ₂)＝（−１、１）のように、または適応的に選択されうる。

適応的なアプローチにおいて、関数Ｐ(ｑ−ｑ'_k)が、関連するＤＦＴ格子点｛Ｐ₁；Ｐ₂｝の範囲内でウィンドウ関数スペクトルのメインローブを適合させるように、間隔が選択されうる。

４．ウィンドウイングされた正弦波信号の連続スペクトルがピークを有すると期待されるＫ個の周波数シフトパラメータｑ'_kのそれぞれに対して、正弦曲線周波数ｆ_kに対する近似値として、ｆ'_k＝ｑ'_k・ｆ_s／Ｌを計算する。

周波数推定のハーモニックエンハンスメント
送信信号は、ハーモニックであってもよく、これは、その信号がある基本周波数ｆ₀の整数倍の周波数を有する正弦波からなることを意味する。これは、信号が、声に出した会話又はある楽器の持続されている音調に対するように非常に周期的である場合である。これは、実施形態の正弦波モデルの周波数は独立ではないが、ハーモニックな関係を有するとともにある基本周波数から生じることを意味する。このハーモニックな特性を考慮することによって、結果として、正弦波成分の周波数の解析を大きく向上させることができ、この実施形態は、以下の手順を含む：

１．信号がハーモニックであるかを確認する。これは、例えば、フレームの喪失に先立って信号の周期性を評価することによって行われうる。１つの簡単な方法は、信号の自己相関解析を実行することである。あるタイムラグτ＞０に対するこのような自己相関関数の最大値をインジケータとして用いることができる。この最大の値が所与の閾値を超える場合、その信号はハーモニックと見なされうる。そして、対応するタイムラグτは、基本周波数ｆ₀＝ｆ_s／τに関連する信号の周期に対応する。

多くの線形予測会話符号化方法は、適応コードブックを用いたいわゆるオープン又はクローズドループのピッチ予測又はＣＥＬＰ（符号励振線形予測）符号化を適用する。このような符号化方法によって得られるピッチ利得及び関連付けられたピッチラグパラメータもまた、信号がハーモニックである場合に、タイムラグに対して、それぞれ、有用なインジケータである。

更なる方法について以下説明する：

２．整数範囲１…Ｊ_maxの範囲内の各ハーモニックインデクスｊに対して、ハーモニック周波数ｆ_j＝ｊｆ₀の近傍の範囲内の解析フレームの（対数）ＤＦＴ振幅スペクトルにおいてピークがあるか否かを確認する。ｆ_jの近傍は、デルタがＤＦＴの周波数分解能ｆ_s／Ｌに対応するｆ_jの周囲のデルタの範囲、すなわち、間隔［ｊ・ｆ₀−ｆ_s／(２・Ｌ)、ｊ・ｆ₀＋ｆ_s／(２・Ｌ)］として定められうる。

対応する推定された正弦波周波数ｆ'_kを伴うこのようなピークが存在する場合、ｆ'_kをｆ''_k＝ｊ・ｆ₀によって入れ替える。

上で与えた手順に対して、信号がハーモニックであるかの確認及び基本周波数の導出を黙示的に、また、場合によっては、ある別個の方法からのインジケータを必ずしも用いずに繰り返す方法で、行う可能性がある。このような技術の例は、以下のように与えられる：

候補値のセット｛ｆ_0,1…ｆ_0,P｝中の各ｆ_0,Pに対して、ｆ'_kを入れ替えないが、ハーモニック周波数すなわちｆ_0,Pの整数倍の周囲の近傍の範囲内にどれだけ多くのＤＦＴピークが存在するかをカウントして、上述の手順２を適用する。そのハーモニック周波数において又はその周囲で最も多くのピークが得られた基本周波数ｆ_0,Pmaxを特定する。このピークの最多数が所与の閾値を超える場合、信号は、ハーモニックであると仮定される。その場合、ｆ_0,Pmaxが、その後それを用いて向上した正弦波周波数ｆ''_kをもたらす手順２が実行される、基本周波数であると仮定されうる。その一方で、より好ましい選択肢は、まず、ハーモニック周波数に一致することが分かったｆ'_kピーク周波数に基づいて、基本周波数推定値ｆ₀を最適化することである。周波数ｆ'_k(m)（ｍ＝１…Ｍ）におけるＭ個のスペクトルのピークのあるセットと一致することが分かったＭ個の倍音、すなわち、ある基本周波数の整数倍｛ｎ₁…ｎ_M｝のセットを仮定して、その後、基礎的な（最適化された）基本周波数推定値ｆ_{0, opt}がハーモニック周波数とスペクトルピーク周波数との間の誤差を最小化するように計算されうる。最小化されるべき誤差が平均二乗誤差Ｅ₂＝Σ_m=1 ^M(ｎ_m・ｆ₀−ｆ'_k(m))²である場合、最適化された基本周波数推定値は、ｆ₀＝(Σ_m=1 ^Mｎ_m・ｆ'_k(m))／Σ_m=1 ^Mｎ_m ²として計算される。

候補値の初期セット｛ｆ_{0, 1}…ｆ_{0, P}｝は、ＤＦＴピークの周波数又は推定された正弦波周波数ｆ'_kから得ることができる。

周波数推定のフレーム間エンハンスメント
この実施形態によれば、推定された正弦波周波数ｆ'_kの精度が、それらの一時的な展開を考慮することによって向上させられる。したがって、複数の解析フレームからの正弦波周波数の推定値が、例えば平均化または予測を用いて合成される。平均化または予測に先立って、推定されたスペクトルのピークを個別の同じ基礎的な正弦曲線につなげるピーク追跡が適用される。

ウィンドウ関数は、正弦解析における上述のウィンドウ関数の１つでありうる。好ましくは、計算の複雑性を抑えるために、周波数変換されたフレームは、正弦解析の間に用いられるものと同一であるべきであり、これは、解析フレームとプロトタイプフレームとが、同様にそれらのそれぞれの周波数変換が同一であることを意味する。

次に、使用されるウィンドウ関数のスペクトルが、ゼロに近い周波数範囲においてのみ十分な寄与をすることが実現される。上述のように、ウィンドウ関数の振幅スペクトルは、ゼロに近い及びその他の小さい周波数（サンプリング周波数の半分に対応する−πからπまでの正規化周波数の範囲内）に対して大きい。したがって、近似値として、ウィンドウスペクトルＷ(ｍ)は間隔Ｍ＝［−ｍ_min、ｍ_max］に対してのみ非ゼロであり、ｍ_min及びｍ_maxは小さい正数であることが想定される。具体的には、ウィンドウ関数スペクトルの近似値は、各ｋに対して、上の式におけるシフトされたウィンドウスペクトルの寄与が厳密にオーバーラップしないように、使用される。したがって、上の式において、各周波数インデクスに対して、最大値においてのみ、１つの加数からの、すなわち、１つのシフトされたウィンドウスペクトルからの寄与が存在する。これは、上の式が以下の近似式まで縮小することを意味する：
非負のｍ∈Ｍ_k及び各ｋに対して、

である。

ここで、Ｍ_kは、整数間隔を表し、Ｍ_k＝［ｒｏｕｎｄ（ｆ_k・Ｌ／ｆ_s）−ｍ_{min, k}、ｒｏｕｎｄ（ｆ_k・Ｌ／ｆ_s）＋ｍ_{max, k}］であり、ｍ_{min, k}及びｍ_{max, k}は、間隔がオーバーラップしないような上述の制約を満たす。ｍ_{min, k}及びｍ_{max, k}の適切な選択は、それらを小さい整数値δに、例えばδ＝３に設定することである。その一方で、２つの隣接する正弦曲線周波数ｆ_k及びｆ_k+1に関連するＤＦＴインデクスが２δより小さい場合、δは、間隔がオーバーラップしないことを確実にするように、ｆｌｏｏｒ((ｒｏｕｎｄ(ｆ_k+1・Ｌ／ｆ_s)−ｒｏｕｎｄ(ｆ_k・Ｌ／ｆ_s))／２)に設定される。関数ｆｌｏｏｒ(・)は、関数変数に対して、それ以下の最も近い整数である。

によって与えられる。

したがって、代理フレームは、非負のｍ∈Ｍ_k及び各ｋに対して、Ｚ(ｍ)＝Ｙ(ｍ)・ｅ^jθkとする場合の、ｚ(ｎ)＝ＩＤＦＴ｛Ｚ(ｍ)｝によって計算されうる。ここで、ＩＤＦＴは逆ＤＦＴを表す。

信号の調性に応じて区間Ｍ_kのサイズを適応させる実施形態について、以下、説明する。

本発明の１つの実施形態は、信号の調性に応じて、間隔Ｍ_kのサイズを適応させることを含む。この適応は、例えばメインローブ推定、ハーモニックエンハンスメント、またはフレーム間エンハンスメントを用いる上述の向上した周波数推定と組み合わせられてもよい。しかしながら、代わりに、信号の調性に応じた間隔Ｍ_kのサイズの適応は、先立つ向上した周波数推定を用いずに実行されてもよい。

間隔Ｍ_kのサイズを最適化することが、再構成された信号の品質に対して有益であることが分かっている。具体的には、信号が非常に調性のある場合、すなわち、明確かつ区別されるスペクトルのピークを有する場合、間隔はより大きくあるべきである。これは、例えば、信号が明確な周期性を有してハーモニックである場合である。信号がより広いスペクトルの最大値を有して、よりはっきりしないスペクトル構造を有する他の場合、小さい間隔を用いることがよりよい品質をもたらすことが分かっている。このことは、信号の特性に従って間隔のサイズが適合させられることに応じて、さらなる改善をもたらす。１つの実現は、調整又は周期性検出器を用いることである。この検出器が信号を調整ありと特定した場合、間隔のサイズを制御するδパラメータは、相対的に大きい値に設定される。その他の場合、δパラメータは、相対的により小さい値に設定される。

先に受信されたまたは再構成されたオーディオ信号の一部の正弦解析が実行され、ここで、正弦解析は、１つのステップにおいて、そのオーディオ信号の正弦波成分の、すなわち正弦曲線の、周波数を特定することを含む。１つのステップにおいて、先に受信されたまたは再構成されたオーディオ信号のセグメントであって、失われたオーディオフレームに対する代理フレームを生成するためのプロトタイプフレームとして用いられるセグメントに正弦波モデルが適用され、１つのステップにおいて、対応する特定された周波数に応じて、失われたオーディオフレームの時間インスタンスまでのプロトタイプフレームの正弦波成分の、すなわち正弦曲線の時間展開を含んで、その失われたオーディオフレームに対する代理フレームが生成される。しかしながら、正弦波成分の周波数を特定するステップと代理フレームを生成するステップとの少なくともいずれかは、さらに、周波数の特定における向上した周波数推定と、オーディオ信号の調性に応じた代理フレームの生成の適合との少なくとも１つを実行することを含みうる。向上した周波数推定は、メインローブ近似、ハーモニックエンハンスメント、及びフレーム間エンハンスメントの少なくとも１つを含む。

さらなる実施形態によれば、オーディオ信号が制限された数の個別の正弦波成分からなることが仮定される。

例示の実施形態によれば、方法は、ウィンドウ関数を用いて先に受信されたまたは再構成された利用可能な信号からプロトタイプフレームを抽出することを含み、抽出されたプロトタイプフレームは、周波数領域表現へと変換されうる。

第１の選択肢の実施形態によれば、向上した周波数推定は、ウィンドウ関数に関する振幅スペクトルのメインローブの形状を近似することを含み、さらに、１つ以上のスペクトルのピーク（ｋ）及び解析フレームに関連する対応する離散周波数変換インデクスｍ_kを識別してもよく；ウィンドウ関数に関する振幅スペクトルを近似する関数Ｐ(ｑ)を導出すること、および、各ピーク（ｋ）に対して、対応する離散周波数変換インデクスｍ_kを用いて、解析フレームに関する仮定される正弦波モデル信号の連続するスペクトルの予想される真のピークを囲む離散周波数変換の２つの格子点を通じて周波数シフトされた関数Ｐ(ｑ−ｑ_k)を適合させることを含む。

第２の選択肢の実施形態によれば、向上した周波数推定は、オーディオ信号がハーモニックであるかを判定することと、信号がハーモニックである場合に基本周波数を導出することとを含んだハーモニックエンハンスメントである。判定は、オーディオ信号の自己相関解析を実行することと、クローズドループピッチ予測の結果、例えばピッチ利得を用いることとの少なくとも１つを含みうる。導出するステップは、クローズドループピッチ予測のさらなる結果、例えばピッチラグを使用することを含みうる。さらに、第２の代替の実施形態によれば、導出するステップは、ハーモニックインデクスｊに対して、このハーモニックインデクス及び基本周波数に関するハーモニック周波数の近傍の範囲内に振幅スペクトルにおけるピークが存在するかを確認することを含んでもよく、ここで、振幅スペクトルは、特定するステップに関連付けられる。

第３の選択肢の実施形態によれば、向上した周波数推定は、２つ以上のオーディオ信号フレームからの特定された周波数を合成することを含んだフレーム間エンハンスメントである。合成は、平均化と予測との少なくともいずれかを含み、ピーク追跡が平均化と予測との少なくともいずれかの前に適用されうる。

実施形態によれば、オーディオ信号の調性に応じた適合は、オーディオ信号の調性に応じて、正弦波成分ｋの近傍に位置する間隔Ｍ_kのサイズを適合させることを含む。さらに、間隔のサイズの適合は、比較的より明白なスペクトルピークを有するオーディオ信号に対する間隔のサイズを増やし、比較的より広範なスペクトルピークを有するオーディオ信号に対する間隔のサイズを減らすことを含みうる。

実施形態による方法は、正弦波成分の周波数に応じて、かつ、失われたオーディオフレームとプロトタイプフレームとの間の時間差に応じて、この正弦波成分の位相を進めることによってプロトタイプフレームの周波数スペクトルの正弦波成分を時間展開することを含みうる。正弦波周波数ｆ_k及び失われたオーディオフレームとプロトタイプフレームとの間の時間差に比例する位相シフトだけ正弦曲線ｋの近傍に位置する間隔Ｍ_kに含まれるプロトタイプフレームのスペクトル係数を変更することをさらに含みうる。

スペクトル係数の上述の変更の後のプロトタイプフレームの周波数スペクトルの逆周波数変換を含んでもよい。

より具体的には、更なる実施形態に係るオーディオフレーム喪失隠蔽方法は、以下のステップを含みうる：

３）正弦波周波数ｆ_kとプロトタイプフレームと代理フレームとの間の時間アドバンスｎ_-1とに応じて、各正弦曲線ｋに対する位相シフトθ_kを計算する。ここで、間隔のサイズＭ_kは、オーディオ信号の調性に応じて、適合されていてもよい。

５）４）で得られたスペクトルの逆ＤＦＴを計算する。

ｄ）信号が有限数の正弦曲線によって表現可能である仮定。

ｅ）代理フレームは、より早いある瞬間と比較して、時間において展開されたこれらの正弦曲線によって十分に良好に表現される仮定。

ｆ）代理フレームのスペクトルを、周波数シフトされたウィンドウ関数スペクトルのオーバーラップしない部分によって、作り上げることができ、シフト周波数は正弦曲線周波数であるような、ウィンドウ関数のスペクトルの近似の仮定。

以下は、先に言及されたＰｈａｓｅＥＣＵのための制御方法に関する。

フレーム喪失隠蔽方法の適応化
上で実行されるステップがフレーム喪失隠蔽動作の適応を示唆する条件を示している場合、代理フレームのスペクトルの計算が変形される。

代理フレームのスペクトルの本来の計算が、式Ｚ(ｍ)＝Ｙ(ｍ)・ｅ^jθkに従って行われる一方で、ここでは、振幅と位相の両方を変更する適応が導入される。振幅は２つの係数α(ｍ)及びβ(ｍ)を伴うスケーリングを用いて変更され、位相は加法位相要素θ'(ｍ)を用いて変更される。これは、代理フレームの以下の変更された計算をもたらす：
Ｚ(ｍ)＝α(ｍ)・β(ｍ)・Ｙ(ｍ)・ｅ^{j(θk+θ'(ｍ))}
α(ｍ)＝１、β(ｍ)＝１、及びθ'(ｍ)＝０である場合、元の（適応されていない）フレーム喪失隠蔽方法が用いられることに留意すべきである。したがって、これらの各値はデフォルトである。

振幅適応を用いる一般的な目的は、フレーム喪失隠蔽方法の聴くことができるアーチファクトを避けることである。このようなアーチファクトは、瞬間的な音の繰り返しから生じる音楽的な、又は調性のある音、又は奇妙な音でありうる。一方、このようなアーチファクトは、その回避が説明された適応の目的である品質劣化を引き起こしうる。このような適応に対する適切な方法は、代理フレームの振幅スペクトルを適切な度合いに変更することである。

ここで、隠蔽方法の変形の実施形態について説明する。振幅の適応は、好ましくは、バースト誤りカウンタｎ_burstが、ある閾値ｔｈｒ_burst、例えばｔｈｒ_burst＝３を超える場合に行われる。その場合、１より小さい値が減衰係数に用いられ、例えばα(ｍ)＝０．１である。

その一方で、度合いを徐々に増やして減衰を実行することが有益であることが分かっている。これを完遂する１つの好ましい実施形態は、フレームごとの減衰における対数増加を特定する対数パラメータａｔｔ＿ｐｅｒ＿ｆｒａｍｅを定めることである。そして、バーストカウンタが閾値を超えた場合に、徐々に増加する減衰係数は、
α(ｍ)＝１０^{c・att_per_frame・(n_burst-thr_burst)}
によって計算される。ここで、定数ｃは、例えばデシベル（ｄＢ）においてパラメータａｔｔ＿ｐｅｒ＿ｆｒａｍｅを特定することを可能とする、単なるスケーリング定数である。

追加の好ましい適応は、信号が音楽であると推定されるか会話であると推定されるかのインジケータに応じて行われる。会話コンテンツと比較して音楽コンテンツに対しては、閾値ｔｈｒ_burstを増やすこと及びフレームごとに減衰を減らすことが好ましい。これは、より低い程度のフレーム喪失隠蔽方法の適応を実行することと等価である。この種の適応の背景は、一般的に、音楽が、会話と比べてより長い喪失バーストに対して敏感でないことである。したがって、本来の、すなわち、変更されていないフレーム喪失隠蔽方法が、少なくとも連続的で多数のフレーム喪失に対して、なおもこの場合に適切である。

振幅減衰係数に関する隠蔽方法のさらなる適応は、好ましくは、インジケータＲ_{l/r, band}(ｋ)又は代わりにＲ_l/r(ｍ)又はＲ_l/rが閾値を超えたことに基づいて過渡変化が検出された場合に、行われる。その場合、適切な適応動作は、２つの係数の積α(ｍ)・β(ｍ)によって全体の減衰が制御されるように、第２の振幅減衰係数β(ｍ)を変更することである。

β(ｍ)は、過渡変化が示されたことに応じて設定される。オフセットが検出された場合、係数β(ｍ)は、好ましくは、そのオフセットのエネルギーの減少を反映するように選択される。適切な選択は、β(ｍ)を検出された利得の変化に設定することであり、
ｍ∈Ｉ_k、ｋ＝１…Ｋに対して、β(ｍ)＝√Ｒ_{l/r, band}(ｋ)
である。オンセットが検出された場合、代理フレームにおけるエネルギーの増加を制限することが有益であることが分かっている。その場合、係数を例えば１のある固定値に設定することができ、これは、減衰も増幅もないことを意味する。

上では、振幅減衰係数が好ましくは周波数選択性を適用されること、すなわち、各周波数帯域に対して別個に計算される係数を伴うことに気づかれるべきである。帯域アプローチが用いられない場合、対応する振幅減衰係数は、アナログの方法で取得されうる。そして、周波数選択性の過渡変化の検出がＤＦＴビンレベルで用いられる場合、β(ｍ)は各ＤＦＴビンに対して個別に設定されうる。又は、周波数選択性の過渡変化の指標が全く使用されない場合、β(ｍ)は、すべてのｍに対して全域で同一でありうる。

振幅減衰係数の更なる好ましい適応は、加法位相要素θ'(ｍ)を用いた位相の変更と併せて行われる。所与のｍに対してこのような位相変更が用いられる場合、減衰係数β(ｍ)は、さらに減少させられる。好ましくは、位相変更の度合いまでも考慮される。位相変更が中庸なだけである場合、β(ｍ)は、少しだけスケールダウンされるが、一方で、位相変更が強い場合、β(ｍ)は、より大きい度合いまでスケールダウンされる。

位相適応を導入することを用いる一般的な目的は、その後に品質劣化を引き起こすであろう、生成された代理フレームにおける強すぎる調性又は信号周期を避けることである。このような適応に対する適切な方法は、位相を適切な度合いまでランダム化すること又はディザすることである。

このような位相ディザリングは、ある制御係数θ'(ｍ)＝ａ(ｍ)・ｒａｎｄ(・)を用いてスケーリングされる加法位相要素θ'(ｍ)がランダム値に設定される場合に完遂される。

関数ｒａｎｄ(・)により得られるランダム値は、例えば、ある疑似乱数生成器によって生成される。ここで、間隔［０、２π］の範囲内のランダム数を提供することが仮定される。

常識におけるスケーリング係数ａ(ｍ)は、その分だけ元の位相θ_kがディザリングされる度合いを制御する。以下の実施形態は、スケーリング係数の制御を用いて位相適応に対処する。スケーリング係数の制御は、上述の振幅変更係数の制御のようにアナログの方法で行われる。

第１の実施形態によれば、スケーリング係数ａ(ｍ)は、バースト喪失カウンタに応答して適応される。バースト喪失カウンタｎ_burstがある閾値ｔｈｒ_burst、例えばｔｈｒ_burst＝３を超える場合に、０より大きい値、例えばａ(ｍ)＝０．２が用いられる。

一方で、徐々に度合いを増やしながらディザリングを実行することが有益であることが分かっている。これを完遂する１つの好ましい実施形態は、フレームごとのディザリングにおける増加を特定するパラメータｄｉｔｈ＿ｉｎｃｒｅａｓｅ＿ｐｅｒ＿ｆｒａｍｅを定義することである。そして、バーストカウンタが閾値を超える場合、徐々に増加するディザリング制御係数は、
ａ(ｍ)＝ｄｉｔｈ＿ｉｎｃｒｅａｓｅ＿ｐｅｒ＿ｆｒａｍｅ・（ｎ_burst−ｔｈｒ_burst）
によって計算される。なお、上式において、ａ(ｍ)は、完全な位相ディザリングが達成される最大値１に制限されなければならない。

なお、位相ディザリングを初期化するのに用いられるバースト喪失閾値ｔｈｒ_burstは、振幅減衰に用いられるものと同じ閾値でありうる。しかしながら、これらの閾値を別個の最適値に設定することによって、より良好な品質を得ることができ、これは、一般的に、これらの閾値が異なりうることを意味する。

追加の好ましい適応は、信号が音楽であると推定されたか会話であると推定されたかのインジケータに応答して行われる。会話コンテンツと比較して音楽コンテンツに対しては、会話と比較して音楽に対する位相ディザリングが連続してより多くのフレームが失われた場合にのみ行われることを意味する、閾値ｔｈｒ_burstを増やすことが好ましい。これは、音楽に対するより低い程度のフレーム喪失隠蔽方法の適応を実行することと等価である。この種の適応の背景は、音楽が、一般的に、会話よりも長い喪失バーストに対してセンシティブでないことである。したがって、元の、すなわち、変更されていないフレーム喪失隠蔽方法が、少なくとも連続的な多数の喪失フレームに対して、好ましいままである。

さらなる好ましい実施形態は、過渡変化が検出されたことに応答して移動ディザリングを適応させることである。その場合、より強い度合いの移動ディザリングを、過渡変化そのビンに対して示されているＤＦＴビンｍ、対応する周波数帯域の又は全フレームのＤＦＴビンに用いることができる。

説明される手順の一部は、ハーモニック信号及び特に音声会話に対するフレーム喪失隠蔽方法の最適化を取り扱う。

上述のような向上した周波数推定を用いる方法が実現されない場合、音声会話信号の品質を最適化するフレーム喪失隠蔽方法に対する別の適応の可能性は、特に音楽及び会話を含んで生成されたオーディオ信号ではなく会話に対して設計されるとともに最適化された、ある他のフレーム喪失隠蔽方法に切り替えることである。その場合、音声会話信号を含むことを示すインジケータは、上述の手順とは異なる別の会話に最適化されたフレーム喪失隠蔽手順を選択するために用いられる。

まとめると、相互動作するユニット又はモジュールの選択及びユニットの命名は例示的な目的のためだけのものであり、開示された処理動作を実行することを可能とする複数の別の方法において構成されうることが理解されるべきである。

また、本開示において説明されるユニット又はモジュールは、論理エンティティとして取り扱われるべきであり、別個の物理エンティティとして取り扱われる必要はないことが留意されるべきである。ここで開示される技術の範囲は、当業者に明らかになりうる他の実施形態を含み、したがって、本開示の範囲は限定されるべきでないことが理解されよう。

単数形での要素への参照は、明示的にそのように言及されない限りは、「１つ及び１つのみ」を意味することは意図されておらず、むしろ「１つ以上」を意味する。当業者に知られている上述の実施形態の要素に対するすべての構造的および機能的等価物は、ここでは参照によって明確に取り込まれ、これにより、包含されることが意図される。さらに、機器又は方法は、ここで開示される技術によって解決されることが求められている問題のそれぞれ及びすべてに対処する必要はなく、これにより、包含される。

先の説明では、説明の目的であって限定の目的ではなく、開示される技術の完全な理解を与えるために、特定のアーキテクチャ、インタフェース、技術等の特定の詳細について説明した。しかしながら、開示された技術が、これらの特定の詳細から離れた他の実施形態及び／または実施形態の組み合わせにおいて実現されうることは、当業者に明らかであろう。すなわち、当業者は、ここで明示的に説明され又は示されていないが、開示された技術の原理を具現化する様々な構成を案出することができるだろう。いくつかの例では、周知の機器及び方法の詳細な説明については、不必要な詳細を用いて開示される技術の説明が不明瞭とならないように、省略されている。開示される技術の原理、態様、及び実施形態を記載するここでのすべての説明及びその特定の例は、その構造的および機能的等価物を含むことが意図されている。さらに、このような等価物は、現在知られている等価物及び将来に開発される等価物、例えば、構造によらずに同一の機能を実行する開発された任意の要素を含むことが意図されている。

このように、例えば、当業者には、ここでの図面が、技術の原理とこのようなコンピュータまたはプロセッサが明示的に図面において示されていなくても、コンピュータ可読媒体において実質的に提示されるとともにコンピュータまたはプロセッサによって実行されうる様々な処理との少なくともいずれかを具現化する、説明される回路又は他の機能部の概略図を提示することができることが理解されるだろう。

機能ブロックを含む様々な要素の機能は、回路ハードウェアおよび／またはコンピュータ可読媒体に記憶されたコーディングされた命令の形式のソフトウェアを実行可能なハードウェアなどのハードウェアを通じて提供されうる。したがって、このような機能及び説明された機能ブロックは、ハードウェア実装されるか、コンピュータ実装されるかの少なくともいずれか、したがって機械実装されると理解されるべきである。

上述の実施形態は、本発明の数少ない説明のための例として理解されるべきである。当業者には、様々な変形、組み合わせ及び変更が、本発明の範囲から離れることなく、実施形態に対してなされうることが理解されるだろう。特に、技術的に可能な場合に、異なる実施形態における異なる部分が他の構成において組み合されうる。

発明の概要について、数少ない実施形態を参照して上述した。しかしながら、当業者であればすでに理解しているように、上で開示さるものではない他の実施形態が、添付の特許請求の範囲によって規定されるように、発明の概要の範囲内において、等しく可能である。

Claims

受信エンティティ（１０３、２００、４００、８００、９００）によって実行される、フレーム喪失隠蔽のための方法であって、
失われたフレームに対して代理フレームを構成するのに関連して、雑音要素を当該代理フレームに加算すること（Ｓ１０４、Ｓ２０８）を含み、
前記雑音要素は、先に受信されたフレームにおける信号の低分解能スペクトル表現に対応する周波数特性を有し、当該低分解能スペクトル表現は、前記先に受信されたフレームにおける前記信号の周波数領域の分解能を低くすることにより得られ、
前記雑音要素および前記代理フレームは、連続して失われたフレームの数に応じて前記雑音要素が振幅を増加しながら前記代理フレームに徐々に重ね合わされるように、当該連続して失われたフレームの数に依存するスケール係数を用いてスケーリングされる、
ことを特徴とする方法。
前記代理フレームのスペクトル及び前記雑音要素は、周波数領域において重ね合わされる、
ことを特徴とする請求項１に記載の方法。
前記低分解能スペクトル表現は、前記先に受信されたフレームにおける前記信号の振幅スペクトルに基づく、
ことを特徴とする請求項１又は２に記載の方法。
前記先に受信されたフレームにおける前記信号の前記振幅スペクトルを周波数グループに関して平均化することにより、前記振幅スペクトルの前記低分解能スペクトル表現を取得する（Ｓ２０２ａ）ことをさらに含む、
ことを特徴とする請求項３に記載の方法。
前記先に受信されたフレームにおける前記信号の多数ｎの低分解能な周波数領域変換を周波数グループに関して平均化することにより、前記振幅スペクトルの前記低分解能スペクトル表現を取得する（Ｓ２０２ｂ）ことをさらに含む、
ことを特徴とする請求項３に記載の方法。
前記周波数グループに関しての平均化の間に用いられるグループ幅は、人間の聴覚に重要な帯域に従う、
ことを特徴とする請求項４又は５に記載の方法。
前記低分解能スペクトル表現は、線形予測符号化（ＬＰＣ）のパラメータに基づく、
ことを特徴とする請求項１から６のいずれか１項に記載の方法。
前記雑音要素の前記代理フレームへの前記加算は、時間領域において実行される、
ことを特徴とする請求項１から７のいずれか１項に記載の方法。
前記代理フレームは、減衰係数α(ｍ)によって徐々に減衰させられ、ここで、ｍは前記代理フレームの周波数領域変換の周波数インデクスであり、α(ｍ)は前記代理フレームのｍ番目の周波数領域要素をスケーリングする、
ことを特徴とする請求項２から７のいずれか１項に記載の方法。
前記代理フレームは位相を有し、当該位相はランダム位相値θ'(ｍ)と重ね合わされる、
ことを特徴とする請求項９に記載の方法。
前記雑音要素に対するスケーリング係数β(ｍ)を、β(ｍ)が前記減衰係数α(ｍ)を前記代理フレームに適用することによって生じるエネルギーの損失を補償するように、決定すること（Ｓ２０４）をさらに含む、
ことを特徴とする請求項９又は１０に記載の方法。
前記雑音要素の周波数領域変換の位相に、ランダム位相値η(ｍ)が与えられる、
ことを特徴とする請求項１１に記載の方法。
β(ｍ)は、
β(ｍ)＝√（１−α²(ｍ)）
のように決定される、
ことを特徴とする請求項１１又は１２に記載の方法。
β(ｍ)は、λ(ｍ)が周波数依存の減衰係数である場合にβ(ｍ)＝λ(ｍ)・√（１−α²(ｍ)）のように決定される、
ことを特徴とする請求項１１又は１２に記載の方法。
λ(ｍ)は閾値より低いｍに対して１に等しく、λ(ｍ)は当該閾値を上回るｍに対して１より小さい、
ことを特徴とする請求項１４に記載の方法。
低域通過特性が前記低分解能スペクトル表現に与えられる、
ことを特徴とする請求項１から１５のいずれか１項に記載の方法。
前記減衰係数α(ｍ)及び前記スケーリング係数β(ｍ)は、周波数グループに関して定数である、
ことを特徴とする請求項１１から１５のいずれか１項に記載の方法。
バースト誤り長ｎが第１の閾値（Ｔ１）を超えることが確認されることを条件として、前記雑音要素が前記代理フレームへ加算される、
ことを特徴とする請求項１から１７のいずれか１項に記載の方法。
Ｔ１≧２である、ことを特徴とする請求項１８に記載の方法。
前記第１の閾値以上の第２の閾値（Ｔ２）を前記バースト誤り長ｎが超える場合、長期減衰係数γをβ(ｍ)に適用すること（Ｓ１０３、Ｓ２０６）をさらに含む、
ことを特徴とする請求項１１から１５のいずれか１項に従属する請求項１８又は１９に記載の方法。
Ｔ２≧１０である、ことを特徴とする請求項２０に記載の方法。
前記代理フレームのコンポーネントは、ＰｈａｓｅＥＣＵのような一次的なフレーム喪失隠蔽方法によって導出される、
ことを特徴とする請求項１から２１のいずれか１項に記載の方法。
フレーム喪失隠蔽のための受信エンティティ（１０３、２００、４００、８００、９００）であって、前記受信エンティティは処理回路（８０３）を含み、前記処理回路は、
失われたフレームに対する代理フレームを構成することに関連して、雑音要素を当該代理フレームに加算すること、
を含んだ一連の処理を前記受信エンティティに実行させるように構成され、
前記雑音要素は、先に受信されたフレームにおける信号の低分解能スペクトル表現に対応する周波数特性を有し、当該低分解能スペクトル表現は、前記先に受信されたフレームにおける前記信号の周波数領域の分解能を低くすることにより得られ、
前記雑音要素および前記代理フレームは、連続して失われたフレームの数に応じて前記雑音要素が振幅を増加しながら前記代理フレームに徐々に重ね合わされるように、当該連続して失われたフレームの数に依存するスケール係数を用いてスケーリングされる、
ことを特徴とする受信エンティティ。
前記一連の処理を記憶する記憶媒体（８０４）をさらに有し、
前記処理回路は、前記記憶媒体から前記一連の処理を取得して、前記受信エンティティに当該一連の処理を実行させるように構成される、
ことを特徴とする請求項２３に記載の受信エンティティ。
前記一連の処理は、一連の実行可能な命令として提供される、
ことを特徴とする請求項２３又は２４に記載の受信エンティティ。
フレーム喪失隠蔽のためのコンピュータプログラム（８０５、１００２）であって、前記コンピュータプログラムは、受信エンティティ（１０３、２００、４００、８００、９００）の処理回路（８０３）において実行される場合に、当該受信エンティティに、
失われたフレームに対する代理フレームを構成することに関連して、雑音要素を当該代理フレームに加算させる（Ｓ１０４、Ｓ２０８）、
コンピュータコードを含み、
前記雑音要素は、先に受信されたフレームにおける信号の低分解能スペクトル表現に対応する周波数特性を有し、当該低分解能スペクトル表現は、前記先に受信されたフレームにおける前記信号の周波数領域の分解能を低くすることにより得られ、
前記雑音要素および前記代理フレームは、連続して失われたフレームの数に応じて前記雑音要素が振幅を増加しながら前記代理フレームに徐々に重ね合わされるように、当該連続して失われたフレームの数に依存するスケール係数を用いてスケーリングされる、
ことを特徴とするコンピュータプログラム。
請求項２６に記載のコンピュータプログラム（８０５、１００２）が記憶されるコンピュータ可読記憶媒体。