JP7471375B2

JP7471375B2 - 位相ｅｃｕｆ０補間スプリットのための方法および関係するコントローラ

Info

Publication number: JP7471375B2
Application number: JP2022181549A
Authority: JP
Inventors: マルティンセールステッド，
Original assignee: テレフオンアクチーボラゲットエルエムエリクソン（パブル）
Priority date: 2019-02-21
Filing date: 2022-11-14
Publication date: 2024-04-19
Anticipated expiration: 2040-02-20
Also published as: WO2020169754A1; US20220189490A1; EP3928314A1; JP7335968B2; KR20210130743A; MX2021009635A; EP3928313A1; US20220172733A1; CN113439302A; JP2023029834A; JP2023166423A; JP2023138988A; JP7307805B2; WO2020169757A1; CO2021012223A2; JP2022521077A; US20220148602A1; WO2020169756A1; US11862180B2; CN113454713A

Description

本開示は、一般に、損失したオーディオフレームについての隠蔽方法を制御するための方法に関する。本開示はまた、受信されたオーディオ信号の損失したオーディオフレームについての隠蔽方法を制御するように設定されたコントローラに関する。

現代の通信チャネル／ネットワークを介した音声／オーディオの送信は、主に、音声／オーディオコーデックを使用してデジタルドメインにおいて行われる。これは、デジタルサンプルを取得するために、アナログ信号をとり、サンプリングおよびアナログデジタル変換器（ＡＤＣ）を使用してそのアナログ信号をデジタル化することを伴い得る。これらのデジタルサンプルは、さらに、適用例に応じて１０ｍｓ～４０ｍｓの連続する期間からのサンプルを含んでいるフレームにグループ化され得る。これらのフレームは、次いで、送信される必要があるビット数を低減し、依然として、できるだけ高い品質を達成し得る、圧縮アルゴリズムを使用して処理され得る。次いで、符号化されたビットストリームが、データパケットとして、デジタルネットワークを介して受信機に送信される。受信機では、プロセスが逆にされる。データパケットは、最初に、復号されて、デジタルサンプルをもつフレームが再作成され得、そのフレームは、次いで、デジタルアナログ変換器（ＤＡＣ）に入力されて、受信機において入力アナログ信号の近似が再作成され得る。図１は、上記で説明された手法を使用する、デジタルネットワークなどのネットワークを介した、オーディオエンコーダおよびデコーダを使用するオーディオ転送のブロック図の一例を提供する。

データパケットがネットワーク上で送信されるとき、トラフィック負荷によりネットワークによってドロップされるか、または、ビット誤りの結果としてドロップされるかのいずれかであり得る、データパケットがあり、復号についてデジタルデータを無効にし得る。これらのイベントが起こるとき、デコーダは、実際の復号を行うことが不可能である期間中に、出力信号を置き換える必要がある。この置換プロセスは、一般に、フレーム／パケット損失隠蔽（ＰＬＣ：ｐａｃｋｅｔｌｏｓｓｃｏｎｃｅａｌｍｅｎｔ）と呼ばれる。図２は、パケット損失隠蔽を含むデコーダ２００のブロック図を示す。不良フレームインジケータ（ＢＦＩ）が、損失したまたは破損したフレームを示すとき、ＰＬＣ２０２が、紛失した／破損したフレームを置き換えるための信号を作成し得る。他の場合、すなわち、ＢＦＩが、損失したまたは破損したフレームを示さないとき、受信された信号は、ストリームデコーダ２０４によって復号される。現在フレームについての不良フレームインジケータ変数を、アクティブ、すなわち、ＢＦＩ＝１にセットすることによって、フレーム消去がデコーダにシグナリングされ得る。復号または隠蔽されたフレームは、次いで、ＤＡＣ２０６に入力されて、アナログ信号が出力される。フレーム／パケット損失隠蔽は、誤り隠蔽ユニット（ＥＣＵ：ｅｒｒｏｒｃｏｎｃｅａｌｍｅｎｔｕｎｉｔ）と呼ばれることもある。

デコーダにおいてパケット損失隠蔽を行う多数のやり方がある。いくつかの例は、損失したフレームを無音（ｓｉｌｅｎｃｅ）と置き換えること、および最後のフレームを繰り返すこと（または、最後のフレームパラメータの復号）である。他の手法は、フレームを、オーディオ信号の最も可能性がある継続（ｃｏｎｔｉｎｕａｔｉｏｎ）と置き換えることを試みることである。雑音のような信号の場合、１つの手法は、同様のスペクトル構造をもつ雑音を生成し得る。音の信号の場合、最初に、今のトーンの特性（周波数、振幅、および位相）を推定し、これらのパラメータを使用して、損失したフレームの対応する時間ロケーションにおいてトーンの継続を生成し得る。

ＥＣＵのための別の手法は、３ＧＰＰＴＳ２６．４７７Ｖ１５．０．０節５．４．３．５およびＷＯ２０１４／１２３４７１Ａ１において説明される、位相ＥＣＵであり、デコーダは、通常復号中に、復号された信号のプロトタイプを継続的に保存し得る。このプロトタイプは、損失したフレームの場合に使用され得る。プロトタイプはスペクトル的に分析され、雑音および音のＥＣＵ機能が、スペクトルドメインにおいて組み合わせられる。位相ＥＣＵは、スペクトル中のトーンを識別し、関係するスペクトルビンのスペクトル時間置換を計算する。他のビン（非音）は、雑音としてハンドリングされ得、これらのスペクトル領域における音のアーティファクトを回避するためにスクランブルされる。得られた再作成されたスペクトルは、時間ドメインに逆ＦＦＴ（高速フーリエ変換）変換され、信号は、損失したフレームの置換を作成するために処理される。オーディオコーデックが修正離散コサイン変換（ＭＤＣＴ）に基づくとき、置換の作成は、すでに復号された信号の統合された継続を作成するための重複ＭＤＣＴに関係する、窓処理、ＴＤＡ（時間ドメインエイリアシング）およびＩＴＤＡ（逆ＴＤＡ）を含む。この方法は、ＭＤＣＴメモリの継続的使用と、通常復号が再開されるべきであるときに使用されるべきであるＭＤＣＴメモリの作成とを保証し得る。ＰＬＣから通常動作への遷移における最初の正しく復号されたフレームは、最初の良好なフレームとしても知られる。図３は、ＰＬＣプロトタイプからの信号の位相ＥＣＵおよび再作成の時間整合および信号図を示す。図３は、エンコーダ（エンコーダ入力の後の一番上のもの）と、デコーダ中の最初の損失したフレームのポイントにおけるデコーダ中（デコーダ合成の後の第２の線）との間のタイミング関係をも示す。図３はまた、位相ＥＣＵ時間進行再作成信号（ＰｈａｓｅＥＣＵｔｉｍｅａｄｖａｎｃｅｄｒｅｃｒｅａｔｅｄｓｉｇｎａｌ）が、消失したフレームセグメントおよび変換メモリを再作成するために、窓処理ＴＤＡ、ＩＴＤＡおよび合成窓処理を使用し続けるために、どのように位置決めされ、使用されるかを示す。

ＰＬＣプロトタイプバッファに対するスペクトル分析を使用して、２つの動作においてトーン位置特定が行われ得る。窓処理およびＦＦＴの後に、第１の動作は、ビンの位置を特定することであり得、マグニチュードスペクトルを使用してトーンの位置が特定され得る。第２の動作は、補間によってこれらの推定値を改良することであり得、それにより、フラクショナル（ｆｒａｃｔｉｏｎａｌ）オフセット値の形態の精度増加を得ることであり得る。周波数推定の分解能は、２つのことに依存する。第１に、変換の長さ－より長い変換が、より高い分解能を与え得る。第２に、異なる補間方法が異なる精度を有し得る。たとえば、国際特許出願公開第ＷＯ２０１４／１２３４６９号において説明される動作では、より短いフレーム（１０ｍｓ）の場合、精度が十分に良好ではないことがある。より高品質の誤り隠蔽のために、高い精度が周波数推定のために必要とされ得る。ただバッファ長を増加させることが１つのソリューションであり得るが、複雑さがあまりにも増加することになる。最も敏感であるのは、クリーン正弦トーン（ｓｉｎｕｓｔｏｎｅ）であり、補間誤差が、明らかに可聴である、フレームごとの不連続性をもたらし、再構築された信号の品質を劣化させる。より長いバーストの場合、小さい誤差でさえ、復号されたコンテンツへの遷移中に、可聴の不連続性を生じ得る。

発明概念のいくつかの実施形態によれば、受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するためのコントローラを動作させるための方法が提供される。そのような方法では、コントローラは、少なくとも１つのトーンについてのスペクトル表現の少なくとも１つのビンベクトルを取得し得、少なくとも１つのビンベクトルは、少なくとも１つのトーンについての３つの連続するビン値を含む。コントローラは、３つの連続するビン値の各々が複素数値を有するのか実数値を有するのかを決定し得る。決定に応答して、コントローラは、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、少なくとも１つのトーンの周波数を推定するために３つの連続するビン値を処理し得る。

取得され得る１つの利点は、フレーム境界におけるクリーントーンにおけるクリックの低減が行われ得ることである。誤りバーストの後の復号されたコンテンツへの遷移も改善し得、マグニチュード近似からの複雑さの低減があり得る。

発明概念のいくつかの実施形態によれば、少なくとも１つのトーンについての３つの連続するビン値の各々が複素数値を有すると決定したことに応答して、コントローラは、３つの連続するビン値の各々についての複素数値係数（ｃｏｍｐｌｅｘｖａｌｕｅｃｏｅｆｆｉｃｉｅｎｔ）を抽出することと、３つの連続するビン値の各々の複素数値係数（ｃｏｍｐｌｅｘｖａｌｕｅｄｃｏｅｆｆｉｃｉｅｎｔ）に基づいて、１つのトーンについてのフラクショナルビンオフセットを計算することと、フラクショナルビンオフセットに基づいて、１つのトーンについてのビン周波数を計算することとを行い得る。３つの連続するビン値のうちの少なくとも１つが実数値を有すると決定したことに応答して、コントローラは、３つの連続するビン値の各々についてのマグニチュードポイントを抽出することと、３つの連続するビン値の各々のマグニチュードポイントに基づいて、少なくとも１つのトーンについてのフラクショナルビンオフセットを計算することと、フラクショナルビンオフセットに基づいて、少なくとも１つのトーンについてのビン周波数を計算することとを行い得る。

発明概念のいくつかの実施形態によれば、受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するための装置が提供される。本装置は、少なくとも１つのトーンについてのスペクトル表現の少なくとも１つのビンベクトルを取得することであって、少なくとも１つのビンベクトルが、少なくとも１つのトーンについての３つの連続するビン値を含む、少なくとも１つのビンベクトルを取得することを含む動作を実施する。本装置は、３つの連続するビン値の各々が複素数値を有するのか実数値を有するのかを決定することを含むさらなる動作を実施する。本装置は、決定に応答して、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、少なくとも１つのトーンの周波数を推定するために３つの連続するビン値を処理することを含むさらなる動作を実施する。

発明概念のいくつかの実施形態によれば、受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するためのデコーダの少なくとも１つのプロセッサによって実行されるべきプログラムコードを備えるコンピュータプログラムが提供される。プログラムコードの実行は、デコーダに、少なくとも１つのトーンについてのスペクトル表現の少なくとも１つのビンベクトルを取得することであって、少なくとも１つのビンベクトルが、少なくとも１つのトーンについての３つの連続するビン値を含む、少なくとも１つのビンベクトルを取得することを含む動作を実施させる。プログラムコードの実行は、デコーダに、３つの連続するビン値の各々が複素数値を有するのか実数値を有するのかを決定することを含むさらなる動作を実施させる。プログラムコードの実行は、デコーダに、決定に応答して、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、少なくとも１つのトーンの周波数を推定するために３つの連続するビン値を処理することを含むさらなる動作を実施させる。

発明概念のいくつかの実施形態によれば、受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するためのデコーダの少なくとも１つのプロセッサによって実行されるべきプログラムコードを含む非一時的記憶媒体を備えるコンピュータプログラム製品。プログラムコードの実行は、デコーダに、少なくとも１つのトーンについてのスペクトル表現の少なくとも１つのビンベクトルを取得することであって、少なくとも１つのビンベクトルが、少なくとも１つのトーンについての３つの連続するビン値を含む、少なくとも１つのビンベクトルを取得することを含む動作を実施させる。プログラムコードの実行は、デコーダに、３つの連続するビン値の各々が複素数値を有するのか実数値を有するのかを決定することを含むさらなる動作を実施させる。プログラムコードの実行は、デコーダに、決定に応答して、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、少なくとも１つのトーンの周波数を推定するために３つの連続するビン値を処理することを含むさらなる動作を実施させる。

本開示のさらなる理解を提供するために含まれ、本出願に組み込まれ、本出願の一部をなす、添付の図面は、発明概念のいくつかの非限定的な実施形態を示す。

ネットワークを介したオーディオエンコーダおよびオーディオデコーダを使用するブロック図である。パケット損失隠蔽を含むデコーダのブロック図である。ＰＬＣプロトタイプからの信号の位相ＥＣＵおよび再作成の時間整合および信号図である。サンプリングマグニチュードスペクトルを示す図である。マグニチュードスペクトルの平方根なしの線形近似（ｓｑｕａｒｅｒｏｏｔｆｒｅｅｌｉｎｅａｒａｐｐｒｏｘｉｍａｔｉｏｎ）のフローチャートである。フラクショナル周波数補間のためのフローチャートである。発明概念のいくつかの実施形態による、フラクショナル周波数補間のためのフローチャートである。発明概念のいくつかの実施形態による、フェード長さ２４をもつ１２８サンプルＨａｍｍＲｅｃｔフィルタのフェードイン（ｆａｄｅｉｎ）のハム（Ｈａｍｍ）を示す図である。発明概念のいくつかの実施形態による、フェード長さ２４サンプルをもつ１２８サンプルＨａｍｍＲｅｃｔフィルタのハムフェードアウト（ｆａｄｅｏｕｔ）を示す図である。発明概念のいくつかの実施形態による、コピー部分の長さがサンプリング周波数に依存することを示す図である。発明概念のいくつかの実施形態による、ハミング部分の長さがサンプル周波数に依存することを示す図である。発明概念のいくつかの実施形態による、コントローラ動作を示すフローチャートである。発明概念のいくつかの実施形態による、コントローラを含むデコーダのブロック図である。発明概念のいくつかの実施形態による、コントローラを含むデコーダのブロック図である。発明概念のいくつかの実施形態による、コントローラを含むデコーダのブロック図である。

次に、発明概念の実施形態の例が示されている添付の図面を参照しながら、発明概念が以下でより十分に説明される。しかしながら、発明概念は、多くの異なる形態で具現され得、本明細書に記載される実施形態に限定されるものとして解釈されるべきではない。むしろ、これらの実施形態は、本開示が徹底的かつ完全であり、本発明概念の範囲を当業者に十分に伝達するように提供される。これらの実施形態は相互排他的でないことにも留意されたい。一実施形態からの構成要素が、別の実施形態において存在する／使用されると暗に仮定され得る。

以下の説明は、開示される主題の様々な実施形態を提示する。これらの実施形態は、教示例として提示され、開示される主題の範囲を限定するものと解釈されるべきではない。たとえば、説明される実施形態のいくらかの詳細は、説明される主題の範囲から逸脱することなく、修正、省略、または拡大され得る。

様々な実施形態が、図１３～図１５に示されているデコーダ中のコントローラに適用される。図１３は、いくつかの実施形態による、デコーダの概略ブロック図である。デコーダ１３００は、符号化されたオーディオ信号を受信するように設定された入力ユニット１３０２を備える。図１３は、論理フレーム損失隠蔽ユニット１３０４によるフレーム損失隠蔽を示し、これは、デコーダが、本明細書で説明される様々な実施形態による、損失したオーディオフレームの隠蔽のためのコントローラを実装するように設定されることを示す。さらに、デコーダ１３００は、本明細書で説明される様々な実施形態を実装するための（本明細書ではプロセッサまたはプロセッサ回路とも呼ばれる）コントローラ１３０６を備える。コントローラ１３０６は、入力（ＩＮ）と、プロセッサ１３０６に結合された（本明細書ではメモリ回路とも呼ばれる）メモリ１３０８とに結合される。プロセッサ１３０６から取得された、復号されたおよび再構築されたオーディオ信号は、出力（ＯＵＴ）から出力される。メモリ１３０８は、プロセッサ１３０６によって実行されたとき、プロセッサに、本明細書で開示される実施形態による動作を実施させる、コンピュータ可読プログラムコード１３１０を含み得る。他の実施形態によれば、プロセッサ１３０６は、別個のメモリが必要とされないようなメモリを含むように規定され得る。

フレーム損失隠蔽動作を実施するための正弦波モデルの適用例は、以下のように説明され得る。

対応する符号化された情報が利用可能でないので、すなわち、フレームが損失したので、コード化された信号の所与のセグメントがデコーダによって再構築され得ない場合、このセグメントより前の信号の利用可能な部分がプロトタイプフレームとして使用され得、ここで、プロトタイプフレームは、単一のフレームよりも長くなり得る。ｎ＝０．．．Ｎ－１であるｙ（ｎ）が、置換フレームｚ（ｎ）が生成されなければならない利用不可能なセグメントであり、ｎ＜０であるｙ（ｎ）が、利用可能な、前に復号された信号である場合、長さＬおよび開始インデックスｎ_－１の利用可能な信号のプロトタイプフレームが、窓関数ｗ（ｎ）を用いて抽出され、たとえば、ＤＦＴによって周波数ドメインに変換される。

様々な実施形態では、復号された信号の端部がプロトタイプフレームとして使用される。そのような状況では、ｙ（ｎ）は、ｎ＝Ｌ．．．Ｎ－１であるｙ（ｎ）になる。上記の等式は、

になる。窓関数は、正弦波分析における、以下でより詳細に説明される窓関数のうちの１つであり得る。たとえば、以下で説明されるように、窓関数は、矩形窓をハム窓に基づくテーパリングと組み合わせ得る。好ましくは、数値複雑さを保存するために、周波数ドメイン変換されたフレームは、正弦波分析中に使用されたものと同等であるべきであり、これは、分析フレームとプロトタイプフレームとが同等であり、同様に、それらのそれぞれの周波数ドメイン変換が同等であることを意味する。

次のステップにおいて、正弦波モデル仮定が適用される。正弦波モデル仮定によれば、プロトタイプフレームのＤＦＴは、以下のように書かれ得る。

次に、使用される窓関数のスペクトルが、０に近い周波数範囲においてのみ著しい寄与を有することが了解される。窓関数のマグニチュードスペクトルは、（サンプリング周波数の半分に対応する、－πからπまでの正規化された周波数範囲内で）０に近い周波数の場合は大きく、他の場合は小さい。したがって、近似として、窓スペクトルＷ（ｍ）は、区間Ｍ＝［－ｍ_ｍｉｎ，ｍ_ｍａｘ］についてのみ非０であり、ｍ_ｍｉｎおよびｍ_ｍａｘは小さい正数であると仮定される。特に、各ｋについて、上記の式におけるシフトされた窓スペクトルの寄与が厳密に重複しないように、窓関数スペクトルの近似が使用される。したがって、上記の等式では、各周波数インデックスについて、常に、最大で、１つの被加数からの、すなわち、１つのシフトされた窓スペクトルからの寄与があるにすぎない。これは、上記の式が、非負ｍ∈Ｍ_ｋについておよび各ｋについて、以下の近似式になることを意味する。

ここでは、Ｍ_ｋは整数区間

を示し、ここで、ｍ_{ｍｉｎ，ｋ}およびｍ_{ｍａｘ，ｋ}は、区間が重複しないように、上記で説明された制約を満たす。ｍ_{ｍｉｎ，ｋ}およびｍ_{ｍａｘ，ｋ}のための好適な選定は、ｍ_{ｍｉｎ，ｋ}およびｍ_{ｍａｘ，ｋ}を小さい整数値δ、たとえば、δ＝３にセットすることである。しかしながら、２つの近隣する正弦波周波数ｆ_ｋおよびｆ_ｋ＋１に関係するＤＦＴインデックスが２δよりも小さい場合、δは、区間が重複しないことが保証されるように、

にセットされる。関数ｆｌｏｏｒ（・）は、関数引数よりも小さいかまたはそれに等しい、関数引数に最も近い整数である。

次に、正弦波モデルは、上記の式に従って、および時間的にそのＫ個のシヌソイド（ｓｉｎｕｓｏｉｄ）を展開するために適用される。プロトタイプフレームの時間インデックスと比較した、消去されたセグメントの時間インデックスが、ｎ_－１個のサンプルだけ異なるという仮定は、シヌソイドの位相が

だけ進行することを意味し、ここで、ｔｉｍｅ_ｏｆｆｓ＝ｔ_ａｄｖ＋Ｎ（ｂｕｒｓｔ_ｌｅｎ－１）である
ここで、ｔｉｍｅ_ｏｆｆｓは時間オフセットであり、ｔ_ａｄｖは時間進行であり、Ｎ（ｂｕｒｓｔ_ｌｅｎ－１）は連続する誤りの数に基づくタイミング調節である。再作成されたフレームは、消失したフレームにわたってセンタリングされる（したがって、再作成されたフレームをセンタリングするためのｔ＿ａｄｖの使用）。連続する誤りの場合、デコーダは、いくつのフレームが損失したかを追跡し、それに応じてオフセットを調節する必要がある（したがって、Ｎ（ｂｕｒｓｔ_ｌｅｎ－１）の使用）。したがって、展開される正弦波モデルのＤＦＴスペクトルは、以下によって与えられる。

シフトされた窓関数スペクトルがそれに従って重複しない、近似を再び適用することが、非負ｍ∈Ｍ_ｋについておよび各ｋについて、以下を与える。

各ｍ∈Ｍ_ｋについて、近似を使用することによって、展開される正弦波モデルＹ_０（ｍ）のＤＦＴとプロトタイプフレームＹ_－１（ｍ）のＤＦＴを比較すると、マグニチュードスペクトルは不変のままであるが、位相は

だけシフトされることがわかる。

したがって、置換フレームは、非負ｍ∈Ｍ_ｋについておよび各ｋについて、以下の式によって計算され得る。
ｚ（ｎ）＝ＩＤＦＴ｛Ｚ（ｍ）｝、

信号調性に応答した区間Ｍ_ｋのサイズが適応され得る。コントローラ１３０６は、少なくとも１つのトーンについてのスペクトル表現の複数のビンベクトルを受信し得る。各ビンベクトルは、１つのトーンについての３つの連続するビン値を含む。コントローラ１３０６は、３つの連続するビンの各々が複素数値を有するのか実数値を有するのかを決定し得る。決定に応答して、コントローラ１３０６は、少なくとも１つのトーンの周波数を推定するために３つの連続するビン値を処理し得る。図１５に示されているように、受信することは、受信ユニット１３１２によって実施され得、決定することは、決定ユニット１３１４によって実施され得、処理することは、処理ユニット１３１６によって実施され得る。図１５に示されているように、受信ユニット１３１２と、決定ユニット１３１４と、処理ユニット１３１６とを含む、プロセッサ１３０６によって処理されるべき信号が、メモリ１３０８から提供され得る。

プロセッサ１３０６をもつデコーダは、ハードウェアで実装され得る。デコーダのユニットの機能を達成するために使用され、組み合わせられ得る、回路エレメントの多数の変形態がある。そのような変形態は、様々な実施形態によって包含される。デコーダのハードウェア実装の特定の例は、汎用電子回路と特定用途向け回路の両方を含む、デジタル信号プロセッサ（ＤＳＰ）ハードウェアおよび集積回路技術における実装である。

ＰＬＣプロトタイプバッファに対するスペクトル分析を使用して、２つの動作においてトーン位置特定が行われ得る。窓処理およびＦＦＴの後に、第１の動作は、ビンの位置を特定することであり得、マグニチュードスペクトルを使用してトーンの位置が特定され得る。第２の動作は、補間によってこれらの推定値を改良することであり得、それにより、フラクショナルオフセット値の形態の精度増加を得ることであり得る。周波数推定の分解能は、２つのことに依存する。第１に、変換の長さ－より長い変換が、より高い分解能を与え得る。第２に、異なる補間方法が異なる精度を有し得る。たとえば、国際特許出願公開第ＷＯ２０１４／１２３４６９号において説明される動作では、より短いフレーム（１０ｍｓ）の場合、精度が十分に良好ではないことがある。より高品質の誤り隠蔽のために、高い精度が周波数推定のために必要とされ得る。ただバッファ長を増加させることが１つのソリューションであり得るが、複雑さが増加することになる。最も敏感であるのは、クリーン正弦トーンであり、補間誤差が、明らかに可聴である、フレームごとの不連続性をもたらし、再構築された信号の品質を劣化させる。より長いバーストの場合、小さい誤差でさえ、復号されたコンテンツへの遷移中に、可聴の不連続性を生じ得る。

さらに、トーンロケータと現在の補間器の両方についてのマグニチュードスペクトルの使用は、複雑な関数である、平方根関数を使用する。複雑さを低減するために、代わりにマグニチュード近似関数を使用することが、より良好であり得る。

発明概念の本開示のいくつかの実施形態は、利用可能なＦＦＴ係数に従って異なる補間方法を使用することを可能にし得る、補間方法コントローラを使用し得、これは、複雑さの増加を限定しながら、精度を増加させ得る。いくつかの実施形態は、トーンロケータのためのマグニチュードスペクトルを計算することの複雑さを低下させるマグニチュード近似をも使用し得、放物線補間によっても使用され得る。

複雑さ低減のために、複雑さがより低いマグニチュード近似ユニットが使用され得る。周波数分解能の損失なしの、同様の複雑さがより低いマグニチュード近似ユニットについての動作が、ＭＡｌｌｉｅおよびＲＬｙｏｎｓ、「ＡＲｏｏｔｏｆＬｅｓｓＥｖｉｌ」、ＩＥＥＥＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＭａｇａｚｉｎｅ、９３～９６ページ、２００５年３月（「Ａｌｌｉｅ」）において説明される。

本発明の実施形態の本開示のいくつかの実施形態は、補間精度を改善し得、位相ＥＣＵからの再作成された信号の品質を増加させ得る。さらに、品質の改善とともに、より短いＰＬＣバッファが使用され、品質を維持し得、これは、複雑さの低減のために使用され得、たとえば、ＦＦＴおよびＩＦＦＴは、大きい算出であり得、長いバッファについてコストがかかるようになり得る。

増加された周波数分解能のための装置が、２つの追加のユニットを含み得る。第１のユニットは、周波数補間のためにどの方法が使用され得るかを制御し得、すなわち、ビンデータの絶対値を使用する補間ユニット（たとえば、国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号において説明される同様の動作を参照）が使用され得るか、または複素ビン値を使用して周波数補間が行われる第２のユニットが使用され得るかのいずれかである。

Ｎ_ＦＦＴ個のサンプルの窓処理およびＦＦＴを使用するプロトタイプバッファの周波数分析が、

個の値をもつスペクトル表現、

についてＷ（ｎ）、を作り出す。ここで、ｎ＝０はＤＣを表し、

はサンプリング周波数（ｆｓ）の半分を表す。これらのうち、２つ以外のすべてが複素数値であり、エンドポイント（ＤＣおよびｆｓ／２）のみが実数である。したがって、利用可能な複素数係数を利用する別の補間方法が使用され得る場合、精度が増加され得る。

国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号において説明される補間方法は、識別されたトーンロケーション上の各側の１つのビンを使用する。また、エンドポイントにおいて、国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号において説明される補間方法は、依然として、３つのビンを使用し、追加のフラグが、識別されたピークが中間ロケーションにないことを示すためにセットされる。発明概念のいくつかの実施形態では、追加の制御ユニットが、すべての３つのビンが複素数値を有するピークについて、その制御ユニットが、改善された周波数推定のために、ビンデータの絶対値を使用する補間ユニットの代わりに新しい補間ユニットを呼び出すことを保証し得る。ビンデータの絶対値を使用する補間ユニットは、ビン０または

個のビンが３つのポイントの補間データ中に含まれる場合、使用され得、ここでも、ピークが中間ビンに位置しない場合、追加のフラグがセットされる。

補間ユニットによる処理の後に、見つけられたトーンロケーションに従ってビン値が更新され得（トーンおよび周囲のビンの位相調節）、非トーンロケーションのスクランブリングが続けられる。たとえば、国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号において説明される同様の動作を参照されたい。

発明概念のいくつかの実施形態では、ＭＤＣＴが、１０ｍｓ進行で２０ｍｓ窓にわたってとられ得る。良好なフレームの後に保存されたＰＬＣプロトタイプフレームは、長さが１６ｍｓである。関係する過渡検出器が、ＰＬＣプロトタイプフレームの１／４である長さ４ｍｓをもつ２つの短いＦＦＴを使用する。これらのアイテムの実際の長さは、使用されるサンプリング周波数に依存し、８ｋＨｚから４８ｋＨｚまでであり得る。これらの長さは、各変換におけるスペクトルビンの数に影響を及ぼす。

スペクトル分析および初期トーン位置特定が、国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号において説明される動作と同様の動作を使用して行われる。発明概念のいくつかの実施形態は、より低い複雑さのためにマグニチュード近似を使用する。国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号において説明される複雑なスペクトル推定のマグニチュードスペクトルの計算は、平方根関数の使用を伴う。たとえば、国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号では、複素数ｘ＝ａ＋ｉｂであり、ｘのマグニチュードが、次のように計算され得る。

発明概念のいくつかの実施形態では、線形近似を使用する、複雑さがより低い近似が使用される。複雑さがより低い近似のための同様の動作が、Ｍ．ＡｌｌｉｅおよびＲ．Ｌｙｏｎｓ、「ＡＲｏｏｔｏｆＬｅｓｓＥｖｉｌ」、ＩＥＥＥＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＭａｇａｚｉｎｅ、９３～９６ページ、２００５年３月（Ａｌｌｉｅ）において説明される。図５を参照すると、ＦＦＴＷ（ｎ）からのスペクトルエステートにおける第１のビン（０）および最後のビン

は、実数であるが、近似は、ブロック５０１においてそれら２つの絶対値をとる。（ビン）n = 1 …

についてのものである、Ｗ（ｎ）＝ａ＋ｉｂという形式を有する複素スペクトル係数の場合、ブロック５０３において、実数部および虚数部の絶対が最初に見つけられる必要がある。
ａ_ａｂｓ＝ａｂｓ（ａ）
ｂ_ａｂｓ＝ａｂｓ（ｂ）（２）

次に、ブロック５０５において、より大きい絶対値とより小さい絶対値とが識別され得る。
ＭＡＸ_ａｂ＝ｍａｘ（ａ_ａｂｓ，ｂ_ａｂｓ）
ＭＩＮ_ａｂ＝ｍｉｎ（ａ_ａｂｓ，ｂ_ａｂｓ）（３）

より大きい値とより小さい値とが知られているとき、ブロック５０７および５０９において、マグニチュード近似が、それら２つの線形結合として計算され得る。

図５は、複素入力Ｘ（ｎ）＝ａ＋ｉｂをもつ、マグニチュードスペクトルの平方根なしの線形近似のフローチャートであり、この線形近似は、各スペクトルビンについて１回実施され得る。

国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号において説明される周波数推定のための動作では、粗い周波数推定は、トーンの位置が特定されるビンである。たとえば、１つのトーンの場合、それは、エンドポイントにおける特殊な処置を除いて、ビンｋに位置する。図６を参照すると、スペクトル推定値は、ビンｋ－１、ｋ、ｋ＋１を使用し得、それらのスペクトルマグニチュードが、ブロック６０１において抽出され、補間ユニットに入力され得、補間ユニットは、ブロック６０３において補間δを計算し得、ブロック６０５におけるフラクショナルビンオフセットは、通常、入力に基づいて、範囲δ＝［－０．５，０．５］内にある。図６は、トーンロケータによって見つけられる各トーンについて１回実施され得る、フラクショナル周波数補間のための上記の動作のためのそのようなプロセスのフローチャートである。

発明概念のいくつかの実施形態では、周波数補間は、位置を特定された各トーンのためにどの方法が使用されるべきであるかを選択するために、制御ユニットを使用し得る。図７は、発明概念の実施形態による、トーンロケータによって見つけられる各トーンについて１回実施され得る、フラクショナル周波数補間のためのフローチャートである。図７は、以下のようにより詳細に説明される。

ブロック７０１において、補間がＤＣビンまたはｆｓ／２ビンのいずれかを使用することになるような、トーンの位置が特定された場合、補間制御ユニットは、ビンデータの絶対値を使用する方法を使用する（ブロック７０７、７０９、７１１）。たとえば、国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号において説明される同様の動作を参照されたい。ここで、ｋにおけるトーンについて、ブロック７０７において抽出された３つの連続するスペクトル推定値は、実数マグニチュードスペクトル係数｜Ｘ（ｎ）｜、ｎ＝ｋ－１、ｋ、ｋ＋１であり、｜Ｘ_ｋ－１｜、｜Ｘ_ｋ｜、および｜Ｘ_ｋ＋１｜として補間現在ユニットに入力される。ブロック７０９において、国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号において説明される動作と同様のフラクショナルオフセットの計算が行われる。

ＤＣまたはＦＳ／２において位置が特定されたトーンの特殊なハンドリングの場合、それは、トーンロケータが、位置が特定されたトーンが、提供されたデータポイントの中心にないことがあることを示し得るときである。

発明概念のいくつかの実施形態では、補間がＤＣビンまたはｆｓ／２ビンのいずれをも使用しないような、トーンの位置が特定された場合、補間制御ユニットは、使用される窓関数およびＦＦＴ長さに適合された方法を使用し（ブロック７０３、７０５、７１１）、

について、ＦＦＴ係数Ｘ（ｎ）が、推定されたスペクトルである。同様の動作が、ＥＪａｃｏｂｓｅｎおよびＰＫｏｏｔｓｏｏｋｓ、「ＦａｓｔＡｃｃｕｒａｔｅＦｒｅｑｕｅｎｃｙＥｓｔｉｍａｔｉｏｎ」、ＩＥＥＥＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＭａｇａｚｉｎｅ、１２３～１２５ページ、２００７年５月（Ｊａｃｏｂｓｅｎ）において説明される。ビンデータの絶対値を使用する補間は、マグニチュードスペクトルを使用するが、複素スペクトルは、依然として保存され、再構築のために使用され得、したがって、複雑さまたはメモリペナルティがない。補間は、中心ビンが、見つけられたトーンロケーションである、３つの連続するＦＦＴビン上の複素数係数を使用して行われ得る。

スペクトルの複素数表現が使用されるので、トーンロケータのためのマグニチュードスペクトルを計算する際にマグニチュード近似を使用することによる精度ペナルティがないことがある。エンドポイントのみが、それらの近似を使用することになる。

ｋにおけるトーンの場合、複素数値係数Ｘ（ｎ）、ｎ＝ｋ－１、ｋ、ｋ＋１は、Ｘ_ｋ－１、Ｘ_ｋ、およびＸ_ｋ＋１として補間ユニットに入力され得る。補間は、以下の等式に基づいて、通常、範囲δ＝［－０．５，０．５］において、ブロック７１１において、フラクショナルビンオフセットを計算し得る。

ここで、Ｋ_{ｊａｃｏｂ}は、使用される窓のタイプとサンプリング周波数に関するＦＦＴのサイズとに依存するスケーリング係数である。一方、式ＲＥ｛｝は、括弧内の式の実数部のみが結果として使用されること、すなわち、入力のために使用されるスペクトル係数が複素数であるにもかかわらず、δが依然として実数値であることになることを意味する。より少ない複雑さのために、ＲＥ｛｝内の式の実数部のみが計算され得る。

どちらの場合も、推定された周波数を得るために、このフラクショナルオフセットは、ピークロケーションｋの粗い分解能および補間値δと組み合わせられ得る。
ｆ_ｋ＝（ｋ＋δ）Ｃ（７）
ここで、Ｃは、（Ｈｚ／ビン単位の）粗い分解能であり、ＦＦＴの長さおよびサンプリング周波数ｆｓに依存する。Ｈｚ／ビンである粗い分解能は、ちょうどＣ＝ｆｓ／Ｎ_ＦＦＴである。

Ｊａｃｏｂｓｅｎは、いくつかの窓タイプについての（ＪａｃｏｂｓｅｎにおいてＱと称する）Ｋ_{ｊａｃｏｂ}値について説明するが、Ｊａｃｏｂｓｅｎは、国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号において使用される窓を含まない。いくつかの実施形態では、その窓についての係数を導出するために、トーンが２つのビン間の中間にある場合が使用され得る、すなわち、どのピークが選定されるかに応じて、δ＝±０．５である。たとえば、図４を参照されたい。図４は、２つのスペクトルビン間の中間において位置が特定された１つのトーンをもつ例示的なマグニチュードスペクトルを示す。トーン位置特定が、粗いトーン推定値をｋ_Ａであると報告するのか、ｋ_Ｂであると報告するのかは、ランダムイベントである。いずれの場合も、フラクショナル補間は、推定された同じ周波数を指すべきであり、これにより、それについて、δ_Ａ≒＋０．５となり、一方δ_Ｂ≒－０．５となる。ｋ_Ａおよびｋ_Ｂのためのマグニチュードが等しく高いので、それらを異ならせるのは、トーンの位相、雑音、またはＦＦＴ精度のみであり得、トーン位置特定は、等しく、それらのいずれかをトーンについてのビンとして選択する可能性がある。したがって、これは、最良の最小２乗誤差を提供しないが、δ＝±０．５における補間不連続性を回避し得る。

国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号におけるスペクトル分析のために使用される窓は、それが、矩形窓をハム窓に基づくテーパリングと組み合わせるので、「ＨａｍｍＲｅｃｔ窓」と呼ばれる。国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号において説明されるすべてのサンプリング周波数について、矩形とテーパリングとの比は同じであり得る。いくつかの実施形態では、窓は、３ｍｓフェードインテーパリング、１０ｍｓ矩形、および３ｍｓフェードアウトとして規定される。ｆｓ＝８ｋＨｚについてのフェードインテーパリングおよびフェードアウトテーパリングが、それぞれ、図８および図９において見られ得、矩形部分は、その２つの間に位置することになり、１．０００の８０個のサンプルがあることになる。図１０および図１１は、異なるサンプリング周波数に応じたフェージングおよび矩形長さを示す。図１０は、発明概念のいくつかの実施形態による、コピー部分の長さがサンプリング周波数に依存することを示す。図１１は、発明概念のいくつかの実施形態による、ハミング部分の長さがサンプル周波数に依存することを示す。

このタイプの窓の場合、Ｋ_{ｊａｃｏｂ}＝１．１４２９の値は、すべてのサンプリング周波数について同じであることになる。テーパリングのために対称ハム窓を使用する場合、異なるサンプリング周波数のために異なる値を使用する必要があり、その差は小さい。いくつかの例は、以下の通りである。ＦＦＴサイズ１２８－＞１．１４７６、２５６－＞１．１４５２、５１２－＞１．１４４０、および７６８－＞１．１４３６。１つの固定係数および周期的ハム窓を使用することが、これを回避し得る。周期的ハム窓のための規定は、以下の通りである。

テーパリングセクションを生成するために、その窓は、Ｌ＝２Ｌ_ｆａｄｅを用いて評価され、評価の後に、この窓の前半はフェードイン部分であり、後半はフェードアウト部分である。

ハム窓が対称であるのか周期的であるのかを知るための１つの手法は、窓における最初および最後のサンプルが０．０８である場合、それが対称であることである。０．０８が周期的窓へのサンプルに追加される場合、それは対称になるが、長さＬ＋１をもつ。記憶の観点から、周期的規定は、サブサンプリングを可能にし、すなわち、３２ｋＨｚ窓から、それをサブサンプリングして、１６ｋＨｚおよび８ｋＨｚ窓を得ることができる。

国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号において説明される放物線補間の場合、定数がなく、その放物線補間は、対称または周期的ハム関数に依存しない。

次に、発明概念のいくつかの実施形態による、図１２のフローチャートを参照しながら、デコーダ１３００の動作が説明される。たとえば、モジュールは、図１３～図１５のメモリ１３０８に記憶され得、これらのモジュールは、モジュールの命令がプロセッサ１３０６によって実行されたとき、プロセッサ１３０６がそれぞれのフローチャートのそれぞれの動作を実施するような命令を提供し得る。

図１２は、受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するためのデコーダ１３００のコントローラ１３０６の動作を示す。

図１２のブロック１２００において、デコーダ１３００のプロセッサ１３０６は、少なくとも１つのトーンについてのスペクトル表現の少なくとも１つのビンベクトルを取得し、少なくとも１つのビンベクトルは、少なくとも１つのトーンについての３つの連続するビン値を含む。ブロック１２０２において、デコーダ１３００のプロセッサ１３０６は、３つの連続するビンベクトルの各々が複素数値を有するのか実数値を有するのかを決定する。ブロック１２０４において、デコーダ１３００のプロセッサ１３０６は、決定に応答して、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、少なくとも１つのトーンの周波数を推定するために３つの連続するビン値を処理し得る。

略語

以下の略語のうちの少なくともいくつかが本開示で使用され得る。略語間の不整合がある場合、その略語が上記でどのように使用されるかが選好されるべきである。以下で複数回リストされる場合、最初のリスティングが（１つまたは複数の）後続のリスティングよりも選好されるべきである。
略語説明
ＡＤＣアナログデジタル変換器
ＢＦＩ不良フレームインジケータ
ＤＡＣデジタルアナログ変換器
ＦＦＴ高速フーリエ変換
ＩＦＦＴ逆高速フーリエ変換
ＩＴＤＡ逆時間ドメインエイリアシング
ＬＡ＿ＺＥＲＯＳルックアヘッドゼロ
ＭＤＣＴ修正離散コサイン変換
ＯＬＡオーバーラップ加算
ＴＤＡ時間ドメインエイリアシング
参考文献
［１］
国際特許公開第ＷＯ２０１４／１２３４６９Ａ１号
［２］
ＭＡｌｌｉｅおよびＲＬｙｏｎｓ、「ＡＲｏｏｔｏｆＬｅｓｓＥｖｉｌ」、ＩＥＥＥＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＭａｇａｚｉｎｅ、９３～９６ページ、２００５年３月
［３］
ＥＪａｃｏｂｓｅｎおよびＰＫｏｏｔｓｏｏｋｓ、「ＦａｓｔＡｃｃｕｒａｔｅＦｒｅｑｕｅｎｃｙＥｓｔｉｍａｔｉｏｎ」、ＩＥＥＥＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇＭａｇａｚｉｎｅ、１２３～１２５ページ、２００７年５月
［４］
国際特許公開第ＷＯ２０１４／１２３４７１Ａ１号

発明概念のさらなる説明が、文献国際特許出願公開第ＷＯ２０１４／１２３４６９Ａ１号において提供される。

発明概念の例示的な実施形態のリスティング：
例示的な実施形態が以下で説明される。参照番号／文字は、例示的な実施形態を、参照番号／文字によって示される特定のエレメントに限定することなしに、例／例示として丸括弧中に提供される。
１．受信されたオーディオ信号の損失したオーディオフレームについての隠蔽方法を制御するための方法であって、方法は、
少なくとも１つのトーンについてのスペクトル表現の複数のビンベクトルを受信すること（１２００、１３１２）であって、複数のビンベクトルが、少なくとも１つのトーンについての３つの連続するビンベクトルを含む、複数のビンベクトルを受信すること（１２００、１３１２）と、
３つの連続するビンベクトルの各々が複素数値を有するのか実数値を有するのかを決定すること（１２０２、１３１４）と、
決定に応答して、少なくとも１つのトーンの周波数を推定するために３つの連続するビン値を処理すること（１２０４、１３１６）と
を含む、方法。
２．決定することは、少なくとも１つのトーンについての３つの連続するビンベクトルの各々が複素数値を有すると決定することを含み、処理することは、３つの連続するビンベクトルの各々についての複素数値係数を抽出することと、３つの連続するビンベクトルの各々についての複素数値係数に基づいて、少なくとも１つのトーンについてのフラクショナルビンオフセットを計算すること（１２０４、１３１４）と、フラクショナルビンオフセットに基づいて、少なくとも１つのトーンについてのビン周波数を計算すること（１２０４、１３１４）とを含む、実施形態１に記載の方法。
３．少なくとも１つのトーンについてのフラクショナルビンオフセットを計算することが、少なくとも１つのトーンについての３つの連続するビンベクトルの各々を含んでいる周波数スペクトルについての、スケーリング係数、スペクトル表現のために使用される窓関数、および変換長を含む、実施形態１または２に記載の方法。
４．スケーリング係数が窓関数のタイプに依存する、実施形態１から３のいずれか１つに記載の方法。
５．少なくとも１つのトーンについてのフラクショナルビンオフセットを計算することが、３つの連続するビンベクトルの各々を含んでいる周波数スペクトルについての、窓関数および変換長を含む、実施形態１から４のいずれか１つに記載の方法。
６．窓関数が、ハム窓に基づくテーパリングとの組み合わせられた矩形窓を含む、実施形態１から５のいずれか１つに記載の方法。
７．矩形窓が矩形長さを含み、ハム窓がフェージング長さを含む、実施形態１から６のいずれか１つに記載の方法。
８．矩形長さおよびフェージング長さの各々が、少なくとも１つのサンプリング周波数に依存する、実施形態１から７のいずれか１つに記載の方法。
９．スケーリング係数は、窓関数が、ハム窓に基づくテーパリングとの組み合わせられた矩形窓を含むとき、定数を含む、実施形態１から１８のいずれか１つに記載の方法。
１０．窓関数が周期的ハム窓を含む、実施形態１から９のいずれか１つに記載の方法。
１１．スケーリング係数は、窓関数が、周期的ハム窓を含むとき、定数を含む、実施形態１から１０のいずれか１つに記載の方法。
１２．少なくとも１つのトーンについてのビン周波数を計算することが、少なくとも１つのトーンについてのフラクショナルビンオフセットと、３つの連続するビンのうちの第１のビンにおける少なくとも１つのトーンのロケーションと、Ｈｚ／ビン単位の粗い分解能とを含む、実施形態１から１１のいずれか１つに記載の方法。
１３．粗い分解能が、周波数スペクトルについての変換長、およびサンプリング周波数に依存する、実施形態１から１２のいずれか１つに記載の方法。
１４．決定することおよび処理することが、スペクトル表現の少なくとも１つのトーンの各々について実施される、実施形態１から１３のいずれか１つに記載の方法。
１５．決定することは、３つの連続するビンベクトルのうちの少なくとも１つが実数値を有すると決定することを含み、処理することが、３つの連続するビンベクトルの各々についてのマグニチュードポイントを抽出することと、３つの連続するビンベクトルの各々についてのマグニチュードポイントに基づいて、フラクショナルビンオフセットを計算することと、フラクショナルビンオフセットに基づいて、少なくとも１つのトーンについてのビン周波数を計算することとを含む、実施形態１に記載の方法。
１６．受信されたオーディオ信号の損失したオーディオフレームについての隠蔽方法を制御するためのデコーダ（１３００）であって、デコーダが、
プロセッサ（１３０６）と、
プロセッサに結合されたメモリ（１３０８）と
を備え、メモリが、プロセッサによって実行されたとき、デコーダに、実施形態１から１５のいずれか１つに記載の動作を実施させる命令を含む、デコーダ（１３００）。
１７．受信されたオーディオ信号の損失したオーディオフレームについての隠蔽方法を制御するためのデコーダ（１３００）であって、デコーダが、実施形態１から１５のいずれか１つに従って実施するように適合された、デコーダ（１３００）。
１８．受信されたオーディオ信号の損失したオーディオフレームについての隠蔽方法を制御するためのデコーダ（１３００）の少なくとも１つのプロセッサ（１３０６）によって実行されるべきプログラムコードを備えるコンピュータプログラムであって、プログラムコードの実行が、デコーダ（１３００）に、実施形態１から１５のいずれか１つに記載の動作を実施させる、コンピュータプログラム。
１９．受信されたオーディオ信号の損失したオーディオフレームについての隠蔽方法を制御するためのデコーダ（１３００）の少なくとも１つのプロセッサ（１３０６）によって実行されるべきプログラムコードを含む非一時的記憶媒体を備えるコンピュータプログラム製品であって、プログラムコードの実行が、デコーダ（１３００）に、実施形態１から１５のいずれか１つに記載の動作を実施させる、コンピュータプログラム製品。

追加の説明

概して、本明細書で使用されるすべての用語は、異なる意味が、明確に与えられ、および／またはその用語が使用される文脈から暗示されない限り、関連する技術分野における、それらの用語の通常の意味に従って解釈されるべきである。１つの（ａ／ａｎ）／その（ｔｈｅ）エレメント、装置、構成要素、手段、ステップなどへのすべての言及は、別段明示的に述べられていない限り、そのエレメント、装置、構成要素、手段、ステップなどの少なくとも１つの事例に言及しているものとしてオープンに解釈されるべきである。本明細書で開示されるいずれの方法のステップも、ステップが、別のステップに後続するかまたは先行するものとして明示的に説明されない限り、および／あるいはステップが別のステップに後続するかまたは先行しなければならないことが暗黙的である場合、開示される厳密な順序で実施される必要はない。本明細書で開示される実施形態のいずれかの任意の特徴は、適切であればいかなる場合も、任意の他の実施形態に適用され得る。同じように、実施形態のいずれかの任意の利点は、任意の他の実施形態に適用され得、その逆も同様である。同封の実施形態の他の目的、特徴、および利点は、以下の説明から明らかになる。

本明細書で開示される任意の適切なステップ、方法、特徴、機能、または利益は、１つまたは複数の仮想装置の１つまたは複数の機能ユニットまたはモジュールを通して実施され得る。各仮想装置は、いくつかのこれらの機能ユニットを備え得る。これらの機能ユニットは、１つまたは複数のマイクロプロセッサまたはマイクロコントローラを含み得る、処理回路、ならびに、デジタル信号プロセッサ（ＤＳＰ）、専用デジタル論理などを含み得る、他のデジタルハードウェアを介して実装され得る。処理回路は、読取り専用メモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、キャッシュメモリ、フラッシュメモリデバイス、光記憶デバイスなど、１つまたはいくつかのタイプのメモリを含み得る、メモリに記憶されたプログラムコードを実行するように設定され得る。メモリに記憶されたプログラムコードは、１つまたは複数の通信および／またはデータ通信プロトコルを実行するためのプログラム命令、ならびに本明細書で説明される技法のうちの１つまたは複数を行うための命令を含む。いくつかの実装形態では、処理回路は、それぞれの機能ユニットに、本開示の１つまたは複数の実施形態による、対応する機能を実施させるために使用され得る。

ユニットという用語は、エレクトロニクス、電気デバイス、および／または電子デバイスの分野での通常の意味を有し得、たとえば、本明細書で説明されるものなど、それぞれのタスク、プロシージャ、算出、出力、および／または表示機能を行うための、電気および／または電子回路、デバイス、モジュール、プロセッサ、メモリ、論理固体および／または個別デバイス、コンピュータプログラムまたは命令などを含み得る。

本発明概念の様々な実施形態の上記の説明では、本明細書で使用される専門用語は、具体的な実施形態を説明するためのものにすぎず、本発明概念を限定するものではないことを理解されたい。別段に規定されていない限り、本明細書で使用される（技術用語および科学用語を含む）すべての用語は、本発明概念が属する技術の当業者によって通常理解されるものと同じ意味を有する。通常使用される辞書において規定される用語など、用語は、本明細書および関連技術の文脈におけるそれらの用語の意味に従う意味を有するものとして解釈されるべきであり、明確にそのように本明細書で規定されない限り、理想的なまたは過度に形式的な意味において解釈されないことをさらに理解されよう。

エレメントが、別のエレメントに「接続された」、「結合された」、「応答する」、またはそれらの変形態であると呼ばれるとき、そのエレメントは、別のエレメントに直接、接続され、結合され、または応答し得、あるいは介在するエレメントが存在し得る。対照的に、エレメントが、別のエレメントに「直接接続された」、「直接結合された」、「直接応答する」、またはそれらの変形態であると呼ばれるとき、介在するエレメントが存在しない。同様の番号は、全体を通して同様のエレメントを指す。さらに、本明細書で使用される、「結合された」、「接続された」、「応答する」、またはそれらの変形態は、無線で結合された、無線で接続された、または無線で応答する、を含み得る。本明細書で使用される単数形「ａ」、「ａｎ」および「ｔｈｅ」は、文脈が別段に明確に示すのでなければ、複数形をも含むものとする。簡潔および／または明快のために、よく知られている機能または構築が詳細に説明されないことがある。「および／または」という用語は、関連するリストされた項目のうちの１つまたは複数の任意のおよび全部の組合せを含む。

様々なエレメント／動作を説明するために、第１の、第２の、第３の、などの用語が本明細書で使用され得るが、これらのエレメント／動作は、これらの用語によって限定されるべきでないことを理解されよう。これらの用語は、あるエレメント／動作を別のエレメント／動作と区別するために使用されるにすぎない。したがって、本発明概念の教示から逸脱することなしに、いくつかの実施形態における第１のエレメント／動作が、他の実施形態において第２のエレメント／動作と呼ばれることがある。同じ参照番号または同じ参照符号は、本明細書全体にわたって同じまたは同様のエレメントを示す。

本明細書で使用される、「備える、含む（ｃｏｍｐｒｉｓｅ）」、「備える、含む（ｃｏｍｐｒｉｓｉｎｇ）」、「備える、含む（ｃｏｍｐｒｉｓｅｓ）」、「含む（ｉｎｃｌｕｄｅ）」、「含む（ｉｎｃｌｕｄｉｎｇ）」、「含む（ｉｎｃｌｕｄｅｓ）」、「有する（ｈａｖｅ）」、「有する（ｈａｓ）」、「有する（ｈａｖｉｎｇ）」という用語、またはそれらの変形態は、オープンエンドであり、１つまたは複数の述べられた特徴、完全体、エレメント、ステップ、構成要素または機能を含むが、１つまたは複数の他の特徴、完全体、エレメント、ステップ、構成要素、機能またはそれらのグループの存在または追加を排除しない。さらに、本明細書で使用される、「たとえば（ｅｘｅｍｐｌｉｇｒａｔｉａ）」というラテン語句に由来する「たとえば（ｅ．ｇ．）」という通例の略語は、前述の項目の一般的な１つまたは複数の例を紹介するかまたは具体的に挙げるために使用され得、そのような項目を限定するものではない。「すなわち（ｉｄｅｓｔ）」というラテン語句に由来する「すなわち（ｉ．ｅ．）」という通例の略語は、より一般的な具陳から特定の項目を具体的に挙げるために使用され得る。

例示的な実施形態が、コンピュータ実装方法、装置（システムおよび／またはデバイス）および／またはコンピュータプログラム製品のブロック図および／またはフローチャート例示を参照しながら本明細書で説明される。ブロック図および／またはフローチャート例示のブロック、ならびにブロック図および／またはフローチャート例示中のブロックの組合せが、１つまたは複数のコンピュータ回路によって実施されるコンピュータプログラム命令によって実装され得ることを理解されたい。これらのコンピュータプログラム命令は、汎用コンピュータ回路、専用コンピュータ回路、および／またはマシンを作り出すための他のプログラマブルデータ処理回路のプロセッサ回路に提供され得、したがって、コンピュータおよび／または他のプログラマブルデータ処理装置のプロセッサを介して実行する命令は、ブロック図および／またはフローチャートの１つまたは複数のブロックにおいて指定された機能／行為を実装するために、およびそれにより、ブロック図および／またはフローチャートの（１つまたは複数の）ブロックにおいて指定された機能／行為を実装するための手段（機能）および／または構造を作成するために、トランジスタ、メモリロケーションに記憶された値、およびそのような回路内の他のハードウェア構成要素を変換および制御する。

これらのコンピュータプログラム命令はまた、コンピュータまたは他のプログラマブルデータ処理装置に特定の様式で機能するように指示することができる、有形コンピュータ可読媒体に記憶され得、したがって、コンピュータ可読媒体に記憶された命令は、ブロック図および／またはフローチャートの１つまたは複数のブロックにおいて指定された機能／行為を実装する命令を含む製造品を作り出す。したがって、本発明概念の実施形態は、ハードウェアで、および／または「回路」、「モジュール」またはそれらの変形態と総称して呼ばれることがある、デジタル信号プロセッサなどのプロセッサ上で稼働する（ファームウェア、常駐ソフトウェア、マイクロコードなどを含む）ソフトウェアで具現され得る。

また、いくつかの代替実装形態では、ブロック中で言及される機能／行為は、フローチャート中で言及される順序から外れて行われ得ることに留意されたい。たとえば、関与する機能／行為に応じて、連続して示されている２つのブロックが、事実上、実質的にコンカレントに実行され得るか、またはブロックが、時々、逆の順序で実行され得る。その上、フローチャートおよび／またはブロック図の所与のブロックの機能が、複数のブロックに分離され得、ならびに／あるいはフローチャートおよび／またはブロック図の２つまたはそれ以上のブロックの機能が、少なくとも部分的に統合され得る。最後に、他のブロックが、示されているブロック間に追加／挿入され得、および／または発明概念の範囲から逸脱することなく、ブロック／動作が省略され得る。その上、図のうちのいくつかが、通信の主要な方向を示すために通信経路上に矢印を含むが、通信が、図示された矢印と反対方向に行われ得ることを理解されたい。

本発明概念の原理から実質的に逸脱することなしに、実施形態に対して多くの変形および修正が行われ得る。すべてのそのような変形および修正は、本発明概念の範囲内で本明細書に含まれるものとする。したがって、上記で開示された主題は、例示であり、限定するものではないと見なされるべきであり、実施形態の例は、本発明概念の趣旨および範囲内に入る、すべてのそのような修正、拡張、および他の実施形態をカバーするものとする。したがって、法によって最大限に許容される限りにおいて、本発明概念の範囲は、実施形態およびそれらの等価物の例を含む、本開示の最も広い許容可能な解釈によって決定されるべきであり、上記の詳細な説明によって制限または限定されるべきでない。

Claims

受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するための方法であって、
少なくとも１つのトーンについてのスペクトル表現の少なくとも１つのビンベクトルを取得すること（１２００、１３１２）であって、前記少なくとも１つのビンベクトルが、前記少なくとも１つのトーンについての３つの連続するビン値を含む、少なくとも１つのビンベクトルを取得すること（１２００、１３１２）と、
前記３つの連続するビン値の各々が複素数値を有するのか実数値を有するのかを決定すること（１２０２、１３１４）と、
前記決定に応答して、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、前記少なくとも１つのトーンの周波数を推定するために前記３つの連続するビン値を処理すること（１２０４、１３１６）と、
前記少なくとも１つのトーンについての前記３つの連続するビン値の各々が複素数値を有すると決定したことに応答して、
前記３つの連続するビン値の各々についての複素数値係数を抽出することと、
前記３つの連続するビン値の各々の前記複素数値係数に基づいて、前記少なくとも１つのトーンについてのフラクショナルビンオフセットを計算すること（１２０４、１３１４）と、
前記フラクショナルビンオフセットに基づいて、前記少なくとも１つのトーンについてのビン周波数を計算すること（１２０４、１３１４）と、
前記３つの連続するビン値のうちの少なくとも１つが実数値を有すると決定したことに応答して、
前記３つの連続するビン値の各々についてのマグニチュードポイントを抽出することと、
前記３つの連続するビン値の各々についての前記マグニチュードポイントに基づいて、前記少なくとも１つのトーンについてのフラクショナルビンオフセットを計算することと、
前記フラクショナルビンオフセットに基づいて、前記少なくとも１つのトーンについてのビン周波数を計算することと、
を含む、方法。
前記少なくとも１つのトーンについての前記フラクショナルビンオフセットを計算することが、前記少なくとも１つのトーンについての前記３つの連続するビン値の各々を含んでいる周波数スペクトルについての、スケーリング係数、前記スペクトル表現のために使用される窓関数、および変換長に基づいて、前記少なくとも１つのトーンについての前記フラクショナルビンオフセットを計算することを含む、請求項１に記載の方法。
前記スケーリング係数が窓関数のタイプに依存する、請求項２に記載の方法。
前記少なくとも１つのトーンについての前記フラクショナルビンオフセットを計算することが、前記３つの連続するビン値の各々を含んでいる周波数スペクトルについての、窓関数および変換長に基づいて、前記少なくとも１つのトーンについての前記フラクショナルビンオフセットを計算することを含む、請求項１から３のいずれか一項に記載の方法。
前記フラクショナルビンオフセットを計算することが、
ｆ_ｋ＝（ｋ＋δ）Ｃ
に従って前記フラクショナルビンオフセットを計算することを含み、ｆ_ｋが、ピークロケーションｋについての前記フラクショナルビンオフセットであり、δが補間値であり、Ｃが、Ｈｚ／ビン単位の粗い分解能である、請求項４に記載の方法。
δが、

に従って決定され、ここで、Ｋ_{ｊａｃｏｂ}がスケーリング係数であり、Ｘ_ｋ－１、Ｘ_ｋ、およびＸ_ｋ＋１が、ｋにおける前記少なくとも１つのトーンについての複素数値係数である、請求項５に記載の方法。
決定することおよび処理することが、前記スペクトル表現の前記少なくとも１つのトーンの各々について実施される、請求項１から６のいずれか一項に記載の方法。
受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するための装置（１３０４）であって、
少なくとも１つのトーンについてのスペクトル表現の少なくとも１つのビンベクトルを取得すること（１２００、１３１２）であって、前記少なくとも１つのビンベクトルが、前記少なくとも１つのトーンについての３つの連続するビン値を含む、少なくとも１つのビンベクトルを取得すること（１２００、１３１２）と、
前記３つの連続するビン値の各々が複素数値を有するのか実数値を有するのかを決定すること（１２０２、１３１４）と、
前記決定に応答して、各ビン値が複素数値を有するのか実数値を有するのかに基づいて、前記少なくとも１つのトーンの周波数を推定するために前記３つの連続するビン値を処理すること（１２０４、１３１６）と、
前記少なくとも１つのトーンについての前記３つの連続するビン値の各々が複素数値を有すると決定したことに応答して、
前記３つの連続するビン値の各々についての複素数値係数を抽出することと、
前記３つの連続するビン値の各々の前記複素数値係数に基づいて、前記少なくとも１つのトーンについてのフラクショナルビンオフセットを計算すること（１２０４、１３１４）と、
前記フラクショナルビンオフセットに基づいて、前記少なくとも１つのトーンについてのビン周波数を計算すること（１２０４、１３１４）と、
前記３つの連続するビン値のうちの少なくとも１つが実数値を有すると決定したことに応答して、
前記３つの連続するビン値の各々についてのマグニチュードポイントを抽出することと、
前記３つの連続するビン値の各々についての前記マグニチュードポイントに基づいて、前記少なくとも１つのトーンについてのフラクショナルビンオフセットを計算することと、
前記フラクショナルビンオフセットに基づいて、前記少なくとも１つのトーンについてのビン周波数を計算することと、
を含む動作を実施する、装置（１３０４）。
前記少なくとも１つのトーンについての前記フラクショナルビンオフセットを計算することが、前記少なくとも１つのトーンについての前記３つの連続するビン値の各々を含んでいる周波数スペクトルについての、スケーリング係数、前記スペクトル表現のために使用される窓関数、および変換長に基づいて、前記少なくとも１つのトーンについての前記フラクショナルビンオフセットを計算することを含む、請求項８に記載の装置。
前記スケーリング係数が窓関数のタイプに依存する、請求項９に記載の装置。
前記少なくとも１つのトーンについての前記フラクショナルビンオフセットを計算することが、前記３つの連続するビン値の各々を含んでいる周波数スペクトルについての、窓関数および変換長に基づいて、前記少なくとも１つのトーンについての前記フラクショナルビンオフセットを計算することを含む、請求項８から１０のいずれか一項に記載の装置。
前記フラクショナルビンオフセットを計算することが、
ｆ_ｋ＝（ｋ＋δ）Ｃ
に従って前記フラクショナルビンオフセットを計算することを含み、ｆ_ｋが、ピークロケーションｋについての前記フラクショナルビンオフセットであり、δが補間値であり、Ｃが、Ｈｚ／ビン単位の粗い分解能である、請求項１１に記載の装置。
δが、

に従って決定され、ここで、Ｋ_{ｊａｃｏｂ}がスケーリング係数であり、Ｘ_ｋ－１、Ｘ_ｋ、およびＸ_ｋ＋１が、_ｋにおける前記少なくとも１つのトーンについての複素数値係数である、請求項１２に記載の装置。
決定することおよび処理することが、前記スペクトル表現の前記少なくとも１つのトーンの各々について実施される、請求項８から１３のいずれか一項に記載の装置。
受信されたオーディオ信号に関連する損失したオーディオフレームについての隠蔽方法を制御するためのデコーダ（１３００）の少なくとも１つのプロセッサ（１３０６）によって実行されるべきプログラムコードを備えるコンピュータプログラムであって、前記プログラムコードの実行は、前記デコーダ（１３００）に、請求項１から７のいずれか一項に記載の方法を実施させる、コンピュータプログラム。
請求項１５に記載のコンピュータプログラムを含む非一時的記憶媒体。