JP2023166423A

JP2023166423A - Ｍｄｃｔ係数からのスペクトル形状予測

Info

Publication number: JP2023166423A
Application number: JP2023133704A
Authority: JP
Inventors: マルティンセールステッド，; Sehlstedt Martin; ヨナススヴェドベリ，; Svedberg Jonas
Original assignee: Telefonaktiebolaget LM Ericsson AB
Current assignee: Telefonaktiebolaget LM Ericsson AB
Priority date: 2019-02-21
Filing date: 2023-08-18
Publication date: 2023-11-21
Also published as: WO2020169754A1; US20220189490A1; EP3928314A1; JP7335968B2; KR20210130743A; MX2021009635A; EP3928313A1; US20220172733A1; CN113439302A; JP2023029834A; JP2023138988A; JP7307805B2; WO2020169757A1; CO2021012223A2; JP2022521077A; US20220148602A1; JP7471375B2; WO2020169756A1; US11862180B2; CN113454713A

Abstract

【課題】失われた音響フレームのための隠蔽方法を制御するための方法、デコーダおよびプログラムコードを提供する。【解決手段】隠蔽方法は、修正離散コサイン変換（ＭＤＣＴ）係数を得るために受け取った音響信号の第１の音響フレームおよび第２の音響フレームを復号し、復号された第１の音響フレームから復号されたＭＤＣＴ係数に基づく第１のスペクトル形状の値および復号された第２の音響フレームから復号されたＭＤＣＴ係数に基づく第２のスペクトル形状の値を決定し、決定された第１の音響フレームおよび第２の音響フレームのスペクトル形状の値およびフレームエネルギーをＦＦＴに基づくスペクトル解析の表現に変換し、変換されたＦＦＴの表現に基づいて過渡状態を検出し、過渡状態の検出に応答して置換フレームスペクトルのスペクトルの大きさを選択的に調整する。【選択図】図９

Description

本発明は、一般に、受け取った音響信号に関連する失われた音響フレームを隠蔽する方法に関する。また、本発明は、受け取った符号化音響信号に関連する失われた音響フレームを隠蔽するように設定されたデコーダにも関する。

近代の通信チャネル／ネットワークを介した音声／音響の伝送は、音声／音響コーデックを使用して主としてデジタル領域で実施されている。これは、デジタルサンプルを得るためにアナログ信号を取得し、サンプリングおよびアナログ－デジタル変換器（ＡＤＣ）を使用してアナログ信号をデジタル化することを伴うことがある。これらのデジタルサンプルは、アプリケーションに応じて１０～４０ｍｓの連続する期間からのサンプルを含有するフレームにさらに分類することができる。これらのフレームは、次に、転送する必要があるビット数を少なくし、かつ、依然として可能な限り高い品質を達成することができる圧縮アルゴリズムを使用して処理することができる。次に、符号化されたビットストリームがデータパケットとしてデジタルネットワークを介して受信機に転送される。受信機ではプロセスが逆転される。最初にデータパケットを復号して、デジタルサンプルを有するフレームを再形成することができ、次に、再形成されたフレームをデジタル－アナログ変換器（ＤＡＣ）に入力して、入力アナログ信号の近似を受信機で再形成することができる。図１は、上で説明した手法を使用した、デジタルネットワークなどのネットワークを介した音響エンコーダおよびデコーダを使用した音響伝達のブロック図の一例を提供したものである。

データパケットがネットワークを介して転送されるとき、トラフィック負荷のためにネットワークによって落とされ得るか、またはデジタルデータを無効にして復号することができないようにするビット誤りの結果として落とされ得るか、のいずれかのデータパケットが存在し得る。これらの事象が生じると、デコーダは、実際に復号することが不可能な期間の間、出力信号を取り替える必要がある。この取替えプロセスは、典型的にはフレーム／パケット損失隠蔽と呼ばれている。図２は、パケット損失隠蔽を含むデコーダ２００のブロック図を図解したものである。不良フレームインジケータ（ＢＦＩ）が失われたフレームまたは破損したフレームを示すと、ＰＬＣ２０２は、失われた／破損したフレームを取り替えるための信号を作り出すことができる。そうでない場合、すなわちＢＦＩが失われたフレームまたは破損したフレームを示さない場合、受け取った信号がストリームデコーダ２０４によって復号される。フレームの消去は、現在のフレームに対する不良フレームインジケータ変数をアクティブにセットする、すなわちＢＦＩ＝１にすることによってデコーダに信号を発信することができる。復号されたフレームまたは隠蔽されたフレームは、次に、アナログ信号を出力するためにＤＡＣ２０６に入力される。フレーム／パケット損失隠蔽は、誤り隠蔽ユニット（ＥＣＵ）と呼ぶことも可能である。

デコーダの中でパケット損失隠蔽を実施する多くの方法が存在している。いくつかの例は、失われたフレームを無音と取り替え、最後のフレームを繰り返す（または最後のフレームパラメータを復号する）ものである。他の解決法は、音響信号の最もありそうな継続とのフレームの取替えを試みる。雑音のような信号に対して、１つの解決法は、同様のスペクトル構造を有する雑音を生成する。音色信号に対しては、最初に現在の音調の特性（周波数、振幅、および位相）を予測し、これらのパラメータを使用して、失われたフレームの対応する一時的な位置に音調の継続を生成することができる。

ＥＣＵの別の実施形態の一例は、国際特許出願第ＷＯ２０１４１２３４７０号に元々記載されている位相ＥＣＵであり、ここでデコーダは、通常の復号の間、復号された信号のプロトタイプを連続的に保存することができる。このプロトタイプは、失われたフレームの場合に使用することができる。プロトタイプは、そのスペクトルが解析され、雑音および音色ＥＣＵ機能がスペクトル領域で組み合わされる。位相ＥＣＵは音調を識別し、関係するスペクトルビンのスペクトル一時的取替えを計算する。他のビンは雑音として取り扱うことができ、また、これらのスペクトル域における音色アーチファクトを回避するためにスクランブルされる。結果として得られる再形成スペクトルは、時間領域に変換された逆ＦＦＴ（高速フーリエ変換）であり、また、信号は、失われたフレームの取替えを作り出すために処理される。

ほとんどの信号は、長い時間期間にわたって継続することはめったにない。誤りバーストをより良好に取り扱うために、ＥＣＵは、現在の入力信号の低分解能スペクトル予測を長期背景予測として使用することができる。より長いバーストの間、ＥＣＵは、再構成するターゲットを時間と共に変更することができる。最初、ターゲットは最後の信号と取り替えることである。時間と共に、ターゲットは、予測をより雑音様にし、最終的には出力を消音させるターゲットへ移動することになる低分解能背景予測に切り替えることができる。

パケット損失隠蔽の場合、現在の入力の低分解能スペクトル表現が必要である。国際特許出願第ＷＯ２０１４１２３４７１号（付録１を参照されたい）に記載されている実施形態では、２つの短いＦＦＴからスペクトル表現を形成することができ、短いＦＦＴの各々はプロトタイプフレームの四分の一であり、過渡検出のために使用される。短い変換の場合、予測は高い分散を有し得る。より安定した長期予測を得るために、２つのＦＦＴの平均を使用することができる。これらの実施形態では、ＦＦＴビンは、聴覚システムにおける臨界帯域を近似的に表す副帯域に分類する。

長期予測は、より長い誤りバーストにおけるターゲットスペクトルとして使用することができ、したがって、時間と共に、失われたフレームを現在の入力背景信号を表す信号と取り替えることができる。

この手法が抱えている欠点は、短いＦＦＴが第１の誤りフレームにおける複雑性を実質的に増すことである。第１の誤りフレームは、失われた信号の再構成を実施することができる前に、スペクトル解析、正弦曲線位置、および正弦曲線成分の一時的補償の完全なＰＬＣチェーンを実施するために使用されるため、既に高い複雑性を有している。

このような場合、２つの短いＦＦＴ（総合プロトタイプフレームの個々の側に位置している）をスペクトル過渡検出器のために使用することもできる（オンセットおよびオフセットを検出する）。したがって、すべての取替えは、その目的に使用するためにも十分に正確でなければならない。

位相ＥＣＵＰＬＣが動作する様子に関するさらなる情報は、国際特許出願第ＷＯ２０１４１２３４７１号（付録１を参照されたい）および３ＧＰＰＴＳ２６．４４７Ｖ１５．０．０ｃｌａｕｓｅ５．４．３．５の中に見出すことができる。

本明細書において開示される本発明の概念の様々な実施形態は、場合によっては、短いＦＦＴが第１の誤りフレームにおける複雑性を実質的に増す、という現在の認識から生じている。第１の誤りフレームは、失われた信号の再構成を実施することができる前に、スペクトル解析、正弦曲線位置、および正弦曲線成分の一時的補償の完全なＰＬＣチェーンを実施するために使用されるため、既に高い複雑性を有している。

本発明の概念のいくつかの実施形態によれば、受け取った音響信号に関連する失われた音響フレームのための隠蔽方法を制御する方法が提供される。このような方法では、修正離散コサイン変換（ＭＤＣＴ）係数を得るために、受け取った音響信号の第１の音響フレームが復号される。復号された第１の音響フレームから復号されたＭＤＣＴ係数に基づいて第１のスペクトル形状の値が決定され、第１のスペクトル形状はある数の副帯域を含む。第２の音響フレームのためのＭＤＣＴ係数を得るために、受け取った音響信号の第２の音響フレームが復号される。復号された第２の音響フレームから復号されたＭＤＣＴ係数に基づいて第２のスペクトル形状の値が決定され、第２のスペクトル形状は上記数の副帯域を含む。第１の音響フレームの第１のスペクトル形状の値および第１のフレームエネルギーは、第１の高速フーリエ変換（ＦＦＴ）に基づくスペクトル解析の第１の表現に変換され、また、第２の音響フレームの第２のスペクトル形状の値および第２のフレームエネルギーは、第２のＦＦＴスペクトル解析の第２の表現に変換される。過渡状態は、第１のＦＦＴの第１の表現および第２のＦＦＴの第２の表現に基づいて検出される。過渡状態の検出に応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整することによって隠蔽方法が修正される。

本発明の概念のいくつかの実施形態によれば、受け取った音響信号に関連する失われた音響フレームのための隠蔽方法を制御するためにデコーダ装置が提供される。本デコーダ装置は、修正離散コサイン変換（ＭＤＣＴ）係数を得るために、受け取った音響信号の第１の音響フレームを復号する。本デコーダ装置は、復号された音響フレームから復号されたＭＤＣＴ係数に基づいて第１のスペクトル形状の値を決定し、第１のスペクトル形状はある数の副帯域を含む。本デコーダ装置は、受け取った音響信号の第２の音響フレームを復号する。本デコーダ装置は、復号された第２の音響フレームから復号されたＭＤＣＴ係数に基づいて第２のスペクトル形状の値を決定し、第２のスペクトル形状は上記数の副帯域を含む。本デコーダ装置は、第１の音響フレームの第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速フーリエ変換（ＦＦＴ）に基づくスペクトル解析の第１の表現に変換し、また、第２の音響フレームの第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換する。本デコーダ装置は、第１のＦＦＴの第１の表現および第２のＦＦＴの第２の表現に基づいて過渡状態を検出する。本デコーダ装置は、過渡状態の検出に応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整することによって隠蔽方法を修正する。

本発明の概念のいくつかの実施形態によれば、受け取った音響信号に関連する失われた音響フレームのための隠蔽方法を制御するためのコンピュータプロセッサによる方法が提供される。本方法は、修正離散コサイン変換（ＭＤＣＴ）に基づいて、受け取った音響信号の第１の音響フレームを復号することを含む。本方法は、復号された音響フレームからの復号されたＭＤＣＴ係数に基づいて第１のスペクトル形状の値を決定すること、および計算された第１のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファに記憶することを含み、第１のスペクトル形状はある数の副帯域を含む。本方法は、音響フレームの第１のフレームエネルギーを決定すること、および計算された第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶することを含む。本方法は、受け取った音響信号の第２の音響フレームを復号することを含む。本方法は、計算された第１のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファからｓｈａｐｅ_ｏｏｌｄバッファへ移すことを含む。本方法は、計算された第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファからＥ＿ｗ_ｏｏｌｄバッファへ移すことを含む。本方法は、復号された第２の音響フレームからの復号されたＭＤＣＴ係数に基づいて第２のスペクトル形状の値を決定すること、および計算された第２のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファに記憶することを含み、第２のスペクトル形状は上記数の副帯域を含む。本方法は、第２の音響フレームの第２のフレームエネルギーを決定すること（９１５）、および計算された第２のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶することを含む。本方法は、第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速フーリエ変換（ＦＦＴ）に基づくスペクトル解析の第１の表現に変換すること、ならびに第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換することを含む。本方法は、第１の高速ＦＦＴの第１の表現および第２のＦＦＴの第２の表現に基づいて、失われた音響フレームのための置換フレームを作り出すために隠蔽方法が使用される場合に、その失われた音響フレームのための置換フレームの最適以下の再構成品質をもたらし得る状態を検出することを含む。本方法は、上記状態の検出に応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整することによって隠蔽方法を修正すること（９２１）を含む。

以下で説明される様々な実施形態における技法の利点は、２つの短いＦＦＴの使用を回避することができることである。この回避により、第１の失われたフレームの複雑性、および失われたフレームを処理する処理オーバヘッドが直接低減されるため、これは重要である。第１の失われたフレームでは、プロトタイプフレームのやや長いＦＦＴ、および再構成されたスペクトルの同様に長い逆ＦＦＴの両方が必要であるため、複雑性が高い。

本開示のさらなる理解を提供するために含まれ、また、本出願に組み込まれ、かつ、本出願の一部を構成している添付の図面は、本発明の概念の特定の非制限の実施形態を図解したものである。

ネットワークを介した音響エンコーダおよび音響デコーダを使用したブロック図である。パケット損失隠蔽を含むデコーダのブロック図である。本発明の概念のいくつかの実施形態による、良好なフレームの間、スペクトルパラメータを更新するためのものであってもよい操作および方法のフローチャートである。本発明の概念のいくつかの実施形態による、良好なフレームの間、スペクトルパラメータを更新するように実施することができる操作および方法のフローチャートである。本発明の概念のいくつかの実施形態による、不良フレームの間、スペクトルパラメータを更新するためのフローチャートである。次のフレームが失われた場合の過渡検出のためのＰＬＣプロトタイプバッファおよび短いＦＦＴの位置の信号線図である。いくつかの実施形態による、次のフレームが失われた場合の過渡検出のためのＰＬＣプロトタイプバッファ、およびスペクトル形状およびフレームエネルギーの位置の信号線図である。ＰＬＣに関係する異なる変換のための、周波数分解能およびビン中心点の相違を図解した線図である。本発明の概念のいくつかの実施形態による、隠蔽方法の修正を図解したフローチャートである。本発明の概念のいくつかの実施形態による、隠蔽方法の修正を図解したフローチャートである。本発明の概念のいくつかの実施形態による、隠蔽方法の修正を図解したフローチャートである。本発明の概念のいくつかの実施形態によるデコーダ装置の一例を示す図である。本発明の概念のいくつかの実施形態によるデコーダ装置の別の例を示す図である。

以下、本発明の概念について、本発明の概念の実施形態の例が示されている添付の図面を参照してより完全に説明する。しかしながら本発明の概念は、多くの異なる形態で具体化することができ、本明細書において説明されている実施形態に限定されるものとして解釈してはならない。そうではなく、これらの実施形態は、本開示が徹底的で、かつ、完全なものであり、また、本発明の概念の範囲が当業者に完全に伝わるように提供されている。また、これらの実施形態は相互に排他的ではないことに同じく留意されたい。１つの実施形態からの構成要素は、別の実施形態にも存在し／使用されることが暗黙のうちに仮定され得る。

以下の説明は、開示される主題の様々な実施形態を提供したものであり、これらの実施形態は教示例として提供されており、開示される主題の範囲を制限するものとして解釈してはならない。例えば説明されている実施形態の特定の詳細は、その説明されている主題の範囲を逸脱することなく、修正し、省略し、あるいは拡張することが可能である。

本明細書において説明されている本発明の概念はＰＬＣの複雑性を低減する。これらの実施形態は、パケット隠蔽のために使用される手法が周波数領域における正弦波モデル化である実施形態の複雑性を、バースト誤りをより良好に取り扱うための追加低分解能背景雑音モデルを使用して低減することに関している。この場合、手法は、より長い誤りバーストにわたって、正弦波モデルから低分解能雑音モデルへ向かって進行する。低分解能雑音モデルは、第１の誤りフレームの間、保存されたプロトタイプフレームに基づいて更新することができる。説明されている技法を同じく使用して、様々な周波数帯域における信号に対する時間によるエネルギー崩壊の高品質（および低複雑性）周波数帯域予測を決定することができ、この予測を使用して、隠蔽されたフレームの帯域エネルギーをモデル化することができる。

音声／音響圧縮が周波数領域で実施される場合、修正離散コサイン変換（ＭＤＣＴ）領域が最もしばしばである周波数領域で利用することができるスペクトル表現が既に存在し得る。多くの状況において利用することができるスペクトル表現の係数を使用して、短いＦＦＴの複雑性と取り替えるための代替スペクトル形状を形成することができる。例えば第１のフレーム誤りのスペクトル形状を使用して、短いＦＦＴによって生成されたであろうスペクトル予測に対応するスペクトル予測を作り出すことができる。

本明細書において説明されている実施形態では、利用可能なＭＤＣＴ係数を使用してスペクトル形状を提供することができ、一方、スペクトル予測のためのエネルギー（すなわちレベル）は、窓処理されたプロトタイプフレームのエネルギーに基づいている。しかしながら本発明者らは、ＭＤＣＴ係数のみを形状およびレベルの両方に使用すると、取り替えられるべき２つの短いＦＦＴのための不十分な品質予測を提供することが分かったことを認識するに至った。

以下で説明される技法の利点は、２つの短いＦＦＴの使用を回避することができることである。この回避により、第１の失われたフレームの複雑性が直接低減されるため、これは重要である。第１の失われたフレームでは、プロトタイプフレームのやや長いＦＦＴ、および再構成されたスペクトルの同様に長い逆ＦＦＴの両方が必要であるため、複雑性が高い。

デコーダに利用することができるＭＤＣＴ係数は安定したエネルギー予測を提供しないが、係数はスペクトル形状予測のために使用することができる。窓処理されたプロトタイプフレームのエネルギーは実際のＦＦＴスペクトルのより良好な予測をもたらすことができるため、スペクトル予測のためのレベルを得るために、この窓処理されたプロトタイプフレームのエネルギーを使用することができる。

２つのより短いＦＦＴを使用する複雑性を回避することにより、一時的な特性およびスペクトル特性の両方にわずかな相違が生じることがある。このような相違は、背景信号の長期予測の形態で使用するためには大して重要な相違ではなく、また、このわずかな相違は、過渡検出器エネルギー崩壊予測に対する大きな問題ではない。

ＭＤＣＴ係数（または通常の符号化された領域に利用することができる任意の他のスペクトル領域情報）、および２つの短いＦＦＴ変換の代わりに使用することができるスペクトル形状への変換を再使用する本発明の概念により、複雑性および失われたフレームを処理する処理オーバヘッドが低減される。これには、ＦＦＴビンを可能な限り近く近似するフォーマットにＭＤＣＴ係数がどのように分類されるかということも関与する。

デコーダ装置は、２つのユニットからなっていてもよく、または図２に図解されているＰＬＣの一部もしくは図１２および図１３に図解されているデコーダ装置であってもよい。デコーダ（１２０１、１３０１）は、誤りがない操作の間、スペクトル形状およびフレームエネルギーを更新することができる。デコーダ（１２０１、１３０１）は、第１のフレーム誤りの間、保存されたスペクトル形状およびフレームエネルギーを使用して、誤り隠蔽中に使用されるべき長期スペクトル予測を生成することができる。デコーダ（１２０１、１３０１）の第３の構成要素を同じく使用して、エネルギーの著しい低下が存在している場合などのＰＬＣ再構成において適用されるべき周波数帯域崩壊を決定することができる。

ＭＤＣＴ係数を再使用しても、典型的にはフレーム毎に１つのスペクトル形状が生成されるだけである。第１の誤りフレームの間、２つのスペクトル形状を有することは、良好なフレーム毎に１つのスペクトル形状予測を生成することによって、また、先行する良好なフレームからのスペクトル形状予測を同じく保存することによって達成することができる。スペクトル予測の正しいレベルを得るために、ＭＤＣＴに基づくデコーダにおける良好なフレーム処理の終わりに、対応するＰＬＣ－プロトタイプフレームの窓処理されたエネルギーを保存することができる。良好なフレームは、正しく受け取られた、誤りがないフレームを意味し、一方、不良フレームは、消去された、すなわち失われた、または破損したフレームを意味している。

失われたフレームの間、第２のユニットは、２つの保存されたスペクトル形状およびフレームエネルギーを使用して、２つの短いＦＦＴによって生成されたであろう２つのスペクトル予測に対応する２つのスペクトル予測を生成する。これにより、複雑性およびプロセッサオーバヘッドが低減される。第３のユニットは、保存された形状およびエネルギーに基づいて、失われたフレームのＰＬＣ再構成において、周波数帯域毎に使用されるべき崩壊ファクターを確立することができる。この後に、前述のように位相ＥＣＵの通常の処理が継続され、国際特許出願第ＷＯ２０１４１２３４７１号（付録１）または３ＧＰＰＴＳ２６．４４７Ｖ１５．０．０ｃｌａｕｓｅ５．４．３．５を参照されたい。

本明細書において説明されている技法は、上で説明したようにＭＤＣＴからのスペクトル予測の使用に限定されない。この技法は、コーデックに使用される任意の他のスペクトル予測技法と共に動作するように適合させることができる。

以下は、ＭＤＣＴを使用する機能をより詳細に説明している。

ＭＤＣＴ係数を得るために、ＭＤＣＴは、２０ｍｓウィンドウにわたって、１０ｍｓの前進で獲得される。１つの変換、例えばＭＤＣＴを使用して、別の変換、例えばＦＦＴの副帯域予測を実施する場合、正しい係数にわたって副帯域への分類を実施することが重要である。良好なフレームの後に保存されたＰＬＣプロトタイプフレームは長さが１６ｍｓであり、また、過渡検出器副帯域解析モジュールは、ＰＬＣプロトタイプフレームの四分の一である長さ４ｍｓの２つの短いＦＦＴを使用する。これらの項目の実際の長さは、使用されるサンプリング周波数に応じて決まり、また、８ｋＨｚから４８ｋＨｚまでであり得る。これらの長さは、個々の変換におけるスペクトルビンの数に影響を及ぼす。２つの短いＦＦＴ解析結果を使用して、以下で説明されるように変換ファクターμが決定される。

良好なフレームにおけるスペクトル形状履歴更新
過渡解析のために、位相ＥＣＵは、ＭＤＣＴに基づくスペクトル形状およびＭＤＣＴ－合成窓処理エネルギーの履歴を使用して、入力信号が時間と共にどのように進展してきたかの画像を構築することができる。スペクトル形状は、復号された信号のスペクトル表現を保持している復号されたＭＤＣＴ係数に基づいて計算される。スペクトル形状は副帯域からなっており、ここで副帯域の数Ｎ_ｇｒｐは、表１に示されているようにサンプリング周波数に応じて決まる。

良好なフレームの場合、すなわちフレームが不良フレームではないことを不良フレームインジケータが示している場合（例えばＢＦＩ＝０）、スペクトル形状の値およびフレームエネルギーを更新することができる。これらのステップは図３のフローチャートに図解されている。図３を参照すると、３０１の操作で、ＢＩＦ＝０であるかどうかの決定がなされる。パラメータは、現在のフレームに対してのみ計算することができることに留意されたい。前のフレームが良好なフレームであった場合、最後のフレームの間に保存された値を第２の最後のフレームとして指定されたバッファ（すなわちｓｈａｐｅ_ｏｏｌｄバッファ）へ移すことができる。引き続く操作３０３で、最後のフレームからのスペクトル形状ｓｈａｐｅ_ｏｌｄ（ｋ）が第２のバッファｓｈａｐｅ_ｏｏｌｄ（ｋ）に移されて保存される。
ｓｈａｐｅ_ｏｏｌｄ（ｋ）＝ｓｈａｐｅ_ｏｌｄ（ｋ）、０≦ｋ＜Ｎ_ｇｒｐ（１）

同様に操作３０５で、最後のフレームエネルギーが第２のバッファＥ＿ｗ_ｏｏｌｄに移される。
Ｅ＿ｗ_ｏｏｌｄ＝Ｅ＿ｗ_ｏｌｄ（２）

これらの更新に引き続いて操作３０７および３０９で、最後のフレームバッファのためのスペクトル形状ｓｈａｐｅ_ｏｌｄ（ｋ）およびフレームエネルギーＥ＿ｗ_ｏｌｄの新しい値を計算することができる。表２は、現在のＭＤＣＴ係数のビンをどのように副帯域の間で分割することができるかを実例で示したものである。表２の表項目は、国際出願ＷＯ２０１４／１２３４７１に記載されている方法に使用することができる一実施形態のための個々の副帯域の開始係数を示したものである。他の実施形態に対しては他の副帯域を使用することができる。

副帯域に基づく、範囲［０，．．．１］のスペクトル形状を有することが場合によっては望ましい。これは、

としてＭＤＣＴ係数の全体の大きさ（ｑ＿ｄ（ｎ））を最初に計算することによって達成することができ、上式でＮ_ＭＤＣＴはＭＤＣＴ係数の数であり、表３に実例で示されているサンプリング周波数などのサンプリング周波数に応じて決まる。

次に、ｓｈａｐｅ＿ｔｏｔに対して計算された値を使用して、

として決定することができる個々の副帯域のスペクトル形状を正規化することができ、上式は、最後のフレームの新しい値のためのスペクトル形状予測を形成する。スペクトル形状に割り当てられないいくつかのＭＤＣＴ係数が存在し得ることに留意されたい。これは、ＤＣビンを対応する短いＦＦＴに使用しないことによるものである。

再構成の間、スペクトル形状を使用することができるようにするために、窓処理されたプロトタイプフレームに基づいてフレームエネルギーを計算することができる。これは、

として決定することができ、上式でｗ_ｗｈｒは（とりわけ長期背景近似予測のための）長いＦＦＴスペクトル解析ウィンドウであってもよく、ｘ_ｐｒｅｖは、潜在的に起ころうとしている失われたフレームのための置換を作り出すために使用される位相ＥＣＵ時間領域プロトタイプ信号であり、また、Ｌ_ｐｒｏｔは、時間ウィンドウｗ_ｗｈｒの長さに同じく対応するｘ_ｐｒｅｖ信号におけるサンプルの数である。

一代替実施形態では、総合スペクトル近似性能は、良好な背景予測の提供と、過渡オフセット検出のための良好な予測との間で平衡を取ることができる。この平衡化は、適用されるｗ_ｗｈｒウィンドウを任意選択で長い／１６ｍｓＦＦＴスペクトル解析ウィンドウとは異なるウィンドウに変更することによって一実施形態の中で実施することができる。適用されるｗ_ｗｈｒウィンドウを変更する１つの可能な手法は、エネルギー予測が短い（４ｍｓ）ＦＦＴウィンドウのエネルギー内容とさらに時間整列するよう、ウィンドウを短くし、かつ、エネルギー予測ウィンドウを未来に向かってシフトさせることである。この手法は、エネルギーアライメント計算の複雑性を同じく低減する。例えばＥ＿ｗ_ｏｌｄを直近に合成されたサンプルである３＊Ｌ＿ｐｒｏｔ／４（１２ｍｓ）、さらには直近のサンプルであるＬ＿ｐｒｏｔ／２（８ｍｓ）の窓処理されたエネルギーに低減することができる。これは、背景予測（１６ｍｓの総スペクトル期間をターゲットとした）と過渡オフセット予測（最後の４ｍｓをターゲットとした）との間でスペクトル近似を平衡させることができる。

図４を参照すると、不良フレームまたは不良フレームのバーストの後の二次バッファの中の古い値の使用を回避するために、スペクトル形状およびフレームエネルギーのｓｈａｐｅ_ｏｏｌｄ（ｋ）およびＥ＿ｗ_ｏｏｌｄ状態を再初期化することができる。したがって良好なフレームＢＦＩ＝０（操作４０１によって図解されている）が不良フレームＢＦＩ_ｐｒｅｖ＝１（操作４０３によって図解されている）の後に続く場合、それぞれ操作４０５および４０７における第１の式（１）および（２）で記述されているように、計算された値が二次バッファにコピーされる。

短いＦＦＴ副帯域エネルギーへのスペクトル形状の変換
過渡解析には、副帯域エネルギーが時間と共にどのように進展しているかを解析するために、保存されたスペクトル形状およびフレームエネルギーを使用することができる。これらの値は、２つのことのため、すなわち第１に副帯域過渡検出器のため、および第２に長期平均

を形成するために使用することができ、

は、バースト誤りの間、副帯域エネルギーを調整するために使用することができる。これらの値は、誤りバーストの間に使用される信号修正値を計算するための基本を形成する。

スペクトル形状およびフレームエネルギーを使用して、誤りがない２つの最後のフレームのための副帯域エネルギーの近似が生成される。これは、図５のフローチャートにおいて、不良フレームインジケータが、操作５０１で不良フレーム（すなわちＢＦＩ＝１）を示す場合と図解されている。図５を参照すると、第１のフレームは、最後のフレームの前の副帯域フレームエネルギーを表しており、操作５０３で、
Ｅ_ｏｏｌｄ（ｋ）＝μ・ｓｈａｐｅ_ｏｏｌｄ（ｋ）・Ｅ＿ｗ_ｏｏｌｄ、０≦ｋ＜Ｎ_ｇｒｐ（６）
によって生成することができる。

第２の副フレームフレームエネルギーは、最後のフレームのためのものであり、

によって操作５０５で生成することができ、上式でμは、サンプリング周波数に応じて決まるスカラー定数であり、ＭＤＣＴに基づくスペクトル形状の、ＦＦＴに基づくスペクトル解析の近似への変換

を取り扱っている。様々なｆｓ周波数に対するμの一例は表５に示されている。

変換ファクターμはオフラインで計算することができ、また、ＭＤＣＴウィンドウ、および失われたフレーム再構成の間、ＭＤＣＴウィンドウが近似としてサーブするＦＦＴに使用されるウィンドウに応じて決まる。これらの係数を見出すためには、変換ファクターの計算に有効である両方の方法（元のＦＦＴ解析、およびＭＤＣＴを使用した、ＦＦＴの複雑性が低減された近似）を使用してＰＬＣを走らせなければならない。変換ファクターを計算するための便利な方法はサイン波を使用することである。個々のグループインターバルの中心に１つの波を使用することができ、また、１にセットされた係数で計算を開始することができる。２つの方法を比較することによって正しい値を計算することができる。表４の中のビンは、ＰＬＣによってプロトタイプフレームに対して使用されるスペクトル解析のために使用される解析長さの四分の一である解析長さを有するＦＦＴのためのビン分類を示しており、すなわちスペクトル解析が１６ｍｓＦＦＴを使用してなされる場合、ビン分類は４ｍｓスペクトル解析のためのものであることに留意されたい。

図６は、ＭＤＣＴコーダのフレーム化および関係するフレーム構造が、非対称的に配置されたＭＤＣＴウィンドウのためにどのように適用されるかの概要を図解したものであり、ＭＤＣＴウィンドウはルックアヘッドゼロ－ＬＡ＿ＺＥＲＯＳのセグメントを有している。信号線図は、ＭＤＣＴウィンドウの中にルックアヘッドゼロ（ＬＡ＿ＺＥＲＯＳ－フレーム長さの３／８）を使用しているため、フレームは現在のフレームの３／４の点までしか復号されないことを示していることに留意されたい。フレーム化は、現在のフレームのうちの復号が可能である部分に影響を及ぼし、したがって次のフレームが失われる場合に保存され、かつ、使用されるＰＬＣプロトタイプフレームの位置に影響を及ぼす。

図６は、この実施形態で使用される、関与する変換の長さの相違も図解している。符号化されたフレームの長さの２倍の長さを有するＭＤＣＴにおいても、個々のスペクトル点は２つの係数を使用して表され（ＮサンプルがＮ個の複素数、すなわち２Ｎ個のスカラー値をもたらすＦＦＴと比較して）、ここで一方は、もう一方の時間反転であってもよい。

図７は、ＭＤＣＴコーダのフレーム化および関係するフレーム構造が、上で説明したように副帯域エネルギーおよびスペクトル形状を決定するためにどのように適用されるかの概要を図解したものである。図７は、現在のフレームおよび先行するフレームが良好なフレームであることを図解しており、また、符号化プロセスに関係して、図３および図９～図１１の方法を実施することができることを示している。

図８は、異なるスペクトル表現の図形表現を図解したものである。ＰＬＣスペクトル解析は１６ｍｓ時間セグメント上でなされており、これは６２．５Ｈｚのビン間距離をもたらしている。Ｎ点ＦＦＴからＮ／２＋１個のビンが得られ、ここで開始点は０Ｈｚであり、また、最後はｆｓ／２である（サンプリング周波数の１／２）。短いＦＦＴが取り替えられる過渡解析に対しても同様であり、相違は、時間ウィンドウが４ｍｓであり、これが２５０Ｈｚのビン間距離をもたらすことである。２０ｍｓ時間セグメントにわたってなされるＭＤＣＴの場合、ビン間距離は、ＭＭＤＣＴおよびＭＭＤＣＴの長さに対して時間係数および時間反転された係数を分類した後では１００Ｈｚになり、分類した後ではＭ／４個の係数が存在する。ＭＤＣＴはＤＣ係数またはｆｓ／２係数を有していないため、最も単純な表現は、図８に示されているように１／２ビンオフセットを有することである。

一実施形態では、国際特許出願第ＷＯ２０１４１２３４７１号（付録１を参照されたい）に記載されているように、上で説明したような過渡解析のためのスペクトル予測のこれらの予測を使用して、過渡計算および隠蔽適合に使用されたスペクトル予測を取り替えることができる。また、これらの予測は、スペクトル予測が３ＧＰＰＴＳ２５．４４７Ｖ．１５．０．０におけるように使用される他の状況においても同じく使用することができる。

例えば図９を参照すると、デコーダ（１２０１、１３０１）は、操作９０１で、ＭＤＣＴに基づいて、受け取った音響信号の第１の音響フレームを復号することができる。操作９０３でデコーダ（１２０１、１３０１）は、復号された第１の音響フレームからのＭＤＣＴ係数に基づいて第１のスペクトル形状の値を決定し、かつ、第１のスペクトル形状の決定された値をｓｈａｐｅ_ｏｌｄバッファに記憶することができ、第１のスペクトル形状はある数の副帯域を含む。操作９０５でデコーダ（１２０１、１３０１）は、第１の音響フレームの第１のフレームエネルギーを決定し、かつ、決定された第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶することができる。

操作９０７でデコーダ（１２０１、１３０１）は、ＭＤＣＴに基づいて、受け取った音響信号の第２の音響フレームを復号することができる。操作９０９でデコーダ（１２０１、１３０１）は、第１のスペクトル形状の決定された値をｓｈａｐｅ_ｏｌｄバッファからｓｈａｐｅ_ｏｏｌｄバッファへ移すことができる。操作９０９は図３の操作３０３に対応し得る。操作９１１でデコーダ（１２０１、１３０１）は、決定された第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファからＥ＿ｗ_ｏｏｌｄバッファへ移すことができる。操作９１１は図３の操作３０５に対応し得る。

操作９１３でデコーダ（１２０１、１３０１）は、復号された第２の音響フレームからの復号されたＭＤＣＴ係数に基づいて第２のスペクトル形状の値を決定し、かつ、第２のスペクトル形状の決定された値をｓｈａｐｅ_ｏｌｄバッファに記憶することができ、第２のスペクトル形状は上記数の副帯域を含む。操作９１５でデコーダ（１２０１、１３０１）は、第２の音響フレームの第２のフレームエネルギーを決定し、かつ、計算された第２のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶することができる。

操作９１７でデコーダ（１２０１、１３０１）は、第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速フーリエ変換（ＦＦＴ）に基づくスペクトル解析の第１の表現に変換し、また、第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換することができる。

操作９１９でデコーダ（１２０１、１３０１）は、第１のスペクトル形状の変換された値および第２のスペクトル形状の値に基づいて、置換フレームを作り出すために隠蔽方法が使用される場合に、失われた音響フレームのための置換フレームの最適以下の再構成品質をもたらし得る状態を検出することができる。

操作９２１でデコーダ（１２０１、１３０１）は、上記状態の検出に応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整することによって隠蔽方法を修正することができる。

１つの実施形態では、上で説明したスペクトル予測を使用して、国際特許出願第ＷＯ２０１４１２３４７１号および３ＧＰＰＴＳ２５．４４７Ｖ．１５．０．０ｃｌａｕｓｅ５．４．３．５に記載されているような過渡計算および隠蔽適合における複雑性および処理オーバヘッドを低減することができる。Ｅ_ｏｏｌｄ（ｋ）およびＥ_ｏｌｄ（ｋ）を使用してエネルギー比率予測が計算され、また、Ｅ_ｏｏｌｄ（ｋ）およびＥ_ｏｌｄ（ｋ）のビンを使用して過渡検出を実施することができる。例えば図１０を参照すると、操作１００１で、上で説明したようにＥ_ｏｏｌｄ（ｋ）およびＥ_ｏｌｄ（ｋ）の副帯域エネルギーを決定することができる。周波数グループ選択性過渡検出は、ここではＥ_ｏｏｌｄ（ｋ）およびＥ_ｏｌｄ（ｋ）に関連するフレームのそれぞれの帯域エネルギー間の帯域による比率に基づき得る。

他の比率を使用することも可能である。

インターバルＩｋ＝［ｍ_ｋ－１＋１，．．．，ｍ_ｋ］は周波数帯域

に対応しており、上式でｆｓは音響サンプリング周波数を表し、また、Ｎ_ｐａｒｔはフレームのサイズに対応していることに留意されたい。最も低い下側の周波数帯域限界ｍ_０は０にセットすることができるが、周波数が低くなるほど大きくなる予測誤りを軽減するために、もっと高い周波数に対応するＤＦＴ指標にセットすることも可能である。最も高い上側の周波数帯域限界ｍ_Ｋは

にセットすることができるが、依然として過渡が著しい可聴効果を有する幾分かより低い周波数に対応するように選択されることが好ましい。

比率は、特定の閾値に対して比較することができる。例えば（周波数選択性）オンセット検出１００３のためのそれぞれの上側の閾値、および（周波数選択性）オフセット検出１００５のためのそれぞれの下側の閾値を使用することができる。エネルギー比率が上側の閾値を超えている場合、または下側の閾値未満である場合、操作１００７で隠蔽方法を修正することができる。これらの操作は図９の操作９１９に対応している。

図９の操作９２１の隠蔽方法を修正する一例が図１１に図解されている。隠蔽方法修正のこの実施形態では、置換フレームスペクトルの大きさおよび位相が決定される。大きさは、２つのファクターα（ｍ）およびβ（ｍ）を使用してスケーリングすることによって修正され、また、位相は付加的位相成分θ（ｍ）を使用して修正される。これにより置換フレームの計算が導かれる。

上式でＺ（ｍ）は置換フレームスペクトルであり、α（ｍ）は第１の大きさ減衰ファクターであり、β（ｍ）は第２の大きさ減衰ファクターであり、Ｙ（ｍ）はプロトタイプフレームであり、θ_ｋは位相シフトであり、θ（ｍ）は付加的位相成分である。

この実施形態では、連続して観察されたフレーム損失の数ｎ_{ｂｕｒｓｔ}が決定され、ここでフレーム損失毎にバースト損失カウンタが１だけ増分され、また、有効フレームを受け取るとゼロにリセットされる。操作１１０１における大きさ適合は、操作１１０３で決定されるように、バースト損失カウンタｎ_{ｂｕｒｓｔ}が何らかの閾値ｔｈｒ_{ｂｕｒｓｔ}、例えばｔｈｒ_{ｂｕｒｓｔ}＝３を超えると実施されることが好ましい。その場合、減衰ファクターには１よりも小さい値、例えばα（ｍ）＝０．１が使用される。大きさ減衰ファクターに関するさらなる適合は、操作１１０５で決定されるように、インジケータＲ_{ｏｌｄ＼ｏｏｌｄ，ｂａｎｄ}（ｋ）または別法としてＲ_{ｏｌｄ＼ｏｏｌｄ}（ｍ）あるいはＲ_{ｏｌｄ＼ｏｏｌｄ}が閾値を通過したことに基づいて過渡が検出された場合に実施することができる。その場合、操作１１０７における適切な適合アクションは、２つのファクターの積α（ｍ）・β（ｍ）によって総減衰が制御されるよう、第２の大きさ減衰ファクターβ（ｍ）を修正することである。

β（ｍ）は、示された過渡に応答して設定することができる。オフセットが検出される場合、ファクターβ（ｍ）は、オフセットのエネルギー減少を反映するように選択することができる。適切な選択は、β（ｍ）を検出された利得変化にセットすることである。

オンセットが検出される場合、どちらかと言えば、置換フレームにおけるエネルギー増加を制限することが有利であることが分かっている。その場合、ファクターを例えば１である何らかの固定された値にセットすることができ、これは減衰が存在していないことを意味しているが、増幅も全く存在していないことも同じく意味している。

操作１１０９における位相ディザリングの例は、国際特許出願第ＷＯ２０１４１２３４７１号（付録１を参照されたい）および３ＧＰＰ＿ＴＳ＿２６．４４７＿ｖ．１５．０．０＿２０１８＿０６，ｃｌａｕｓｅ５．４．３．５．３に記載されており、本明細書において詳細に説明する必要はない。

図１２は、実施形態に従って使用することができるデコーダの略ブロック図である。デコーダ１２０１は、符号化された音響信号を受け取るように設定された入力ユニット１２０３を備えている。図１１は、論理フレーム損失隠蔽ユニット１２０５によるフレーム損失隠蔽を図解したものであり、これは、デコーダが失われた音響フレームの隠蔽を上で説明した実施形態に従って実現するように設定されていることを示している。さらに、デコーダは、図３～図５および図９～図１１に図解されている操作、および／またはそれぞれの例示的実施形態に関係して以下で考察される操作を含む、上で説明した実施形態を実現するためのコントローラ１２０７を備えている。

例えばコントローラ１２０７は、既に受け取られ、かつ、再構成された音響信号の特性、または元の非適合位相ＥＣＵ方法による失われたフレームの置換が比較的低減された品質を提供する観察されたフレーム損失の統計的特性を決定するように設定することができる。このような状態が検出される場合、コントローラ１２０７は、上で説明したような位相またはスペクトルの大きさを選択的に調整することによって計算される置換フレームスペクトルに応じて隠蔽方法の要素を修正し、また、再生のために受信機に向けて音響フレームを出力するように設定することができる。受信機は、拡声器、拡声器デバイス、電話、等々を有するデバイスであってもよい。

デコーダはハードウェアの中で実現することができる。デコーダのユニットの機能を達成するために使用し、組み合わせることができる多くの様々な回路機構要素が存在している。このような変形形態は実施形態によって包含されている。デコーダのハードウェア実施態様の特定の例は、デジタル信号プロセッサ（ＤＳＰ）ハードウェア、および汎用電子回路機構および特定用途向け回路機構の両方を含む集積回路技術における実施態様である。

本明細書において説明されているデコーダは、別法として、図３～図５および図９～図１１に示されているように、本明細書において説明されている実施形態に従って音響フレーム損失隠蔽を実施することを含む音響信号の再構成のために、例えば図１３に図解されているように実現することも可能であり、すなわちプロセッサ１３０５、およびそのための適切な記憶装置すなわちメモリ１３１１を有する適切なソフトウェア１３０９のうちの１つまたは複数によって実現することができる。入ってくる符号化された音響信号は、プロセッサ１３０５およびメモリ１３１１が接続されている入力（ＩＮ）１３０３によって受け取られる。ソフトウェアから得られた、復号され、かつ、再構成された音響信号は、再生のために出力（ＯＵＴ）１３０７から受信機に向けて出力される。本明細書において考察されているように、デコーダ１３０１の操作はプロセッサ１３０５によって実施することができる。さらに、モジュールはメモリ１３１１に記憶することができ、また、これらのモジュールは命令を提供することができ、したがってモジュールの命令がプロセッサ１３０５によって実行されると、プロセッサ１３０５はそれぞれの操作を実施する。

上で説明した技術は、例えば、移動デバイス（例えば移動電話、ラップトップコンピュータ）、またはパーソナルコンピュータなどの据付けデバイスに使用することができる受信機に使用することができる。

対話ユニットまたはモジュール、ならびにユニットの名前付けの選択は、単に例示的目的のためにすぎず、開示されたプロセスアクションを実行することができるようにするために複数の代替方法で設定することができることを理解されたい。

略称
以下の略称のうちの少なくともいくつかは本開示に使用することができる。略称同士の間に矛盾が存在している場合、その略称が上でどのように使用されているかを優先するべきである。以下で複数回にわたって列挙されている場合、最初の列挙をすべての後続する列挙よりも優先すべきである。
略称説明
ＡＤＣアナログ－デジタル変換器
ＢＦＩ不良フレームインジケータ
ＢＦＩ＿ｐｒｅｖ先行するフレームの不良フレームインジケータ
ＤＡＣデジタル－アナログ変換器
ＦＦＴ高速フーリエ変換
ＭＤＣＴ修正離散コサイン変換
参考文献
［１］国際特許出願第ＷＯ２０１４１２３４７０号
［２］国際特許出願第ＷＯ２０１４１２３４７１号
［３］参照によりその全体が本明細書に組み込まれている３ＧＰＰＴＳ２６．４４５Ｖ１５．１．０（ｃｌａｕｓｅｓ５．３．２．２ａｎｄ６．２．４．１）
［４］参照によりその全体が本明細書に組み込まれている３ＧＰＰＴＳ２６．４４７Ｖ１５．０．０（ｃｌａｕｓｅ５．４．３．５）

例示的実施形態の列挙
以下、例示的実施形態が考察される。参照番号／文字は、例示的実施形態を参照番号／文字によって示されている特定の要素に限定することなく、一例／例証として括弧に入れて提供されている。
１．受け取った音響信号の失われた音響フレームのための隠蔽方法を制御するためのコンピュータプロセッサによる方法であって、本方法は、
修正離散コサイン変換（ＭＤＣＴ）に基づいて、受け取った音響信号の第１の音響フレームを復号すること（９０１）と、
復号された音響フレームからの復号されたＭＤＣＴ係数に基づいて第１のスペクトル形状の値を決定すること（３０７～３０９、９０３）、および計算された第１のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファに記憶することであって、第１のスペクトル形状はある数の副帯域を含む、第１のスペクトル形状の値を記憶することと、
音響フレームの第１のフレームエネルギーを決定すること（９０５）、および計算された第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶することと、
受け取った音響信号の第２の音響フレームを復号すること（９０７）と、
計算された第１のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファからｓｈａｐｅ_ｏｏｌｄバッファへ移すこと（３０３、９０９）と、
計算された第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファからＥ＿ｗ_ｏｏｌｄバッファへ移すこと（３０５、９１１）と、
復号された第２の音響フレームからの復号されたＭＤＣＴ係数に基づいて第２のスペクトル形状の値を決定すること（３０７～３０９、９１３）、および計算された第２のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファに記憶することであって、第２のスペクトル形状は上記数の副帯域を含む、第２のスペクトル形状の値を記憶することと、
第２の音響フレームの第２のフレームエネルギーを決定すること（９１５）、および計算された第２のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶することと、
第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速フーリエ変換（ＦＦＴ）に基づくスペクトル解析の第１の表現に変換すること（９１７）、および第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換すること（９１７）と、
第１の高速ＦＦＴの第１の表現および第２のＦＦＴの第２の表現に基づいて、失われた音響フレームのための置換フレームを作り出すために隠蔽方法が使用される場合に、その失われた音響フレームのための置換フレームの最適以下の再構成品質をもたらし得る状態を検出すること（９１９）と、
上記状態の検出に応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整することによって隠蔽方法を修正すること（９２１）と
を含む。
２．実施形態１の方法であって、復号されたＭＤＣＴ係数に基づいて第１のスペクトル形状の値を決定することは、
ＭＤＣＴ係数の全体の大きさを決定すること（３０７）と、
第１のスペクトル形状の個々の副帯域値を正規化することと、
個々の正規化された副帯域値を第１のスペクトル形状の値のうちの一値として記憶することと
を含む。
３．実施形態２の方法であって、ＭＤＣＴ係数の全体の大きさは、

に従って決定され、上式でｓｈａｐｅ＿ｔｏｔはＭＤＣＴ係数の全体の大きさであり、Ｎ_ＭＤＣＴはＭＤＣＴ係数の数であってサンプリング周波数に応じて決まり、また、ｑ＿ｄ（ｎ）はＭＤＣＴ係数である。
４．実施形態２～３のうちのいずれかの方法であって、個々の副帯域の正規化は、

に従って正規化され、上式でｓｈａｐｅ_ｏｌｄ（ｋ）は副帯域（ｋ）のスペクトル形状であり、ｓｈａｐｅ＿ｔｏｔはＭＤＣＴ係数の全体の大きさであり、ｑ＿ｄ（ｎ）はＭＤＣＴ係数であり、Ｎ_ｇｒｐはＭＤＣＴ係数の数であり、ｇｒｐ＿ｂｉｎ（ｋ）は副帯域（ｋ）におけるＭＤＣＴ係数に対する開始指標であり、Ｎ_ｇｒｐは副帯域の数である。
５．実施形態１～４のうちのいずれかの方法であって、第１のフレームエネルギーおよび第２のフレームエネルギーのフレームエネルギーは、

に従って決定され、上式でＥ＿ｗ_ｏｌｄはフレームエネルギーであり、ｗ_ｗｈｒは長いＦＦＴスペクトル解析ウィンドウであり、ｘ_ｐｒｅｖは、潜在的に起ころうとしている失われたフレームのための置換を作り出すために使用される時間領域プロトタイプ信号であり、Ｌ_ｐｒｏｔはｘ_ｐｒｅｖ信号におけるサンプルの数である。
６．実施形態１～５のうちのいずれかの方法であって、第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速ＦＦＴに基づくスペクトル解析の第１の表現に変換すること、ならびに第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換することは、第１のスペクトル形状の値および第１のフレームエネルギー、ならびに第２のスペクトル形状の値および第２のフレームエネルギーに変換ファクターを適用することを含む。
７．実施形態６の方法であって、変換ファクターは復号のサンプリング周波数に応じて決まる。
８．実施形態４～７のうちのいずれかの方法であって、
Ｅ_ｏｏｌｄ（ｋ）が第１の表現であり、μが変換ファクターであり、ｓｈａｐｅ_ｏｏｌｄ（ｋ）が第１のスペクトル形状の副帯域（ｋ）のスペクトル形状であり、Ｅ＿ｗ_ｏｏｌｄが第１のフレームエネルギーであり、Ｅ_ｏｌｄ（ｋ）が第２の表現であり、ｓｈａｐｅ_ｏｌｄ（ｋ）が第２のスペクトル形状の副帯域（ｋ）のスペクトル形状であり、Ｅ＿ｗ_ｏｌｄが第２のフレームエネルギーであり、Ｎ_ｇｒｐが副帯域の数である、
Ｅ_ｏｏｌｄ（ｋ）＝μ・ｓｈａｐｅ_ｏｏｌｄ（ｋ）・Ｅ＿ｗ_ｏｏｌｄ、０≦ｋ＜Ｎ_ｇｒｐ
および

に従って第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速ＦＦＴに基づくスペクトル解析の第１の表現に変換すること、および第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換すること
をさらに含む。
９．実施形態８の方法であって、
Ｅ_ｏｏｌｄ（ｋ）およびＥ_ｏｌｄ（ｋ）に基づいて副帯域過渡が閾値を超えているかどうかを決定すること（１１０５）と、
副帯域過渡が閾値を超えていることに応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整する（１１０７）ことによって隠蔽方法を修正することと
をさらに含む。
１０．実施形態９の方法であって、置換フレームスペクトルは、

の表現式に従って計算され、
また、スペクトルの大きさを調整することは、β（ｍ）を調整すること（１１０７）を含み、ここで、Ｚ（ｍ）が置換フレームスペクトルであり、α（ｍ）が第１の大きさ減衰ファクターであり、β（ｍ）が第２の大きさ減衰ファクターであり、Ｙ（ｍ）がプロトタイプフレームであり、θ_ｋが位相シフトであり、また、θ（ｍ）が付加的位相成分である。
１１．実施形態１～１０のうちのいずれかの方法であって、
不良フレームインジケータを受け取ること（４０３、５０１）と、
不良フレームインジケータの受取りに応答して、ｓｈａｐｅ_ｏｏｌｄバッファおよびＥ＿ｗ_ｏｏｌｄエネルギーバッファをフラッシングすることと、
受け取った音響信号の新しい音響フレームを受け取ることと、
復号された新しい音響フレームからの復号されたＭＤＣＴ係数に基づいて新しいスペクトル形状の値を決定すること（５０３）、および計算された新しいスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファおよびｓｈａｐｅ_ｏｏｌｄバッファに記憶すること（４０５）であって、新しいスペクトル形状はある数の副帯域を含む、新しいスペクトル形状の値を記憶すること（４０５）と、
音響フレームの新しいフレームエネルギーを決定すること（５０５）、および計算された新しいフレームエネルギーをＥ＿ｗ_ｏｌｄバッファおよびＥ＿ｗ_ｏｏｌｄバッファに記憶すること（４０７）と
をさらに含む。
１２．実施形態１～１１のうちの任意の実施形態による操作を実施するように適合されたデコーダ装置（１２０１、１３０１）。
１３．受け取った音響信号の失われた音響フレームのための隠蔽方法を制御するように設定されたデコーダ装置（１２０１、１３０１）であって、本デコーダ装置は、
修正離散コサイン変換（ＭＤＣＴ）に基づいて、受け取った音響信号の第１の音響フレームを復号し、
復号された音響フレームからの復号されたＭＤＣＴ係数に基づいて第１のスペクトル形状の値を決定し、また、計算された第１のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファに記憶し、第１のスペクトル形状はある数の副帯域を含み、
音響フレームの第１のフレームエネルギーを決定し、また、計算された第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶し、
受け取った音響信号の第２の音響フレームを復号し、
計算された第１のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファからｓｈａｐｅ_ｏｏｌｄバッファへ移し、
計算された第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファからＥ＿ｗ_ｏｏｌｄバッファへ移し、
復号された第２の音響フレームからの復号されたＭＤＣＴ係数に基づいて第２のスペクトル形状の値を決定し、また、計算された第２のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファに記憶し、第２のスペクトル形状は上記数の副帯域を含み、
第２の音響フレームの第２のフレームエネルギーを決定し、また、計算された第２のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶し、
第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速フーリエ変換（ＦＦＴ）に基づくスペクトル解析の第１の表現に変換し、また、第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換し、
第１の高速ＦＦＴの第１の表現および第２のＦＦＴの第２の表現に基づいて、失われた音響フレームのための置換フレームを作り出すために隠蔽方法が使用される場合に、その失われた音響フレームのための置換フレームの最適以下の再構成品質をもたらし得る状態を検出し、また、
上記状態の検出に応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整することによって隠蔽方法を修正する
ように設定される。
１４．実施形態１３のデコーダ装置であって、本デコーダ装置は実施形態２～１１の操作を実施するように設定される。
１５．受け取った音響信号の失われた音響フレームのための隠蔽方法を制御するように設定されたデコーダ装置（１２０１、１３０１）であって、本デコーダ装置は、
プロセッサ（１３０５）と、
メモリ（１３１１）であって、プロセッサによって実行されると、デコーダ装置（１２０１、１３０１）に、
修正離散コサイン変換（ＭＤＣＴ）に基づいて、受け取った音響信号の第１の音響フレームを復号すること（９０１）と、
復号された音響フレームからの復号されたＭＤＣＴ係数に基づいて第１のスペクトル形状の値を決定すること（９０３）、および計算された第１のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファに記憶することであって、第１のスペクトル形状はある数の副帯域を含む、第１のスペクトル形状の値を記憶することと、
音響フレームの第１のフレームエネルギーを決定すること（９０５）、および計算された第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶することと、
受け取った音響信号の第２の音響フレームを復号すること（９０７）と、
計算された第１のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファからｓｈａｐｅ_ｏｏｌｄバッファへ移すこと（３０３、９０９）と、
計算された第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファからＥ＿ｗ_ｏｏｌｄバッファへ移すこと（３０５、９１１）と、
復号された第２の音響フレームからの復号されたＭＤＣＴ係数に基づいて第２のスペクトル形状の値を決定すること（３０７～３０９、９１３）、および計算された第２のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファに記憶することであって、第２のスペクトル形状は上記数の副帯域を含む、第２のスペクトル形状の値を記憶することと、
第２の音響フレームの第２のフレームエネルギーを決定すること（９１５）、および計算された第２のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶することと、
第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速フーリエ変換（ＦＦＴ）に基づくスペクトル解析の第１の表現に変換すること（９１７）、および第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換することと、
第１の高速ＦＦＴの第１の表現および第２のＦＦＴの第２の表現に基づいて、失われた音響フレームのための置換フレームを作り出すために隠蔽方法が使用される場合に、その失われた音響フレームのための置換フレームの最適以下の再構成品質をもたらし得る状態を検出すること（９１９）と、
上記状態の検出に応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整することによって隠蔽方法を修正すること（９２１）と
を含む操作を実施させる命令を記憶するメモリ（１３１１）と
を備える。
１６．実施形態１のデコーダ装置であって、復号されたＭＤＣＴ係数に基づいて第１のスペクトル形状の値を決定するために、命令は、プロセッサによって実行されると、装置に、
ＭＤＣＴ係数の全体の大きさを決定すること（３０７）と、
第１のスペクトル形状の個々の副帯域値を正規化することと、
個々の正規化された副帯域値を第１のスペクトル形状の値のうちの一値として記憶することと
を含む操作を実施させるさらなる命令を含む。
１７．実施形態１６のデコーダ装置であって、ＭＤＣＴ係数の全体の大きさは、

に従って決定され、上式でｓｈａｐｅ＿ｔｏｔはＭＤＣＴ係数の全体の大きさであり、Ｎ_ＭＤＣＴはＭＤＣＴ係数の数であってサンプリング周波数に応じて決まり、また、ｑ＿ｄ（ｎ）はＭＤＣＴ係数である。
１８．実施形態１６～１７のうちのいずれかのデコーダ装置であって、個々の副帯域の正規化は、

に従って正規化され、上式でｓｈａｐｅ_ｏｌｄ（ｋ）は副帯域（ｋ）のスペクトル形状であり、ｓｈａｐｅ＿ｔｏｔはＭＤＣＴ係数の全体の大きさであり、ｑ＿ｄ（ｎ）はＭＤＣＴ係数であり、ｇｒｐ＿ｂｉｎ（ｋ）は副帯域（ｋ）におけるＭＤＣＴ係数に対する開始指標であり、Ｎ_ｇｒｐは副帯域の数である。
１９．実施形態１５～１８のうちのいずれかのデコーダ装置であって、第１のフレームエネルギーおよび第２のフレームエネルギーのフレームエネルギーは、

に従って決定され、上式でＥ＿ｗ_ｏｌｄはフレームエネルギーであり、ｗ_ｗｈｒは長いＦＦＴスペクトル解析ウィンドウであり、ｘ_ｐｒｅｖは、潜在的に起ころうとしている失われたフレームのための置換を作り出すために使用される時間領域プロトタイプ信号であり、Ｌ_ｐｒｏｔはｘ_ｐｒｅｖ信号におけるサンプルの数である。
２０．実施形態１５～１９のうちのいずれかのデコーダ装置であって、第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速ＦＦＴに基づくスペクトル解析の第１の表現に変換し、また、第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換するために、命令は、プロセッサによって実行されると、装置に、
第１のスペクトル形状の値および第１のフレームエネルギー、および第２のスペクトル形状の値および第２のフレームエネルギーに変換ファクターを適用すること
を含む操作を実施させるさらなる命令を含む。
２１．実施形態２０のデコーダ装置であって、変換ファクターは復号のサンプリング周波数に応じて決まる。
２２．実施形態２０～２１のうちのいずれかのデコーダ装置であって、
Ｅ_ｏｏｌｄ（ｋ）が第１の表現であり、μが変換ファクターであり、ｓｈａｐｅ_ｏｏｌｄ（ｋ）が第１のスペクトル形状の副帯域（ｋ）のスペクトル形状であり、Ｅ＿ｗ_ｏｏｌｄが第１のフレームエネルギーであり、Ｅ_ｏｌｄ（ｋ）が第２の表現であり、ｓｈａｐｅ_ｏｌｄ（ｋ）が第２のスペクトル形状の副帯域（ｋ）のスペクトル形状であり、Ｅ＿ｗ_ｏｌｄが第２のフレームエネルギーであり、Ｎ_ｇｒｐが副帯域の数である、
Ｅ_ｏｏｌｄ（ｋ）＝μ・ｓｈａｐｅ_ｏｏｌｄ（ｋ）・Ｅ＿ｗ_ｏｏｌｄ、０≦ｋ＜Ｎ_ｇｒｐ
および

に従って第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速ＦＦＴに基づくスペクトル解析の第１の表現に変換すること、および第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換すること
をさらに含む。
２３．実施形態２２のデコーダ装置であって、命令は、プロセッサによって実行されると、装置に、
Ｅ_ｏｏｌｄ（ｋ）およびＥ_ｏｌｄ（ｋ）に基づいて副帯域過渡が閾値を超えているかどうかを決定すること（１１０５）と、
副帯域過渡が閾値を超えていることに応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整する（１１０７）ことによって隠蔽方法を修正することと
をさらに含む操作を実施させるさらなる命令を含む。
２４．実施形態２２のデコーダ装置であって、置換フレームスペクトルは、

の表現式に従って計算され、
また、スペクトルの大きさを調整することは、β（ｍ）を調整すること（１１０７）を含み、ここで、Ｚ（ｍ）が置換フレームスペクトルであり、α（ｍ）が第１の大きさ減衰ファクターであり、β（ｍ）が第２の大きさ減衰ファクターであり、Ｙ（ｍ）がプロトタイプフレームであり、θ_ｋが位相シフトであり、また、θ（ｍ）が付加的位相成分である。
２５．実施形態１～１０のうちのいずれかのデコーダ装置であって、命令は、プロセッサによって実行されると、装置に、
不良フレームインジケータを受け取ること（４０３、５０１）と、
不良フレームインジケータの受取りに応答して、ｓｈａｐｅ_ｏｏｌｄバッファおよびＥ＿ｗ_ｏｏｌｄエネルギーバッファをフラッシングすることと、
受け取った音響信号の新しい音響フレームを受け取ることと、
復号された新しい音響フレームからの復号されたＭＤＣＴ係数に基づいて新しいスペクトル形状の値を決定すること（５０３）、および計算された新しいスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファおよびｓｈａｐｅ_ｏｏｌｄバッファに記憶すること（４０５）であって、新しいスペクトル形状はある数の副帯域を含む、新しいスペクトル形状の値を記憶すること（４０５）と、
音響フレームの新しいフレームエネルギーを決定すること（５０５）、および計算された新しいフレームエネルギーをＥ＿ｗ_ｏｌｄバッファおよびＥ＿ｗ_ｏｏｌｄバッファに記憶すること（４０７）と
をさらに含む操作を実施させるさらなる命令を含む。

追加説明
一般に、本明細書において使用されているすべての用語は、異なる意味が明確に与えられていない限り、および／またはその用語が使用されている文脈から異なる意味がほのめかされていない限り、関係する技術分野におけるそれらの用語の元々の意味に従って解釈されたい。単数形の表現の要素、装置、構成要素、手段、ステップ、等々に対するすべての参照は、そうではないことが明確に言及されていない限り、要素、装置、構成要素、手段、ステップ、等々の少なくとも１つの実例を意味するものとして広義に解釈されたい。本明細書において開示されている何らかの方法のステップは、あるステップが別のステップに後続するものとして、もしくは別のステップに先行するものとして明確に説明されていない限り、および／またはあるステップを別のステップに後続させなければならない、もしくは別のステップに先行させなければならないことが暗に含まれていない限り、開示されている厳密な順序で実施する必要はない。本明細書において開示されている任意の実施形態の何らかの特徴は、適切である場合はいつでも、任意の他の実施形態に適用することができる。同様に、任意の実施形態の何らかの利点は任意の他の実施形態に適用することができ、その逆も真である。包含されている実施形態の他の目的、特徴および利点は、以下の説明から明らかになるであろう。

以下、本明細書において企図されている実施形態のうちのいくつかについて、添付の図面を参照してより完全に説明する。しかしながら本明細書において開示されている主題の範囲内には他の実施形態が包含されており、開示されている主題は、本明細書において示されている実施形態のみに限定されるものとして解釈してはならず、そうではなくこれらの実施形態は、主題の範囲を当業者に伝えるための一例として提供されている。

本明細書において開示されている適切なステップ、方法、特徴、機能または利点は、すべて、１つもしくは複数の仮想装置の１つもしくは複数の機能ユニットまたはモジュールを介して実施することができる。個々の仮想装置は、多くのこれらの機能ユニットを備えることができる。これらの機能ユニットは、１つもしくは複数のマイクロプロセッサまたはマイクロコントローラ、ならびにデジタル信号プロセッサ（ＤＳＰ）、および専用デジタル論理、等々を含むことができる他のデジタルハードウェアを含むことができる処理回路を介して実現することができる。処理回路は、メモリに記憶されているプログラムコードを実行するように設定することができ、メモリは、リードオンリメモリ（ＲＯＭ）、ランダムアクセスメモリ（ＲＡＭ）、キャッシュメモリ、フラッシュメモリデバイス、光記憶デバイス、等々などの１つまたはいくつかのタイプのメモリを含むことができる。メモリに記憶されているプログラムコードは、１つもしくは複数の通信および／またはデータ通信プロトコル、ならびに本明細書において説明されている技法のうちの１つまたは複数を実施するための命令を実行するためのプログラム命令を含む。いくつかの実施態様では、処理回路を使用して、それぞれの機能ユニットに、本開示の１つまたは複数の実施形態による対応する機能を実施させることができる。

ユニットという用語は、電子工学、電気デバイスおよび／または電子デバイスの分野における従来の意味を有することができ、また、例えば、本明細書において説明されているようなそれぞれのタスク、手順、計算、出力および／または表示機能、等々を実施するための電気および／または電子回路機構、デバイス、モジュール、プロセッサ、メモリ、論理ソリッドステートおよび／または離散デバイス、コンピュータプログラムまたは命令を含むことができる。

本発明の概念の様々な実施形態についての上記説明では、本明細書において使用されている専門用語は、単に特定の実施形態を説明するためのものにすぎず、本発明の概念を制限することは意図されていないことを理解されたい。そうではないことが規定されていない限り、本明細書において使用されているすべての用語（技術的用語および科学的用語を含む）は、本発明の概念が属している当業者によって広く理解されている意味と同じ意味を有している。広く使用されている辞書に規定されているような用語は、本明細書および関係する技術の文脈におけるそれらの意味と無矛盾の意味を有しているものとして解釈されるべきであることはさらに理解され、また、本明細書においてそのように明確に規定されていない限り、理想化された、あるいはあまりにも型通りの意味で解釈されることはないものと思われる。

要素が別の要素に「接続されている」、「結合されている」、「に応答する」またはそれらの変形として参照されている場合、その要素は、他の要素に直接接続し、結合し、または応答することができ、あるいは介在する要素が存在していてもよい。それとは対照的に、要素が別の要素に「直接接続されている」、「直接結合されている」、「直接応答する」またはそれらの変形として参照されている場合、介在する要素は存在していない。同様の番号は、全体を通して同様の要素を表している。さらに、本明細書において使用されている「結合された」、「接続された」、「応答する」またはそれらの変形は、無線で結合された、接続された、または応答する、を含むことができる。本明細書において使用される場合、単数形の表現には、文脈が単数形の表現であることを明確に示していない限り、複数形の表現を同じく含むことが意図されている。よく知られている機能または構造は、簡潔にするために、および／または分かりやすくするために、場合によっては詳細に説明されていない。「および／または」という用語は、列挙されている関係する項目のうちの１つまたは複数の任意の組合せおよびすべての組合せを含む。

第１の、第２の、第３の、等々という用語は、本明細書においては様々な要素／操作を説明するために使用され得るが、これらの要素／操作は、これらの用語によって制限されてはならないことは理解されよう。これらの用語は、単に１つの要素／操作を別の要素／操作から区別するために使用されているにすぎない。したがっていくつかの実施形態における第１の要素／操作は、他の実施形態では、本発明の概念の教示から逸脱することなく第２の要素／操作と称することも可能である。同じ参照数表示または同じ参照指名子は、本明細書全体を通して同じまたは同様の要素を表している。

本明細書において使用される場合、「備える」、「備えている」、「含む」、「含んだ」、「有する」、「有している」またはそれらの変形はオープンエンドであり、また、１つもしくは複数の言及されている特徴、整数、要素、ステップ、構成要素または機能を含むが、１つもしくは複数の他の特徴、整数、要素、ステップ、構成要素、機能またはそれらのグループの存在または追加を前もって排除しない。さらに、本明細書において使用される場合、「例えば」を使用して、一般的な一例または既に言及されている項目の例を紹介し、あるいは明記することがあるが、これは、このような項目を制限することは意図されていない。「すなわち」を使用して、より一般的な記載から特定の項目を明記することがある。

例示的実施形態は、本明細書においては、コンピュータ実現方法、装置（システムおよび／もしくはデバイス）ならびに／またはコンピュータプログラム製品のブロック図および／またはフローチャート図解を参照して説明されている。ブロック図および／またはフローチャート図解のブロック、ならびにブロック図および／またはフローチャート図解におけるブロックの組合せは、１つまたは複数のコンピュータ回路によって実施されるコンピュータプログラム命令によって実現することができることを理解されたい。これらのコンピュータプログラム命令は、コンピュータおよび／または他のプログラマブルデータ処理装置のプロセッサを介して実行する命令が、トランジスタ、記憶場所に記憶されている値、およびこのような回路機構内の他のハードウェア構成要素を変換し、かつ、制御して、ブロック図および／または１つもしくは複数のフローチャートブロックに明記されている機能／行為を実現し、それによりブロック図および／もしくはフローチャートブロックに明記されている機能／行為を実現するための手段（機能性）ならびに／または構造を作り出すよう、汎用コンピュータ回路、専用コンピュータ回路および／または他のプログラマブルデータ処理回路のプロセッサ回路に提供して機械を製造することができる。

また、これらのコンピュータプログラム命令は、コンピュータ可読媒体に記憶されている命令が、ブロック図および／または１つもしくは複数のフローチャートブロックに明記されている機能／行為を実現する命令を含む製造物品をもたらすよう、コンピュータまたは他のプログラマブルデータ処理装置を導いて特定の方法で機能させることができる有形コンピュータ可読媒体に記憶することができる。したがって本発明の概念の実施形態は、ハードウェアの中および／または集合的に「回路機構」、「モジュール」もしくはその変形と呼ぶことができるデジタル信号プロセッサなどのプロセッサ上で走るソフトウェア（ファームウェア、常駐ソフトウェア、マイクロコード、等々を含む）の中で具体化することができる。

いくつかの代替実施態様では、ブロックの中に記されている機能／行為は、フローチャートの中に記されている順序から外れて生じ得ることに同じく留意されたい。例えば連続して示されている２つのブロックは、実際、実質的に同時に実行することができ、あるいはブロックは、含まれている機能性／行為に応じて時によっては逆の順序で実行することも可能である。さらに、フローチャートおよび／もしくはブロック図の所与のブロックの機能性は、複数のブロックに分割することも可能であり、ならびに／またはフローチャートおよび／もしくはブロック図の２つ以上のブロックの機能性は、少なくとも部分的に統合することができる。最後に、図解されているブロック同士の間に他のブロックを追加／挿入することも可能であり、および／またはブロック／操作は、本発明の概念の範囲から逸脱することなく省略することができる。さらに、線図のうちのいくつかは、通信の主方向を示すための矢印を通信経路上に含んでいるが、通信は、描かれている矢印とは逆の方向に生じ得ることを理解されたい。

本発明の概念の原理から実質的に逸脱することなく、多くの変更および修正を実施形態に加えることができる。すべてのこのような変更および修正は、本明細書においては、本発明の概念の範囲内に含まれることが意図されている。したがって上で開示した主題は、制限的なものではなく、説明的なものと見なすべきであり、実施形態の例には、本発明の概念の思想および範囲の範疇であるすべてのこのような修正、改良、および他の実施形態を網羅することが意図されている。したがって本発明の概念の範囲は、法律によって許容される最大の範囲まで、実施形態の例およびそれらの等価物を含む本開示の最も広義の許容可能解釈によって決定されるべきであり、以上の詳細な説明によって限定または制限されるべきではない。付録１は本開示の一部を形成している。

付録１
［発明の名称］オーディオフレーム損失のコンシールメントを制御する方法及び装置
［技術分野］
［０００１］
本発明は、受信したオーディオ信号の損失オーディオフレームに対するコンシールメント（concealment）方法を制御する方法及び装置に関する。
［背景技術］
［０００２］
従来のオーディオ通信システムは、音声信号及びオーディオ信号をフレームごとに送信する。送信側は、まず信号を例えば２０～４０ｍｓの短いセグメント又はフレームとして配列する。これらは順次、符号化され、例えば送信パケットにおける論理ユニットとして送信される。受信機は、それらの論理ユニットの各々を復号化し、対応する信号フレームを再構成する。再構成されたフレームは、最終的には再構成信号サンプルの連続シーケンスとして出力される。符号化に先立って、マイクロホンからのアナログ音声信号又はアナログオーディオ信号をオーディオサンプルのシーケンスに変換するアナログ／デジタル（Ａ／Ｄ）変換ステップが通常実行される。逆に、受信端では、再構成デジタル信号サンプルをスピーカ再生のための連続時間アナログ信号に変換する最終Ｄ／Ａ変換ステップが通常実行される。
［０００３］
しかし、音声信号及びオーディオ信号のそのような送信システムにおいては、送信エラーが生じ、これにより送信フレームのうち１つ又はいくつかを受信機で再構成のために利用できないという状況が起きる可能性がある。その場合、デコーダは、消失したフレーム、すなわち利用不可能なフレームの各々に対して代替の信号を生成する必要がある。これは、受信側信号デコーダのいわゆるフレーム損失コンシールメント（frame loss concealment）ユニット又はエラーコンシールメント（error concealment）ユニットで実行される。フレーム損失コンシールメントの目的は、フレーム損失を可能な限り聴き取れないようにし、それにより、フレーム損失が再構成信号の品質に与える影響を可能な限り軽減することである。
［０００４］
従来のフレーム損失コンシールメント方法は、コーデックの構造又はアーキテクチャに依存して、例えば過去に受信されたコーデックパラメータを反復して適用するというものである。そのようなパラメータ反復技術は、使用されるコーデックの特定のパラメータに明らかに依存しており、従って、異なる構造を有する他のコーデックには容易に適用することはできない。従来のフレーム損失コンシールメント方法は、損失フレームに対する代替フレームを生成するために、例えば過去に受信されたフレームのパラメータのフリーズと外挿を行うというものがある。
［０００５］
従来技術によるこれらのフレーム損失コンシールメント方法は、何らかのバースト損失処理方法を含む。一般に、１つの列の中のいくつかのフレーム損失があると、合成信号は、長いエラーのバーストの後に完全に消音されるまで減衰される。更に、基本的に反復され外挿される符号化パラメータは、減衰が実現されスペクトルのピークが平坦化されるよう修正される。
［０００６］
従来のフレーム損失コンシールメント技術は、通常、損失フレームに対する代替フレームを生成するために、通常、過去に受信されたフレームのパラメータをフリーズして外挿を行うという概念を適用する。ＡＭＲ又はＡＭＲ－ＷＢなどの線形予測コーデックのような多くのパラメトリック音声コーデックは、通常、過去に受信されたパラメータをフリーズするか又はその何らかの外挿を使用し、そのようなパラメータとともにデコーダを使用する。本質的には、この原理は、符号化／復号化のために所定のモデルを設定し、フリーズされたパラメータ又は外挿されたパラメータによって同一のモデルを適用するというものである。ＡＭＲ及びＡＭＲ－ＷＢのフレーム損失コンシールメント技術は代表的な技術であると考えることができる。それらの技術は、対応する規格仕様書の中で詳細に記述されている。
［０００７］
各種あるオーディオコーデックのうちの多くのコーデックは、何らかの周波数領域変換の後にスペクトルパラメータに符号化モデルが適用される周波数領域符号化技術を適用する。デコーダは、受信したパラメータから信号スペクトルを再構成し、最終的にスペクトルを変換して時間信号に戻す。通常、時間信号はフレームごとに再構成される。そのようなフレームは、オーバラップ加算技術により最終再構成信号として合成される。そのオーディオコーデックの場合であっても、従来のエラーコンシールメントは、損失フレームに対して同一の又は少なくとも類似する復号化モデルを通常適用する。過去に受信されたフレームからの周波数領域パラメータがフリーズされるか又は適切に外挿され、その後、周波数／時間領域変換で使用される。そのような技術の例は、３ＧＰＰ規格に準拠した３ＧＰＰオーディオコーデックによって提供される。
［発明の概要］
［０００８］
従来技術によるフレーム損失コンシールメントの方法では、一般に、品質の不足が問題となる。例えば、パラメータのフリーズ、外挿技術や損失フレーム対しても同一のデコーダモデルを再適用することによって、必ずしも、過去に復号化された信号フレームから損失フレームへの円滑かつ忠実な信号発展（signal evolution）が保証されるものではないということが主な問題点である。そのため、可聴信号はしばしば不連続になり、品質にも影響が出る。
［０００９］
音声及びオーディオ伝送システムの新規なフレーム損失コンシールメント方式を説明する。新規な方式により、従来のフレーム損失コンシールメント技術で実現可能であった品質と比較して、フレーム損失の場合の品質が改善される。
［００１０］
本発明の実施形態の目的は、以下に説明される関連する新規な種類の方法であるのが好ましいフレーム損失コンシールメント方式を、可能な限り最良の再構成信号音質が実現されるように制御することである。実施形態は、信号の特性及びフレーム損失の時間的分布の双方に関して再構成品質を最適化することを目的とする。高い品質を提供することに関してフレーム損失コンシールメントで特に問題になるのは、オーディオ信号がエネルギーの立ち上がりや立ち下がりのような大きく変化する特性を有する場合、又はオーディオ信号のスペクトルが非常に大きく変動する場合である。その場合、説明したコンシールメント方法では、上記立ち上がり、立ち下がり、又はスペクトルの変動を繰り返してしまい、原信号から大きな変化して品質が劣化する。
［００１１］
問題となる別のケースは、フレーム損失のバーストが連続的に起こる場合である。概念的には、説明した方法に係るフレーム損失コンシールメント方法では、そのような場合に対処しても、依然として音のアーチファクト（tonal artifacts）を生じてしまう。本発明の実施形態の別の目的は、そのような音のアーチファクトを可能な限り大きく軽減することである。
［００１２］
第１の態様によれば、損失オーディオフレームのコンシールメントを行うデコーダの方法は、過去に受信され再構成されたオーディオ信号の特性又は観測されたフレーム損失の
統計的特性における、損失フレームの代替によって品質が相対的に低下するような条件を検出するステップを含む。そのような条件が検出された場合、代替フレームスペクトルの位相又はスペクトル振幅を選択的に調整することにより、コンシールメント方法を修正する。
［００１３］
第２の態様によれば、デコーダは損失オーディオフレームのコンシールメントを実現するように構成される。デコーダは、過去に受信され再構成されたオーディオ信号の特性又は観測されたフレーム損失の統計的特性における、損失フレームの代替により品質が相対的に低下するような条件を検出するコントローラを備える。そのような条件が検出された場合、コントローラは、代替フレームスペクトルの位相又はスペクトル振幅を選択的に調整することによりコンシールメント方法を修正する。
［００１４］
デコーダは、例えば移動電話などの装置で実現可能である。
［００１５］
第３の態様によれば、受信機は、上述の第２の態様に係るデコーダを備える。
［００１６］
第４の態様によれば、損失オーディオフレームのコンシールメントを行うためのコンピュータプログラムが定義される。コンピュータプログラムは、プロセッサにより実行されると、プロセッサに上述の第１の態様に従って損失オーディオフレームのコンシールメントを行わせる命令を含む。
［００１７］
第５の態様によれば、コンピュータプログラム製品は、上述の第４の態様に係るコンピュータプログラムを記憶するコンピュータ読み取り可能な媒体を備える。
［００１８］
一実施形態の利点は、従来のコンシールメント方法のみの場合に実現される品質と比較して、符号化音声信号及び符号化オーディオ信号の伝送におけるフレーム損失による音質への影響を大きく軽減できるフレーム損失コンシールメント方法の適応制御が実現されることである。実施形態の一般的利点は、損失フレームに対しても円滑かつ忠実な再構成信号の発展（evolution）が提供されることである。フレーム損失の聴感上の影響は、従来技術と比べて大幅に低減される。
［図面の簡単な説明］
［００１９］
［図１］方形窓関数を示す図。
［図２］ハミング窓と方形窓との組み合わせを示す図。
［図３］窓関数の振幅スペクトルの一例を示す図。
［図４］周波数ｆ_kの例示的な正弦波信号の線スペクトルを示す図。
［図５］周波数ｆ_kの窓掛け後の正弦波信号のスペクトルを示す図。
［図６］分析フレームに基づくＤＦＴのグリッドポイントの大きさに対応するバーを示す図。
［図７］ＤＦＴグリッドポイントＰ１、Ｐ２及びＰ３を通るパラボラフィッティングを示す図。
［図８］窓スペクトルのメインローブのフィッティングを示す図。
［図９］ＤＦＴグリッドポイントＰ１及びＰ２を通るメインローブ近似関数Ｐのフィッティングを示す図。
［図１０］受信オーディオ信号の損失オーディオフレームに対するコンシールメント方法を制御する本発明の実施形態に係る例示的な方法を示すフローチャート。
［図１１］受信オーディオ信号の損失オーディオフレームに対するコンシールメント方法を制御する本発明の実施形態に係る別の例示的な方法を示すフローチャート。
［図１２］本発明の別の例示的な実施形態を示す図。
［図１３］本発明の一実施形態に係る装置の一例を示す図。
［図１４］本発明の一実施形態に係る装置の別の例を示す図。
［図１５］本発明の一実施形態に係る装置の別の例を示す図。
［発明を実施するための形態］
［００２０］
説明する新規なフレーム損失コンシールメント技術に関する新規な制御方式は、図１０に示されるような以下のステップを含む。なお、方法はデコーダのコントローラによって実行可能である。
［００２１］
１．前述の方法では損失フレームの代替によって音質が劣化してしまうような、過去に受信され再構成されたオーディオ信号の特性または観測されたフレーム損失の統計的特性の状態を検出する（１０１）。
［００２２］
２．ステップ１でそのような状態が検出された場合、位相又はスペクトル振幅を選択的に調整することにより、Ｚ（ｍ）＝Ｙ（ｍ）・ｅ^jθ _kによって代替フレームスペクトルを計算する方法の要素を修正する（１０２）。
［００２３］
（正弦波分析）
新規な制御技術が適用されうるフレーム損失コンシールメント技術の第１のステップは、過去に受信された信号の一部の正弦波分析（sinusoidal analysis）を含む。この正弦波分析の目的は、その信号の主正弦波の周波数を特定することである。これは、限定された数の個別の正弦波から信号が構成されていること、すなわち信号が以下に示す種類のマルチ正弦波信号であることが、基本的な前提となっている。
［００２４］

ただし、Ｋは、信号を構成すると想定される正弦波の数である。添字ｋ＝１…Ｋの各正弦波に対して、ａ_kは振幅、ｆ_kは周波数、φ_kは位相である。サンプリング周波数はｆ_sで表され、時間離散信号サンプルｓ（ｎ）の時間インデックスはｎで表される。
［００２５］
可能な限り正確な正弦波の周波数を特定することが第１に重要である。理想的な正弦波信号は線周波数ｆ_kの線スペクトルを有すると考えられるが、その真の値を特定するには、原理上、無限の測定時間が必要になるであろう。従って、実際には、本明細書において説明される正弦波分析に使用される信号セグメントに対応する短時間の測定に基づいて線周波数を推定することしかできないので、線周波数を発見するのは難しい。以下の説明中、この信号セグメントは分析フレームと呼ばれる。別の困難な問題は、信号が実際には時変信号であり、上記の式のパラメータが時間の経過に伴って変動するということである。そこで、測定をより正確にするためには長い分析フレームを使用することが望ましいが、起こりうる信号変動に更に適切に対応するためには、測定時間を短縮することが必要になる。その適切なトレードオフとしては、例えば２０～４０ｍｓ程度の長さの分析フレームを使用することである。
［００２６］
正弦波の周波数ｆ_kを特定可能にする好適な方法は、分析フレームの周波数領域分析を実行することである。この目的のために、例えばＤＦＴ又はＤＣＴ、あるいは類似する周波数領域変換によって、分析フレームは周波数領域に変換される。分析フレームのＤＦＴが使用される場合、スペクトルは次式により表される。
［００２７］

ただし、ｗ（ｎ）は、長さＬの分析フレームを抽出し重み付けする窓関数を表す。典型的な窓関数は、例えば、図１に示されるようなｎ∈ ［０…Ｌ－１］に対して１であり、その他の場合は０である方形窓である。過去に受信されたオーディオ信号の時間指標は、分析フレームが時間指標ｎ＝０…Ｌ－１により参照されるように設定されると想定する。スペクトル分析に更に適すると思われる他の窓関数としては、例えばハミング窓、ハニング窓、カイザー窓又はブラックマン窓がある。特に有用であるとわかっている窓関数は、ハミング窓と方形窓との組み合わせである。図２に示されるように、この窓は、長さＬ１のハミング窓の左半分のような立ち上がり端形状及び長さＬ１のハミング窓の右半分のような立ち下がり端形状を有し、立ち上がり端と立ち下がり端との間で、窓は、長さＬ－Ｌ１の場合に１に等しい。
［００２８］
窓分析フレーム｜Ｘ（ｍ）｜の振幅スペクトルのピークは、必要とされる正弦波周波数ｆ_kの近似を構成する。しかし、この近似の正確度は、ＤＦＴの周波数間隔により限定される。ブロック長ＬのＤＦＴの場合、正確度はｆ_s／（２Ｌ）に限定される。
［００２９］
実験によれば、このレベルの正確度は、本明細書において説明される方法の範囲内では低すぎるかもしれない。以下のことを考慮した結果に基づき、正確度の改善を得ることができる。
［００３０］
窓分析フレームのスペクトルは、正弦波モデル信号Ｓ（Ω）の線スペクトルによる窓関数のスペクトルの畳み込みと、その後に続く次式のＤＦＴのグリッドポイントにおけるサンプリングによって与えられる。
［００３１］

［００３２］
正弦波モデル信号のスペクトル表現を使用することにより、これを次のように書き換えることができる。
［００３３］

［００３４］
従って、サンプリングされたスペクトルは次式により表される。
［００３５］

ただし、ｍ＝０…Ｌ－１
［００３６］
この考えに基づき、分析フレームの振幅スペクトルの中で観測されるピークは、それらのピークの近傍で真の正弦波周波数が特定されるＫ個の正弦波を含む窓掛け後正弦波信号
に由来するものと想定される。観測されたｋ番目のピークのＤＦＴインデックス（グリッドポイント）をｍ_kとすると、対応する周波数は、

であり、これは、真の正弦波周波数ｆ_kの近似であるとみなすことができる。真の正弦波周波数ｆ_kは、区間

の中にあると想定できる。
［００３７］
なお、明確にするため、正弦波モデル信号の線スペクトルのスペクトルによる窓関数のスペクトルの畳み込みは、窓関数スペクトルの周波数シフトバージョンの重畳であると理解することができ、このため、シフト周波数は正弦波の周波数である。次に、この重畳はＤＦＴグリッドポイントでサンプリングされる。それらのステップは図３以降の図により示される。図３は窓関数の振幅スペクトルの一例を示す。図４は、周波数の１つの正弦波と共に正弦波信号の一例の振幅スペクトル（線スペクトル）を示す。図５は、正弦波の周波数における周波数シフト窓スペクトルを再現し、重畳する窓掛け後正弦波信号の振幅スペクトルを示す。図６の点線は、分析フレームのＤＦＴを計算することにより取得された窓掛け後正弦波におけるＤＦＴのグリッドポイントの振幅に対応する。なお、すべてのスペクトルは正規化周波数パラメータΩによって周期的である。ここで、Ωは、サンプリング周波数ｆ_sに対応する２πである。
［００３８］
先の説明及び図６は、使用される周波数領域変換の周波数分解能と比較して探索の分解能を増加させることによってのみ、正弦波周波数をよりよく近似できることを示唆する。
［００３９］
正弦波の周波数ｆ_kの更によい近似を発見する好適な方法の１つは、放物線補間（parabolic interpolation）を適用することである。そのような方式の１つは、ピークを取り囲むＤＦＴ振幅スペクトルのグリッドポイントを通してパラボラフィッティングを行い、放物線最大値に属する各々の周波数を計算することである。放物線の次の適切な選択肢は２である。詳細には、以下の手順を適用することができる。
［００４０］
１．窓掛け後分析フレームのＤＦＴのピークを特定する。ピーク探索はピークの数Ｋ及びピークの対応するＤＦＴインデックスを出力する。ピーク探索は、通常、ＤＦＴ振幅スペクトル又は対数ＤＦＴ振幅スペクトルに対して実行可能である。
［００４１］
２．対応するＤＦＴインデックスｍ_kを有するピークｋ（ｋ＝１…Ｋ）ごとに、３つのポイント

を通してパラボラフィッティングを行う。その結果、次式により定義される放物線の放物線係数ｂ_k（０）、ｂ_k（１）、ｂ_k（２）が得られる。
［００４２］

このパラボラフィッティングは、図７に示される。
［００４３］
３．Ｋ個の放物線の各々に対して、その放物線が最大値を有するｑの値に対応する補間周波数インデックス

を計算する。正弦波周波数ｆ_kの近似として

を使用する。
［００４４］
説明した方式は良好な結果を提供するが、放物線は、窓関数の振幅スペクトル｜Ｗ（Ω）｜のメインローブの形状を近似しないので、いくつかの制限があるかもしれない。これを実行する代替方式は、以下に説明されるように、メインローブ近似を使用する改良型周波数推定である。この代替方式の主要な概念は、

のメインローブを近似する関数Ｐ（ｑ）を、ピークを取り囲むＤＦＴ振幅スペクトルのグリッドポイントを通してフィッティングし、関数最大値に属する各々の周波数を計算することである。関数Ｐ（ｑ）は、窓関数の周波数シフト振幅スペクトル

と同一でありうる。しかし、数値的に単純にするために、これを関数最大値の容易な計算を可能にする多項式にすべきである。以下に詳細に説明される手順を適用できる。
［００４５］
１．窓分析フレームのＤＦＴのポイントを特定する。ピーク探索はピークの数Ｋ及びピークの対応するＤＦＴインデックスを出力する。ピーク探索は、通常、ＤＦＴ振幅スペクトル又は対数ＤＦＴ振幅スペクトルに対して実行可能である。
［００４６］
２．所定の区間（ｑ₁，ｑ₂）に対して窓関数の振幅スペクトル

または対数振幅スペクトル

を近似する関数Ｐ（ｑ）を取り出す。窓スペクトルのメインローブを近似する近似関数の選択は、図８により示される。
［００４７］
３．対応するＤＦＴインデックスｍ_kを伴うピークｋ（ｋ＝１…Ｋ）ごとに、窓正弦波信号の連続スペクトルの予想される真のピークを取り囲む２つのＤＦＴグリッドポイント
を通して周波数シフト関数

のフィッティングを行う。従って、
｜Ｘ（ｍ_k－１）｜が｜Ｘ（ｍ_k＋１）｜より大きい場合、ポイント

を通して

のフィッティングを行い、そうでない場合、ポイント

を通して

のフィッティングを行う。簡単にするため、Ｐ（ｑ）を２次又は４次のいずれかの多項式として選択できる。これにより、ステップ２の近似は単純な線形回帰計算及び

の簡単な計算となる。区間（ｑ₁、ｑ₂）は、すべてのピークに対して一定かつ同一になるように選択でき、例えば（ｑ₁、ｑ₂）＝（－１，１）であるか、又は適応的である。適応的方式の場合、関数

が関連するＤＦＴグリッドポイント｛Ｐ₁；Ｐ₂｝の範囲内で窓関数スペクトルのメインローブのフィッティングを行うように、区間を選択できる。このフィッティング処理は図９に示される。
［００４８］
４．窓正弦波信号の連続スペクトルがピークを有すると予測されるＫ個の周波数パラメータ

の各々に対して、

を正弦波周波数ｆ_kの近似として計算する。
［００４９］
送信された信号が高調波である場合、何らかの基本周波数ｆ₀の整数倍数であるような周波数を有する正弦波から信号が構成される場合が多い。これは、信号が例えば有声音声又は何らかの楽器の持続音のように非常に周期的である場合である。実施形態の正弦波モデルの周波数は周波数依存ではなく、同一の基本周波数に対して高調波の関係にあり、同一の基本周波数に由来する。この高調波特性を考慮に入れることにより、結果的に正弦波成分周波数の分析を相当に改善できる。
［００５０］
改善の可能性の１つの概要は次の通りである。
［００５１］
１．信号が高調波であるか否かを検査する。これは、例えば、フレーム損失以前の信号の周期性を評価することにより実行可能である。簡単な方法の１つは信号の自動相関分析を実行することである。何らかの時間遅延τ＞０に関する自動相関関数の最大値を指標として使用できる。この最大値の値が所定の閾値を超えた場合、信号は高調波であるとみなすことができる。その場合、対応する時間遅延τは、

によって基本周波数と関連する信号の周期に対応する。
［００５２］
多くの線形予測音声符号化法は、適応コードブックを使用していわゆる開ループ又は閉ループピッチ予測符号化、すなわちＣＥＬＰ符号化を適用する。信号が高調波である場合、そのような符号化方法により取り出されるピッチゲイン及び関連するピッチラグパラメータも、時間遅延に関してそれぞれ有用な指標である。
［００５３］
ｆ₀を取得する更なる方法を以下に説明する。
［００５４］
２．整数範囲１…Ｊ_maxの中の高調波インデックスｊごとに、高調波周波数ｆ_j＝ｊ・ｆ₀の近傍に分析フレームの（対数）ＤＦＴ振幅スペクトルのピークが存在するか否かを検査する。ｆ_jの近傍は、デルタがＤＦＴの周波数分解能ＤＦＴ（ｆ_s／Ｌ）に対応するｆ_jの周囲のデルタ範囲、すなわち区間

として定義されうる。対応する推定正弦波周波数

を有するピークが存在する場合、f^kをf^k=j・f₀と置換する。
［００５５］
上記の２ステップ手順の場合、信号が高調波であるか否かの検査及び基本周波数の偏移を黙示的に、おそらくは反復方式で必ずしも何らかの別の方法からの指標を使用せずに取り出すことも可能である。そのような技術の一例を以下に示す。
［００５６］
候補値｛ｆ_0,1…ｆ_0,P｝の集合の中からのｆ_0,pごとに、

を置換することなく、高調波周波数の周囲の近傍に存在するＤＦＴピークの数、すなわちｆ_0,pの整数倍数をカウントしつつ、手順のステップ２を適用する。高調波周波数に又はその周囲に最大数のピークが取得される基本周波数ｆ_0,pmaxを特定する。このピークの最大数が所定の閾値を超えた場合、信号は高調波であると想定される。その場合、ｆ_0,pmaxは、ステップ２の実行に際して使用され、その結果、改善された正弦波周波数f^kをもたらす基本周波数であると想定できる。しかし、これに代わる更に好適な方法は、まず、高調波周波数と一致することがわかっているピーク周波数f^kに基づいて基本周波数ｆ₀を最
適化することである。Ｍ個の高調波より成る集合、すなわち、周波数f^k(m), m = 1…MでＭ個のスペクトルピークの何らかの集合と一致することがわかっている何らかの基本周波数の整数倍数｛ｎ₁…ｎ_M｝を想定すると、基礎を成す（最適化）基本周波数ｆ_0,optは、高調波周波数とスペクトルピーク周波数との誤差を最小限にするように計算できる。最小にすべき誤差が平均２乗誤差

である場合、最適基本周波数は、

として計算される。候補値の初期集合｛ｆ_0,1…ｆ_0,P｝は、ＤＦＴピークの周波数又は推定正弦波周波数

から取得できる。
推定正弦波周波数

の正確度を改善する更なる可能性は、その時間発展（temporal evolution）を考慮することである。その目的のために、複数の分析フレームからの正弦波周波数の推定値を例えば平均化又は予測によって組み合わせることができる。平均化又は予測に先立って、各推定スペクトルピークを同一の基調となる各正弦波に結び付けるピーク追跡を適用することができる。
［００５７］
（正弦波モデルの適用）
以下、フレーム損失コンシールメント演算を実行するための正弦波モデルの適用について説明する。
［００５８］
対応する符号化情報が利用不可能であるため符号化信号の所定のセグメントをデコーダにより再構成できない場合を想定する。更に、このセグメントより過去の信号の部分が利用可能であるとする。ｙ（ｎ）（ただし、ｎ＝０…Ｎ－１）を、代替フレームｚ（ｎ）が生成されなければならない利用不可能セグメントであるとし、ｎ＜０の場合のｙ（ｎ）を、過去に復号された利用可能信号であるとする。この場合、第１のステップにおいて、長さＬ及び開始インデックスｎ_-1の利用可能信号のプロトタイプフレームが窓関数ｗ（ｎ）によって抽出され、例えば次式のＤＦＴによって周波数領域に変換される。
［００５９］

［００６０］
窓関数は、先に正弦波分析に関して説明した窓関数のうち１つでありうる。数値の複雑さを軽減するために、周波数領域変換後のフレームは、正弦波分析において使用されるフレームと同一であるのが好ましい。
［００６１］
次のステップにおいて、想定正弦波モデルが適用される。想定正弦波モデルによれば、プロトタイプフレームのＤＦＴを次のように書き表すことができる。
［００６２］

［００６３］
次のステップは、使用される窓関数のスペクトルが０にごく近い周波数範囲において重大な寄与をすると理解することである。図３に示されるように、窓関数の振幅スペクトルは、０にごく近い周波数に対しては大きく、そうでない周波数に対しては小さい（サンプリング周波数の２分の１に対応する－π～πの正規化周波数範囲内）。従って、近似として、窓スペクトルＷ（ｍ）は、区間Ｍ＝［－ｍ_min，ｍ_max］（ｍ_min及びｍ_maxは小さな正の整数）に対してのみ０ではないと仮定する。特に、窓関数スペクトルの近似は、ｋごとに、上記の式中のシフトされた窓スペクトルの寄与が厳密に互いに重なり合わないように使用される。上記の式において、周波数インデックスごとに、１つの被加数からの、すなわち１つのシフトされた窓スペクトルからの寄与のみが常に最大である。これは、上記の式が下記の近似式に縮小されることを意味する。
［００６４］
非負であるｍ∈Ｍ_kに対して、ｋごとに、

［００６５］
ここで、Ｍ_kは、整数区間

を示し、ｍ_min,k及びｍ_max,kは、区間が互いに重なり合わないようにするという先に説明した制約に適合する。ｍ_min,k及びｍ_max,kの適切な選択は、それらの値を小さな整数値δ、例えばδ＝３に設定することである。しかし、２つの隣接する正弦波周波数ｆ_k及びｆ_k+1に関連するＤＦＴインデックスが２δより小さい場合、区間が重なり合わないことが保証されるように、δは、

に設定される。関数floor(・)は、それ以下である関数引数に最も近い整数である。
［００６６］
一実施形態による次のステップは、上記の式による正弦波モデルを適用し、そのＫ個の正弦波を時間的に発展（evolve）させることである。プロトタイプフレームの時間インデックスと比較して、消去セグメントの時間インデックスはｎ_-1サンプルだけ異なるという仮定は、正弦波の位相が

だけ進んでいることを意味する。従って、発展させた正弦波モデルのＤＦＴスペクトルは
次式により表される。
［００６７］

［００６８］
シフトされた窓関数スペクトルが互いに重なり合わないという近似を再び適用すると、非負であるｍ∈Ｍ_kに対して、ｋごとに以下の式が得られる。
［００６９］

［００７０］
近似を使用することにより、プロトタイプフレームＹ_-1Ｙ（ｍ）のＤＦＴを、発展させた正弦波モデルＹ₀（ｍ）のＤＦＴと比較すると、ｍ∈Ｍ_kごとに位相が

だけシフトされる間、振幅スペクトルは不変のままであることがわかる。従って、各正弦波の近傍のプロトタイプフレームの周波数スペクトル係数は、正弦波周波数ｆ_kと、損失オーディオフレームとプロトタイプフレームｎ_-1との間の時間差とに比例してシフトされる。
［００７１］
従って、本実施形態によれば、次式により代替フレームを計算できる。
非負のｍ∈Ｍ_kに対して、ｋごとに、

とし、

［００７２］
特定の一実施形態は、どの区間Ｍ_kにも属さないＤＦＴインデックスに関する位相ランダム化に対処する。先に説明したように、区間Ｍ_k，ｋ＝１…Ｋは、それらの区間が厳密に重なり合わないように設定されなければならず、これは、区間のサイズを制御する何らかのパラメータδを使用して実行される。２つの隣接する正弦の周波数距離に関連して、δが小さいということが起こりうる。従って、その場合、２つの区間の間に隙間ができることもありうる。そのため、対応するＤＦＴインデックスｍに対して、上記の式

に従った位相シフトは定義されない。本実施形態による適切な選択肢は、それらのインデックスに対して位相をランダム化することであり、その結果、Ｚ（ｍ）＝Ｙ（ｍ）・ｅ^{j2πrand(・)}となる。ここで、関数rand(・)は何らかの乱数を返す。
［００７３］
再構成信号の品質に関して、区間Ｍ_kのサイズを最適化することは有益であることがわかっている。特に信号が非常にトーン信号に近い場合、すなわち鮮明かつ明確なスペクトルピークを有する場合、区間を大きくすべきである。これは、例えば信号が明確な周期性
を有する高調波である場合である。信号が広いスペクトル最大値を有し、さほど明確ではないスペクトル構造を有する他の場合には、狭い区間を使用することにより品質がよくなることがわかっている。この発見により、信号の特性に従って区間サイズを適応化させるという更なる改善が得られる。実施形態の１つはトーン性検出器又は周期性検出器を使用する。この検出器が信号がトーン信号に近いと判定すると、区間サイズを制御するδパラメータは、相対的に大きな値に設定される。そうでない場合、δパラメータは相対的に小さな値に設定される。
［００７４］
上記の説明に基づき、オーディオフレーム損失コンシールメント方法は次のステップを含む。
［００７５］
１．利用可能な、過去に合成された信号のセグメントを分析して、例えば改善周波数推定値を使用して、正弦波モデルの組成する正弦波周波数ｆ_kを取得する。
［００７６］
２．利用可能な、過去に合成された信号からプロトタイプフレームｙ_-1を抽出し、そのフレームのＤＦＴを計算する。
［００７７］
３．正弦波周波数ｆ_kと、プロトタイプフレームと代替フレームとの間の時間の進みｎ_-1とに応じて、正弦波ｋごとの位相シフトθ_kを計算する。このステップにおいて、例えば、区間Ｍのサイズがオーディオ信号のトーン性に応じて適応化されうる。
［００７８］
４．正弦波ｋごとに、正弦波周波数ｆ_kの周囲の近傍に関連するＤＦＴインデックスに対して、プロトタイプフレームＤＦＴの位相を選択的にθ_k進ませる。
［００７９］
５．ステップ４で取得されたスペクトルの逆ＤＦＴを計算する。
［００８０］
（信号及びフレーム損失特性の分析及び検出）
上述した方法は、オーディオ信号の特性は、短時間の間では、過去に受信され再構成された信号フレーム及び損失フレームから大きく変化することはないという仮定に基づいている。この場合、過去に再構成されたフレームの振幅スペクトルを保持し、過去に再構成された信号において検出された正弦波主成分の位相を発展させる（evolve）ことは、非常に良い選択である。しかし、例えば急激なエネルギー変化や急激なスペクトル変化を伴う過渡状態が存在する場合には、この仮定は誤りとなりうる。
［００８１］
そのため、本発明に係る過渡検出器の第１の実施形態は、過去に再構成された信号のエネルギー変動に基づくことができる。図１１に示されるこの方法は、分析フレーム１１３の左側部分及び右側部分のエネルギーを計算する。分析フレームは、前述した正弦波分析に使用されるフレームと同一でよい。分析フレームの一部（左側又は右側）は、その分析フレームの最初の半分の部分または最後の半分の部分であってもよいし、例えば分析フレーム１１０の最初の４分の１の部分または最後の４分の１の部分であってもよい。それぞれの部分のエネルギー計算は、それらの部分フレームにおけるサンプルの２乗を加算することにより実行される。
［００８２］

ただし、ｙ（ｎ）は分析フレームを示し、ｎ_left及びｎ_rightは共に、サイズＮ_partの部分フレームの開始インデックスを示す。
［００８３］
左右の部分フレームのエネルギーは、信号不連続性の検出に使用される。これは、比

を計算することにより実行される。比Ｒ_l/rが閾値（例えば、10）を超えた場合、急激なエネルギー減少（立ち下がり）による不連続性を検出できる（１１５）。同様に、比Ｒ_l/rが他の閾値（例えば、0.1）を下回った場合、急激なエネルギー増加（立ち上がり）による不連続性を検出できる（１１７）。
［００８４］
前述したコンシールメント方法に関連して、上記定義したエネルギー比は多くの場合で感度の低すぎる指標であるかもしれないということが判明した。特に、実信号、とりわけ音楽信号の場合、ある周波数のトーンが急激に現れるのに対し、他の周波数の他のトーンが急激に消滅することがある。上記定義したエネルギー比を使用して信号フレームを分析すると、この指標は異なる周波数に対しては低い感度しか示さないので、いずれの場合にも、上記トーンのうちの少なくとも１つについて誤った検出結果を導く可能性がある。
［００８５］
この問題に対する解決方法を以下の実施形態で説明する。まず、過渡検出が時間-周波数平面で実行される。分析フレームは、同様に左側部分フレームと右側部分フレームとに分割される（１１０）。しかし、それら２つの部分フレームは、（例えば、ハミング窓による適切な窓掛け（１１１）の後に）例えばＮ_part点ＤＦＴによって周波数領域に変換される（１１２）。
［００８６］

及び、ｍ＝０…Ｎ_part－１の場合、

［００８７］
ここで、インデックスｍのＤＦＴビンごとに、過渡検出を周波数選択的に実行可能である。ＤＦＴインデックスｍごとに、左右の部分フレームの振幅スペクトルのパワを用いてエネルギー比を次のように計算できる（１１３）。
［００８８］

［００８９］
経験上、ＤＦＴビン分解能による周波数選択的過渡検出は、統計的変動（推定誤差）のために相対的に不正確であることがわかっている。周波数帯域に基づいて周波数選択的過渡検出を実行した場合、演算の品質が向上することが判明している。ｌ_k＝［ｍ_k-1＋１，…，ｍ_k］がｍ_k-1＋１からｍ_kまでのＤＦＴビンを含むｋ番目の区間（ｋ＝１…Ｋ）を指定するとすれば、それらの区間は、Ｋ個の周波数帯域を定義する。そこで、左側部分フレームと右側部分フレームの各帯域エネルギーの帯域ごとの比に基づいて、周波数群選択的過渡検出を実行できる。
［００９０］

［００９１］
なお、区間ｌ_k＝［ｍ_k-1＋１，…，ｍ_k］は、周波数帯域

に対応し、ｆ_sはオーディオサンプリング周波数である。
［００９２］
最も低い下限周波数帯域境界ｍ₀を０に設定することは可能であるが、周波数が低くなるほど増加する推定誤差を軽減するために、それより高い周波数に対応するＤＦＴインデックスに境界が設定されてもよい。最も高い上限周波数帯域境界ｍ_kを

に設定することは可能であるが、これは、過渡状態が依然として聞こえの効果に重大な影響を及ぼす低い周波数に対応するように選択されるのが好ましい。
［００９３］
それらの周波数帯域のサイズ又は幅の適切な選択の１つは、それらを等しい大きさ、例えば数百Ｈｚの幅、にすることである。別の好適な方法は、周波数帯域の幅を人間の聴覚の臨界帯域のサイズに従うこと、すなわちそれらを聴覚系の周波数分解能に関連付けることである。これは、周波数帯域の幅を１ｋＨｚまでの周波数に対しては等しくし、約１ｋＨｚを超えた後は指数関数的に増加させることとほぼ同じである。指数関数的増加は、例えば帯域インデックスｋの増分に伴って周波数帯域幅を２倍にすることを意味する。
［００９４］
２つの部分フレームのエネルギー比に基づく過渡検出器の第１の実施形態で説明したように、２つの部分フレームの帯域エネルギー又はＤＦＴビンエネルギーに関連する比が、閾値と比較される。（周波数選択的）立ち下がり検出１１５には上限閾値が用いられ、（周波数選択的）立ち上がり検出１１７には下限閾値が用いられる。
［００９５］
フレーム損失コンシールメント方法の適応化に適する更に別のオーディオ信号依存指標は、デコーダへ送信されるコーデックパラメータに基づくことができる。例えば、コーデックは、ＩＴＵ－ＴＧ．７１８のようなマルチモードコーデックであってもよい。そのようなコーデックは、信号の異なる種類に対して特定のコーデックモードを使用し、フレーム損失の直前のフレームにおけるコーデックモードの変更は、過渡の指標とみなされうる。
［００９６］
フレーム損失コンシールメントの適応化に有用な別の指標は、有声音特性及び送信信号に関連するコーデックパラメータである。有声音は、人間の声道の周期的な声門励振により生成される極めて周期的な音声に関連する。
［００９７］
更なる好適な指標は、信号コンテンツが音楽であるか音声であるかの推定の指標である。そのような指標は、通常はコーデックの一部でありうる信号分類器から取得できる。コーデックがそのような分類を実行し、デコーダに対する符号化パラメータとして利用可能な対応する分類がされた場合、このパラメータは、フレーム損失コンシールメント方法を適応化させるために使用される信号コンテンツ指標として使用されるのが好ましい。
［００９８］
フレーム損失コンシールメント方法の適応化に使用されるのが好ましい別の指標は、フレーム損失のバースト性である。フレーム損失のバースト性は、数回のフレーム損失が連続的に起こり、そのため、フレーム損失コンシールメント方法がその演算に最近復号された有効信号部分を使用するのが難しくなっていることを意味する。従来の技術による指標は、連続して観測されたフレーム損失の数ｎ_burstである。このカウンタは、フレーム損失が起こるたびに１増分され、有効フレームが受信されると０にリセットされる。この指標は、本発明の例示的な実施形態に関連して使用される。
［００９９］
（フレーム損失コンシールメント方法の適応化）
実行された上記のステップがフレーム損失コンシールメント演算の適応化を示唆する状態を示す場合、代替フレームのスペクトルの計算が修正される。
［０１００］
代替フレームスペクトルの当初の計算は、式Ｚ（ｍ）＝Ｙ（ｍ）・ｅ^jθ _kに従って実行されるが、振幅及び位相の双方を修正する適応化が導入される。振幅は２つの係数α（ｍ）及びβ（ｍ）によるスケーリングによって修正され、位相は追加位相成分

によって修正される。これにより、代替フレームは次のように修正計算される。
［０１０１］

［０１０２］
なお、

である場合、当初の（非適応）フレーム損失コンシールメント方法が使用される。従って、それらの値はそれぞれデフォルト値である。
［０１０３］
振幅適応化を導入することの一般的目的は、フレーム損失コンシールメント方法の音のアーチファクトを回避することである。そのような音のアーチファクトは、過渡音の反復から生じる音楽音、トーン音、あるいは異常音となりうる。そのような音のアーチファクトは品質の劣化につながると考えられるので、音のアーチファクトを回避することが、ここで説明する適応化の目的である。そのような適応化に適する方法は、代替フレームの振幅スペクトルを適切な程度に修正することである。
［０１０４］
図１２は、コンシールメント方法修正の一実施形態を示す。バースト損失カウンタｎ_burstが閾値thr_burst（例えばthr_burst＝３）を超えた場合（１２１）、振幅適応化が実行されるのが好ましい（１２３）。その場合、減衰率として、１より小さい値（例えばα（ｍ）＝0.1）が使用される。
［０１０５］
ただし、徐々に程度が増加する減衰を実行するのが有益であることがわかっている。これを実現する好適な一実施形態は、フレームごとの減衰量の対数増加att_per_frameを指定する対数パラメータを定義することである。そこで、バーストカウンタが閾値を超えた場合の、徐々に増加する減衰率は、次式により計算される。
［０１０６］

ただし、定数ｃは、例えばデシベル（ｄＢ）単位でパラメータatt_per_frameを指定することを可能にする単なるスケーリング定数である。
［０１０７］
追加的な好適な適応化は、信号が音楽であるか音声であるかの推定を示す指標に応じて実行されるものである。音楽コンテンツの場合、音声コンテンツと比較して閾値thr_burstを増加させ、フレームごとの減衰を減少させることが好ましい。これは、程度を下げながらフレーム損失コンシールメント方法の適応化を実行することに等しい。この種の適応化の背景にあるのは、一般に、音声と比較して音楽のほうが長い損失バーストの影響を受けやすいことである。従ってこの場合、少なくとも複数のフレーム損失が含まれる場合には
、当初のフレーム損失コンシールメント方法、すなわち未修正のフレーム損失コンシールメント方法が依然として好適である。
［０１０８］
指標Ｒ_l/r,band（ｋ）、あるいはＲ_l/r（ｍ）又はＲ_l/rが閾値を超えたことに基づいて過渡が検出された場合、振幅減衰率に関する更なるコンシールメント方法の適応化が実行されるのが好ましい（１２２）。その場合、適切な適応化動作（１２５）は、全減衰量が２つの係数の積α（ｍ）・β（ｍ）により制御されるように第２の振幅減衰率β（ｍ）を修正することである。
［０１０９］
β（ｍ）は、過渡が示されたことに応じて設定される。立ち下がりが検出された場合、係数β（ｍ）は、その立ち下がりのエネルギー減少を反映するように選択されるのが好ましい。適切な選択肢は、β（ｍ）を検出されたゲイン変化に設定することである。すなわち、
ｍ∈Ｉ_k，ｋ＝１…Ｋとして、

［０１１０］
立ち上がりが検出された場合、代替フレームにおけるエネルギー増加を制限するのが有利であることがわかっている。その場合、係数は、減衰も増幅もしないことを意味する固定値（例えば１）に設定することができる。
［０１１１］
なお、上記の説明において、振幅減衰率は周波数選択的に、すなわち、周波数帯域ごとに、個別に計算された係数によって適用されるのが好ましい。帯域方式が使用されない場合、対応する振幅減衰率をアナログ的に取得することが可能である。ＤＦＴビンレベルで周波数選択的過渡検出が使用される場合、ＤＦＴビンごとに個別にβ（ｍ）を設定できる。あるいは、周波数選択的過渡指示がまったく使用されない場合、すべてのｍに対してβ（ｍ）を包括的に同一にすることができる。
［０１１２］
振幅減衰率の更なる好適な適応化は、位相の修正と関連して追加位相成分

によって実行される（１２７）。所定のｍに対して、そのような位相修正が使用される場合、減衰率β（ｍ）は更に減少される。位相修正の程度まで考慮に入れられるのが好ましい。位相修正が適度に実行されるだけの場合、β（ｍ）はわずかにスケールダウンされるのみであるが、位相修正が強力である場合、β（ｍ）は更に大幅にスケールダウンされる。
［０１１３］
位相適応化を導入することの一般的な目的は、生成される代替フレームのトーン性又は信号周期性が強すぎることによる品質劣化を招くようなことを回避することである。そのような適応化に適した方法は、位相を適切な程度にランダム化（randomize）又はディザリング（dithering）することである。
［０１１４］
そのような位相ディザリングは、追加位相成分

が制御係数によってスケーリングされたランダム値

に設定されることにより実現される。
［０１１５］
関数rand(・)により得られるランダム値は、例えば疑似乱数発生器により生成される。ここで、疑似乱数発生器は、区間［０，２π］の中で１つの乱数を出力すると想定する。
［０１１６］
上式のスケーリング係数α（ｍ）は、当初の位相θ_kがディザリングされる程度を制御する。以下に示す実施形態は、このスケーリング係数を制御することによって位相適応化に対処する。スケーリング係数の制御は、先に説明した振幅修正係数の制御と同様に実行される。
［０１１７］
第１の実施形態によれば、スケーリング係数α（ｍ）は、バースト損失カウンタに応じて適応化される。バースト損失カウンタｎ_burstが閾値thr_burst（例えば_burst＝３）を超えた場合、０より大きい数（例えば、α（ｍ）＝0.2）が使用される。
［０１１８］
しかし、徐々に程度を増加させながらディザリングを実行するのが有益であることが分かっている。これを実現する好適な一実施形態は、フレームごとのディザリングの増加を指定するパラメータdith_increase_per_frameを定義することである。そこで、バーストカウンタが閾値を超えた場合、徐々に増加するディザリング制御係数は次式により計算される。
［０１１９］

［０１２０］
ただし、上式において、α（ｍ）は、全位相ディザリングが達成される最大値１に制限されなければならない。
［０１２１］
なお、位相ディザリングを開始するために使用されるバースト損失閾値thr_burstは、振幅減衰に使用される閾値と同一の閾値であってもよい。しかし、それらの閾値を個別に最適値に設定することにより、より高い品質を得ることができ、これは、一般にそれらの閾値が異なっていてもよいことを意味する。
［０１２２］
信号が音楽であるか音声であるかの推定を示す指標に応じて、好適な追加的な適応化が実行される。音楽コンテンツの場合、音声コンテンツと比較して閾値thr_burstを増加させるのが好ましい。これは、音声と比較して、音楽の場合の位相ディザリングは、連続する損失フレームの数が多い場合にのみ実行されることを意味する。これは、程度を下げながら音楽の場合のフレーム損失コンシールメント方法の適応化を実行することと同等である。この種の適応化の背景には、一般に音楽は、音声より長い損失バーストの影響を受けにくいということがある。従って、この場合、少なくとも多数の連続するフレーム損失に対しては、当初のフレーム損失コンシールメント方法、すなわち未修正のフレーム損失コンシールメント方法が依然として好ましい。
［０１２３］
更なる好適な実施形態は、検出された過渡に応じて位相ディザリングを適応化することである。その場合、そのビン、対応する周波数帯域のＤＦＴビン、又はフレーム全体のＤＦＴビンに関して過渡が示されたＤＦＴビンｍに対して、より強力な程度の位相ディザリングを使用できる。
［０１２４］
説明される方式の一部は、高調波信号、特に有声音の高調波信号に対してフレーム損失コンシールメント方法を最適化することに対処する。
［０１２５］
前述したような改善型周波数推定を使用する方法が実現されない場合、有声音声信号に対して品質を最適化するフレーム損失コンシールメント方法の別の適応可能性は、音楽及び音声を含む一般的なオーディオ信号に関する方法ではなく、音声に特定して設計されかつ最適化された他のフレーム損失コンシールメント方法に切り替えることである。その場合、信号が有声音声信号を含むという指標が、前述した方式ではなく別の音声最適化フレーム損失コンシールメント方式を選択するために使用される。
［０１２６］
実施形態は、図１３に示されるようなデコーダのコントローラに適用される。図１３は実施形態に係るデコーダの概略ブロック図である。デコーダ１３０は、符号化オーディオ信号を受信するように構成された入力ユニット１３２を備える。図は、論理フレーム損失コンシールメントユニット１３４によるフレーム損失コンシールメントを示し、これは、先述した実施形態に従ってデコーダが損失オーディオフレームのコンシールメントを実現するように構成されていることを示す。デコーダは、先述した実施形態を実現するコントローラ１３６を更に備える。コントローラ１３６は、受信され、再構成されたオーディオ信号の特性の中で又は観測されたフレーム損失の統計的特性において、先述した方法に従った損失フレームの代替が相対的に品質を低下させるような状態を検出するように構成される。そのような状態が検出された場合、コントローラ１３６は、位相又はスペクトル振幅を選択的に調整することにより、

に従って代替フレームスペクトルを計算するコンシールメント方法の要素を修正するように構成される。検出は、検出器ユニット１４６により実行可能であり、修正は、図１４に示されるような修正器ユニット１４８により実行可能である。
［０１２７］
デコーダは、そこに含まれるユニットと共に、ハードウェアで実現可能である。デコーダのユニットの機能を実現するために使用可能であり、組み合わせ可能である回路素子には数多くの変形がありうる。そのような変形例は実施形態に含まれる。デコーダのハードウェア実現形態の特定の実施例は、共に汎用電子回路及び特定用途向け回路を含むデジタルシグナルプロセッサ（ＤＳＰ）ハードウェアと集積回路技術である。
［０１２８］
あるいは、図１３に示されるような本明細書において説明される実施形態に係るオーディオフレーム損失コンシールメントの実行を含めて、オーディオ信号を再構成するために、本明細書において説明されるデコーダ１５０は、例えば図１５に示されるように、すなわち、プロセッサ１５４及び適切な記憶装置又はメモリ１５６を伴う適切なソフトウェア１５５のうち１つ以上により実現可能である。入力される符号化オーディオ信号は入力端子（ＩＮ）１５２により受信され、この入力端子（ＩＮ）１５２には、プロセッサ１５４及びメモリ１５６が接続される。ソフトウェアから取得された復号化、再構成化オーディオ信号は、出力端子（ＯＵＴ）１５８から出力される。
［０１２９］
上述の技術は、例えば、移動体装置（例えば、移動電話、ラップトップ）又はパーソナルコンピュータなどの固定デバイスで使用可能な受信機において使用されうる。
［０１３０］
相互に作用するユニット又はモジュールの選択、並びにそれらのユニットの名前は単なる例であり、開示される処理動作を実行可能にするために複数の代替方法で構成されうることは理解されよう。
［０１３１］
なお、本明細書において説明されるユニット又はモジュールは、必ずしも個別の物理エンティティではなく、論理エンティティとしてみなされるべきものである。本明細書において開示される技術の範囲は、当業者には自明であると思われる他の実施形態をすべて含
み、それに従って、本明細書の開示の範囲が限定されるべきではないことが理解されるだろう。
［０１３２］
単数形の要素を説明する場合、明示して指示のない限り、それは「ただ１つの」要素を意味するのではなく、「１つ以上の」要素を表す。先に説明された実施形態の要素と同等の、当業者には知られているすべての構造及び機能は、そこで参照することにより本発明に明白に取り入れられており、本発明に含まれることが意図される。更に、装置又は方法は、本発明に含まれるために、本明細書において開示された技術により解決されようとしているありとあらゆる問題に対処する必要はない。
［０１３３］
以上の説明の中で、開示される技術を完全に理解させるために、説明の便宜上、特定の構造、インタフェース、技術などの特定の詳細を述べたが、それは本発明を限定するものではない。しかし、それらの特定の詳細から逸脱した他の実施形態及び／又は実施形態の組み合わせにおいて、開示された技術が実施されてもよいことは当業者には明らかだろう。すなわち、本明細書には明示して説明又は図示されてはいないが、開示された技術の原理を具現化する種々の構成を当業者は考案できるだろう。場合によっては、不必要に詳細を述べることによって、開示される技術の説明をわかりにくくしないように、周知のデバイス、回路及び方法の詳細な説明を省略した。開示される技術の原理、態様及び実施形態、並びにその特定の実施例を説明した本明細書のすべての記述は、それらと同等な構造及び同等な機能を共に含むことを意図する。更に、そのような同等物は、現在知られている同等物に加えて、将来開発される同等物、例えば、構造に関わらず同一の機能を実行するように開発された何らかの要素をも含むことが意図される。
［０１３４］
従って、例えば、添付の図は、技術の原理を具現化する例示的な回路又は他の機能ユニット、及び／又はコンピュータ読み取り可能な媒体で実質的に表現されてもよく、図には明示して示されてはいないが、コンピュータ又はプロセッサにより実行されうる種々の処理の概念図を表すことができることが当業者には理解されるだろう。
［０１３５］
機能ブロックを含む種々の要素の機能は、回路ハードウェア及び／又はコンピュータ読み取り可能な媒体に記憶された符号化命令の形のソフトウェアを実行可能なハードウェアの使用によって提供されてもよい。従って、そのような機能及び図示される機能ブロックは、ハードウェアで実現されかつ／又はコンピュータで実現され、従って機械で実現されると理解されるべきである。
［０１３６］
以上説明した実施形態は、本発明のいくつかの例示として理解されるべきである。本発明の範囲から逸脱することなく、それらの実施形態に対して種々の修正、組み合わせ及び変更が行われてもよいことは当業者には理解されよう。特に、異なる実施形態の異なる部分の方法は、技術的に可能であるならば、他の構成で組み合わせ可能である。

Claims

受け取った音響信号に関連する失われた音響フレームのための隠蔽方法を制御するための方法であって、
修正離散コサイン変換（ＭＤＣＴ）係数を得るために、前記受け取った音響信号の第１の音響フレームを復号すること（９０１）と、
復号された前記第１の音響フレームから復号された前記ＭＤＣＴ係数に基づいて第１のスペクトル形状の値を決定すること（３０７～３０９、９０３）であって、前記第１のスペクトル形状がある数の副帯域を含む、第１のスペクトル形状の値を決定すること（３０７～３０９、９０３）と、
第２の音響フレームのためのＭＤＣＴ係数を得るために、前記受け取った音響信号の前記第２の音響フレームを復号すること（９０７）と、
復号された前記第２の音響フレームから復号されたＭＤＣＴ係数に基づいて第２のスペクトル形状の値を決定すること（３０７～３０９、９１３）であって、前記第２のスペクトル形状が前記数の副帯域を含む、第２のスペクトル形状の値を決定すること（３０７～３０９、９１３）と、
前記第１の音響フレームの前記第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速フーリエ変換（ＦＦＴ）に基づくスペクトル解析の第１の表現に変換すること（９１７）、および前記第２の音響フレームの前記第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換すること（９１７）と、
前記第１のＦＦＴの前記第１の表現および第２のＦＦＴの前記第２の表現に基づいて過渡状態を検出すること（９１９）と、
前記過渡状態の検出に応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整することによって前記隠蔽方法を修正すること（９２１）と
を含む方法。
前記ＭＤＣＴ係数に基づいて前記第１のスペクトル形状の前記値を決定することが、
前記ＭＤＣＴ係数の全体の大きさを決定すること（３０７）と、
前記第１のスペクトル形状の個々の副帯域値を正規化することと、
個々の正規化された副帯域値を前記第１のスペクトル形状の前記値のうちの一値として記憶することと
を含む、請求項１に記載の方法。
前記ＭＤＣＴ係数の前記全体の大きさが、

に従って決定され、ここで、ｓｈａｐｅ＿ｔｏｔは前記ＭＤＣＴ係数の前記全体の大きさであり、Ｎ_ＭＤＣＴはＭＤＣＴ係数の数であってサンプリング周波数に応じて決まり、ｑ＿ｄ（ｎ）が前記ＭＤＣＴ係数である、請求項２に記載の方法。
前記個々の副帯域の正規化が、

に従って正規化され、ここで、ｓｈａｐｅ_ｏｌｄ（ｋ）は副帯域（ｋ）のスペクトル形状であり、ｓｈａｐｅ＿ｔｏｔは前記ＭＤＣＴ係数の前記全体の大きさであり、ｑ＿ｄ（ｎ）は前記ＭＤＣＴ係数であり、ｇｒｐ＿ｂｉｎ（ｋ）は副帯域（ｋ）における前記ＭＤＣＴ係数に対する開始指標であり、Ｎ_ｇｒｐは副帯域の数である、請求項２または３に記載の方法。
前記第１のスペクトル形状および前記第１のフレームエネルギーの前記値を第１のＦＦＴに基づくスペクトル解析の前記第１の表現に変換すること、および前記第２のスペクトル形状および前記第２のフレームエネルギーの前記値を第２のＦＦＴスペクトル解析の第２の表現に変換することが、前記第１のスペクトル形状および前記第１のフレームエネルギーの前記値、および前記第２のスペクトル形状および前記第２のフレームエネルギーの前記値に変換ファクターを適用することを含む、請求項１から４のいずれか一項に記載の方法。
前記変換ファクターがサンプリング周波数に応じて決まる、請求項５に記載の方法。
Ｅ_ｏｏｌｄ（ｋ）＝μ・ｓｈａｐｅ_ｏｏｌｄ（ｋ）・Ｅ＿ｗ_ｏｏｌｄ、０≦ｋ＜Ｎ_ｇｒｐ
および

に従って、前記第１のスペクトル形状および前記第１のフレームエネルギーの前記値を第１のＦＦＴに基づくスペクトル解析の前記第１の表現に変換すること、および前記第２のスペクトル形状および前記第２のフレームエネルギーの前記値を第２のＦＦＴスペクトル解析の第２の表現に変換することをさらに含み、
ここで、Ｅ_ｏｏｌｄ（ｋ）は前記第１の表現であり、μは変換ファクターであり、ｓｈａｐｅ_ｏｏｌｄ（ｋ）は前記第１のスペクトル形状の副帯域（ｋ）のスペクトル形状であり、Ｅ＿ｗ_ｏｏｌｄは前記第１のフレームエネルギーであり、Ｅ_ｏｌｄ（ｋ）は前記第２の表現であり、ｓｈａｐｅ_ｏｌｄ（ｋ）は前記第２のスペクトル形状の副帯域（ｋ）のスペクトル形状であり、Ｅ＿ｗ_ｏｌｄは前記第２のフレームエネルギーであり、Ｎ_ｇｒｐは副帯域の数である、請求項４から６のいずれか一項に記載の方法。
Ｅ_ｏｏｌｄ（ｋ）およびＥ_ｏｌｄ（ｋ）に関連するフレームのそれぞれの帯域エネルギー同士の間の比率が閾値よりも大きいかどうかを決定すること（１１０５）と、
前記比率が前記閾値よりも大きいことに応答して、前記置換フレームスペクトルの前記スペクトルの大きさを選択的に調整すること（１１０７）によって前記隠蔽方法を修正することと
をさらに含む、請求項７に記載の方法。
前記置換フレームスペクトルが

の表現式に従って計算され、また、前記スペクトルの大きさを調整することが、β（ｍ）を調整すること（１１０７）を含み、ここで、Ｚ（ｍ）が前記置換フレームスペクトルであり、α（ｍ）が第１の大きさ減衰ファクターであり、β（ｍ）が第２の大きさ減衰ファクターであり、Ｙ（ｍ）がプロトタイプフレームであり、θ_ｋが位相シフトであり、θ（ｍ）が付加的位相成分である、請求項８に記載の方法。
前記第１のスペクトル形状の決定された前記値をｓｈａｐｅ_ｏｌｄバッファに記憶することと、
前記第１の音響フレームの前記第１のフレームエネルギーを決定すること（９０５）、および決定された前記第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶することと、
前記第２の音響フレームの復号に応答して、前記第１のスペクトル形状の決定された前記値を前記ｓｈａｐｅ_ｏｌｄバッファからｓｈａｐｅ_ｏｏｌｄバッファへ移すこと（３０３、９０９）と、
決定された前記第１のフレームエネルギーを前記Ｅ＿ｗ_ｏｌｄバッファからＥ＿ｗ_ｏｏｌｄバッファへ移すこと（３０５、９１１）と、
前記第２のスペクトル形状の決定された前記値を前記ｓｈａｐｅ_ｏｌｄバッファに記憶することと、
前記第２の音響フレームの前記第２のフレームエネルギーを決定すること（９１５）、および決定された前記第２のフレームエネルギーを前記Ｅ＿ｗ_ｏｌｄバッファに記憶することと
をさらに含む、請求項１から９のいずれか一項に記載の方法。
前記第１のフレームエネルギーおよび前記第２のフレームエネルギーの各々のフレームエネルギーが、
Ｅ＿ｗ_ｏｏｌｄ＝Ｅ＿ｗ_ｏｌｄ

に従って決定され、ここで、Ｅ＿ｗ_ｏｏｌｄが先行するフレームエネルギーであり、Ｅ＿ｗ_ｏｌｄが、計算されている第１のフレームまたは計算されている第２のフレームのフレームエネルギーであり、ｗ_ｗｈｒが長いＦＦＴスペクトル解析ウィンドウであり、ｘ_ｐｒｅｖが、潜在的に起ころうとしている失われたフレームのための置換を作り出すために使用される時間領域プロトタイプ信号であり、Ｌ_ｐｒｏｔが前記ｘ_ｐｒｅｖ信号におけるサンプルの数である、請求項１から１０のいずれか一項に記載の方法。
不良フレームインジケータを受け取ること（４０３、５０１）と、
前記不良フレームインジケータの受取りに応答して、前記ｓｈａｐｅ_ｏｏｌｄバッファおよび前記Ｅ＿ｗ_ｏｏｌｄエネルギーバッファをフラッシングすることと、
前記受け取った音響信号の新しい音響フレームを受け取ることと、
復号された前記新しい音響フレームからの復号されたＭＤＣＴ係数に基づいて新しいスペクトル形状の値を決定すること（５０３）、および計算された前記新しいスペクトル形状の値を前記ｓｈａｐｅ_ｏｌｄバッファおよび前記ｓｈａｐｅ_ｏｏｌｄバッファに記憶すること（４０５）であって、前記新しいスペクトル形状がある数の副帯域を含む、新しいスペクトル形状の値を記憶すること（４０５）と、
前記音響フレームの新しいフレームエネルギーを決定すること（５０５）、および計算された前記新しいフレームエネルギーを前記Ｅ＿ｗ_ｏｌｄバッファおよび前記Ｅ＿ｗ_ｏｏｌｄバッファに記憶すること（４０７）と
をさらに含む、請求項１０または１１に記載の方法。
請求項１から１２の少なくともいずれか一項による操作を実施するように適合された、デコーダ装置（１２０１、１３０１）。
受け取った音響信号に関連する失われた音響フレームのための隠蔽方法を制御するように設定された装置（１２０１、１３０１）であって、
修正離散コサイン変換（ＭＤＣＴ）係数を得るために、前記受け取った音響信号の第１の音響フレームを復号し、
復号された前記音響フレームから復号されたＭＤＣＴ係数に基づいて第１のスペクトル形状の値を決定し、前記第１のスペクトル形状がある数の副帯域を含み、
前記受け取った音響信号の第２の音響フレームを復号し、
復号された前記第２の音響フレームから復号されたＭＤＣＴ係数に基づいて第２のスペクトル形状の値を決定し、前記第２のスペクトル形状が前記数の副帯域を含み、
前記第１の音響フレームの前記第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速フーリエ変換（ＦＦＴ）に基づくスペクトル解析の第１の表現に変換し、また、前記第２の音響フレームの前記第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換し、
前記第１のＦＦＴの前記第１の表現および第２のＦＦＴの前記第２の表現に基づいて過渡状態を検出し、また、
前記過渡状態の検出に応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整することによって前記隠蔽方法を修正する
ように設定された、装置。
前記装置が請求項２から１２のいずれか一項に記載の操作を実施するように設定される、請求項１４に記載の装置。
受け取った音響信号に関連する失われた音響フレームのための隠蔽方法を制御するように設定されたデコーダ（１２０１、１３０１）であって、
プロセッサ（１３０５）と、
メモリ（１３１１）であって、前記プロセッサによって実行されると、前記デコーダ装置（１２０１、１３０１）に、
修正離散コサイン変換（ＭＤＣＴ）係数を得るために、前記受け取った音響信号の第１の音響フレームを復号すること（９０１）と、
復号された前記第１の音響フレームから復号されたＭＤＣＴ係数に基づいて第１のスペクトル形状の値を決定すること（９０３）であって、前記第１のスペクトル形状がある数の副帯域を含む、第１のスペクトル形状の値を決定すること（９０３）と、
前記受け取った音響信号の第２の音響フレームを復号すること（９０７）と、
復号された前記第２の音響フレームから復号されたＭＤＣＴ係数に基づいて第２のスペクトル形状の値を決定すること（３０７～３０９、９１３）であって、前記第２のスペクトル形状が前記数の副帯域を含む、第２のスペクトル形状の値を決定すること（３０７～３０９、９１３）と、
前記第１の音響フレームの前記第１のスペクトル形状の値および第１のフレームエネルギーを第１の高速フーリエ変換（ＦＦＴ）に基づくスペクトル解析の第１の表現に変換すること（９１７）、および前記第２の音響フレームの前記第２のスペクトル形状の値および第２のフレームエネルギーを第２のＦＦＴスペクトル解析の第２の表現に変換することと、
前記第１のＦＦＴの前記第１の表現および第２のＦＦＴの前記第２の表現に基づいて過渡状態を検出すること（９１９）と、
前記過渡状態の検出に応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整することによって前記隠蔽方法を修正すること（９２１）と
を含む操作を実施させる命令を記憶するメモリ（１３１１）と
を備える、デコーダ装置。
復号されたＭＤＣＴ係数に基づいて前記第１のスペクトル形状の前記値を決定するために、前記命令が、前記プロセッサによって実行されると、前記装置に
前記ＭＤＣＴ係数の全体の大きさを決定すること（３０７）と、
前記第１のスペクトル形状の個々の副帯域値を正規化することと、
個々の正規化された副帯域値を前記第１のスペクトル形状の前記値のうちの一値として記憶することと
を含む操作を実施させるさらなる命令を含む、請求項１６に記載のデコーダ。
前記ＭＤＣＴ係数の前記全体の大きさが、

に従って決定され、ここで、ｓｈａｐｅ＿ｔｏｔが前記ＭＤＣＴ係数の前記全体の大きさであり、Ｎ_ＭＤＣＴがＭＤＣＴ係数の数であってサンプリング周波数に応じて決まり、ｑ＿ｄ（ｎ）が前記ＭＤＣＴ係数である、請求項１７に記載のデコーダ。
前記個々の副帯域の正規化が、

に従って正規化され、ここで、ｓｈａｐｅ_ｏｌｄ（ｋ）が副帯域（ｋ）のスペクトル形状であり、ｓｈａｐｅ＿ｔｏｔが前記ＭＤＣＴ係数の前記全体の大きさであり、ｑ＿ｄ（ｎ）が前記ＭＤＣＴ係数であり、ｇｒｐ＿ｂｉｎ（ｋ）が副帯域（ｋ）における前記ＭＤＣＴ係数に対する開始指標であり、Ｎ_ｇｒｐが副帯域の数である、請求項１７または１８に記載のデコーダ。
前記第１のスペクトル形状および前記第１のフレームエネルギーの前記値を第１のＦＦＴに基づくスペクトル解析の前記第１の表現に変換し、また、前記第２のスペクトル形状および前記第２のフレームエネルギーの前記値を第２のＦＦＴスペクトル解析の第２の表現に変換するために、前記命令が、前記プロセッサによって実行されると、前記装置に、
前記第１のスペクトル形状および前記第１のフレームエネルギーの前記値、および前記第２のスペクトル形状および前記第２のフレームエネルギーの前記値に変換ファクターを適用すること
を含む操作を実施させるさらなる命令を含む、請求項１６から１９のいずれか一項に記載のデコーダ。
前記変換ファクターがサンプリング周波数に応じて決まる、請求項２０に記載のデコーダ。
Ｅ_ｏｏｌｄ（ｋ）＝μ・ｓｈａｐｅ_ｏｏｌｄ（ｋ）・Ｅ＿ｗ_ｏｏｌｄ、０≦ｋ＜Ｎ_ｇｒｐ
および

に従って、前記第１のスペクトル形状および前記第１のフレームエネルギーの前記値を第１のＦＦＴに基づくスペクトル解析の前記第１の表現に変換すること、および前記第２のスペクトル形状および前記第２のフレームエネルギーの前記値を第２のＦＦＴスペクトル解析の第２の表現に変換することをさらに含み、
ここで、Ｅ_ｏｏｌｄ（ｋ）が前記第１の表現であり、μが前記変換ファクターであり、ｓｈａｐｅ_ｏｏｌｄ（ｋ）が前記第１のスペクトル形状の副帯域（ｋ）のスペクトル形状であり、Ｅ＿ｗ_ｏｏｌｄが前記第１のフレームエネルギーであり、Ｅ_ｏｌｄ（ｋ）が前記第２の表現であり、ｓｈａｐｅ_ｏｌｄ（ｋ）が前記第２のスペクトル形状の副帯域（ｋ）のスペクトル形状であり、Ｅ＿ｗ_ｏｌｄが前記第２のフレームエネルギーであり、Ｎ_ｇｒｐが副帯域の数である、請求項２０または２１に記載のデコーダ。
前記命令が、前記プロセッサによって実行されると、前記装置に、
Ｅ_ｏｏｌｄ（ｋ）およびＥ_ｏｌｄ（ｋ）に基づいて、Ｅ_ｏｏｌｄ（ｋ）およびＥ_ｏｌｄ（ｋ）に関連するフレームのそれぞれの帯域エネルギー同士の間の比率が閾値よりも大きいかどうかを決定すること（１１０５）と、
前記比率が前記閾値よりも大きいことに応答して、前記置換フレームスペクトルの前記スペクトルの大きさを選択的に調整すること（１１０７）によって前記隠蔽方法を修正することと
をさらに含む操作を実施させるさらなる命令を含む、請求項２２に記載のデコーダ。
前記置換フレームスペクトルが、

の表現式に従って計算され、また、前記スペクトルの大きさを調整することが、β（ｍ）を調整すること（１１０７）を含み、ここで、Ｚ（ｍ）が前記置換フレームスペクトルであり、α（ｍ）が第１の大きさ減衰ファクターであり、β（ｍ）が第２の大きさ減衰ファクターであり、Ｙ（ｍ）がプロトタイプフレームであり、θ_ｋが位相シフトであり、θ（ｍ）が付加的位相成分である、請求項２３に記載のデコーダ。
前記第１のスペクトル形状の決定された前記値をｓｈａｐｅ_ｏｌｄバッファに記憶することと、
前記第１の音響フレームの前記第１のフレームエネルギーを決定すること（９０５）、および決定された前記第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶することと、
前記第２の音響フレームの復号に応答して、前記第１のスペクトル形状の決定された前記値を前記ｓｈａｐｅ_ｏｌｄバッファからｓｈａｐｅ_ｏｏｌｄバッファへ移すこと（３０３、９０９）と、
決定された前記第１のフレームエネルギーを前記Ｅ＿ｗ_ｏｌｄバッファからＥ＿ｗ_ｏｏｌｄバッファへ移すこと（３０５、９１１）と、
前記第２のスペクトル形状の決定された前記値を前記ｓｈａｐｅ_ｏｌｄバッファに記憶することと、
前記第２の音響フレームの前記第２のフレームエネルギーを決定すること（９１５）、および決定された前記第２のフレームエネルギーを前記Ｅ＿ｗ_ｏｌｄバッファに記憶することと
をさらに含む、請求項１６から２４のいずれか一項に記載のデコーダ。
前記第１のフレームエネルギーおよび前記第２のフレームエネルギーのフレームエネルギーが、

に従って決定され、ここで、Ｅ＿ｗ_ｏｏｌｄが先行するフレームエネルギーであり、Ｅ＿ｗ_ｏｌｄが、計算されている第１のフレームまたは計算されている第２のフレームのフレームエネルギーであり、ｗ_ｗｈｒが長いＦＦＴスペクトル解析ウィンドウであり、ｘ_ｐｒｅｖが、潜在的に起ころうとしている失われたフレームのための置換を作り出すために使用される時間領域プロトタイプ信号であり、Ｌ_ｐｒｏｔが前記ｘ_ｐｒｅｖ信号におけるサンプルの数である、請求項２５に記載のデコーダ。
前記命令が、前記プロセッサによって実行されると、前記装置に、
不良フレームインジケータを受け取ること（４０３、５０１）と、
前記不良フレームインジケータの受取りに応答して、前記ｓｈａｐｅ_ｏｏｌｄバッファおよび前記Ｅ＿ｗ_ｏｏｌｄエネルギーバッファをフラッシングすることと、
前記受け取った音響信号の新しい音響フレームを受け取ることと、
復号された前記新しい音響フレームからの復号されたＭＤＣＴ係数に基づいて新しいスペクトル形状の値を決定すること（５０３）、および計算された前記新しいスペクトル形状の値を前記ｓｈａｐｅ_ｏｌｄバッファおよび前記ｓｈａｐｅ_ｏｏｌｄバッファに記憶すること（４０５）であって、前記新しいスペクトル形状がある数の副帯域を含む、新しいスペクトル形状の値を記憶すること（４０５）と、
前記音響フレームの新しいフレームエネルギーを決定すること（５０５）、および計算された前記新しいフレームエネルギーを前記Ｅ＿ｗ_ｏｌｄバッファおよび前記Ｅ＿ｗ_ｏｏｌｄバッファに記憶すること（４０７）と
をさらに含む操作を実施させるさらなる命令を含む、請求項２５または２６に記載のデコーダ。
受け取った音響信号に関連する失われた音響フレームのための隠蔽方法を制御するためのコンピュータプロセッサによる方法であって、
修正離散コサイン変換（ＭＤＣＴ）に基づいて、前記受け取った音響信号の第１の音響フレームを復号すること（９０１）と、
復号された前記音響フレームからの復号されたＭＤＣＴ係数に基づいて第１のスペクトル形状の値を決定すること（３０７～３０９、９０３）、および計算された前記第１のスペクトル形状の値をｓｈａｐｅ_ｏｌｄバッファに記憶することであって、前記第１のスペクトル形状がある数の副帯域を含む、第１のスペクトル形状の値を記憶することと、
前記音響フレームの第１のフレームエネルギーを決定すること（９０５）、および計算された前記第１のフレームエネルギーをＥ＿ｗ_ｏｌｄバッファに記憶することと、
前記受け取った音響信号の第２の音響フレームを復号すること（９０７）と、
計算された前記第１のスペクトル形状の値を前記ｓｈａｐｅ_ｏｌｄバッファからｓｈａｐｅ_ｏｏｌｄバッファへ移すこと（３０３、９０９）と、
計算された前記第１のフレームエネルギーを前記Ｅ＿ｗ_ｏｌｄバッファからＥ＿ｗ_ｏｏｌｄバッファへ移すこと（３０５、９１１）と、
復号された前記第２の音響フレームからの復号されたＭＤＣＴ係数に基づいて第２のスペクトル形状の値を決定すること（３０７～３０９、９１３）、および計算された前記第２のスペクトル形状の値を前記ｓｈａｐｅ_ｏｌｄバッファに記憶することであって、前記第２のスペクトル形状が前記数の副帯域を含む、第２のスペクトル形状の値を記憶することと、
前記第２の音響フレームの第２のフレームエネルギーを決定すること（９１５）、および計算された前記第２のフレームエネルギーを前記Ｅ＿ｗ_ｏｌｄバッファに記憶することと、
前記第１のスペクトル形状および前記第１のフレームエネルギーの前記値を第１の高速フーリエ変換（ＦＦＴ）に基づくスペクトル解析の第１の表現に変換すること（９１７）、および前記第２のスペクトル形状および前記第２のフレームエネルギーの前記値を第２のＦＦＴスペクトル解析の第２の表現に変換すること（９１７）と、
前記第１の高速ＦＦＴの前記第１の表現および第２のＦＦＴの前記第２の表現に基づいて、前記失われた音響フレームのための置換フレームを作り出すために前記隠蔽方法が使用される場合に、前記失われた音響フレームのための前記置換フレームの最適以下の再構成品質をもたらし得る状態を検出すること（９１９）と、
前記状態の検出に応答して、置換フレームスペクトルのスペクトルの大きさを選択的に調整することによって前記隠蔽方法を修正すること（９２１）と
を含む、方法。