JP5265553B2

JP5265553B2 - フレーム消去回復のシステム、方法、および装置

Info

Publication number: JP5265553B2
Application number: JP2009531638A
Authority: JP
Inventors: クリシュナン、ベンカテシュ; カンドハダイ、アナンサパドマナブハン・アアサニパライ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2006-10-06
Filing date: 2007-10-07
Publication date: 2013-08-14
Anticipated expiration: 2027-10-07
Also published as: ATE548726T1; US8825477B2; CN101523484A; US20080086302A1; RU2009117181A; BRPI0717495B1; KR20090082383A; JP2010506221A; KR101092267B1; EP2423916B1; CA2663385A1; US7877253B2; BRPI0717495A2; EP2423916A3; TWI362031B; CN101523484B; US20110082693A1; WO2008043095A1; EP2070082A1; EP2423916A2

Description

関連出願

本願は、２００６年１０月６日に出願した米国仮出願第６０／８２８４１４号、弁理士整理番号第０６１６８０Ｐ１号、名称「ＳＹＳＴＥＭＳ，ＭＥＴＨＯＤＳ，ＡＮＤＡＰＰＡＲＡＴＵＳＦＯＲＦＲＡＭＥＥＲＡＳＵＲＥＲＥＣＯＶＥＲＹ」の利益を主張するものである。

本開示は、音声信号の処理に関する。

音声および音楽などのオーディオのデジタル技法による伝送は、特に長距離テレフォニ、ＶｏｉｃｅｏｖｅｒＩＰ（ＶｏＩＰとも呼ばれ、ＩＰはＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌ（インターネットプロトコル）を表す）などのパケット交換テレフォニ、およびセルラテレフォニなどのデジタルラジオテレフォニで広まってきた。そのような増殖は、再構成された音声の知覚される品質を維持しながら、伝送チャネルを介する音声通信の転送に使用される情報の量を減らすことへの関心を生み出した。例えば、使用可能な無線システム帯域幅を最もよく利用することが望ましい。システム帯域幅を効率的に使用する１つの形が信号圧縮技法を使用することである。音声信号を搬送する無線システムについて、音声圧縮（または「音声符号化」）技法が、一般にこの目的に使用されている。

人間の音声生成のモデルに関係するパラメータを抽出することによって音声を圧縮するように構成されたデバイスは、しばしば、ボコーダ、「オーディオコーダ」、または「音声コーダ」と呼ばれる。オーディオコーダは、一般に、符号器および復号器を含む。符号器は、通常、着信音声信号（オーディオ情報を表すデジタル信号）を「フレーム」と呼ばれる時間のセグメントに分割し、ある関連パラメータを抽出するために各フレームを分析し、パラメータを符号化されたフレームに量子化する。符号化されたフレームは、伝送チャネル（すなわち、有線または無線のネットワーク接続）を介して、復号器を含む受話器に伝送される。復号器は、符号化されたフレームを受け取り、処理し、パラメータを作るためにこれらを逆量子化し、逆量子化されたパラメータを使用して音声フレームを再作成する。

通常の会話では、各話者は、時間の約６０％の間は無音である。音声符号器は、通常、音声を含む音声信号のフレーム（「アクティブフレーム」）を無音または背景雑音だけを含む音声信号のフレーム（「インアクティブフレーム」）から区別するように構成される。そのような符号器は、アクティブフレームおよびインアクティブフレームを符号化するのに異なるコーディングモードおよび／またはコーディングレートを使用するように構成され得る。例えば、音声符号器は、通常、インアクティブフレームを符号化するのに、アクティブフレームの符号化より少ないビットを使用するように構成される。音声コーダは、知覚される品質の損失をほとんどまたはまったく伴わずに、より低い平均ビットレートでの音声信号の転送をサポートするために、インアクティブフレームにより低いビットレートを使用することができる。

アクティブフレームを符号化するのに使用されるビットレートの例は、１フレームあたり１７１ビット、１フレームあたり８０ビット、および１フレームあたり４０ビットを含む。インアクティブフレームを符号化するのに使用されるビットレートの例は、１フレームあたり１６ビットを含む。セルラテレフォニシステム（特に、米国バージニア州アーリントンのＴｅｌｅｃｏｍｍｕｎｉｃａｔｉｏｎｓＩｎｄｕｓｔｒｙＡｓｓｏｃｉａｔｉｏｎ社によって公表されたＩｎｔｅｒｉｍＳｔａｎｄａｒｄ（ＩＳ）−９５または類似する産業標準規格に準拠するシステム）のコンテキストでは、この４つのビットレートを、それぞれ「フルレート」、「ハーフレート」、「１／４レート」、および「１／８レート」とも称する。

セル電話機および衛星通信システムなどの音声コーダを使用する多くの通信システムは、情報を通信するために無線チャネルに依存する。そのような情報を通信する過程で、無線伝送チャネルは、マルチパスフェージングなど、誤りの深刻なソースから損害を受ける可能性がある。伝送での誤りは、「フレーム消去（frame erasure）」とも呼ばれるフレームの回復不能な破壊につながる場合がある。通常のセル電話システムでは、フレーム消去は、１〜３％の割合で発生し、５％に達するかこれを超える場合すらある。

オーディオコーディング配置（例えば、ＶｏｉｃｅｏｖｅｒＩｎｔｅｒｎｅｔＰｒｏｔｏｃｏｌすなわち「ＶｏＩＰ」）を使用するパケット交換ネットワークでのパケット消失の問題は、無線コンテキストでのフレーム消去に非常に似ている。すなわち、パケット消失に起因して、オーディオ復号器は、あるフレームの受信に失敗するか、かなりの数のビット誤りを有するフレームを受信する場合がある。どちらの場合でも、オーディオ復号器は、同一の問題すなわち、圧縮音声情報の消失にかかわらず、復号されたオーディオフレームを作る必要を提示される。この説明において、用語「フレーム消去」は、「パケット消失」を含むと見なされる。

フレーム消去は、ＣＲＣ（巡回冗長検査）関数あるいは例えば１つまたは複数の検査合計および／もしくはパリティビットを使用する他の誤り検出関数などのチェック関数の失敗に従って、復号器で検出することができる。そのような関数は、通常、チャネル復号器によって（例えば、多重通信サブレイヤ（multiplex sublayer）内で）実行され、このチャネル復号器は、畳み込み復号および／またはデインタリービングなどの作業も実行することができる。通常の復号器では、フレーム誤り検出器が、フレーム内の訂正不能な誤りの表示を受け取ったときにフレーム消去フラグをセットする。復号器を、フレーム消去フラグがそれについてセットされたフレームを処理するためにフレーム消去回復モジュールを選択するように構成することができる。

１つの構成による音声復号の方法は、符号化された音声信号内で、継続される有声音セグメントの第２フレームの消去を検出することを含む。この方法は、また、継続される有声音セグメントの第１フレームに基づいて、第２フレームの置換フレームを計算することを含む。この方法では、置換フレームの計算は、第１フレームの対応する利得値より大きい利得値を得ることを含む。

もう１つの構成による復号された音声信号のフレームを入手する方法は、符号化された音声信号の第１の符号化されたフレームおよび第１励起信号からの情報に基づいて、復号された音声信号の第１フレームを計算することを含む。この方法は、また、前記第１の符号化されたフレームに直接に続く前記符号化された音声信号のフレームの消去の表示に応答して、第２励起信号に基づいて、前記第１フレームに直接に続く前記復号された音声信号の第２フレームを計算することを含む。この方法は、また、第３励起信号に基づいて、復号された音声信号の前記第１フレームに先行する第３フレームを計算することを含む。この方法では、第１励起信号は、（Ａ）第３励起信号からの情報に基づく値の第１シーケンスと（Ｂ）第１利得係数との積に基づく。この方法では、第２フレームの計算は、第２励起信号が（Ａ）前記第１励起信号からの情報に基づく値の第２シーケンスと（Ｂ）第１利得係数より大きい第２利得係数との積に基づくように、しきい値と第１利得係数に基づく値との間の関係に従って第２励起信号を生成することを含む。

もう１つの構成による復号された音声信号のフレームを入手する方法は、第１利得係数と、値の第１シーケンスとの積に基づく第１励起信号を生成することを含む。この方法は、また、第１励起信号および符号化された音声信号の第１の符号化されたフレームからの情報に基づいて、復号された音声信号の第１フレームを計算することを含む。この方法は、また、前記第１の符号化されたフレームに直接に続く前記符号化された音声信号のフレームの消去の表示に応答して、しきい値と第１利得係数に基づく値との間の関係に従って、（Ａ）第１利得係数より大きい第２利得係数と（Ｂ）値の第２シーケンスとの積に基づいて第２励起信号を生成することを含む。この方法は、また、第２励起信号に基づいて、復号された音声信号の前記第１フレームに直接に続く第２フレームを計算することを含む。この方法は、また、第３励起信号に基づいて、復号された音声信号の前記第１フレームに先行する第３フレームを計算することを含む。この方法では、第１シーケンスは、第３励起信号からの情報に基づき、第２シーケンスは、第１励起信号からの情報に基づく。

もう１つの構成による復号された音声信号のフレームを入手する装置は、第１、第２、および第３の励起信号を生成するように構成された励起信号ジェネレータを含む。この装置は、また、（Ａ）第１励起信号および符号化された音声信号の第１の符号化されたフレームからの情報に基づいて、復号された音声信号の第１フレームを計算し、（Ｂ）第２励起信号に基づいて、復号された音声信号の前記第１フレームに直接に続く第２フレームを計算し、（Ｃ）第３励起信号に基づいて、復号された音声信号の前記第１フレームに先行する第３フレームを計算するように構成されたスペクトルシェーパを含む。この装置は、また、（Ａ）しきい値と第１利得係数に基づく値との間の関係を評価するように構成され、（Ｂ）前記第１の符号化されたフレームに直接に続く符号化された音声信号のフレームの消去の表示を受け取るように配置された論理モジュールを含む。この装置では、励起信号ジェネレータは、（Ａ）第１利得係数と（Ｂ）第３励起信号からの情報に基づく値の第１シーケンスとの積に基づいて第１励起信号を生成するように構成される。この装置では、論理モジュールは、消去の表示に応答し、評価された関係に従って、励起信号ジェネレータに、（Ａ）第１利得係数より大きい第２利得係数と（Ｂ）第１励起信号からの情報に基づく値の第２シーケンスとの積に基づいて第２励起信号を生成させるように構成される。

もう１つの構成による復号された音声信号のフレームを入手する装置は、第１利得係数と値の第１シーケンスとの積に基づく第１励起信号を生成するための手段を含む。この装置は、また、第１励起信号および符号化された音声信号の第１の符号化されたフレームからの情報に基づいて復号された音声信号の第１フレームを計算するための手段を含む。この装置は、また、前記第１の符号化されたフレームに直接に続く前記符号化された音声信号のフレームの消去の表示に応答して、しきい値と第１利得係数に基づく値との間の関係に従って、（Ａ）第１利得係数より大きい第２利得係数と（Ｂ）値の第２シーケンスとの積に基づいて第２励起信号を生成するための手段を含む。この装置は、また、第２励起信号に基づいて、復号された音声信号の前記第１フレームに直接に続く第２フレームを計算するための手段を含む。この装置は、また、第３励起信号に基づいて、復号された音声信号の前記第１フレームに先行する第３フレームを計算するための手段を含む。この装置では、第１シーケンスは、第３励起信号からの情報に基づき、第２シーケンスは、第１励起信号からの情報に基づく。

もう１つの構成によるコンピュータプログラム製品は、コンピュータ可読媒体を含み、このコンピュータ可読媒体は、少なくとも１つのコンピュータに、第１利得係数と値の第１シーケンスとの積に基づく第１励起信号を生成させるコードを含む。この媒体は、また、少なくとも１つのコンピュータに、第１励起信号および符号化された音声信号の第１の符号化されたフレームからの情報に基づいて、復号された音声信号の第１フレームを計算させるコードを含む。この媒体は、また、少なくとも１つのコンピュータに、前記第１の符号化されたフレームに直接に続く前記符号化された音声信号のフレームの消去の表示に応答して、しきい値と第１利得係数に基づく値との間の関係に従って、（Ａ）第１利得係数より大きい第２利得係数と（Ｂ）値の第２のシーケンスとの積に基づく第２励起信号を生成させるコードを含む。この媒体は、また、少なくとも１つのコンピュータに、第２励起信号に基づいて、復号された音声信号の前記第１フレームに直接に続く第２フレームを計算させるコードを含む。この媒体は、また、少なくとも１つのコンピュータに、第３励起信号に基づいて、復号された音声信号の前記第１フレームに先行する第３フレームを計算させるコードを含む。この製品では、第１シーケンスは、第３励起信号からの情報に基づき、第２シーケンスは、第１励起信号からの情報に基づく。

図１は、励起合成フィルタに基づく包括的音声復号器を示すブロック図。図２は、経時的な音声の有声音セグメントの振幅を表す図。図３は、固定コードブックおよび適応コードブックを有するＣＥＬＰ復号器を示すブロック図。図４は、ＣＥＬＰフォーマットで符号化される一連のフレームを復号するプロセスでのデータ依存性を示す図。図５は、マルチモード可変レート音声復号器の例を示すブロック図。図６は、ＣＥＬＰフレームが続くＮＥＬＰフレーム（例えば、無音または無声音の音声フレーム）のシーケンスを復号するプロセスでのデータ依存性を示す図。図７は、ＣＥＬＰフォーマットで符号化されるフレームに続くフレーム消去を処理するプロセスでのデータ依存性を示す図。図８は、ＥＶＲＣＳｅｒｖｉｃｅＯｐｔｉｏｎ３に準拠するフレーム消去の方法を示す流れ図。図９は、継続される有声音セグメントの始めを含むフレームの時間シーケンスを示す図。図１０ａは、本開示の構成による方法Ｍ１１０を示す流れ図。図１０ｂは、本開示の構成による方法Ｍ１２０を示す流れ図。図１０ｃは、本開示の構成による方法Ｍ１３０を示す流れ図。図１０ｄは、本開示の構成による方法Ｍ１４０を示す流れ図。図１１は、方法Ｍ１２０の実施態様Ｍ１８０を示す流れ図。図１２は、一構成による音声復号器の例を示すブロック図。図１３Ａは、包括的構成による復号された音声信号のフレームを入手する方法Ｍ２００を示す流れ図。図１３Ｂは、包括的構成による復号された音声信号のフレームを入手する装置Ｆ２００を示すブロック図。図１４は、方法Ｍ２００の実施形態の応用例でのデータ依存性を示す図。図１５Ａは、方法Ｍ２００の実施態様方法Ｍ２０１を示す流れ図。図１５Ｂは、図１５Ａの方法Ｍ２０１に対応する装置Ｆ２０１を示すブロック図。図１６は、方法Ｍ２０１の通常の応用例でのいくつかのデータ依存性を示す図。図１７は、方法Ｍ２０１の実施態様の応用例でのデータ依存性を示す図。図１８は、方法Ｍ２００の実施態様方法Ｍ２０３を示す流れ図。図１９は、図１８の方法Ｍ２０３の通常の応用例でのいくつかのデータ依存性を示す図。図２０は、図１８の方法Ｍ２０３の応用例のいくつかのデータ依存性を示す図。図２１Ａは、包括的構成による復号された音声信号のフレームを入手する装置Ａ１００を示すブロック図。図２１Ｂは、装置Ａ１００の通常の応用例を示す図。図２２は、論理モジュール１１０の実施態様１１２の動作を説明する論理概略図。図２３は、論理モジュール１１０の実施態様１１４の動作を示す流れ図。図２４は、論理モジュール１１０のもう１つの実施態様１１６の動作の説明を示す図。図２５は、論理モジュール１１６の実施態様１１８の動作の説明を示す図。図２６Ａは、装置Ａ１００の実施態様Ａ１００Ａを示すブロック図。図２６Ｂは、装置Ａ１００の実施態様Ａ１００Ｂを示すブロック図。図２６Ｃは、装置Ａ１００の実施態様Ａ１００Ｃを示すブロック図。図２７Ａは、励起信号ジェネレータ１２０の実施態様１２２を示すブロック図。図２７Ｂは、励起信号ジェネレータ１２２の実施態様１２４を示すブロック図。図２８は、音声パラメータカリキュレータ２３０の実施態様２３２を示すブロック図。図２９Ａは、消去検出器２１０、フォーマット検出器２２０、音声パラメータカリキュレータ２３０、および装置Ａ１００の実施態様を含むシステムの例を示すブロック図。図２９Ｂは、フォーマット検出器２２０の実施態様２２２を含むシステムを示すブロック図。

発明の詳細な説明

本明細書で説明する構成は、連続する有声音セグメントの重要フレーム（significant frame）が消去される場合に改善された性能をもたらすのに使用できるフレーム消去回復のシステム、方法、および装置を含む。代替では、継続される有声音セグメントの重要フレームを、重大フレーム（crucial frame）と表す場合がある。そのような構成を、パケット交換式（例えば、ＶｏＩＰなどのプロトコルに従って音声伝送を搬送するように配置された有線および／または無線のネットワーク）および／または回線交換式であるネットワーク内での使用に適合できることが特に企図され、本明細書によって開示される。また、そのような構成を、全帯域コーディングシステムおよびスプリットバンドコーディングシステムを含む狭帯域コーディングシステム（例えば、約４または５キロヘルツのオーディオ周波数範囲を符号化するシステム）ならびに広帯域コーディングシステム（例えば、５キロヘルツを超えるオーディオ周波数を符号化するシステム）での使用に適合できることが特に企図され、本明細書によって開示される。

文脈によって特に制限されない限り、用語「生成」は、本明細書で、計算することまたは他の形で作ることなど、その通常の意味のすべてを示すのに使用される。文脈によって特に制限されない限り、用語「計算」は、本明細書で、値のセットから計算すること、評価すること、および／または選択することなど、その通常の意味のすべてを示すのに使用される。文脈によって特に制限されない限り、用語「入手」は、計算すること、導出すること、受信すること（例えば、外部デバイスから）、および／または取り出すこと（例えば、ストレージ要素のアレイから）など、その通常の意味のすべてを示すのに使用される。用語「備える」は、本説明および特許請求の範囲で使用される場合に、他の要素または動作を除外しない。用語「に基づく」（「ＡはＢに基づく」など）は、（ｉ）「少なくとも〜に基づく」（例えば、「Ａは少なくともＢに基づく」）、および特定の文脈で適当な場合に、（ｉｉ）「と等しい」（例えば、「ＡはＢと等しい」）というケースを含む、その通常の意味のすべてを意味するのに使用される。

そうではないと示さない限り、特定の特性を有する音声復号器のすべての開示は、類似する特性を有する音声復号の方法を開示することをも特に意図され（逆も同様である）、特定の構成による音声復号器のすべての開示は、類似する構成による音声復号の方法を開示することをも特に意図される（逆も同様である）。

音声符号化において、音声信号は、通常、サンプルのストリームを得るためにデジタル化（または量子化）される。デジタル化プロセスは、例えばパルス符号変調（ＰＣＭ）、コンパンデッドミュー−ロー（companded mu-law）ＰＣＭ、およびコンパンデッドＡロー（companded A-law）ＰＣＭを含む当技術分野で既知の様々な方法のいずれかに従って実行することができる。狭帯域音声符号器は、通常、８ｋＨｚのサンプリングレートを使用するが、広帯域音声符号器は、通常、より高いサンプリングレート（例えば、１２ｋＨｚまたは１６ｋＨｚ）を使用する。

デジタル化された音声信号は、一連のフレームとして処理される。このシリーズは、通常、オーバーラップしないシリーズとして実施されるが、１フレームまたはフレームのセグメント（サブフレームとも呼ばれる）を処理する動作は、その入力内の１つまたは複数の隣接するフレームのセグメントを含むこともできる。音声信号のフレームは、通常、その信号のスペクトルエンベロープがフレームにわたって比較的静止したままになると期待できるのに十分に短い。フレームは、通常、５ミリ秒と３５ミリ秒との間の音声信号（または約４０サンプルから２００サンプルまで）に対応し、１０ミリ秒、２０ミリ秒、および３０ミリ秒が、一般的なフレームサイズである。符号化されたフレームの実際のサイズは、コーディングビットレートに伴ってフレームごとに変化する可能性がある。

２０ミリ秒のフレーム長は、７キロヘルツ（ｋＨｚ）のサンプリングレートで１４０サンプルに対応し、８ｋＨｚのサンプリングレートで１６０サンプルに対応し、１６ｋＨｚのサンプリングレートで３２０サンプルに対応するが、特定の応用例に適切と思われる任意のサンプリングレートを使用することができる。音声符号化に使用できるサンプリングレートのもう１つの例は、１２．８ｋＨｚであり、さらなる例は、１２．８ｋＨｚから３８．４ｋＨＺまでの範囲内の他のレートを含む。

通常、すべてのフレームが同一の長さを有し、均一のフレーム長が本明細書で説明する特定の例で仮定される。しかし、不均一フレーム長を使用できることも特に企図され、本明細書によって開示される。例えば、方法Ｍ１００およびＭ２００の実施態様を、アクティブフレームおよびインアクティブフレームについてならびに／あるいは有声音フレームおよび無声音フレームについて異なるフレーム長を使用する応用例に使用することもできる。

符号化されたフレームは、通常、音声信号の対応するフレームをそれから再構成できる値を含む。例えば、符号化されたフレームは、周波数スペクトルにまたがるフレーム内のエネルギの分布の記述を含む。そのようなエネルギの分布を、フレームの「周波数エンベロープ」または「スペクトルエンベロープ」とも呼ぶ。符号化されたフレームは、通常、フレームのスペクトルエンベロープを記述する値の順序付きシーケンスを含む。いくつかの場合に、順序付きシーケンスの各値は、対応する周波数でのまたは対応するスペクトル領域にわたる信号の振幅または大きさを示す。そのような記述の１つの例が、フーリエ変換係数の順序付きシーケンスである。

他の場合に、順序付きシーケンスは、コーディングモデルのパラメータの値を含む。そのような順序付きシーケンスの１つの通常の例は、線形予測符号化（ＬＰＣ）分析の係数の値のセットである。これらの係数は、符号化された音声の共鳴（「フォルマント」とも呼ばれる）を符号化し、フィルタ係数または反射係数として構成する。ほとんどの現代の音声コーダの符号化部分は、各フレームのＬＰＣ係数のセットを抽出する分析フィルタを含む。セット内の係数値（通常は１つまたは複数のベクトルとして配置される）の個数を、ＬＰＣ分析の「オーダー」とも呼ぶ。通信デバイス（セル電話機など）の音声符号器によって実行されるＬＰＣ分析の通常のオーダーの例は、４、６、８、１０、１２、１６、２０、２４、２８、および３２を含む。

スペクトルエンベロープの記述は、通常、量子化された形で（例えば、対応するルックアップテーブルまたは「コードブック」への１つまたは複数のインデックスとして）符号化されたフレーム内に現れる。したがって、復号器が、線スペクトル対（line spectral pair）(ＬＳＰ）、線スペクトル周波数（line spectral frequency）(ＬＳＦ）、イミタンススペクトル対（immittance spectral pair）(ＩＳＰ）、イミタンススペクトル周波数（immittance spectral frequency）(ＩＳＦ）、ケプストラム係数(cepstral coefficient)、または対数面積比(log area ratio)の値のセットなど、量子化についてより効率的な形でＬＰＳ係数値のセットを受け取ることが通例である。音声復号器は、通常、そのようなセットをＬＰＣ係数値の対応するセットに変換するように構成される。

図１に、励起合成フィルタを含む音声復号器の包括的な例を示す。符号化されたフレームを復号するために、逆量子化されたＬＰＣ係数値が、復号器の合成フィルタを構成するのに使用される。また、符号化されたフレームは、時間情報または、時間期間内の経時的なエネルギの分布を記述する情報を含むことができる。例えば、時間情報は、音声信号を再作成するために合成フィルタを励起するのに使用される励起信号を記述することができる。

音声信号のアクティブフレームは、有声音（例えば、母音の音を表す）、無声音（例えば、摩擦の音を表す）、または移行（例えば、単語の始めまたは終りを表す）など、複数の異なるタイプのうちの１つとして分類することができる。有声音音声のフレームは、長期の（すなわち、複数のフレーム期間にわたって継続する）周期的構造を有する傾向があり、ピッチに関連し、通常、この長期スペクトル特性の記述を符号化するコーディングモードを使用して、有声音フレーム（または有声音フレームのシーケンス）を符号化することがより効率的である。そのようなコーディングモードの例は、ｃｏｄｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ（ＣＥＬＰ）、ｐｒｏｔｏｔｙｐｅｐｉｔｃｈｐｅｒｉｏｄ（ＰＰＰ）、およびｐｒｏｔｏｔｙｐｅｗａｖｅｆｏｒｍｉｎｔｅｒｐｏｌａｔｉｏｎ（ＰＷＩ）を含む。その一方で、無声音フレームおよびインアクティブフレームは、通常、重要な長期スペクトル特性を欠き、音声符号器を、そのような特性を記述することを試みないコーディングモードを使用してこれらのフレームを符号化するように構成することができる。Ｎｏｉｓｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ（ＮＥＬＰ）が、そのようなコーディングモードの１つの例である。

図２に、経時的な有声音音声セグメント（母音など）の振幅の１つの例を示す。有声音フレームについて、励起信号は、通常、ピッチ周波数で周期的である一連のパルスに似るが、無声音フレームについて、励起信号は、通常、白色ガウス雑音に似ている。ＣＥＬＰコーダは、よりよいコーディング効率を達成するために、有声音音声セグメントの特性を示すより高い周期性を活用することができる。

ＣＥＬＰコーダは、励起信号を符号化するのに１つまたは複数のコードブックを使用するａｎａｌｙｓｉｓ−ｂｙ−ｓｙｎｔｈｅｓｉｓ音声コーダである。符号器では、１つまたは複数のコードブックエントリが選択される。復号器は、これらのエントリのコードブックインデックスを、利得係数の対応する値（１つまたは複数の利得コードブックへのインデックスとすることもできる）と一緒に受け取る。復号器は、コードブックエントリ（またはそれに基づく信号）を利得係数だけスケーリングして励起信号を入手し、この励起信号は、合成フィルタを励起し、復号された音声信号を入手するのに使用される。

いくつかのＣＥＬＰシステムは、ピッチ予測フィルタ（pitch-predictive filter）を使用して周期性をモデル化する。他のＣＥＬＰシステムは、例えば一連のパルス位置として、非周期的コンポーネントをモデル化するのに通常は使用される固定コードブック（「ｉｎｎｏｖａｔｉｖｅｃｏｄｅｂｏｏｋ」とも称する）と共に、励起信号の周期関連またはピッチ関連コンポーネントをモデル化するのに適応コードブック(adaptive codebook)（ＡＣＢ、「ピッチコードブック（pitch codebook）」とも呼ばれる）を使用する。一般に、非常に有声音のあるセグメントが、最も知覚的に関連する。適応ＣＥＬＰ方式を使用して符号化される非常に有声音のある音声フレームについて、励起信号のほとんどは、ＡＣＢによってモデル化され、このＡＣＢは、ピッチラグに対応する支配的周波数成分を有して強く周期的である。

励起信号へのＡＣＢ寄与は、現在のフレームの残差と１つまたは複数の過去のフレームからの情報との間の相関を表す。ＡＣＢは、通常、過去の音声信号のサンプルまたは音声残差信号もしくは励起信号などのその導関数を格納するメモリとして実施される。例えば、ＡＣＢは、異なる量だけ遅延された以前の残差のコピーを含むことができる。１つの例で、ＡＣＢは、前に合成された音声励起波形の異なるピッチ周期のセットを含む。

適応コーディングされるフレームの１つのパラメータが、ピッチラグ（遅延またはピッチ遅延とも呼ばれる）である。このパラメータは、一般に、フレームの自己相関関数を最大にする音声サンプルの個数として表され、分数成分を含むことができる。人間の音声のピッチ周波数は、一般に、４０Ｈｚから５００Ｈｚの範囲内であり、これは、約２００サンプルから１６サンプルまでに対応する。適応ＣＥＬＰ復号器の１つの例は、選択されたＡＣＢエントリをピッチラグだけ並進させる。この復号器は、変換エントリを補間することもできる（例えば、有限インパルス応答フィルタすなわちＦＩＲフィルタを使用して）。いくつかの場合に、ピッチラグは、ＡＣＢインデックスとして働くことができる。適応ＣＥＬＰ復号器のもう１つの例は、ピッチラグパラメータの対応する連続するが異なる値に従って適応コードブックのセグメントを平滑化する（または「タイムワープさせる」）ように構成される。

適応コーディングされたフレームのもう１つのパラメータはＡＣＢ利得（またはピッチ利得）であり、これは、長期周期性の強さを示し、通常はサブフレームごとに評価される。特定のサブフレームの励起信号に対するＡＣＢ寄与を得るために、復号器は、補間された信号（またはその対応する部分）に対応するＡＣＢ利得値を乗ずる。図３に、ｇ_ｃおよびｇ_ｐがそれぞれコードブック利得およびピッチ利得を表す、ＡＣＢを有するＣＥＬＰ復号器の１つの例のブロック図を示す。もう１つの共通するＡＣＢパラメータが、デルタ遅延(delta delay)であり、これは、現在のフレームと以前のフレームとの間の遅延の差を示し、消去されたフレームまたは破壊されたフレームのピッチラグを計算するのに使用することができる。

周知の時間領域音声コーダは、Ｌ．Ｂ．ＲａｂｉｎｅｒおよびＲ．Ｗ．Ｓｃｈａｆｅｒ著、ＤｉｇｉｔａｌＰｒｏｃｅｓｓｉｎｇｏｆＳｐｅｅｃｈＳｉｇｎａｌｓ、３９６〜４５３ページ（１９７８年）に記載のＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒＰｒｅｄｉｃｔｉｖｅ（ＣＥＬＰ）コーダである。例示的な可変レートＣＥＬＰコーダが、本発明の譲受人に譲渡され、参照によって全体的に本明細書に組み込まれている米国特許第５４１４７９６号に記載されている。ＣＥＬＰの多数の変形形態がある。代表的な例は、ＡＭＲＳｐｅｅｃｈＣｏｄｅｃ（ＡｄａｐｔｉｖｅＭｕｌｔｉ−Ｒａｔｅ、ＴｈｉｒｄＧｅｎｅｒａｔｉｏｎＰａｒｔｎｅｒｓｈｉｐＰｒｏｊｅｃｔ（３ＧＰＰ）ＴｅｃｈｎｉｃａｌＳｐｅｃｉｆｉｃａｔｉｏｎ（ＴＳ）２６．０９０、ｃｈ．４、５、および６、２００４年１２月）、ＡＭＲ−ＷＢＳｐｅｅｃｈＣｏｄｅｃ（ＡＭＲ−Ｗｉｄｅｂａｎｄ、国際電気通信連合（ＩＴＵ）−Ｔ勧告Ｇ．７２２．２、ｃｈ．５および６、２００３年７月）、およびＥＶＲＣ（Enhanced Variable Rate Codec）、米国電子工業会（ＥＩＡ）／通信工業会（ＴＩＡ）ＩｎｔｅｒｉｍＳｔａｎｄａｒｄＩＳ−１２７、ｃｈ．４およびｃｈ．５、１９９７年１月）を含む。

図４は、一連のＣＥＬＰフレームを復号するプロセスでのデータ依存性を示す。符号化されたフレームＢは適応利得係数Ｂを提供し、適応コードブックは前の励起信号Ａからの情報に基づいてシーケンスＡを提供する。復号プロセスは適応利得係数ＢおよびシーケンスＡに基づいて励起信号Ｂを生成し、励起信号Ｂは、復号されたフレームＢを作るために、符号化されたフレームＢからのスペクトル情報に従ってスペクトル的に成形される。また、復号プロセスは励起信号Ｂに基づいて適応コードブックを更新する。次の符号化されたフレームＣは適応利得係数Ｃを提供し、適応コードブックは励起信号Ｂに基づいてシーケンスＢを提供する。復号プロセスは、適応利得係数ＣおよびシーケンスＢに基づいて励起信号Ｃを生成し、励起信号Ｃは、復号されたフレームＣを作るために、符号化されたフレームＣからのスペクトル情報に従ってスペクトル的に成形される。復号プロセスは、また、異なるコーディングモード（例えば、ＮＥＬＰ）で符号化されたフレームに出会うまで、励起信号Ｃに基づいて適応コードブックを更新し、以下同様である。

可変レートコーディング方式を使用することが（例えば、ネットワーク需要と容量とのバランスをとるために）望ましい場合がある。フレームが例えば周期性または有声化に基づく分類に従って異なるモードを使用して符号化される、マルチモードコーディング方式を使用することが望ましい場合もある。例えば、音声コーダがアクティブフレームおよびインアクティブフレームについて異なるコーディングモードおよび／またはビットレートを使用することが望ましい場合がある。音声コーダが異なるタイプのアクティブフレームについてビットレートおよびコーディングモード（「コーディング方式」とも呼ばれる）の異なる組合せを使用することが望ましい場合もある。そのような音声コーダの１つの例は、有声音音声を含むフレームおよび過渡フレームにフルレートＣＥＬＰ方式を、無声音音声を含むフレームにハーフレートＮＥＬＰ方式を、インアクティブフレームに１／８レートＮＥＬＰ方式を使用する。そのような音声コーダの他の例は、フルレートおよびハーフレートのＣＥＬＰ方式ならびに／またはフルレートおよび１／４レートのＰＰＰ方式など、１つまたは複数のコーディング方式について複数のコーディングレートをサポートする。

図５は、パケットおよび対応するパケットタイプインジケータを受け取る（例えば多重通信サブレイヤから）マルチモード可変レート復号器の例のブロック図を示す。この例では、フレーム誤り検出器は、パケットタイプインジケータに従って対応するレート（または消去回復）を選択し、デパケッタイザは、パケットをディスアセンブルし、対応するモードを選択する。代替案では、正しいコーディング方式を選択するようにフレーム消去検出器が構成される。この例での使用可能なモードは、フルレートおよびハーフレートのＣＥＬＰ、フルレートおよび１／４レートのＰＰＰ（prototype pitch period、強い有声音を有するフレームに使用される）、ＮＥＬＰ（無声音フレームに使用される）、および無音を含む。復号器は、通常、量子化雑音を減らす（例えば、フォルマント周波数を強調することおよび／またはスペクトルの谷を減衰させることによって）ように構成された後フィルタ(postfilter)を含み、また、適応利得制御を含むこともできる。

図６は、ＣＥＬＰフレームが続くＮＥＬＰフレームを復号するプロセスでのデータ依存性を示す。符号化されたＮＥＬＰフレームＮを復号するために、復号プロセスは励起信号Ｎとして雑音信号を生成し、この励起信号Ｎは、復号されたフレームＮを作るために符号化されたフレームＮからのスペクトル情報に従ってスペクトル的に成形される。この例では、復号プロセスは励起信号Ｎに基づいて適応コードブックをも更新する。符号化されたＣＥＬＰフレームＣは適応利得係数Ｃを提供し、適応コードブックは励起信号Ｎに基づいてシーケンスＮを提供する。ＮＥＬＰフレームＮの励起信号とＣＥＬＰフレームＣの励起信号との間の相関は非常に小さくなる可能性が高く、シーケンスＮとフレームＣの励起信号との間の相関も非常に小さくなる可能性が高い。その結果、適応利得係数Ｃは０に近い値を有する可能性が高い。復号プロセスは、名目上は適応利得係数ＣおよびシーケンスＮに基づくが、符号化されたフレームＣからの固定コードブック情報により大きく基づく可能性が高い励起信号Ｃを生成し、励起信号Ｃは、復号されたフレームＣを作るために、符号化されたフレームＣからのスペクトル情報に従ってスペクトル的に成形される。復号プロセスは、また、励起信号Ｃに基づいて適応コードブックを更新する。

いくつかのＣＥＬＰコーダではＬＰＣ係数はフレームごとに更新されるが、ピッチラグおよび／またはＡＣＢ利得などの励起パラメータはサブフレームごとに更新される。例えば、ＡＭＲ−ＷＢではピッチラグおよびＡＣＢ利得などのＣＥＬＰ励起パラメータが４つのサブフレームのそれぞれについて１回更新される。ＥＶＲＣのＣＥＬＰモードでは、１６０サンプルフレームの３つのサブフレーム（それぞれ長さ５３サンプル、５３サンプル、および５４サンプル）のそれぞれが、対応するＡＣＢ利得値およびＦＣＢ利得値ならびに対応するＦＣＢインデックスを有する。単一のコーデック内の異なるモードが、フレームを別個に処理することもできる。ＥＶＲＣコーデックでは、例えば、ＣＥＬＰモードは３つのサブフレームを有するフレームに従って励起信号を処理するが、ＮＥＬＰモードは４つのサブフレームを有するフレームに従って励起信号を処理する。２つのサブフレームを有するフレームに従って励起信号を処理するモードも存在する。

可変レート音声復号器を、符号化されたフレームのビットレートをフレームエネルギなどの１つまたは複数のパラメータから判定するように構成することができる。いくつかの応用例で、コーディングシステムは、符号化されたフレームのビットレートがコーディングモードをも示すように、特定のビットレートについて１つのコーディングモードだけを使用するように構成される。他の場合に、符号化されたフレームが、そのフレームがそれに従って符号化されたコーディングモードを識別する１つまたは複数のビットのセットなどの情報を含むことができる。そのようなビットのセットを、「コーディングインデックス」とも呼ぶ。いくつかの場合に、コーディングインデックスは、コーディングモードを明示的に示すことができる。他の場合に、コーディングインデックスは、例えば別のコーディングモードについて無効になるはずの値を示すことによって、コーディングモードを暗黙のうちに示すことができる。この説明および添付の特許請求の範囲では、用語「フォーマット」または「フレームフォーマット」は、コーディングモードをそこから判定できる符号化されたフレームの１つまたは複数の態様を示すのに使用され、この態様は、上で説明したように、ビットレートおよび／またはコーディングインデックスを含むことができる。

図７は、ＣＥＬＰフレームに続くフレーム消去を処理するプロセスでのデータ依存性を示す。図４と同様に、符号化されたフレームＢは適応利得係数Ｂを提供し、適応コードブックは前の励起信号Ａからの情報に基づいてシーケンスＡを提供する。復号プロセスは適応利得係数ＢおよびシーケンスＡに基づいて励起信号Ｂを生成し、この励起信号Ｂは復号されたフレームＢを作るために、符号化されたフレームＢからのスペクトル情報に従ってスペクトル的に成形される。また、復号プロセスは、励起信号Ｂに基づいて適応コードブックを更新する。次の符号化されたフレームが消去されていることの表示に応答して、復号プロセスは前のコーディングモード（すなわち、ＣＥＬＰ）での動作を継続し、適応コードブックが励起信号Ｂに基づいてシーケンスＢを提供するようにする。この場合に、復号プロセスは適応利得係数ＢおよびシーケンスＢに基づいて励起信号Ｘを生成し、励起信号Ｘは、復号されたフレームＸを作るために、符号化されたフレームＢからのスペクトル情報に従ってスペクトル的に成形される。

図８は、３ＧＰＰ２標準規格Ｃ．Ｓ００１４−Ａｖ１．０（ＥＶＲＣＳｅｒｖｉｃｅＯｐｔｉｏｎ３）、ｃｈ．５、２００４年４月に準拠するフレーム消去回復の方法の流れ図を示す。米国特許出願公開第２００２／０１２３８８７号（Ｕｎｎｏ）に、ＩＴＵ−Ｔ勧告Ｇ．７２９による類似するプロセスが記載されている。そのような方法は、例えば、図５に示されたフレーム誤り回復モジュールによって実行することができる。この方法は、現在のフレームが使用不能であること（例えば、現在のフレームのフレーム消去フラグ［ＦＥＲ（ｍ）］の値がＴＲＵＥであること）の検出から開始される。タスクＴ１１０は、前のフレームも使用不能であるかどうかを判定する。この実施態様では、タスクＴ１１０は、前のフレームのフレーム消去フラグ［ＦＥＲ（ｍ−１）］の値もＴＲＵＥであるかどうかを判定する。

前のフレームが消去されなかった場合に、タスクＴ１２０は、現在のフレームの平均適応コードブック利得［ｇ_ｐａｖｇ（ｍ）］の値に、前のフレームの平均適応コードブック利得［ｇ_ｐａｖｇ（ｍ−１）］の値をセットする。そうでない場合（すなわち、前のフレームも消去された場合）に、タスクＴ１３０は、現在のフレームの平均ＡＣＢ利得［ｇ_ｐａｖｇ（ｍ）］の値に、前のフレームの平均ＡＣＢ利得［ｇ_ｐａｖｇ（ｍ−１）］の減衰されたバージョンをセットする。この例では、タスクＴ１３０は、平均ＡＣＢ利得にｇ_ｐａｖｇ（ｍ−１）の値の０．７５倍をセットする。次に、タスクＴ１４０は、現在のフレームのサブフレームのＡＣＢ利得［ｇ_ｐ（ｍ．ｉ）、ただしｉ＝０，１，２］の値にｇ_ｐａｖｇ（ｍ）の値をセットする。通常、ＦＣＢ利得係数には、消去されたフレームについて０がセットされる。３ＧＰＰ２標準規格Ｃ．Ｓ００１４−Ｃｖ１．０のセクション５．２．３．５に、ＥＶＲＣＳｅｒｖｉｃｅＯｐｔｉｏｎ６８に関するこの方法の変形形態が記載され、この場合に、現在のフレームのサブフレームのＡＣＢ利得［ｇ_ｐ（ｍ．ｉ）、ただしｉ＝０，１，２］の値には、前のフレームが消去されたか無音またはＮＥＬＰフレームとして処理された場合に０がセットされる。

フレーム消去に続くフレームは、メモリレスシステムまたはメモリレスコーディングモードでのみ誤りなしで復号することができる。１つまたは複数の過去のフレームへの相関を活用するモードについて、フレーム消去は、誤りを後続フレームに伝搬させる可能性がある。例えば、適応復号器の状態変数が、フレーム消去から回復するのにいくらかの時間を必要とする場合がある。ＣＥＬＰコーダについて、適応コードブックは強いフレーム間依存性を導入し、通常、そのような誤り伝搬の主な原因である。その結果、タスクＴ１２０のように以前の平均より高くはないＡＣＢ利得を使用すること、あるいは、タスクＴ１３０のようにＡＣＢ利得を減衰させることさえも、通常である。しかし、ある種の場合に、そのような実践が後続フレームの再作成に悪影響する場合がある。

図９は、継続される有声音セグメントが続く非有声音セグメントを含むフレームのシーケンスの例を示す。そのような継続される有声音セグメントは、「ｃｒａｚｙ」または「ｆｅｅｌ」などの単語で発生し得る。この図に示されているように、継続される有声音セグメントの最初のフレームは、過去への少ない依存を有する。具体的に言うと、そのフレームが適応コードブックを使用して符号化される場合に、そのフレームの適応コードブック利得値は小さくなる。継続される有声音セグメント内のフレームの残りについて、ＡＣＢ利得値は、隣接するフレームの間の強い相関の結果として、通常、大きい。

そのような状況で、継続される有声音セグメントの２番目のフレームが消去される場合に、問題が生じる場合がある。このフレームは、前のフレームへの強い依存を有するので、その適応コードブック利得値は大きくなければならず、周期的成分を強化する。しかし、フレーム消去回復は、通常、先行するフレームから消去されたフレームを再構成するので、回復されるフレームは小さい適応コードブック利得値を有し、前の有声音フレームからの寄与が不適切に小さくなる。この誤りが、次の複数のフレームを通って伝搬される場合がある。そのような理由から、継続される有声音セグメントの２番目のフレームを重要フレームとも呼ぶ。その代わりに、継続される有声音セグメントの２番目のフレームを重大フレームと呼ぶ場合もある。

図１０ａ、１０ｂ、１０ｃ、および１０ｄに、本開示のそれぞれの構成による方法Ｍ１１０、Ｍ１２０、Ｍ１３０、およびＭ１４０の流れ図を示す。これらの方法の最初のタスクは、（タスクＴ１１、Ｔ１２、およびＴ１３）フレーム消去に先行する２つのフレームでのモードの１つまたは複数の特定のシーケンスを検出し、あるいは（タスクＴ１４）継続される有声音セグメントの重要フレームの消去を検出する。タスクＴ１１、Ｔ１２、およびＴ１３では、１つまたは複数の特定のシーケンスは、通常、これらのフレームがそれに従って符号化されるモードを参照して判定される。

方法Ｍ１１０では、タスクＴ１１は、シーケンス（非有声音フレーム、有声音フレーム、フレーム消去）を検出する。「非有声音フレーム」というカテゴリは、無音フレーム（すなわち、背景雑音）ならびに摩擦音などの無声音フレームを含むことができる。例えば、カテゴリ「無声音フレーム」を、ＮＥＬＰモードまたは無音モード（通常はＮＥＬＰモードでもある）のいずれかで符号化されるフレームを含むように実施することができる。図１０ｂに示されているように、「有声音フレーム」というカテゴリを、タスクＴ１２で、ＣＥＬＰモードを使用して符号化されるフレームに制限することができる（例えば、１つまたは複数のＰＰＰモードをも有する復号器で）。このカテゴリを、さらに、適応コードブックを有するＣＥＬＰモードを使用して符号化されるフレームに制限することもできる（例えば、固定コードブックだけを有するＣＥＬＰモードをもサポートする復号器で）。

方法Ｍ１３０のタスクＴ１３は、フレーム内で使用される励起信号に関してターゲットシーケンスの特性を表し、第１フレームは、非周期的励起（例えば、ＮＥＬＰコーディングまたは無音コーディングで使用されるランダム励起）を有し、第２フレームは、適応的で周期的な励起（例えば、適応コードブックを有するＣＥＬＰモードで使用される）を有する。もう１つの例で、タスクＴ１３は検出されるシーケンスが励起信号を有しない第１フレームをも含むように実施される。方法Ｍ１４０のタスクＴ１４は継続される有声音セグメントの重要フレームの消去を検出するが、シーケンス（ＮＥＬＰフレームまたは無音フレーム、ＣＥＬＰフレーム）に直接に続くフレーム消去を検出するように実施することができる。

タスクＴ２０は、消去の前のフレームに少なくとも部分的に基づいて利得値を入手する。例えば、入手される利得値は、消去されたフレームについて予測される（例えば、フレーム消去回復モジュールによって）利得値とすることができる。特定の例で、利得値は、フレーム消去回復モジュールによって消去されたフレームについて予測される励起利得値（ＡＣＢ利得値など）である。図８のタスクＴ１１０からＴ１４０までに、複数のＡＣＢ値が消去に先行するフレームに基づいて予測される１つの例を示す。

示されたシーケンス（または複数の示されたシーケンスのうちの１つ）が検出される場合に、タスクＴ３０は入手された利得値をしきい値と比較する。入手された利得値がしきい値未満である（代替案ではしきい値を超えない）場合に、タスクＴ４０は入手された利得値を増やす。例えば、タスクＴ４０を入手された利得値に正の値を加算するように、あるいは入手された利得値に１より大きい係数を乗じるように構成することができる。代替案では、タスクＴ４０を入手された利得値を１つまたは複数のより大きい値に置換するように構成することができる。

図１１に、方法Ｍ１２０の構成Ｍ１８０の流れ図を示す。タスクＴ１１０、Ｔ１２０、Ｔ１３０、およびＴ１４０は、上で説明したとおりである。ｇ_ｐａｖｇ（ｍ）の値がセットされた（タスクＴ１２０またはＴ１３０）後に、タスクＮ２１０、Ｎ２２０、およびＮ２３０が、現在のフレームおよび最近のヒストリに関するある種の条件をテストする。タスクＮ２１０は、前のフレームがＣＥＬＰフレームとして符号化されたかどうかを判定する。タスクＮ２２０は、前のフレームの前のフレームが非有声音フレームとして（例えばＮＥＬＰまたは無音として）符号化されたかどうかを判定する。タスクＮ２３０は、ｇ_ｐａｖｇ（ｍ）の値がしきい値Ｔ_ｍａｘより小さいかどうかを判定する。タスクＮ２１０、Ｎ２２０、およびＮ２３０のいずれかの結果が否定である場合には、タスクＴ１４０が、上で説明したように実行される。そうでない場合には、タスクＮ２４０が、新しい利得プロファイルを現在のフレームに割り当てる。

図１１に示された特定の例では、タスクＮ２４０は、値Ｔ１、Ｔ２、およびＴ３を、それぞれｉ＝０，１，２のｇ_ｐ（ｍ．ｉ）の値に割り当てる。これらの値は、Ｔ１≧Ｔ２≧Ｔ３になるように配置することができ、これは、一定または減少のいずれかである利得プロファイルをもたらし、Ｔ１はＴ_ｍａｘに近い（または等しい）。

タスクＮ２４０の他の実施態様を、ｇ_ｐ（ｍ．ｉ）の１つまたは複数の値にそれぞれの利得係数（少なくとも１つは１より大きい）または共通の利得係数を乗じるか、ｇ_ｐ（ｍ．ｉ）の１つまたは複数の値に正のオフセットを加算するように構成することができる。その場合に、ｇ_ｐ（ｍ．ｉ）の各値に上限（例えば、Ｔ_ｍａｘ）を課すことが望ましい場合がある。タスクＮ２１０からＮ２４０までを、フレーム消去回復モジュール内のハードウェア、ファームウェア、および／またはソフトウェアルーチンとして実施することができる。

いくつかの技法で、消去されたフレームは、１つまたは複数の以前のフレーム中およびおそらくは１つまたは複数の続くフレーム中に受け取られる情報から外挿される。いくつかの構成で、以前のフレームと将来のフレームとの両方の音声パラメータが、消去されたフレームの再構成に使用される。この場合に、タスクＴ２０を、消去の前のフレームと消去の後のフレームとの両方に基づいて、入手される利得値を計算するように構成することができる。それに加えて、またはその代わりに、タスクＴ４０の実施態様（例えば、タスクＮ２４０）は、利得プロファイルを選択するために将来のフレームからの情報を使用することができる（例えば、利得値の補間を介して）。例えば、タスクＴ４０のそのような実施態様は、減少する利得プロファイルの代わりに一定のまたは増加する利得プロファイルを、あるいは一定の利得プロファイルの代わりに増加する利得プロファイルを選択することができる。この種の構成は、将来のフレームがそのような使用に使用可能であるかどうかを示すために、ジッタバッファ(jitter buffer)を使用することができる。

図１２は、一構成によるフレーム消去回復モジュール１００を含む音声復号器のブロック図を示す。そのようなモジュール１００が、本明細書に記載の方法Ｍ１１０、Ｍ１２０、Ｍ１３０、またはＭ１８０を実行するように構成される。

図１３Ａに、タスクＴ２１０、Ｔ２２０、Ｔ２３０、Ｔ２４０、Ｔ２４５、およびＴ２５０を含む、包括的構成による復号された音声信号のフレームを入手する方法Ｍ２００の流れ図を示す。タスクＴ２１０は、第１励起信号を生成する。第１励起信号に基づいて、タスクＴ２２０は、復号された音声信号の第１フレームを計算する。タスクＴ２３０は、第２励起信号を生成する。第２励起信号に基づいて、タスクＴ２４０は、復号された音声信号の第１フレームに直接に続く第２フレームを計算する。タスクＴ２４５は、第３励起信号を生成する。特定の応用例に応じて、タスクＴ２４５を、生成された雑音信号および／または適応コードブックからの情報に基づいて（例えば、１つまたは複数の以前の励起信号からの情報に基づいて）第３励起信号を生成するように構成することができる。第３励起信号に基づいて、タスクＴ２５０は、復号された音声信号の第１フレームに直接に先行する第３フレームを計算する。図１４に、方法Ｍ２００の通常の応用例でのデータ依存性の一部を示す。

タスクＴ２１０は、符号化された音声信号の第１の符号化されたフレームが第１フォーマットを有することの表示に応答して実行される。第１フォーマットは、そのフレームが過去の励起情報の記憶に基づく励起信号を使用して（例えば、ＣＥＬＰコーディングモードを使用して）復号されなければならないことを示す。第１の符号化されたフレームのビットレートで１つのコーディングモードのみを使用するコーディングシステムについて、ビットレートの判定をコーディングモードの判定に充分とすることができ、ビットレートの表示がフレームフォーマットをも示すように働くことができる。

第１の符号化されたフレームのビットレートで複数のコーディングモードを使用するコーディングシステムについて、符号化されたフレームは、コーディングモードを識別する１つまたは複数のビットのセットなど、コーディングインデックスを含むことができる。この場合に、フォーマット表示は、コーディングインデックスの判定に基づくものとすることができる。いくつかの場合に、コーディングインデックスはコーディングモードを明示的に示すことができる。他の場合に、コーディングインデックスは、例えば別のコーディングモードについて無効になるはずの値を示すことによって、コーディングモードを暗黙のうちに示すことができる。

フォーマット表示に応答して、タスクＴ２１０は値の第１シーケンスに基づいて第１励起信号を生成する。値の第１シーケンスは、第３励起信号のセグメントなど、第３励起信号からの情報に基づく。第１シーケンスと第３励起信号との間のこの関係は、図１３Ａでは点線によって示される。通常の例では、第１シーケンスは、第３励起信号の最後のサブフレームに基づく。タスクＴ２１０は、適応コードブックから第１シーケンスを取り出すことを含むことができる。

図１３Ｂに、包括的構成による復号された音声信号のフレームを入手する装置Ｆ２００のブロック図を示す。装置Ｆ２００は、図１３Ａの方法Ｍ２００の様々なタスクを実行する手段を含む。手段Ｆ２１０は第１励起信号を生成する。第１励起信号に基づいて、手段Ｆ２２０は復号された音声信号の第１フレームを計算する。手段Ｆ２３０は第２励起信号を生成する。第２励起信号に基づいて、手段Ｆ２４０は復号された音声信号の第１フレームに直接に続く第２フレームを計算する。手段Ｆ２４５は第３励起信号を生成する。特定の応用例に応じて、手段Ｆ２４５を、生成された雑音信号および／または適応コードブックからの情報に基づいて（例えば、１つまたは複数の以前の励起信号からの情報に基づいて）第３励起信号を生成するように構成することができる。第３励起信号に基づいて、手段Ｆ２５０は復号された音声信号の第１フレームに直接に先行する第３フレームを計算する。

図１４に、タスクＴ２１０が第１利得係数および第１シーケンスに基づいて第１励起信号を生成する例を示す。その場合に、タスクＴ２１０を、第１利得係数と第１シーケンスとの積に基づいて第１励起信号を生成するように構成することができる。第１利得係数は、適応利得コードブックインデックスなど、第１の符号化されたフレームからの情報に基づくものとすることができる。タスクＴ２１０を、第１励起信号に対する固定コードブック寄与を指定する情報など（例えば、１つまたは複数のコードブックインデックスおよび対応する利得係数値または利得コードブックインデックス）、第１の符号化されたフレームからの他の情報に基づいて第１励起信号を生成するように構成することができる。

第１励起信号および第１の符号化されたフレームからの情報に基づいて、タスクＴ２２０は、復号された音声信号の第１フレームを計算する。通常、第１の符号化されたフレームからの情報は、スペクトルパラメータの値のセット（例えば、１つまたは複数のＬＳＦ係数ベクトルまたはＬＰＣ係数ベクトル）を含み、タスクＴ２２０は、スペクトルパラメータ値に従って第１励起信号のスペクトルを成形するように構成される。タスクＴ２２０は、第１励起信号、第１の符号化されたフレームからの情報、および／または計算された第１フレームに対して１つまたは複数の他の処理動作（例えば、フィルタリング、平滑化、補間）を実行することをも含むことができる。

タスク２３０は、符号化された音声信号内の第１の符号化されたフレームに直接に続く符号化されたフレームの消去の表示に応答して実行される。消去の表示は、次の条件すなわち、（１）フレームが回復されるためには多すぎるビット誤りを含む、（２）フレームについて示されたビットレートが無効であるかサポートされない、（３）フレームのすべてのビットが０である、（４）フレームについて示されたビットレートが１／８レート(eighth-rate)であり、フレームのすべてのビットが１である、（５）フレームが空白であり、最後の有効なビットレートが１／８ではなかった、のうちの１つまたは複数に基づくものとすることができる。

タスクＴ２３０は、また、しきい値と第１利得値（「ベースライン利得係数値」とも呼ばれる）との間の関係に従って実行される。例えば、タスクＴ２３０を、ベースライン利得係数値がしきい値未満である（代替案ではしきい値を超えない）場合に実行されるように構成することができる。ベースライン利得係数値は、特に第１の符号化されたフレームが１つの適応コードブック利得係数だけを含む応用例について、単純に第１利得係数の値とすることができる。第１の符号化されたフレームが複数の適応コードブック利得係数（例えば、サブフレームごとの異なる係数）を含む応用例について、ベースライン利得係数値を、他の適応コードブック利得係数のうちの１つまたは複数にも基づくものとすることができる。その場合に、例えば、ベースライン利得係数値を、図１１を参照して述べた値ｇ_ｐａｖｇ（ｍ）と同様に、第１の符号化されたフレームの適応コードブック利得係数の平均値とすることができる。

タスクＴ２３０は、第１の符号化されたフレームが第１フォーマットを有することおよび第１の符号化されたフレームに先行する符号化されたフレーム（「先行するフレーム」）が第１フォーマットと異なる第２フォーマットを有することの表示に応答して実行されるものとすることもできる。第２フォーマットは、そのフレームが、雑音信号に基づく励起信号を使用して（例えば、ＮＥＬＰコーディングモードを使用して）復号されなければならないことを示す。先行するフレームのビットレートで１つのコーディングモードだけを使用するコーディングシステムについて、ビットレートの判定をコーディングモードの判定に充分とすることができ、ビットレートの表示がフレームフォーマットも示すように働くことができる。代替案では、先行するフレームがコーディングモードを示すコーディングインデックスを含むことができ、フォーマット表示をコーディングインデックスの判定に基づくものとすることができる。

タスクＴ２３０は、第１利得係数より大きい第２利得係数に基づいて第２励起信号を生成する。第２利得係数はベースライン利得係数値より大きいものとすることもできる。例えば、第２利得係数を、しきい値と等しいか、しきい値を超えるものとすることもできる。タスクＴ２３０が、一連のサブフレーム励起信号として第２励起信号を生成するように構成される場合に、第２利得係数の異なる値をサブフレーム励起信号ごとに使用することができ、少なくとも１つの値はベースライン利得係数値より大きい。その場合に、第２利得係数の異なる値がフレーム期間にわたって増えるか減るように配置されることが望ましい。

タスクＴ２３０は、通常、第２利得係数と、値の第２シーケンスとの積に基づいて第２励起信号を生成するように構成される。図１４に示されているように、第２シーケンスは、第１励起信号のセグメントのような第１励起信号からの情報に基づく。通常の例では、第２シーケンスは第１励起信号の最後のサブフレームに基づく。したがって、タスクＴ２１０を、第１励起信号からの情報に基づいて適応コードブックを更新するように構成することができる。ｒｅｌａｘａｔｉｏｎＣＥＬＰ（ＲＣＥＬＰ）コーディングモードをサポートするコーディングシステムへの方法Ｍ２００の適用について、タスクＴ２１０のそのような実施態様を、ピッチラグパラメータ(pitch lag parameter)の対応する値に従ってセグメントをタイムワープ(time-warp)させるように構成することができる。そのようなワーピング動作の例が、上で引用した３ＧＰＰ２文書Ｃ．Ｓ００１４−Ｃｖ１．０のセクション５．２．２（セクション４．１１．５への参照を伴う）に記載されている。タスクＴ２３０のさらなる実施態様は、上で説明した方法Ｍ１１０、Ｍ１２０、Ｍ１３０、Ｍ１４０、およびＭ１８０のうちの１つまたは複数を含むことができる。

第２励起信号に基づいて、タスクＴ２４０は、復号された音声信号の第１フレームに直接に続く第２フレームを計算する。図１４に示されているように、タスクＴ２４０を、上で説明したスペクトルパラメータ値のセットなど、第１の符号化されたフレームからの情報に基づいて第２フレームを計算するように構成することもできる。例えば、タスクＴ２４０を、スペクトルパラメータ値のセットに従って第２励起信号のスペクトルを成形するように構成することができる。

代替案では、タスクＴ２４０を、スペクトルパラメータ値のセットに基づくスペクトルパラメータ値の第２セットに従って第２励起信号のスペクトルを成形するように構成することができる。例えば、タスクＴ２４０を、第１の符号化されたフレームからのスペクトルパラメータ値のセットとスペクトルパラメータ値の初期セットとの平均値としてスペクトルパラメータ値の第２セットを計算するように構成することができる。加重平均としてのそのような計算の例が、上で引用した３ＧＰＰ２文書Ｃ．Ｓ００１４−Ｃｖ１．０のセクション５．２．１に記載されている。タスクＴ２４０は、第２励起信号、第１の符号化されたフレームからの情報、および計算された第２フレームのうちの１つまたは複数に対して１つまたは複数の他の処理動作（例えば、フィルタリング、平滑化、補間）を実行することをも含むことができる。

第３励起信号に基づいて、タスクＴ２５０は、復号された音声信号内で第１フレームに先行する第３フレームを計算する。タスクＴ２５０は、第１シーケンスを格納することによって適応コードブックを更新することをも含むことができ、ここで、第１シーケンスは、少なくとも第３励起信号のセグメントに基づく。ｒｅｌａｘａｔｉｏｎＣＥＬＰ（ＲＣＥＬＰ）コーディングモードをサポートするコーディングシステムへの方法Ｍ２００の適用について、タスクＴ２５０を、ピッチラグパラメータの対応する値に従ってセグメントをタイムワープさせるように構成することができる。そのようなワーピング動作の例が、上で引用した３ＧＰＰ２文書Ｃ．Ｓ００１４−Ｃｖ１．０のセクション５．２．２（セクション４．１１．５への参照を伴う）に記載されている。

符号化されたフレームのパラメータのうちの少なくともいくつかを、対応する復号されたフレームの一態様を一連のサブフレームとして記述するように配置することができる。例えば、ＣＥＬＰコーディングモードに従ってフォーマットされた符号化されたフレームが、そのフレームのスペクトルパラメータ値のセットおよびサブフレームのそれぞれの時間パラメータの別々のセット（例えば、コードブックインデックスおよび利得係数値）を含むことが一般的である。対応する復号器を、復号されたフレームをサブフレームによって増分式に計算するように構成することができる。その場合に、タスクＴ２１０を、一連のサブフレーム励起信号として第１励起信号を生成するように構成することができ、サブフレーム励起信号のそれぞれを、異なる利得係数および／またはシーケンスに基づくものとすることができる。タスクＴ２１０を、サブフレーム励起信号のそれぞれからの情報を用いて適応コードブックを直列に更新するように構成することもできる。同様に、タスクＴ２２０を、第１励起信号の異なるサブフレームに基づいて第１の復号されたフレームの各サブフレームを計算するように構成することができる。タスクＴ２２０を、フレームの間でサブフレームにまたがってスペクトルパラメータのセットを補間するか他の形で平滑化するように構成することもできる。

図１５Ａに、復号器を、適応コードブックを更新するために雑音信号に基づく励起信号（例えば、ＮＥＬＰフォーマットの表示に応答して生成された励起信号）からの情報を使用するように構成できることを示す。具体的には、図１５Ａは、タスクＴ２６０およびＴ２７０を含む方法Ｍ２００（上で述べた、図１３Ａからの）の実施態様Ｍ２０１の流れ図を示す。タスクＴ２６０は、雑音信号（例えば、白色ガウス雑音を近似する擬似乱数信号）を生成し、タスクＴ２７０は、生成された雑音信号に基づいて第３励起信号を生成する。やはり、第１シーケンスと第３励起信号との間の関係は、図１５Ａでは点線によって示される。タスクＴ２６０が、対応する符号化されたフレームからの他の情報（例えば、スペクトル情報）に基づくシード値を使用して雑音信号を生成することが望ましい場合がある。というのは、そのような技法を使用して、符号器で使用されたものと同一の雑音信号の生成をサポートできるからである。方法Ｍ２０１は、また、第３励起信号に基づいて第３フレームを計算する、タスクＴ２５０（上で論じた、図１３Ａからの）の実施態様Ｔ２５２を含む。タスクＴ２５２は、また、第１の符号化されたフレームに直接に先行し、第２フォーマットを有する符号化されたフレーム（「先行するフレーム」）からの情報に基づいて第３フレームを計算するように構成される。その場合に、タスクＴ２３０は、（Ａ）先行するフレームが第２フォーマットを有し、（Ｂ）第１の符号化されたフレームが第１フォーマットを有することの表示に基づくものとされる。

図１５Ｂに、図１５Ａに関して上で述べた方法Ｍ２０１に対応する装置Ｆ２０１のブロック図を示す。装置Ｆ２０１は、方法Ｍ２０１の様々なタスクを実行する手段を含む。様々な要素を、本明細書で開示されるタスクを実行する構造のいずれか（例えば、命令の１つまたは複数のセット、論理要素の１つまたは複数のアレイなど）を含む、そのようなタスクを実行することのできる任意の構造に従って実施することができる。図１５Ｂは、復号器を、適応コードブックを更新するために雑音信号に基づく励起信号（例えば、ＮＥＬＰフォーマットの表示に応答して生成された励起信号）からの情報を使用するように構成できることを示す。図１５Ｂの装置Ｆ２０１は、手段Ｆ２６０、Ｆ２７０、およびＦ２５２を追加された、図１３Ｂの装置Ｆ２００に類似する。手段Ｆ２６０は、雑音信号（例えば、白色ガウス雑音を近似する擬似乱数信号）を生成し、手段Ｆ２７０は、生成された雑音信号に基づいて第３励起信号を生成する。やはり、第１シーケンスと第３励起信号との間の関係は、図示の点線によって示される。手段Ｆ２６０が、対応する符号化されたフレームからの他の情報（例えば、スペクトル情報）に基づくシード値を使用して雑音信号を生成することが望ましい。というのは、そのような技法を使用して、符号器で使用されたものと同一の雑音信号の生成をサポートできるからである。装置Ｆ２０１は、手段Ｆ２５０（上で述べた、図１３Ａからの）に対応する手段Ｆ２５２をも含む。手段Ｆ２５２は、第３励起信号に基づいて第３フレームを計算する。手段Ｆ２５２を、第１の符号化されたフレームに直接に先行し、第２フォーマットを有する符号化されたフレーム（「先行するフレーム」）からの情報に基づいて第３フレームを計算するように構成することもできる。その場合に、手段Ｆ２３０を、（Ａ）先行するフレームが第２フォーマットを有し、（Ｂ）第１の符号化されたフレームが第１フォーマットを有することの表示に基づくものとすることができる。

図１６に、方法Ｍ２０１の通常の応用例でのいくつかのデータ依存性を示す。この応用例では、第１の符号化されたフレームに直接に先行する符号化されたフレーム（この図では「第２の符号化されたフレーム」として示される）が、第２フォーマット（例えば、ＮＥＬＰフォーマット）を有する。図１６に示されているように、タスクＴ２５２は、第２の符号化されたフレームからの情報に基づいて第３フレームを計算するように構成される。例えば、タスクＴ２５２を、第２の符号化されたフレームからの情報に基づくスペクトルパラメータ値のセットに従って第３励起信号のスペクトルを成形するように構成することができる。タスクＴ２５２は、第３励起信号、第２の符号化されたフレームからの情報、および計算された第３フレームのうちの１つまた複数に対して１つまた複数の他の処理動作（例えば、フィルタリング、平滑化、補間）を実行することをも含むことができる。タスクＴ２５２を、第３励起信号からの情報（例えば、第３励起信号のセグメント）に基づいて適応コードブックを更新するように構成することもできる。

音声信号は、通常、その間に話者が無音である期間を含む。符号器が、そのような期間中にインアクティブフレームのすべてより少ないフレームについて符号化されたフレームを送ることが望ましい。そのような動作を、ｄｉｓｃｏｎｔｉｎｕｏｕｓｔｒａｎｓｍｉｓｓｉｏｎ（ＤＴＸ）とも呼ぶ。１つの例で、音声符号器は、３２個の連続するインアクティブフレームの列ごとに１つの符号化されたインアクティブフレーム（「ｓｉｌｅｎｃｅｄｅｓｃｒｉｐｔｏｒ」、「ｓｉｌｅｎｃｅｄｅｓｃｒｉｐｔｉｏｎ」、またはＳＩＤとも呼ばれる）を送ることによってＤＴＸを実行する。他の例では、音声符号器は、異なる個数の連続するインアクティブフレーム（例えば、８個または１６個）の列ごとに１つのＳＩＤを送ることによって、および／またはフレームエネルギの変化もしくはスペクトルチルトなどのある他のイベントの際にＳＩＤを送ることによって、ＤＴＸを実行する。対応する復号器は、ＳＩＤ内の情報（通常、スペクトルパラメータ値および利得プロファイル）を使用して、符号化されたフレームが受け取られない後続フレーム期間のインアクティブフレームを合成する。

ＤＴＸをもサポートするコーディングシステム内で方法Ｍ２００を使用することが望ましい。図１７に、第２の符号化されたフレームがＳＩＤフレームであり、このフレームと第１の符号化されたフレームとの間のフレームが空白である（ここでは「ＤＴＸインターバル」として示される）、方法Ｍ２０１のそのような応用例でのいくつかのデータ依存性を示す。第２の符号化されたフレームをタスクＴ２５２に接続する線は、第２の符号化されたフレームからの情報（例えば、スペクトルパラメータ値）が、復号された音声信号の複数のフレームを計算するのに使用されることを示すために、破線にされている。

上で注記したように、タスクＴ２３０は、第１の符号化されたフレームに先行する符号化されたフレームが第２フォーマットを有することの表示に応答して実行され得る。図１７に示された応用例について、この第２フォーマットの表示は、第１の符号化されたフレームに直接に先行するフレームがＤＴＸのために空白にされていることの表示、またはＮＥＬＰコーディングモードが復号された音声信号の対応するフレームを計算するのに使用されることの表示とすることができる。代替案では、この第２フォーマットの表示を、第２の符号化されたフレームのフォーマットの表示（すなわち、第１の符号化されたフレームの前の最後のＳＩＤフレームのフォーマットの表示）とすることができる。

図１７は、第３フレームが、復号された音声信号内で第１フレームに直接に先行し、ＤＴＸインターバル内の最後のフレーム周期に対応する特定の例を示す。他の例では、第３フレームは、ＤＴＸインターバル内の別のフレーム周期に対応し、１つまたは複数のフレームが、復号された音声信号内で第３フレームを第１フレームから分離するようになっている。図１７には、適応コードブックがＤＴＸインターバル中に更新されない例も示されている。他の例では、ＤＴＸインターバル中に生成される１つまたは複数の励起信号が、適応コードブックを更新するのに使用される。

雑音ベースの励起信号の記憶は、後続フレームの励起信号を生成するのに有用ではない場合がある。その結果、復号器が、適応コードブックを更新するのに雑音ベースの励起信号からの情報を使用しないことが望ましい。例えば、そのような復号器を、ＮＥＬＰフレームを復号するときではなく、ＣＥＬＰフレームを復号するときだけ、またはＣＥＬＰフレーム、ＰＰＰフレーム、もしくはＰＷＩフレームを復号するときだけ、適応コードブックを更新するように構成することができる。

図１８に、タスクＴ２６０、Ｔ２８０、およびＴ２９０を含む方法Ｍ２００（図１３Ａの）の実施態様方法Ｍ２０３の流れ図を示す。タスクＴ２８０は、タスクＴ２６０によって生成された雑音信号に基づいて第４励起信号を生成する。この特定の例では、タスクＴ２１０およびＴ２８０は、実線によって示されるように、第２の符号化されたフレームが第２フォーマットを有することの表示に従って実行されるように構成される。第４励起信号に基づいて、タスクＴ２９０は第３フレームに直接に先行する復号された音声信号の第４フレームを計算する。方法Ｍ２０３は、また、タスクＴ２４５からの第３励起信号に基づいて復号された音声信号の第３フレームを計算する、タスクＴ２５０（図１３Ａの）の実施態様Ｔ２５４を含む。

タスクＴ２９０は、第１の符号化されたフレームに先行する第２の符号化されたフレームからの、スペクトルパラメータ値のセットなどの情報に基づいて第４フレームを計算する。例えば、タスクＴ２９０を、スペクトルパラメータ値のセットに従って第４励起信号のスペクトルを成形するように構成することができる。タスクＴ２５４は、第２の符号化されたフレームに先行する第３の符号化されたフレームからの、スペクトルパラメータ値のセットなどの情報に基づいて第３フレームを計算する。例えば、タスクＴ２５４を、スペクトルパラメータ値のセットに従って第３励起信号のスペクトルを成形するように構成することができる。タスクＴ２５４を、第３の符号化されたフレームが第１フォーマットを有することの表示に応答して実行されるように構成することもできる。

図１９に、方法Ｍ２０３（図１８の）の通常の応用例でのいくつかのデータ依存性を示す。この応用例では、第３の符号化されたフレームを、その励起信号が適応コードブックの更新に使用されない１つまたは複数の符号化されたフレーム（例えば、ＮＥＬＰフォーマットを有する符号化されたフレーム）だけ第２の符号化されたフレームから分離することができる。その場合に、第３および第４の符号化されたフレームは、通常、第２および第３の符号化されたフレームを分離するフレーム数と同一の個数のフレームだけ分離される。

上で注記したように、コーディングシステム内で、ＤＴＸをもサポートする方法Ｍ２００を使用することが望ましい場合がある。図２０に、第２の符号化されたフレームがＳＩＤフレームであり、このフレームと第１の符号化されたフレームとの間のフレームが空白にされる、方法Ｍ２０３（図１８の）の応用例のいくつかのデータ依存性を示す。第２の符号化されたフレームをタスクＴ２９０に接続する線は、第２の符号化されたフレームからの情報（例えば、スペクトルパラメータ値）が、復号された音声信号の複数のフレームを計算するのに使用されることを示すために、破線にされている。

上で注記したように、タスクＴ２３０は、第１の符号化されたフレームに先行する符号化されたフレームが第２フォーマットを有することの表示に応答して実行され得る。図２０に示された応用例について、この第２フォーマットの表示は、第１の符号化されたフレームに直接に先行するフレームがＤＴＸのために空白にされることの表示、またはＮＥＬＰコーディングモードが復号された音声信号の対応するフレームを計算するのに使用されることの表示とすることができる。代替案では、この第２フォーマットの表示を、第２の符号化されたフレームのフォーマットの表示（すなわち、第１の符号化されたフレームの前の最後のＳＩＤフレームのフォーマットの表示）とすることができる。

図２０は、第４フレームが、復号された音声信号内で第１フレームに直接に先行し、ＤＴＸインターバル内の最後のフレーム期間に対応する特定の例を示す。他の例では、第４フレームは、ＤＴＸインターバル内の別のフレーム期間に対応し、１つまたは複数のフレームが、復号された音声信号内で第４フレームを第１フレームから分離するようになっている。

方法Ｍ２００（図１３Ａの）の実施態様の通常の応用例では、論理要素（例えば、論理ゲート）のアレイが、この方法の様々なタスクのうちの１つ、複数、またはすべてを実行するように構成される。タスクのうちの１つまたは複数（おそらくはすべて）を、論理要素のアレイ（例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、または他の有限状態機械）を含む機械（例えば、コンピュータ）によって読み取り可能および／または実行可能であるコンピュータプログラム製品（例えば、ディスク、フラッシュメモリカード、他の不揮発性メモリカード、半導体メモリチップなどの１つまたは複数のデータ記憶媒体）内で実施されるコード（例えば、命令の１つまたは複数のセット）として実施することもできる。方法Ｍ２００（図１３Ａの）の実施態様のタスクを、複数のそのようなアレイまたは機械によって実行することもできる。これらおよび他の実施態様では、タスクを、セル電話機などの無線通信用のデバイスまたはそのような通信機能を有する他のデバイス内で実行することができる。そのようなデバイスを、回線交換ネットワークおよび／またはパケット交換ネットワークと通信する（例えば、ＶｏＩＰなどの１つまたは複数のプロトコルを使用して）ように構成することができる。例えば、そのようなデバイスは、符号化されたフレームを受信するように構成されたＲＦ回路網を含むことができる。

図２１Ａに、包括的構成による復号された音声信号のフレームを入手する装置Ａ１００のブロック図を示す。例えば、装置Ａ１００を、本明細書で説明する方法Ｍ１００またはＭ２００の実施態様を含む音声復号の方法を実行するように構成することができる。図２１Ｂに、（Ａ）符号化された音声信号の第１の符号化されたフレームと（Ｂ）符号化された音声信号内で第１の符号化されたフレームに直接に続くフレームの消去の表示とに基づいて、復号された音声信号の連続する第１および第２のフレームを計算するように構成された、装置Ａ１００の通常の応用例を示す。装置Ａ１００は、消去の表示を受け取るように配置された論理モジュール１１０と、上で説明した第１、第２、および第３の励起信号を生成するように構成された励起信号ジェネレータ１２０と、復号された音声信号の第１および第２のフレームを計算するように構成されたスペクトルシェーパ１３０とを含む。

セル電話機など、装置Ａ１００を含む通信デバイスを、有線伝送チャネル、無線伝送チャネル、または光伝送チャネルから符号化された音声信号を含む送信を受信するように構成することができる。そのようなデバイスを、搬送波信号を復調し、かつ／または、デインタリービングおよび／または誤り訂正コードの復号など、符号化された音声信号を入手するために伝送に対する前処理動作を実行するように構成することができる。そのようなデバイスは、装置Ａ１００と、二重会話の他方の音声信号の符号化および／または送信の装置（例えば、トランシーバ内）との両方の実施態様を含むこともできる。

論理モジュール１１０は、励起信号ジェネレータ１２０に第２励起信号を出力させるように構成され、配置される。第２励起信号は、ベースライン利得係数値より大きい第２利得係数に基づく。例えば、論理モジュール１１０と励起信号ジェネレータ１２０との組合せを、上で説明したタスクＴ２３０を実行するように構成することができる。

論理モジュール１１０を、複数の条件に従って複数のオプションの中から第２利得係数を選択するように構成することができる。これらの条件は、（Ａ）最も最近の(most recent)符号化されたフレームが第１フォーマット（例えば、ＣＥＬＰフォーマット）を有したこと、（Ｂ）最も最近の符号化されたフレームに先行する符号化されたフレームが第２フォーマット（例えば、ＮＥＬＰフォーマット）を有したこと、（Ｃ）現在の符号化されたフレームが消去されること、および（Ｄ）しきい値とベースライン利得係数値との間の関係が、特定の状態を有すること（例えば、しきい値がベースライン利得係数値より大きいこと）を含む。図２２に、ＡＮＤゲート１４０およびセレクタ１５０を使用する論理モジュール１１０の実施態様１１２の動作を説明する論理概略図を示す。条件のすべてが真である場合に、論理モジュール１１２は、第２利得係数を選択する。そうでない場合に、論理モジュール１１２は、ベースライン利得係数値を選択する。

図２３は、論理モジュール１１０のもう１つの実施態様１１４の動作の流れ図を示す。この例では、論理モジュール１１４は、図８に示されたタスクＮ２１０、Ｎ２２０、およびＮ２３０を実行するように構成される。論理モジュール１１４の実施態様を、図８に示されたタスクＴ１１０〜Ｔ１４０のうちの１つまたは複数（おそらくはすべて）を実行するように構成することもできる。

図２４は、状態機械を含む論理モジュール１１０のもう１つの実施態様１１６の動作の説明を示す。符号化されたフレームごとに、この状態機械は、現在の符号化されたフレームのフォーマットまたは消去の表示に従ってその状態を更新する（状態１が初期状態である）。この状態機械が、現在のフレームが消去されることの表示を受け取るときに状態３である場合に、論理モジュール１１６は、ベースライン利得係数値がしきい値より小さい（代替案では、しきい値を超えない）かどうかを決定する。この比較の結果に応じて、論理モジュール１１６は、ベースライン利得係数値または第２利得係数の中の１つを選択する。

励起信号ジェネレータ１２０を、一連のサブフレーム励起信号として第２励起信号を生成するように構成することができる。論理モジュール１１０の対応する実施態様を、サブフレーム励起信号ごとに第２利得係数の異なる値を選択するか他の形で作るように構成することができ、この値のうちの少なくとも１つは、ベースライン利得係数値より大きい。例えば、図２５に、図８に示されたタスクＴ１４０、Ｔ２３０、およびＴ２４０を実行するように構成された論理モジュール１１６の実施態様１１８の動作の説明を示す。

論理モジュール１１０を、装置Ａ１００内に含まれるまたは装置Ａ１００の外部（例えば、セル電話機などの装置Ａ１００を含むデバイス内）にある消去検出器から消去表示を受け取るように配置することができる。消去検出器２１０を、条件（１）フレームが回復されるには多すぎるビット誤りを含む、（２）フレームについて示されたビットレートが無効であるかサポートされない、（３）フレームのすべてのビットが０である、（４）フレームについて示されたビットレートが１／８レートであり、フレームのすべてのビットが１である、（５）フレームが空白であり、最後の有効なビットレートが１／８ではなかった、のうちのいずれか１つまたは複数を検出したときにフレームの消去表示を作るように構成することができる。

論理モジュール１１０のさらなる実施態様を、上で説明したフレーム消去回復モジュール１００によって実行されるものなど、消去処理の追加の態様を実行するように構成することができる。例えば、論理モジュール１１０のそのような実施態様を、ベースライン利得係数値の計算および／または第２励起信号をフィルタリングするためのスペクトルパラメータ値のセットの計算などのタスクを実行するように構成することができる。第１の符号化されたフレームが１つの適応コードブック利得係数だけを含む応用例について、ベースライン利得係数値を、単純に第１利得係数の値とすることができる。第１の符号化されたフレームが複数の適応コードブック利得係数（例えば、サブフレームごとに異なる係数）を含む応用例について、ベースライン利得係数値を、他の適応コードブック利得係数のうちの１つまたは複数にも基づくものとすることができる。その場合に、例えば、論理モジュール１１０を、第１の符号化されたフレームの適応コードブック利得係数の平均値としてベースライン利得係数値を計算するように構成することができる。

論理モジュール１１０の実施態様を、それらが励起信号ジェネレータ１２０に第２励起信号を出力させる形に従って分類することができる。論理モジュール１１０の１つのクラス１１０Ａは、第２利得係数を励起信号ジェネレータ１２０に供給するように構成された実施態様を含む。図２６Ａに、論理モジュール１１０のそのような実施態様および励起信号ジェネレータ１２０の対応する実施態様１２０Ａを含む、装置Ａ１００の実施態様Ａ１００Ａのブロック図を示す。

論理モジュール１１０のもう１つのクラス１１０Ｂは、励起信号ジェネレータ１２０に複数のオプション（例えば、入力として）の中から第２利得係数を選択させるように構成された実施態様を含む。図２６Ｂに、論理モジュール１１０のそのような実施態様および励起信号ジェネレータ１２０の対応する実施態様１２０Ｂを含む、装置Ａ１００の実施態様Ａ１００Ｂのブロック図を示す。この場合に、図２２の論理モジュール１１２内に示されたセレクタ１５０は、その代わりに励起信号ジェネレータ１２０Ｂ内に配置される。論理モジュール１１０の実施態様１１２、１１４、１１６、および１１８のいずれをも、クラス１１０Ａまたはクラス１１０Ｂに従って構成でき、配置できることが特に企図され、本明細書によって開示される。

図２６Ｃに、装置Ａ１００の実施態様Ａ１００Ｃのブロック図を示す。装置Ａ１００Ｃは、励起信号ジェネレータ１２０に複数の励起信号の中から第２励起信号を選択させるように配置された論理モジュール１１０のクラス１１０Ｂの実施態様を含む。励起信号ジェネレータ１２０Ｃは励起信号ジェネレータ１２０の２つの副実施態様１２０Ｃ１および１２０Ｃ２を含み、その一方は、第２利得係数に基づいて励起信号を生成するように構成され、他方は、もう１つの利得係数値（例えば、ベースライン利得係数値）に基づいて励起信号を生成するように構成される。励起信号ジェネレータ１２０Ｃは、第２利得係数に基づく励起信号を選択することによって、論理モジュール１１０Ｂからセレクタ１５０への制御信号に従って第２励起信号を生成するように構成される。励起信号ジェネレータ１２０のクラス１２０Ｃの構成がクラス１２０Ａまたは１２０Ｂの対応する実施態様より多くの処理サイクル、電力、および／またはストレージを消費する可能性があることに留意されたい。

励起信号ジェネレータ１２０は、第１利得および値の第１シーケンスに基づいて第１励起信号を生成するように構成される。例えば、励起信号ジェネレータ１２０を、上で説明したタスクＴ２１０を実行するように構成することができる。値の第１シーケンスは、第３励起信号のセグメントなど、第３励起信号からの情報に基づく。通常の例では、第１シーケンスは、第３励起信号の最後のサブフレームに基づく。

励起信号ジェネレータ１２０の通常の実施態様は、第１シーケンスを受け取り、格納するように構成されたメモリ（例えば、適応コードブック）を含む。図２７Ａに、そのようなメモリ１６０を含む、励起信号ジェネレータ１２０の実施態様１２２のブロック図を示す。代替案では、適応コードブックの少なくとも一部を、装置Ａ１００内または装置Ａ１００の外部の他の場所のメモリ内に配置することができ、第１シーケンスの一部（おそらくはすべて）が、励起信号ジェネレータ１２０に入力として供給されるようになる。

図２７Ａに示されているように、励起信号ジェネレータ１２０は、現在の利得係数とシーケンスとの積を計算するように構成された乗算器１７０を含むことができる。第１利得係数は、利得コードブックインデックスなど、第１の符号化されたフレームからの情報に基づくものとすることができる。その場合に、励起信号ジェネレータ１２０は、利得コードブックを、このインデックスに対応する値として第１利得係数を取り出すように構成された論理と一緒に含むことができる。励起信号ジェネレータ１２０を、適応コードブック内の第１シーケンスの位置を示す適応コードブックインデックスを受け取るように構成することもできる。

励起信号ジェネレータ１２０を、第１の符号化されたフレームからの追加情報に基づいて第１励起信号を生成するように構成することができる。そのような情報は、１つまたは複数の固定コードブックインデックスと、第１励起信号への第１コードブック寄与を指定する、対応する利得係数値または利得コードブックインデックスとを含むことができる。図２７Ｂに、生成される励起信号をそれに基づくものとすることができる他の情報を格納するように構成されたコードブック１８０（例えば、固定コードブック）と、固定コードブックシーケンスと固定コードブック利得係数との積を計算するように構成された乗算器１９０と、固定コードブック寄与と適応コードブック寄与との合計として励起信号を計算するように構成された加算器１９５とを含む、励起信号ジェネレータ１２２の実施態様１２４のブロック図を示す。励起信号ジェネレータ１２４は、対応するインデックスに従ってめいめいのコードブックからシーケンスおよび利得係数を取り出すように構成された論理をも含むことができる。

励起信号ジェネレータ１２０は、また、第２利得係数および値の第２シーケンスに基づいて第２励起信号を生成するように構成される。第２利得係数は、第１利得係数より大きく、ベースライン利得係数値より大きくすることができる。第２利得係数は、しきい値と等しくすることもでき、しきい値を超えるものとすることもできる。励起信号ジェネレータ１２０が、一連のサブフレーム励起信号として第２励起信号を生成するように構成される場合に、第２利得係数の異なる値を、サブフレーム励起信号ごとに使用することができ、この値の少なくとも１つは、ベースライン利得係数値より大きい。その場合に、第２利得係数の異なる値が、フレーム期間にわたって増えるか減るように配置されることが望ましい。

値の第２シーケンスは、第１励起信号のセグメントなど、第１励起信号からの情報に基づく。通常の例では、第２シーケンスは、第１励起信号の最後のサブフレームに基づく。したがって、励起信号ジェネレータ１２０を、第１励起信号からの情報に基づいて適応コードブックを更新するように構成することができる。ｒｅｌａｘａｔｉｏｎＣＥＬＰ（ＲＣＥＬＰ）コーディングモードをサポートするコーディングシステムへの装置Ａ１００の適用について、励起信号ジェネレータ１２０のそのような実施態様を、ピッチラグパラメータの対応する値に従ってセグメントをタイムワープさせるように構成することができる。そのようなワーピング動作の例が、上で引用した３ＧＰＰ２文書Ｃ．Ｓ００１４−Ｃｖ１．０のセクション５．２．２（セクション４．１１．５への参照を伴う）に記載されている。

励起信号ジェネレータ１２０は、第３励起信号を生成するようにも構成される。いくつかの応用例で、励起信号ジェネレータ１２０は、適応コードブック（例えば、メモリ１６０）からの情報に基づいて第３励起信号を生成するように構成される。

励起信号ジェネレータ１２０を、雑音信号に基づく励起信号（例えば、ＮＥＬＰフォーマットの表示に応答して生成される励起信号）を生成するように構成することができる。その場合に、励起信号ジェネレータ１２０を、タスクＴ２６０を実行するように構成された雑音信号ジェネレータを含むように構成することができる。雑音ジェネレータが、対応する符号化されたフレームからの他の情報（例えば、スペクトル情報）に基づくシード値を使用することが望ましい場合がある。というのは、そのような技法を使用して、符号器で使用されたものと同一の雑音信号の生成をサポートできるからである。代替案では、励起信号ジェネレータ１２０を、生成された雑音信号を受け取るように構成することができる。特定の応用例に応じて、励起信号ジェネレータ１２０を、生成された雑音信号に基づいて第３励起信号を生成する（例えば、タスクＴ２７０を実行する）ように、または生成された雑音信号に基づいて第４励起信号を生成する（例えば、タスクＴ２８０を実行する）ように構成することができる。

励起信号ジェネレータ１２０を、フレームフォーマットの表示に従って、適応コードブックからのシーケンスに基づいて励起信号を生成するか、生成された雑音信号に基づいて励起信号を生成するように構成することができる。その場合に、励起信号ジェネレータ１２０は、通常、現在のフレームが消去される場合に最後の有効なフレームのコーディングモードに従って動作を継続するように構成される。

励起信号ジェネレータ１２２は、通常、メモリ１６０内に格納されたシーケンスが前のフレームの励起信号に基づくように適応コードブックを更新するように実施される。上で注記したように、適応コードブックの更新は、ピッチラグパラメータの値に従うタイムワーピング動作を実行することを含むことができる。励起信号ジェネレータ１２２を、各フレームに（または各サブフレームにさえ）メモリ１６０を更新するように構成することができる。代替案では、励起信号ジェネレータ１２２を、メモリからの情報に基づく励起信号を使用して復号されるフレームでのみメモリ１６０を更新するように実施することができる。例えば、励起信号ジェネレータ１２２を、ＮＥＬＰフレームの励起信号からの情報に基づくのではなく、ＣＥＬＰフレームの励起信号からの情報に基づいてメモリ１６０を更新するように実施することができる。メモリ１６０が更新されないフレーム周期について、メモリ１６０の内容は、未変更のままとすることができ、あるいは、初期状態にリセットする（例えば、０をセットする）こともできる。

スペクトルシェーパ１３０は、第１励起信号と、符号化された音声信号の第１の符号化されたフレームからの情報とに基づいて、復号された音声信号の第１フレームを計算するように構成される。例えば、スペクトルシェーパ１３０を、タスクＴ２２０を実行するように構成することができる。スペクトルシェーパ１３０は、第２励起信号に基づいて、第１フレームに直接に続く復号された音声信号の第２フレームを計算するようにも構成される。例えば、スペクトルシェーパ１３０を、タスクＴ２４０を実行するように構成することができる。スペクトルシェーパ１３０は、第３励起信号に基づいて、第１フレームに先行する復号された音声信号の第３フレームを計算するようにも構成される。例えば、スペクトルシェーパ１３０を、タスクＴ２５０を実行するように構成することができる。応用例に応じて、スペクトルシェーパ１３０を、第４励起信号に基づいて、復号された音声信号の第４フレームを計算する（例えば、タスクＴ２９０を実行する）ように構成することもできる。

スペクトルシェーパ１３０の通常の実施態様は、ＬＰＣ係数値のセットなど、フレームのスペクトルパラメータ値のセットに従って構成される合成フィルタを含む。スペクトルシェーパ１３０を、本明細書で説明する音声パラメータカリキュレータからおよび／または論理モジュール１１０から（例えば、フレーム消去の場合に）スペクトルパラメータ値のセットを受け取るように配置することができる。スペクトルシェーパ１３０を、励起信号の一連の異なるサブフレームおよび／またはスペクトルパラメータ値の一連の異なるセットに従って、復号されたフレームを計算するように構成することもできる。スペクトルシェーパ１３０を、他のフィルタリング動作など、励起信号、成形された励起信号、および／またはスペクトルパラメータ値に対する１つまたは複数の他の処理動作を実行するように構成することもできる。

装置Ａ１００内に含まれるか装置Ａ１００の外部（例えば、セル電話機などの装置Ａ１００を含むデバイス内）にあるフォーマット検出器２２０を、論理モジュール１１０、励起信号ジェネレータ１２０、およびスペクトルシェーパ１３０のうちの１つまたは複数に第１のおよび他の符号化されたフレームのフレームフォーマットの表示を供給するように配置することができる。フォーマット検出器２２０は、消去検出器２１０を含むことができ、あるいは、この２つの要素を別々に実施することができる。いくつかの応用例で、コーディングシステムは、特定のビットレートについて１つのコーディングモードだけを使用するように構成される。これらの場合に、符号化されたフレームのビットレート（例えば、フレームエネルギなどの１つまたは複数のパラメータから判定される）は、フレームフォーマットをも示す。符号化されたフレームのビットレートで複数のコーディングモードを使用するコーディングシステムについて、フォーマット検出器２２０を、コーディングモードを識別する符号化されたフレーム内の１つまたは複数のビットのセットなど、コーディングインデックスからフォーマットを判定するように構成することができる。この場合に、フォーマット表示は、コーディングインデックスの判定に基づくものとすることができる。いくつかの場合に、コーディングインデックスは、コーディングモードを明示的に示すことができる。他の場合に、コーディングインデックスは、例えば別のコーディングモードについて無効になるはずの値を示すことによって、コーディングモードを暗黙のうちに示すことができる。

装置Ａ１００を、装置Ａ１００内に含まれるか装置Ａ１００の外部（例えば、セル電話機などの装置Ａ１００を含むデバイス内）にある音声パラメータカリキュレータ２３０から符号化されたフレームの音声パラメータ（例えば、スペクトルパラメータ値、適応コードブックインデックスおよび／または固定コードブックインデックス、利得係数値および／または利得コードブックインデックス）を受け取るように配置することができる。図２８に、パーサ３１０（「デパケッタイザ」とも呼ばれる）、逆量子化器３２０および３３０、ならびにコンバータ３４０を含む、音声パラメータカリキュレータ２３０の実施態様２３２のブロック図を示す。パーサ３１０は、符号化されたフレームをそのフォーマットに従って解析するように構成される。例えば、パーサ３１０を、フォーマットによって示される、フレーム内のビット位置に従ってフレーム内の様々なタイプの情報を区別するように構成することができる。

逆量子化器３２０は、スペクトル情報を逆量子化するように構成される。例えば、逆量子化器３２０は、通常、スペクトルパラメータ値のセットを入手するために、符号化されたフレームから解析されたスペクトル情報を１つまたは複数のコードブックへのインデックスとして適用するように構成される。逆量子化器３３０は、時間情報を逆量子化するように構成される。例えば、逆量子化器３３０も、通常、時間パラメータ値（例えば、利得係数値）を入手するために、符号化されたフレームから解析された時間情報を１つまたは複数のコードブックへのインデックスとして適用するように構成される。代替案では、励起信号ジェネレータ１２０を、時間情報（例えば、適応コードブックインデックスおよび／または固定コードブックインデックス）の一部またはすべての逆量子化を実行するように構成することができる。図２８に示されているように、逆量子化器３２０および３３０の一方または両方を、特定のフレームフォーマットに従って対応するフレーム情報を逆量子化するように構成することができる。というのは、異なるコーディングモードが、異なる量子化テーブルまたは量子化方式を使用する場合があるからである。

上で注記したように、ＬＰＣ係数値は、通常、量子化の前に別の形（例えば、ＬＳＰ値、ＬＳＦ値、ＩＳＰ値、および／またはＩＳＦ値）に変換される。コンバータ３４０は、逆量子化されたスペクトル情報をＬＰＣ係数値に変換するように構成される。消去されたフレームについて、音声パラメータカリキュレータ２３０の出力は、特定の設計選択に応じて、ヌル、未定義、または無変更とすることができる。図２９Ａに、消去検出器２１０、フォーマット検出器２２０、音声パラメータカリキュレータ２３０、および装置Ａ１００の実施態様を含むシステムの例のブロック図を示す。図２９Ｂに、消去検出をも実行するフォーマット検出器２２０の実施態様２２２を含む類似するシステムのブロック図を示す。

装置Ａ１００の実施態様の様々な要素（例えば、論理モジュール１１０、励起信号ジェネレータ１２０、およびスペクトルシェーパ１３０）を、所期の応用例に適すると思われる、ハードウェア、ソフトウェア、および／またはファームウェアの任意の組合せで実施することができる。例えば、そのような要素を、例えば同一チップ上またはチップセット内の複数のチップの中に存在する電子デバイスおよび／または光学デバイスとして製造することができる。そのようなデバイスの一例が、トランジスタまたは論理ゲートなどの論理要素の固定されたアレイまたはプログラマブルアレイであり、これらの要素のいずれをも、１つまたは複数のそのようなアレイとして実施することができる。これらの要素のうちの任意の複数またはすべてすら、同一の１つまたは複数のアレイ内で実施することができる。そのような１つまたは複数のアレイを、１つまたは複数のチップ内（例えば、複数のチップを含むチップセット内）で実施することができる。

本明細書で説明する装置Ａ１００の様々な実施態様の１つまたは複数の要素（例えば、論理モジュール１１０、励起信号ジェネレータ１２０、およびスペクトルシェーパ１３０）を、マイクロプロセッサ、組み込みプロセッサ、ＩＰコア、デジタル信号プロセッサ、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）、ＡＳＳＰ（application-specific standard product）、およびＡＳＩＣ（特定用途向け集積回路）など、論理要素の１つまたは複数の固定されたまたはプログラマブルなアレイ上で実行されるように配置された命令の１つまたは複数のセットとして全体的にまたは部分的に実施することもできる。装置Ａ１００の実施態様の様々な要素のいずれをも、１つまたは複数のコンピュータ（例えば、「プロセッサ」とも呼ばれる、命令の１つまたは複数のセットまたはシーケンスを実行するようにプログラムされた１つまたは複数のアレイを含む機械）として実施することもでき、これらの要素のうちの任意の複数またはすべてすら、同一のそのような１つまたは複数のコンピュータ内で実施することができる。

装置Ａ１００の実施態様の様々な要素を、セル電話機またはそのような通信機能を有する他のデバイスなど、無線通信用のデバイス内に含めることができる。そのようなデバイスを、回線交換ネットワークおよび／またはパケット交換ネットワークと通信する（例えば、ＶｏＩＰなどの１つまたは複数のプロトコルを使用して）ように構成することができる。そのようなデバイスを、デインタリービング、デパンクチャリング（de-puncturing）、１つまたは複数の畳み込み符号の復号、１つまたは複数の誤り訂正符号の復号、ネットワークプロトコル（例えば、イーサネット（登録商標）、ＴＣＰ／ＩＰ、ｃｄｍａ２０００）の１つまたは複数のレイヤの復号、無線周波数（ＲＦ）復調、および／またはＲＦ受信など、符号化されたフレームを搬送する信号に対する動作を実行するように構成することができる。

装置Ａ１００の実施態様の１つまたは複数の要素を、その装置が組み込まれるデバイスまたはシステムの別の動作に関連するタスクなど、その装置の動作に直接には関連しないタスクを実行し、または命令の他のセットを実行するのに使用することが、可能である。装置Ａ１００の実施態様の１つまたは複数の要素が、共通の構造を有することも可能である（例えば、異なるときに異なる要素に対応するコードの部分を実行するのに使用されるプロセッサ、異なるときに異なる要素に対応するタスクを実行するために実行される命令のセット、あるいは異なるときに異なる要素の動作を実行する電子デバイスおよび／または光学デバイスの配置など）。１つのそのような例では、論理モジュール１１０、励起信号ジェネレータ１２０、およびスペクトルシェーパ１３０が、同一プロセッサ上で実行されるように配置された命令のセットとして実施される。もう１つのそのような例では、これらの要素と、消去検出器２１０、フォーマット検出器２２０、および音声パラメータカリキュレータ２３０のうちの１つまたは複数（おそらくはすべて）とが、同一プロセッサ上で実行されるように配置された命令のセットとして実施される。さらなる例では、励起信号ジェネレータ１２０Ｃ１および１２０Ｃ２が、異なるときに実行される命令の同一のセットとして実施される。さらなる例では、逆量子化器３２０および３３０が、異なるときに実行される命令の同一のセットとして実施される。

セル電話機またはそのような通信機能を有する他のデバイスなどの無線通信のデバイスを、装置Ａ１００と音声符号器との両方の実施態様を含むように構成することができる。その場合に、装置Ａ１００および音声符号器が、共通の構造を有することが可能である。１つのそのような例では、装置Ａ１００および音声符号器は、同一プロセッサ上で実行されるように配置された命令のセットを含むように実施される。

説明された構成の前述の提示は、当業者が本明細書で開示される方法および他の構造を作るか使用することを可能にするために提供されるものである。図示され、本明細書で説明される流れ図、ブロック図、状態図、および他の構造は、例にすぎず、これらの構造の他の変形形態も、本開示の範囲に含まれる。これらの構成に対する様々な変更が可能であり、本明細書で提示される包括的原理を、他の構成にも適用することができる。例えば、例は、ＣＥＬＰフレームに続く消去されたフレームへの適用を主に説明するが、そのような方法、装置、およびシステムを、消去されたフレームがＰＰＰまたは他のＰＷＩコーディングモードなどの過去の励起情報の記憶に基づく励起信号を使用する別のコーディングモードに従って符号化されたフレームに続く場合に適用することもできることが、特に企図され、本明細書によって開示される。したがって、本開示は、上で示した特定の例または構成に限定されることを意図されているのではなく、最初の開示の一部を形成する、出願された添付の特許請求の範囲に含まれる、本明細書で任意の形で開示された原理および新規の特性と一貫する最も広い範囲に従わなければならない。

本明細書で説明される音声復号器および／または音声復号の方法と共に使用することができるまたはそれと共に使用されるように適合されるコーデックの例は、文書３ＧＰＰ２Ｃ．Ｓ００１４−Ｃｖｅｒｓｉｏｎ１．０、「ＥｎｈａｎｃｅｄＶａｒｉａｂｌｅＲａｔｅＣｏｄｅｃ，ＳｐｅｅｃｈＳｅｒｖｉｃｅＯｐｔｉｏｎｓ３，６８，ａｎｄ７０ｆｏｒＷｉｄｅｂａｎｄＳｐｒｅａｄＳｐｅｃｔｒｕｍＤｉｇｉｔａｌＳｙｓｔｅｍｓ」、ｃｈ．５、２００７年１月に記載のＥｎｈａｎｃｅｄＶａｒｉａｂｌｅＲａｔｅＣｏｄｅｃ（ＥＶＲＣ）と、文書ＥＴＳＩＴＳ１２６０９２Ｖ６．０．０、ｃｈ．６、２００４年１２月に記載のＡｄａｐｔｉｖｅＭｕｌｔｉＲａｔｅ（ＡＭＲ）音声コーデックと、文書ＥＴＳＩＴＳ１２６１９２Ｖ６．０．０、ｃｈ．６、２００４年１２月に記載のＡＭＲＷｉｄｅｂａｎｄ音声コーデックとを含む。

当業者は、情報および信号を、様々な異なるテクノロジおよび技法のいずれを使用しても表すことができることを理解するであろう。例えば、上の説明全体を通じて言及され得るデータ、命令、コマンド、情報、信号、ビット、および記号を、電圧、電流、電磁波、磁界、磁性粒子、光学場、光学粒子、またはこれらの任意の組合せによって表すことができる。符号化されたフレームがそれから導出される信号および復号された信号を、「音声信号」と呼ぶが、これらの信号が、アクティブフレーム中に音楽または他の非音声情報内容を搬送し得ることも、企図され、本明細書によって開示される。

当業者は、本明細書で開示される構成に関して説明された論理ブロック、モジュール、回路、および動作を、電子ハードウェア、コンピュータソフトウェア、またはこの両方の組合せとして実施できることを了解するであろう。そのような論理ブロック、モジュール、回路、および動作を、本明細書で説明する機能を実行するように設計された、汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、ＡＳＩＣ、ＦＰＧＡまたは他のプログラマブル論理デバイス、ディスクリートゲートまたはトランジスタロジック、ディスクリートハードウェアコンポーネント、あるいはそれらの任意の組合せを用いて実施し、または実行することができる。汎用プロセッサは、マイクロプロセッサとすることができるが、代替案では、プロセッサを、任意の従来のプロセッサ、コントローラ、マイクロコントローラ、または状態機械とすることができる。プロセッサは、コンピューティングデバイスの組合せとして、例えば、ＤＳＰとマイクロプロセッサとの組合せ、複数のマイクロプロセッサ、ＤＳＰコアと一緒の１つまたは複数のマイクロプロセッサ、または任意の他のそのような構成として実施することもできる。

本明細書に記載の方法およびアルゴリズムのタスクは、ハードウェア内で直接に、プロセッサによって実行されるソフトウェアモジュールで、またはこの２つの組合せで実施することができる。ソフトウェアモジュールは、ＲＡＭメモリ、フラッシュメモリ、ＲＯＭメモリ、ＥＰＲＯＭメモリ、ＥＥＰＲＯＭメモリ、レジスタ、ハードディスク、リムーバブルディスク、ＣＤ−ＲＯＭ、または当技術分野で既知の任意の他の形の記憶媒体に常駐することができる。例示的な記憶媒体は、プロセッサに結合され、プロセッサが、記憶媒体から情報を読み取り、記憶媒体に情報を書き込むことが可能になる。代替案では、記憶媒体を、プロセッサに一体とすることができる。プロセッサおよび記憶媒体は、１つのＡＳＩＣ内に存在することができる。このＡＳＩＣは、ユーザ端末内に存在することができる。代替案では、プロセッサおよび記憶媒体が、ユーザ端末内に別個のコンポーネントとして存在することができる。

本明細書で説明した構成のそれぞれを、少なくとも部分的に、ハードワイヤド回路として、特定用途向け集積回路内に製造された回路構成として、あるいは不揮発性ストレージにロードされるファームウェアプログラムまたは機械可読コードとしてデータ記憶媒体からロードされもしくはデータ記憶媒体にロードされるソフトウェアプログラムとして実施することができ、そのようなコードは、マイクロプロセッサまたは他のデジタル信号処理ユニットなどの論理要素のアレイによって実行可能な命令である。データ記憶媒体は、半導体メモリ（限定なしにダイナミックＲＡＭ（ランダムアクセスメモリ）、スタティックＲＡＭ、ＲＯＭ（読み取り専用メモリ）、および／またはフラッシュＲＡＭを含むことができる）、または強磁性体、磁気抵抗、オボニック、ポリマ、もしくは相変化メモリなどの記憶要素のアレイ、あるいは磁気ディスクまたは光ディスクなどのディスク媒体とすることができる。用語「ソフトウェア」は、ソースコード、アセンブリ言語コード、機械コード、バイナリコード、ファームウェア、マクロコード、マイクロコード、論理要素のアレイによって実行可能な命令の任意の１つまたは複数のセットまたはシーケンス、およびそのような例の任意の組合せを含むものと理解されるべきである。
以下に、本願発明の当初の特許請求の範囲に記載された発明を付記する。
［１］
復号された音声信号のフレームを入手する方法であって、
符号化された音声信号の第１の符号化されたフレームおよび第１励起信号からの情報に基づいて、前記復号された音声信号の第１フレームを計算することと、
前記第１の符号化されたフレームに直接に続く前記符号化された音声信号のフレームの消去の表示に応答して、第２励起信号に基づいて、前記第１フレームに直接に続く前記復号された音声信号の第２フレームを計算することと、
第３励起信号に基づいて、前記復号された音声信号の前記第１フレームに先行する第３フレームを計算することと、を備え、
前記第１励起信号は、（Ａ）前記第３励起信号からの情報に基づく値の第１シーケンスと（Ｂ）第１利得係数との積に基づき、
第２フレームの前記計算は、前記第２励起信号が（Ａ）前記第１励起信号からの情報に基づく値の第２シーケンスと（Ｂ）前記第１利得係数より大きい第２利得係数との積に基づくように、しきい値と前記第１利得係数に基づく値との間の関係に従って前記第２励起信号を生成することを含む、方法。
［２］
復号された音声信号のフレームを入手する方法であって、
第１利得係数と、値の第１シーケンスとの積に基づく第１励起信号を生成することと、
前記第１励起信号および符号化された音声信号の第１の符号化されたフレームからの情報に基づいて、前記復号された音声信号の第１フレームを計算することと、
前記第１の符号化されたフレームに直接に続く前記符号化された音声信号のフレームの消去の表示に応答して、しきい値と前記第１利得係数に基づく値との間の関係に従って、（Ａ）前記第１利得係数より大きい第２利得係数と（Ｂ）値の第２シーケンスとの積に基づいて第２励起信号を生成することと、
前記第２励起信号に基づいて、前記復号された音声信号の前記第１フレームに直接に続く第２フレームを計算することと、
第３励起信号に基づいて、前記復号された音声信号の前記第１フレームに先行する第３フレームを計算することと、を備え、
前記第１シーケンスは前記第３励起信号からの情報に基づき、前記第２シーケンスは前記第１励起信号からの情報に基づく、方法。
［３］
前記第２シーケンスは、少なくとも、前記第１励起信号のセグメントに基づく、［２］に記載の復号された音声信号のフレームを入手する方法。
［４］
前記第１利得係数は前記第１の符号化されたフレームからの情報に基づく、［２］に記載の復号された音声信号のフレームを入手する方法。
［５］
前記復号された音声信号の第１フレームを計算することは、第１の複数のスペクトルパラメータ値に従って前記第１励起信号を処理することを含み、前記第１の複数のスペクトルパラメータ値は前記第１の符号化されたフレームからの前記情報に基づき、
前記復号された音声信号の第２フレームを計算することは、第２の複数のスペクトルパラメータ値に従って前記第２励起信号を処理することを含み、前記第２の複数のスペクトルパラメータ値は前記第１の複数のスペクトルパラメータ値に基づく、［２］に記載の復号された音声信号のフレームを入手する方法。
［６］
前記第１励起信号を生成することは、少なくとも１つのピッチパラメータに従って前記第１シーケンスを処理することを含み、前記少なくとも１つのピッチパラメータは前記第１の符号化されたフレームからの情報に基づく、請求項２に記載の復号された音声信号のフレームを入手する方法。
［７］
前記方法は、
雑音信号を生成することと、
前記生成された雑音信号に基づいて前記第３励起信号を生成することと、
を備える、［２］に記載の復号された音声信号のフレームを入手する方法。
［８］
前記第３フレームは、前記復号された音声信号内で前記第１フレームにすぐに先行する、［７］に記載の復号された音声信号のフレームを入手する方法。
［９］
前記第３フレームを計算することは、複数のスペクトルパラメータ値に従って前記第３励起信号を処理することを含み、前記複数のスペクトルパラメータ値は前記符号化された音声信号内で前記第１の符号化されたフレームに先行する第２の符号化されたフレームからの情報に基づく、［８］に記載の復号された音声信号のフレームを入手する方法。
［１０］
少なくとも１つのフレーム周期が、前記符号化された音声信号内で前記第２の符号化されたフレームを前記第１の符号化されたフレームから分離する、［９］に記載の復号された音声信号のフレームを入手する方法。
［１１］
値の第１シーケンスに基づいて前記第１励起信号を生成することは、符号化された音声信号の第１の符号化されたフレームが第１フォーマットを有することの表示の結果として発生し、
前記生成された雑音信号に基づいて前記第３励起信号を生成することは、前記符号化された音声信号の前記第１の符号化されたフレームに先行する第２の符号化されたフレームが第２フォーマットを有することの表示の結果として発生し、
前記第２利得係数に基づいて前記第２励起信号を生成することは、（Ａ）前記第１の符号化されたフレームが前記第１フォーマットを有し（Ｂ）前記第２の符号化されたフレームが前記第２フォーマットを有することの表示の結果として発生する、請求項７に記載の復号された音声信号のフレームを入手する方法。
［１２］
値の第１シーケンスに基づいて前記第１励起信号を生成することは、前記第１の符号化されたフレームが第１フォーマットを有することの表示の結果として発生し、
前記方法は、雑音信号を生成することを備え、
前記方法は、（Ａ）前記符号化された音声信号内で前記第１の符号化されたフレームに先行する第２の符号化されたフレームからの情報および（Ｂ）前記生成された雑音信号に基づく第４励起信号に基づいて、前記復号された音声信号内で前記第３フレームにすぐに先行する第４フレームを計算することを備え、
前記第３フレームを計算することは、複数のスペクトルパラメータ値に従って前記第３励起信号を処理することを含み、前記複数のスペクトルパラメータ値は、（Ａ）前記符号化された音声信号内で前記第２の符号化されたフレームに先行し（Ｂ）前記第１フォーマットを有する第３の符号化されたフレームからの情報に基づく、請求項２に記載の復号された音声信号のフレームを入手する方法。
［１３］
前記方法は、前記第２の符号化されたフレームが第２フォーマットを有することの表示の結果として、前記生成された雑音信号に基づいて第４励起信号を生成することを備え、
前記第２利得係数に基づいて前記第２励起信号を生成することは、（Ａ）前記第１の符号化されたフレームが前記第１フォーマットを有し（Ｂ）前記第２の符号化されたフレームが前記第２フォーマットを有することの表示の結果として発生する、［１２］に記載の復号された音声信号のフレームを入手する方法。
［１４］
前記方法は、
前記第１利得係数に基づく値をしきい値と比較することと、
前記比較の結果に基づいて、（Ａ）複数の利得係数値の中から前記第２利得係数を選択することと（Ｂ）前記第１利得係数および前記第１利得係数に基づく前記値の中の少なくとも１つに基づいて前記第２利得係数を計算することとのうちの少なくとも１つを実行することと、
を備える、［２］に記載の復号された音声信号のフレームを入手する方法。
［１５］
前記復号された音声信号の前記第１フレームは複数のサブフレームを含み、前記複数のサブフレームのそれぞれは、複数のサブフレーム励起信号のうちの対応する１つに基づき、
前記複数のサブフレーム励起信号のそれぞれは、（Ａ）複数のサブフレーム利得係数のうちの対応する１つと（Ｂ）複数のサブフレームシーケンスのうちの対応する１つとの積に基づき、
前記第１励起信号は、前記複数のサブフレーム励起信号を含み、前記第１利得係数は前記複数のサブフレーム利得係数のうちの１つであり、前記第１シーケンスは前記複数のサブフレームシーケンスのうちの１つである、
［２］に記載の復号された音声信号のフレームを入手する方法。
［１６］
前記第１利得係数に基づく前記値は前記サブフレーム利得係数の平均値に基づく、［１５］に記載の復号された音声信号のフレームを入手する方法。
［１７］
前記第２利得係数は前記サブフレーム利得係数の前記平均値より大きい、［１６］に記載の復号された音声信号のフレームを入手する方法。
［１８］
復号された音声信号のフレームを入手する装置であって、
第１、第２、および第３の励起信号を生成するように構成された励起信号ジェネレータと、
（Ａ）前記第１励起信号および符号化された音声信号の第１の符号化されたフレームからの情報に基づいて、復号された音声信号の第１フレームを計算し、（Ｂ）前記第２励起信号に基づいて、前記復号された音声信号の前記第１フレームに直接に続く第２フレームを計算し、（Ｃ）前記第３励起信号に基づいて、前記復号された音声信号の前記第１フレームに先行する第３フレームを計算するように構成されたスペクトルシェーパと、
（Ａ）しきい値と第１利得係数に基づく値との間の関係を評価するように構成され、（Ｂ）前記第１の符号化されたフレームにすぐに続く符号化された音声信号のフレームの消去の表示を受け取るように配置された論理モジュールと、
を備え、
前記励起信号ジェネレータは、（Ａ）第１利得係数と（Ｂ）前記第３励起信号からの情報に基づく値の第１シーケンスとの積に基づいて前記第１励起信号を生成するように構成され、
消去の前記表示に応答し、前記評価された関係に従って、前記論理モジュールは前記励起信号ジェネレータに、（Ａ）前記第１利得係数より大きい第２利得係数と（Ｂ）前記第１励起信号からの情報に基づく値の第２シーケンスとの積に基づいて前記第２励起信号を生成させるように構成される、
装置。
［１９］
前記スペクトルシェーパは、第１の複数のスペクトルパラメータ値に基づいて前記第１フレームを計算するように構成され、前記第１の複数のスペクトルパラメータ値は前記第１の符号化されたフレームからの情報に基づき、
前記スペクトルシェーパは、第２の複数のスペクトルパラメータ値に基づいて前記第２フレームを計算するように構成され、前記第２の複数のスペクトルパラメータ値は前記第１の複数のスペクトルパラメータ値に基づく、［１８］に記載の復号された音声信号のフレームを入手する装置。
［２０］
前記論理モジュールは、前記しきい値を（Ａ）前記第１利得係数と（Ｂ）前記第１利得係数に基づく値のうちの少なくとも１つと比較することによって、前記しきい値と前記第１利得係数に基づく前記値との間の関係を評価するように構成される、［１８］に記載の復号された音声信号のフレームを入手する装置。
［２１］
前記第１の復号されたフレームは複数のサブフレームを含み、前記複数のサブフレームのそれぞれは、複数のサブフレーム励起信号のうちの対応する１つに基づき、
前記複数のサブフレーム励起信号のそれぞれは、（Ａ）複数のサブフレーム利得係数のうちの対応する１つと（Ｂ）複数のサブフレームシーケンスのうちの対応する１つとの積に基づき、
前記第１励起信号は、前記複数のサブフレーム励起信号を含み、前記第１利得係数は前記複数のサブフレーム利得係数のうちの１つであり、前記第１シーケンスは前記複数のサブフレームシーケンスのうちの１つであり、
前記第１利得係数に基づく前記値は、前記サブフレーム利得係数の平均値に基づく、［１８］に記載の復号された音声信号のフレームを入手する装置。
［２２］
前記励起信号ジェネレータは、前記第１の符号化されたフレームが第１フォーマットを有することの表示に応答して前記第１励起信号を生成するように構成され、
第３の符号化されたフレームが前記第１フォーマットと異なる第２フォーマットを有することの表示に応答して、前記励起信号ジェネレータは、生成された雑音信号に基づいて前記第３励起信号を生成するように構成され、
前記論理モジュールは、前記励起信号ジェネレータに、（Ａ）前記第１の符号化されたフレームが前記第１フォーマットを有し（Ｂ）前記第３の符号化されたフレームが前記第２フォーマットを有することの表示に応答して前記第２励起信号を生成させるように構成される、［１８］に記載の復号された音声信号のフレームを入手する装置。
［２３］
復号された音声信号のフレームを入手する装置であって、
第１利得係数と値の第１シーケンスとの積に基づく第１励起信号を生成するための手段と、
前記第１励起信号および符号化された音声信号の第１の符号化されたフレームからの情報に基づいて前記復号された音声信号の第１フレームを計算するための手段と、
前記第１の符号化されたフレームに直接に続く前記符号化された音声信号のフレームの消去の表示に応答して、しきい値と前記第１利得係数に基づく値との間の関係に従って、（Ａ）前記第１利得係数より大きい第２利得係数と（Ｂ）値の第２シーケンスとの積に基づいて第２励起信号を生成するための手段と、
前記第２励起信号に基づいて、前記復号された音声信号の前記第１フレームに直接に続く第２フレームを計算するための手段と、
第３励起信号に基づいて、前記復号された音声信号の前記第１フレームに先行する第３フレームを計算するための手段と、を備え、
前記第１シーケンスが、前記第３励起信号からの情報に基づき、前記第２シーケンスが、前記第１励起信号からの情報に基づく、装置。
［２４］
第１励起信号を生成するための前記手段は、前記第１の符号化されたフレームが第１フォーマットを有することの表示に応答して前記第１励起信号を生成するように構成され、
前記装置は、第３の符号化されたフレームが前記第１フォーマットと異なる第２フォーマットを有することの表示に応答して、生成された雑音信号に基づいて前記第３励起信号を生成するための手段を備え、
第２励起信号を生成するための前記手段は、（Ａ）前記第１の符号化されたフレームが前記第１フォーマットを有し（Ｂ）前記第３の符号化されたフレームが前記第２フォーマットを有することの表示に応答して前記第２励起信号を生成するように構成される、［２３］に記載の復号された音声信号のフレームを入手する装置。
［２５］
コンピュータ可読媒体を備えるコンピュータプログラム製品であって、前記媒体が、
少なくとも１つのコンピュータに、第１利得係数と値の第１シーケンスとの積に基づく第１励起信号を生成させるコードと、
少なくとも１つのコンピュータに、前記第１励起信号および符号化された音声信号の第１の符号化されたフレームからの情報に基づいて、前記復号された音声信号の第１フレームを計算させるコードと、
少なくとも１つのコンピュータに、前記第１の符号化されたフレームに直接に続く前記符号化された音声信号のフレームの消去の表示に応答して、しきい値と前記第１利得係数に基づく値との間の関係に従って、（Ａ）前記第１利得係数より大きい第２利得係数と（Ｂ）値の第２のシーケンスとの積に基づく第２励起信号を生成させるコードと、
少なくとも１つのコンピュータに、前記第２励起信号に基づいて、前記復号された音声信号の前記第１フレームに直接に続く第２フレームを計算させるコードと、
少なくとも１つのコンピュータに、第３励起信号に基づいて、前記復号された音声信号の前記第１フレームに先行する第３フレームを計算させるコードと、を備え、
前記第１シーケンスは前記第３励起信号からの情報に基づき、前記第２シーケンスは前記第１励起信号からの情報に基づく、コンピュータプログラム製品。

Claims

符号化された音声信号を処理する方法であって、
前記符号化された音声信号の消去されたフレームのための利得値を、前記消去されたフレームに先行する前記符号化された音声信号の第１のフレームからの情報に基づいて予測することと、
（Ａ）前記第１のフレームが第１のフォーマットにしたがって構成され、かつ、（Ｂ）前記符号化された音声信号の第１のフレームに先行する第２のフレームが前記第１のフォーマットとは異なる第２のフォーマットにしたがって構成されることを示す表示に応答して、前記予測された利得値をしきい値と比較することと、
前記比較することの結果に応答して、前記予測された利得値を増加することと、
前記増加された利得値に基づいて前記消去されたフレームのための励起信号を生成することと、
を備え、
前記第１のフォーマットは有声音フレームに対する符号化モードに関連付けられ、前記第２のフォーマットは無声音フレーム又はインアクティブフレームに対する符号化モードに関連付けられる、
方法。
前記予測される利得値は、適応コードブック利得値である、請求項１に記載の方法。
前記表示に応答して比較することは、前記表示に基づいて、前記第１および第２のフレームにおいて少なくとも１つの特定のモードのシーケンスを検出することと、前記検出することに応答して前記比較することを実行することとを備える、請求項１および２のいずれか１つに記載の方法。
前記第１のフレームが第１のフォーマットにしたがって構成されることを示す表示は、前記第１のフレームが、過去の励起情報のメモリに基づく励起信号を使用して復号されるものであることを示す、請求項１乃至３のいずれか１つに記載の方法。
前記第１のフレームが第１のフォーマットにしたがって構成されることを示す表示は、前記第１のフレームがｃｏｄｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ符号化モードを使用して復号されるものであることを示す、請求項１乃至３のいずれか１つに記載の方法。
前記第２のフレームが第２のフォーマットにしたがって構成されることを示す表示は、前記第２のフレームが非周期的励起を有することを示す、請求項１乃至３のいずれか１つに記載の方法。
前記第２のフレームが第２のフォーマットにしたがって構成されることを示す表示は、前記第２のフレームがＮｏｉｓｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ符号化モードを使用して復号されるものであることを示す、請求項１乃至３のいずれか１つに記載の方法。
前記予測される利得値を増加することは、前記予測される利得値に、前記しきい値に等しい値を割り当てることを含む、請求項１乃至７のいずれか１つに記載の方法。
前記方法は、前記比較することの結果に応答して、前記消去されたフレームのサブフレームの適応コードブック利得係数に値を割り当てることを備え、前記増加された利得値は、前記割り当てられた値のうちの１つである、請求項１乃至８のいずれか１つに記載の方法。
前記割り当てられた値は、減少する利得プロファイルとなるように配置される、請求項９に記載の方法。
請求項１乃至１０のいずれか１つに記載の方法を論理要素のアレイに実行させる命令群を記憶するコンピュータ読取可能な媒体。
符号化された音声信号を処理するための装置であって、
消去されたフレームに先行する前記符号化された音声信号の第１のフレームからの情報に基づいて、前記符号化された音声信号の消去されたフレームのための利得値を予測する手段と、
（Ａ）前記第１のフレームが第１のフォーマットにしたがって構成され、かつ、（Ｂ）前記符号化された音声信号の第１のフレームに先行する第２のフレームが、前記第１のフォーマットとは異なる第２のフォーマットにしたがって構成されることを示す表示に応答して、前記予測された利得値をしきい値と比較する手段と、
前記比較することの結果に応答して、前記予測された利得値を増加する手段と、
前記増加された利得値に基づく前記消去されたフレームのための励起信号を生成する手段と、
を備え、
前記第１のフォーマットは有声音フレームに対する符号化モードに関連付けられ、前記第２のフォーマットは無声音フレーム又はインアクティブフレームに対する符号化モードに関連付けられる、
る装置。
前記予測される利得値は、適応コードブック利得値である、請求項１２に記載の装置。
前記比較する手段は、前記表示に基づいて、前記第１および第２のフレームにおいて、少なくとも１つの特定のモードのシーケンスを検出し、前記検出することに応答して前記比較することを実行する手段を備える、請求項１２および１３のいずれか１つに記載の装置。
前記第１のフレームが第１のフォーマットにしたがって構成されることを示す表示は、前記第１のフレームが、過去の励起情報のメモリに基づく例示信号を使用して復号されるものであることを示す、請求項１２乃至１４のいずれか１つに記載の装置。
前記第２のフレームが第２のフォーマットにしたがって構成されることを示す表示は、前記第２のフォーマットが非周期的励起を有することを示す、請求項１２乃至１４のいずれか１つに記載の装置。
前記第２のフレームが第２のフォーマットにしたがって構成されることを示す表示は、前記第２のフレームがＮｏｉｓｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ符号化モードを使用して復号されるものであることを示す、請求項１２乃至１４のいずれか１つに記載の装置。
前記予測される利得値を増加する手段は、前記予測される利得値に、前記しきい値に等しい値を割り当てる手段を含む、請求項１２乃至１７のいずれか１つに記載の装置。
符号化された音声信号を処理するための装置であって、
前記符号化された音声信号の消去されたフレームのための利得値を、前記消去されたフレームに先行する前記符号化された音声信号の第１のフレームからの情報に基づいて予測し、
（Ａ）前記第１のフレームが第１のフォーマットにしたがって構成され、かつ、（Ｂ）前記符号化された音声信号の前記第１のフレームに先行する第２のフレームが前記第１のフォーマットとは異なる第２のフォーマットにしたがって構成されることを示す表示に応答して、前記予測された利得値をしきい値と比較し、
前記比較することの結果に応答して、前記利得値を増加する
ように構成された論理モジュールと、
前記増加された利得値に基づく前記消去されたフレームのための励起信号を生成するように構成された励起信号ジェネレータと、
を備え、
前記第１のフォーマットは有声音フレームに対する符号化モードに関連付けられ、前記第２のフォーマットは無声音フレーム又はインアクティブフレームに対する符号化モードに関連付けられる、
装置。
前記予測される利得値は、適応コードブック利得値である請求項１９に記載の装置。
前記論理モジュールは、前記表示に基づいて、前記第１および第２のフレームにおける少なくとも１つの特定のモードのシーケンスを検出し、前記検出することに応答して前記比較することを実行するように構成される、請求項１９および２０のいずれか１つに記載の装置。
前記第１のフレームが第１のフォーマットにしたがって構成されることを示す表示は、前記第１のフレームが、過去の励起情報のメモリに基づく励起信号を使用して復号されるものであることを示す、請求項１９乃至２１のいずれか１つに記載の装置。
前記第２のフレームが第２のフォーマットに従って構成されることを示す表示は、前記第２のフレームが非周期的励起を有することを示す、請求項１９乃至２１のいずれか１つに記載の装置。
前記第２のフレームが第２のフォーマットにしたがって構成されることを示す表示は、前記第２のフレームがＮｏｉｓｅ−ｅｘｃｉｔｅｄｌｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ符号化モードを使用して復号されるものであることを示す、請求項１９乃至２１のいずれか１つに記載の装置。
前記論理モジュールは、前記予測される利得値に、しきい値に等しい値を割り当てることによって、前記予測される利得値を増加するように構成される、請求項１９乃至２４のいずれか１つに記載の装置。