JP5618826B2

JP5618826B2 - Ｉｔｕ．ｔ勧告ｇ．７１１と相互運用可能なｐｃｍコーデックにおいてフレーム消失を補償する装置および方法

Info

Publication number: JP5618826B2
Application number: JP2010511454A
Authority: JP
Inventors: ウラジミール・マレノフスキー; レドワン・サラミ
Original assignee: ヴォイスエイジ・コーポレーション
Priority date: 2007-06-14
Filing date: 2007-12-24
Publication date: 2014-11-05
Anticipated expiration: 2027-12-24
Also published as: CN101765879B; WO2008151408A1; US20110022924A1; JP2010530078A; JP2009541815A; WO2008151408A8; US20110173004A1; EP2160733A4; JP5161212B2; WO2008151410A1; CN101765879A; EP2160733A1

Description

本発明は、損失フレームを補償し復元する装置および方法に関する。排他的にではないが、より詳細には、本発明は、ＩＴＵ．Ｔ勧告Ｇ．７１１と相互運用可能な多層埋め込みコーデックでの損失フレームを補償し復元する装置および方法に関し、そのために、
−ピッチおよびエネルギー追跡、信号分類、ならびにエネルギー減衰に基づくパケット損失補償アルゴリズムと、
−デコーダにおいて、一連の損失フレーム後の音声信号の遷移を平滑化するために適用される信号再同期方法と
を使用し得る。

この方法は、補償セグメントの終わりにおける非同期補償信号から通常通り復号化された信号への切り替わりに起因する可聴アーチファクトを除去する。

主観的品質とビットレートとのトレードオフが良好で効率的な広帯域のデジタルスピーチ／オーディオ符号化技法に対する需要が、テレビ会議、マルチメディア、無線用途、およびＩＰ電話等の様々な用途で増えつつある。最近まで、スピーチ符号化システムは、電話帯域においてのみ、すなわち２００〜３４００Ｈｚの範囲内のみの信号しか処理できなかった。今日、５０〜７０００Ｈｚの範囲内の信号を処理可能な広帯域システムに対する需要が増しつつある。これらシステムは、音声の了解度および自然度を増大させるため、狭帯域システムよりもはるかに高い品質を提供する。５０〜７０００Ｈｚの帯域幅は、会話中の対面での発話の品質を届けるのに十分なことが分かっている。音楽等のオーディオ信号の場合、この範囲は受け入れることができるオーディオ品質を与えるが、それでもまだ２０〜２００００Ｈｚの範囲で動作するＣＤのオーディオ品質よりは低い。

６４ｋｂｐｓのＩＴＵ−Ｔ勧告Ｇ．７１１および８ｋｂｐｓのＩＴＵ−Ｔ勧告Ｇ．７２９は、パケット交換電話用途で広く使用されている２つのコーデックに関するスピーチ符号化規格である。したがって、狭帯域電話から広帯域電話への移行に当たり、これら２つの規格に対して下位相互運用可能な広帯域コーデックの開発に関心がある。このために、ＩＴＵ−Ｔは、２００６年に、８ｋｂｐｓのＩＴＵ−Ｔ勧告Ｇ．７２９と相互運用可能なコアを有する埋め込みマルチレートコーダである勧告Ｇ．７２９．１を承認した。同様に、２００７年３月に、６４ｋｂｐｓのＩＴＵ−Ｔ勧告Ｇ．７１１（μ法則およびＡ法則の両方）と相互運用可能な狭帯域コアに基づく埋め込み広帯域コーデックに対する新たな活動が始動した。この新たなＧ．７１１ベースの規格は、ＩＴＵ−Ｔ勧告Ｇ．７１１広帯域拡張（Ｇ．７１１ＷＢＥ）として知られている。

Ｇ．７１１ＷＢＥでは、入力信号が１６ｋＨｚでサンプリングされ、次に、ＱＭＦ（直交ミラーフィルタ）解析を使用して２つの帯域：０〜４０００Ｈｚの低帯域および４０００〜７０００Ｈｚの高帯域に分割される。例えば、入力信号の帯域幅が５０〜８０００Ｈｚの場合、低帯域および高帯域のそれぞれは５０〜４０００Ｈｚおよび４０００〜８０００Ｈｚであることができる。Ｇ．７１１ＷＢＥでは、入力広帯域信号は３つのレイヤで符号化される。第１のレイヤ（レイヤ１：コア）は、６４ｋｂｐｓのＧ．７１１準拠の形式で、低帯域の信号を符号化する。次に、第２のレイヤ（レイヤ２：狭帯域向上レイヤ）が、低帯域においてサンプル毎に２ビット（１６キロビット／秒）を追加して、この帯域での信号品質を向上させる。最後に、第３のレイヤ（レイヤ３：広帯域拡張レイヤ）が、サンプル毎にさらに２ビットを使用して（１６キロビット／秒）高帯域を符号化して、広帯域合成を生成する。ビットストリームのこの構造は埋め込まれる。すなわち、常にレイヤ１があり、その後にレイヤ２またはレイヤ３のいずれかまたは両方（レイヤ２およびレイヤ３）が続く。このようにして、復号化されるレイヤの数が多くなるほど、品質が徐々に向上する合成信号を得ることができる。例えば、図１は、Ｇ．７１１ＷＢＥエンコーダの一例の構造を示す概略ブロック図であり、図２は、Ｇ．７１１ＷＢＥデコーダの一例の構造を示す概略ブロック図であり、図３は、Ｇ．７１１ＷＢＥコーデックでの多層を有するビットストリームの埋め込み構造の一例の構成を示す概略図である。

ＩＴＵ−Ｔ勧告Ｇ．７１１は、圧伸パルス符号変調（ＰＣＭ）としても知られ、８ビットを使用して各入力サンプルを量子化する。まず、入力音声信号の振幅が、対数則を使用して圧縮され、７ビット（に符号のための１ビットを追加したもの）を使用して均一に量子化され、次に、伸展させて線形領域に戻す。ＩＴＵ−Ｔ勧告Ｇ．７１１は、２つの圧縮法則：μ法則およびＡ法則を定義している。ＩＴＵ−Ｔ勧告Ｇ．７１１は、電話帯域幅、すなわち２００〜３４００Ｈｚの範囲内の狭帯域入力音声信号用に特に設計されたものでもある。したがって、範囲５０〜４０００Ｈｚ範囲内の信号に適用された場合、量子化雑音に悩まされ、量子化雑音は特に、高周波数（図４参照）で聞こえる。したがって、埋め込みＧ．７１１ＷＢＥの高帯域（４０００〜７０００Ｈｚ）が適宜符号化された場合であっても、合成広帯域信号の品質は、０〜４０００Ｈｚ帯域を符号化するレガシーＧ．７１１の制約によりやはり不良であり得る。これは、何故レイヤ２がＧ．７１１ＷＢＥ規格に追加されたかの理由である。レイヤ２は、レイヤ１での残留雑音のレベルを低減するため、狭帯域合成音声信号の全体品質を向上させる。他方、不必要に高いビットレートおよび過度の複雑性が生じる恐れがある。レイヤ１のみまたはレイヤ１＋レイヤ３のみを符号化する場合に聞こえる雑音の問題も解決されない。品質は、雑音整形（ｎｏｉｓｅｓｈａｐｉｎｇ）の使用によりかなり向上させることができる。この概念は、聞き手を悩ます程度がかなり低減するように、Ｇ．７１１残留雑音をいくつかの知覚的基準およびマスキング効果に従って整形することである。この技法はエンコーダにおいて適用され、ＩＴＵ−Ｔ勧告Ｇ．７１１との相互運用性に影響しない。換言すれば、レイヤ１に対応する符号化ビットストリームの部分は、レガシーＧ．７１１デコーダにより復号化することができる（適切な雑音整形により向上した品質で）。

Ｇ．７１１ＷＢＥコーデックの主な用途は、ボイスオーバパケットネットワークであるため、フレーム消失の場合のコーデックのロバスト性を増大させることがかなり重要になっている。ボイスオーバパケットネットワーク用途では、スピーチ信号はパケット化され、通常、各パケットが５〜２０ｍｓの音声信号に対応する。パケット交換通信では、パケットの数が非常に大きくなった場合、パケット破棄がルータで発生することがあり、またはパケットが長い遅延の後に受信器に到達することがあり、遅延が受信器エンドにあるジッタバッファの長さよりも長い場合には損失したと宣言されるべきである。これらシステムでは、コーデックは通常、３〜５％のフレーム消失率である。さらに、広帯域スピーチ符号化の使用は、レガシー狭帯域スピーチ信号を使用する従来のＰＳＴＮ（公衆交換電話網）との競合を可能にするために、これらシステムへの重要な資産である。したがって、パケット損失率の場合に良好な品質を維持することが非常に重要である。

ＩＴＵ−Ｔ勧告Ｇ．７１１は通常、予測に基づく低ビットレートコーダと比較してパケット損失の影響を受けにくい。しかし、高パケット損失率では、特に、広帯域サービスから予想される高品質により、適切なパケット損失補償を導入する必要がある。

この目標を達成するために、本発明によれば、符号化音声信号のフレーム消失補償後に再同期し復元する方法であって、現在のフレームにおいて、フレーム消失後に正確に受信された信号を復号化すること、現在のフレームにおいてフレーム消失補償を拡張すること、前のフレームからの消失補償信号を使用して、拡張消失補償信号を生成すること、拡張消失補償信号を現在のフレーム内の復号化信号と相関付け、相関付けに応答して、拡張消失補償信号を復号化信号と同期させること、および現在のフレームにおいて、同期された拡張消失補償信号から復号化信号への滑らかな遷移を生み出すことを含む、方法が提供される。

本発明は、符号化音声信号のフレーム消失補償後に再同期し復元する装置であって、現在のフレームにおいてフレーム消失後に正しく受信した信号を復号化するデコーダと、前のフレームからの消失補償信号を使用して、現在のフレームにおいて拡張消失補償信号を生成する補償信号拡張器と、拡張消失補償信号と現在のフレーム内の復号化信号との相関器および相関に応答して拡張消失補償信号と復号化信号との同期器と、復号化信号と共に同期された拡張消失補償信号が供給され、現在のフレームにおいて、同期された拡張消失補償信号から復号化信号への滑らかな遷移を生み出すように構成された復元ユニットとを備える、装置にも関する。

この装置および方法は、補償信号と復号化信号との間の遷移が滑らかで連続することを保証する。したがって、これら装置および方法は、補償セグメントの終わりにおいて、非同期補償信号から通常通り復号化された信号への切り替わりに起因する可聴アーチファクトを除去する。

本発明の上記および他の目的、利点、および特徴は、添付図面を参照して単なる例として与えられる本発明の例示的な実施形態の以下の制限ではない説明を読めば、より明確になるであろう。

Ｇ．７１１ＷＢＥエンコーダの構造を示す概略ブロック図である。Ｇ．７１１ＷＢＥデコーダの構造を示す概略ブロック図である。Ｇ．７１１ＷＢＥコーデックでの多層を使用した埋め込みビットストリームの構成を示す概略図である。信号再同期に関わる異なる要素および演算のブロック図である。フレーム消失補償処理段階を示すグラフである。一連のフレーム消失後の復元段階の一環としての重複加算演算（ＯＬＡ）を示すグラフである。信号再同期を示すグラフである。

例示的な実施形態の詳細な説明
本発明の非制限的で例示的な実施形態は、多層埋め込みＧ．７１１相互運用可能なコーデックでの消失フレームの補償に関する。このコーデックには、伝送中に失われたパケットのためのフレーム消失補償（ＦＥＣ）メカニズムが備えられている。ＦＥＣはデコーダにおいて実施され、フレーム単位で動作し、１フレーム先読みを利用する。

以前の狭帯域信号（レイヤ１、またはレイヤ１およびレイヤ２）が、開ループ（ＯＬ）ピッチ解析を行うために使用される。これは、隣接する値を利用することによりピッチ輪郭の滑らかさを保証するピッチ追跡アルゴリズムによって行われる。さらに、２つの同時ピッチ発展輪郭（ｐｉｔｃｈｅｖｏｌｕｔｉｏｎｃｏｎｔｏｕｒ）が比較され、より平滑な輪郭をもたらすトラックが選択される。

ＦＥＣの効率を向上させるために、信号分類アルゴリズムが使用されて、フレームが無声、有声、または遷移（ｔｒａｎｓｉｔｉｏｎ）として分類される。サブクラスが使用されて、分類がさらに改良される。例示的な一実施形態では、各フレームの終わりで、エネルギーおよびピッチ発展が、フレーム消失補償（ＦＥＣ）の開始時に使用するために推定される。重複加算（ＯＬＡ）メカニズムが、ＦＥＣの開始時および終了時に使用される。安定有声信号の場合、ＦＥＣアルゴリズムは、フレーム消失前に推定されたピッチおよびエネルギー発展を尊重して、音声信号の既知の最後のピッチ周期を繰り返す。無声フレームの場合、過去の合成信号を使用してＬＰ解析を実行し、ＬＰフィルタを計算する。乱数生成器が使用されて、ＬＰフィルタを使用して合成される補償フレームが作成される。エネルギーは、遷移を平滑化するために調整される。長い消失の場合、漸進的なエネルギー減衰が適用される。減衰の傾きは信号のクラスおよびピッチ周期に依存する。安定信号の場合、減衰は穏やかであるが、遷移の場合には急である。

ＦＥＣ後に最初の正確に受信したフレーム内で、音声信号は、拡張補償信号と正確に受信した信号との相関解析を実行することにより再同期される。この再同期は、有声信号に対してのみ実行される。フレーム消失補償が完了した後、ＯＬＡメカニズムおよびエネルギー調整を適用することを含む復元段階が開始される。ＦＥＣ段階を図５に示す。

ＦＥＣアルゴリズムは、パケット損失の場合に高品質の合成音声信号を維持するように設計することができる。非制限的で例示的な実施形態では、「パケット」は、合成音声信号の１フレームを作成するために使用されるビットストリームから導出される情報を指す。

ＦＥＣアルゴリズムは、デコーダにおいて１フレーム先読みを利用する。この先読みの使用は、スピーチの合成フレームを生成するために、デコーダが次のフレームの情報を「見る」（または使用する）ことを意味する。したがって、損失フレームが検出された場合、補償メカニズムは消失後の最初のフレームから効率的に開始する。したがって、一連の消失後に最初の正確なパケットを受信すると、ＦＥＣは、この最初に正確に受信したフレームを使用して、最後に補償されたフレームについてのいくらかの情報を取り出す。このようにして、遷移は、補償された信号の冒頭および末尾で平滑化される。

開ループピッチ解析
デコーダ内の新しいあらゆる合成フレームを使用して、ピッチ解析が実行され、ＦＥＣに使用される開ループ（ＯＬ）ピッチが推定される。ＯＬピッチ解析は、狭帯域信号に対して実行される。非制限的な例として、このＯＬピッチ解析は、３００サンプル窓を使用する。ＯＬピッチアルゴリズムは、ピッチラグの４つの間隔、すなわち［１３，２０］、［２１，３９］、［４０，７６］、および［７７，１４４］内で行われる相関解析に基づく（８０００Ｈｚサンプリングレートで）。各間隔内の合算長は、
セクション［１３，２０］の場合、Ｌ_ｓｅｃ＝５０
セクション［２１，３９］の場合、Ｌ_ｓｅｃ＝５０
セクション［４０，７６］の場合、Ｌ_ｓｅｃ＝７８
セクション［７７，１４４］の場合、Ｌ_ｓｅｃ＝１４４（１）
により与えられる。

自動相関関数が、以下の関係式
を使用して各ピッチラグ値に対して計算され、式中、ｓ（ｎ）は、過去の合成バッファを含むスピーチの現在の合成フレームであり、ｄはピッチラグ（遅延）であり、Ｎはフレーム長である。例えば、Ｎ＝４０、すなわち８０００Ｈｚのサンプリング周波数では５ｍｓである。

次に、自動相関関数は、前のフレームで決定されたＯＬピッチラグの近傍において三角窓により重み付けされる。これにより、過去のピッチ値の重要性が強化され、ピッチコヒーレンスが保たれる。過去のピッチ値を使用しての自動相関補強の詳細は、参照［２］に見出すことができ、この参照文献は引用により本明細書に組み込まれる。重み付き自動相関関数をＣ^Ｗ（．）と記す。

自動相関関数を三角窓で重み付けた後、４つの間隔のそれぞれ内の最大が、対応するピッチラグと共に決定される。この最大は、以下の関係式
を使用して正規化される。

これより、４つの間隔それぞれの内の正規化された重み付き自動相関関数の最大をＸ_０、Ｘ_１、Ｘ_２、Ｘ_４と記し、対応するピッチラグをｄ_０、ｄ_１、ｄ_２、ｄ_３と記す。残りのすべての処理はこれら選択された値のみを使用して実行され、それにより、全体の複雑性が低減する。

ピッチ倍数（ｐｉｔｃｈｍｕｌｔｉｐｌｅ）の選択を回避するために、倍数のうちの１つが、高ピッチラグ間隔内の相関最大に対応するピッチラグの近傍にある場合、低ピッチラグ間隔内の相関最大がさらに強調される。これは、ピッチラグ倍数を使用しての相互相関補強と呼ばれ、このトピックについてのより詳細は参照［２］に与えられる。したがって、相関最大の変更セットはＸ_Ｃ０、Ｘ_Ｃ１、Ｘ_Ｃ２、Ｘ_Ｃ３になる。最高のピッチラグ間隔は強調されないため、Ｘ_Ｃ３＝Ｘ_３であることに留意されたい。最後に、４つの間隔のそれぞれ内の最大Ｘ_Ｃｉが比較され、最高の最大に対応するピッチラグが、新たなＯＬピッチ値になる。以下の開示では、Ｘ_Ｃ０、Ｘ_Ｃ１、Ｘ_Ｃ２、およびＸ_Ｃ３の間の最高の最大をＣ_ｍａｘと記す。

信号の分類
適切なＦＥＣ戦略を選ぶために、デコーダにおいて、信号の分類が過去の合成信号に対して実行される。この目的は、単一のフレームを以下の５つのクラスのうちの１つに分類することである。
クラス０：ＵＮＶＯＩＣＥＤ
クラス１：ＵＮＶＯＩＣＥＤＴＲＡＮＳＩＴＩＯＮ
クラス２：ＶＯＩＣＥＤＴＲＡＮＳＩＴＩＯＮ
クラス３：ＶＯＩＣＥＤ
クラス４：ＯＮＳＥＴ

信号分類アルゴリズムは、以下のパラメータ：ピッチコヒーレンス、ゼロ交差率、最大正規化相関、スペクトル傾斜、およびエネルギー差の重み付き和として計算されるメリット関数に基づく。

最大正規化相関Ｃ_ｍａｘについては前のセクションですでに説明した。

ゼロ交差率ｚｃについては、この概念は当業者に周知であると考えられるため、本明細書において説明しない。

スペクトル傾斜ｅ_ｔは以下の関係式
により与えられ、式中、合算は、最後の合成フレームで開始され、現在の合成フレームの終わりで終了する。スペクトル傾斜パラメータは、スピーチ信号の周波数分布についての情報を含む。

ピッチコヒーレンスｐｃは以下の関係式
により与えられ、式中、
は現在のフレーム内のＯＬピッチ周期であり、
、ｉ＝１，２，３は過去のフレーム内のＯＬピッチ周期である。

フレームの終わりのピッチ同期相対エネルギーは、関係式
により与えられ、式中、
は、合成信号の終わりで計算されるピッチ同期エネルギーであり、
は、この計算されたピッチ同期エネルギーの長期値であり、Ｔ’は現在のピッチおよび最後のＯＬピッチの端数の丸められた平均である。Ｔ’がＮよりも小さい場合、Ｔ’は２で乗算される。長期エネルギーは、現在のフレームが、関係式
を使用してＶＯＩＣＥＤと分類された場合のみ更新される。

各分類パラメータは、無声信号の典型的な値が０であり、有声信号の典型的な値が１であるようにスケーリングされる。線形関数がこれらの間で使用される。特定のパラメータｐをスケーリングしたものｐ^Ｓは、関係式
ｐ^Ｓ＝ｋ．ｐ＋ｃ（９）
を使用して得られ、式中、定数ｋおよびｃは、表１に従って変化する。ピッチコヒーレンスパラメータをスケーリングしたものは、＜０；１＞により制限される。

メリット関数は、
として定義され、式中、添え字ｓは、パラメータをスケーリングしたものであることを示す。

分類は、メリット関数ｆ_ｍおよび以下のルール
Ｉｆ（ｌａｓｔ＿ｃｌａｓがＯＮＳＥＴ、ＶＯＩＣＥＤ、またはＶＯＩＣＥＤＴＲＡＮＳＩＴＩＯＮであった）
Ｉｆ（ｆ_ｍ＜０．３９）ｃｌａｓ＝ＵＮＶＯＩＣＥＤ
Ｉｆ（０．３９≦ｆ_ｍ＜０．６３）ｃｌａｓ＝ＶＯＩＣＥＤＴＲＡＮＳＩＴＩＯＮ
Ｉｆ（０．６３≦ｆ_ｍ）ｃｌａｓ＝ＶＯＩＣＥＤ
Ｅｌｓｅ
Ｉｆ（ｆ_ｍ≦０．４５）ｃｌａｓ＝ＵＮＶＯＩＣＥＤ
Ｉｆ（０．４５＜ｆ_ｍ≦０．５６）ｃｌａｓ＝ＵＮＶＯＩＣＥＤＴＲＡＮＳＩＴＩＯＮ
Ｉｆ（０．５６＜ｆ_ｍ）ｃｌａｓ＝ＯＮＳＥＴ
Ｅｎｄ
を使用して実行される。

ｃｌａｓパラメータは現在のフレームの分類であり、ｌａｓｔ＿ｃｌａｓは最後のフレームの分類である。

事前補償
パケット損失により現在のフレームを合成できない場合、ＦＥＣアルゴリズムは、代わりに補償信号を生成し、最後に正確に合成されたフレームと補償信号の冒頭との間の平滑な遷移を保証する。これは、冒頭の前に補償信号を外挿し、重なった部分に重複加算（ＯＬＡ）演算を行うことにより達成される。しかし、ＯＬＡは、最後のフレームが有声のような場合、すなわち、（ｃｌａｓ＞ＵＮＶＯＩＣＥＤＴＲＡＮＳＩＴＩＯＮ）の場合のみ適用される。

まず、補償信号の１つのフレームが、最後の正確なＯＬピッチに基づいて生成される。この補償は、最初のピッチおよびエネルギー発展を尊重し、フレームの末尾に向けていくらかのエネルギー減衰を適用する。以下の説明では、ｓ（ｎ）は最後に正確に合成されたフレームを示す。補償信号は、以下の関係式
ｓ_ｘ（ｎ）＝ｓ（ｎ＋Ｎ−Ｔ_ＯＬ），ｎ＝０，１，．．．，Ｎ−１（１１）
により与えられる。

ＯＬＡ演算が実行されるセグメントの長さは、ＯＬピッチ周期の１／４である。すなわち、Ｌ_ＯＬＡ＝Ｔ_ＯＬ／４である。したがって、補償信号の追加のＬ_ＯＬＡサンプルが、ＯＬＡ演算のためにｓ_ｘ（ｎ）の前に生成される。これは、以下の関係式
ｓ_Ｘ（ｎ）＝ｓ（ｎ＋Ｎ−Ｔ_ＯＬ），ｎ＝−Ｌ_ＯＬＡ，．．．，−１，０，１，．．．，Ｎ−１（１２）
により反映される。

ＯＬＡ演算のために、以下の線形関数が定義される。

次に、最後の正確な合成フレームの終了セグメントが、以下
ｓ（ｎ＋Ｎ−Ｌ_ＯＬＡ）＝ｓ（ｎ＋Ｎ−Ｌ_ＯＬＡ）ｆ_ＯＬＡ（ｎ）＋＋ｓ_ｘ（ｎ−Ｌ_ＯＬＡ）［１−ｆ_ＯＬＡ（ｎ）］ｎ＝０，１，．．．，Ｌ_ＯＬＡ−１（１４）
のように変更され、外挿された補償フレームの先頭セグメントが、
ｓｆ_ＯＬＡ（ｎ−Ｌ_ＯＬＡ）＝ｓｆ（ｎ−Ｌ_ＯＬＡ）（１−ｆ_ＯＬＡ（ｎ）），ｎ＝０，１，．．．，Ｌ_ＯＬＡ（１５）
として変更される。

ピッチ発展
有声のような信号の場合、すなわち、ｃｌａｓ＞ＵＮＶＯＩＣＥＤＴＲＡＮＳＩＴＩＯＮの場合、合成信号の最後のピッチ周期は繰り返され、最後の正確な合成フレームの末尾において推定されるピッチ発展を尊重するように変更される。ピッチ発展の推定は、ＯＬピッチ追跡アルゴリズムの一環である。ピッチが有意なように発展するか否かを検証するために使用されるピッチコヒーレンスフラグを計算することで開始される。ピッチコヒーレンスフラグｃｏｈ＿ｆｌａｇ（ｉ）は、以下の２つの条件が満たされた場合に設定される。

上記テストは、ｉ＝０，−１，−２の場合、すなわち最後の３つのＯＬピッチ周期に対して実行される。

ピッチ発展係数ｄｅｌｔａ＿ｐｉｔは、最後のピッチコヒーレントセグメント内の平均ピッチ差として計算される。ピッチコヒーレントセグメントは、ｉ＝０で開始される正のコヒーレンスフラグにより区切られる。したがって、ｃｏｈ＿ｆｌａｇ（０）およびｃｏｈ＿ｆｌａｇ（−１）が両方とも１に等しく、ｃｏｈ＿ｆｌａｇ（−２）が０に等しい場合、ピッチコヒーレントセグメントはｉ＝０およびｉ＝−１のものである。そして、これは、
と書くことができ、式中、ｉ_ｐｃはピッチコヒーレントセグメント内の最後のインデックスである。ピッチ発展係数は、間隔＜−３；３＞内に制限される。

ピッチ発展係数が正の場合、補償フレームは、内部にいくつかのサンプルを挿入することによって伸張される。ピッチ発展係数が負の場合、補償フレームは、いくつかのサンプルを除去することにより短縮化される。サンプル挿入／除去アルゴリズムは、変更から生じる境界の影響がなくなるように、補償信号が１フレームよりも長いものと仮定する。これは、補償信号の外挿により保証される。

新たなあらゆる補償フレームで、ピッチ発展係数がまず、正の場合に１だけ低減され、負の場合に１だけ増大される。これにより、３つの連続したフレーム消失後、ピッチ発展が終了することが保証される。ピッチ発展係数の絶対値は、挿入または除去されるサンプルの数も定義する。すなわち、
Ｎ_ｐ＝｜ｄｅｌｔａ＿ｐｉｔ｜（１８）
である。

補償フレームはＮ_ｐ＋１個の領域に分割され、あらゆる領域において、最低エネルギーを有するポイントが探される。低エネルギーポイントは、
ｎ_ＬＥ＝ａｒｇｍｉｎ（ｓｆ^２（ｎ）＋ｓｆ^２（ｎ＋１））（１９）
として定義される。

すべての領域の低エネルギーポイントは
として付番される。但し、ｉ＝０，１，．．．，Ｎ_ｐである。低エネルギーポイントは、サンプルを挿入または除去すべき場所を指す。

サンプルは、
により指された位置において挿入または除去され、補償フレームの残りの部分はそれに従ってシフトされる。サンプルが挿入される場合、その値は近傍の平均値として計算される。サンプルが除去される場合、新しいサンプルは、補償フレームの末尾を超えた外挿部分から除去されて、ギャップが埋められる。これにより、補償信号が常に長さＮを有することが保証される。

無声フレームの補償
前のセクションにおいて述べたように、有声のような信号の場合、すなわち、ｃｌａｓ＞ＵＮＶＯＩＣＥＤＴＲＡＮＳＩＴＩＯＮの場合、合成信号の最後のピッチ周期は繰り返される。無声のような信号の場合、ピッチ発展は重要ではなく、尊重されない。

無声のような信号の場合、ＦＥＣは残差領域（ｒｅｓｉｄｕａｌｄｏｍａｉｎ）において実行される。まず、線形予測（ＬＰ）解析が過去の合成信号の最後の１２０個のサンプルに対して行われ、ＬＰフィルタ係数のセットα_ｉ，ｉ＝０，１，．．．，８が検索される。ＬＰ解析は、自動相関原理およびレビンソン−ダービンアルゴリズムを使用して行われる。ＬＰ解析の詳細は、この技法が当業者に周知であると考えられるため、本明細書において与えられない。

補償無声フレームのサンプルは疑似乱数生成器により生成され、新しい各サンプルは、
ｘ（ｎ）＝３１８２１．ｘ（ｎ−１）＋１３８４９，ｎ＝１，２，．．．，Ｎ（２０）
により与えられる。

乱数生成器はｇ（０）＝２１８４５（他の値を使用することも可能である）を使用して初期化される。次に、ランダム信号が、前に見つけたＬＰ係数、すなわち、
を使用して合成される。

合成信号のエネルギーは、前のフレームのエネルギーに調整される。すなわち、
ｓｆ（ｎ）＝ｇ_ａｓ_ＳＹＮ（ｎ），ｎ＝０，１，．．．，Ｎ−１（２２）
であり、式中、ｇ_ａは、過去のフレームエネルギーとランダム合成フレームのエネルギーとの比の平方根として定義される。すなわち、
である。

まとめると、式（１１）は、ピッチ発展に関してさらに変更される有声のような信号の補償フレームを特定し、式（２２）は、無声のような信号の補償フレームを特定する。

エネルギー減衰
両方の種類の信号、すなわち、有声および無声について、補償信号のエネルギーは、消失の数が増えるにつれて徐々に減衰する。減衰アルゴリズムには、有声オフセットの検出器が備えられ、有声オフセット中に、減衰アルゴリズムは低減するエネルギー傾向を尊重しようとする。これは、発展が不適切であったいくつかのオンセットを検出することも可能であり、異なる減衰戦略を適用する。減衰アルゴリズムのパラメータは、補償信号の高い主観的品質を提供するように手調整されている。

第１の消失フレームが検出され、補償全体を通して使用される場合、一連の減衰係数が計算される。各減衰係数は、補償信号に適用される各フレームの末尾における利得関数の値を特定する。一連の減衰係数は、以下の関係式
ｇ_ａｔｔ＝［１，ｇ（０），ｇ（１），．．．，ｇ（Ｎ_ＡＴＴ）＝０］（２４）
により与えられ、Ｎ_ＡＴＴ＝２０は、一連の長さである。一連は１で開始され、０で終わる。これは、補償フレームの冒頭のエネルギーが減衰されず、末尾のエネルギーが０に減衰することを示す。表２に、様々な信号クラスの減衰係数を示す。

有声のような信号（ｃｌａｓ＞ＶＯＩＣＥＤＴＲＡＮＳＩＴＩＯＮ）の場合、ピッチ同期エネルギーは、以下の関係式
により各合成フレームの末尾において計算される。

エネルギー傾向は、最小二乗（ＬＳ）手法を使用して推定される。以下の一次線形関数が、最後の５つのエネルギー値の発展を近似するために使用され、
ｆ_Ｅ（ｉ）＝ｋ．ｔ（ｉ）＋ｑ（２６）
式中、ｔ＝［４Ｎ，３Ｎ，２Ｎ，Ｎ，０］は時間インデックスのベクトルであり、ｉ＝０，１，．．．，４およびｆ_Ｅ（ｉ）は近似されたエネルギー値である。係数ｋおよびｑは、
により与えられ、式中、Ｅ_ＦＥＣ（．）への負のインデックスは、過去のエネルギー値を指す。平均二乗誤差が、関係式
を使用して計算され、エネルギー傾向は
Ｅ_{ｔｒｅｎｄ}＝ｋ．Ｎ（２９）
により与えられる。

減衰アルゴリズムはこれら２つのパラメータを使用して、有声オフセットを検出する。このアルゴリズムはまず、最後の５つの正確に合成されたフレームが有声のようであると分類されたか否か、すなわち、条件ｃｌａｓ＞ＵＮＶＯＩＣＥＤＴＲＡＮＳＩＴＩＯＮを満たすか否かを検証する。さらに、減衰アルゴリズムのために、有声オフセットは以下の条件を満たさなければならない。
（Ｅ_{ｔｒｅｎｄ}＜−０．１）ＡＮＤ（ｅｒｒ＜０．６）（３０）

有声オフセットの一連の減衰係数は、
として定義される。

これは、有声オフセットの消失前に推定されたエネルギー傾向が、補償中も保たれることを保証する。

減衰アルゴリズムは、誤って、または不適切に発展したオンセットに対して異なる減衰戦略を適用する。このようなフレームを検出するために、以下の条件を満たさなければならない。
式中、インデックスは、最後に正確に合成されたフレームに対して０から始まるフレーム番号を示す。このようにして検出されたオンセットの一連の減衰係数は、
ｇ_ａｔｔ＝［１，ｗ（０），ｗ（１），．．．，ｗ（Ｎ_ＡＴＴ）＝０］（３２）
により与えられ、式中、ｗ（．）はｗ（０）＝１により初期化された線形関数であり、
として各フレームの終わりで更新される。

したがって、ｗ（．）は、ＯＬピッチ周期に依存する。ピッチ周期が短い場合、より素早く低減し、周期が長い場合、ゆっくりと低減する。

最後に、あらゆる補償フレームのサンプルは、２つの連続した減衰係数の補間である線形関数、すなわち、
ｓｆ_ＡＴＴ（ｎ）＝ｓｆ（ｎ）ｆ_ＡＴＴ（ｎ）ｎ＝０，１，．．．，Ｎ−１（３４）
で乗算され、式中、ｆ_ＡＴＴ（．）は、各フレームの終わりにおいて、
により更新される。

式（３５）での更新は、ｉ＝１（ｇ_ＡＴＴ（０）＝１）で開始され、ｉは、各フレームの終わりで１だけ増分される。式（３５）は、利得がフレーム全体を通して徐々に低減し、ゼロに達するまで、または消失が終わるまで、フレームからフレームに滑らかに続くことを保証する。

最後のピッチ周期の繰り返し（有声信号の場合）またはランダム信号の再合成（無声信号の場合）の後に、ピッチ発展および／またはエネルギー減衰による変更を含むＦＥＣの概念は、フレーム消失の全持続期間中、繰り返される。

信号再同期
有声フレームの補償中、式（１１）でのように、過去の信号が、推定されたピッチラグを使用して繰り返される。一連の消失後の最初の良好なフレームが受信されると、ピッチの不連続性が現れ、気に障るアーチファクトが生じ得る。非制限的な実施形態は、この問題を回避するための信号再同期方法を含む。

一連の消失後の最初の良好なフレームが受信されると、信号再同期が、有声信号の場合に実行される。再同期は、最後の補償フレームおよび最初に正確に復号化されたフレームにおいて適用されて、信号遷移を平滑化し、アーチファクトの原因を回避する。開示される信号再同期の原理を図４に示す。

デコーダ４０１において、フレーム消失後に最初に正確に受信したフレームのビットストリーム４００が復号化され、合成されて、復号化信号４０４を生成する。

補償信号拡張器４０２において、補償信号４０６が、前のフレーム内の補償信号４０５の論理的な拡張である補償アルゴリズムにより、現在のフレームにおいて生成される。より具体的には、前の損失フレーム内の補償が現在のフレームにおいて続けられる。

相互相関器４０３において、相互相関解析が、現在のフレーム内の２つの信号４０４と４０６との間：デコーダ４０１からの正確に受信したフレームの復号化信号４０４と拡張ユニット４０２により現在のフレームに拡張された補償信号４０６との間で実行される。遅延４０７が、相互相関器４０３の相互相関関数に基づいて抽出される。

前のフレームおよび現在のフレームの連結に対応する補償信号４１２が、前のフレームの補償信号４０５および現在のフレームの拡張補償信号４０６の両方を入力として受信する２フレームバッファ４１２により供給される。決定された遅延４０７に基づいて、同期器４０８は、補償信号４１２（前のフレームおよび現在のフレームの連結に対応する）をリサンプリングするリサンプラを備える。例えば、リサンプラは、遅延４０７が正であるか、それとも負であるかに応じて、連結された補償信号４１２を圧縮または伸展する圧縮器または伸展器を備える。結果として生成されるリサンプリング信号４１６は、２フレームバッファ４１０に供給される。この概念は、連結された補償信号４１２の位相を正確に受信されたフレームからの復号化信号４０４の位相とを位置合わせすることである。

同期器４０８での補償信号のリサンプリング（圧縮または伸展）後、前のフレームに対応するリサンプリングされた補償信号の部分４０９は、２フレームバッファ４１０を通して抽出され、出力される。現在のフレームに対応するリサンプリングされた補償信号の部分４１１は、２フレームバッファ４１０を通して抽出され、出力され、次に、復元ユニット４１４において、ＯＬＡアルゴリズムを使用して正確に受信したフレームの復号化信号４０４とクロスフェーディングされて、現在のフレーム内に合成信号４１５を生成する。ＯＬＡアルゴリズムについては以下の説明において詳細に説明する。

一連のパケット損失後の最初の復号化フレームにおいて、補償アルゴリズム（拡張器４０２）は、もう１つの補償信号４０６を生成する（復号化フレームが失われた場合と同じように）。次に、相互相関解析（相互相関器４０３）が、範囲＜−５；５＞内で補償信号と復号化信号との間で実行される。復号化信号をｓ（ｎ）と記し、補償信号をｓ_ｘ（ｎ）と記す。但し、ｎ＝−Ｎ，．．．，０，１，．．．，Ｎ−１であり、Ｎはフレームサイズであり、この非制限的で例示的な実施形態では４０に等しい。負のインデックスが過去の補償信号のサンプル、すなわち、復号化前に正確に受信したフレームを示すことに留意されたい。相関関数は、
として定義され、式中、Ｌ_ＲＳＸ＝５が再同期間隔である。相関関数の最大が見つけられ、この最大に対応する遅延が、以下
のように検索される。

最大相関を正規化するために、以下の２つのエネルギーが、以下の関係式
を使用して計算され、
は、それらの積の平方根で除算される。

再同期は、外挿されたフレームのエネルギーと正確に受信したフレームのエネルギーとの間に大きな不一致がある場合には適用されない。したがって、エネルギー比が、以下の関係式
を使用して計算される。

再同期に続くための条件は、
［（ｌａｓｔ＿ｃｌａｓ＝＝ＶＯＩＣＥＤ）ＡＮＤ（Ｃ_ＲＳＸ＞０．７）ＡＮＤ（ｒ_ＲＳＸ＜２．０）］
として定義される。但し、ｌａｓｔ＿ｃｌａｓは、補償周期の前の信号の分類である。この条件が満たされる場合、補償信号は、先に見つけられたサンプルの数に応じて伸展または短縮（圧縮）される。これが補償信号ｓ_ｘ（ｎ）全体に対して、すなわち、
ｎ＝−Ｎ，．．．，０，１，．．．，Ｎ−１
に対して行われることに留意されたい。

信号の圧縮または伸展は、異なる方法を使用して実行することができる。例えば、「リサンプリング」関数を補間の原理に基づいて使用することができる。単純な線形補間を使用して、複雑性を低減することができる。しかし、効率は、二次補間またはスプライン補間等の異なる原理を利用することにより向上させることができる。元の信号の隣接する信号間の距離が「１」と考えられる場合、リサンプリングされた信号の隣接するサンプル間の距離は、以下
のように定義することができる。

ｄ_ＲＳＸは範囲＜−５；５＞内でのみ変更可能であるため、Δは範囲＜０．８７１８；１．１２８２＞内でのみ変更可能である。

リサンプリングされた信号の値は、Δの倍数、すなわち
ｐ（ｋ）＝ｋΔ（ｋ＝０，．．．，２Ｎ−１）（４２）
により与えられる位置における元の信号の値から計算される。

上記説明において述べたように、リサンプリングは補償信号全体ｓ_ｘ（ｎ）、ｎ＝−Ｎ，．．．，Ｎ−１に対して実行される。リサンプリングされた補償信号ｓ_Ｒｘ（ｎ）は、以下の関係式
により与えられ、式中、
は、ｐ（ｋ）の最も近いより大きな整数値であり、
はｐ（ｋ）の最も近いより低い整数値である。ｐ（ｋ）が整数の場合、
であり、かつ
であることに留意する。リサンプリング演算の長さは、以下
のように制限される。

Ｋ＜Ｎの場合、欠落サンプルｓ_Ｒｘ（ｎ）、ｎ＝Ｋ，．．．，Ｎ−１は０に設定される。再同期後のクロスフェーディング（ＯＬＡ）が、非制限的な例として、三角窓を使用し、通常、最後のサンプルは、０に近い係数で乗算されるため、これは問題ではない。再同期の原理を図７に示し、図７では、２サンプルによる拡張が実行される。

過去のフレームおよび現在のフレームｓ_Ｒｘ（ｎ）、ｎ＝＿−Ｎ，．．．，Ｎ−１に対する再同期された補償信号を見つけた後、過去の補償フレームは、以下の関係式
ｓ_Ｒｘ（ｎ），ｎ＝＿−Ｎ，．．．，−１（４５）
により与えられ、現在のフレームは、復号化信号ｓ（ｎ）、ｎ＝０，．．．，Ｎ−１および再同期された補償信号ｓ_Ｒｘ（ｎ）をクロスフェーディング（重複加算）することにより与えられる。補償された過去のフレームおよびクロスフェーディングされた現在のフレームを出力する前に、さらなる処理を再同期された補償信号に適用できることに留意されたい。

クロスフェーディング（重複加算（ＯＬＡ））は、現在のフレームの冒頭の特定の数のサンプルＬに対して適用することがきる。クロスフェーディングされた信号は、以下の関係式
により与えられる。

非制限的な例として、三角窓がクロスフェーディング演算に使用され、窓は、以下の関係式
により与えられる。

この非制限的な例では、フレームが短い（Ｎ＝４０）ため、クロスフェーディング演算はフレーム全体に対して実行される。すなわち、Ｌ＝Ｎである。

補償後の復元
補償段階が終了すると、復元段階が開始される。復元を行う理由は、補償の末尾と通常通りの合成の冒頭との間の平滑な遷移を保証することである。復元段階の長さは、信号クラスおよび補償中に使用されたピッチ周期、式（３９）において計算された正規化相関、ならびに式（４０）において計算されたエネルギー比に依存する。

以下の疑似コードが、復元の長さの決定に使用される。

復元は、本質的に、長さＬ_ＲＣＶの拡張補償信号と通常通り合成された信号との間で実行されるＯＬＡ演算（図４の復元ユニット４１４）である。この拡張は、再同期が行われた場合、再同期された補償信号に対して実行される。ＯＬＡ演算については上記の事前補償セクションにおいてすでに説明した。Ｌ_ＲＣＶ＝Ｎの場合のＯＬＡの原理および関連する重み付け関数（三角窓）のグラフ図を図６に示す。

ＦＥＣおよび復元演算の順序および位置を図５に示す。この例では、復元段階は、本質的に、ＯＬＡ演算であり、再同期は、一連のフレーム消失後に最初に正確に受信したフレーム内の合成信号を使用して、最後の補償フレームに対して行われる。

拡張レイヤでのＦＥＣ
これまで、説明したＦＥＣアルゴリズムは、過去の合成狭帯域信号（レイヤ１またはレイヤ１およびレイヤ２）に対して実行されてきた。フレームが失われた場合、狭帯域拡張部分（レイヤ２）は復号化もされず、補償もされなかった。これは、補償段階中および復元段階中（一連のフレーム消失後に最初に正確に受信した２つのフレーム）、レイヤ２情報が使用されないことを意味する。ＦＥＣ後に最初の正確に受信した２つのフレームは、十分なデータが、レイヤ２合成の一体部分である、行われるＬＰ解析に利用できない（１２０個のサンプルが必要）ため、通常の演算から省かれる。

広帯域拡張レイヤ（レイヤ３）の補償は、ＱＭＦ合成広帯域信号のＨＦ部を構成するため、必要である。ＨＦ部の補償は重要ではなく、本発明の部分ではない。

本発明について本発明の非制限的で例示的な実施形態により上記説明において説明したが、この実施形態は、本発明の主旨、性質、および範囲から逸脱せずに添付の特許請求の範囲内で、随意、変更することが可能である。

参照
[1] Pulse code modulation (PCM) of voice frequencies, ITU-T Recommendation G.711, November 1988, (http://www.itu.int)
[2] Source-Controlled Variable-Rate Multimode Wideband Speech Codec (VMR-WB), Service Options 62 and 63 for Spread Spectrum Systems, 3GPP2 Technical Specification C.S0052-A v1.0, April 2005 (http://www.3gpp2.org)

４０１デコーダ
４０２補償信号拡張器
４０３相互相関器
４０４復号化信号
４０５前のフレーム内の補償信号
４０６現在のフレーム内の補償信号
４０６補償信号
４０７遅延
４０８同期器
４０９前のフレームに対応するリサンプリングされた補償信号の部分
４１０、４１３２フレームバッファ
４１１現在のフレームに対応するリサンプリングされた補償信号の部分
４１２前のフレームおよび現在のフレームの連結に対応する補償信号
４１４復元ユニット
４１５合成信号
４１６リサンプリング信号

Claims

符号化音声信号のフレーム消失補償後に再同期し復元する方法であって、
フレーム消失の後、現在のフレームにおいて正確に受信された信号を復号化すること、
前のフレームからの消失補償信号の続きを使用して、前記現在のフレーム内のフレーム消失補償を拡張して、拡張消失補償信号を生成すること、
前記拡張消失補償信号を前記現在のフレーム内の復号化信号と相関付け、前記相関付けに応答して、前記拡張消失補償信号を前記復号化信号に同期させること、および
前記現在のフレームにおいて、前記同期された拡張消失補償信号から前記復号化信号への平滑な遷移を生み出すこと
を含み、
前記拡張消失補償信号を前記復号化信号と相関付けることは、前記相関付けに対応する遅延を計算することを含み、
前記拡張消失補償信号を前記復号化信号と同期させることは、前記計算された遅延に応
答して、前記拡張消失補償信号をリサンプリングすることを含み、
前記計算された遅延に応答して、前記拡張消失補償信号をリサンプリングすることは、前記計算された遅延が正であるか、それとも負であるかに応じて前記拡張消失補償
信号を圧縮または伸展することを含む、再同期し復元する方法。
前記相関付けに応答して、前記前のフレームからの前記消失補償信号を前記復号化信号と同期させることをさらに含む、請求項１に記載の再同期し復元する方法。
前記拡張消失補償信号を前記復号化信号と相関付けることは、前記拡張消失補償信号と前記復号化信号との相互相関を最大化することを含む、請求項１に記載の再同期し復元する方法。
前記前のフレームからの前記消失補償信号を前記現在のフレーム内の前記拡張消失補償信号に連結して、連結された消失補償信号を生成することをさらに含む、請求項１に記載の再同期し復元する方法。
２つのフレームに対応する周期を前記連結された消失補償信号で覆うことを含む、請求項４に記載の再同期し復元する方法。
前記方法は、前のフレームからの前記消失補償信号を前記現在のフレーム内の前記拡張消失補償信号に連結して、連結された消失補償信号を生成することを含み、前記拡張消失補償信号を前記現在のフレーム内の前記復号化信号と同期させること、および前記前のフレームからの前記消失補償信号を前記現在のフレーム内の前記復号化信号と同期させることは、前記計算された遅延に応答して、前記連結された消失補償信号をリサンプリングすることを含む、請求項２に記載の再同期し復元する方法。
前記計算された遅延に応答して、前記連結された消失補償信号をリサンプリングすることは、前記計算された遅延が正であるか、それとも負であるかに応じて前記連結された消失補償信号を圧縮または伸展することを含む、請求項６に記載の再同期し復元する方法。
前記連結された消失補償信号を圧縮することは、前記計算された遅延の値に対応するいくつかのサンプルを除去することを含む、請求項７に記載の再同期し復元する方法。
前記連結された消失補償信号を伸展することは、前記計算された遅延の値に対応するいくつかのサンプルを挿入することを含む、請求項７に記載の再同期し復元する方法。
前記相関付けに応答して前記拡張消失補償信号を前記復号化信号と同期させることは、前記拡張消失補償信号の位相を前記復号化信号と位置合わせすることを含む、請求項１に記載の再同期し復元する方法。
前記前のフレームから前記消失補償信号を抽出して、前記前のフレーム内の合成信号を生成することを含む、請求項１に記載の再同期し復元する方法。
平滑な遷移を生成することは、前記拡張消失補償信号および前記現在のフレーム内の前記復号化信号に対してクロスフェーディング演算を実行することを含む、請求項１に記載の再同期し復元する方法。
平滑な遷移を生成することは、前記連結された消失補償信号および前記現在のフレーム内の前記復号化信号の重複部分に対して重複加算演算を実行することを含む、請求項４に記載の再同期し復元する方法。
前記重複加算演算を実行することは、前記現在のフレーム内に合成信号を生成することを含む、請求項１３に記載の再同期し復元する方法。
前記重複加算演算を実行することは、三角窓を使用することを含む、請求項１３に記載の再同期し復元する方法。
前記重複加算演算を実行することは、前記重複加算演算の長さを計算することを含む、請求項１３に記載の再同期し復元する方法。
前記符号化音声信号の信号分類を決定することをさらに含む、請求項１に記載の再同期し復元する方法。
前記符号化音声信号の前記信号分類を決定することは、前記符号化音声信号を無声信号、無声遷移信号、有声遷移信号、有声信号、およびオンセット信号からなる群に分類することを含む、請求項１７に記載の再同期し復元する方法。
前記信号分類を決定することは、前記符号化音声信号に関連するピッチコヒーレンス、ゼロ交差率、相関、スペクトル傾斜、およびエネルギー差からなる群から選択されたパラメータを計算して、前記符号化音声信号の前記信号分類を決定することを含む、請求項１７に記載の再同期し復元する方法。
有声信号の場合のみ、前記拡張消失補償信号の前記復号化信号との同期を実行することを含む、請求項１に記載の再同期し復元する方法。
前記エネルギー差を計算することは、前記拡張消失補償信号と前記現在のフレーム内の前記復号化信号とのエネルギーの比を計算することを含む、請求項１９に記載の再同期し復元する方法。
符号化音声信号のフレーム消失補償後に再同期し復元する装置であって、
フレーム消失の後、現在のフレームにおいて正確に受信された信号を復号化するデコーダと、
前のフレームからの消失補償信号の続きを使用して、前記現在のフレームにおいて拡張消失補償信号を生成する補償信号拡張器と、
前記拡張消失補償信号と前記現在のフレーム内の復号化信号との相関器および相関に応答する、前記復号化信号との前記拡張消失補償信号の同期器と、
同期された拡張消失補償信号が供給され、前記同期された拡張消失補償信号から前記復号化信号への平滑な遷移を前記現在のフレーム内で生成するように構成された復元ユニットと
を備え、
前記相関器は、前記相関に対応する遅延を計算し、
前記同期器は、前記計算された遅延に応答する、前記拡張消失補償信号のリサンプラを備え、
前記リサンプラは、前記計算された遅延が正であるか、それとも負であるかに応じる、前記拡張消失補償信号の圧縮器または伸展器を備える、再同期し復元する装置。
前記同期器は、前記相関に応答して、前記前のフレームからの前記消失補償信号も符号化信号に同期させる、請求項２２に記載の再同期し復元する装置。
前記相関器は、前記拡張消失補償信号と前記復号化信号との相互相関を最大化することを含む、請求項２２に記載の再同期し復元する装置。
前記前のフレームからの前記消失補償信号を前記現在のフレーム内の前記拡張消失補償信号と連結して、連結された消失補償信号を生成する手段を備える、請求項２２に記載の再同期し復元する装置。
前記相関器は、前記相関に対応する遅延を計算し、前記装置は、前記前のフレームからの前記消失補償信号を前記現在のフレーム内の前記拡張消失補償信号と連結して、連結された消失補償信号を生成する手段を備え、前記同期器は、前記計算された遅延に応答して、前記連結された消失補償信号のリサンプラを備える、請求項２３に記載の再同期し復元する装置。
前記計算された遅延に応答する前記連結された消失補償信号のリサンプラは、前記計算された遅延が正であるか、それとも負であるかに応じて、前記連結された消失補償信号の圧縮器または伸展器を備える、請求項２６に記載の再同期し復元する装置。
前記連結された消失補償信号の圧縮器は、前記計算された遅延の値に対応するいくつかのサンプルを除去する、請求項２７に記載の再同期し復元する装置。
前記連結された消失補償信号の伸展器は、前記計算された遅延の値に対応するいくつかのサンプルを挿入する、請求項２７に記載の再同期し復元する装置。
前記相関に応答する前記拡張消失補償信号と前記復号化信号との同期器は、前記拡張消失補償信号の位相を前記復号化信号と位置合わせする、請求項２２に記載の再同期し復元する装置。
前記前のフレームから前記消失補償信号を抽出して、前記前のフレームにおいて合成信号を生成する手段を備える、請求項２２に記載の再同期し復元する装置。
前記復元ユニットは、前記拡張消失補償信号および前記現在のフレーム内の前記復号化信号に対して重複加算演算を実行する、請求項２２に記載の再同期し復元する装置。
前記復元ユニットは、前記連結された消失補償信号および前記現在のフレーム内の前記復号化信号の重複部分に対して重複加算演算を実行して、前記現在のフレームにおいて合成信号を生成する、請求項２５に記載の再同期し復元する装置。
前記復元ユニットは、三角窓を使用して前記重複加算演算を実行する、請求項３２に記載の再同期し復元する装置。
前記符号化音声信号の信号分類を決定することをさらに含む、請求項２２に記載の再同期し復元する装置。