JP6373873B2

JP6373873B2 - 線形予測コーディングにおける適応型フォルマントシャープニングのためのシステム、方法、装置、及びコンピュータによって読み取り可能な媒体

Info

Publication number: JP6373873B2
Application number: JP2015555166A
Authority: JP
Inventors: アッティ、ベンカトラマン・エス．; ラジェンドラン、ビベク; クリシュナン、ベンカテシュ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-01-29
Filing date: 2013-12-23
Publication date: 2018-08-15
Anticipated expiration: 2033-12-23
Also published as: JP2016504637A; US20170301364A1; CN104937662B; BR112015018057A2; BR112015018057B1; CN104937662A; CN109243478A; WO2014120365A3; US10141001B2; US9728200B2; WO2014120365A2; DK2951823T3; KR101891388B1; ES2907212T3; US20140214413A1; KR20150110721A; HUE057931T2; CN109243478B; EP2951823B1; EP2951823A2

Description

関連出願の相互参照
［０００１］本出願は、ここにおける引用によってここにおいて内容全体が明示で組み入れられている、共通所有される米国仮特許出願第６１／７５８，１５２号（出願日：２０１３年１月２９日）及び米国非仮特許出願第１４／０２６，７６５号（出願日：２０１３年９月１３日）からの優先権を主張するものである。

［０００２］本開示は、音声信号のコーディング（例えば、話声コーディング）に関するものである。

［０００３］線形予測（ＬＰ）解析−合成フレームワークは、話声合成に関するソース−システムパラダイムに非常に良く適合するため、話声コーディングに関して成功を収めている。特に、上方声道の経時でゆっくりと変化するスペクトル特性がオールポールフィルタ（ａｌｌ−ｐｏｌｅｆｉｌｔｅｒ）によってモデル化され、他方、予測残差は、声帯の有声、無声、又は混合された励振挙動をキャプチャする。ＬＰ解析からの予測残差は、クローズドループの合成による解析プロセスを用いてモデル化及び符号化される。

［０００４］合成による解析符号励振線形予測（ＣＥＬＰ）システムでは、入力話声と再構築された話声との間の最小の観測された“知覚的に重みが付けられた”（ｐｅｒｃｅｐｔｕａｌｌｙ−ｗｅｉｇｈｔｅｄ）平均二乗誤差（ＭＳＥ）が結果的に得られる励起シーケンスが選択される。知覚的重み付けフィルタは、量子化雑音が高エネルギーフォルマントによってマスキングされるような形で予測誤差を整形する。知覚的重み付けフィルタの役割は、フォルマント領域における誤差エネルギーをデエンファサイズ（ｄｅ−ｅｍｐｈａｓｉｚｅ）することである。このデエンファシス戦略は、フォルマント領域では、量子化雑音が話声によって部分的にマスキングされるという事実に基づく。ＣＥＬＰコーディングでは、励起信号は、２つのコードブック、すなわち、適応型コードブック（ＡＣＢ）及び固定型コードブック、から生成される。ＡＣＢベクトルは、過去の励起信号の遅延（すなわち、クローズドループピッチ値だけ）セグメントを表し、全体的励起の周期的コンポーネントに貢献する。全体的励起における周期的貢献がキャプチャされた後は、固定型コードブック探索が行われる。ＦＣＢ励起ベクトルは、励起信号内の残りの非周期的コンポーネントを部分的に表し、インターリービングされたユニタリパルスの代数型コードブックを用いて構築される。話声コーディングでは、ピッチ及びフォルマントシャープニング技法は、例えば、より低いビットレートにおける話声再構築品質の有意な向上を提供する。

［０００５］フォルマントシャープニングは、クリーンな話声における有意な品質上の利得に貢献することができる。しかしながら、雑音が存在しさらに信号対雑音比（ＳＮＲ）が低い状態では、品質上の利得は顕著さが低くなる。これは、フォルマントシャープニングフィルタの不正確な推定に起因し、及び部分的にではあるが、雑音を追加で考慮する必要があるソース−システム話声モデルの幾つかの制限事項に起因する。幾つかの事例においては、話声品質の劣化は、変形された、フォルマントシャープニングされた低帯域励起が高帯域合成において使用される帯域幅拡大が存在するほうがより顕著である。特に、低帯域励起の幾つかのコンポーネント（例えば、固定型コードブックの貢献）は、低帯域合成の知覚上の品質を向上させるためにピッチ及び／又はフォルマントのシャープニングを受けることができる。高帯域合成のために低帯域からのピッチ及び／又はフォルマントシャープニングされた励起を使用することは、可聴アーティファクトを発生させる尤度が全体的な話声再構築品質を向上させるよりも高くなることがある。

［０００６］低ビットレート話声コーディングに関するコード励起線形予測（ＣＥＬＰ）合成解析アーキテクチャに関する概略図を示す。［０００７］話声信号のフレームの一例に関する高速フーリエ変換（ＦＦＴ）スペクトル及び対応するＬＰＣスペクトルを示した図である。［０００８］一般的構成による音声信号を処理するための方法Ｍ１００に関するフローチャートを示す。［０００９］一般的構成による音声信号を処理するための装置ＭＦ１００に関するブロック図を示す。［００１０］一般的構成による音声信号を処理するための装置Ａ１００に関するブロック図を示す。［００１１］方法１００の実装Ｍ１２０に関するフローチャートを示す。［００１２］装置ＭＦ１００の実装Ａ１２０に関するブロック図を示す。［００１３］装置Ａ１００の実装Ａ１２０に関するブロック図を示す。［００１４］長期的ＳＮＲを計算するための擬似コードリストの例を示した図である。［００１５］長期的ＳＮＲによりフォルマントシャープニング率を推定するための擬似コードリストの例を示した図である。［００１６］γ_２値対長期的ＳＮＲのプロット例を示した図である。［００１６］γ_２値対長期的ＳＮＲのプロット例を示した図である。［００１６］γ_２値対長期的ＳＮＲのプロット例を示した図である。［００１７］適応型コードブック探索のためのターゲット信号ｘ（ｎ）の生成を例示した図である。［００１８］ＦＣＢ推定のための方法を示した図である。［００１９］ここにおいて説明される適応型フォルマントシャープニングを含めるための図８の方法の修正を示した図である。［００２０］一般的構成による符号化された音声信号を処理するための方法Ｍ２００に関するフローチャートを示す。［００２１］一般的構成による符号化された音声信号を処理するための装置ＭＦ２００に関するブロック図を示す。［００２２］一般的構成による符号化された音声信号を処理するための装置Ａ２００に関するブロック図を示す。［００２３］ネットワークＮＷ１０を通じて通信する送信端末１０２及び受信端末１０４の例を示したブロック図である。［００２４］音声符号器ＡＥ１０の実装ＡＥ２０のブロック図を示す。［００２５］フレーム符号器ＦＥ１０の基本的実装ＦＥ２０のブロック図を示す。［００２６］通信デバイスＤ１０のブロック図を示す。［００２７］無線デバイス１１０２のブロック図を示す。［００２８］ハンドセットＨ１００の前面図、後面図、及び側面図を示す。

［００２９］文脈上明示で制限されないかぎり、用語“信号”は、ここにおいては、それの通常の意味のうちのいずれかを示すために使用され、ワイヤ、バス、又はその他の送信媒体において表されるメモリ記憶場所（又はメモリ記憶場所の組）の状態を含む。文脈上明示で制限されないかぎり、用語“生成する”は、ここにおいては、それの通常の意味のうちのいずれか、例えば、演算すること又はその他の方法で生成すること、を示すために使用される。文脈上明示で制限されないかぎり、用語“計算する”は、ここにおいては、それの通常の意味のうちのいずれか、例えば、演算すること、評価すること、平滑化すること、及び／又は複数の値から選択すること、を示すために使用される。文脈上明示で制限されないかぎり、用語“入手する”は、ここにおいては、それの通常の意味のうちのいずれか、例えば、計算すること、導き出すこと、（例えば、外部のデバイスから）受信すること、（例えば、記憶素子のアレイから）取り出すこと、を示すために使用される。文脈上明示で制限されないかぎり、用語“選択する”は、それの通常の意味のうちのいずれか、例えば、２つ以上の物から成る組の中の少なくとも１つ、及びすべてよりも少ない物を識別すること、示すこと、適用すること、及び／又は使用すること、を示すために使用される。用語“備える”が本説明及び請求項において使用される場合は、その他の要素又は動作を除外しない。用語“に基づいて”（例えば、“ＡはＢに基づく”）は、それの通常の意味のうちのいずれかを示すために使用され、事例（ｉ）“から導き出された”（例えば、“Ｂは、Ａの先駆である”）、（ｉｉ）“少なくとも〜に基づいて”（例えば、“Ａは少なくともＢに基づく”）、及び、特定の文脈において該当する場合は、（ｉｉｉ）“に等しい” （例えば、“ＡはＢに等しい”）を含む。同様に、用語“に応答して”は、それの通常の意味のうちのいずれかを示すために使用され、“少なくとも〜に応答して”を含む。

［００３０］別記がないかぎり、用語“一連の”は、２つ以上の項目のシーケンスを示すために使用される。用語“対数”は、１０を底とする対数を示すために使用されるが、その他の底への該演算の拡張も本開示の適用範囲内である。用語“周波数成分”は、信号の周波数又は周波数帯域の組の中の１つ、例えば、（高速フーリエ変換又はＭＤＣＴによって生成された）信号の周波数−領域表現のサンプル、又はその信号のサブバンド（例えば、バーク尺度又はメル尺度サブバンド）を示すために使用される。

［００３１］別記がないかぎり、特定の特徴を有する装置の動作の開示は、類似の特徴を有する方法を開示することも明示で意図され（逆も同じ）、特定の構成による装置の動作の開示は、類似の構成を有する方法を開示することも明示で意図される（逆も同じ）。用語“構成”は、方法、装置、及び／又はシステムに言及して使用することができ、それの特定の文脈によって示される。用語“方法”、“プロセス”、“手順”、及び“技法”は、特定の文脈によって別の意味が示されないかぎり、一般的に及び互換可能な形で使用される。複数のサブタスクを有する“タスク”も方法である。用語“装置”及び“デバイス”も、特定の文脈によって別の意味が示されないかぎり、一般的に及び互換可能な形で使用される。用語“要素”及び“モジュール”は、典型的には、より大きい構成の一部分を示すために使用される。文脈によって明示で制限されないかぎり、用語“システム”は、ここにおいては、それの通常の意味のうちのいずれかを示すために使用され、“１つの共通の目的を果たすために相互に作用する要素のグループ”を含む。用語“複数”は、“２つ以上”を意味する。文書の一部に言及することによって組み入れられている場合は、その一部分におい言及される用語又は変数の定義、及び、組み入れられている一部分において言及される図も組み入れると理解されるべきであり、該定義は文書内の別の箇所で現れる場合も含む。

［００３２］用語“コーダ”、“コーデック”、及び“コーディングシステム”は、（おそらく１つ以上の前処理動作、例えば、知覚的重み付け及び／又はその他のフィルタリング動作、の後に）音声信号のフレームを受信及び符号化するように構成された少なくとも１つの符号器と、それらのフレームの復号された表現を生成するように構成された対応する復号器と、を含むシステムを表すために互換可能な形で使用される。該符号器及び復号器は、典型的には、通信リンクの反対側の端末に配備される。全二重通信をサポートするために、符号器及び復号器の両方の例は、典型的には、該リンクの各端部において配備される。

［００３３］別記がないかぎり、用語“ボコーダ”、“音声コーダ”、及び“話声コーダ”は、音声符号器及び対応する音声復号器の組み合わせを意味する。別記がないかぎり、用語“コーディング”は、コーデックを介しての音声信号の転送を示し、符号化及び後続する復号を含む。別記がないかぎり、用語“送信する”は、送信チャネル内への伝搬（例えば、信号）を示す。

［００３４］ここにおいて説明されるコーディング方式は、あらゆる音声信号（例えば、非話声音声を含む）をコーディングするために適用することができる。代替として、該コーディング方式は、話声のためのみに使用するのが望ましいであろう。該事例においては、コーディング方式は、音声信号の各フレームの内容のタイプを決定するための及び適切なコーディング方式を選択するための分類方式とともに使用することができる。

［００３５］ここにおいて説明されるコーディング方式は、プライマリコーデックとして又は多層又は多段コーデックにおける１つの層又は段として使用することができる。１つの該例では、該コーディング方式は、音声信号の周波数成分の一部分（例えば、低帯域又は高帯域）をコーディングするために使用され、信号の周波数成分の他の一部分をコーディングするために他のコーディング方式が使用される。

［００３６］線形予測（ＬＰ）解析−合成フレームワークは、話声合成に関するソース−システムパラダイムに非常に良く適合するため、話声コーディングに関して成功を収めている。特に、上方声道の経時でゆっくりと変化するスペクトル特性がオールポールフィルタによってモデル化され、他方、予測残差は、声帯の有声、無声、又は混合された励振挙動をキャプチャする。

［００３７］ＬＰ解析からの予測残差をモデル化及び符号化するためにはクローズドループでの合成による解析を使用するのが望ましいであろう。（例えば、図１において示されるような）合成による解析符号励振線形予測（ＣＥＬＰ）システムでは、入力話声と再構築された（又は“合成された”）話声との間の誤差を最小にする励起シーケンスが選択される。該システムにおいて最小化される誤差は、例えば、知覚的に重みが付けられた平均二乗誤差（ＭＳＥ）であることができる。

［００３８］図２は、話声信号のフレームの一例に関する高速フーリエ変換（ＦＦＴ）スペクトル及び対応するＬＰＣスペクトルを示す。この例では、フォルマント（ラベルＦ１乃至Ｆ４）におけるエネルギーの集中は、声道内での共鳴に対応し、より平滑なＬＰＣスペクトルにおいてはっきりと見ることができる。

［００３９］フォルマント領域における話声エネルギーは、本来であればそれらの領域において発生することがある雑音を部分的にマスキングすることを予想することができる。従って、量子化誤差に起因する雑音を高エネルギーフォルマントによってマスキングすることができるようにするために予測誤差を整形するための知覚的重み付けフィルタ（ＰＷＦ）を含めるようにＬＰコーダを実装するのが望ましい。

［００４０］（例えば、フォルマント領域の外側の予測誤差をより正確にモデル化できるようにするために）それらの領域内の予測誤差のエネルギーをデエンファサイズするＰＷＦＷ（ｚ）を以下のような式に従って実装することができる。

ここで、γ_１及びγ_２は、その値が０＜γ_２＜γ_１＜１の関係を満たす重みであり、ａ_ｉは、オールポールフィルタ、Ａ（ｚ）の係数であり、Ｌは、オールポールフィルタの次数（ｏｒｄｅｒ）である。典型的には、フィードフォワード（ｆｅｅｄｆｏｒｗａｒｄ）重みγ_１の値は、０．９以上であり（例えば、０．９４乃至０．９８の範囲内）、フィードバック重みγ_２の値は、０．４乃至０．７である。式（１ａ）において示されるように、γ_１及びγ_２の値は、異なるフィルタ係数ａ_ｉに関して異なることができ、又は、すべてのｉ、１≦ｉ≦Ｌに関してγ_１及びγ_２の同じ値を使用することができる。γ_１及びγ_２の値は、例えば、ＬＰＣスペクトルエンベロープに関連するチルト（ｔｉｌｔ）（又は平らさ）特性に従って選択することができる。一例においては、スペクトルチルトは、第１の反射係数によって示される。Ｗ（ｚ）が値｛γ_１、γ_２｝＝｛０．９２、０．６８｝を有する式（１ｂ）に従って実装される特定の例が、sections 4.3 and 5.3 of Technical Specification (TS) 26.190 v 11.0.0(AMR-WB speech codec, Sep. 2012, Third Generation Partnership Project (3GPP), Valbonne, FR) において記述されている。

［００４１］ＣＥＬＰコーディングにおいては、励起信号ｅ（ｎ）は、２つのコードブック、すなわち、適応型コードブック（ＡＣＢ）及び固定型コードブック（ＦＣＢ）、から生成される。励起信号ｅ（ｎ）は、以下のような式に従って生成することができる。

ここで、ｎは、サンプルインデックスであり、ｇ_ｐ及びｇ_ｃは、それぞれＡＣＢ利得及びＦＣＢ利得であり、ｖ（ｎ）及びｃ（ｎ）は、ＡＣＢベクトル及びＦＣＢベクトルである。ＡＣＢベクトルｖ（ｎ）は、過去の励起信号の遅延セグメント（すなわち、ピッチ値、例えば、クローズドループピッチ値だけ遅延）を表し、全体的励起の周期的コンポーネントに貢献する。ＦＣＢ励起ベクトルｃ（ｎ）は、励起信号内の残りの非周期的コンポーネントを部分的に表す。一例においては、ベクトルｃ（ｎ）は、インターリービングされたユニタリパルスの代数型コードブックを用いて構築される。ＦＣＢベクトルｃ（ｎ）は、全体的励起における周期的な貢献がｇ_ｐｖ（ｎ）でキャプチャされた後に固定型コードブック探索を行うことによって入手することができる。

［００４２］ここにおいて説明される方法、システム、及び装置は、音声信号を一連のセグメントとして処理するように構成することができる。典型的なセグメントの長さは、約５又は１０ミリ秒乃至約４０又は５０ミリ秒の範囲であり、セグメントは、重なり合うこと（例えば、隣接セグメントと２５％又は５０％重なり合う）又は重なり合わないことができる。１つの特定の例においては、音声信号は、各々が１０ミリ秒の長さを有する一連の重なり合わないセグメント又は“フレーム”に分割される。他の特定の例においては、各フレームは、２０ミリ秒の長さを有する。音声信号に関するサンプリングレートの例は、（限定することなしに）８、１２、１６、３２、４４．１、４８、及び１９２キロヘルツを含む。該方法、システム、又は装置は、ＬＰ解析をサブフレームごとに更新するのが望ましいであろう（例えば、各フレームが、ほぼ同じサイズの２つ、３つ、又は４つのサブフレームに分割される）。さらに加えて又は代替として、該方法、システム、又は装置は、励起信号をサブフレームごとに生成するのが望ましい。

［００４３］図１は、低ビットレート話声コーディングに関するコード励起線形予測（ＣＥＬＰ）の合成による解析アーキテクチャに関する概略図を示す。この図では、ｓは、入力された話声であり、ｓ（ｎ）は、前処理された話声であり、

は、再構築された話声であり、Ａ（ｚ）は、ＬＰ解析フィルタである。

［００４４］ピッチシャープニング及び／又はフォルマントシャープニング技法を採用するのが望ましく、それらは、特に低ビットレートにおいて、話声再構築品質の有意な向上を提供することができる。該技法は、ＦＣＢ探索前に、重み付き合成フィルタのインパルス応答（例えば、

は、量子化された合成フィルタを表す）においてピッチシャープニング及びフォルマントシャープニングを最初に適用し、次に、後述されるように推定されたＦＣＢベクトルｃ（ｎ）においてシャープニングを適用することによって実装することができる。

［００４５］１）ＡＣＢベクトルｖ（ｎ）は、信号ｓ（ｎ）内の全ピッチエネルギーをキャプチャするわけではないこと、及び、ＦＣＢ探索は、ピッチエネルギーの一部を含む残りの部分に従って行われることを予想することができる。従って、ＦＣＢベクトル内の対応する成分をシャープニングするために現在のピッチ推定値（例えば、クローズドループピッチ値）を使用するのが望ましい。ピッチシャープニングは、以下のような伝達関数を用いて行うことができる。

ここで、τは、現在のピッチ推定値に基づく（例えば、τは、最寄りの整数値に丸められたクローズドループピッチ値である）。推定されたＦＣＢベクトルｃ（ｎ）は、該ピッチプリフィルタＨ_１（ｚ）を用いてフィルタリングされる。フィルタＨ_１（ｚ）は、ＦＣＢ推定前に重み付き合成フィルタのインパルス応答に（例えば、

のインパルス応答に）も適用される。他の例においては、フィルタＨ_１（ｚ）は、例えば、以下の中の適応型コードブック利得ｇ_ｐに基づく。

（例えば、第三世代パートナーシッププロジェクト２（３ＧＰＰ２）文書Ｃ．Ｓ００１４−Ｅｖ１．０，Ｄｅｃ．２０１１，Ａｒｌｉｎｇｔｏｎ，ＶＡの第４．１２．４．１４節において記述される）、ここで、ｇ_ｐの値（０≦ｇ_ｐ≦１）は、値［０．２，０．９］によって囲むことができる。

［００４６］２）ＦＣＢ探索は、完全に雑音ではなく、フォルマント領域のより多くのエネルギーを含む残りの部分に従って行われることを予想することができる。フォルマントシャープニング（ＦＳ）は、上述されるフィルタＷ（ｚ）に類似する知覚的重み付けフィルタを用いて行うことができる。しかしながら、この場合は、重みの値は、０＜γ_１＜γ_２＜１の関係を満たす。１つの該例においては、フィードフォワード重みに関する値γ_１＝０．７５及びフィードバック重みに関するγ_２＝０．９が使用される。

フォルマント内の量子化雑音を隠すためにデエンファシスを行う式（１）内のＰＷＦＷ（ｚ）と異なり、式（４）に示されるＦＳフィルタＨ_２（ｚ）は、ＦＣＢ励起に関連するフォルマント領域をエンファサイズする。推定されたＦＣＢベクトルｃ（ｎ）は、該ＦＳフィルタＨ_２（ｚ）を用いてフィルタリングされる。フィルタＨ_２（ｚ）は、ＦＣＢ推定前に重み付き合成フィルタのインパルス応答に（例えば、

のインパルス応答に）も適用される。

［００４７］ピッチシャープニング及びフォルマントシャープニングを用いて入手することができる話声再構築品質の向上は、基礎になる話声信号モデル及びクローズドループピッチτ及びＬＰ解析フィルタＡ（ｚ）の推定における精度に直接依存することができる。幾つかの大規模な聴覚試験に基づき、フォルマントシャープニングは、クリーンな話声における大きな品質利得に貢献できることが実験的に検証されている。しかしながら、雑音が存在する状態では、ある程度の劣化が一貫して観察されている。フォルマントシャープニングを原因とする劣化は、ＦＳフィルタの不正確な推定に起因し、及び／又は雑音を追加で考慮する必要があるソース−システム話声モデルの幾つかの制限事項に起因することができる。

［００４８］高帯域ＬＰＣフィルタ係数を入手するために狭帯域ＬＰＣフィルタ係数をスペクトル拡大することによって（代替として、高帯域ＬＰＣフィルタ係数を符号化された信号に含めることによって）及び高帯域励起信号を入手するために（例えば、非線形関数、例えば、絶対値又は平方化、を用いて）狭帯域励起信号をスペクトル拡大することによって、（例えば、０、５０、１００、２００、３００又は３５０ヘルツ乃至３、３．２、３．４、３．５、４、６．４、又は８ｋＨｚの帯域幅を有する）復号された狭帯域話声信号の帯域幅を増大させて高帯域（例えば、７、８、１２、１４、１６、又は２０ｋＨｚ）にするために帯域幅拡大技法を使用することができる。残念なことに、フォルマントシャープニングを原因とする劣化は、該変換された低帯域励起が高帯域合成において使用される帯域幅拡大が存在する状態ではより激しくなるおそれがある。

［００４９］クリーンな話声及び雑音のある話声の両方においてＦＳに起因する品質向上を保持するのが望ましいであろう。フォルマント−シャープニング（ＦＳ）率を好適に変化させるアプローチ法がここにおいて説明される。特に、品質向上は、雑音が存在する状態でフォルマントシャープニングを行うための積極性のより低いエンファシスファクタγ_２を使用時に注目された。

［００５０］図３Ａは、タスクＴ１００、Ｔ２００、及びＴ３００を含む一般的構成による音声信号を処理するための方法Ｍ１００に関するフローチャートを示す。タスクＴ１００は、経時での音声信号に関する平均信号対雑音比を決定する（例えば、計算する）。平均ＳＮＲに基づき、タスクＴ２００は、フォルマントシャープニング率を決定する（例えば、計算する、推定する、ルックアップテーブルから取り出す、等）。“フォルマントシャープニング率”（又は“ＦＳ率”）は、話声コーディング（又は復号）システムにおいて適用することができるパラメータに対応し、従って、システムは、そのパラメータの異なる値に応答して異なるフォルマントエンファシス結果を生み出す。例示することを目的として、フォルマントシャープニング率は、フォルマントシャープニングフィルタのフィルタパラメータであることができる。例えば、式１（ａ）、式１（ｂ）、及び式４のγ_１及び／又はγ_２は、フォルマントシャープニング率である。フォルマントシャープニング率γ_２は、例えば、図５及び６Ａ乃至６Ｃに関して説明されるような、長期的信号対雑音比に基づいて決定することができる。フォルマントシャープニング率γ_２は、その他の要因、例えば、ボイシング（ｖｏｉｃｉｎｇ）、コーディングモード、及び／又はピッチタグに基づいて決定することができる。タスクＴ３００は、ＦＳ率に基づくフィルタを音声信号からの情報に基づくＦＣＢベクトルに適用する。

［００５１］実施形態例では、図３ＡのタスクＴ１００は、その他の中間的な率、例えば、ボイシング率（例えば、０．８乃至１．０の範囲内のボイシング値は、強い有声のセグメントに対応し、０乃至０．２の範囲内のボイシング値は、弱い有声のセグメントに対応する）、コーディングモード（例えば、話声、音楽、沈黙、遷移フレーム、又は無声のセグメント）、及びピッチラグに対応する。これらの補助的なパラメータは、フォルマントシャープニング率を決定するために平均ＳＮＲと共に又は平均ＳＮＲの代わりに使用することができる。

［００５２］タスクＴ１００は、雑音推定を行うために及び長期的ＳＮＲを計算するために実装することができる。例えば、タスクＴ１００は、音声信号の非アクティブなセグメント中に長期的雑音推定値を追跡するために及び音声信号のアクティブなセグメント中に長期的信号エネルギーを計算するために実装することができる。音声信号のセグメント（例えば、フレーム）がアクティブであるか又は非アクティブであるかは、符号器の他のモジュール、例えば、音声区間検出器（ｖｏｉｃｅａｃｔｉｖｉｔｙｄｅｔｅｃｔｏｒ）、によって示すことができる。タスクＴ１００は、長期的ＳＮＲを計算するために一時的に平滑化された雑音及び信号エネルギー推定値を使用することができる。

［００５３］図４は、タスクＴ１００によって行うことができる長期的ＳＮＲＦＳ_ｌｔＳＮＲを計算するための擬似コードリストの例を示し、ここで、ＦＳ_ｌｔＮｓＥｎｅｒ及びＦＳ_ｌｔＳｐＥｎｅｒは、長期的雑音エネルギー推定値及び長期的話声エネルギー推定値をそれぞれ表す。この例では、雑音及び信号エネルギー推定値の両方に関して０．９９の値を有する一時的平滑化率が使用されるが、概して、各々の該率は、ゼロ（平滑化なし）と１（更新なし）との間のあらゆる希望される値を有することができる。

［００５４］タスクＴ２００は、フォルマントシャープニング率を経時で好適に変化させるために実装することができる。例えば、タスクＴ２００は、次のフレームに関するフォルマントシャープニング率を好適に変化させるために現在のフレームからの推定された長期的ＳＮＲを使用するために実装することができる。図５は、タスクＴ２００によって行うことができる長期的ＳＮＲに従ってＦＳ率を推定するための擬似コードリストの例を示す。図６Ａは、図５のリストにおいて使用されるパラメータのうちの一部を例示するγ_２値対長期的ＳＮＲのプロット例である。タスクＴ２００は、下限（例えば、ＧＡＭＭＡ２ＭＩＮ）及び上限（例えば、ＧＡＭＭＡ２ＭＡＸ）を課すために計算されたＦＳ率をクリッピングするサブタスクを含むこともできる。

［００５５］タスクＴ２００は、γ_２値対長期的ＳＮＲの異なるマッピングを使用するために実装することもできる。該マッピングは、１つ、２つ、又はそれ以上の追加の反曲点及び隣接する反曲点間で異なる傾きを有する区分的線形であることができる。該マッピングの傾きは、図６Ｂの例において示されるように、より低いＳＮＲに関してより急であり、より高い傾きに関してはより緩やかであることができる。代替として、該マッピングは、非線形関数、例えば、ｇａｍｍａ

などであることができるか、又は図６Ｃの例において示されるとおりであることができる。

［００５６］タスクＴ３００は、タスクＴ２００によって生成されたＦＳ率を用いて、ＦＣＢ励起においてフォルマントシャープニングフィルタを適用する。フォルマントシャープニングフィルタＨ_２（ｚ）は、例えば、以下のような式に従って実装することができる。

クリーンな話声に関して、及び高いＳＮＲが存在する状態で、γ_２の値は図５の例における０．９に近く、その結果、積極的なフォルマントシャープニングが得られることに注目すること。約１０乃至１５ｄＢの低いＳＮＲでは、γ_２の値は約０．７５乃至０．７８であり、その結果、フォルマントシャープニングが得られないか又は積極性が低いフォルマントシャープニングになる。

［００５７］帯域幅拡大では、高帯域合成のためにフォルマントシャープニングされた低帯域励起を使用することは、その結果として、アーティファクトが発生するおそれがある。高帯域に対する影響が無視できる大きさに維持されるような形でＦＳ率を変化させるためにここにおいて説明される方法Ｍ１００の実装を使用することができる。代替として、高帯域励起に対するフォルマントシャープニングの貢献は、（例えば、高帯域励起生成においてＦＣＢベクトルのプリシャープニングバージョンを用いることによって、又は、狭帯域及び高帯域の両方における励起生成のためのフォルマントシャープニングをディスエーブルにすることによって）ディスエーブルにすることができる。該方法は、例えば、ポータブル通信デバイス、例えば、携帯電話、内で実行することができる。

［００５８］図３Ｄは、タスクＴ２２０とＴ２４０とを含む方法Ｍ１００の実装Ｍ１２０のフローチャートを示す。タスクＴ２２０は、決定されたＦＳ率に基づくフィルタ（例えば、ここにおいて説明されるフォルマントシャープニングフィルタ）を合成フィルタ（例えば、ここにおいて説明される重み付き合成フィルタ）のインパルス応答に適用する。タスクＴ２４０は、タスクＴ３００が実行されるＦＣＢベクトルを選択する。例えば、タスクＴ２４０は、（例えば、ここにおける図８において説明されるように及び／又は３ＧＰＰＴＳ２６．１９０ｖ１１．０．０のｓｅｃｔｉｏｎ５．８におけるように）コードブック探索を行うように構成することができる。

［００５９］図３Ｂは、タスクＴ１００、Ｔ２００、及びＴ３００を含む一般的構成に従って音声信号を処理するための装置ＭＦ１００に関するブロック図を示す。装置ＭＦ１００は、（例えば、タスクＴ１００を参照してここおいて説明されるように）経時での音声信号に関する平均信号対雑音比を計算するための手段Ｆ１００を含む。実施形態例では、装置ＭＦ１００は、その他の中間的な率、例えば、ボイシング率（例えば、０．８乃至１．０の範囲内のボイシング値は、強い有声のセグメントに対応し、０乃至０．２の範囲内のボイシング値は、弱い有声のセグメントに対応する）、コーディングモード（例えば、話声、音楽、沈黙、遷移フレーム、又は無声のセグメント）、及びピッチラグを計算するための手段Ｆ１００を含むことができる。これらの補助的なパラメータは、フォルマントシャープニング率を決定するために平均ＳＮＲと共に又は平均ＳＮＲの代わりに使用することができる。

［００６０］装置ＭＦ１００は、（例えば、タスク２００を参照してここにおいて説明されるように）計算された平均ＳＮＲに基づいてフォルマントシャープニング率を計算するための手段Ｆ２００も含む。装置ＭＦ１００は、計算されたＦＳ率に基づくフィルタを（例えば、タスクＴ３００を参照してここにおいて説明されるように）音声信号からの情報に基づくＦＣＢベクトルに適用するための手段Ｆ３００も含む。該装置は、例えば、ポータブル通信デバイス、例えば、携帯電話、の符号器内に実装することができる。

［００６１］図３Ｅは、計算されたＦＳ率に基づくフィルタを（例えば、タスクＴ２２０を参照してここにおいて説明されるように）合成フィルタのインパルス応答に適用するための手段Ｆ２２０を含む装置ＭＦ１００の実装ＭＦ１２０のブロック図を示す。装置ＭＦ１２０は、（例えば、タスクＴ２４０を参照してここにおいて説明されるように）ＦＣＢベクトルを選択するための手段Ｆ２４０も含む。

［００６２］図３Ｃは、第１の計算器１００と、第２の計算器２００と、フィルタ３００と、を含む一般的構成による音声信号を処理するための装置Ａ１００に関するブロック図を示す。計算器１００は、（例えば、タスクＴ１００を参照してここにおいて説明されるように）経時での音声信号に関する平均信号対雑音比を決定する（例えば、計算する）ように構成される。計算器２００は、（例えば、タスクＴ２００を参照してここにおいて説明されるように）計算された平均ＳＮＲに基づいてフォルマントシャープニング率を決定する（例えば、計算する）ように構成される。フィルタ３００は、（例えば、タスクＴ３００を参照してここにおいて説明されるように）計算されたＦＳ率に基づき、及び音声信号からの情報に基づくＦＣＢベクトルをフィルタリングするように配置される。該装置は、例えば、ポータブル通信デバイス、例えば、携帯電話、の符号器内で実装することができる。

［００６３］図３Ｆは、（例えば、タスクＴ２２０を参照してここにおいて説明されるように）フィルタ３００が合成フィルタのインパルス応答をフィルタリングするように配置される装置Ａ１００の実装Ａ１２０のブロック図を示す。装置Ａ１２０は、（例えば、タスクＴ２４０を参照してここにおいて説明されるように）ＦＣＢベクトルを選択するように構成されたコードブック探索モジュール２４０も含む。

［００６４］図７及び８は、ここにおいて説明されるように適応型フォルマントシャープニングを含めるために修正することができるＦＣＢ推定方法の追加の詳細を示す。図７は、前処理された話声信号ｓ（ｎ）に基づく予測誤差及び前サブフレームの最後に入手された励起信号に対して重み付き合成フィルタを適用することによる適応型コードブック探索に関するターゲット信号ｘ（ｎ）の生成を例示する。

［００６５］図８では、重み付き合成フィルタのインパルス応答ｈ（ｎ）は、ＡＣＢ成分ｙ（ｎ）を生成するためにＡＣＢベクトルｖ（ｎ）と畳み込まれる。ＡＣＢ成分ｙ（ｎ）は、ＦＣＢ探索のための修正されたターゲット信号ｘ’（ｎ）を生成するためにターゲット信号ｘ（ｎ）から減じられるＡＣＢ貢献を生成するためにｇ_ｐによって重みが付けられ、それは、例えば、（ＴＳ２６．１９０ｖ１１．０．０のｓｅｃｔｉｏｎ５．８．３において説明されるように）図８において示される探索項を最大化するＦＣＢパルスのインデックス位置ｋを見つけるために行うことができる。

［００６６］図９は、ここにおいて説明されるように適応型フォルマントシャープニングを含めるために図８に示されるＦＣＢ推定手順を修正することを示す。この事例では、修正されたインパルス応答ｈ’（ｎ）を生成するために重み付き合成フィルタのインパルス応答ｈ（ｎ）にフィルタＨ_１（ｚ）及びＨ_２（ｚ）が適用される。これらのフィルタは、探索後のＦＣＢ（又は“代数型コードブック”）にも適用される。

［００６７］復号器は、フィルタＨ_１（ｚ）及びＨ_２（ｚ）をＦＣＢベクトルに適用するために実装することができる。１つの該例においては、符号器は、計算されたＦＳ率を符号化されたフレームのパラメータとして復号器に送信するために実装される。この実装は、復号された信号におけるフォルマントシャープニングの規模を制御するために使用することができる。他の該例においては、復号器は、（例えば、図４及び５の擬似コードリストを参照してここにおいて説明されるように）ローカルで生成することができる長期的ＳＮＲ推定値に基づいてフィルタＨ_１（ｚ）及びＨ_２（ｚ）を生成するために実装され、従って、追加の送信された情報は要求されない。しかしながら、この事例では、符号器及び復号器におけるＳＮＲ推定値は、例えば、復号器におけるフレーム消去の大きなバーストに起因して非同期化する可能性がある。このような潜在的なＳＮＲドリフトは、符号器及び復号器における長期的ＳＮＲ推定値の（例えば、現在の瞬間的ＳＮＲへの）同期的及び周期的なリセットを行うことによって予防的に対処するのが望ましい。一例においては、該リセットは、定期的な間隔で（例えば、５秒ごとに、又は２５０フレームごとに）実行される。他の例においては、該リセットは、長い不活動期間（例えば、少なくとも２秒の期間、又は少なくとも１００の連続する非アクティブフレームのシーケンス）後に発生する話声セグメントの開始時に行われる。

［００６８］図１０Ａは、タスクＴ５００、Ｔ６００、及びＴ７００を含む一般的構成による符号化された音声信号を処理する方法Ｍ２００に関するフローチャートを示す。タスクＴ５００は、符号化された音声信号の第１のフレームからの情報に基づいて、（例えば、タスクＴ１００を参照してここにおいて説明されるように）経時での平均信号対雑音比を決定する（例えば、計算する）。タスクＴ６００は、（例えば、タスクＴ２００を参照してここにおいて説明されるように）平均信号対雑音比に基づいて、フォルマントシャープニング率を決定する（例えば、計算する）。タスクＴ７００は、フォルマントシャープニング率に基づくフィルタ（例えば、ここにおいて説明されるＨ_２（ｚ）又はＨ_１（ｚ）Ｈ_２（ｚ））を、符号化された音声信号の第２のフレームからの情報に基づくコードブックベクトル（例えば、ＦＣＢベクトル）に適用する。該方法は、例えば、ポータブル通信デバイス、例えば、携帯電話、内で実行することができる。

［００６９］図１０Ｂは、一般的構成による符号化された音声信号を処理するための装置ＭＦ２００のブロック図を示す。装置ＭＦ２００は、符号化された音声信号の第１のフレームからの情報に基づいて、（例えば、タスクＴ１００を参照してここにおいて説明されるように）経時での平均信号対雑音比を計算するための手段Ｆ５００を含む。装置ＭＦ２００は、（例えば、タスクＴ２００を参照してここにおいて説明されるように）計算された平均信号対雑音比に基づいて、フォルマントシャープニング率を計算するための手段Ｆ６００も含む。装置ＭＦ２００は、計算されたフォルマントシャープニング率に基づくフィルタ（例えば、ここにおいて説明されるＨ_２（ｚ）又はＨ_１（ｚ）Ｈ_２（ｚ））を、符号化された音声信号の第２のフレームからの情報に基づくコードブックベクトル（例えば、ＦＣＢベクトル）に適用するための手段Ｆ７００も含む。該装置は、例えば、ポータブル通信デバイス、例えば、携帯電話、内に実装することができる。

［００７０］図１０Ｃは、一般的構成による符号化された音声信号を処理するための装置Ａ２００のブロック図を示す。装置Ａ２００は、符号化された音声信号の第１のフレームからの情報に基づいて、（例えば、タスクＴ１００を参照してここにおいて説明されるように）経時での平均信号対雑音比を決定するように構成された第１の計算器５００を含む。装置Ａ２００は、（例えば、タスクＴ２００を参照してここにおいて説明されるように）平均信号対雑音比に基づいて、フォルマントシャープニング率を決定するように構成された第２の計算器６００も含む。装置Ａ２００は、フォルマントシャープニング率に基づくフィルタ７００（例えば、ここにおいて説明されるＨ_２（ｚ）又はＨ_１（ｚ）Ｈ_２（ｚ））も含み、符号化された音声信号の第２のフレームからの情報に基づくコードブックベクトル（例えば、ＦＣＢベクトル）をフィルタリングするように配置される。該装置は、例えば、ポータブル通信デバイス、例えば、携帯電話、内に実装することができる。

［００７１］図１１Ａは、送信チャネルＴＣ１０を介してネットワークＮＷ１０を通じて通信する送信端末１０２及び受信端末１０４の例を示したブロック図である。端末１０２及び１０４の各々は、ここにおいて説明される方法を実行するために及び／又はここにおいて説明される装置を含めるために実装することができる。送信端末及び受信端末１０２、１０４は、電話（例えば、スマートフォン）、コンピュータ、音声ブロードキャスト及び受信装置、ビデオ会議装置、等を含む声の通信をサポートすることが可能なあらゆるデバイスであることができる。送信端末及び受信端末１０２、１０４は、例えば、無線多元接続技術、例えば、符号分割多元接続（ＣＤＭＡ）能力、を用いて実装することができる。ＣＤＭＡは、拡散スペクトル通信に基づく変調及び多元接続方式である。

［００７２］送信端末１０２は、音声符号器ＡＥ１０を含み、受信端末１０４は、音声復号器ＡＤ１０を含む。音声符号器ＡＥ１０は、人間の話声の生成モデルに従ってパラメータ値を抽出することによって第１のユーザインタフェースＵＩ１０（例えば、マイク及びオーディオフロント−エンド）からの音声情報（例えば、話声）を圧縮するために使用することができ、ここにおいて説明されるように方法を実行するために実装することができる。チャネル符号器ＣＥ１０は、パラメータ値を集めてパケットにし、送信機ＴＸ１０は、送信チャネルＴＣ１０を介して、パケットに基づくネットワーク、例えば、インターネット又はコーポレートイントラネット、を含むことができるネットワークＮＷ１０を通じてこれらのパラメータ値を含むパケットを送信する。送信チャネルＴＣ１０は、有線及び／又は無線の送信チャネルであることができ、及び、チャネルの品質がどのように及びどこで決定されるかに依存して、ネットワークＮＷ１０の入口点（例えば、基地局コントローラ）まで、ネットワークＮＷ１０内の他のエンティティ（例えば、チャネル品質解析器）まで、及び／又は受信端末１０４の受信機ＲＸ１０まで延長するとみなすことができる。

［００７３］受信端末１０４の受信機ＲＸ１０は、送信チャネルを介してネットワークＮＷ１０からパケットを受信するために使用される。チャネル復号器ＣＤ１０は、パラメータ値を入手するためにパケットを復号し、音声復号器ＡＤ１０は、（例えば、ここにおいて説明される方法に従って）パケットからのパラメータ値を用いて音声情報を合成する。合成された音声（例えば、話声）は、受信端末１０４の第２のユーザインタフェースＵＩ２０（例えば、音声出力段及び拡声器）に提供される。示されていないが、チャネル符号器ＣＥ１０及びチャネル復号器ＣＤ１０では様々な信号処理機能（例えば、巡回冗長検査（ＣＲＣ）機能を含む畳み込み式コーディング、インターリービング）及び送信機ＴＸ１０及び受信機ＲＸ１０では様々な信号処理機能（例えば、デジタル変調及び対応する復調、拡散スペクトル処理、アナログ−デジタル変換及びデジタル−アナログ変換）を実行することができる。

［００７４］通信の各当事者は、送信及び受信することができ、各端末は、音声符号器ＡＥ１０及び復号器ＡＤ１０の例を含むことができる。音声符号器及び復号器は、別個のデバイスであること又は“ボイスコーダ”又は“ボコーダ”と呼ばれる単一のデバイスに一体化することができる。図１１Ａにおいて示されるように、端末１０２、１０４は、ネットワークＮＷ１０の一方の端末における音声符号器ＡＥ１０及び他方における音声復号器ＡＤ１０を用いて説明される。

［００７５］送信端末１０２の少なくとも１つの構成では、音声信号（例えば、話声）は、第１のユーザインタフェースＵＩ１０から音声符号器ＡＥ１０にフレームで入力することができ、各フレームは、サブフレームにさらに分割される。何らかのブロック処理が行われる場合は該任意のフレーム境界を使用することができる。しかしながら、音声サンプルをフレーム（及びサブフレーム）に該分割することは、ブロック処理ではなく連続処理が実装される場合は省略することができる。説明される例では、ネットワークＮＷ１０を通じて送信された各パケットは、特定の用途及び全体的な設計上の制約事項に依存して１つ以上のフレームを含むことができる。

［００７６］音声符号器ＡＥ１０は、可変レート又は単一の固定レートの符号器であることができる。可変レート符号器は、音声の内容に依存して（例えば、話声が存在するかどうか及び／又はどのタイプの話声が存在するかに依存して）、フレームごとに複数の符号器モード（例えば、異なる固定レート）の間で動的に切り換わることができる。音声復号器ＡＤ１０も、対応する方法でフレームごとに対応する復号器モード間で動的に切り換わることができる。受信端末１０４において受け入れ可能な信号再生品質を維持しつつ各フレームが利用可能な最低のビットレートを達成するために特定のモードを選択することができる。

［００７７］音声符号器ＡＥ１０は、典型的には、入力信号を時間的に重なり合わない一連のセグメント又は“フレーム”として処理し、新しい符号化されたフレームが各フレームに関して計算される。フレーム期間は、概して、信号がローカルで静止していると予想することができる期間であり、共通例は、２０ミリ秒（１６ｋＨｚのサンプリングレートで３２０サンプル、１２．８ｋＨｚのサンプリングレートで２５６サンプル、又は８ｋＨｚのサンプリングレートで１６０サンプルに相当）及び１０ミリ秒を含む。入力信号を一連の重なり合うフレームとして処理するために音声符号器ＡＥ１０を実装することも可能である。

［００７８］図１１Ｂは、フレーム符号器ＦＥ１０を含む音声符号器ＡＥ１０の実装ＡＥ２０のブロック図を示す。フレーム符号器ＦＥ１０は、１つのシーケンスの符号化された音声フレームＥＦのうちの対応する１つを生成するために入力信号の１つのシーケンスのフレームＣＦ（“コア音声フレーム”）の各々を符号化するように構成される。音声符号器ＡＥ１０は、追加のタスク、例えば、入力信号をフレームに分割すること、及び、フレーム符号器ＦＥ１０に関するコーディングモードを選択すること（例えば、タスクＴ４００を参照してここにおいて説明されるように、最初のビット割り当ての再割り当てを選択すること）、を実行するために実装することもできる。コーディングモード（例えば、レート制御）を選択することは、音声区間検出（ＶＡＤ）を行うこと及び／又はフレームの音声内容を分類することを含むことができる。この例では、音声符号器ＡＥ２０は、（例えば、ＥＴＳＩにおいて入手可能な、３ＧＰＰＴＳ２６．１９４ｖ１１．０．０，Ｓｅｐ．２０１２において説明されるように）音声区間検出信号ＶＳを生成するためにコア音声フレームＣＦを処理するように構成される音声区間検出器ＶＡＤ１０も含む。

［００７９］フレーム符号器ＦＥ１０は、（Ａ）フィルタを記述する一組のパラメータ及び（Ｂ）音声フレームの合成された再生を生成するために記述されるフィルタを駆動するために復号器において使用される励起信号として入力音声信号の各フレームを符号化するソース−フィルタモデルに従ってコードブックに基づく方式（例えば、コードブック励起線形予測又はＣＥＬＰ）を実行するために実装される。話声信号のスペクトルエンベロープは、典型的には、声道（例えば、喉及び口）の共鳴を表すピークが特徴であり、フォルマントと呼ばれる。ほとんどの話声コーダは、少なくともこの粗いスペクトル構造を一組のパラメータ、例えば、フィルタ係数、として符号化する。残りの残差信号は、話声信号を生成するためにフィルタを駆動し及び典型的には強度及びピッチを特徴とする（例えば、声帯によって生成された）ソースとしてモデル化することができる。

［００８０］符号化されたフレームＥＦを生成するためにフレーム符号器ＦＥ１０によって使用することができる符号化方式の特定の例は、限定することなしに、Ｇ．７２６、Ｇ．７２８、Ｇ．７２９Ａ、ＡＭＲ、ＡＭＲ−ＷＢ、ＡＭＲ−ＷＢ＋（例えば、３ＧＰＰＴＳ２６．２９０ｖ１１．０．０，Ｓｅｐ．２０１２（ＥＴＳＩから入手可能）において記述）、ＶＭＲ−ＷＢ（例えば、第三世代パートナーシッププロジェクト２（３ＧＰＰ２）ｄｏｃｕｍｅｎｔＣ．Ｓ００５２−Ａｖ１．０、Ａｐｒ．２００５（ｗｗｗ−ｄｏｔ−３ｇｐｐ２−ｄｏｔ−ｏｒｇにおいてオンラインで利用可能）において記述）、ＥｎｈａｎｃｅｄＶａｒｉａｂｌｅＲａｔｅＣｏｄｅｃ（ＥＶＢＲＣ、３ＧＰＰ２ｄｏｃｕｍｅｎｔＣ．Ｓ００１４−Ｅｖ１．０、Ｄｅｃ．２００１１（ｗｗｗ−ｄｏｔ−３ｇｐｐ２−ｄｏｔ−ｏｒｇにおいてオンラインで利用可能）において記述）、ＳｅｌｅｃｔａｂｌｅＭｏｄｅＶｏｃｏｄｅｒ話声コーデック（３ＧＰＰ２ｄｏｃｕｍｅｎｔＣ．Ｓ００３０−０，ｖ３．０、Ｊａｎ．２００４（ｗｗｗ−ｄｏｔ−３ｇｐｐ２−ｄｏｔ−ｏｒｇにおいてオンラインで利用可能）において記述）、及びＥｎｈａｎｃｅｄＶｏｉｃｅＳｅｒｖｉｃｅコーデック（ＥＶＳ、例えば、ＥＴＳＩから入手可能な、３ＧＰＰＴＲ２２．８１３ｖ１０．０．０（Ｍａｒｃｈ２０１０）において記述）を含む。

［００８１］図１２は、前処理モジュールＰＰ１０と、線形予測コーディング（ＬＰＣ）解析モジュールＬＡ１０と、オープンループピッチ探索モードＯＬ１０と、適応型コードブック（ＡＣＢ）探索モジュールＡＳ１０と、固定型コードブック（ＦＣＢ）探索モジュールＦＳ１０と、利得ベクトル量子化（ＶＱ）モジュールＧＶ１０と、を含むフレーム符号器ＦＥ１０の基本的実装ＦＥ２０のブロック図を示す。前処理モジュールＰＰ１０は、例えば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０のｓｅｃｔｉｏｎ５．１において記述されるように実装することができる。１つの該例においては、前処理モジュールＰＰ１０は、（１６ｋＨｚから１２．８ｋＨｚへの）コア音声フレームのダウンサンプリング、ダウンサンプリングされたフレーム（例えば、５０Ｈｚのカットオフ周波数を有する）のハイパスフィルタリング、及び（例えば、ファーストオーダーハイパスフィルタを用いて）フィルタリングされたフレームのプリエンファシスを行うために実装される。

［００８２］線形予測コーディング（ＬＰＣ）解析モジュールＬＡ１０は、各コア音声フレームのスペクトルエンベロープを一組の線形予測（ＬＰ）係数（例えば、上述されるオールポールフィルタ１／Ａ（ｚ）の係数）として符号化する。一例においては、ＬＰＣ解析モジュールＬＡ１０は、各２０ミリ秒フレームのフォルマント構造の特徴を描写するための１６のＬＰフィルタ係数の組を計算するように構成される。解析モジュールＬＡ１０は、例えば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０のｓｅｃｔｉｏｎ５．２において記述されるように実装することができる。

［００８３］解析モジュールＬＡ１０は、各フレームのサンプルを直接解析するように構成することができ、又は、サンプルは、最初に、ウィンドウ関数（例えば、ハミングウィンドウ）により重みを付けることができる。解析は、フレームよりも大きいウィンドウ、例えば、３０ミリ秒ウィンドウ、を通じて行うこともできる。このウィンドウは、対称的（例えば、５−２０−５、従って、２０ミリ秒フレームの直前及び直後の５ミリ秒を含む）又は非対称的（例えば、１０−２０、従って、先行するフレームの最後の１０ミリ秒を含む）であることができる。ＬＰＣ解析モジュールは、典型的には、レビンソン・ダービン再帰法又はＬｅｒｏｕｘ−Ｇｕｅｇｕｅｎアルゴリズムを用いてＬＰフィルタ係数を計算するように構成される。ＬＰＣ符号化は、話声に非常に適するが、一般的音声信号（例えば、非話声、例えば、音楽、を含む）を符号化するために使用することもできる。他の実装においては、解析モジュールは、ＬＰフィルタ係数の組の代わりに各フレームに関するケプストラム係数の組を計算するように構成することができる。

［００８４］線形予測フィルタ係数は、典型的には、効率的に量子化するのは困難であり、通常は、量子化及び／又はエントロピー符号化のために、他の表現、例えば、線スペクトル対（ＬＳＰ）又は線スペクトル周波数（ＬＳＦ）、又は、イミッタンススペクトル対（ＩＳＰ）又はイミッタンススペクトル周波数（ＩＳＦ）、にマッピングされる。一例においては、解析モジュールＬＡ１０は、ＬＰフィルタ係数の組を対応するＩＳＦの組に変換する。ＬＰフィルタ係数のその他の１対１の表現は、パーコール係数と、ログ面積比値とを含む。典型的には、ＬＰフィルタ係数の組と対応するＬＳＦ、ＬＳＰ、ＩＳＦ、又はＩＳＰの組との間の変換は、逆転可能であるが、実施形態は、誤差なしで変換を逆転することができない解析モジュールＬＡ１０の実装も含む。

［００８５］解析モジュールＬＡ１０は、ＩＳＦ（又はＬＳＦ又はその他の係数表現）の組を量子化するように構成され、フレーム符号器ＦＥ２０は、この量子化の結果をＬＰＣインデックスＸＬとして出力するように構成される。該量子化器は、典型的には、テーブル又はコードブック内の対応するエントリのインデックスとして入力ベクトルを符号化するベクトル量子化器を含む。モジュールＬＡ１０は、（例えば、ＡＣＢ探索モジュールＡＳ１０によって）ここにおいて説明される重み付き合成フィルタの計算のための量子化された係数ａ＾_ｉを提供するようにも構成される。

［００８６］フレーム符号器ＦＥ２０は、ピッチ解析を単純化するために及び適応型コードブック探索モジュールＡＳ１０でのクローズドループピッチ探索の範囲を狭くするために使用することができる任意選択のオープンループピッチ探索モジュールＯＬ１０も含む。モジュールＯＬ１０は、量子化されないＬＰフィルタ係数に基づく重み付けフィルタを通じて入力信号をフィルタリングするために、重みが付けられた信号を２だけデシメート（ｄｅｃｉｍａｔｅ）するために、及び、（現在のレートに依存して）ピッチ推定値をフレームごとに１回又は２回生成するために実装することができる。モジュールＯＬ１０は、例えば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０のｓｅｃｔｉｏｎ５．４において記述されるように実装することができる。

［００８７］適応型コードブック（ＡＣＢ）探索モジュールＡＳ１０は、ピッチフィルタの遅延及び利得を生成するために適応型コードブック（過去の励起に基づき及び“ピッチコードブック”とも呼ばれる）を探索するように構成される。モジュールＡＳ１０は、（例えば、量子化された及び量子化されないＬＰフィルタ係数に基づいて重み付き合成フィルタを通じてＬＰ残差をフィルタリングすることによって入手された）ターゲット信号に関してサブフレームに基づいてオープンループピッチ推定値に関するクローズドループピッチ探索を行うために、及び、指示されたフラクショナルピッチラグで過去の励起を内挿することによって適応型コードベクトルを計算するために、及びＡＣＢ利得を計算するために実装することができる。モジュールＡＳ１０は、（特に、例えば、４０又は６４サンプルのサブフレームサイズよりも小さい遅延に関して）クローズドループピッチ探索を単純化するために過去の励起バッファを拡大するために実装することもできる。モジュールＡＳ１０は、（例えば、各サブフレームに関する）ＡＣＢ利得ｇ_ｐ及び第１のサブフレームのピッチ遅延（又は、現在のレートに依存して、第１及び第３のサブフレームのピッチ遅延）及びその他のサブフレームの相対的ピッチ遅延を示す量子化されたインデックスを生成するために実装することができる。モジュールＡＳ１０は、例えば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０のｓｅｃｔｉｏｎ５．７において記述されるように実装することができる。図１２の例では、モジュールＡＳ１０は、修正されたターゲット信号ｘ’（ｎ）及び修正されたインパルス応答ｈ’（ｎ）をＦＣＢ探索モジュールＦＳ１０に提供する。

［００８８］固定型コードブック（ＦＣＢ）探索モジュールＦＳ１０は、適応型コードベクトルによってモデル化されない励起部分を表す、固定型コードブック（“革新コードブック”、“革新的コードブック”、“確率的コードブック”、又は“代数型コードブック”とも呼ばれる）のベクトルを示すインデックスを生成するように構成される。モジュールＦＳ１０は、ＦＣＢベクトルｃ（ｎ）を再生するために必要なすべての情報が入った（例えば、パルス位置及び符号を表す）コードワードとしてコードブックインデックスを生成するために実装することができ、従って、コードブックは必要ない。モジュールＦＳ１０は、例えば、ここの図８において及び／又は３ＧＰＰＴＳ２６．１９０ｖ１１．０．０のｓｅｃｔｉｏｎ５．８において説明されるように実装することができる。図１２の例では、モジュールＦＳ１０は、（例えば、サブフレームに関する励起信号ｅ（ｎ）の計算前に、ここで、ｅ（ｎ）＝ｇ_ｐｖ（ｎ）＋ｇ_ｃｃ’（ｎ））フィルタＨ_１（ｚ）Ｈ_２（ｚ）をｃ（ｎ）に適用するようにも構成される。

［００８９］利得ベクトル量子化モジュールＧＶ１０は、ＦＣＢ及びＡＣＢ利得を量子化するように構成され、各サブフレームに関する利得を含むことができる。モジュールＧＶ１０は、例えば、３ＧＰＰＴＳ２６．１９０ｖ１１．０．０のｓｅｃｔｉｏｎ５．９において説明されるように実装することができる。

［００９０］図１３Ａは、装置Ａ１００（又はＭＦ１００）の要素を具現化するチップ又はチップセットＣＳ１０（例えば、移動局モデム（ＭＳＭ）チップセット）を含む通信デバイスＤ１０のブロック図を示す。チップ／チップセットＣＳ１０は、１つ以上のプロセッサを含むことができ、それらは、装置Ａ１００又はＭＦ１００のソフトウェア及び／又はファームウェア部分を（例えば、命令として）実行するように構成することができる。送信端末１０２は、デバイスＤ１０の実装として実現することができる。

［００９１］チップ／チップセットＣＳ１０は、受信機（例えば、ＲＸ１０）を含み、それは、無線周波数（ＲＦ）通信信号を受信するように及びＲＦ信号内で符号化された音声信号を復号及び再生するように構成され、及び、送信機（例えば、ＴＸ１０）を含み、それは、（例えば、方法Ｍ１００を用いて生成された）符号化された音声信号を記述するＲＦ通信信号を送信するように構成される。該デバイスは、ここにおいて言及されるコーデックのうちの１つ以上を介して無線で声通信データを送信及び受信するように構成することができる。

［００９２］デバイスＤ１０は、アンテナＣ３０を介してＲＦ通信信号を受信及び送信するように構成される。デバイスＤ１０は、アンテナＣ３０への経路内においてディプレクサ及び１つ以上の電力増幅器も含むことができる。チップ／チップセットＣＳ１０は、キーパッドＣ１０を介してユーザ入力を受信するように及びディスプレイＣ２０を介して情報を表示するようにも構成される。この例においては、デバイスＤ１０は、全地球測位システム（ＧＰＳ）位置決めサービス及び／又は外部のデバイス、例えば、ワイヤレス（例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標））ヘッドセット、との短距離通信をサポートするための１本以上のアンテナＣ４０も含む。他の例においては、該通信デバイス自体がＢｌｕｅｔｏｏｔｈ（登録商標））ヘッドセットであり、キーパッドＣ１０、ディスプレイＣ２０、及びアンテナＣ３０を有さない。

［００９３］通信デバイスＤ１０は、様々な通信デバイスにおいて具現化することができ、スマートフォンと、ラップトップコンピュータと、タブレットコンピュータと、を含む。図１４は、１つの該例の前面図、後面図、及び側面図を示し、ハンドセットＨ１００（例えば、スマートフォン）は、２つの音声マイクＭＶ１０−１及びＭＶ１０−３が前面に配置され、音声マイクＭＶ１０−２が後面に配置され、（例えば、エンハンスされた指向性感度のための及び／又はアクティブな雑音除去動作への入力のためにユーザの耳における音響誤差をキャプチャするための）他のマイクＭＥ１０が前面の上隅に配置され、（例えば、エンハンスされた指向性感度のための及び／又は背景雑音基準をキャプチャするための）他のマイクＭＲ１０が裏面に配置される。前面の上中央の誤差マイクＭＥ１０の近くに拡声器ＬＳ１０が配置され、その他の２つの拡声器ＬＳ２０Ｌ、ＬＳ２０Ｒも（例えば、スピーカーフォン用途のために）提供される。該ハンドセットのマイク間の最大距離は、典型的には、約１０又は１２ｃｍである。

［００９４］図１３Ｂは、ここにおいて説明される方法を実行するために実装することができる無線デバイス１１０２のブロック図を示す。送信端末１０２は、無線デバイス１１０２の実装として実現することができる。無線デバイス１１０２は、遠隔局、アクセス端末、ハンドセット、パーソナルデジタルアシスタント（ＰＤＡ）、携帯電話、等であることができる。

［００９５］無線デバイス１１０２は、そのデバイスの動作を制御するプロセッサ１１０４を含む。プロセッサ１１０４は、中央処理装置（ＣＰＵ）と呼ぶこともできる。メモリ１１０６は、読み取り専用メモリ（ＲＯＭ）と、ランダムアクセスメモリ（ＲＡＭ）との両方を含むことができ、命令及びデータをプロセッサ１１０４に提供する。メモリ１１０６の一部分は、非揮発性ランダムアクセスメモリ（ＮＶＴＲＡＭ）を含むこともできる。プロセッサ１１０４は、典型的には、メモリ１１０６内に格納されたプログラム命令に基づいて論理演算及び算術演算を行う。メモリ１１０６内の命令は、ここにおいて説明される方法又は方法（複数）を実装するために実行可能である。

［００９６］無線デバイス１１０２は、無線デバイス１１０２と遠隔位置との間でのデータの送信及び受信を可能にするための送信機１１１０と受信機１１１２とを含むことができるハウジング１１０８を含む。送信機１１１０及び受信機１１１２は、トランシーバ１１１４として結合することができる。アンテナ１１１６をハウジング１１０８に取り付け、トランシーバ１１１４に電気的に結合することができる。無線デバイス１１０２は、複数の送信機、複数の受信機、複数のトランシーバ及び／又は複数のアンテナを含むことができる（示されていない）。

［００９７］この例においては、無線デバイス１１０２は、トランシーバ１１１４によって受信された信号のレベルを検出及び定量化するために使用することができる信号検出器１１１８も含む。信号検出器１１１８は、総エネルギー、擬似雑音（ＰＮ）チップ当たりのパイロットエネルギー、電力スペクトル密度、及びその他の信号、等の信号を検出することができる。無線デバイス１１０２は、信号を処理する際に使用するためのデジタル信号プロセッサ（ＤＳＰ）１１２０も含む。

［００９８］無線デバイス１１０２の様々なコンポーネントは、バスシステム１１２２によってまとめて結合され、それは、データバスに加えて、電力バスと、制御信号バスと、状態信号バスと、を含むことができる。明確化を目的として、図１３Ｂでは様々なバスがバスシステム１１２２として例示される。

［００９９］ここにおいて開示される方法及び装置は、概して、あらゆるトランシーバ及び／又は音声検知用途、特に、該用途のモバイル又はその他のポータブルな事例において適用することができる。例えば、ここにおいて開示される構成の範囲は、符号分割多元接続（ＣＤＭＡ）オーバー・ザ・エアインタフェースを採用するように構成された無線テレフォニー通信システムに常在する通信デバイスを含む。しかしながら、ここにおいて説明される特徴を有する方法及び装置は、当業者にとって既知である広範な技術を採用する様々な通信システム、例えば、有線及び／又は無線の（例えば、ＣＤＭＡ、ＴＤＭＡ、ＦＤＭＡ、及び／又はＴＤ−ＳＣＤＭＡ）送信チャネルを通じてのボイス・オーバーＩＰ（ＶｏＩＰ）を採用するシステム、のうちのいずかにおいて常在することができることが当業者によって理解されるであろう。

［００１００］ここにおいて開示される通信デバイスは、パケット交換型であるネットワーク（例えば、ＶｏＩＰ、等のプロトコルに従って音声送信を搬送するように配置された有線及び／又は無線のネットワーク）及び／又は回線交換型であるネットワークにおける使用のために好適化することができることが明示で企図され及びここによって開示される。さらに、ここにおいて開示される通信デバイスは、狭帯域コーディングシステム（例えば、約４又は５キロヘルツの音声周波数範囲を符号化するシステム）において使用するために及び／又は広帯域コーディングシステム（例えば、５キロヘルツよりも大きい音声周波数を符号化するシステム）において使用するために好適化することができることが明示で企図され及びここによって開示され、全帯域広帯域コーディングシステムと、分割帯域広帯域コーディングシステムと、を含む。

［００１０１］説明される構成の提示は、当業者がここにおいて開示される方法及びその他の構造を製造又は使用することを可能にするために提供される。ここにおいて示されて説明されるフローチャート、ブロック図、及びその他の構造は、例であるにすぎず、これらの構造のその他の変形も本開示の適用範囲内である。これらの構成に対する様々な修正が可能であり、及びここにおいて提示される一般原理は、その他の構成に対しても適用することができる。以上のように、本開示は、上において示される構成に限定されることが意図されるものではなく、ここにおいて、及び、原開示の一部を成す、申請された、添付された請求項において開示される原理及び新規の特徴に一致する限りにおいて最も広範な適用範囲が認められるべきである。

［００１０２］当業者は、情報及び信号は様々な異なる技術及び技法のうちのいずれかを用いて表すことができることを理解するであろう。例えば、上記の説明全体を通じて参照されることがあるデータ、命令、コマンド、情報、信号、ビット、及びシンボルは、電圧、電流、電磁波、磁場、磁粒子、光学場、光学粒子、又はそれらのあらゆる組合せによって表すことができる。

［００１０３］ここにおいて開示される構成の実装に関する重要な設計上の要求事項は、特に、計算集約型の用途、例えば、圧縮されたオーディオ又はオーディオビジュアル情報（例えば、圧縮型式に従って符号化されたファイル又はストリーム、例えば、ここにおいて特定される例のうちの１つ）の再生、又は、広帯域通信（例えば、８キロヘルツよりも高いサンプリングレート、例えば、１２、１６、３２、４４．１、４８、又は１９２ｋＨｚでの声通信）に関する用途に関して、処理遅延及び／又は計算の複雑さ（典型的には、毎秒当たり数百万の命令又はＭＩＰＳで測定）を最小化することを含むことができる。

［００１０４］ここにおいて開示される装置（例えば、装置Ａ１００、Ａ２００、ＭＦ１００、ＭＦ２００）は、意図される用途に適するとみなされるハードウェアとソフトウェアの組み合わせ、及び／又はハードウェアとファームウェアとの組み合わせにおいて実装することができる。例えば、該装置の要素は、例えば、チップセット内の同じチップ上に又は２つ以上のチップ間に常在する電子及び／又は光学デバイスとして製造することができる。該デバイスの一例は、論理素子の固定された又はプログラマブルなアレイ、例えば、トランジスタ又は論理ゲート、であり、及びこれらの素子のうちのいずれも、１つ以上の該アレイとして実装することができる。該アレイ又はアレイ（複数）は、１つ以上のチップ内（例えば、２つ以上のチップを含むチップセット内）に実装することができる。

［００１０５］ここにおいて開示される装置（例えば、装置Ａ１００、Ａ２００、ＭＦ１００、ＭＦ２００）の様々な実装の１つ以上の要素は、全体又は一部を、論理素子の１つ以上の固定された又はプログラマブルなアレイ、例えば、マイクロプロセッサ、埋込み型プロセッサ、ＩＰコア、デジタル信号プロセッサ、ＦＰＧＡ（フィールドプログラマブルゲートアレイ）、ＡＳＳＰ（特定用途向け標準製品）、ＡＳＩＣ（特定用途向け集積回路）において実行するような編成された命令の１つ以上の組として実装することができる。ここにおいて開示される装置の実装の様々な要素は、１つ以上のコンピュータ（例えば、命令の１つ以上の組又はシーケンスを実行するためにプログラミングされた１つ以上のアレイを含む機械、“プロセッサ”とも呼ばれる）として具現化することもでき、及び、これらの要素のうちの２つ以上、さらにはすべてを、同じ該コンピュータ又はコンピュータ（複数）内に実装することができる。

［００１０６］ここにおい開示されるプロセッサ又はその他の処理手段は、例えば、チップセット内の同じチップ上に又は２つ以上のチップ間に常在する１つ以上の電子及び／又は光学デバイスとして製造することができる。該デバイスの一例は、論理素子、例えば、トランジスタ又は論理ゲート、の固定された又はプログラマブルなアレイであり、及びこれらの素子のうちのいずれも、１つ以上の該アレイとして実装することができる。該アレイ又はアレイ（複数）は、１つ以上のチップ内（例えば、２つ以上のチップを含むチップセット内）に実装することができる。該アレイの例は、論理素子の固定された又はプログラマブルなアレイ、例えば、マイクロプロセッサ、埋込み型プロセッサ、ＩＰコア、ＤＳＰ、ＦＰＧＡ、ＡＳＳＰ、及びＡＳＩＣ、を含む。ここにおいて開示されるプロセッサ又はその他の処理手段は、１つ以上のコンピュータ（例えば、命令の１つ以上の組又はシーケンスを実行するためにプログラミングされた１つ以上のアレイを含む機械）として具現化することもできる。ここにおいて説明されるプロセッサは、タスクを実行するために又は方法Ｍ１００の実装の手順に直接関連しない命令のその他の組を実行するために使用することが可能であり、例えば、プロセッサが埋め込まれているデバイス又はシステム（例えば、音声検知デバイス）の他の動作に関連するタスクである。さらに、ここにおいて開示される方法の一部を音声検知デバイスのプロセッサによって実行すること及びその方法の他の部分を１つ以上のその他のプロセッサの制御に基づいて実行することも可能である。

［００１０７］ここにおいて開示される構成と関係させて説明される様々な例示的なモジュール、論理ブロック、回路、及び試験及びその他の動作は、電子ハードウェア、コンピュータソフトウェア、又は両方の組み合わせとして実装可能であることを当業者は評価するであろう。該モジュール、論理ブロック、回路、及び動作は、ここにおいて開示される構成を生成するように設計された汎用プロセッサ、デジタル信号プロセッサ（ＤＳＰ）、ＡＳＩＣ、ＡＳＳＰ、ＦＰＧＡ又はその他のプログラマブル論理デバイス、ディスクリートゲートロジック、ディスクリートトランジスタロジック、ディスクリートハードウェアコンポーネント、又はそれらのあらゆる組合せ、を用いて実装又は実行することが可能である。例えば、該構成は、少なくとも部分的には、ハードワイヤド回路として、特定用途向け集積回路内に製造された回路構成として、又は、非揮発性記憶装置内にローディングされたファームウェアプログラム又は機械によって読み取り可能なコードとしてデータ記憶媒体から又はデータ記憶媒体内にローディングされたソフトウェアプログラムとして、実装することができ、該コードは、論理素子のアレイ、例えば、汎用プロセッサ又はその他のデジタル信号処理ユニット、によって実行可能な命令である。汎用プロセッサは、マイクロプロセッサであることができるが、代替においては、プロセッサは、従来のどのようなプロセッサ、コントローラ、マイクロコントローラ、又はステートマシンであってもよい。プロセッサは、コンピューティングデバイスの組合せ、例えば、ＤＳＰと、１つのマイクロプロセッサとの組合せ、複数のマイクロプロセッサとの組合せ、ＤＳＰコアと関連する１つ以上のマイクロプロセッサとの組合せ、又はあらゆるその他の構成、として実装することも可能である。ソフトウェアモジュールは、非一時的な記憶媒体、例えば、ＲＡＭ（ランダムアクセスメモリ）、ＲＯＭ（読み取り専用メモリ）、非揮発性ＲＡＭ（ＮＶＲＡＭ）、例えば、フラッシュＲＡＭ、消去可能プログラマブルＲＯＭ（ＥＰＲＯＭ）、電気的消去可能プログラマブルＲＯＭ（ＥＥＰＲＯＭ）、レジスタ、ハードディスク、取り外し可能なディスク、又はＣＤ−ＲＯＭ、又は当業において既知であるその他のあらゆる形態の記憶媒体において常駐することができる。例示的名記憶媒体は、プロセッサが記憶媒体から情報を読み出すこと及び記憶媒体に情報を書き込むことができるようにプロセッサに結合される。代替においては、記憶媒体は、プロセッサと一体化させることができる。プロセッサ及び記憶媒体は、ＡＳＩＣ内に常駐することができる。ＡＳＩＣは、ユーザ端末内に常駐することができる。代替においては、プロセッサ及び記憶媒体は、ユーザ端末内において個別コンポーネントとして常駐することができる。

［００１０８］ここにおいて開示される様々な方法（例えば、方法Ｍ１００又はＭ２００の実装）は、プロセッサ、等の論理素子のアレイによって実行することができること、及び、ここにおいて説明される装置の様々な要素は、該アレイ上で実行するように設計されたモジュールとして実装することができることが注記される。ここにおいて使用される場合において、用語“モジュール”又は“サブモジュール”は、ソフトウェア、ハードウェア又はファームウェアの形態のコンピュータ命令（例えば、論理式）を含むあらゆる方法、装置、デバイス、ユニット又はコンピュータによって読み取り可能なデータ記憶媒体を意味することができる。同じ機能を実行するために複数のモジュール又はシステムを１つのモジュール又はシステムとして結合すること及び１つのモジュール又はシステムを複数のモジュール又はシステムに分離することができることが理解されるべきである。ソフトウェア又はその他のコンピュータによって実行可能な命令内に実装されるときには、プロセスの要素は、基本的には、例えば、ルーチン、プログラム、オブジェクト、コンポーネント、データ構造、等を用いて関連タスクを実行するためのコードセグメントである。用語“ソフトウェア”は、ソースコード、アセンブリ言語コード、機械コード、バイナリコード、ファームウェア、マクロコード、ミクロコード、論理素子のアレイによって実行可能な命令の１つ以上の組又はシーケンス、及び該例の組み合わせを含むことが理解されるべきである。プログラム又はコードセグメントは、プロセッサによって読み取り可能な媒体に格納すること又は送信媒体又は通信リンクを通じて搬送波内で具現化されたコンピュータデータ信号によって送信することができる。

［００１０９］ここにおいて開示される方法、方式、及び技法の実装は、論理素子のアレイ（例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、又はその他の有限ステートマシン）を含む機械によって実行可能な命令の１つ以上の組として（例えば、ここにおいて記載される１つ以上のコンピュータによって読み取り可能な記憶媒体の有形なコンピュータによって読み取り可能な特徴において）有形な形で具現化することもできる。用語“コンピュータによって読み取り可能な媒体”は、情報を格納又は転送することができるあらゆる媒体を含むことができ、揮発性、非揮発性、取り外し可能、及び取り外し不能な記憶媒体を含む。コンピュータによって読み取り可能な媒体の例は、電子回路、半導体メモリデバイス、ＲＯＭ、フラッシュメモリ、消去可能ＲＯＭ（ＥＲＯＭ）、フロッピー（登録商標）ディスケット、その他の磁気記憶装置、ＣＤ−ＲＯＭ／ＤＶＤ、その他の光記憶装置、ハードディスク、又は、希望される情報を格納するために使用することができるその他の媒体、光ファイバ媒体、無線周波数（ＲＦ）リンク、又は、希望される情報を搬送するための使用することができ及びアクセスすることができるその他のあらゆる媒体を含む。コンピュータデータ信号は、送信媒体、例えば、電子ネットワークチャネル、光ファイバ、空気、電磁、ＲＦリンク、等を通じて伝搬することができるあらゆる信号を含むことができる。コードセグメントは、コンピュータネットワーク、例えば、インターネット又はイントラネット、を介してダウンロードすることができる。いずれの場合も、本開示の適用範囲は、該実施形態によって限定されるとは解釈されるべきではない。

［００１１０］ここにおいて説明される方法のタスクの各々は、直接ハードウェア内において、プロセッサによって実行されるソフトウェアモジュール内において、又はそれらの２つの組み合わせ内において具現化することが可能である。ここにおいて開示される方法の実装の典型的な用途においては、論理素子（例えば、論理ゲート）のアレイは、方法の様々なタスクのうちの１つ、２つ以上、又は全部さえも実行するように構成される。それらのタスクのうちの１つ以上（可能な場合はすべて）は、コンピュータプログラム製品（例えば、１つ以上のデータ記憶媒体、例えば、ディスク、フラッシュ又はその他の非揮発性メモリカード、半導体メモリチップ、等）において具現化され、論理素子（例えば、プロセッサ、マイクロプロセッサ、マイクロコントローラ、又はその他の有限ステートマシン）のアレイを含む機械（例えば、コンピュータ）によって読み取り可能及び／又は実行可能であるコード（例えば、命令の１つ以上の組）として実装することもできる。ここにおいて開示される方法の実装のタスクは、２つ以上の該アレイ又は機械によって実行することもできる。これらの又はその他の実装において、それらのタスクは、無線通信のためのデバイス、例えば、携帯電話、又は、該通信能力を有するその他のデバイス内で実行することができる。該デバイスは、（例えば、１つ以上のプロトコル、例えば、ＶｏＩＰを用いて）回線交換型及び／又はパケット交換型ネットワークと通信するように構成することができる。例えば、該デバイスは、符号化されたフレームを受信及び／又は送信するように構成されたＲＦ回路を含むことができる。

［００１１１］ここにおいて開示される様々な方法は、ポータブル通信デバイス、例えば、ハンドセット、ヘッドセット、又はポータブルデジタルアシスタント（ＰＤＡ）、によって実行することかできること、及び、ここにおいて説明される様々な装置は、該デバイス内に含めることができることが明示で開示される。１つの典型的なリアルタイム（例えば、オンライン）の用途は、該モバイルデバイスを用いて行われる電話会話である。

［００１１２］１つ以上の典型的な実施形態においては、ここにおいて説明される動作は、ハードウェア、ソフトウェア、ファームウェア、又はそれらのあらゆる組み合わせにおいて実装することができる。ソフトウェアにおいて実装される場合は、該動作は、１つ以上の命令又はコードとしてコンピュータによって読み取り可能な媒体に格納すること又はコンピュータによって読み取り可能な媒体を通じて送信することができる。用語“コンピュータによって読み取り可能な媒体”は、コンピュータによって読み取り可能な記憶媒体と、通信（例えば、送信）媒体との両方を含む。例として、及び限定することなしに、コンピュータによって読み取り可能な記憶媒体は、記憶要素、例えば、半導体メモリ（限定することなしに、ダイナミック又はスタティックＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、及び／又はフラッシュＲＡＭを含むことができる）、強誘電性メモリ、磁気抵抗メモリ、オボニックメモリ、高分子メモリ、又は相変化メモリ、のアレイ、ＣＤ−ＲＯＭ又はその他の光ディスク記憶装置、及び／又は磁気ディスク記憶装置又はその他の磁気記憶デバイス、を備えることができる。該記憶媒体は、コンピュータによってアクセスすることができる命令又はデータ構造の形態の情報を格納することができる。通信媒体は、希望されるプログラムコードを命令又はデータ構造の形態で搬送するために使用することができ及びコンピュータによってアクセスすることができるあらゆる媒体を含み、１つの場所から他へのコンピュータプログラムの転送を容易にするあらゆる媒体を含む。さらに、いずれの接続もコンピュータによって読み取り可能な媒体であると適切に呼ばれる。例えば、ソフトウェアが、同軸ケーブル、光ファイバケーブル、より対線、デジタル加入者ライン（ＤＳＬ）、又は無線技術、例えば、赤外線、無線、及びマイクロ波、を用いてウェブサイト、サーバ、又はその他の遠隔ソースから送信される場合は、該同軸ケーブル、光ファイバケーブル、より対線、ＤＳＬ、又は無線技術、例えば赤外線、無線、及びマイクロ波、は、媒体の定義の中に含まれる。ここにおいて用いられるときのディスク（ｄｉｓｋ及びｄｉｓｃ）は、コンパクトディスク（ＣＤ）（ｄｉｓｃ）と、レーザーディスク（登録商標）（ｄｉｓｃ）と、光ディスク（ｄｉｓｃ）と、デジタルバーサタイルディスク（ＤＶＤ）（ｄｉｓｃ）と、フロッピーディスク（ｄｉｓｋ）と、Ｂｌｕ−ＲａｙＤｉｓｃ（登録商標）（Ｂｌｕ−ＲａｙＤｉｓｋＡｓｓｏｃｉａｔｉｏｎ，ＵｎｉｖｅｒｓａｌＣｉｔｙ，ＣＡ）と、を含み、ここで、ｄｉｓｋは通常は磁気的にデータを複製し、ｄｉｓｃは、レーザを用いて光学的にデータを複製する。上記の組合せも、コンピュータによって読み取り可能な媒体の適用範囲に含めるべきである。

［００１１３］ここにおいて説明される音響信号処理装置は、幾つかの動作を制御するために話声入力を受け入れるか又は希望される雑音を背景雑音から分離することによって利益を得ることができる電子デバイス、例えば、通信デバイス、に組み入れることができる。多くの用途は、クリアな希望される音をエンハンスするか又は複数の方向を発生源とする背景音から分離することによって利益を得ることができる。該用途は、声の認識と検出、話声のエンハンスメントと分離、声によって起動される制御、等の能力を組み入れた電子デバイス又はコンピューティングデバイスに人間−機械インタフェースを含めることができる。該音響信号処理装置は、限られた処理能力のみを提供するデバイスにおいて実装するのが望ましく及び適切である。

［００１１４］ここにおいて説明されるモジュール、要素、及びデバイスの様々な実装の要素は、例えば、チップセット内の同じチップ上に又は２つ以上のチップ間に常在する電子及び／又は光学デバイスとして製造することができる。該デバイスの一例は、固定された又はプログラマブルな論理素子のアレイ、例えば、トランジスタ又はゲート、である。ここにおいて説明される装置の様々な実装の１つ以上の要素は、論理素子の１つ以上の固定された又はプログラマブルなアレイ、例えば、マイクロプロセッサ、埋め込まれたプロセッサ、ＩＰコア、デジタル信号プロセッサ、ＦＰＧＡ、ＡＳＳＰ、及びＡＳＩＣ、上で実行するように編成された命令の１つ以上の組として全体又は一部分を実装することもできる。

［００１１５］ここにおいて説明される装置の実装の１つ以上の要素をタスク、例えば、装置が埋め込まれているデバイス又はシステムの他の動作に関連するタスク、又は、装置の動作に直接関連していない命令のその他の組を実行するために使用することが可能である。さらに、該装置の実装の１つ以上の要素が共通の構造を有することも可能である（例えば、異なる要素に対応するコード部分を異なる時間に実行するために使用されるプロセッサ、異なる要素に対応するタスクを異なる時間に実行するために実行される命令の組、又は、異なる時間に異なる要素に関する動作を行う電子的及び／又は光学的デバイスの配置）。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］音声信号を処理する方法であって、
経時での前記音声信号に関する平均信号対雑音比を決定することと、
前記決定された平均信号対雑音比に基づいて、フォルマントシャープニング率を決定することと、
前記決定されたフォルマントシャープニング率に基づくフィルタを前記音声信号からの情報に基づくコードブックベクトルに適用することと、を備える、方法。
［Ｃ２］前記コードブックベクトルは、ユニタリパルスのシーケンスを備えるＣ１に記載の方法。
［Ｃ３］複数の線形予測フィルタ係数を入手するために前記音声信号における線形予測コーディング解析を行うことと、
修正されたインパルス応答を入手するために前記決定されたフォルマントシャープニング率に基づく前記フィルタを前記複数の線形予測フィルタ係数に基づくフィルタのインパルス応答に適用することと、をさらに備えるＣ１に記載の方法。
［Ｃ４］前記複数の線形予測フィルタ係数に基づく前記フィルタは、合成フィルタであるＣ３に記載の方法。
［Ｃ５］前記合成フィルタは、重み付き合成フィルタであるＣ４に記載の方法。
［Ｃ６］前記重み付き合成フィルタは、フィードフォワード重みと、フィードバック重みと、を含み、前記フィードフォワード重みは、前記フィードバック重みよりも大きいＣ５に記載の方法。
［Ｃ７］前記修正されたインパルス応答に基づいて、複数の代数型コードブックベクトルの中から前記コードブックベクトルを選択することをさらに備えるＣ３に記載の方法。
［Ｃ８］前記決定されたフォルマントシャープニング率に基づく前記フィルタは、ピッチ推定値にも基づくＣ１に記載の方法。
［Ｃ９］前記決定されたフォルマントシャープニング率に基づく前記フィルタは、
前記決定されたフォルマントシャープニング率に基づくフォルマントシャープニングフィルタと、
ピッチ推定値に基づくピッチシャープニングフィルタと、を備えるＣ１に記載の方法。
［Ｃ１０］前記決定されたフォルマントシャープニング率に基づく前記フィルタは、
フィードフォワード重みと、
前記フィードフォワード重みよりも大きいフィードバック重みと、を備えるＣ１に記載の方法。
［Ｃ１１］前記音声信号の符号化されたバージョンを有する前記フォルマントシャープニングフィルタのインディケーションを復号器に送信することをさらに備えるＣ１に記載の方法。
［Ｃ１２］前記フォルマントシャープニング率の前記インディケーションは、前記音声信号の前記符号化されたバージョンのフレームのパラメータとして送信されるＣ１１に記載の方法。
［Ｃ１３］復号器における対応する信号対雑音推定値の実質的に同期のリセットを可能にするリセット基準に従って前記音声信号の信号対雑音推定値をリセットすることをさらに備えるＣ１に記載の方法。
［Ｃ１４］前記信号対雑音推定値をリセットすることは、定期的な間隔で行われるＣ１３に記載の方法。
［Ｃ１５］前記信号対雑音推定値をリセットすることは、ある不活動期間後に発生する前記音声信号内の話声セグメントの開始に応答して行われるＣ１３に記載の方法。
［Ｃ１６］前記音声信号を符号化することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、前記低帯域励起のフォルマントシャープニングに起因する高帯域アーティファクトを低減させるために前記フォルマントシャープニング率を変化させることをさらに備えるＣ１に記載の方法。
［Ｃ１７］前記音声信号を符号化することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、高帯域励起へのフォルマントシャープニング率の貢献をディスエーブルにすることをさらに備えるＣ１に記載の方法。
［Ｃ１８］前記高帯域励起への前記フォルマントシャープニング率の貢献をディスエーブルにすることは、固定型コードブックベクトルのシャープニングされないバージョンを使用することを含むＣ１７に記載の方法。
［Ｃ１９］音声信号を処理するための装置であって、
経時での前記音声信号に関する平均信号対雑音比を計算するための手段と、
前記計算された平均信号対雑音比に基づいてフォルマントシャープニング率を計算するための手段と、
前記計算されたフォルマントシャープニング率に基づくフィルタを前記音声信号からの情報に基づくコードブックベクトルに適用するための手段と、を備える、装置。
［Ｃ２０］前記コードブックベクトルは、ユニタリパルスのシーケンスを備えるＣ１９に記載の装置。
［Ｃ２１］複数の線形予測フィルタ係数を入手するために前記音声信号における線形予測コーディング解析を行うための手段と、
修正されたインパルス応答を入手するために前記計算されたフォルマントシャープニング率に基づく前記フィルタを前記複数の線形予測フィルタ係数に基づくフィルタのインパルス応答に適用するための手段と、をさらに備えるＣ１９に記載の装置。
［Ｃ２２］前記複数の線形予測フィルタ係数に基づく前記フィルタは、合成フィルタであるＣ２１に記載の装置。
［Ｃ２３］前記修正されたインパルス応答に基づいて複数の代数型コードブックベクトルの中から前記コードブックベクトルを選択するための手段をさらに備えるＣ２１に記載の装置。
［Ｃ２４］前記音声信号の符号化されたバージョンを有する前記フォルマントシャープニングフィルタのインディケーションを復号器に送信するための手段をさらに備えるＣ１９に記載の装置。
［Ｃ２５］前記フォルマントシャープニング率の前記インディケーションは、前記音声信号の前記符号化されたバージョンのフレームのパラメータとして送信されるＣ２４に記載の装置。
［Ｃ２６］復号器における対応する信号対雑音推定値の実質的に同期のリセットを可能にするリセット基準に従って前記音声信号の信号対雑音推定値をリセットするための手段をさらに備えるＣ１９に記載の装置。
［Ｃ２７］前記信号対雑音推定値をリセットすることは、定期的な間隔で行われるＣ２６に記載の装置。
［Ｃ２８］前記信号対雑音推定値をリセットすることは、ある不活動期間後に発生する前記音声信号内の話声セグメントの開始に応答して行われるＣ２６に記載の装置。
［Ｃ２９］前記音声信号を符号化することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、前記低帯域励起のフォルマントシャープニングに起因する高帯域アーティファクトを低減させるために前記フォルマントシャープニング率を変化させるための手段をさらに備えるＣ１９に記載の装置。
［Ｃ３０］前記音声信号を符号化することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、高帯域励起へのフォルマントシャープニング率の貢献をディスエーブルにするための手段をさらに備えるＣ１９に記載の装置。
［Ｃ３１］前記高帯域励起への前記フォルマントシャープニング率の貢献をディスエーブルにするための前記手段は、固定型コードブックベクトルのシャープニングされないバージョンを使用するＣ３０に記載の装置。

［Ｃ３２］音声信号を処理する装置であって、
経時での前記音声信号に関する平均信号対雑音比を決定するように構成された第１の計算器と、
前記決定された平均信号対雑音比に基づいてフォルマントシャープニング率を決定するように構成された第２の計算器と、
前記決定されたフォルマントシャープニング率に基づくフィルタと、を備え、前記フィルタは、コードブックベクトルをフィルタリングするために配置され、前記コードブックベクトルは、前記音声信号からの情報に基づく、装置。
［Ｃ３３］前記コードブックベクトルは、ユニタリパルスのシーケンスを備えるＣ３２に記載の装置。
［Ｃ３４］複数の線形予測フィルタ係数を入手するために前記音声信号における線形予測コーディング解析を行うように構成された線形予測解析器をさらに備え、前記計算されたフォルマントシャープニング率に基づく前記フィルタは、修正されたインパルス応答を入手するために前記複数の線形予測フィルタ係数に基づくフィルタのインパルス応答をフィルタリングするように配置されるＣ３２に記載の装置。
［Ｃ３５］前記複数の線形予測フィルタ係数に基づく前記フィルタは、合成フィルタであるＣ３４に記載の装置。
［Ｃ３６］前記修正されたインパルス応答に基づいて複数の代数型コードブックベクトルの中から前記コードブックベクトルを選択するように構成された選択器をさらに備えるＣ３４に記載の装置。
［Ｃ３７］前記フォルマントシャープニングフィルタのインディケーションは、前記音声信号の符号化されたバージョンともに復号器に送信されるＣ３２に記載の装置。
［Ｃ３８］前記フォルマントシャープニング率の前記インディケーションは、前記音声信号の前記符号化されたバージョンのフレームのパラメータとして送信されるＣ３７に記載の装置。
［Ｃ３９］前記音声信号の信号対雑音推定値は、復号器における対応する信号対雑音推定値の実質的に同期のリセットを可能にするリセット基準に従ってリセットされるＣ３２に記載の装置。
［Ｃ４０］前記信号対雑音推定値をリセットすることは、定期的な間隔で行われるＣ３９に記載の装置。
［Ｃ４１］前記信号対雑音推定値をリセットすることは、ある不活動期間後に発生する前記音声信号内の話声セグメントの開始に応答して行われるＣ３９に記載の装置。
［Ｃ４２］前記音声信号を符号化することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、前記フォルマントシャープニング率は、前記低帯域励起のフォルマントシャープニングに起因する高帯域アーティファクトを低減させるために変化されるＣ３２に記載の装置。
［Ｃ４３］前記音声信号を符号化することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、高帯域励起へのフォルマントシャープニング率の貢献がディスエーブルにされるＣ３２に記載の装置。
［Ｃ４４］前記高帯域励起への前記フォルマントシャープニング率の貢献は、固定型コードブックベクトルのシャープニングされないバージョンを用いてディスエーブルにされるＣ４３に記載の装置。
［Ｃ４５］非一時的なコンピュータによって読み取り可能な媒体であって、
コンピュータによって実行されたときに、
経時での前記音声信号に関する平均信号対雑音比を決定すること、
前記決定された平均信号対雑音比に基づいて、フォルマントシャープニング率を決定すること、及び
前記決定されたフォルマントシャープニング率に基づくフィルタを前記音声信号からの情報に基づくコードブックベクトルに適用することを前記コンピュータに行わせる命令を備える、非一時的なコンピュータによって読み取り可能な媒体。
［Ｃ４６］前記決定されたフォルマントシャープニング率に基づく前記フィルタは、ピッチ推定値にも基づくＣ４５に記載のコンピュータによって読み取り可能な媒体。
［Ｃ４７］前記決定されたフォルマントシャープニング率に基づく前記フィルタは、
前記決定されたフォルマントシャープニング率に基づくフォルマントシャープニングフィルタと、
ピッチ推定値に基づくピッチシャープニングフィルタと、を備えるＣ４５に記載のコンピュータによって読み取り可能な媒体。
［Ｃ４８］前記決定されたフォルマントシャープニング率に基づく前記フィルタは、
フィードフォワード重みと、
前記フィードフォワード重みよりも大きいフィードバック重みと、を備えるＣ４５に記載のコンピュータによって読み取り可能な媒体。
［Ｃ４９］前記音声信号の符号化されたバージョンを有する前記フォルマントシャープニングフィルタのインディケーションを復号器に送信することを前記コンピュータに行わせるための命令をさらに備えるＣ４５に記載のコンピュータによって読み取り可能な媒体。
［Ｃ５０］前記フォルマントシャープニング率の前記インディケーションは、前記音声信号の前記符号化されたバージョンのフレームのパラメータとして送信されるＣ４９に記載のコンピュータによって読み取り可能な媒体。
［Ｃ５１］復号器における対応する信号対雑音推定値の実質的に同期のリセットを可能にするリセット基準に従って前記音声信号の信号対雑音推定値をリセットすることを前記コンピュータに行わせるための命令をさらに備えるＣ４５に記載のコンピュータによって読み取り可能な媒体。
［Ｃ５２］前記信号対雑音推定値をリセットすることは、定期的な間隔で行われるＣ５１に記載のコンピュータによって読み取り可能な媒体。
［Ｃ５３］前記信号対雑音推定値をリセットすることは、ある不活動期間後に発生する前記音声信号内の話声セグメントの開始に応答して行われるＣ５１に記載のコンピュータによって読み取り可能な媒体。
［Ｃ５４］前記音声信号を符号化することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、前記低帯域励起のフォルマントシャープニングに起因する高帯域アーティファクトを低減させるために前記フォルマントシャープニング率を変化させることを前記コンピュータに行わせるための命令をさらに備えるＣ４５に記載のコンピュータによって読み取り可能な媒体。
［Ｃ５５］前記音声信号を符号化することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、高帯域励起へのフォルマントシャープニング率の貢献をディスエーブルにすることを前記コンピュータに行わせるための命令をさらに備えるＣ４５に記載のコンピュータによって読み取り可能な媒体。
［Ｃ５６］前記高帯域励起への前記フォルマントシャープニング率の貢献をディスエーブルにすることは、固定型コードブックベクトルのシャープニングされないバージョンを使用することを含むＣ５５に記載のコンピュータによって読み取り可能な媒体。
［Ｃ５７］符号化された音声信号を処理する方法であって、
前記符号化された音声信号の第１のフレームからの情報に基づいて、経時での平均信号対雑音比を決定することと、
前記決定された平均信号対雑音比に基づいて、フォルマントシャープニング率を決定することと、
前記決定されたフォルマントシャープニング率に基づくフィルタを前記符号化された音声信号の第２のフレームからの情報に基づくコードブックベクトルに適用することと、を備える、方法。
［Ｃ５８］前記コードブックベクトルは、ユニタリパルスのシーケンスを備えるＣ５７に記載の方法。
［Ｃ５９］修正されたインパルス応答を入手するために前記計算されたフォルマントシャープニング率に基づく前記フィルタを複数の線形予測フィルタ係数に基づくフィルタのインパルス応答に適用することをさらに備え、前記複数の線形予測フィルタ係数は、前記符号化された音声信号の前記第２のフレームからの情報に基づくＣ５７に記載の方法。
［Ｃ６０］前記複数の線形予測フィルタ係数に基づく前記フィルタは、合成フィルタであるＣ５７に記載の方法。
［Ｃ６１］前記合成フィルタは、重み付き合成フィルタであるＣ６０に記載の方法。
［Ｃ６２］前記重み付き合成フィルタは、フィードフォワード重みと、フィードバック重みと、を含み、前記フィードフォワード重みは、前記フィードバック重みよりも大きいＣ６１に記載の方法。
［Ｃ６３］前記決定されたフォルマントシャープニング率に基づく前記フィルタは、ピッチ推定値にも基づくＣ５７に記載の方法。
［Ｃ６４］前記決定されたフォルマントシャープニング率に基づく前記フィルタは、
前記決定されたフォルマントシャープニング率に基づくフォルマントシャープニングフィルタと、
ピッチ推定値に基づくピッチシャープニングフィルタと、を備えるＣ５７に記載の方法。
［Ｃ６５］前記決定されたフォルマントシャープニング率に基づく前記フィルタは、
フィードフォワード重みと、
前記決定されたフォルマントシャープニング率に基づく前記フィルタの前記フィードフォワード重みよりも大きいフィードバック重みと、を含むＣ５７に記載の方法。
［Ｃ６６］符号器における対応する信号対雑音推定値の実質的に同期のリセットを可能にするリセット基準に従って前記信号対雑音比をリセットすることをさらに備えるＣ５７に記載の方法。
［Ｃ６７］前記平均信号対雑音比をリセットすることは、定期的な間隔で行われるＣ６６に記載の方法。
［Ｃ６８］前記平均信号対雑音比をリセットすることは、ある不活動期間後に発生する前記音声信号内の話声セグメントの開始に応答して行われるＣ５７に記載の方法。
［Ｃ６９］前記符号化された音声信号を処理することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、前記低帯域励起のフォルマントシャープニングに起因する高帯域アーティファクトを低減させるために前記フォルマントシャープニング率を変化させることをさらに備えるＣ５７に記載の方法。
［Ｃ７０］前記符号化された音声信号を処理することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、高帯域励起へのフォルマントシャープニング率の貢献をディスエーブルにすることをさらに備えるＣ５７に記載の方法。
［Ｃ７１］前記高帯域励起への前記フォルマントシャープニング率の貢献をディスエーブルにすることは、固定型コードブックベクトルのシャープニングされないバージョンを使用することを含むＣ７０に記載の方法。
［Ｃ７２］符号化された音声信号を処理するための装置であって、
前記符号化された音声信号の第１のフレームからの情報に基づいて、経時での平均信号対雑音比を計算するための手段と、
前記計算された平均信号対雑音比に基づいて、フォルマントシャープニング率を計算するための手段と、
前記計算されたフォルマントシャープニング率に基づくフィルタを前記符号化された音声信号の第２のフレームからの情報に基づくコードブックベクトルに適用するための手段と、を備える、装置。
［Ｃ７３］修正されたインパルス応答を入手するために前記計算されたフォルマントシャープニング率に基づく前記フィルタを複数の線形予測フィルタ係数に基づく重み付き合成フィルタのインパルス応答に適用するための手段をさらに備え、前記複数の線形予測フィルタ係数は、前記符号化された音声信号の前記第２のフレームからの情報に基づくＣ７２に記載の装置。
［Ｃ７４］符号器における対応する信号対雑音推定値の実質的に同期のリセットを可能にするリセット基準に従って前記平均信号対雑音比をリセットするための手段をさらに備えるＣ７２に記載の装置。
［Ｃ７５］前記平均信号対雑音比をリセットすることは、定期的な間隔で行われるＣ７４に記載の装置。
［Ｃ７６］前記平均信号対雑音比をリセットすることは、ある不活動期間後に発生する前記音声信号内の話声セグメントの開始に応答して行われるＣ７４に記載の装置。
［Ｃ７７］前記符号化された音声信号を処理することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、前記低帯域励起のフォルマントシャープニングに起因する高帯域アーティファクトを低減させるために前記フォルマントシャープニング率を変化させるための手段をさらに備えるＣ７２に記載の装置。
［Ｃ７８］前記符号化された音声信号を処理することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、高帯域励起へのフォルマントシャープニング率の貢献をディスエーブルにするための手段をさらに備えるＣ７２に記載の装置。
［Ｃ７９］前記高帯域励起への前記フォルマントシャープニング率の貢献をディスエーブルにすることは、固定型コードブックベクトルのシャープニングされないバージョンを使用することを含むＣ７８に記載の装置。
［Ｃ８０］符号化された音声信号を処理するための装置であって、
前記符号化された音声信号の第１のフレームからの情報に基づいて、経時での平均信号対雑音比を決定するように構成された第１の計算器と、
前記決定された平均信号対雑音比に基づいて、フォルマントシャープニング率を決定するように構成された第２の計算器と、
前記決定されたフォルマントシャープニング率に基づき及び前記符号化された音声信号の第２のフレームからの情報に基づくコードブックベクトルをフィルタリングするために配置されるフィルタと、を備える、装置。
［Ｃ８１］前記決定されたフォルマントシャープニング率に基づく前記フィルタは、修正されたインパルス応答を入手するために複数の線形予測フィルタ係数に基づく重み付き合成フィルタのインパルス応答をフィルタリングするように配置され、前記複数の線形予測フィルタ係数は、前記符号化された音声信号の前記第２のフレームからの情報に基づくＣ８０に記載の装置。
［Ｃ８２］前記平均信号対雑音比は、符号器における対応する信号対雑音推定値の実質的に同期のリセットを可能にするリセット基準に従ってリセットされるＣ８０に記載の装置。
［Ｃ８３］前記平均信号対雑音比をリセットすることは、定期的な間隔で行われるＣ８２に記載の装置。
［Ｃ８４］前記平均信号対雑音比をリセットすることは、ある不活動期間後に発生する前記音声信号内の話声セグメントの開始に応答して行われるＣ８２に記載の装置。
［Ｃ８５］前記符号化された音声信号を処理することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、前記フォルマントシャープニング率は、前記低帯域励起のフォルマントシャープニングに起因する高帯域アーティファクトを低減させるために変化されるＣ８０に記載の装置。
［Ｃ８６］前記符号化された音声信号を処理することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、高帯域励起へのフォルマントシャープニング率の貢献がディスエーブルにされるＣ８０に記載の装置。
［Ｃ８７］前記高帯域励起への前記フォルマントシャープニング率の貢献をディスエーブルにすることは、固定型コードブックベクトルのシャープニングされないバージョンを使用することを含むＣ８６に記載の装置。
［Ｃ８８］非一時的なコンピュータによって読み取り可能な媒体であって、
コンピュータによって実行されたときに、
前記符号化された音声信号の第１のフレームからの情報に基づいて、経時での平均信号対雑音比を決定すること、
前記決定された平均信号対雑音比に基づいて、フォルマントシャープニング率を決定すること、及び
前記決定されたフォルマントシャープニング率に基づくフィルタを前記符号化された音声信号の第２のフレームからの情報に基づくコードブックベクトルに適用することを前記コンピュータに行わせる命令を備える、非一時的なコンピュータによって読み取り可能な媒体。
［Ｃ８９］前記コードブックベクトルは、ユニタリパルスのシーケンスを備えるＣ８８に記載のコンピュータによって読み取り可能な媒体。
［Ｃ９０］符号器における対応する信号対雑音推定値の実質的に同期のリセットを可能にするリセット基準に従って前記平均信号対雑音比をリセットすることを前記コンピュータに行わせるための命令をさらに備えるＣ８８に記載のコンピュータによって読み取り可能な媒体。
［Ｃ９１］前記平均信号対雑音比をリセットすることは、定期的な間隔で行われるＣ９０に記載のコンピュータによって読み取り可能な媒体。
［Ｃ９２］前記平均信号対雑音比をリセットすることは、ある不活動期間後に発生する前記音声信号内の話声セグメントの開始に応答して行われるＣ９０に記載のコンピュータによって読み取り可能な媒体。
［Ｃ９３］前記符号化された音声信号を処理することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、前記低帯域励起のフォルマントシャープニングに起因する高帯域アーティファクトを低減させるために前記フォルマントシャープニング率を変化させることを前記コンピュータに行わせるための命令をさらに備えるＣ８８に記載のコンピュータによって読み取り可能な媒体。
［Ｃ９４］前記符号化された音声信号を処理することは、高帯域合成のために低帯域励起を用いて帯域幅拡大を行うことを含み、高帯域励起へのフォルマントシャープニング率の貢献をディスエーブルにすることを前記コンピュータに行わせるための命令をさらに備えるＣ８８に記載のコンピュータによって読み取り可能な媒体。
［Ｃ９５］前記高帯域励起への前記フォルマントシャープニング率の貢献をディスエーブルにすることは、固定型コードブックベクトルのシャープニングされないバージョンを使用することを含むＣ９４に記載のコンピュータによって読み取り可能な媒体。
［Ｃ９６］音声信号を処理する方法であって、
前記音声信号に対応するパラメータを決定することであって、前記パラメータは、ボイシングファクタ、コーディングモード、又はピッチラグに対応することと、
前記決定されたパラメータに基づいて、フォルマントシャープニング率を決定することと、
前記決定されたフォルマントシャープニング率に基づくフィルタを前記音声信号からの情報に基づくコードブックベクトルに適用することと、を備える、方法。
［Ｃ９７］前記パラメータは、前記ボイシングファクタに対応し、強い声が出されたセグメント又は弱い声が出されたセグメントのうちの少なくとも１つを示すＣ９６に記載の方法。
［Ｃ９８］前記パラメータは、前記コーディングモードに対応し、話声、音楽、沈黙、遷移フレーム、又は声が出されないフレームのうちの少なくとも１つを示すＣ９６に記載の方法。
［Ｃ９９］装置であって、
音声信号に対応するパラメータを決定するように構成された第１の計算器であって、前記パラメータは、ボイシングファクタ、コーディングモード、又はピッチラグに対応する第１の計算器と、
前記決定されたパラメータに基づいてフォルマントシャープニング率を決定するように構成された第２の計算器と、
前記決定されたフォルマントシャープニング率に基づくフィルタを備え、前記フィルタは、コードブックベクトルをフィルタリングするように配置され、前記コードブックベクトルは、前記音声信号からの情報に基づく、装置。
［Ｃ１００］符号化された音声信号を処理する方法であって、
前記符号化された音声信号とともにパラメータを受信することであって、前記パラメータは、ボイシングファクタ、コーディングモード、又はピッチラグに対応することと、
前記受信されたパラメータに基づいて、フォルマントシャープニング率を決定することと、
前記決定されたフォルマントシャープニング率に基づくフィルタを前記符号化された音声信号からの情報に基づくコードブックベクトルに適用することと、を備える、方法。
［Ｃ１０１］前記パラメータは、前記ボイシングファクタに対応し、強い声が出されたセグメント又は弱い声が出されたセグメントのうちの少なくとも１つを示すＣ１００に記載の方法。
［Ｃ１０２］前記パラメータは、前記コーディングモードに対応し、話声、音楽、沈黙、遷移フレーム、又は声が出されないフレームのうちの少なくとも１つを示すＣ１００に記載の方法。
［Ｃ１０３］装置であって、
符号化された音声信号とともに受信されたパラメータに基づいてフォルマントシャープニング率を決定するように構成された計算器であって、前記パラメータは、ボイシングファクタ、コーディングモード、又はピッチラグに対応する計算器と、
前記決定されたフォルマントシャープニング率に基づくフィルタと、を備え、前記フィルタは、コードブックベクトルをフィルタリングするように配置され、前記コードブックベクトルは、前記符号化された音声信号からの情報に基づく、装置。

Claims

音声信号を処理する方法であって、前記方法は、
前記音声信号に関連付けられたパラメータを決定することと、ここにおいて、前記パラメータは、ボイシングファクタ、コーディングモード、又はピッチラグに対応し、前記音声信号は、音声コーダで受信され、
前記決定されたパラメータに基づいて、フォルマントシャープニング率を決定することと、
フィルタリングされたコードブックベクトルを生成するために、前記決定されたフォルマントシャープニング率に基づくフィルタを前記音声信号からの情報に基づくコードブックベクトルに適用することと、
を備え、前記コードブックベクトルは、ユニタリパルスのシーケンスを備え、前記フィルタリングされたコードブックベクトルは、合成された音声信号を生成するために使用される、方法。
前記パラメータは、前記ボイシングファクタに対応し、強い有声のセグメント又は弱い有声のセグメントのうちの少なくとも１つを示す、請求項１に記載の方法。
前記ボイシングファクタは、前記強い有声のセグメントを示す、請求項２に記載の方法。
前記ボイシングファクタは、前記弱い有声のセグメントを示す、請求項２に記載の方法。
前記パラメータは、前記コーディングモードに対応し、音楽、沈黙、遷移フレーム、有声のフレーム、又は無声のフレームのうちの少なくとも１つを示す、請求項１に記載の方法。
前記コーディングモードは、音楽を示す、請求項５に記載の方法。
前記コーディングモードは、沈黙を示す、請求項５に記載の方法。
前記コーディングモードは、遷移フレームを示す、請求項５に記載の方法。
前記コーディングモードは、無声のフレームを示す、請求項５に記載の方法。
前記フォルマントシャープニング率を決定するために、経時での前記音声信号に関する平均信号対雑音比を決定することをさらに備える、請求項１に記載の方法。
複数の線形予測フィルタ係数を入手するために、前記音声信号における線形予測コーディング解析を行うことと、
修正されたインパルス応答を入手するために、前記複数の線形予測フィルタ係数に基づく重み付き合成フィルタのインパルス応答に前記フィルタを適用することと、ここにおいて、前記重み付き合成フィルタは、フィードフォワード重みとフィードバック重みとを含み、前記フィードフォワード重みは、前記フィードバック重みよりも大きく、
前記修正されたインパルス応答に基づいて、複数の代数型コードブックベクトルの中から前記コードブックベクトルを選択することと
をさらに備える、請求項１に記載の方法。
前記フィルタは、前記決定されたフォルマントシャープニング率に基づくフォルマントシャープニングフィルタと、前記音声信号の少なくとも一部分のピッチ推定値に基づくピッチシャープニングフィルタとを含む、請求項１に記載の方法。
前記音声信号の符号化されたバージョンを有する前記フォルマントシャープニング率のインディケーションを復号器に送ることをさらに備える、請求項１に記載の方法。
前記フォルマントシャープニング率の前記インディケーションは、前記音声信号の前記符号化されたバージョンのフレームに含まれる、請求項１３に記載の方法。
潜在的なドリフトを防止するために、調整基準に従って前記音声信号の信号対雑音推定値をリセットすることをさらに備える、請求項１に記載の方法。
前記調整基準は、ある時間期間を備える、請求項１５に記載の方法。
前記音声信号に関連付けられた前記パラメータを決定することは、モバイル通信デバイスを備えるデバイス内で行われる、請求項１に記載の方法。
前記パラメータは、前記ピッチラグに対応する、請求項１に記載の方法。
前記フィルタを適用することは、デバイスによって行われ、前記デバイスは、モバイル通信デバイスを備える、請求項１に記載の方法。
前記フィルタを適用することは、デバイスによって行われ、前記デバイスは、基地局を備える、請求項１に記載の方法。
前記フィルタリングされたコードブックベクトルに基づいて、励起信号を生成することと、
前記励起信号に基づいて、前記合成された音声信号を生成することと
をさらに備える、請求項１に記載の方法。
モバイルデバイスのマイク又はアンテナを介して前記音声信号を受信することをさらに備える、請求項１に記載の方法。
前記決定されたフォルマントシャープニング率に基づく前記フィルタを前記コードブックベクトルに適用する前に、前記決定されたフォルマントシャープニング率に基づく第２のフィルタを、フィルタリングされたインパルス応答を生成するために合成フィルタのインパルス応答に適用することをさらに備える、請求項１に記載の方法。
前記合成フィルタは、重み付き合成フィルタを備える、請求項２３に記載の方法。
前記第２のフィルタは、ピッチシャープニング率にさらに基づく、請求項２３に記載の方法。
前記フィルタリングされたインパルス応答に基づいて、前記コードブックベクトルを決定することをさらに備える、請求項２３に記載の方法。
前記コードブックベクトルを決定することは、前記フィルタリングされたインパルス応答に基づいて、複数の代数型コードブックベクトルの検索を行うことによって、前記コードブックベクトルを推定することを含む、請求項２６に記載の方法。
前記コードブックベクトルは、ターゲット信号に基づいてさらに決定される、請求項２６に記載の方法。
前記合成フィルタを予測誤差に適用することに基づいて、前記ターゲット信号を生成することをさらに備える、請求項２８に記載の方法。
前記予測誤差は、前記音声信号と、前サブフレームに関連付けられた励起信号とに基づく、請求項２９に記載の方法。
装置であって、
音声信号を受信するように構成された音声コーダ入力と、
前記音声信号に関連付けられたパラメータを決定するように構成された第１の計算器と、ここにおいて、前記パラメータは、ボイシングファクタ、コーディングモード、又はピッチラグに対応し、
前記決定されたパラメータに基づいてフォルマントシャープニング率を決定するように構成された第２の計算器と、
前記決定されたフォルマントシャープニング率に基づくフィルタと
を備え、前記フィルタは、コードブックベクトルをフィルタリングするように配置され、前記コードブックベクトルは、フィルタリングされたコードブックベクトルを生成するために、前記音声信号からの情報に基づき、前記コードブックベクトルは、ユニタリパルスのシーケンスを備え、前記フィルタリングされたコードブックベクトルは、合成された音声信号を生成するために使用される、装置。
アンテナと、
前記アンテナおよび前記音声コーダ入力に結合された受信機と
をさらに備える、請求項３１に記載の装置。
前記受信機、前記第１の計算器、前記第２の計算器、および前記フィルタは、モバイル通信デバイスに一体化される、請求項３２に記載の装置。
前記受信機、前記第１の計算器、前記第２の計算器、および前記フィルタは、基地局に一体化される、請求項３２に記載の装置。
複数の線形予測フィルタ係数を生成するために、前記音声信号における線形予測コーディング解析を行うように構成された線形予測解析器をさらに備える、請求項３１に記載の装置。
適応型コードブックベクトルに基づいて、複数の代数型コードブックベクトルの中から前記コードブックベクトルを選択するように構成された選択器をさらに備える、請求項３５に記載の装置。
前記音声信号の符号化されたバージョンを有する前記フォルマントシャープニング率のインディケーションを復号器に送るように構成された送信機をさらに備える、請求項３１に記載の装置。
前記フィルタは、前記フィルタリングされたコードブックベクトルを出力するようにさらに構成される、請求項３１に記載の装置。
前記フィルタリングされたコードブックベクトルに基づいて、励起信号を生成することと、
前記励起信号に基づいて、前記合成された音声信号を生成することと
を行うように構成されたコーダをさらに備える、請求項３１に記載の装置。
インパルス応答を生成するように構成された合成フィルタをさらに備える、請求項３１に記載の装置。
前記合成フィルタは、重み付き合成フィルタを備える、請求項４０に記載の装置。
前記決定されたフォルマントシャープニング率に基づく第２のフィルタをさらに備え、前記第２のフィルタは、フィルタリングされたインパルス応答を生成するために、前記インパルス応答をフィルタリングするように配置される、請求項４０に記載の装置。
前記第２のフィルタは、ピッチシャープニング率にさらに基づく、請求項４２に記載の装置。
前記フィルタリングされたインパルス応答に基づいて、複数の代数型コードブックベクトルの中から前記コードブックベクトルを選択するように構成された選択器をさらに備える、請求項４２に記載の装置。
符号化された音声信号を処理する方法であって、前記方法は、
音声コーダにおいて、前記符号化された音声信号を受信することと、
前記符号化された音声信号のフレームのパラメータに基づいて、フォルマントシャープニング率を決定することと、ここにおいて、前記パラメータは、ボイシングファクタ、コーディングモード、又はピッチラグに対応し、
フィルタリングされたコードブックベクトルを生成するために、前記決定されたフォルマントシャープニング率に基づくフィルタを前記符号化された音声信号からの情報に基づくコードブックベクトルに適用することと、
を備え、前記コードブックベクトルは、ユニタリパルスのシーケンスを備え、前記フィルタリングされたコードブックベクトルは、合成された音声信号を生成するために使用される、方法。
前記パラメータは、前記ボイシングファクタに対応し、強い有声のセグメント又は弱い有声のセグメントのうちの少なくとも１つを示す、請求項４５に記載の方法。
前記パラメータは、前記コーディングモードに対応し、音楽、沈黙、遷移フレーム、有声のフレーム、又は無声のフレームのうちの少なくとも１つを示す、請求項４５に記載の方法。
前記フィルタを適用することは、デバイスによって行われ、前記デバイスは、モバイル通信デバイスを備える、請求項４５に記載の方法。
前記フィルタを適用することは、デバイスによって行われ、前記デバイスは、基地局を備える、請求項４５に記載の方法。
前記フィルタリングされたコードブックベクトルに基づいて、励起信号を生成することと、
前記励起信号に基づいて、前記合成された音声信号を生成することと
をさらに備える、請求項４５に記載の方法。
装置であって、
符号化された音声信号を受信するように構成された音声コーダ入力と、
前記符号化された音声信号のフレームのパラメータに基づいて、フォルマントシャープニング率を決定するように構成された計算器と、ここにおいて、前記パラメータは、ボイシングファクタ、コーディングモード、又はピッチラグに対応し、
前記決定されたフォルマントシャープニング率に基づくフィルタと
を備え、前記フィルタは、コードブックベクトルをフィルタリングするように配置され、前記コードブックベクトルは、フィルタリングされたコードブックベクトルを生成するために、前記符号化された音声信号からの情報に基づき、前記コードブックベクトルは、ユニタリパルスのシーケンスを備え、前記フィルタリングされたコードブックベクトルは、合成された音声信号を生成するために使用される、装置。
アンテナと、
前記アンテナおよび前記音声コーダ入力に結合された受信機と
をさらに備える、請求項５１に記載の装置。
前記受信機、前記計算器、および前記フィルタは、モバイル通信デバイスに一体化される、請求項５２に記載の装置。
前記受信機、前記計算器、および前記フィルタは、基地局に一体化される、請求項５２に記載の装置。
命令を記憶するコンピュータによって読み取り可能な記憶デバイスであって、前記命令がプロセッサによって実行されるとき、前記プロセッサに、
音声信号に関連付けられたパラメータを決定することと、ここにおいて、前記パラメータは、ボイシングファクタ、コーディングモード、又はピッチラグに対応し、前記音声信号は、音声コーダで受信され、
前記決定されたパラメータに基づいてフォルマントシャープニング率を決定することと、
フィルタリングされたコードブックベクトルを生成するために、前記決定されたフォルマントシャープニング率に基づくフィルタを前記音声信号からの情報に基づくコードブックベクトルに適用することと、
を備える動作を行わせ、前記コードブックベクトルは、ユニタリパルスのシーケンスを備え、前記フィルタリングされたコードブックベクトルは、合成された音声信号を生成するために使用される、コンピュータによって読み取り可能な記憶デバイス。
前記パラメータは、前記コーディングモードに対応し、前記コーディングモードは、特定のビットレートに関連付けられる、請求項５５に記載のコンピュータによって読み取り可能な記憶デバイス。
前記フォルマントシャープニング率は、雑音推定に基づく、請求項５５に記載のコンピュータによって読み取り可能な記憶デバイス。
前記動作は、
前記音声信号の非アクティブなセグメント中に長期的信号推定値を追跡することと、
前記長期的信号推定値に基づいて、前記雑音推定を生成することと
をさらに備える、請求項５７に記載のコンピュータによって読み取り可能な記憶デバイス。
前記動作は、
前記音声信号の線形予測コーディング解析を行うことによって、複数の線形予測フィルタ係数を生成することと、
第２のフィルタのインパルス応答に前記フィルタを適用することによって、修正されたインパルス応答を生成すること
をさらに備え、前記第２のフィルタは、前記複数の線形予測フィルタ係数に基づく、請求項５５に記載のコンピュータによって読み取り可能な記憶デバイス。
前記動作は、複数の代数型コードブックベクトルから、前記修正されたインパルス応答に基づいて、前記コードブックベクトルを選択することをさらに備える、請求項５９に記載のコンピュータによって読み取り可能な記憶デバイス。
装置であって、
音声信号に関連付けられたパラメータを決定するための手段と、ここにおいて、前記パラメータは、ボイシングファクタ、コーディングモード、又はピッチラグに対応し、前記音声信号は、音声コーダ入力で受信され、
前記決定されたパラメータに基づいてフォルマントシャープニング率を決定するための手段と、
前記決定されたフォルマントシャープニング率に基づいて、コードブックベクトルをフィルタリングするための手段と
を備え、前記コードブックベクトルは、フィルタリングされたコードブックベクトルを生成するために、前記音声信号からの情報に基づき、前記コードブックベクトルは、ユニタリパルスのシーケンスを備え、前記フィルタリングされたコードブックベクトルは、合成された音声信号を生成するために使用される、装置。
前記パラメータは、前記コーディングモードに対応し、前記コーディングモードは、特定のサンプリングレートに関連付けられる、請求項６１に記載の装置。
前記フォルマントシャープニング率は、雑音推定に基づき、前記パラメータを決定するための前記手段は、第１の計算器を備え、前記フォルマントシャープニング率を決定するための前記手段は、第２の計算器を備え、前記コードブックベクトルをフィルタリングするための前記手段は、フィルタを備える、請求項６１に記載の装置。
前記パラメータを決定するための前記手段、前記フォルマントシャープニング率を決定するための前記手段、およびフィルタリングするための前記手段は、モバイル通信デバイスに一体化される、請求項６１に記載の装置。
前記パラメータを決定するための前記手段、前記フォルマントシャープニング率を決定するための前記手段、およびフィルタリングするための前記手段は、基地局に一体化される、請求項６１に記載の装置。
命令を記憶するコンピュータによって読み取り可能な記憶デバイスであって、前記命令がプロセッサによって実行されるとき、前記プロセッサに、
符号化された音声信号の第１のフレームのパラメータに基づいて、フォルマントシャープニング率を決定することと、前記パラメータは、ボイシングファクタ、コーディングモード、又はピッチラグに対応し、前記符号化された音声信号は、音声コーダで受信され、
フィルタリングされたコードブックベクトルを生成するために、前記決定されたフォルマントシャープニング率に基づくフィルタを前記符号化された音声信号からの情報に基づくコードブックベクトルに適用することと、
を備える動作を行わせ、前記コードブックベクトルは、ユニタリパルスのシーケンスを備え、前記フィルタリングされたコードブックベクトルは、合成された音声信号を生成するために使用される、コンピュータによって読み取り可能な記憶デバイス。
前記パラメータは、前記コーディングモードに対応する、請求項６６に記載のコンピュータによって読み取り可能な記憶デバイス。
前記動作は、第２のフィルタのインパルス応答に前記フィルタを適用することによって、修正されたインパルス応答を生成することをさらに備え、前記第２のフィルタは、複数の線形予測フィルタ係数に基づき、前記複数の線形予測フィルタ係数は、前記符号化された音声信号の第２のフレームからの情報に基づく、請求項６６に記載のコンピュータによって読み取り可能な記憶デバイス。
前記第２のフィルタは、合成フィルタを含む、請求項６８に記載のコンピュータによって読み取り可能な記憶デバイス。
前記第２のフィルタは、重み付き合成フィルタを含む、請求項６８に記載のコンピュータによって読み取り可能な記憶デバイス。
前記重み付き合成フィルタは、フィードフォワード重みとフィードバック重みとに基づき、前記フィードフォワード重みは、前記フィードバック重みよりも大きい、請求項７０に記載のコンピュータによって読み取り可能な記憶デバイス。
装置であって、
符号化された音声信号のフレームのパラメータに基づいて、フォルマントシャープニング率を決定するための手段と、前記パラメータは、ボイシングファクタ、コーディングモード、又はピッチラグに対応し、前記符号化された音声信号は、音声コーダ入力で受信され、
前記決定されたフォルマントシャープニング率に基づいて、コードブックベクトルをフィルタリングするための手段と
を備え、前記コードブックベクトルは、フィルタリングされたコードブックベクトルを生成するために、前記符号化された音声信号からの情報に基づき、前記コードブックベクトルは、ユニタリパルスのシーケンスを備え、前記フィルタリングされたコードブックベクトルは、合成された音声信号を生成するために使用される、装置。
前記パラメータは、前記コーディングモードに対応し、前記コーディングモードは、特定のビットレートに関連付けられる、請求項７２に記載の装置。
決定するための前記手段、およびフィルタリングするための前記手段は、モバイル通信デバイスに一体化される、請求項７２に記載の装置。
決定するための前記手段、およびフィルタリングするための前記手段は、基地局に一体化される、請求項７２に記載の装置。
音声信号を処理する方法であって、前記方法は、
前記音声信号に関連付けられたパラメータを決定することと、ここにおいて、前記パラメータは、コーディングモードに対応し、前記音声信号は、音声コーダで受信され、
前記決定されたパラメータに基づいてフォルマントシャープニング率を決定することと、
フィルタリングされたコードブックベクトルを生成するために、前記決定されたフォルマントシャープニング率に基づくフィルタを前記音声信号からの情報に基づくコードブックベクトルに適用することと、
を備え、前記コードブックベクトルは、ユニタリパルスのシーケンスを備え、前記フィルタリングされたコードブックベクトルは、合成された音声信号を生成するために使用される、方法。
前記パラメータは、音楽、沈黙、遷移フレーム、有声のフレーム、又は無声のフレームのうちの少なくとも１つを示す、請求項７６に記載の方法。
前記フィルタを適用することは、前記フォルマントシャープニング率に対応する重みに基づいて、重み付けされたフィルタを適用することを含む、請求項７６に記載の方法。
前記フォルマントシャープニング率は、雑音推定に基づく、請求項７６に記載の方法。
前記フィルタを適用することは、デバイスによって行われ、前記デバイスは、モバイル通信デバイスを備える、請求項７６に記載の方法。
前記フィルタを適用することは、デバイスによって行われ、前記デバイスは、基地局を備える、請求項７６に記載の方法。
装置であって、
音声信号を受信するように構成された音声コーダ入力と、
前記音声信号に関連付けられたパラメータを決定するように構成された第１の計算器と、ここにおいて、前記パラメータは、コーディングモードに対応し、
前記決定されたパラメータに基づいてフォルマントシャープニング率を決定するように構成された第２の計算器と、
前記決定されたフォルマントシャープニング率に基づくフィルタと
を備え、前記フィルタは、コードブックベクトルをフィルタリングするように配置され、前記コードブックベクトルは、フィルタリングされたコードブックベクトルを生成するために、前記音声信号からの情報に基づき、前記コードブックベクトルは、ユニタリパルスのシーケンスを備え、前記フィルタリングされたコードブックベクトルは、合成された音声信号を生成するために使用される、装置。
前記コーディングモードは、前記音声信号のサンプリングレートに関連付けられる、請求項８２に記載の装置。
前記フィルタは、
前記決定されたフォルマントシャープニング率に基づくフォルマントシャープニングフィルタと、
前記音声信号のピッチ推定値に基づくピッチシャープニングフィルタと
を備える、請求項８２に記載の装置。
前記音声信号の符号化されたバージョンのフレームのパラメータとして、前記フォルマントシャープニング率のインディケーションを復号器に送るように構成された送信機をさらに備える、請求項８２に記載の装置。
アンテナと、
前記アンテナおよび前記音声コーダ入力に結合された受信機と
をさらに備える、請求項８２に記載の装置。
前記受信機、前記第１の計算器、前記第２の計算器、および前記フィルタは、モバイル通信デバイスに一体化される、請求項８６に記載の装置。
前記受信機、前記第１の計算器、前記第２の計算器、および前記フィルタは、基地局に一体化される、請求項８６に記載の装置。
符号化された音声信号を処理する方法であって、前記方法は、
音声コーダにおいて、符号化された音声信号を受信することと、
前記符号化された音声信号のフレームのパラメータに基づいて、フォルマントシャープニング率を決定することと、ここにおいて、前記パラメータは、コーディングモードに対応し、
フィルタリングされたコードブックベクトルを生成するために、前記決定されたフォルマントシャープニング率に基づくフィルタを前記符号化された音声信号からの情報に基づくコードブックベクトルに適用することと、
を備え、前記コードブックベクトルは、ユニタリパルスのシーケンスを備え、前記フィルタリングされたコードブックベクトルは、合成された音声信号を生成するために使用される、方法。
前記コーディングモードは、前記符号化された音声信号のサンプリングレートに関連付けられる、請求項８９に記載の方法。
前記パラメータは、音楽、沈黙、遷移フレーム、有声のフレーム、又は無声のフレームのうちの少なくとも１つを示す、請求項８９に記載の方法。
前記フィルタを適用することは、デバイスによって行われ、前記デバイスは、モバイル通信デバイスを備える、請求項８９に記載の方法。
前記フィルタを適用することは、デバイスによって行われ、前記デバイスは、基地局を備える、請求項８９に記載の方法。
装置であって、
符号化された音声信号を受信するように構成された音声コーダ入力と、
前記符号化された音声信号のフレームのパラメータに基づいて、フォルマントシャープニング率を決定するように構成された計算器と、ここにおいて、前記パラメータは、コーディングモードに対応し、
前記決定されたフォルマントシャープニング率に基づくフィルタと
を備え、前記フィルタは、コードブックベクトルをフィルタリングするように配置され、前記コードブックベクトルは、フィルタリングされたコードブックベクトルを生成するために、前記符号化された音声信号からの情報に基づき、前記コードブックベクトルは、ユニタリパルスのシーケンスを備え、前記フィルタリングされたコードブックベクトルは、合成された音声信号を生成するために使用される、装置。
前記パラメータは、音楽、沈黙、遷移フレーム、有声のフレーム、又は無声のフレームのうちの少なくとも１つを示す、請求項９４に記載の装置。
前記コーディングモードは、特定のビットレートに関連付けられる、請求項９４に記載の装置。
アンテナと、
前記アンテナおよび前記音声コーダ入力に結合された受信機と
をさらに備える、請求項９４に記載の装置。
前記受信機、前記計算器、および前記フィルタは、モバイル通信デバイスに一体化される、請求項９７に記載の装置。
前記受信機、前記計算器、および前記フィルタは、基地局に一体化される、請求項９７に記載の装置。