JP2016507087A

JP2016507087A - 利得制御を行うシステムおよび方法

Info

Publication number: JP2016507087A
Application number: JP2015556928A
Authority: JP
Inventors: アッティ、ベンカトラマン・スリニバサ; クリシュナン、ベンカテシュ
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2013-02-08
Filing date: 2013-08-06
Publication date: 2016-03-07
Anticipated expiration: 2033-08-06
Also published as: SI2954524T1; KR20150116880A; CN104956437B; CA2896811A1; JP6185085B2; IL239718A; PH12015501694B1; AU2013377884A1; ZA201506578B; MY183416A; CN104956437A; IL239718A0; PT2954524T; RU2643454C2; UA114027C2; AU2013377884B2; EP2954524A1; US20140229170A1; DK2954524T3; HRP20170232T1

Abstract

特定の方法は、音声信号に対応する線スペクトル対（ＬＳＰ）間隔に基づいて、音声信号がアーティファクト生成条件に対応する成分を含むと決定することを含む。この方法は、音声信号が当該成分を含むと決定することに応答して、音声信号に対応する利得パラメータを調整することも含む。たとえば、利得パラメータは利得減衰および／または利得平滑化により調整することができる。

Description

関連出願の相互参照
[0001]本出願は、共通に所有される２０１３年２月８日に出願された米国仮特許出願第６１／７６２，８０３号および２０１３年８月５日に出願された米国特許出願第１３／９５９，０９０号に基づく優先権を主張し、参照によりその全体が明示的に本明細書に援用される。

[0002]本開示は、一般に信号処理に関する。

[0003]技術の進歩により、コンピューティングデバイスがより小型化、高性能化されている。たとえば、現在、小型、軽量でユーザに容易に携帯される携帯ワイヤレス電話、携帯情報端末（ＰＤＡ）、ページングデバイスなど、ワイヤレスコンピューティングデバイスを含む、様々な携帯パーソナルコンピューティングデバイスが存在する。より具体的には、セルラー電話やインターネットプロトコル（ＩＰ）電話などの携帯ワイヤレス電話は、ワイヤレスネットワークを介して音声とデータパケットとを伝達することができる。また、そのような多くのワイヤレス電話は、内蔵された他の種類のデバイスを含む。たとえば、ワイヤレス電話は、デジタルスチルカメラ、デジタルビデオカメラ、デジタルレコーダ、およびオーディオファイルプレーヤをも含むことができる。

[0004]従来の電話システム（たとえば公衆交換電話網（ＰＳＴＮ））では、信号帯域幅が３００ヘルツ（Ｈｚ）から３．４キロヘルツ（ｋＨｚ）の周波数範囲に限られている。セルラー電話やボイスオーバーインターネットプロトコル（ＶｏＩＰ）などの広帯域（ＷＢ）用途では、信号帯域幅は５０Ｈｚから７ｋＨｚの周波数範囲にわたる場合がある。超広帯域（ＳＷＢ）符号化技術は、最大約１６ｋＨｚまでに及ぶ帯域に対応する。信号帯域幅を３．４ｋＨｚの狭帯域電話方式から１６ｋＨｚのＳＷＢ電話方式に拡張することにより、信号再構成の品質、了解度および自然さを向上させることができる。

[0005]ＳＷＢ符号化技術は、一般に、信号のより低い周波数部分（たとえば５０Ｈｚ〜７ｋＨｚ、「低帯域」とも呼ぶ）の符号化と送信を伴う。たとえば、低帯域は、フィルタパラメータおよび／または低帯域励起信号を使用して表され得る。しかし、符号化効率を向上させるためには、信号のより高い周波数部分（たとえば７ｋＨｚ〜１６ｋＨｚ、「高帯域」とも呼ぶ）が完全には符号化および送信されない場合がある。その代わりに、受信器が信号モデリングを使用して高帯域を予測することができる。実装形態によっては、予測を支援するために、高帯域に関連付けられたデータを受信器に供給することがある。そのようなデータを「サイド情報」と呼ぶことがあり、利得情報、線スペクトル周波数（ＬＳＦ、線スペクトル対（ＬＳＰ）とも呼ぶ）などの情報を含み得る。信号モデルを使用する高帯域予測は、低帯域信号が高帯域信号と十分に相関がある場合に、受容可能な精度を有し得る。しかし、雑音があると、低帯域と高帯域との相関は弱くなる場合があり、信号モデルは高帯域を正確に表すことができなくなることがある。その結果、受信器においてアーティファクト（たとえば歪み発話）が生じることがある。

[0006]利得制御を行うシステムおよび方法が開示される。記載の技術は、送信のために符号化される音声信号が、音声信号の再構成時に可聴アーティファクトを生じる可能性がある成分（たとえば雑音）を含むか否かを決定することを含む。たとえば、信号モデルは雑音を発話データと解釈する可能性があり、その結果、誤った利得情報が使用されて音声信号が表される可能性がある。記載の技術によると、雑音が存在する条件がある場合、送信される信号を表すために使用される利得パラメータを調整するために、利得減衰および／または利得平滑化が行われ得る。このような調整により、受信器において信号のより正確な再構成が可能になり、それによって可聴アーティファクトが低減される。

[0007]特定の実施形態において、方法は、音声信号に対応する線スペクトル対（ＬＳＰ）間隔に基づいて、音声信号がアーティファクト生成条件に対応する成分を含むと決定することを含む。この方法は、音声信号が当該成分を含むと決定することに応答して音声信号に対応する利得パラメータを調整することも含む。

[0008]別の特定の実施形態において、この方法は、音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔を少なくとも１つの閾値と比較することを含む。この方法は、比較の結果に少なくとも部分的に基づいて、音声信号に対応する発話符号化利得パラメータ（たとえば発話符号化システムにおいて使用されるデジタル利得のためのコーデック利得パラメータ）を調整することも含む。

[0009]別の特定の実施形態においては、装置は、音声信号に対応する線スペクトル対（ＬＳＰ）間隔に基づいて、音声信号がアーティファクト生成条件に対応する成分を含むと決定するように構成された雑音検出回路を含む。この装置は、雑音検出回路に応答し、音声信号が当該成分を含むと決定することに応答して、音声信号に対応する利得パラメータを調整するように構成された利得減衰および平滑化回路も含む。

[0010]別の特定の実施形態において、装置が、音声信号に対応する線スペクトル対（ＬＳＰ）間隔に基づいて、音声信号がアーティファクト生成条件に対応する成分を含むと決定するための手段を含む。この装置は、音声信号が当該成分を含むと決定することに応答して音声信号に対応する利得パラメータを調整するための手段も含む。

[0011]別の特定の実施形態において、非一時的コンピュータ可読媒体が、コンピュータによって実行されるとコンピュータに、音声信号に対応する線スペクトル対（ＬＳＰ）間隔に基づいて、音声信号がアーティファクト生成条件に対応する成分を含むと決定させる命令を含む。命令は、コンピュータに、音声信号が当該成分を含むと決定することに応答して音声信号に対応する利得パラメータを調整させるようにも実行可能である。

[0012]開示の実施形態のうちの少なくとも１つによって提供される特定の利点としては、アーティファクト誘起成分（たとえば雑音）を検出可能であることと、そのようなアーティファクト誘起成分の検出に応答して利得制御（たとえば利得減衰および／または利得平滑化）を選択的に実行可能であることが含まれ、その結果、受信器において信号再構成がより正確になり、可聴アーティファクトが少なくなる可能性がある。本開示の他の態様と、利点と、特徴とは、以下の図面の簡単な説明、発明を実施するための形態、および特許請求の範囲の各項を含む本出願全体を見当すれば明らかになろう。

[0013]利得制御を行うために動作可能なシステムの特定の実施形態を示す図。 [0014]アーティファクト誘起成分と、アーティファクトを含む対応する再構成信号と、アーティファクトを含まない対応する再構成信号との例を示す図。 [0015]利得制御を行う方法の特定の実施形態を示すフローチャート。 [0016]利得制御を行う方法の別の特定の実施形態を示すフローチャート。 [0017]利得制御を行う方法の別の特定の実施形態を示すフローチャート。 [0018]図１〜図５のシステムおよび方法による信号処理動作を行うように動作可能なワイヤレスデバイスを示すブロック図。

[0019]図１を参照すると、利得制御を行うように動作可能なシステムの特定の実施形態が示され、全体が１００と表記されている。特定の実施形態では、システム１００は符号化システムまたは装置（たとえばワイヤレス電話または符号化器／復号器（ＣＯＤＥＣ）に組み込むことができる。

[0020]なお、以下の説明では、図１のシステム１００によって実行される様々な機能について、特定のコンポーネントまたはモジュールによって実行されるものとして説明する。しかし、このコンポーネントおよびモジュールという区分は、例示のためにすぎない。代替実施形態では、特定のコンポーネントまたはモジュールによって実行される機能を複数のコンポーネントまたはモジュールに分担させてよい。また、代替実施形態では、図１の２つ以上のコンポーネントまたはモジュールを単一のコンポーネントまたはモジュールに統合してよい。図１に示す各コンポーネントまたはモジュールは、ハードウェア（たとえばフィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）、デジタルシグナルプロセッサ（ＤＳＰ）、コントローラなど）、ソフトウェア（たとえばプロセッサによって実行可能な命令）、またはこれらの任意の組合せを使用して実装可能である。

[0021]システム１００は、入力音声信号１０２を受信するように構成された解析フィルタバンク１１０を含む。たとえば、入力音声信号１０２はマイクロフォンまたは他の入力装置によって供給され得る。特定の実施形態では、入力音声信号１０２は発話を含み得る。入力音声信号は、約５０ヘルツ（Ｈｚ）〜約１６キロヘルツ（ｋＨｚ）までの周波数範囲のデータを含む超広帯域（ＳＷＢ）信号であってよい。解析フィルタバンク１１０は、周波数に基づいて入力音声信号１０２をフィルタリングして複数の部分に分割することができる。たとえば、解析フィルタバンク１１０は低帯域信号１２２と高帯域信号１２４とを生成し得る。低帯域信号１２２と高帯域信号１２４とは、等しい帯域幅または異なる帯域幅を有してよく、重なり合っていても重なり合っていなくてもよい。代替実施形態では、解析フィルタバンク１１０は３つ以上の出力を生成してよい。

[0022]図１の例では、低帯域信号１２２と高帯域信号１２４とは重なり合わない周波数帯域を占有する。たとえば、低帯域信号１２２と高帯域信号１２４とは、５０Ｈｚ〜７ｋＨｚと７ｋＨｚ〜１６ｋＨｚの重なり合わない周波数帯域を占有してよい。代替態様では、低帯域信号１２２と高帯域信号１２４とは、５０Ｈｚ〜８ｋＨｚと８ｋＨｚ〜１６ｋＨｚの重なり合わない周波数帯域を占有してよい。別の実施形態では、低帯域信号１２２と高帯域信号１２４とは重なり合ってよく（たとえば５０Ｈｚ〜８ｋＨｚと７ｋＨｚ〜１６ｋＨｚ）、これによって解析フィルタバンク１１０のローパスフィルタとハイパスフィルタとが平滑なロールオフを有し得るようにすることができ、それによってローパスフィルタとハイパスフィルタの設計を簡略化し、コストを削減することができる。低帯域信号１２２と高帯域信号１２４とを重なり合わせることによって、受信器において低帯域信号と高帯域信号との平滑な混合も可能にすることができ、その結果、可聴アーティファクトが少なくなる。

[0023]なお、図１の例はＳＷＢ信号の処理を示しているが、これは例示のために過ぎないことに留意されたい。代替実施形態では、入力音声信号１０２は、約５０Ｈｚ〜約８ｋＨｚまでの周波数範囲を有する広帯域（ＷＢ）信号であってよい。そのような実施形態では、低帯域信号１２２は、約５０Ｈｚ〜約６．４ｋＨｚの周波数範囲に対応し、高帯域信号１２４は約６．４ｋＨｚ〜約８ｋＨｚまでの周波数範囲に対応し得る。なお、本明細書における様々なシステムおよび方法は、高帯域雑音を検出し、高帯域雑音に応答して様々な動作を行うものとして説明することにも留意されたいしかし、これは例示のために過ぎない。図１〜図６を参照しながら示す技術は、低帯域雑音の場合にも実行可能である。

[0024]システム１００は、低帯域信号１２２を受信するように構成された低帯域解析モジュール１３０を含み得る。特定の実施形態では、低帯域解析モジュール１３０は、符号励振線形予測（ＣｏｄｅＥｘｃｉｔｅｄＬｉｎｅａｒｐｒｅｄｉｃｔｉｏｎ（ＣＥＬＰ））符号化器に相当し得る。低帯域解析モジュール１３０は、線形予測（ＬＰ）解析および符号化モジュール１３２と、線形予測係数（ＬＰＣ）−線スペクトル対（ＬＳＰ）変換モジュール１３４と、量子化器１３６とを含み得る。ＬＳＰは、線スペクトル周波数（ＬＳＦ）とも呼ばれることがあり、本明細書ではこの２つの用語は交換可能に使用する場合がある。ＬＰ解析および符号化モジュール１３２は、低帯域信号１２２のスペクトル包絡線をＬＰＣのセットとして符号化することができる。ＬＰＣは、音声（たとえば、１６ｋＨｚのサンプリングレートで３２０サンプルに対応する２０ミリ秒（ｍｓ）の音声）の各フレーム、音声の各サブフレーム（たとえば５ｍｓの音声）またはこれらの各組合せについて生成することができる。各フレームまたは各サブフレームについて生成されるＬＰＣの数は、実行されるＬＰ解析の「次数」によって決定され得る。特定の実施形態では、ＬＰ解析および符号化モジュール１３２は、１０次ＬＰ解析に対応する１１個のＬＰＣからなるセットを生成することができる。

[0025]ＬＰＣ−ＬＳＰ変換モジュール１３４は、ＬＰ解析／符号化モジュール１３２によって生成されたＬＰＣのセットを（たとえば一対一変換によって）対応するＬＳＰのセットに変換することができる。あるいは、ＬＰＣのセットは、パーコール係数、ログ面積比値、イミタンススペクトル対（ＩＳＰ）、またはイミタンススペクトル周波数（ＩＳＦ）の対応するセットに一対一に変換され得る。ＬＰＣのセットとＬＳＰのセットとの間の変換は、誤差なしに可逆であり得る。

[0026]量子化器１３６は、変換モジュール１３４によって生成されたＬＳＰのセットを量子化することができる。たとえば、量子化器１３６は、複数の項目（たとえばベクトル）を含む複数のコードブックを含み得るかまたはそのようなコードブックに結合され得る。ＬＳＰのセットを量子化するために、量子化器１３６はそのＬＳＰのセットに（たとえば最小二乗または平均二乗誤差などの歪み測度に基づいて）「最も近い」コードブック項目を特定することができる。量子化器１３６は、コードブック内の特定された項目の位置に対応する指標値または一連の指標値を出力することができる。したがって量子化器１３６の出力は、低帯域ビットストリーム１４２に含まれる低帯域フィルタパラメータを表し得る。

[0027]低帯域解析モジュール１３０は、低帯域励起信号１４４を生成することもできる。たとえば、低帯域励起信号１４４は、低帯域解析モジュール１３０によって実行されたＬＰ処理時に生成されるＬＰ残留信号を量子化することによって生成される符号化信号であってよい。ＬＰ残留信号は予測誤差を表し得る。

[0028]システム１００は、解析フィルタバンク１１０からの高帯域信号１２４と低帯域解析モジュール１３０からの低帯域励起信号１４４とを受信するように構成された高帯域解析モジュール１５０をさらに含むことができる。高帯域解析モジュール１５０は、高帯域信号１２４と低帯域励起信号１４４とに基づいて高帯域サイド情報１７２を生成し得る。たとえば、本明細書で詳述するように、高帯域サイド情報１７２は（たとえば少なくとも高帯域エネルギーと低帯域エネルギーとの比に基づく）高帯域ＬＳＰおよび／または利得情報を含み得る。

[0029]高帯域解析モジュール１５０は、高帯域励起発生器１６０を含み得る。高帯域励起発生器１６０は、低帯域励起信号１４４のスペクトルを高帯域周波数範囲（たとえば７ｋＨｚ〜１６ｋＨｚ）に拡張することによって高帯域励起信号を生成することができる。例として、高帯域励起発生器１６０は、低帯域励起信号への変換（たとえば、絶対値または二乗演算などの非線形変換）を適用してよく、変換された低帯域励起信号を雑音信号（たとえば低帯域励起信号１４４に対応する包絡線に従って変調されたホワイトノイズ）と混合して高帯域励起信号を生成してよい。高帯域励起信号は、高帯域サイド情報１７２に含まれる１つまたは複数の高帯域利得パラメータを決定するために使用され得る。

[0030]高帯域解析モジュール１５０は、ＬＰ解析および符号化モジュール１５２と、ＬＰＣ−ＬＳＰ変換モジュール１５４と、量子化器１５６も含み得る。ＬＰ解析および符号化モジュール１５２と、変換モジュール１５４と、量子化器１５６とはそれぞれ、低帯域解析モジュール１３０の対応するコンポーネントを参照しながら上述したように機能するが、分解能は比較的に低い（たとえば各係数、ＬＳＰなどにより少ないビット数を使用する）。別の例示の実施形態では、高帯域ＬＳＰ量子化器１５６は、事前定義されたビット数を使用してＬＳＰ係数のサブセットが個別に量子化されるスカラー量子化を使用することができる。たとえば、ＬＰ解析および符号化モジュール１５２と、変換モジュール１５４と、量子化器１５６とは、高帯域サイド情報１７２に含まれる高帯域フィルタ情報（たとえば高帯域ＬＳＰ）を決定するために高帯域信号１２４を使用してよい。特定の実施形態では、高帯域サイド情報１７２は高帯域ＬＳＰのほか、高帯域利得パラメータを含み得る。特定の種類の雑音が存在する場合、本明細書で詳述するように利得減衰および平滑化モジュール１６２によって実行される利得減衰および／または利得平滑化の結果として高帯域利得パラメータが生成され得る。

[0031]低帯域ビットストリーム１４２と高帯域サイド情報１７２とは、出力ビットストリーム１９２を生成するためにマルチプレクサ（ＭＵＸ）１８０によって多重化されてよい。出力ビットストリーム１９２は、入力音声信号１０２に対応する符号化音声信号を表し得る。たとえば、出力ビットストリーム１９２は（有線、ワイヤレス、または光チャネルを介して）送信および／または記憶され得る。受信器において、音声信号（たとえばスピーカまたは他の出力装置に供給される入力音声信号１０２が再構成されたバージョン）を生成するように、デマルチプレクサ（ＤＥＭＵＸ）と、低帯域復号器と、高帯域復号器と、フィルタバンクとによって逆の動作が行われ得る。低帯域ビットストリーム１４２を表すために使用されるビット数は、高帯域サイド情報１７２を表すために使用されるビット数よりも大幅に大きくてよい。したがって、出力ビットストリーム１９２内のビットの大部分が低帯域データを表す。高帯域サイド情報１７２は、受信器において信号モデルに従って低帯域データから高帯域信号を再生するために使用することができる。たとえば、信号モデルは、低帯域データ（たとえば低帯域信号１２２）と高帯域データ（たとえば高帯域信号１２４）との間の期待される関係または相関のセットを表すことができる。したがって、異なる種類の音声データ（たとえば発話、音楽など）に異なる信号モデルが使用可能であり、符号化音声データの通信の前に、使用する特定の信号モデルが送信器と受信器とによってネゴシエートされてよい（または業界標準で定義されてよい）。信号モデルを使用すれば、送信器における高帯域解析モジュール１５０は、受信器における対応する高帯域解析モジュールが信号モデルを使用して出力ビットストリーム１９２から高帯域信号１２４を再構成することができるように高帯域サイド情報１７２を生成することができるはずである。

[0032]しかし、背景雑音がある場合、低帯域と高帯域との間の相関が不十分であることによって、基となる信号モデルが信頼性のある信号再構成という点で最適ではない仕方で機能する可能性があるので、受信器における高帯域合成の結果として顕著なアーティファクトが生じる場合がある。たとえば、信号モデルは高帯域における雑音成分を誤って発話と解釈する可能性があり、それによって受信器において雑音を不正確に再現しようとする利得パラメータが生成される可能性があり、その結果、顕著なアーティファクトが生じる。そのようなアーティファクト生成条件の例としては、自動車のクラクションやかん高いブレーキ音などの高周波雑音があるが、これらには限らない。例として、図２の第１のスペクトログラム２１０に、比較的大きな信号エネルギーを有する高帯域雑音として示されているアーティファクト生成条件に対応する２つの成分を有する音声信号を示す。第２のスペクトログラム２２０は、高帯域利得パラメータの過大推定による再構成信号における結果のアーティファクトを示す。

[0033]このようなアーティファクトを低減するために、高帯域解析モジュール１５０は高帯域利得制御を行うことができる。たとえば、高帯域解析モジュール１５０は、再生時に可聴アーティファクトを生じさせる可能性のある信号成分（たとえば図２の第１のスペクトログラム２１０に示すアーティファクト生成条件）を検出するように構成された、アーティファクト誘起成分検出モジュール１５８を含んでよい。そのような成分がある場合、高帯域解析モジュール１５０は、そのようなアーティファクトの可聴作用を少なくとも部分的に低減する符号化信号の生成を可能にする。たとえば、利得減衰および平滑化モジュール１６２は利得減衰および／または利得平滑化を行って、高帯域サイド情報１７２に含まれる利得情報またはパラメータを修正してよい。

[0034]利得減衰は、具体例として、指数演算または線形演算の適用によりモデル化利得値を低減することを含み得る。利得平滑化は、現在のフレーム／サブフレームのモデル化利得と１つまたは複数の前のフレーム／サブフレームのモデル化利得との加重和を計算することを含み得る。この修正利得情報の結果、図２の第２のスペクトログラム２２０に示されるアーティファクトがない（または低減されたレベルを有する）図２の第３のスペクトログラム２３０による再構成信号を生じさせることができる。

[0035]音声信号がアーティファクト生成条件を含むか否かを評価するために１つまたは複数の試験を行うことができる。たとえば、第１の試験は、ＬＳＰ（たとえば音声信号の特定のフレームのＬＳＰ）のセット内で検出される最小ＬＳＰ間隔を第１の閾値と比較することを含み得る。ＬＳＰ間の小さな間隔は、比較的狭い周波数範囲での比較的強い信号に対応する。特定の実施形態では、高帯域信号１２４が第１の閾値未満の最小ＬＳＰ間隔を有するフレームを生じさせると決定される場合、音声信号内にアーティファクト生成条件が存在すると決定され、そのフレームに対して利得減衰が有効にされてよい。

[0036]別の例として、第２の試験は、連続した複数のフレームの平均最小ＬＳＰ間隔を第２の閾値と比較することを含み得る。たとえば、音声信号の特定のフレームが、第１の閾値より大きいが第２の閾値より小さい最小ＬＳＰ間隔を有する場合、複数のフレームの平均最小ＬＳＰ間隔（たとえばその特定のフレームを含む最近の４個のフレームの最小ＬＳＰ間隔の加重平均）が第３の閾値よりも小さければ、アーティファクト生成条件が存在すると決定してよい。その結果、その特定のフレームに対して利得減衰が有効にされてよい。

[0037]別の例として、第３の試験は、音声信号の利得減衰済みフレームの後に特定のフレームが続くか否かを決定することを含み得る。利得減衰済みフレームの後にその特定のフレームが続く場合、その特定のフレームの最小ＬＳＰ間隔が第２の閾値未満であることに基づいて、その特定のフレームに対して利得減衰が有効にされてよい。

[0038]例示のために３種類の試験について説明されている。これらの試験のうちの任意の１つまたは複数の試験（またはこれらの試験の組合せ）が満たされていることに応答して、または１つまたは複数の他の試験または条件が満たされていることに応答して、フレームの利得減衰が有効にされてよい。たとえば、特定の実施形態は、第２の試験と第３の試験のいずれも適用せずに、上述の第１の試験などの単一の試験に基づいて利得減衰を有効にするか否かを決定することを含み得る。代替実施形態は、第１の試験と第３の試験のいずれも適用せずに第２の試験に基づいて、または第１の試験と第２の試験のいずれも適用せずに第３の試験に基づいて、利得減衰を有効にするか否かを決定することを含み得る。別の例として、特定の実施形態は、第３の試験を適用せずに、第１の試験と第２の試験などの２種類の試験に基づいて、利得減衰を有効にするか否かを決定することを含み得る。代替実施形態は、第３の試験を適用せずに第１の試験と第３の試験とに基づいて、または第１の試験を適用せずに第２の試験と第３の試験とに基づいて、利得減衰を有効にするか否かを決定することを含み得る。

[0039]特定のフレームについて利得減衰が有効にされた場合、その特定のフレームについて利得平滑化も有効にしてよい。たとえば、その特定のフレームの利得値と音声信号の先行フレームの利得値との平均（たとえば加重平均）を決定することによって利得平滑化が行われ得る。決定された平均はその特定のフレームの利得値として使用されてよく、それによって音声信号の連続フレーム間の利得値の変化量が低減される。

[0040]特定のフレームのＬＳＰ値がＬＳＰ値の「低速」変化推定値から第４の閾値未満だけ逸脱しており、ＬＳＰ値の「高速」変化推定値から第５の閾値未満だけ逸脱していると決定することに応答して、特定のフレームについて利得平滑化を有効にしてよい。低速変化推定値からの逸脱の量は、低速ＬＳＰ変化レートと呼ばれる場合がある。高速変化推定値からの逸脱の量は、高速ＬＳＰ変化レートと呼ばれる場合があり、低速ＬＳＰ変化レートよりも速い適応レートに対応し得る。

[0041]低速ＬＳＰ変化レートは、１つまたは複数の前のフレームのＬＳＰ値に現在のフレームのＬＳＰ値よりも重い重み付けをする、複数の連続フレームのＬＳＰ値の加重平均からの逸脱に基づいてよい。比較的大きな値を有する低速ＬＳＰ変化レートは、ＬＳＰ値がアーティファクト生成条件を示していないレートで変化していることを示す。しかし、比較的小さい値（たとえば第４の閾値未満）を有する低速ＬＳＰ変化レートは、複数のフレームにわたるＬＳＰの低速の動きに対応し、これは進行中のアーティファクト生成条件を示している可能性がある。

[0042]高速ＬＳＰ変化レートは、現在のフレームのＬＳＰ値に低速ＬＳＰ変化レートの加重平均よりも重く重み付けをする、複数の連続フレームのＬＳＰ値の加重平均からの逸脱に基づいてよい。比較的大きな値を有する高速ＬＳＰ変化レートは、ＬＳＰ値がアーティファクト生成条件を示していない率で変化していることを示している可能性があり、比較的小さい値（たとえば第５の閾値未満）を有する高速ＬＳＰ変化レートは、複数のフレームにわたるＬＳＰの比較的小さい変化に対応している可能性があり、これはアーティファクト生成条件を示している可能性がある。

[0043]低速ＬＳＰ変化レートは複数フレームアーティファクト生成条件が開始した時を示すために使用され得るが、低速ＬＳＰ変化レートは複数フレームアーティファクト生成条件が終了した時の検出に遅延を生じさせる可能性がある。同様に、高速ＬＳＰ変化レートは複数フレームアーティファクト生成条件が開始した時を検出するのに低速ＬＳＰ変化レートよりも信頼性が低い可能性があるが、高速ＬＳＰ変化レートは、複数フレームアーティファクト生成条件が終了した時をより正確に検出するために使用され得る。低速ＬＳＰ変化レートが第４の閾値未満であり、高速ＬＳＰ変化レートが第５の閾値未満である間は、複数フレームアーティファクト生成事象が進行中であると決定され得る。その結果、アーティファクト生成事象の進行中に、利得平滑化が有効にされてフレーム利得値の急上昇またはスプリアス上昇を防止することができる。

[0044]特定の実施形態では、アーティファクト誘起成分検出モジュール１５８は、音声信号が可聴アーティファクトを生じさせる成分を含むか否かを決定するために、最小ＬＳＰ間隔と、低速ＬＳＰ変化レートと、高速ＬＳＰ変化レートと、平均最小ＬＳＰ変化レートとの４つのパラメータを音声信号から決定することができる。たとえば、１０次ＬＰプロセスは、１０個のＬＳＰに変換される１１個のＬＰＣからなるセットを生成することができる。アーティファクト誘起成分検出モジュール１５８は、音声の特定のフレームについて、１０個のＬＳＰのうちの任意の２つのＬＳＰの間の最小（たとえば最も小さい）間隔を決定することができる。典型的には、自動車のクラクションやかん高いブレーキ音などの鋭い突然の雑音の結果として、間隔の狭いＬＳＰが生じる（たとえば、第１のスペクトログラム２１０における「強い」１３ｋＨｚの雑音成分は１２．９５ｋＨｚと１３．０５ｋＨｚのＬＳＰによって近接して囲まれ得る）。アーティファクト誘起成分検出モジュール１５８は、アーティファクト誘起成分検出モジュール１５８により実行または実装され得る以下のＣ＋＋式擬似コードに示すようにして、低速ＬＳＰ変化レートと高速変化レートとを決定することもできる。

[0045]アーティファクト誘起成分検出モジュール１５８は、以下の擬似コードに従って加重平均最小ＬＳＰ間隔をさらに決定してよい。以下の擬似コードは、モード遷移に応答してＬＳＰ間隔をリセットすることも含む。そのようなモード遷移は、音楽および／または発話の複数の符号化モードに対応するデバイスにおいて発生することがある。たとえば、デバイスは発話には代数ＣＥＬＰ（ＡＣＥＰ）モードを使用し、音楽型信号には音声符号化モード、すなわち汎用信号符号化（ＧＳＣ）を使用することができる。あるいは、特定の低速事例では、デバイスは特徴パラメータ（たとえば調性、ピッチドリフト、発声など）に基づいて、ＡＣＥＬＰ／ＧＳＣ／変形離散コサイン変換（ＭＤＣＴ）モードが使用可能であると決定してよい。

[0046]最小ＬＳＰ間隔と、ＬＳＰ変化レートと、平均最小ＬＳＰ間隔とを決定した後、アーティファクト誘起成分検出モジュール１５８は、音声のフレーム内にアーティファクト誘起雑音が存在するか否かを決定するために、決定した各値を以下の擬似コードに従って１つまたは複数の閾値と比較することができる。アーティファクト誘起雑音が存在する場合、アーティファクト誘起成分検出モジュール１５８は、利得減衰および平滑化モジュール１６２が適宜、利得減衰および／または利得平滑化を行うことができるようにしてよい。

[0047]特定の実施形態では、利得減衰および平滑化モジュール１６２は、以下の擬似コードに従って利得減衰および／または平滑化を選択的に行ってよい。

[0048]このように、図１のシステム１００は、入力信号中の雑音による可聴アーティファクトを低減または防止するために利得制御（たとえば利得減衰および／または利得平滑化）を行うことができる。したがって、図１のシステム１００は、発話符号化信号モデルによっては説明されない雑音が存在する場合に音声信号（たとえば発話信号）のより正確な再生を可能にすることができる。

[0049]図３を参照すると、利得制御を行う方法の特定の実施形態を示すフローチャートが示されており、全体が３００と表記されている。例示的な一実施形態では、方法３００は、図１のシステム１００において実施され得る。

[0050]方法３００は、（発話符号化信号モデルを介して）符号化される音声信号を３０２で受信することを含み得る。特定の実施形態では、音声信号は約５０Ｈｚ〜約１６ｋＨｚの帯域幅を有することができ、発話を含み得る。たとえば、図１においては、解析フィルタバンク１１０が、受信器で再生されるように符号化される入力音声信号１０２を受信してよい。

[0051]方法３００は、３０４で、音声信号に対応するスペクトル情報（たとえばＬＳＰ間隔、ＬＳＰ変化レート）に基づいて、音声信号がアーティファクト生成条件に対応する成分を含むと決定してよい。特定の実施形態では、アーティファクト誘起成分は、図２の第１のスペクトログラム２１０に示される高周波雑音などの雑音であり得る。たとえば、図１では、アーティファクト誘起成分検出モジュール１５８がスペクトル情報に基づいて、音声信号１０２の高帯域部分がそのような雑音を含むと決定することができる。

[0052]音声信号が当該成分を含むと決定することは、音声信号のフレームに関連付けられたＬＳＰ間隔を決定することを含み得る。ＬＳＰ間隔は、音声信号のフレームの高帯域部分の線形予測符号化（ＬＰＣ）時に生成された複数のＬＳＰに対応する複数のＬＳＰ間隔のうちの最小のＬＳＰ間隔であってよい。たとえば、音声信号は、ＬＳＰ間隔が第１の閾値未満であることに応答して、当該成分を含むと決定され得る。別の例として、音声信号は、ＬＳＰ間隔が第２の閾値未満であり、複数のフレームの平均ＬＳＰ間隔が第３の閾値未満であることに応答して、当該成分を含むと決定され得る。図５を参照しながら詳述するように、音声信号は、（１）ＬＳＰ間隔が第２の閾値未満であり、（２）平均ＬＳＰ間隔が第３の閾値であるか、または音声信号の別のフレームに対応する利得減衰が有効にされており、その別のフレームは音声信号の当該フレームに先行する、のうちの少なくとも一方に応答して、当該成分を含むと決定され得る。音声信号が当該成分を含むか否かを決定するための条件が（１）および（２）と標識付けされているが、そのような標識は参照のために過ぎず、動作の順序を規定するものではない。そうではなく、条件（１）と（２）とは、互いを基準として任意の順序で決定され得るかまたは（時間的に少なくとも部分的に重なり合って）同時に決定され得る。

[0053]方法３００は、音声信号が当該成分を含むという決定に応答して、３０６において音声信号に対応する利得パラメータを調整することをさらに含み得る。たとえば図１において、利得減衰および平滑化モジュール１６２は、高帯域サイド情報１７２に含められる利得情報を修正してよく、その結果、符号化出力ビットストリーム１９２は信号モデルから逸脱することになる。方法３００は３０８で終了することができる。

[0054]利得パラメータを調整することは、利得平滑化を有効にして音声信号のフレームに対応する利得値を低減することを含み得る。特定の実施形態では、利得平滑化は、当該利得値と音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む。利得平滑化は、フレームに関連付けられた第１の線スペクトル対（ＬＳＰ）変化レートが第４の閾値未満であり、フレームに関連付けられた第２のＬＳＰ変化レートが第５の閾値未満であることに応答して有効にされ得る。第１のＬＳＰ変化レート（たとえば「低速」ＬＳＰ変化レート）は、第２のＬＳＰ変化レート（たとえば「高速」ＬＳＰ変化レート）より低速の適応レートに対応し得る。

[0055]利得パラメータを調整することは、音声信号のフレームに対応する利得値を低減するために利得減衰を有効にすることを含み得る。特定の実施形態では、利得減衰は、利得値に指数演算を適用すること、または利得値に線形演算を適用することを含む。たとえば、第１の利得条件（たとえばフレームが第６の閾値未満の平均ＬＳＰ間隔を含む）が満たされることに応答して、利得値に指数演算を適用してよい。第２の利得条件（たとえば音声信号の別のフレームに対応する利得減衰が有効にされ、その別のフレームは音声信号の当該フレームに先行する）が満たされることに応答して、利得値に線形演算を適応してよい。特定の実施形態では、図３の方法３００は、中央演算処理装置（ＣＰＵ）、デジタルシグナルプロセッサ（ＤＳＰ）またはコントローラなどの処理ユニットのハードウェア（たとえばフィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）など）によって、またはファームウェアデバイス、またはこれらの任意の組合せによって実装可能である。一例として、図３の方法３００は、図６を参照して説明するように命令を実行するプロセッサによって実行され得る。

[0056]図４を参照すると、利得制御を行う方法の特定の実施形態を示すフローチャートが示されており、全体が４００と表記されている。例示的な一実施形態では、方法４００は、図１のシステム１００において実施され得る。

[0057]４０２において、音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔が少なくとも１つの閾値と比較され、４０４において、比較の結果に少なくとも部分的に基づいて音声信号に対応する利得パラメータが調整される。ＬＳＰ間隔を少なくとも１つの閾値と比較することは音声信号中のアーティファクト生成成分の存在を示し得るが、この比較はアーティファクト生成成分が実際に存在することを示す必要はない。たとえば、音声信号中にアーティファクト生成成分が存在するときに利得制御が実行される可能性を高くすると同時に音声信号中にアーティファクト生成成分が存在しない状態で利得制御が実行される（たとえば「フォールスポジティブ」）可能性も高くするように、比較に使用される１つまたは複数の閾値が設定され得る。したがって、方法４００は、音声信号中にアーティファクト生成成分が存在するか否かを決定せずに利得制御を行ってよい。

[0058]特定の実施形態では、ＬＳＰ間隔は、音声信号のフレームの高帯域部分の複数のＬＳＰに対応する複数のＬＳＰ間隔のうちの最小のＬＳＰ間隔である。利得パラメータを調整することは、ＬＳＰ間隔が第１の閾値未満であることに応答して利得減衰を有効にすることを含み得る。これに代えてまたはこれに加えて、利得パラメータを調整することは、ＬＳＰ間隔が第２の閾値未満であり、平均ＬＳＰ間隔が第３の閾値未満であることに応答して利得減衰を有効にすることを含み、ここで平均ＬＳＰ間隔は、当該フレームに関連付けられたＬＳＰ間隔と音声信号の少なくとも１つの他のフレームに関連付けられた少なくとも１つの他のＬＳＰ間隔とに基づく。

[0059]利得減衰が有効にされている場合、利得パラメータを調整することは、第１の利得条件が満たされることに応答して利得パラメータの値に指数演算を適用することと、第２の利得条件が満たされることに応答して利得パラメータの値に線形演算を適用することとを含み得る。

[0060]利得パラメータを調整することは、音声信号のフレームに対応する利得値を低減するように利得平滑化を有効にすることを含み得る。利得平滑化は、フレームに関連付けられた利得値と音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含み得る。利得平滑化は、フレームに関連付けられた第１の線スペクトル対（ＬＳＰ）変化レートが第４の閾値未満であり、フレームに関連付けられた第２のＬＳＰ変化レートが第５の閾値未満であることに応答して有効にされ得る。第１のＬＳＰ変化レートは、第２のＬＳＰ変化レートよりも低速の適応レートに対応する。

[0061]特定の実施形態では、図４の方法４００は、中央演算処理装置（ＣＰＵ）、デジタルシグナルプロセッサ（ＤＳＰ）またはコントローラなどの処理ユニットのハードウェア（たとえばフィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）など）によって、またはファームウェアデバイス、またはこれらの任意の組合せによって実装可能である。一例として、図４の方法４００は、図６を参照して説明するように命令を実行するプロセッサによって実行され得る。

[0062]図５を参照すると、利得制御を行う方法の別の実施形態を示すフローチャートが示されており、全体が５００と表記されている。例示的な一実施形態では、方法５００は、図１のシステム１００において実施され得る。

[0063]方法５００は、５０２において、音声信号のフレームに関連付けられたＬＳＰ間隔を決定することを含み得る。ＬＳＰ間隔は、フレームの線形予測符号化時に生成される複数のＬＳＰに対応する複数のＬＳＰ間隔のうちの最小のＬＳＰ間隔であってよい。たとえば、ＬＳＰ間隔は、図１に対応する擬似コードにおける「ｌｓｐ＿ｓｐａｃｉｎｇ」変数を参照して例示されるように決定され得る。

[0064]方法５００は、５０４において、フレームに関連付けられた第１の（たとえば低速）ＬＳＰ変化レートを決定し、５０６において、フレームに関連付けられた第２の（たとえば高速）ＬＳＰ変化レートを決定することも含み得る。たとえば、ＬＳＰ変化レートは、図１に対応する擬似コードにおける「ｌｓｐ＿ｓｌｏｗ＿ｅｖｏｌ＿ｒａｔｅ」変数と「ｌｓｐ＿ｆａｓｔ＿ｅｖｏｌ＿ｒａｔｅ」変数とを参照して例示するように決定され得る。

[0065]方法５００は、５０８において、フレームに関連付けられたＬＳＰ間隔と音声信号の少なくとも１つの他のフレームに関連付けられた少なくとも１つの他のＬＳＰ間隔とに基づいて、平均ＬＳＰ間隔を決定することを含み得る。たとえば、平均ＬＳＰ間隔は、図１に対応する擬似コードにおける「Ａｖｅｒａｇｅ＿ｌｓｐ＿ｓｈｂ＿ｓｐａｃｉｎｇ」変数を参照して例示するように決定され得る。

[0066]方法５００は、５１０において、ＬＳＰ間隔が第１の閾値未満であるか否かを決定することを含み得る。たとえば、図１の擬似コードにおいて、第１の閾値は「ＴＨＲ２」＝０．００３２であってよい。ＬＳＰ間隔が第１の閾値未満の場合、方法５００は５１４において利得減衰を有効にすることを含み得る。

[0067]ＬＳＰ間隔が第１の閾値未満でない場合、方法５００は、５１２においてＬＳＰ間隔が第２の閾値未満であるか否かを決定することを含み得る。たとえば、図１の擬似コードにおいて、第２の閾値は「ＴＨＲ１」＝０．００８であってよい。ＬＳＰ間隔が第２の閾値未満でない場合、方法５００は５２２で終了し得る。ＬＳＰ間隔が第２の閾値未満である場合、方法５００は、５１６で、平均ＬＳＰ間隔が第３の閾値未満であるか否か、フレームがモード遷移を表しているか（または他の方法でモード遷移に関連付けられているか）否か、および／または前のフレームで利得減衰が有効にされていたか否かを決定することを含み得る。たとえば、図１の擬似コードにおいて、第３の閾値は「ＴＨＲ３」＝０．００５であってよい。平均ＬＳＰ間隔が第３の閾値未満である場合、またはフレームがモード遷移を表している場合、または変数ｐｒｅｖＧａｉｎＡｔｔｅｎｕａｔｅ＝ＴＲＵＥの場合、方法５００は５１４で利得減衰を有効にすることを含み得る。平均ＬＳＰ間隔が第３の閾値未満でなく、フレームがモード遷移を表しておらず、変数ｐｒｅｖＧａｉｎＡｔｔｅｎｕａｔｅ＝ＦＡＬＳＥである場合、方法５００は５２２で終了し得る。

[0068]５１４で利得減衰が有効にされる場合、方法５００は５１８に進んでよく、５１８において、第１の変化レートが第４の閾値未満であり、第２の変化レートが第５の閾値未満であるか否かを決定してよい。たとえば、図１の擬似コードにおいて、第４の閾値は「ＴＨＲ４」＝０．００１であってよく、第５の閾値は「ＴＨＲ５」＝０．００１であってよい。第１の変化レートが第４の閾値未満であって、第２の変化レートが第５の閾値未満である場合、方法５００は５２０において利得平滑化を有効にすることを含み得、その後に方法５００は５２２で終了してよい。第１の変化レートが第４の閾値未満でないか、または第２の変化レートが第５の閾値未満でない場合、方法５００は５２２で終了してよい。

[0069]特定の実施形態では、図５の方法５００は、中央演算処理装置（ＣＰＵ）、デジタルシグナルプロセッサ（ＤＳＰ）またはコントローラなどの処理ユニットのハードウェア（たとえばフィールドプログラマブルゲートアレイ（ＦＰＧＡ）デバイス、特定用途向け集積回路（ＡＳＩＣ）など）によって、またはファームウェアデバイス、またはこれらの任意の組合せによって実装可能である。一例として、図５の方法５００は、図６を参照して説明するように命令を実行するプロセッサによって実行され得る。

[0070]以上のように、図１〜図５は、雑音によるアーティファクトを低減するために（たとえば図１の利得減衰および平滑化モジュール１６２において）利得制御を実行するか否かを決定するシステムおよび方法を示している
[0071]図６を参照すると、ワイヤレス通信デバイスの特定の例示の実施形態を示すブロック図が示されており、全体が６００と表記されている。このデバイス６００は、メモリ６３２に結合されたプロセッサ６１０（たとえば中央演算処理装置（ＣＰＵ）、デジタルシグナルプロセッサ（ＤＳＰ）など）を含む。メモリ６３２は、図３〜図５の方法など、本明細書で開示されている方法および処理を実行するためにプロセッサ６１０および／または符号化器／復号器（ＣＯＤＥＣ）６３４によって実行可能な命令６６０を含み得る。

[0072]ＣＯＤＥＣ６３４は利得制御システム６７２を含み得る。特定の実施形態では、利得制御システム６７２は、図１のシステム１００の１つまたは複数のコンポーネントを含み得る。利得制御システム６７２は、専用ハードウェア（たとえば回路）により、または１つまたは複数のタスクを実行するための命令を実行するプロセッサによって、またはこれらの組合せによって実装され得る。一例として、メモリ６３２、またはＣＯＤＥＣ６３４内のメモリは、ランダムアクセスメモリ（ＲＡＭ）、磁気抵抗ランダムアクセスメモリ（ＭＲＡＭ）、スピン注入ＭＲＡＭ（ＳＴＴ−ＭＲＡＭ）、フラッシュメモリ、読取り専用メモリ（ＲＯＭ）、プログラマブル読取り専用メモリ（ＰＲＯＭ）、消去可能プログラマブル読取り専用メモリ（ＥＰＲＯＭ）、電気的消去可能プログラム読取り専用メモリ（ＥＥＰＲＯＭ（登録商標））、レジスタ、ハードディスク、取外し式ディスク、またはコンパクトディスク読取り専用メモリ（ＣＤ−ＲＯＭ）などのメモリデバイスであってよい。メモリデバイスは、コンピュータ（たとえばＣＯＤＥＣ６３４内のプロセッサおよび／またはプロセッサ６１０）によって実行されるとコンピュータに、音声信号に対応するスペクトル情報に基づいて音声信号がアーティファクト生成条件に対応する成分を含むと決定させ、音声信号がその成分を含むと決定することに応答して音声信号に対応する利得パラメータを調整させる命令（たとえば命令６６０）を含むことができる。一例として、メモリ６３２、またはＣＯＤＥＣ６３４内のメモリは、コンピュータ（たとえばＣＯＤＥＣ６３４内のプロセッサおよび／またはプロセッサ６１０）によって実行されるとコンピュータに音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔を少なくとも１つの閾値と比較させ、比較の結果に少なくとも部分的に基づいて音声信号に対応する音声符号化利得パラメータを調整させる命令（たとえば命令６６０）を含む、非一時的コンピュータ可読媒体であってよい。

[0073]図６は、プロセッサ６１０とディスプレイ６２８とに結合されたディスプレイコントローラ６２６も示す。ＣＯＤＥＣ６３４は、図のように、プロセッサ６１０に結合され得る。ＣＯＤＥＣ６３４にはスピーカ６３６とマイクロフォン６３８とが結合され得る。たとえば、マイクロフォン６３８は、図１の入力音声信号１０２を生成することができ、ＣＯＤＥＣ６３４は、入力音声信号１０２に基づいて受信器に送信するための出力ビットストリーム１９２を生成することができる。別の例として、スピーカ６３６は、図１の出力ビットストリーム１９２からＣＯＤＥＣ６３４によって再構成された信号を出力するために使用することができ、この場合、出力ビットストリーム１９２は送信器から受信される。図６は、ワイヤレスコントローラ６４０をプロセッサ６１０とワイヤレスアンテナ６４２とに結合することができることも示している。

[0074]特定の実施形態では、プロセッサ６１０と、ディスプレイコントローラ６２６と、メモリ６３２と、ＣＯＤＥＣ６３４と、ワイヤレスコントローラ６４０とは、システムインパッケージまたはシステムオンチップデバイス（たとえば移動局モデム（ＭＳＭ））６２２内に含まれる。特定の実施形態では、タッチスクリーンおよび／またはキーパッドなどの入力デバイス６３０と、電源６４４がシステムオンチップデバイス６２２に結合されている。さらに、特定の実施形態では、図６に示すように、ディスプレイ６２８と、入力デバイス６３０と、スピーカ６３６と、マイクロフォン６３８と、ワイヤレスアンテナ６４２と、電源６４４とは、システムオンチップデバイス６２２の外部にある。しかし、ディスプレイ６２８と、入力デバイス６３０と、スピーカ６３６と、マイクロフォン６３８と、ワイヤレスアンテナ６４２と、電源６４４とのそれぞれは、インターフェースまたはコントローラなどの、システムオンチップデバイス６２２のコンポーネントに結合され得る。

[0075]記載の実施形態に関連して、音声信号に対応するスペクトル情報に基づいて音声信号がアーティファクト生成条件に対応する成分を含むと決定するための手段を含む装置が開示される。たとえば、決定するための手段は、図１のアーティファクト誘起成分検出モジュール１５８、図６の利得制御システム６７２またはこれらの組合せ、音声信号がそのような成分を含むと決定するように構成された１つまたは複数のデバイス（たとえば非一時的コンピュータ可読媒体における命令を実行するプロセッサ）、またはこれらの任意の組合せを含み得る。

[0076]装置は、音声信号が当該成分を含むと決定することに応答して音声信号に対応する利得パラメータを調整するための手段も含み得る。たとえば、調整するための手段は、図１の利得減衰および平滑化モジュール１６２、図６の利得制御システム６７２またはそのコンポーネント、符号化信号を生成するように構成された１つまたは複数のデバイス（たとえば非一時的コンピュータ可読記憶媒体における命令を実行するプロセッサ）またはこれらの任意の組合せを含み得る。

[0077]本明細書に開示の実施形態に関連して記載されている様々な例示の論理ブロック、構成、モジュール、回路およびアルゴリズムステップが、電子ハードウェア、またはハードウェアプロセッサなどの処理デバイスによって実行されるコンピュータソフトウェア、または両者の組合せとして実装され得ることが、当業者ならさらにわかるであろう。上記では、様々な例示のコンポーネント、ブロック、構成、モジュール、回路、およびステップについて、それらの機能の観点から一般的に説明した。そのような機能をハードウェアとして実装するか、実行可能ソフトウェアとして実装するかは、特定の適用例および全体的なシステムに課される設計制約に依存する。当業者は、説明された機能を特定の適用例ごとに様々な方法で実現できるが、そのような実現の決定は、本開示の範囲からの逸脱を生じるものと解釈されるべきではない。

[0078]本明細書に開示の実施形態に関連して説明した方法またはアルゴリズムのステップは、直接にハードウェアの形態、プロセッサによって実行されるソフトウェアモジュールの形態、またはこの２つの組合せの形態で実施され得る。ソフトウェアモジュールは、ランダムアクセスメモリ（ＲＡＭ）、磁気抵抗ランダムアクセスメモリ（ＭＲＡＭ）、スピン注入ＭＲＡＭ（ＳＴＴ−ＭＲＡＭ）、フラッシュメモリ、読取り専用メモリ（ＲＯＭ）、プログラマブル読取り専用メモリ（ＰＲＯＭ）、消去可能プログラマブル読取り専用メモリ（ＥＰＲＯＭ）、電気的消去可能プログラマブル読取り専用メモリ（ＥＥＰＲＯＭ）、レジスタ、ハードディスク、取外し式ディスク、またはコンパクトディスク読取り専用メモリ（ＣＤ−ＲＯＭ）などのメモリデバイスに存在し得る。例示のメモリデバイスは、プロセッサがメモリデバイスから情報を読み取り、メモリデバイスに情報を書き込むことができるようにプロセッサに結合される。代替実施形態では、メモリデバイスはプロセッサに内蔵され得る。プロセッサと記憶媒体とは、特定用途向け集積回路（ＡＳＩＣ）内に存在し得る。ＡＳＩＣは、コンピューティングデバイスまたはユーザ端末内に存在し得る。代替として、プロセッサおよび記憶媒体は、コンピューティングデバイスまたはユーザ端末中に個別構成要素として常駐し得る。

[0079]開示した実施形態の上記の説明は、開示した実施形態を当業者が作成または使用することができるように行ったものである。当業者にはこれらの実施形態に対する様々な修正が容易にわかるであろうし、本明細書で定義されている原理は本開示の範囲から逸脱することなく他の実施形態に適用され得る。したがって、本開示は、本明細書に示されている実施形態に限定されることが意図されたものではなく、以下の特許請求の範囲によって定義される原理および新規な特徴と合致する最大限の範囲が与えられることが意図されている。

[0079]開示した実施形態の上記の説明は、開示した実施形態を当業者が作成または使用することができるように行ったものである。当業者にはこれらの実施形態に対する様々な修正が容易にわかるであろうし、本明細書で定義されている原理は本開示の範囲から逸脱することなく他の実施形態に適用され得る。したがって、本開示は、本明細書に示されている実施形態に限定されることが意図されたものではなく、以下の特許請求の範囲によって定義される原理および新規な特徴と合致する最大限の範囲が与えられることが意図されている。
以下に、本願出願の当初の特許請求の範囲に記載された発明を付記する。
［Ｃ１］
音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定することと、
前記音声信号が前記成分を含むと決定することに応答して、前記音声信号に対応する利得パラメータを調整することと、を備える方法。
［Ｃ２］
前記ＬＳＰ間隔は、前記音声信号のフレームに関連付けられている、Ｃ１に記載の方法。
［Ｃ３］
前記ＬＳＰ間隔は、前記音声信号の前記フレームの高帯域部分の複数のＬＳＰに対応する複数のＬＳＰ間隔のうちの最小のＬＳＰ間隔である、Ｃ２に記載の方法。
［Ｃ４］
前記音声信号は、前記ＬＳＰ間隔が第１の閾値未満であることに応答して前記成分を含むと決定される、Ｃ２に記載の方法。
［Ｃ５］
前記音声信号は、前記ＬＳＰ間隔が第２の閾値未満であることと平均ＬＳＰ間隔が第３の閾値未満であることとに応答して前記成分を含むと決定され、ここにおいて、前記平均ＬＳＰ間隔は前記フレームに関連付けられた前記ＬＳＰ間隔と前記音声信号の少なくとも１つの他のフレームに関連付けられた少なくとも１つの他のＬＳＰ間隔とに基づく、Ｃ２に記載の方法。
［Ｃ６］
前記音声信号は、
１）前記ＬＳＰ間隔が第２の閾値未満であることと、
２）平均ＬＳＰ間隔が第３の閾値未満であること、または
前記音声信号の別のフレームに対応する利得減衰が有効化されていることのうちの少なくとも１つにと応答して、前記成分を含むと決定され、前記別のフレームは前記音声信号の前記フレームに先行する、Ｃ２に記載の方法。
［Ｃ７］
前記利得パラメータを調整することは、前記音声信号のフレームに対応する利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、Ｃ１に記載の方法。
［Ｃ８］
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値との加重平均を決定すること、を含むＣ７に記載の方法。
［Ｃ９］
前記利得平滑化は、前記フレームに関連付けられた第１の線スペクトル対（ＬＳＰ）変化レートが第４の閾値未満であり、前記フレームに関連付けられた第２のＬＳＰ変化レートが第５の閾値未満であることに応答して有効にされる、Ｃ７に記載の方法。
［Ｃ１０］
前記第１のＬＳＰ変化レートは、前記第２のＬＳＰ変化レートよりも低速の適応レートに対応する、Ｃ９に記載の方法。
［Ｃ１１］
前記利得パラメータを調整することは、前記音声信号のフレームに対応する利得値を低減するために利得減衰を有効にすることを含む、Ｃ１に記載の方法。
［Ｃ１２］
前記利得減衰は、前記利得値に指数演算を適用することを含む、Ｃ１１に記載の方法。
［Ｃ１３］
前記利得減衰は、前記利得値に線形演算を適用することを含む、Ｃ１１に記載の方法。
［Ｃ１４］
前記利得減衰は、
第１の利得条件が満たされていることに応答して前記利得値に指数演算を適用することと、
第２の利得条件が満たされていることに応答して前記利得値に線形演算を適用することとを含む、Ｃ１１に記載の方法。
［Ｃ１５］
前記第１の利得条件は、平均ＬＳＰ間隔が第６の閾値未満であることを含み、ここにおいて、前記平均ＬＳＰ間隔は前記フレームに関連付けられた前記ＬＳＰ間隔と前記音声信号の少なくとも１つの他のフレームに関連付けられた少なくとも１つの他のＬＳＰ間隔とに基づく、Ｃ１４に記載の方法。
［Ｃ１６］
前記第２の利得条件は、前記音声信号の別のフレームに対応する利得減衰が有効化されていることを含み、前記別のフレームは前記音声信号に先行する、Ｃ１４に記載の方法。
［Ｃ１７］
前記アーティファクト生成条件は、高帯域雑音に対応する、Ｃ１に記載の方法。
［Ｃ１８］
音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔を少なくとも１つの閾値と比較することと、
前記比較の結果に少なくとも部分的に基づいて前記音声信号に対応する音声符号化利得パラメータを調整することと、を備える方法。
［Ｃ１９］
前記ＬＳＰ間隔は、前記音声信号の前記フレームの高帯域部分の複数のＬＳＰに対応する複数のＬＳＰ間隔のうちの最小のＬＳＰ間隔である、Ｃ１８に記載の方法。
［Ｃ２０］
前記利得パラメータを調整することは、前記ＬＳＰ間隔が第１の閾値未満であることに応答して利得減衰を有効にすることを含む、Ｃ１８に記載の方法。
［Ｃ２１］
前記利得パラメータを調整することは、前記ＬＳＰ間隔が第２の閾値未満であることと平均ＬＳＰ間隔が第３の閾値未満であることとに応答して利得減衰を有効にすることを含み、ここにおいて前記平均ＬＳＰ間隔は前記フレームに関連付けられた前記ＬＳＰ間隔と前記音声信号の少なくとも１つの他のフレームに関連付けられた少なくとも１つの他のＬＳＰ間隔とに基づく、Ｃ１８に記載の方法。
［Ｃ２２］
前記利得パラメータを調整することは、利得減衰が有効にされている場合に、
第１の利得条件が満たされていることに応答して、前記利得パラメータの値に指数演算を適用することと、
第２の利得条件が満たされていることに応答して、前記利得パラメータの前記値に線形演算を適用することと、を含むＣ１８に記載の方法。
［Ｃ２３］
前記利得パラメータを調整することは、前記音声信号のフレームに対応する前記利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、Ｃ１８に記載の方法。
［Ｃ２４］
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む、Ｃ２３に記載の方法。
［Ｃ２５］
前記利得平滑化は、前記フレームに関連付けられた第１の線スペクトル対（ＬＳＰ）変化レートが第４の閾値未満であることと、前記フレームに関連付けられた第２のＬＳＰ変化レートが第５の閾値未満であることとに応答して有効にされ、ここにおいて、前記第１のＬＳＰ変化レートは前記第２のＬＳＰ変化レートよりも低速な適応レートである、Ｃ２４に記載の方法。
［Ｃ２６］
音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔に基づいて前記音声信号がアーティファクト生成条件に対応する成分を含むと決定するように構成された雑音検出回路と、
前記雑音検出回路に応答し、前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整するように構成された利得減衰および平滑化回路と、を備える装置。
［Ｃ２７］
前記音声信号を受信し、前記音声信号の低帯域部分と前記音声信号の高帯域部分とを生成するように構成された解析フィルタバンクと、
前記低帯域部分に基づいて低帯域ビットストリームを生成するように構成された低帯域解析回路と、
前記高帯域部分と前記低帯域部分に関連付けられた低帯域励起とに基づいて高帯域サイド情報を生成するように構成された高帯域解析回路と、ここにおいて、前記利得パラメータを含む利得情報が前記高帯域サイド情報に含まれる、
出力ビットストリームを生成するために前記低帯域ビットストリームと前記高帯域サイド情報とを多重化するように構成されたマルチプレクサと、をさらに備えるＣ２６に記載の装置。
［Ｃ２８］
音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定するための手段と、
前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整するための手段と、を備える装置。
［Ｃ２９］
前記音声信号の低帯域部分と前記音声信号の高帯域部分とを生成するための手段と、
前記低帯域部分に基づいて低帯域ビットストリームを生成するための手段と、
前記高帯域部分と前記低帯域部分に関連付けられた低帯域励起とに基づいて高帯域サイド情報を生成するための手段と、ここにおいて、前記利得パラメータを含む利得情報が前記高帯域サイド情報に含まれる、
出力ビットストリームを生成するために前記低帯域ビットストリームと前記高帯域サイド情報とを多重化するための手段と、を備えるＣ２８に記載の装置。
［Ｃ３０］
コンピュータによって実行されると、前記コンピュータに、
音声信号に対応する音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定させ、
前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整させる命令、を備える非一時的コンピュータ可読媒体。
［Ｃ３１］
前記ＬＳＰ間隔は、前記音声信号の前記フレームの高帯域部分の複数のＬＳＰに対応する複数のＬＳＰ間隔のうちの最小のＬＳＰ間隔である、Ｃ３０に記載のコンピュータ可読媒体。
［Ｃ３２］
前記利得パラメータを調整することは、前記ＬＳＰ間隔が第１の閾値未満であることに応答して利得減衰を有効にすることを含む、Ｃ３０に記載のコンピュータ可読媒体。
［Ｃ３３］
前記利得パラメータを調整することは、前記ＬＳＰ間隔が第２の閾値未満であることと平均ＬＳＰ間隔が第３の閾値未満であることとに応答して利得減衰を有効にすることを含み、ここにおいて、前記平均ＬＳＰ間隔は前記フレームに関連付けられた前記ＬＳＰ間隔と前記音声信号の少なくとも１つの他のフレームに関連付けられた少なくとも１つの他のＬＳＰ間隔とに基づく、Ｃ３０に記載のコンピュータ可読媒体。
［Ｃ３４］
前記利得パラメータを調整することは、利得減衰が有効にされている場合に、
第１の利得条件が満たされていることに応答して、前記利得パラメータの値に指数演算を適用することと、
第２の利得条件が満たされていることに応答して、前記利得パラメータの前記値に線形演算を適用することと、を含むＣ３０に記載のコンピュータ可読媒体。
［Ｃ３５］
前記利得パラメータを調整することは、前記音声信号のフレームに対応する前記利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、Ｃ３０に記載のコンピュータ可読媒体。
［Ｃ３６］
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む、Ｃ３５に記載のコンピュータ可読媒体。
［Ｃ３７］
前記利得平滑化は、前記フレームに関連付けられた第１の線スペクトル対（ＬＳＰ）変化レートが第４の閾値未満であることと、前記フレームに関連付けられた第２のＬＳＰ変化レートが第５の閾値未満であることとに応答して有効にされ、ここにおいて、前記第１のＬＳＰ変化レートは前記第２のＬＳＰ変化レートよりも低速な適応レートである、Ｃ３６に記載のコンピュータ可読媒体。

Claims

音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定することと、
前記音声信号が前記成分を含むと決定することに応答して、前記音声信号に対応する利得パラメータを調整することと、を備える方法。
前記ＬＳＰ間隔は、前記音声信号のフレームに関連付けられている、請求項１に記載の方法。
前記ＬＳＰ間隔は、前記音声信号の前記フレームの高帯域部分の複数のＬＳＰに対応する複数のＬＳＰ間隔のうちの最小のＬＳＰ間隔である、請求項２に記載の方法。
前記音声信号は、前記ＬＳＰ間隔が第１の閾値未満であることに応答して前記成分を含むと決定される、請求項２に記載の方法。
前記音声信号は、前記ＬＳＰ間隔が第２の閾値未満であることと平均ＬＳＰ間隔が第３の閾値未満であることとに応答して前記成分を含むと決定され、ここにおいて、前記平均ＬＳＰ間隔は前記フレームに関連付けられた前記ＬＳＰ間隔と前記音声信号の少なくとも１つの他のフレームに関連付けられた少なくとも１つの他のＬＳＰ間隔とに基づく、請求項２に記載の方法。
前記音声信号は、
１）前記ＬＳＰ間隔が第２の閾値未満であることと、
２）平均ＬＳＰ間隔が第３の閾値未満であること、または
前記音声信号の別のフレームに対応する利得減衰が有効化されていることのうちの少なくとも１つにと応答して、前記成分を含むと決定され、前記別のフレームは前記音声信号の前記フレームに先行する、請求項２に記載の方法。
前記利得パラメータを調整することは、前記音声信号のフレームに対応する利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、請求項１に記載の方法。
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値との加重平均を決定すること、を含む請求項７に記載の方法。
前記利得平滑化は、前記フレームに関連付けられた第１の線スペクトル対（ＬＳＰ）変化レートが第４の閾値未満であり、前記フレームに関連付けられた第２のＬＳＰ変化レートが第５の閾値未満であることに応答して有効にされる、請求項７に記載の方法。
前記第１のＬＳＰ変化レートは、前記第２のＬＳＰ変化レートよりも低速の適応レートに対応する、請求項９に記載の方法。
前記利得パラメータを調整することは、前記音声信号のフレームに対応する利得値を低減するために利得減衰を有効にすることを含む、請求項１に記載の方法。
前記利得減衰は、前記利得値に指数演算を適用することを含む、請求項１１に記載の方法。
前記利得減衰は、前記利得値に線形演算を適用することを含む、請求項１１に記載の方法。
前記利得減衰は、
第１の利得条件が満たされていることに応答して前記利得値に指数演算を適用することと、
第２の利得条件が満たされていることに応答して前記利得値に線形演算を適用することとを含む、請求項１１に記載の方法。
前記第１の利得条件は、平均ＬＳＰ間隔が第６の閾値未満であることを含み、ここにおいて、前記平均ＬＳＰ間隔は前記フレームに関連付けられた前記ＬＳＰ間隔と前記音声信号の少なくとも１つの他のフレームに関連付けられた少なくとも１つの他のＬＳＰ間隔とに基づく、請求項１４に記載の方法。
前記第２の利得条件は、前記音声信号の別のフレームに対応する利得減衰が有効化されていることを含み、前記別のフレームは前記音声信号に先行する、請求項１４に記載の方法。
前記アーティファクト生成条件は、高帯域雑音に対応する、請求項１に記載の方法。
音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔を少なくとも１つの閾値と比較することと、
前記比較の結果に少なくとも部分的に基づいて前記音声信号に対応する音声符号化利得パラメータを調整することと、を備える方法。
前記ＬＳＰ間隔は、前記音声信号の前記フレームの高帯域部分の複数のＬＳＰに対応する複数のＬＳＰ間隔のうちの最小のＬＳＰ間隔である、請求項１８に記載の方法。
前記利得パラメータを調整することは、前記ＬＳＰ間隔が第１の閾値未満であることに応答して利得減衰を有効にすることを含む、請求項１８に記載の方法。
前記利得パラメータを調整することは、前記ＬＳＰ間隔が第２の閾値未満であることと平均ＬＳＰ間隔が第３の閾値未満であることとに応答して利得減衰を有効にすることを含み、ここにおいて前記平均ＬＳＰ間隔は前記フレームに関連付けられた前記ＬＳＰ間隔と前記音声信号の少なくとも１つの他のフレームに関連付けられた少なくとも１つの他のＬＳＰ間隔とに基づく、請求項１８に記載の方法。
前記利得パラメータを調整することは、利得減衰が有効にされている場合に、
第１の利得条件が満たされていることに応答して、前記利得パラメータの値に指数演算を適用することと、
第２の利得条件が満たされていることに応答して、前記利得パラメータの前記値に線形演算を適用することと、を含む請求項１８に記載の方法。
前記利得パラメータを調整することは、前記音声信号のフレームに対応する前記利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、請求項１８に記載の方法。
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む、請求項２３に記載の方法。
前記利得平滑化は、前記フレームに関連付けられた第１の線スペクトル対（ＬＳＰ）変化レートが第４の閾値未満であることと、前記フレームに関連付けられた第２のＬＳＰ変化レートが第５の閾値未満であることとに応答して有効にされ、ここにおいて、前記第１のＬＳＰ変化レートは前記第２のＬＳＰ変化レートよりも低速な適応レートである、請求項２４に記載の方法。
音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔に基づいて前記音声信号がアーティファクト生成条件に対応する成分を含むと決定するように構成された雑音検出回路と、
前記雑音検出回路に応答し、前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整するように構成された利得減衰および平滑化回路と、を備える装置。
前記音声信号を受信し、前記音声信号の低帯域部分と前記音声信号の高帯域部分とを生成するように構成された解析フィルタバンクと、
前記低帯域部分に基づいて低帯域ビットストリームを生成するように構成された低帯域解析回路と、
前記高帯域部分と前記低帯域部分に関連付けられた低帯域励起とに基づいて高帯域サイド情報を生成するように構成された高帯域解析回路と、ここにおいて、前記利得パラメータを含む利得情報が前記高帯域サイド情報に含まれる、
出力ビットストリームを生成するために前記低帯域ビットストリームと前記高帯域サイド情報とを多重化するように構成されたマルチプレクサと、をさらに備える請求項２６に記載の装置。
音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定するための手段と、
前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整するための手段と、を備える装置。
前記音声信号の低帯域部分と前記音声信号の高帯域部分とを生成するための手段と、
前記低帯域部分に基づいて低帯域ビットストリームを生成するための手段と、
前記高帯域部分と前記低帯域部分に関連付けられた低帯域励起とに基づいて高帯域サイド情報を生成するための手段と、ここにおいて、前記利得パラメータを含む利得情報が前記高帯域サイド情報に含まれる、
出力ビットストリームを生成するために前記低帯域ビットストリームと前記高帯域サイド情報とを多重化するための手段と、を備える請求項２８に記載の装置。
コンピュータによって実行されると、前記コンピュータに、
音声信号に対応する音声信号のフレームに関連付けられた線スペクトル対（ＬＳＰ）間隔に基づいて、前記音声信号がアーティファクト生成条件に対応する成分を含むと決定させ、
前記音声信号が前記成分を含むと決定することに応答して前記音声信号に対応する利得パラメータを調整させる命令、を備える非一時的コンピュータ可読媒体。
前記ＬＳＰ間隔は、前記音声信号の前記フレームの高帯域部分の複数のＬＳＰに対応する複数のＬＳＰ間隔のうちの最小のＬＳＰ間隔である、請求項３０に記載のコンピュータ可読媒体。
前記利得パラメータを調整することは、前記ＬＳＰ間隔が第１の閾値未満であることに応答して利得減衰を有効にすることを含む、請求項３０に記載のコンピュータ可読媒体。
前記利得パラメータを調整することは、前記ＬＳＰ間隔が第２の閾値未満であることと平均ＬＳＰ間隔が第３の閾値未満であることとに応答して利得減衰を有効にすることを含み、ここにおいて、前記平均ＬＳＰ間隔は前記フレームに関連付けられた前記ＬＳＰ間隔と前記音声信号の少なくとも１つの他のフレームに関連付けられた少なくとも１つの他のＬＳＰ間隔とに基づく、請求項３０に記載のコンピュータ可読媒体。
前記利得パラメータを調整することは、利得減衰が有効にされている場合に、
第１の利得条件が満たされていることに応答して、前記利得パラメータの値に指数演算を適用することと、
第２の利得条件が満たされていることに応答して、前記利得パラメータの前記値に線形演算を適用することと、を含む請求項３０に記載のコンピュータ可読媒体。
前記利得パラメータを調整することは、前記音声信号のフレームに対応する前記利得値における、より高速の変化を低減するために利得平滑化を有効にすることを含む、請求項３０に記載のコンピュータ可読媒体。
前記利得平滑化は、前記フレームに関連付けられた前記利得値と前記音声信号の別のフレームに対応する別の利得値とを含む利得値の加重平均を決定することを含む、請求項３５に記載のコンピュータ可読媒体。
前記利得平滑化は、前記フレームに関連付けられた第１の線スペクトル対（ＬＳＰ）変化レートが第４の閾値未満であることと、前記フレームに関連付けられた第２のＬＳＰ変化レートが第５の閾値未満であることとに応答して有効にされ、ここにおいて、前記第１のＬＳＰ変化レートは前記第２のＬＳＰ変化レートよりも低速な適応レートである、請求項３６に記載のコンピュータ可読媒体。