JP2013506878A

JP2013506878A - オーディオ信号の雑音抑制

Info

Publication number: JP2013506878A
Application number: JP2012532370A
Authority: JP
Inventors: ラマクリシュナン、ディネッシュ; シュアーリ、ホーマユーン; ワン、ソン
Original assignee: Qualcomm Inc
Current assignee: Qualcomm Inc
Priority date: 2009-10-01
Filing date: 2010-10-01
Publication date: 2013-02-28
Also published as: US20110081026A1; WO2011041738A3; KR20120090075A; WO2011041738A2; US8571231B2; EP2483888A2; CN102549659A

Abstract

オーディオ信号の雑音を抑制するための電子デバイスが記述される。電子デバイスは、プロセッサと、メモリに記憶された命令とを含む。電子デバイスは、入力オーディオ信号を受信し、定常雑音推定、非定常雑音推定、および、超過雑音推定に基づいて、総合雑音推定を計算する。電子デバイスは、さらに、入力の信号対雑音比（ＳＮＲ）および１または複数のＳＮＲ限界に基づいて適応係数を計算する。スペクトル拡張利得関数を用いて、利得のセットがさらに計算される。スペクトル拡張利得関数は、総合雑音推定および適応係数に基づく。電子デバイスは、さらに、利得のセットを入力オーディオ信号に適応して、雑音抑制済みオーディオ信号を生成し、その雑音抑制済みオーディオ信号を提供する。

Description

[関連出願]
本出願は、２００９年１０月１日に出願された「Enhanced Noise Suppression with Single Input Audio Signal」と題する米国仮出願第６１／２４７，８８８号に関し、それからの優先権を主張する。

[技術分野]
本開示は一般的に電子デバイスに関する。より詳細には、本開示は、オーディオ信号の雑音を抑制することに関する。

[背景]
過去数十年で、電子デバイスの使用は一般的になった。特に、電子技術における進歩は、益々複雑で有益な電子デバイスのコストを削減した。コストの削減と消費者の需要は、電子デバイスの使用を急激に増加させ、それらは、実際、現在の社会においてユビキタスである。電子デバイスの使用が拡大するにつれ、電子デバイスの新しく且つ改善された特徴に対する需要も増加してきた。より具体的には、機能を、より迅速に、より効率的に、または、より高品質で実行する電子デバイスが求められることが多い。

多くの電子デバイスが、外部入力を取り込むか、あるいは受信する。例えば、多くの電子デバイスは、サウンド（例えば、オーディオ信号）を取り込む。例えば、電子デバイスは、オーディオ信号を使用してサウンドを記録しうる。オーディオ信号は、サウンドを再生するためにも使用されうる。いくつかの電子デバイスは、オーディオ信号を処理して、それらをある方法で高める。多くの電子デバイスは、さらに、電磁信号を送信および／または受信する。これらの電磁信号のうちのいくつかは、オーディオ信号を表すことができる。

サウンドは、騒がしい環境で取り込まれることが多い。これが生じた場合、電子デバイスは、しばしば、所望サウンドに加えて雑音を取り込む。例えば、携帯電話のユーザは、バックグラウンド雑音が著しいロケーション（例えば、車中、電車の中、騒がしいレストラン、屋外など）で電話を掛けうる。そのような雑音も取り込まれると、結果として生じるオーディオ信号の品質は低下しうる。例えば、取り込まれたサウンドが、劣化したオーディオ信号を使用して再生されると、所望サウンドが破損して、雑音と区別することが難しくなる可能性がある。この論述が示すように、オーディオ信号の雑音を抑制するための改善されたシステムおよび方法が有益でありうる。

図１は、オーディオ信号の雑音を抑制するシステムおよび方法が実現されうる電子デバイスの１つの例を示すブロック図である。図２は、オーディオ信号の雑音を抑制するシステムおよび方法が実現されうる電子デバイスの１つの例を示すブロック図である。図３は、オーディオ信号の雑音を抑制するシステムおよび方法が実現されうる無線通信デバイスの１つの構成を示すブロック図である。図４は、オーディオ信号の雑音を抑制するシステムおよび方法が実現されうる無線通信デバイスの別のより具体的な構成を示すブロック図である。図５は、オーディオ信号の雑音を抑制するシステムおよび方法が実現されうる無線通信デバイスと基地局の複数の構成を示すブロック図である。図６は、オーディオ信号の複数の帯域上での雑音抑制を示すブロック図である。図７は、オーディオ信号の雑音を抑制する方法の１つの構成を示すフロー図である。図８は、オーディオ信号の雑音を抑制する方法のより具体的な構成を示すフロー図である。図９は、雑音抑制モジュールの１つの構成を示すブロック図である。図１０は、ビン圧縮の１つの例を示すブロック図である。図１１は、本明細書に開示されるシステムおよび方法に従って超過雑音推定と総合雑音推定とを計算することの、より具体的なインプリメンテーションを示すブロック図である。図１２は、過剰減算係数を決定するのに使用されうるより具体的の関数を示す図である。図１３は、利得計算モジュールのより具体的なインプリメンテーションを示すブロック図である。図１４は、電子デバイスで利用されうる様々なコンポーネントを示す。図１５は、無線通信デバイスに含まれうる特定のコンポーネントを示す。図１６は、基地局に含まれうる特定のコンポーネントを示す。

[詳細な説明]
本明細書で使用される場合、「基地局（base station）」という用語は、一般的に、通信ネットワークへのアクセスを提供することができる通信デバイスを表す。通信ネットワークの例は、電話ネットワーク（例えば、公衆電話交換ネットワーク（ＰＳＴＮ）またはセルラ電話ネットワークなどの「陸線」ネットワーク）、インターネット、ローカルエリアネットワーク（ＬＡＮ）、広域ネットワーク（ＷＡＮ）、メトロポリタンエリアネットワーク（ＭＡＮ）などを含むがそれらに限定されない。基地局の例は、例えば、セルラ電話基地局またはノード、アクセスポイント、無線ゲートウェイ、無線ルータを含む。基地局は、ＩＥＥＥ（Institute of Electrical and Electronics Engineers）８０２．１１ａ、８０２．１１ｂ、８０２．１１ｇ、８０２．１１ｎ、８０２．１１ａｃ（例えば、「Ｗｉ−Ｆｉ（Wireless Fidelity）」）標準などの特定の業界標準に従って動作しうる。基地局が従いうる標準の別の例は、ＩＥＥＥ８０２．１６（例えば、「ＷｉＭＡＸ（Worldwide Interoperability for Microwave Access）」、第３世代パートナーシッププロジェクト（３ＧＰＰ）、３ＧＰＰロングタームエボリューション（ＬＴＥ）、および、その他（ここでは、基地局がノードＢ、発展型ノードＢ（ｅＮＢ）と呼ばれうる）など）を含む。本明細書に開示されるシステムおよび方法のいくつかは、１または複数の標準の観点から記述されるが、このシステムおよび方法は、多数のシステムおよび／または標準に適用可能であるため、これによって、本開示の範囲が制限されるべきではない。

本明細書で使用される場合、「無線通信デバイス（wireless communication device）」という用語は、一般的に、基地局に無線で接続されうる通信デバイス（例えば、アクセス端末、クライアントデバイス、クライアント局など）を表す。無線通信デバイスは、別名、モバイルデバイス、モバイル局、加入者局、ユーザ機器（ＵＥ）、リモート局、アクセス端末、モバイル端末、端末、ユーザ端末、加入者ユニットなどと呼ばれうる。無線通信デバイスの例は、ラップトップまたはデスクトップコンピュータ、セルラ電話、スマートフォン、無線モデム、電子リーダ、タブレットデバイス、ゲーミングシステムなどを含む。無線通信デバイスは、基地局に関して上に記述されたような１または複数の業界標準に従って動作しうる。このように、「無線通信デバイス（wireless communication device）」という一般用語は、業界標準に従った様々な名称（例えば、アクセス端末、ユーザ機器（ＵＥ）、リモート局など）で記述される無線通信デバイスを含みうる。

音声通信は、無線通信デバイスによって行われることが多い１つの機能である。近年、無線通信デバイスの音声品質を向上させるために、多数の信号処理解法が提示されてきた。いくつかの解法は、送信またはアップリンク側でしか有効ではない。ダウンリンク側での音声品質の改善は、単一入力オーディオ信号だけを使用して雑音抑制を提供することができる解法を要求しうる。本明細書に開示されるシステムおよび方法は、単一入力信号を使用し、入力信号の定常（stationary）雑音と非定常（non-stationary）雑音の両方を抑制するために、改善された能力を提供しうる強化された雑音抑制を提示する。

本明細書に開示されるシステムおよび方法は、一般的に、電子デバイス（例えば、無線通信デバイス）の音声品質を改善するために使用される信号処理解法の分野に関する。より詳細には、本明細書に開示されるシステムおよび方法は、雑音（例えば、環境騒音、バックグラウンド雑音）を抑制することと、所望信号の品質を改善することに焦点を当てる。

電子デバイス（例えば、無線通信デバイス、音声レコーダなど）において、改善された音声品質は、望ましいものであり、かつ、有益である。音声品質は、電子デバイスを使用する間、環境騒音の存在に影響されることが多い。騒がしいシナリオにおいて音声品質を改善するための１つのアプローチは、複数のマイクロフォンを電子デバイスに備え、高性能の信号処理技術を使用して、環境雑音から所望信号を分離することである。しかしながら、これは、特定のシナリオ（例えば、無線通信デバイスのアップリンク側）でのみ有効でありうる。別のシナリオ（例えば、電子デバイスが１つのマイクロフォンしか有さない場合、無線通信デバイスのダウンリンク側）において、唯一の利用可能なオーディオ信号は、モノフォニック（例えば、「モノ（mono）」あるいはモノラル）信号である。このようなシナリオの場合、信号の雑音を抑制するために、単一入力信号処理解法だけが使用されうる。

通信デバイス（例えば、１種類の電子デバイス）に関して、遠端からの雑音は、ダウンリンクの音声品質に影響を及ぼしうる。さらに、アップリンクにおける単一または複数のマイクロフォン雑音抑制は、無線通信デバイスの近端ユーザに対して直接的な利益を供給しない可能性がある。さらに、いくつかの通信デバイス（例えば、陸線電話）は、いずれの雑音抑制も有さない可能性がある。いくつかのデバイスは、単一マイクロフォン定常雑音抑制を提供する。このように、遠端雑音抑制は、それが、非定常雑音抑制を提供する場合に有益でありうる。この文脈において、遠端雑音抑制は、雑音を抑制し、通信デバイスの音声品質を改善するために、ダウンリンク経路に組み込まれうる。

これまでの多くの単一入力雑音抑制解法は、モータ雑音、熱雑音、エンジン雑音などの定常雑音しか抑制することができない。すなわち、それらは、非定常雑音を抑制することができない可能性がある。さらに、単一入力雑音抑制解法は、雑音抑制の量がある範囲以上に増加した場合、所望信号の品質を損なうことが多い。音声通信システムにおいて、雑音を抑制すると同時に音声品質を維持することは、特にダウンリンク側で有益でありうる。既存の単一入力雑音抑制技術の多くが、この目的には不適切である。

本明細書に開示されるシステムおよび方法は、単一または複数の入力に対して使用されうる雑音抑制を提供し、所望信号の品質を維持すると同時に定常雑音および非定常雑音の両方の抑制を提供しうる。本明細書のシステムおよび方法は、スピーチ適応スペクトル拡張（および／または、圧縮、すなわち「コンパンディング」）技術を用いて、出力信号の改善された品質を提供する。これらは、狭帯域（narrow-band）、広帯域（wide-band）、あるいは、任意のサンプリングレートの入力に適用されうる。加えて、これらは、音声およびミュージックの両方の入力信号の雑音を抑制するために使用されうる。本明細書で開示されるシステムおよび方法のアプリケーションのうちのいくつかは、無線（またはモバイル）通信においてダウンリンク音声品質を改善するための単一または複数のマイクロフォン雑音抑制、音声およびオーディオ記録のための雑音抑制、その他を含む。

オーディオ信号の雑音を抑制するための電子デバイスが開示される。電子デバイスは、プロセッサと、メモリに記憶された命令とを含む。電子デバイスは、入力オーディオ信号を受信し、定常雑音推定１（stationary noise estimate）、非定常雑音推定（non-stationary noise estimate）、および、超過雑音推定(excess noise estimate)に基づいて総合雑音推定(overall noise estimate)を計算する。電子デバイスは、さらに、入力の信号対雑音比（ＳＮＲ）および１または複数のＳＮＲ限界（ＳＮＲＬｉｍｉｔ）に基づいて、適応係数(adaptive factor)を計算する。利得のセットは、スペクトル拡張利得関数（spectral expansion function）を使用して計算される。スペクトル拡張利得関数は、総合雑音推定および適応係数に基づく。電子デバイスは、雑音抑制済みオーディオ信号を生成するために、利得のセットを入力オーディオ信号に適用し、この雑音抑制済みオーディオ信号を提供する。

電子デバイスは、さらに、定常雑音推定、非定常雑音推定、および、超過雑音推定に対する重みを計算しうる。定常雑音推定は、入力オーディオ信号の電力レベルを追跡することによって計算されうる。入力オーディオ信号の電力レベルを追跡することは、スライディングウィンドウ(sliding window)を使用して実現されうる。

非定常雑音推定は、長期推定(long-term estimate)でありうる。超過雑音推定は、短期推定(short-term estimate)でありうる。スペクトル拡張利得関数は、さらに、短期ＳＮＲ推定に基づきうる。スペクトル拡張利得関数は、基数(base)と指数(exponent)を含みうる。基数は、総合雑音推定で割った入力信号電力を含み、指数は、適応係数で割った所望雑音抑制レベルを含みうる。

電子デバイスは、入力オーディオ信号をいくつかの周波数ビン(frequency bin)に圧縮しうる。圧縮は、複数の周波数ビンにわたってデータを平均化することを含みうる。この場合、１または複数のより低い周波数ビンにおける低い方の周波数データは、１または複数の高い周波数ビンにおける高い方の周波数データよりも圧縮されない。

電子デバイスは、さらに、入力オーディオ信号の離散フーリエ変換（ＤＦＴ）を計算し、雑音抑制済みオーディオ信号の離散逆フーリエ変換（ＩＤＦＴ）を計算する。電子デバイスは、無線通信デバイスでありうる。電子デバイスは、基地局でありうる。電子デバイスは、雑音抑制済みオーディオ信号をメモリに記憶しうる、入力オーディオ信号は、リモートの無線通信デバイスから受信されうる。１または複数のＳＮＲ限界は、異なるＳＮＲ領域に対して別々に利得を決定するのに使用される複数のターニングポイント(turning point)でありうる。

スペクトル拡張利得関数は、次の式に従って計算されうる：

ここで、Ｇ（ｎ，ｋ）は利得のセットであり、ｎはフレーム番号であり、ｋはビン番号(bin number)であり、Ｂは所望の雑音抑制限界であり、Ａは適応係数であり、ｂはＢに基づく係数であり、Ａ（ｎ，ｋ）は入力大きさ推定であり、Ａ_ｏｎ（ｎ，ｋ）は、総合雑音推定である。超過雑音推定は、次の式に従って計算されうる：

ここで、Ａ_ｅｎ（ｎ，ｋ）は超過雑音推定であり、ｎはフレーム番号であり、ｋはビン番号であり、β_ＮＳは所望の雑音抑制限界であり、Ａ（ｎ，ｋ）は入力大きさ推定であり、γ_ｃｎは結合スケーリング係数あり、Ａ_ｃｎ（ｎ，ｋ）は結合雑音推定(combined noise estimate)である。

総合雑音推定は、次の式に従って計算されうる：

ここで、Ａ_ｏｎ（ｎ，ｋ）は、総合雑音推定であり、ｎはフレーム番号であり、ｋはビン番号であり、γ_ｃｎは結合スケーリング係数であり、Ａ_ｃｎ（ｎ，ｋ）は、結合雑音推定であり、γ_ｅｎは超過雑音スケーリング係数(excess noise scaling factor)であり、Ａ_ｅｎ（ｎ，ｋ）は超過雑音推定である。入力オーディオ信号は、複数の周波数帯域に分割される広帯域オーディオ信号であり、雑音抑制は、その複数の周波数帯域の各々で行われる。

電子デバイスは、定常雑音推定、結合雑音推定、入力のＳＮＲ、および、利得のセットを平滑化しうる。

オーディオ信号の雑音を抑制するための方法が、さらに開示される。方法は、入力オーディオ信号を受信することと、電子デバイス上で、定常雑音推定、非定常雑音推定、超過雑音推定に基づいて総合雑音推定を計算することとを含む。方法は、さらに、入力の信号対雑音比（ＳＮＲ）および１または複数のＳＮＲ限界に基づいて適応係数を計算することを含む。方法は、さらに、電子デバイス上で、スペクトル拡張利得関数を使用して利得のセットを計算することを含む。スペクトル拡張利得関数は、総合雑音推定および適応係数に基づく。方法は、さらに、雑音抑制済みオーディオ信号を生成するために、利得のセットを入力オーディオ信号に適用することと、この雑音抑制済みオーディオ信号を提供することとを含む。

オーディオ信号の雑音を抑制するためのコンピュータプログラムプロダクトが、さらに開示される。コンピュータプログラムプロダクトは、非一時的なコンピュータ可読媒体上に命令を含む。この命令は、入力オーディ信号を受信するためのコードと、定常雑音推定、非定常雑音推定、超過雑音推定に基づいて総合雑音推定を計算するためのコードとを含む。命令は、さらに、入力の信号対雑音比（ＳＮＲ）、および、１または複数のＳＮＲ限界に基づいて適応係数を計算するためのコードと、スペクトル拡張利得関数を使用して利得のセットを計算するためのコードとを含む。スペクトル拡張利得関数は、総合雑音推定および適応係数に基づく。命令はさらに、雑音抑制済みオーディオ信号を生成するために、利得のセットを入力オーディオ信号に適用するためのコードと、この雑音抑制済みオーディオ信号を提供するためのコードとを含む。

オーディオ信号の雑音を抑制するための装置が、さらに開示される。装置は、入力オーディオ信号を受信するための手段と、定常雑音推定、非定常雑音推定、超過雑音推定に基づいて総合雑音推定を計算するための手段とを含む。装置は、さらに、入力の信号対雑音比（ＳＮＲ）および１または複数のＳＮＲ限界に基づいて適応係数を計算するための手段と、スペクトル拡張利得関数を使用して利得のセットを計算するための手段とを含む。スペクトル拡張利得関数は、総合雑音推定および適応係数に基づく。装置は、さらに、雑音抑制済みオーディオ信号を生成するために、利得のセットを入力オーディオ信号に適用するための手段と、この雑音抑制済みオーディオ信号を提供するための手段とを含む。

本明細書に開示されるシステムおよび方法は、少なくとも１つのオーディオ入力信号を取得し、雑音抑制済み出力信号を提供する電子デバイス上の雑音抑制モジュールを記述する。すなわち、雑音抑制モジュールは、バックグラウンド雑音を抑制し、オーディオ信号の音声品質を改善しうる。雑音抑制モジュールは、ハードウェア、ソフトウェア、または、両方の組み合わせとして実現されうる。モジュールは、入力信号に離散フーリエ変換（ＤＦＴ）を行い（それを周波数ドメインに変換するために）、入力信号のＤＦＴに適用可能な利得のセットを計算するために（例えば、各周波数ビンで）、入力の大きさスペクトルで動作する（例えば、利得のセットを使用して入力信号のＤＦＴをスケーリングすることによって）。雑音抑制済み出力は、適用された利得を用いて入力信号に逆ＤＦＴ（ＩＤＦＴ）を行うことによって同期されうる。

本明細書に開示されるシステムおよび方法は、定常雑音および非定常雑音の両方の抑制を供給しうる。これを達成するために、いくつか（例えば、３つ）の異なるタイプの雑音電力推定が、各周波数ビンで計算され、そのビンでの総合雑音推定を産出するために結合されうる。例えば、定常雑音スペクトル推定の推定は、最小統計技術を用い、さらに、ある時間期間にわたって入力スペクトルの最小値（例えば、最小電力レベル）を追跡することによって計算される。検出器は、入力信号における所望信号の存在を検出するために用いられうる。検出器の出力は、非定常雑音スペクトル推定を形成するために使用されうる。非定常雑音推定は、検出器の決定に基づいて入力スペクトル推定を理知的に平均化することによって獲得されうる。例えば、非定常雑音推定は、スピーチが存在しない間は速やかに更新され、スピーチが存在する間はゆっくりと更新されうる。超過雑音推定は、スピーチが検出されない場合に、スペクトル内の残余雑音から計算されうる。雑音推定のスケーリング係数は、入力データの信号対雑音比（ＳＮＲ）に基づいて引き出されうる。スペクトル平均化は、さらに、可聴帯域をシミュレートするため、且つ、アルゴリズムの計算的な負担を減らすために、入力スペクトル推定をより少ない周波数ビンに圧縮するために用いられうる。

本明細書に開示されるシステムおよび方法は、スピーチ適応スペクトル拡張（および／または、圧縮、すなわち「コンパンディング」）技術を用いて、入力スペクトルに適用されるべき利得のセットを生成する。入力スペクトル推定および雑音スペクトル推定は、入力の信号対雑音比（ＳＮＲ）推定を計算するために使用される。ＳＮＲ推定は、利得のセットを計算するために使用される。雑音抑制の積極性は、入力のＳＮＲ推定に基づいて自動的に調整されうる。特に、雑音抑制は、入力のＳＮＲが低い場合に増加し（例えば、「積極的にされ」）、入力のＳＮＲが高い場合に減少しうる。利得のセットは、さらに、出力信号の不連続性およびアーティファクトを減らすために、時間および／または周波数にわたって平滑化されうる。利得のセットは、入力信号のＤＦＴに適用されうる。雑音抑制済み時間ドメインデータを再構築するために、適用された利得を用いて、周波数ドメイン入力信号に対してＩＤＦＴが行われうる。このアプローチは、所望のスピーチまたは音声に対する著しい劣化なく、雑音を適切に抑制しうる。

広帯域信号の場合、フィルタバンクが用いられ、入力信号を周波数帯域のセットに分割しうる。雑音抑制は、入力信号の雑音を抑制するために、全ての帯域に適用されうる。

ここで、様々な構成は、同様の参照番号が機能的に同様のエレメントを指しうる複数の図に関して記述される。本明細書において全体的に記述され、図に示されるシステムおよび方法は、多種多様な異なる構成で配列および設計されうる。このように、図に示されるような、いくつかの構成についてのより詳細な次の記述は、請求される範囲を限定することを目的としておらず、システムおよび方法の単なる例である。

図１は、オーディオ信号１０４の雑音１０８を抑制するためのシステムおよび方法が実現されうる電子デバイス１０２の１つの例を示すブロック図である。電子デバイス１０２は、雑音抑制モジュール１１０を含みうる。雑音抑制モジュール１１０は、ハードウェアとして、ソフトウェアとして、または、ハードウェアとソフトウェアの組み合わせとして実現されうる。雑音抑制モジュール１１０は、オーディオ信号１０４を受信または取得し、雑音抑制済みオーディオ信号１２０を出力する。オーディオ信号１０４は、音声１０６（例えば、スピーチ、音声エネルギ、音声信号、または、別の所望信号）と、雑音１０８（例えば、雑音エネルギ、または、雑音を引き起こす信号）とを含みうる。

雑音抑制モジュール１１０は、音声１０６を維持しつつ、オーディオ信号１０４の雑音１０８を抑制しうる。雑音抑制モジュール１１０は、利得計算モジュール１１２を含みうる。利得計算モジュール１１２は、オーディオ信号１０４に適用されうる利得のセットを計算し、雑音抑制済みオーディオ信号１２０を生成する。利得計算モジュール１１２は、利得のセットを計算するために、スペクトル拡張利得関数１１４を使用しうる。スペクトル拡張利得関数１１４は、総合雑音推定１１６および／または適応係数１１８を使用して、利得のセットを計算しうる。換言すると、スペクトル拡張利得関数１１４は、総合雑音推定１１６および適応係数１１８に基づきうる。

図２は、オーディオ信号２０４の雑音を抑制するためのシステムおよび方法が実現されうる電子デバイス２０２の１つの例を示すブロック図である。電子デバイス２０２の例は、オーディオ（例えば、音声）レコーダ、音声カムコーダ、カメラ、パーソナルコンピュータ、ラップトップコンピュータ、携帯情報端末（ＰＤＡ）、セルラ電話、スマートフォン、ミュージックプレーヤ、ゲームコンソール、および、補聴器などを含む。

電子デバイス２０２は、１または複数のマイクロフォン２２２、雑音抑制モジュール２１０、および、メモリ２２４を含みうる。マイクロフォン２２２は、音響信号（例えば、サウンド）を電子信号に変換するために使用されるデバイスでありうる。マイクロフォン２２２の例は、センサまたはトランスデューサを含む。マイクロフォンのいくつかのタイプは、ダイナミック、コンデンサ、リボン、静電気、カーボン、キャパシタ、圧電性、および、光ファイバマイクロフォンなどを含む。雑音抑制モジュール２１０は、オーディオ信号２０４の雑音を抑制し、雑音抑制済みオーディオ信号２２０を生成する。メモリ２２４は、雑音抑制モジュール２１０によって生成された電子信号またはデータ（例えば、雑音抑制済みオーディオ信号２２０）を記憶するために使用されるデバイスでありうる。メモリ２２４の例は、ハードディスクドライブ、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、フラッシュメモリなどを含む。メモリ２２４は、雑音抑制済みオーディオ信号２２０を記憶するために使用されうる。

図３は、オーディオ信号の雑音を抑制するためのシステムおよび方法が実現されうる無線通信デバイス３２６の１つの構成を示すブロック図である。無線通信デバイス３２６は、別のデバイス（例えば、基地局、アクセスポイント、別の無線通信デバイスなど）と通信するために使用される電子デバイス１０２でありうる。無線通信デバイス３２６の例は、セルラ電話、ラップトップコンピュータ、スマートフォン、電子リーダ、ＰＤＡ、ネットブック、ミュージックプレーヤなどを含む。無線通信デバイス３２６は、１または複数のスピーカ３２８、雑音抑制モジュールＡ３１０ａ、ボコーダ／デコーダ３３０、モデム３３２、および、１または複数のアンテナ３３４を含みうる。無線通信デバイス３２６は、さらに、ボコーダ／エンコーダ３３６、雑音抑制モジュールＢ３１０ｂ、および、１または複数のマイクロフォン３２２を含みうる。

無線通信デバイス３２６は、オーディオ信号を取り込み、オーディオ信号の雑音を抑制し、および／または、オーディオ信号を送信するように構成されうる。１つの構成において、マイクロフォン３２２は、音響信号（例えば、スピーチまたは音声を含む）を取り込み、それをオーディオ信号Ｂ３０４ｂに変換する。オーディオ信号Ｂ３０４ｂは、オーディオ信号Ｂ３０４ｂの雑音（例えば、環境雑音またはバックグラウンドの雑音）を抑制しうる雑音抑制モジュールＢ３１０ｂに入力され、それによって、雑音抑制済みオーディオ信号Ｂ３２０ｂを生成しうる。雑音抑制済みオーディオ信号Ｂ３２０ｂは、無線送信に備えて、符号化された雑音抑制済みオーディオ信号３４０を生成するボコーダ／エンコーダ３３６に入力されうる。モデム３３２は、無線送信のために、符号化された雑音抑制済みオーディオ信号３４０を変調しうる。次に、無線通信デバイス３２６は、１または複数のアンテナ３３４を使用して変調信号を送信しうる。

無線通信デバイス３２６は、加えて、または、代替として、オーディオ信号を受信し、オーディオ信号の雑音を抑制し、および／または、オーディオ信号を音響的に再生するように構成されうる。１つの構成において、無線通信デバイス３２６は、１または複数のアンテナ３３４を使用して変調信号を受信する。無線通信デバイス３２６は、モデム３３２を使用して、受信された変調信号を復調し、符号化オーディオ信号３３８を生成しうる。符号化オーディオ信号３３８は、ボコーダ／デコーダモジュール３３０を使用して復号され、オーディオ信号Ａ３０４ａが生成されうる。次に、雑音抑制モジュールＡ３１０ａは、オーディオ信号Ａ３０４ａの雑音を抑制し、結果として雑音抑制済みオーディオ信号Ａ３２０ａが生じる。次に、雑音抑制済みオーディオ信号Ａ３０４ａは、１または複数のスピーカ３２８を使用して音響信号に変換されうる（例えば、出力または再生される）。

図４は、オーディオ信号の雑音を抑制するためのシステムおよび方法が実現されうる無線通信デバイス４２６のより具体的な別の構成を示すブロック図である。無線通信デバイス４２６は、オーディオ信号を受信および／または出力するために（例えば、１または複数のスピーカ４２８を使用して）使用されるいくつかのモジュールを含みうる。例えば、無線通信デバイス４２６は、１または複数のスピーカ４２８、デジタル／アナログ変換器（ＤＡＣ）４４２、第１のオーディオフロントエンド（ＡＦＥ）モジュール４４４、第１の自動利得制御（ＡＧＣ）モジュール４５０、雑音抑制モジュールＡ４１０ａ、デコーダ４３０を含みうる。無線通信デバイス４２６は、さらに、オーディオ信号を取り込み、それを送信用にフォーマットするために使用されるいくつかのモジュールを含みうる。例えば、無線通信デバイス４２６は、１または複数のマイクロフォン４２２、アナログ／デジタル変換器（ＡＤＣ）４５２、第２のオーディオフロントエンド（ＡＦＥ）４５４モジュール、エコーキャンセラモジュール４４６、雑音抑制モジュールＢ４１０ｂ、第２の自動利得制御（ＡＧＣ）モジュール４５６、エンコーダ４３６を含みうる。無線通信デバイス４２６は、さらに、オーディオ信号を送信しうる。

無線通信デバイス４２６は、符号化されたオーディオ信号Ａ４３８ａを受信しうる。無線通信デバイス４２６は、デコーダ４３０を使用して、符号化されたオーディオ信号Ａ４３８ａを復号し、オーディオ信号Ａ４０４ａを生成しうる。雑音抑制モジュールＡ４１０ａは、ダウンリンクオーディオのバックグラウンド雑音を抑制するために、デコーダ４３０の後に実現されうる。すなわち、雑音抑制モジュールＡ４１０ａは、オーディオ信号Ａ４０４ａの雑音を抑制し、それによって、雑音抑制済みオーディオ信号Ａ４２０ａを生成しうる。第１のＡＧＣモジュール４５０は、雑音抑制済みオーディオ信号Ａ４２０ａの大きさまたはボリュームを調整または制御し、第１のＡＧＣ出力４６８を生成しうる。第１のＡＧＣ出力４６８は、第１のオーディオフロントエンドモジュール４４４およびエコーキャンセラモジュール４４６に入力されうる。第１のオーディオフロントエンドモジュール４４４は、第１のＡＧＣ出力４６８を受信し、デジタル雑音抑制済みオーディオ信号４６２を生成する。一般的に、オーディオフロントエンドモジュール４４４および４５４は、基本的なフィルタリングおよび利得動作を、取り込まれたマイクロフォン信号（例えば、オーディオ信号Ｂ４０４ｂ、デジタルオーディオ信号４７０）、および／または、ＤＡＣ４４２に向かうダウンリンク信号（例えば、第１のＡＧＣ出力４６８）に対して行いうる。デジタル雑音抑制済みオーディオ信号４６２は、ＤＡＣ４４２によって、アナログ雑音抑制済みオーディオ信号４６０に変換されうる。アナログ雑音抑制済みオーディオ信号４６０は、１または複数のスピーカ４２８によって出力されうる。１または複数のスピーカ４２８は、一般的に、（電子）オーディオ信号を音響信号またはサウンドに変換する。

無線通信デバイス４２６は、１または複数のマイクロフォン４２２を使用して、オーディオ信号Ｂ４０４ｂを取り込みうる。１または複数のマイクロフォン４２２は、例えば、音響信号（例えば、音声、スピーチ、雑音などを含む）をオーディオ信号Ｂ４０４ｂに変換しうる。オーディオ信号Ｂ４０４ｂは、ＡＤＣ４５２を使用してデジタルオーディオ信号４７０に変換されるアナログ信号でありうる。第２のオーディオフロントエンド４５４は、ＡＦＥ出力４７２を生成する。ＡＦＥ出力４７２は、エコーキャンセラモジュール４４６に入力されうる。エコーキャンセラモジュール４４６は、送信のために、信号のエコーを抑制しうる。例えば、エコーキャンセラモジュール４４６は、エコーキャンセラ出力４６４を生成する。雑音抑制モジュールＢ４１０ｂは、エコーキャンセラ出力４６４の雑音を抑制し、それによって、雑音抑制済みオーディオ信号Ｂ４２０ｂを生成しうる。第２のＡＧＣモジュール４５６は、雑音抑制済みオーディオ信号Ｂ４２０ｂの大きさまたはボリュームを調整することによって第２のＡＧＣ出力信号４７４を生成しうる。第２のＡＧＣ出力信号４７４は、さらに、エンコーダ４３６によって符号化され、符号化されたオーディオ信号Ｂ４３８ｂが生成されうる。符号化されたオーディオ信号Ｂ４２８ｂは、さらに、処理および／または送信されうる。随意的に、無線通信デバイス４２６は（１つの構成において）、送信のために、オーディオ信号Ｂ４０４ｂの雑音を抑制しない可能性がある。

図４に示される無線通信デバイス４２６において、雑音抑制モジュールＡ４１０ａが、受信されたオーディオ信号（例えば、オーディオ信号Ａ４０４ａ）の雑音を抑制しうることは観察されうる。これは、無線通信デバイス４２６が、（後に）抑制されうる雑音を含むオーディオ信号４０４ａ、または、雑音抑制を有さない別のデバイス（例えば、「陸線」電話）からのオーディオ信号４０４ａを受信する場合に有益でありうる。

図５は、オーディオ信号の雑音を抑制するためのシステムおよび方法が実現されうる無線通信デバイス５２６および基地局５８４の複数の構成を示すブロック図である。無線通信デバイスＡ５２６ａは、１または複数のマイクロフォン５２２、送信機Ａ５７８ａ、および、１または複数のアンテナ５３４ａを含みうる。無線通信デバイスＡ５２６ａは、さらに、受信機を含みうる（便宜上、示されない）。１または複数のマイクロフォン５２２は、音響信号をオーディオ信号５０４ａに変換する。送信機Ａ５７８ａは、１または複数のアンテナ５３４ａを使用して電磁信号を（例えば、基地局５８４に）送信する。無線通信デバイスＡ５２６ａは、さらに、基地局５８４から電磁信号を受信しうる。

基地局５８４は、１または複数のアンテナ５８２、受信機Ａ５８０ａ、送信機Ｂ５７８ｂを含みうる。受信機Ａ５８０ａおよび送信機Ｂ５７８ｂは、集合的に、トランシーバ５８６と呼ばれうる。受信機Ａ５８０ａは、１または複数のアンテナ５８２を使用して、電磁信号を（例えば、無線通信デバイスＡ５２６ａおよび／または無線通信デバイスＢ５２６ｂから）受信する。送信機Ｂ５７８ｂは、１または複数のアンテナ５８２を使用して電磁信号を（例えば、無線通信デバイスＢ５２６ｂ、および／または、無線通信デバイスＡ５２６ａに）送信する。

無線通信デバイスＢ５２６ｂは、１または複数のスピーカ５２８、受信機Ｂ５８０ｂ、１または複数のアンテナ５３４ｂを含みうる。無線通信デバイスＢ５２６ｂは、さらに、１または複数のアンテナ５３４ｂを使用して電磁信号を送信するための送信機を含みうる（便宜上示されない）。受信機Ｂ５８０ｂは、１または複数のアンテナ５３４ｂを使用して電磁信号を受信する。１または複数のスピーカ５２８は、電子オーディオ信号を音響信号に変換する。

１つの構成において、アップリンク雑音抑制がオーディオ信号５０４ａに対して行われる。この構成において、無線通信デバイスＡ５２６ａは、雑音抑制モジュールＡ５１０ａを含む。雑音抑制モジュールＡ５１０ａは、オーディオ信号５０４ａの雑音を抑制し、雑音抑制済みオーディオ信号５２０ａを生成する。雑音抑制済みオーディオ信号５２０ａは、送信機Ａ５７８ａ、および、１または複数のアンテナ５３４ａを使用して基地局５８４に送信される。基地局５８４は、雑音抑制済みオーディオ信号５２０ａを受信し、トランシーバ５８６、および、１または複数のアンテナ５８２を使用して、それ５２０ａを、無線通信デバイスＢ５２６ｂに送信する。無線通信デバイスＢ５２６ｂは、受信機Ｂ５８０ｂ、および、１または複数のアンテナ５３４ｂを使用して、雑音抑制済みオーディオ信号５２０ｃを受信する。次に、雑音抑制済みオーディオ信号５２０ｃは、１または複数のスピーカ５２８によって音響信号に変換されうる（例えば、出力される）。

別の構成において、雑音抑制が基地局５８４で行われる。この構成において、無線通信デバイスＡ５２６ａは、１または複数のマイクロフォン５２２を使用してオーディオ信号５０４ａを取り込み、それ５０４ａを、送信機Ａ５７８ａ、および、１または複数のアンテナ５３４ａを使用して基地局５８４に送信する。基地局５８４は、１または複数のアンテナ５８２および受信機Ａ５８０ａを使用してオーディオ信号５０４ｂを受信する。雑音抑制モジュールＣ５１０ｃは、オーディオ信号５０４ｂの雑音を抑制し、雑音抑制済みオーディオ信号５２０ｂを生成する。雑音抑制済みオーディオ信号５２０ｂは、送信機Ｂ５７８ｂおよび１または複数のアンテナ５８２を使用して無線通信デバイスＢ５２６ｂに送信される。無線通信デバイスＢ５２６ｂは、雑音抑制済みオーディオ信号５２０ｃを受信するために、１または複数のアンテナ５３４ｂおよび受信機Ｂ５８０ｂを使用する。次に、雑音抑制済みオーディオ信号５２０ｃは、１または複数のスピーカ５２８を使用して出力される。

さらに別の構成において、ダウンリンク雑音抑制が、オーディオ信号５０４ｃに対して行われる。この構成において、オーディオ信号５０４ａは、１または複数のマイクロフォン５２２を使用して無線通信デバイスＡ５２６ａで取り込まれ、送信機Ａ５７８ａ、および、１または複数のアンテナ５３４ａを使用して基地局５８４に送信される。基地局５８４は、トランシーバ５８６、および、１または複数のアンテナ５８２を使用してオーディオ信号５０４ａを受信して送信する。無線通信デバイスＢ５２６ｂは、１または複数のアンテナ５３４ｂおよび受信機Ｂ５８０ｂを使用してオーディオ信号５０４ｃを受信する。雑音抑制モジュールＢ５１０ｂは、オーディオ信号５０４ｃの雑音を抑制し、１または複数のスピーカ５２８を使用して音響信号に変換された雑音抑制済みオーディオ信号５２０ｃを生成する。

別の構成も可能である。すなわち、雑音抑制５１０は、送信側の無線通信デバイス５２６ａ、基地局５８４、および／または、受信側の無線通信デバイス５２６ｂのあらゆる組み合わせで実行されうる。例えば、雑音抑制５１０は、送信側の無線通信デバイス５２６ａおよび受信側の無線通信デバイス５２６ｂの両方によって行われうる。あるいは、雑音抑制は、送信側の無線通信デバイス５２６ａおよび基地局５８４によって行われうる。あるいは、雑音抑制は、基地局５８４および受信側の無線通信デバイス５２６ｂによって行われうる。さらに、雑音抑制は、送信側の無線通信デバイス５２６ａ、基地局５８４、および、受信側の無線通信デバイス５２６ｂによって行われうる。

図６は、オーディオ信号６０４の複数の帯域６９０での雑音抑制を示すブロック図である。全体的に、図６は、広帯域オーディオ信号６０４に適用されている雑音抑制６１０を示す。この場合、オーディオ信号６０４は、まず、異なる周波数帯域６９０に対応する出力のセットを生成するために、分析フィルタバンク６８８を通過する。各帯域６９０は、雑音抑制６１０の別々のセットに従属されうる（例えば、利得の別々のセットは、周波数帯域６９０ごとに計算される）。次に、各帯域の雑音抑制済み出力６０３は、合成フィルタバンク６９６を使用して結合され、広帯域の雑音抑制済み出力信号６２０が生成される。この手順に関するさらなる詳細が下に提供される。

１つの構成において、オーディオ信号６０４は、雑音抑制６１０のために、２つ以上の帯域６９０へと分割されうる。これは、特に、オーディオ信号６０４が、広帯域オーディオ信６０４の場合に有益でありうる。分析フィルタバンク６８８は、オーディオ信号６０４を２つ以上の（周波数）帯域６９０に分割するために使用されうる。分析フィルタバンク６８８は、例えば、複数の無限インパルス応答（ＩＩＲ）フィルタとして実現されうる。１つの構成において、分析フィルタバンク６８８は、オーディオ信号６０４を、帯域Ａ６９０ａおよび帯域Ｂ６９０ｂという２つの帯域に分離する。例えば、帯域Ａ６９０ａは、より低い周波数コンポーネントを含む帯域Ｂ６９０ｂよりも高い周波数コンポーネントを含む「高帯域」でありうる。図６は、帯域Ａ６９０ａおよび帯域Ｂ６９０ｂしか示さないが、別の構成において、分析フィルタバンク６８８は、オーディオ信号６０４を２つよりも多くの帯域６９０に分離しうる。

雑音抑制６１０は、オーディオ信号６０４の各帯域６９０で行われうる。例えば、ＤＦＴＡ６９２ａは、帯域Ａ６９０ａを、周波数ドメインに変換して、周波数ドメイン信号Ａ６９８ａを生成する。次に、雑音抑制Ａ６１０ａは、周波数ドメイン信号Ａ６９８ａに適用され、周波数ドメイン雑音抑制済み信号Ａ６０１ａを生成しうる。周波数ドメイン雑音抑制済み信号Ａ６１０ａは、ＩＤＦＴＡ６９４ａを使用して、雑音抑制済み信号Ａ６０３（時間ドメインの）へと変換されうる。

同様に、帯域Ｂ６９０ｂのＤＦＴＢ６９２ｂが計算され、周波数ドメイン信号Ｂ６９８ｂを生成しうる。雑音抑制Ｂ６１０ｂは、周波数ドメイン信号Ｂ６９８ｂに適用され、周波数ドメイン雑音抑制済み信号Ｂ６０１ｂが生成される。ＩＤＦＴＢ６９４ｂは、周波数ドメイン雑音抑制済み信号Ｂ６１０ｂを時間ドメインに変換し、結果として、雑音抑制済み信号Ｂ６０３ｂが生じる。次に、雑音抑制済み信号Ａ６０３ａ、および、Ｂ６０３ｂは、合成フィルタバンク６９６へと入力されうる。合成フィルタバンク６９６は、雑音抑制済み信号Ａ６０３ａ、および、Ｂ６０３ｂを、単一の雑音抑制済みオーディオ信号６２０へと結合または合成する。

図７は、オーディオ信号の雑音を抑制するための方法７００の１つの構成を示すフロー図である。電子デバイス１０２は、オーディオ信号を獲得しうる（７０２）。１つの構成において、電子デバイス１０２は、マイクロフォンを使用して、オーディオ信号を獲得する（７０２）。別の構成において、電子デバイス１０２は、オーディオ信号を別の電子デバイス（例えば、無線通信デバイス、基地局など）から受信することによって、オーディオ信号を獲得する（７０２）。電子デバイスは、定常雑音推定、非定常雑音推定、および、超過雑音推定に基づいて総合雑音推定を計算しうる（７０４）。様々な雑音推定を計算することについてのさらなる詳細が下に提供される。

電子デバイス１０２は、さらに、入力の信号対雑音比（ＳＮＲ）および１または複数のＳＮＲ限界に基づいて適応係数を計算しうる（７０６）。入力のＳＮＲは、例えば、オーディオ信号に基づいて獲得されうる。入力のＳＮＲおよびＳＮＲ限界についてのさらなる詳細が下に提供される。

電子デバイス１０２は、スペクトル拡張利得関数を使用して利得のセットを計算しうる（７０８）。スペクトル拡張利得関数は、総合雑音推定および／または適応係数に基づきうる。一般的に、スペクトル拡張は、信号の大きさに（例えば、所与の周波数での）基づいて、そのダイナミックレンジを拡張しうる。電子デバイス１０２は、利得のセットをオーディオ信号に適用し、雑音抑制済みオーディオ信号を生成しうる（７１０）。次に、電子デバイス１０２は、雑音抑制済みオーディオ信号を提供しうる（７１２）。１つの構成において、電子デバイスは、音響信号に変換することによって（例えば、スピーカを使用して）、雑音抑制済みオーディオ信号を提供する（７１２）。別の構成において、電子デバイス１０２は、別の電子デバイス（例えば、無線通信デバイス、基地局など）に送信することによって、雑音抑制済みオーディオ信号を提供する（７１２）。さらに別の構成において、電子デバイス１０２は、メモリに記憶することによって雑音抑制済みオーディオ信号を提供する（７１２）。

図８は、オーディオ信号の雑音を抑制するための方法８００のより具体的な構成を示すフロー図である。電子デバイス１０２は、オーディオ信号を獲得しうる（８０２）。上で論述されたように、電子デバイス１０２は、マイクロフォンを使用してオーディオ信号を取り込むことによって、または、オーディオ信号を受信することによって（例えば、別の電子デバイスから）、オーディオ信号を獲得しうる（８０２）。電子デバイス１０２は、オーディオ信号のＤＦＴを計算し、周波数ドメインオーディオ信号を生成しうる（８０４）。例えば、電子デバイス１０２は、高速フーリエ変換（ＦＦＴ）アルゴリズムを使用して、オーディ信号のＤＦＴを計算しうる（８０４）。電子デバイス１０２は、周波数ドメインオーディオ信号の大きさまたは電力を計算しうる（８０６）。電子デバイス１０２は、周波数ドメインオーディオ信号の大きさまたは電力を、より少ない周波数ビンに圧縮しうる（８０８）この圧縮（８０８）についてのさらなる詳細が下に提供される。

電子デバイス１０２は、周波数ドメインオーディオ信号の大きさまたは電力に基づいて定常雑音推定を計算しうる（８１０）。例えば、電子デバイス１０２は、最小追跡アプローチを使用して、オーディオ信号の定常雑音を推定しうる。随意的に、定常雑音推定は、電子デバイス１０２によって平滑化されうる（８１２）。

電子デバイス１０２は、音声活動検出器（ＶＡＤ）を使用して、周波数ドメインオーディオ信号の大きさまたは電力に基づいて非定常雑音推定を計算しうる（８１４）。例えば、電子デバイス１０２は、ＶＡＤ非アクティブ期間（例えば、音声またはスピーチが検出されない場合）と比較して、ＶＡＤアクティブ期間（例えば、音声またはスピーチが検出される場合）の間に、異なる平滑化または平均化係数を使用して周波数ドメインオーディオ信号の大きさまたは電力の移動平均を計算しうる。より具体的に、平滑化係数は、ＶＡＤを使用して、音声が検出されなかった場合よりも音声が検出された場合に大きくありうる。

電子デバイス１０２は、周波数ドメインオーディオ信号の大きさまたは電力、定常雑音推定、非定常雑音推定に基づいて、対数ＳＮＲを計算しうる（８１６）。例えば、電子デバイス１０２は、定常雑音推定と非定常雑音推定とに基づいて結合雑音推定を計算する。電子デバイス１０２は、対数ＳＮＲを生成するために、結合雑音推定に対する、周波数ドメインオーディオ信号の大きさまたは電力の比の対数を取りうる。

電子デバイス１０２は、定常雑音推定と非定常雑音推定とに基づいて超過雑音推定を計算しうる（８１８）。例えば、電子デバイス１０２は、ゼロから、結合雑音スケーリング係数と結合雑音推定との積が差し引かれたターゲット雑音抑制限界と周波数ドメインオーディオ信号の大きさまたは電力との積までの間の最大値を計算または決定する（例えば、定数雑音推定および非定数雑音推定に基づいて）。超過雑音推定の計算（８１８）もＶＡＤを使用しうる。例えば、超過雑音推定は、ＶＡＤが非アクティブの場合（例えば、音声またはスピーチが検出されない場合）にのみ計算されうる。あるいは、または、加えて、超過雑音推定は、ＶＡＤがアクティブの場合にゼロであり、ＶＡＤが非アクティブの場合に非ゼロであるスケーリングまたは重み係数と乗算されうる。

電子デバイス１０２は、定常雑音推定、非定常雑音推定、および、超過雑音推定に基づいて総合雑音推定を計算しうる（８２０）。例えば、総合雑音推定は、結合雑音推定（例えば、定常および非定常雑音推定に基づく）と、結合雑音スケーリング（または、過剰減算）係数との積を、超過雑音推定と超過雑音スケーリングまたは重み係数との積に加算することによって計算される。上で論述されたように、超過雑音スケーリングまたは重み係数は、ＶＡＤがアクティブの場合にゼロであり、ＶＡＤが非アクティブの場合に非ゼロでありうる。このように、超過雑音推定は、ＶＡＤがアクティブの場合、総合雑音推定に寄与しない可能性がある。

電子デバイス１０２は、対数ＳＮＲ、および、１または複数のＳＮＲ限界に基づいて適応係数を計算しうる（８２２）。例えば、対数ＳＮＲがＳＮＲ限界よりも大きい場合、適応係数は、対数ＳＮＲとバイアス値とを用いて計算されうる（８２２）。対数ＳＮＲが、ＳＮＲ限界以下の場合、適応係数は、雑音抑制限界に基づいて計算されうる（８２２）。さらに、複数のＳＮＲ限界が使用されうる。例えば、ＳＮＲ限界は、利得曲線（下により詳細に論述される）が、ＳＮＲが制限よりも大きい場合に対してＳＮＲが限界より小さい場合にどのような反応を示すべきかを決定するターニングポイントである。いくつかの構成において、複数のターニングポイントまたはＳＮＲ限界は、適応係数（従って、利得のセット）が異なるＳＮＲ領域に対して別々に決定されるように使用されうる。

電子デバイス１０２は、周波数ドメインオーディオ信号の大きさまたは電力、総合雑音推定、および、適応係数に基づいてスペクトル拡張利得関数を使用して利得のセットを計算しうる（８２４）。利得のセットおよびスペクトル拡張利得関数についてのさらなる詳細が下に提供される。電子デバイス１０２は、随意的に、時間的および／または周波数平滑化（８２６）を利得のセットに適用しうる。

電子デバイス１０２は、周波数ビンを圧縮解除しうる（８２８）。例えば、電子デバイス１０２は、圧縮解除された周波数ビンを補間しうる。１つの構成において、同一の圧縮利得が、圧縮周波数ビンに対応する全ての周波数に対して使用される。電子デバイスは、随意的に、不連続性を減らすために、複数の周波数にわたって（圧縮解除された）利得のセットを平滑化しうる（８３０）。

電子デバイス１０２は、利得のセットを周波数ドメインオーディオ信号に適用し、周波数ドメイン雑音抑制済みオーディオ信号を生成しうる（８３２）。例えば、電子デバイス１０２は、周波数ドメインオーディオ信号を利得のセットと乗算しうる。次に、電子デバイス１０２は、周波数ドメイン雑音抑制済みオーディオ信号のＩＤＦＴ（例えば、高速逆フーリエ変換（ＩＦＦＴ））を計算し、雑音抑制済オーディオ信号（時間ドメインの）を生成しうる（８３４）。電子デバイス１０２は、雑音抑制済みオーディオ信号を提供しうる（８３６）。例えば、電子デバイス１０２は、雑音抑制済みオーディオ信号を、基地局または無線通信デバイスのような別の電子デバイスに送信しうる。あるいは、電子デバイス１０２は、雑音抑制済みオーディオ信号を音響信号に変換すること（例えば、スピーカを使用して雑音抑制済みオーディオ信号を出力すること）によって、雑音抑制済みオーディオ信号を提供しうる（８３６）。電子デバイスは、さらに、あるいは、代替として、メモリに記憶することによって、雑音抑制済みオーディオ信号を提供しうる（８３６）。

図９は、雑音抑制モジュール９１０の１つの構成を示すブロック図である。雑音抑制モジュール９１０のより一般的な説明は、図９に関連して提供される。雑音抑制モジュール９１０に含まれる可能なインプリメンテーションまたは機能に関するさらなる詳細が以下に提供される。雑音抑制モジュール９１０が、ハードウェア、ソフトウェア、または、両方の組み合わせで実現されうることに注意されたい。

雑音抑制モジュール９１０は、周波数ドメイン雑音抑制技術を用いて、オーディオ信号９０４の品質を改善する。オーディオ信号９０４は、まず、ＤＦＴ（例えば、ＦＦＴ）９２２動作を適用することによって、周波数ドメインオーディオ信号９０５に変換されうる。スペクトル大きさまたは電力推定９０９は、大きさ／電力計算モジュール９０７によって計算されうる。例えば、周波数ドメインオーディオ信号９０５の絶対電力が計算され、オーディオ信号９０４のスペクトル大きさ推定９０９を生成するために、この絶対電力の平方根が計算される。

より具体的には、Ｘ（ｎ、ｆ）は、時間フレームｎおよび周波数ビンｆにおける周波数ドメインオーディオ信号９０５（例えば、オーディオ信号９０４の複合ＤＦＴまたはＦＦＴ９９２）を表すとする。入力オーディオ信号９０４は、長さＮのフレームまたはブロックへとセグメント化されうる。例えば、Ｎ＝１０ミリ秒（ｍｓ）または２０ｍｓなどでありうる。ＤＦＴ９９２動作は、オーディオ信号９０４を周波数ドメインに変換するために、例えば、それ９０４に対して１２８ポイントまたは２５６ポイントＦＦＴを行うことによって実行され、周波数ドメインオーディオ信号９０５を生成しうる。

時間フレームｎおよび周波数ビンｆにおける入力オーディオ信号９０４の瞬間電力スペクトルＰ（ｎ、ｆ）９０９の推定は、式（１）に示される：

オーディオ信号９０４の大きさスペクトル推定Ｓ（ｎ、ｆ）９０９は、式（２）に示されるように電力スペクトル推定Ｐ（ｎ、ｆ）に平方根を行うことによって計算されうる。

雑音抑制モジュール９１０は、オーディオ信号９０４の（例えば、周波数ドメインオーディオ信号Ｘ（ｎ、ｆ）の）大きさスペクトル推定Ｓ（ｎ、ｆ）９０９で動作する。あるいは、雑音抑制モジュール９１０は、直接、電力スペクトル推定Ｐ（ｎ、ｆ）９０９、あるいは、電力スペクトル推定Ｐ（ｎ、ｆ）の任意の別の電力で動作しうる。換言すると、雑音抑制モジュール９１０は、スペクトル大きさまたは電力９０９推定を使用して動作しうる。

スペクトル推定９０９は、周波数ビンの数をより少ない数のビンへと減らすために圧縮されうる。すなわち、ビン圧縮モジュール９１１は、スペクトル大きさ／電力推定９０９を圧縮し、圧縮スペクトル大きさ／電力推定９１３を生成しうる。これは、（例えば、必ずしもバークスケールではなく）対数スケールで行われうる。可聴帯域が複数の周波数にわたって対数的に増加するため、スペクトル圧縮は、スペクトル大きさ推定またはデータ９０９を複数の周波数にわたって対数的に圧縮９１１することにより、単純な方法で行われうる。スペクトル大きさ／電力９０９をより少ない周波数ビンに圧縮することは、計算複雑性を減らしうる。しかしながら、周波数ビン圧縮９１１が随意的であること、および、雑音抑制モジュール９１０が、圧縮されていないスペクトル大きさ／電力推定９０９を用いて動作しうることに注意されたい。

スペクトル大きさ推定９０９または圧縮スペクトル大きさ推定９１３から、定常雑音推定９１９、非定常雑音推定９２３、超過雑音推定９３９という３つのタイプの雑音スペクトル推定が計算されうる。例えば、定常雑音推定モジュール９１５は、圧縮スペクトル大きさ９１３を使用して、定常雑音推定９１９を生成する。定常雑音推定９１９は、平滑化９１７を使用して随意的に平滑化されうる。

非定常雑音推定９２３および超過雑音推定９３９は、所望信号の存在を検出するのに検出器９２５を用いることによって計算されうる。例えば、所望信号は、音声である必要はなく、音声活動検出器（ＶＡＤ）以外の別のタイプの検出器９２５が使用されうる。音声通信システムの場合、ＶＡＤ９２５は、音声またはスピーチを検出するために用いられる。例えば、非定常雑音推定モジュール９２１は、圧縮スペクトル大きさ９１３およびＶＡＤ信号９２７を使用して、非定常雑音推定９２３を計算する。ＶＡＤ９２５は、例えば、ブラウズトークモードで使用されるような時間ドメイン単一マイクロフォンＶＡＤでありうる。

定常雑音推定９１９および非定常雑音推定９２３は、ＳＮＲ推定モジュール９２９によって使用され、スペクトル大きさ／電力９０９、または、圧縮スペクトル大きさ／電力９１３のＳＮＲ推定９３１（例えば、対数ＳＮＲ９３１）が計算されうる。ＳＮＲ推定９３１は、過剰減算係数計算モジュール９３３によって使用され、積極性または過剰減算係数９３５が計算されうる。過剰減算係数９３５、定常雑音推定９１９、非定常雑音推定９２３、ＶＡＤ信号９２７は、超過雑音推定モジュール９３７によって使用され、超過雑音推定９２９が計算されうる。

定常雑音推定９１９、非定常雑音推定９２３、超過雑音推定９３９は、理知的に結合され、総合雑音推定９１６が形成されうる。換言すると、総合雑音推定９１６は、定常雑音推定９１９、非定常雑音推定９２３、超過雑音推定９３９に基づいて総合雑音推定モジュール９４１によって計算されうる。過剰減算係数９３５は、さらに、総合雑音推定９１６の計算に使用されうる。

総合雑音推定９１６は、スピーチ適応９１８スペクトル拡張９１４（例えば、コンパンディング）ベースの利得計算９１２に使用されうる。例えば、利得計算モジュール９１２は、スペクトル拡張関数９１４を含みうる。スペクトル拡張関数９１４は、適応係数９１８を使用しうる。適応係数９１８は、１または複数のＳＮＲ限界９４３およびＳＮＲ推定９３１を使用して計算されうる。利得計算モジュール９１２は、スペクトル拡張関数、圧縮スペクトル大きさ９１３、および、総合雑音推定９１６を使用して利得のセット９４５を計算しうる。

利得のセット９４５は、時間および周波数にわたる利得９４５の急速な変化によって引き起こされる不連続性を減らすために、随意的に平滑化されうる。例えば、時間／周波数平滑化モジュール９４７は、時間および／または周波数にわたって、利得のセット９４５を随意的に平滑化し、平滑化（圧縮）された利得９４９を生成しうる。１つの構成において、時間平滑化モジュール９４７は、式（３）に示されるような変化を減らすために、時間またはフレームにわたって指数平均化（例えば、ＩＩＲ利得平均化）を使用しうる。

式（３）において、Ｇ（ｎ、ｋ）は、利得のセット９４５である。この場合、ｎはフレーム番号であり、ｋは周波数ビン番号である。さらに、

は、時間的に平滑化された利得のセットであり、α_ｔは平滑化定数である。

所望の信号が音声である場合、ＶＡＤ９２５の決定に基づいて平滑化定数α_ｔを決定するこが有益でありうる。例えば、スピーチまたは音声が検出された場合、スピーチを維持してアーティファクトを減らすために、利得が急速に変化することが可能にされうる。スピーチまたは音声が検出された場合、平滑化定数は、０＜α_ｔ≦０．６の範囲内に設定されうる。雑音だけの期間（スピーチまたは音声が検出されない場合）について、利得は、０．５＜α_ｔ≦１の範囲内の平滑化定数を用いて平滑化されうることが多い。これは、雑音だけの期間の間に雑音残余の品質を改善しうる。加えて、平滑化定数α_ｔは、さらに、アタック・アンド・リリース・タイム（attack and release time）に基づいて変更されうる。利得９４５が突然増えると、平滑化定数α_ｔは、より早い追跡を可能にするために、より低くされうる。利得９４５が減少すると、平滑化定数α_ｔが増やされ、利得がゆっくりと下がることを可能にする。これは、スピーチまたは音声アクティブ期間の間、スピーチまたは音声のより良い維持を提供しうる。

利得のセット９４５は、加えて、または、あるいは、複数の周波数にわたって利得不連続性を減らすために、複数の周波数にわたって平滑化されうる。周波数平滑化への１つのアプローチは、式（４）に示されるように、複数の周波数にわたって有限インパルス応答（ＦＩＲ）フィルタを利得に適用することである。

式（４）において、α_ｆは、平滑化係数であり、

は、周波数に平滑化された利得のセットである。平滑化フィルタは、例えば、［１−２×ａ、ａ、１−２×ａ］のような対称的な３タップフィルタである。この場合、より小さいａの値は、より高い平滑化を提供し、より大きいａの値はより粗い平滑化を提供する。加えて、平滑化定数ａは、より低い周波数が、粗く平滑化され、より高い周波数がより高品質に平滑化されるように、周波数に依存しうる。例えば、０〜１０００Ｈｚの場合、ａ＝０．９であり、１０００〜２０００Ｈｚの場合、ａ＝０．８であり、２０００〜４０００Ｈｚの場合、ａ＝０．７であり、より高い周波数の場合、ａ＝０．６である。このように、利得のセット９４５は、時間および／または周波数で随意的に平滑化され、平滑化（圧縮）された利得９４９を生成しうる。複数の周波数にわたるＦＩＲ利得平滑化の別の例は、式（５）に示される。

便宜上、時間／周波数平滑化モジュール９４７の出力は、「平滑化（圧縮）された利得」９４９と表されるが、時間／周波数平滑化モジュール９４７は、圧縮されていない利得で動作し、圧縮されていない平滑化利得９４９を生成しうることに注意されたい。

利得のセット９４５または平滑化された（圧縮）利得９４９は、利得を圧縮解除するためにビン圧縮解除モジュール９５１に入力され、それによって、圧縮解除された利得のセット９５３を生成しうる（例えば、周波数ビンの圧縮解除された数に）。すなわち、計算された利得のセット９４５、または、平滑化された利得９４９は、スペクトル的に圧縮解除９５１され（例えば、より少ない数の周波数ビンから、ビン圧縮９１１前の元々周波数ビンの数に）、元の周波数のセットの圧縮解除利得９５３を生成しうる。これは、補間技術を使用して行われうる。第０のオーダの補間を有する１つの例は、同一の圧縮利得を、その圧縮ビンに対応する全ての周波数に対して使用することを含み、それは、式（６）に示される：

式（６）において、ｎはフレーム番号であり、ｋはビン番号である。さらに、

は、圧縮解除または補間された利得のセットである。この場合、随意的に平滑化された利得

および９４９は、ｆ_ｋ−１からｆ_ｋの間の全ての周波数ｆに適用される。周波数ビン圧縮９１１が随意的であるため、周波数ビン圧縮解除９５１も随意的である。

随意的な周波数平滑化９５５が圧縮解除された利得のセット

に適用され、平滑化された（圧縮解除）利得９５７を生成しうる。周波数平滑化９５５は、不連続性を減らしうる。周波数平滑化モジュール９５５は、式（７）に示されるように、利得のセット９４５、９４９、９５３を平滑化し、周波数平滑化利得９５７を生成しうる：

式（７）において、

は、平滑化された利得のセットを表し、α_ｆ０は、平滑化または平均化係数であり、ｍは圧縮解除されたビン番号である。周波数平滑化９５５が、圧縮および／または圧縮解除されていない利得のセット９４５、９４９を平滑化するために適用されうることに注意されたい。

利得のセット（例えば、平滑化された（圧縮解除）利得９６７）は、圧縮解除された利得９５３、平滑化された利得９４９（ビン圧縮９１１なく）、または、利得９４５（ビン圧縮９１１なく）は、利得適用モジュール９５９によって周波数ドメインオーディオ信号９０５に適用されうる。例えば、平滑化利得

は、式（８）に示されるように、周波数ドメインオーディオ信号９０５（例えば、入力データの複合ＦＦＴ）と乗算され、周波数ドメイン雑音抑制済みオーディオ信号９６１（例えば、雑音抑制済みＦＦＴデータ）を獲得しうる：

式（８）において、Ｙ（ｎ，ｆ）は、周波数ドメイン雑音抑制済みオーディオ信号９６１であり、Ｘ（ｎ，ｆ）は、周波数ドメインオーディオ信号９０５である。周波数ドメイン雑音抑制オーディオ信号９６１はＩＤＦＴ（例えば、逆ＦＦＴまたはＩＦＦＴ）９９４にかけられ、雑音抑制済みオーディオ信号９２０（時間ドメインで）を生成しうる。

簡潔には、本明細書において開示されるシステムおよび方法は、オーディオ信号９０４の雑音を抑制するために、異なる周波数において雑音レベル推定９１５、９２１、９３７、９４１を計算することと、入力スペクトル大きさデータ９０９、９１３から利得のセット９４５を計算することとを含みうる。本明細書において開示されるシステムおよび方法は、オーディオ／音声記録および音声通信のような様々なアプリケーションに対して、例えば、単一マイクロフォン雑音抑制器、あるいは、フロントエンド雑音抑制器として使用されうる。

図１０は、ビン圧縮１０１１の１つの例を示すブロック図である。ビン圧縮モジュール１０１１は、多数の周波数「ビン」においてスペクトル大きさ／電力信号１００９を受信し、それをより少ない数の圧縮周波数ビン１０６７に圧縮しうる。圧縮された周波数ビン１０６７は、出力圧縮周波数ビン１０１３として出力されうる。上に記述されたように、ビン圧縮１０１１は、雑音抑制９１０を行う際の計算複雑性を減らしうる。

一般的に、ＤＦＴ９２２（例えば、ＦＦＴ）の長さはＮ_ｆで表されるとする。例えば、Ｎ_ｆは、音声アプリケーションの場合、１２８または２５６などでありうる。Ｎ_ｆの周波数ビンにわたるスペクトル大きさデータ１００９は、スペクトル大きさデータ１００９を隣接の周波数ビンにわたって平均化することによって、より少ない数のビンのセットを占めるように圧縮される。

元の周波数１０６３のセットから圧縮周波数（ビン）１０６７のセットへのマッピングの例が図１０に示される。この例において、より低い周波数（１０００ヘルツ（Ｈｚ）より低い）のデータは、より低い周波数に対して高い解像度処理を提供するために維持される。より高い周波数について、隣接周波数ビンデータは、隣接ビンで平均化され、より平滑なスペクトル推定を提供しうる。図１０に示される例は、周波数１０６３に従って圧縮ビン１０６７に圧縮される未圧縮の周波数ビンを示す。例えば、スペクトル大きさ推定１００９の１２８個の周波数ビンまたはデータポイントは、示される圧縮に従って、４８個の圧縮周波数ビン１０６７に圧縮されうる。圧縮１０１１は、マッピングおよび／または平均化を通して達成されうる。より詳細に、０〜１０００Ｈｚの間の周波数ビン１０６３の各々は、圧縮周波数ビン１０６７に１：１で（１０６５ａ）マッピングされうる。よって、周波数ビン１〜１６は、圧縮周波数ビン１〜１６となる。１０００Ｈｚ〜２０００Ｈｚの場合、周波数ビン１７〜３２の各２つは平均化され、圧縮周波数ビン１０６７１７〜２４に２：１で（１０６５ｂ）マッピングされうる。同様に、２０００Ｈｚから３００Ｈｚの場合、周波数ビン３３〜４８は平均化され、圧縮周波数ビン１０６７２５〜３２に２：１で（１０６５ｃ）マッピングされうる。３０００Ｈｚから４０００Ｈｚの場合、周波数ビン４９〜６４の各４つは平均化され、圧縮周波数ビン１０６７３３〜３６に４：１で（１０６５ｄ）マッピングされる。同様に、４０００Ｈｚ〜５０００Ｈｚの場合、ビン６５〜８０は、４：１（１０６５ｅ）で圧縮されて圧縮ビン３７〜４０となり、５０００Ｈｚ〜６０００Ｈｚの場合、ビン８１〜９６は、４：１で（１０６５ｆ）圧縮されて圧縮ビン４１〜４４となる。６０００Ｈｚ〜７０００Ｈｚの場合、８：１で（１０６５ｇ）、ビン９７〜１１２は圧縮ビン４５〜４６となり、７０００Ｈｚ〜８０００Ｈｚの場合、８：１で（１０６５ｈ）、ビン１１３〜１２８はビン４７から４８となる。

一般的に、ｋは、圧縮周波数ビン１０６７を表すとする。圧縮周波数ビンＡ（ｎ、ｋ）１０６７のスペクトル大きさデータは、式（９）に従って計算されうる。

式（９）において、ｆは周波数を表し、Ｎ_ｋは、圧縮ビンｋにおける線形周波数ビンの数を表す。この平均化は、人間の聞くことにおける聴覚処理を粗くシミュレートしうる。すなわち、人間の蝸牛にある聴覚処理フィルタは、帯域幅が周波数と共に益々増える帯域パスフィルタのセットとして作られうる。フィルタの帯域幅は、聴覚の「臨界帯域」と呼ばれることが多い。入力データ１００９のスペクトル圧縮は、さらに、平均化によって入力スペクトル推定の変化を減らす助けとなりうる。それは、さらに、雑音抑制９１０アルゴリズムの計算負担の削減を促進しうる。スペクトルデータの圧縮に使用される特定のタイプの平均化が重要なわけではないことに注意されたい。このように、本明細書のシステムおよび方法は、いずれかの特定の種類のスペクトル圧縮に限定されない。

図１１は、本明細書に開示されるシステムおよび方法に従って、超過雑音推定および総合雑音推定を計算することのより具体的なインプリメンテーションを示すブロック図である。雑音抑制アルゴリズムは、入力信号の雑音の推定を抑制するために、それを要求しうる。入力信号の雑音は、定常雑音および非定常雑音のカテゴリに分類されうる。雑音の統計値が、ある時間にわたって定常である場合、この雑音は定常雑音に分類されうる。定常雑音の例は、エンジン雑音、モータ雑音、熱雑音などを含む。非定常雑音の統計的特性は、時間で変化することである。本明細書に開示されるシステムおよび方法に従って、定常および非定常雑音コンポーネントは、別々に推定され、総合雑音推定を形成するために結合されうる。

図１１に示されるインプリメンテーションにおいて、電子デバイス１０２は、入力信号１１０４から定常雑音推定を計算する。これは、いくつかの方法で達成されうる。例えば、定常雑音は、最小統計値アプローチを使用して、定常雑音推定モジュール１１１５によって計算されうる。このアプローチにおいて、スペクトル大きさデータＡ（ｎ，ｋ）１１１３（これは、圧縮されうる、あるいうは、圧縮されていない可能性がある）は、長さＮ_ｓ１１７３（例えば、Ｎ_ｓ＝１秒）の期間にセグメント化され、この期間の間の最小スペクトル大きさは、最小探索モジュール１１７１によって探索および決定される。最小探索１１７１は、定常雑音フロア推定Ａ_ｓｎ（ｍ，Ｋ）１１７７を決定するために、各期間で繰り返される。このように、定常雑音推定Ａ_ｓｎ（ｍ，ｋ）１１７７は、式（１０）に従って決定されうる：

式（１０）において、ｍは定常雑音探索ブロックのインデックスであり、ｎは、ブロック内のサンプルのインデックスであり、ｋは、周波数ビン番号であり、Ａ（ｎ，ｋ）１１３３は、サンプルｎおよびビンｋにおけるスペクトル大きさ推定である。式（１０）に従って、最小探索１１７１は、Ｎ_ｓ１１７３のサンプルのブロックにわたって行われ、Ａ_ｓｎ（ｍ，ｋ）１１７７において更新される。代替として、時間セグメントＮ_ｓ１１７３は、いくつかのサブウィンドウに細分化されうる。第１に、各サブウィンドウの最小値が計算されうる。次に、全ての時間セグメントＮ_ｓ１１７３についての総合最小値が決定されうる。このアプローチによって、より短いインターバルで（例えば、サブウィンドウ毎に）定常雑音フロア推定Ａ_ｓｎ（ｍ，ｋ）１１７７を更新することができ、それにより、より早い追跡の性能を有しうる。例えば、スペクトル大きさ推定１１１３の電力を追跡することは、スライディングウィンドウで実現されうる。このスライディングウィンドウインプリメンテーションにおいて、Ｔ秒の推定期間の全長は、各々が、Ｔ／ｎ_ｓｓ秒の時間期間を有するｎ_ｓｓ個のサブセクションに分割されうる。この方法において、定常雑音推定Ａ_ｓｎ（ｍ，ｋ）１１７７は、Ｔ秒ごとではなく、Ｔ／ｎ_ｓｓ秒ごとに更新されうる。

随意的に、入力大きさ推定Ａ（ｎ，ｋ）１１１３は、定常雑音フロア推定１１１５の前に、入力平滑化モジュール１１１８によって時間で平滑化されうる。すなわち、スペクトル大きさ推定Ａ（ｎ，ｋ）１１１３または平滑化されたスペクトル大きさ推定

は、定常雑音推定モジュール１１１５に入力されうる。定常雑音フロア推定Ａ_ｓｎ（ｍ、ｋ）１１７７は、さらに、式（１１）に示されるように、定常雑音平滑化モジュール１１１７によって、ある時間にわたって随意的に平滑化さｒ、推定の変化を減らしうる。

式（１１）において、α_ｓ１１７５は、定常雑音平滑化または平均化係数であり、

は、平滑化された定常雑音推定である。α_ｓ１１７５は、例えば、０．５から０．８の間の値（例えば、０．７）に設定されうる。つまり、定常雑音推定モジュール１１１５は、定常雑音推定Ａ_ｓｎ（ｍ，ｋ）１１７７、または、随意的に平滑化された定常雑音推定

を出力しうる。

定常雑音推定Ａ_ｓｎ（ｍ，ｋ）１１７７（あるいは、随意的に平滑化された定常雑音推定１１１９）は、最小追跡の性質により雑音レベルを十分に推定しない可能性がある。この不十分な推定を補償するために、定常雑音推定１１７７および１１１９は、定常雑音スケーリングまたは重み係数γ_ｓｎ１１７９によってスケーリングされうる。定常雑音スケーリングまたは重み係数γ_ｓｎ１１７９は、それが雑音抑制に使用される前に、１よりも大きい数で定常雑音推定１１７７、１１１９を（乗算１１８１ａを通して）スケーリングするために使用されうる。例えば、定常雑音スケーリング係数γ_ｓｎ１１７９は、１．２５、１．４、あるいは、１．５などでありうる。

電子デバイス１０２は、さらに、非定常雑音推定Ａ_ｎｎ（ｎ，ｋ）１１２３を計算する。非定常雑音推定Ａ_ｎｎ（ｎ，ｋ）１１２３は、非定常雑音推定モジュール１１２１によって計算されうる。定常雑音推定技術は、効果的に、エンジン雑音、モータ雑音などの単調な雑音だけのレベルを取り込む。しかしながら、これらは、バブル雑音などの雑音を効果的に取り込まないことが多い。より良い雑音推定は、検出器１１２５を使用することによって行われうる。音声通信の場合、所望信号はスピーチまたは音声である。音声活動検出器（ＶＡＤ）１１２５は、スピーチまたは音声を含む入力オーディオ信号１１０４の一部と、雑音しか含まない他の部分とを識別するために用いられうる。この情報を用いて、より迅速な雑音追跡が可能な雑音推定が計算されうる。

例えば、非定常平均化／平滑化モジュール１１９３は、ＶＡＤ１１２５のアクティブおよび非アクティブ期間の間に異なる平滑化係数α_ｎ１１９７を用いて入力スペクトル大きさＡ（ｎ，ｋ）１１１３の移動平均を計算する。このアプローチは式（１２）に示される：

式（１２）において、α_ｎ１１９７は、非定常平滑化または平均化係数である。加えて、または、あるいは、定常雑音推定Ａ_ｓｎ（ｍ，ｋ）１１７７は、雑音電力レベルが、利得計算に対して過剰推定されないように、非定常雑音推定Ａ_ｎｎ（ｎ，ｋ）１１２３から差し引かれうる。

平滑化係数α_ｎ１１９７は、ＶＡＤ１１２５がアクティブの場合に（例えば、音声／スピーチを示している場合）に大きく、ＶＡＤ１１２５が非アクティブ（スピーチ／音声を示していない）の場合に、より小さくなるように選択されうる。例えば、ＶＡＤ１１２５が非アクティブの場合にα_ｎ＝０．９であり、ＶＡＤ１１２５がアクティブの場合にα_ｎ＝０．９９９９である（大きい信号電力を有する）。さらに、平滑化係数１１９７は、小さい信号電力（例えば、α_ｎ＝０．９９９９）を有するアクティブスピーチ期間の間ゆっくりと非定常雑音推定１１２３を更新するために設定されうる。これは、雑音だけの期間の間、雑音変化のより迅速なトラッキングを可能にする。これにより、ＶＡＤ１１２５がアクティブの場合に、非定常雑音推定Ａ_ｎｎ（ｎ，ｋ）１１２３における所望信号の取り込みを減らしうる。平滑化係数α_ｎ１１９７は、Ａ_ｎｎ（ｎ，ｋ）１１２３が、「長期の（long-term）」非定常雑音推定と考えられうるように、比較的高い値（例えば、１に近い値）に設定されうる。すなわち、非定常雑音平均化係数α_ｎ１１９７が高く設定された場合、Ａ_ｎｎ（ｎ，ｋ）１１２３は、比較的長い期間にわたってゆっくりと変化しうる。

非定常平滑化１１９３は、アタック・アンド・リリース・タイム１１９５を平均化手順に組み込むことで、より高性能になりうる。例えば、入力が突然高くなると、平均化係数α_ｎ１１９７は、突然の増加がスピーチまたは音声の存在によるものでありうるため、非定常雑音レベル推定Ａ_ｎｎ（ｎ，ｋ）１１２３におけるこの突然の増加を防ぐために、高い値に増やされうる。入力が、非定常雑音推定Ａ_ｎｎ（ｎ，ｋ）１１２３と比較して下がると、平均化係数α_ｎ１１９７は、雑音変化のより迅速なトラッキングを可能にするために低くされうる。

電子デバイス１０２は、理知的に、定常雑音推定１１７７、１１１９と、非定常雑音推定Ａ_ｎｎ（ｎ，ｋ）１１２３とを結合し、雑音抑制に使用されうる結合雑音推定Ａ_ｃｎ（ｎ，ｋ）１１９１を生成しうる。すなわち、結合雑音推定Ａ_ｃｎ（ｎ，ｋ）１１９１は、結合雑音推定モジュール１１８７を使用して計算されうる。例えば、１つの結合アプローチは、式（１３）に示されるように、２つの雑音推定１１１９および１１２３に重みを加え、それらを合計して、結合雑音推定Ａ_ｃｎ（ｎ，ｋ）１１９１を得る：

式（１３）において、γ_ｎｎは、非定常雑音スケーリングまたは重み係数である（図１１に示されない）。非定常雑音推定Ａ_ｎｎ（ｎ，ｋ）１１２３は、すでに、定常雑音推定１１７７を含みうる。このように、このアプローチは、不必要に、雑音レベルを過剰推定しうる。あるいは、結合雑音推定Ａ_ｃｎ（ｎ、ｋ）１１９１は、式（１４）に示されるように決定されうる。

式（１４）において、スケーリングまたは過剰減算係数γ_ｓｎ１１７９は、定常雑音推定１１７７、１１１９と、非定常雑音推定Ａ_ｎｎ（ｎ、ｋ）１１２３の最大値１１８９ａの発見前に、定常雑音推定１１７７、１１１９をスケールアップするために使用されうる。定常雑音スケーリングまたは過剰減算係数γ_ｓｎ１１７９は、ターニングパラメータとして構成され、デフォルトで２に設定されうる。随意的に、結合雑音推定Ａ_ｃｎ（ｎ，ｋ）１１９１は、平滑化１１２２を使用して平滑化されうる（例えば、ＬｏｇＳＮＲ１１３１を決定するために使用される前に）。

加えて、結合雑音推定Ａ_ｃｎ（ｎ，ｋ）１１９１は、さらに、雑音抑制性能を改善するために、スケーリングされうる。結合雑音推定スケーリング係数γ_ｃｎ１１３５（過剰減算係数または総合雑音過剰減算係数とも呼ばれる）は、入力オーディオ信号１１０４の信号対雑音比（ＳＮＲ）に基づいて、過剰減算係数計算モジュール１１３３によって決定されうる。対数ＳＮＲ推定モジュール１１２９は、式（１５）に示されるように、入力スペクトル大きさＡ（ｎ，ｋ）１１１３および結合雑音推定Ａ_ｃｎ（ｎ，ｋ）１１９１に基づいて、対数ＳＮＲ推定（便宜上、ＬｏｇＳＮＲ１１３１とも呼ばれうる）を決定しうる。

あるいは、ＬｏｇＳＮＲ１１３１は、式（１６）に従って計算されうる：

随意的に、ＬｏｇＳＮＲ１１３１は、結合雑音スケーリング、過剰減算、または、重み係数γ_ｃｎ１１３５の決定に使用される前に、平滑化１１２０されうる。ＳＮＲが低い場合に、より多くの雑音を除去するために、結合雑音スケーリング係数γ_ｃｎ１１３５が高い値に設定されるように、結合雑音スケーリングまたは過剰減算係数γ_ｃｎ１１３５が選択されうる。さらに、ＳＮＲが高い場合、結合雑音スケーリングまたは過剰減算係数γ_ｃｎ１１３５は、ユニティ(unity)に近く設定され、より少ない雑音を除去し、出力において、より多くのスピーチまたは音声を保存する。結合雑音スケーリング係数γ_ｃｎ１１３５を、ＬｏｇＳＮＲ１１３１の関数として決定するための式の１つの例が式（１７）に示される：

式（１７）において、ＬｏｇＳＮＲ１１３１は、最小値（例えば、０ｄＢ）から最大値（例えば、２０ｄＢ）の間の値の範囲内に限定されうる。さらに、γ_ｍａｘ１１８５は、ＬｏｇＳＮＲ１１３１が０ｄＢ以下の場合に使用される最大スケーリングまたは重み係数でありうる。ｍ_ｎ１１８３は、γ_ｃｎ１１３５がＬｏｇＳＮＲ１１３１によってどれだけ変化するかを決定するスロープ係数である。

雑音推定は、さらに、ＶＡＤ１１２５が非アクティブの場合に超過雑音推定Ａ_ｅｎ（ｎ，ｋ）１１２４を使用することで改善されうる。例えば、２０ｄＢの雑音抑制が出力において望まれる場合でも、雑音抑制アルゴリズムが、このレベルの抑制を常に達成できるわけではない。超過雑音推定Ａ_ｅｎ（ｎ，ｋ）１１２４の使用は、雑音抑制の改善を促進し、この望まれるターゲット雑音抑制目標を達成しうる。超過雑音推定Ａ_ｅｎ（ｎ，ｋ）１１２４は、式（１８）に示されるように、超過雑音推定モジュール１１２６によって計算されうる。

式（１８）において、β_ＮＳ１１９９は、所望またはターゲット雑音抑制限界である。例えば、２０ｄＢの抑制が望まれる場合、β_ＮＳ＝０．１である。式（１８）に示されるように、スペクトル大きさ推定Ａ（ｎ，ｋ）１１１３は、雑音抑制限界β_ＮＳ１１９９によって重み付けされるか、スケーリングされうる（例えば、乗算１１８１ｃを通して）。結合雑音推定Ａ_ｃｎ（ｎ，ｋ）１１９１は、結合雑音スケーリング、重みまたは過剰減算係数γ_ｃｎ１１３５と乗算され（１１８１ｂ）、γ_ｃｎＡ_ｃｎ（ｎ，ｋ）１１０６が産出されうる。この重み付けまたはスケーリングされた結合雑音推定γ_ｃｎＡ_ｃｎ（ｎ，ｋ）１１０６は、超過雑音推定モジュール１１２６によって、重み付けまたはスケーリングされたスペクトル大きさ推定β_ＮＳＡ（ｎ，ｋ）１１０２から差し引かれうる（１１０８ａ）この差の最大値１１８９ｂおよび定数１１１０（例えば、ゼロ）は、さらに、超過雑音推定モジュール１１２６によって決定され、超過雑音推定Ａ_ｅｎ（ｎ，ｋ）１１２４を産出しうる。超過雑音推定Ａ_ｅｎ（ｎ，ｋ）１１２４が「短期」推定とみなされることに注意されたい。超過雑音推定Ａ_ｅｎ（ｎ，ｋ）１１２４は、それ１１２４が、迅速に変化すること、および、アクティブスピーチが存在しない場合に雑音統計値を追跡することを許可されるため、「短期」推定とみなされる。

超過雑音推定Ａ_ｅｎ（ｎ，ｋ）１１２４は、ＶＡＤ１１２５が非アクティブの場合（例えば、スピーチが検出されない場合）にのみ計算されうる。これは、超過雑音スケーリングまたは重み係数γ_ｅｎ１１１４を通して達成されうる。すなわち、超過雑音スケーリングまたは重み係数γ_ｅｎ１１１４は、ＶＡＤ１１２５決定の関数でありうる。１つの構成において、γ_ｅｎ計算モジュール１１１２は、ＶＡＤ１１２５がアクティブの場合（スピーチまたは音声が検出された場合）にγ_ｅｎ＝０に、ＶＡＤ１１２５が非アクティブの場合（スピーチまたは音声が検出されない場合）に０≦γ_ｅｎ≦１に設定する。

超過雑音推定Ａ_ｅｎ（ｎ，ｋ）１１２４は、超過雑音スケーリングまたは重み係数γ_ｅｎ１１１４と乗算され（１１８１ｄ）、γ_ｅｎＡ_ｅｎ（ｎ，ｋ）を獲得しうる。γ_ｅｎＡ_ｅｎ（ｎ，ｋ）は、総合雑音推定モジュール１１４１によって、スケーリングまたは重み付けされた結合雑音推定γ_ｃｎＡ_ｃｎ（ｎ，ｋ）１１０６に加算され（１１０８ｂ）、総合雑音推定Ａ_ｏｎ（ｎ，ｋ）１１１６が獲得されうる。総合雑音推定Ａ_ｏｎ（ｎ，ｋ）１１１６は、式（１９）に示されるように表されうる：

総合雑音推定Ａ_ｏｎ（ｎ，ｋ）１１１６は、入力スペクトル大きさデータＡ（ｎ，ｋ）１１１３に適用するための利得のセットを計算するために使用されうる。利得計算についてのさらなる詳細は下に提供される。別の構成において、総合雑音推定Ａ_ｏｎ（ｎ，ｋ）１１１６は、式（２０）に従って計算されうる：

図１２は、過剰減算係数を決定するのに使用されうるより具体的な機能を示す図である。過剰減算または結合雑音スケーリング係数γ_ｃｎ１２３５は、より多くのノイズを除去するために、ＬｏｇＳＮＲ１２３１が低い場合に結合雑音スケーリング係数γ_ｃｎ１２３５がより高い値に設定されるように決定されうる。さらに、ＬｏｇＳＮＲ１２３１が高い場合、結合雑音スケーリング係数γ_ｃｎ１１３５は、より低い値に（例えば、ユニティに近く）設定され、より少ない雑音を除去し、出力においてより多くのスピーチまたは音声を保存する。式（２１）は、過剰減算または結合雑音スケーリング係数γ_ｃｎ１２３５を、ＬｏｇＳＮＲ１２３１の関数として決定するための式の別の例を示す。

において、ＬｏｇＳＮＲ１２３１は、最小値（例えば、０ｄＢ）から最大値ＳＮＲ_ｍａｘ１２３０（例えば、２０ｄＢ）の値の範囲内に制限されうる。γ_ｍａｘ１２８５は、ＬｏｇＳＮＲ１２３１が０ｄＢ以下の場合に使用される最大スケーリングまたは重み係数である。加えて、γ_ｍｉｎ１２２８は、ＬｏｇＳＮＲ１２３１が２０ｄＢ以上の場合に使用される最小スケーリングまたは重み係数である。ｍ_ｎ１２８３は、γ_ｃｎ１２３５がＬｏｇＳＮＲ１２３１によってどれだけ変化するかを決定するスロープ係数である。

図１３は、利得計算モジュール１３１２のより具体的なインプリメンテーションを示すブロック図である。本明細書に開示されるシステムおよび方法に従って、雑音抑制アルゴリズムは、雑音を抑制するために入力オーディオ信号に適用されうる周波数依存利得Ｇ（ｎ，ｋ）１３４５のセットを決定する。雑音を抑制するための別のアプローチ（例えば、従来のスペクトル減算またはウィーナフィルタリング）が使用されている。しかしながら、これらのアプローチは、入力ＳＮＲが低い場合、または、雑音抑制が積極的に調整される場合に、非常に多くのアーティファクトをもたらしうる。

本明細書のシステムおよび方法は、オーディオ信号１０４の雑音を抑制しながらスピーチまたは音声品質の維持を促進しうるスピーチ適応スペクトル拡張またはコンパンディングベースの利得設計を開示する。利得計算モジュール１３１２は、スペクトル拡張関数１３１４を使用して、利得Ｇ（ｎ，ｋ）１３４５のセットを計算しうる。スペクトル拡張利得関数１３１４は、総合雑音推定Ａ_ｏｎ（ｎ，ｋ）１３１６および適応係数１３１８に基づきうる。

適応係数Ａ１３１８は、入力ＳＮＲ（例えば、便宜上、ＬｏｇＳＮＲ１３３１と呼ばれうる対数ＳＮＲ）、１または複数のＳＮＲ限界１３４３、および、バイアス１３５６に基づいて計算されうる。適応係数Ａ１３１８は、式（２２）に示されるように計算されうる:

において、バイアス１３５６は、音声品質選好に基づいて適応係数Ａ１３１８の値をシフトするために使用されうる小さい数である。例えば、０≦バイアス≦５である。ＳＮＲ＿Ｌｉｍｉｔ１３４３は、入力ＳＮＲ（例えば、ＬｏｇＳＮＲ１３３１）がリミット以上の場合と比較して、リミット未満の場合に、利得曲線がどのような反応を示すべきかを決定または判定するターニングポイントである。ＬｏｇＳＮＲ１３３１は、上の式（１５）または（１６）で示されたように計算されうる。図１１に関して記述されたように、スペクトル大きさ推定Ａ（ｎ，ｋ）１３１３は、平滑化され１１１８（例えば、平滑化されたスペクトル大きさ推定

１１６９を生成するために）、結合雑音推定Ａ_ｃｎ（ｎ，ｋ）１１９１は、平滑化されうる（１１２２）。これは、随意的に、スペクトル大きさ推定Ａ（ｎ，ｋ）１３１３の前に起こりうる。さらに、結合雑音推定Ａ_ｃｎ（ｎ，ｋ）１１９１が使用され、式（１５）または（１６）に示されるように、ＬｏｇＳＮＲ１３３１を計算する。さらに、ＬｏｇＳＮＲ１３３１自体は、図１１に関して上で論述されたように、随意的に平滑化１１２０されうる。平滑化１１１８、１１２２、１１２０は、ＬｏｇＳＮＲ１３３１が使用される前に行われ、適応係数Ａ１３１８を計算しうる適応係数Ａ１３１８は、それが、上の式（１５）または（１６）で示されたように（随意的に平滑化された）スペクトル大きさ推定Ａ（ｎ，ｋ）１３１３、結合雑音推定Ａ_ｃｎ（ｎ，ｋ）１１９１、および／または、非定常雑音推定Ａ_ｎｎ（ｎ，ｋ）１１２３に依存しうるＬｏｇＳＮＲ１３３１に依存するため、「適応的」と呼ばれうる。

利得計算モジュール１３１２は、入力ＳＮＲの関数として設計され、ＳＮＲが低い場合により低く、ＳＮＲが高い場合により高く設定されうる。例えば、入力スペクトル大きさＡ（ｎ，ｋ）１３１３および総合雑音推定Ａ_ｏｎ（ｎ，ｋ）１３１６は、式（２３）に示されるように、利得のセットＧ（ｎ，ｋ）１３４５を計算するために使用されうる：

式（２３）において、Ｂ１３５４は、ｄＢで表された所望雑音抑制リミット（例えば、Ｂ＝２０ｄＢ）であり、雑音抑制の量に対するユーザ選好に従って設定されうる。ｂ１３５０は利得の最小境界であり、ｂ計算モジュール１３５２により、次の式に従って計算されうる：

利得のセットＧ（ｎ，ｋ）１３４５は、それが、フレームごとに、または、「短期」ＳＮＲに基づいて更新されうるため、「短期」と考えられうる。例えば、短期ＳＮＲ

は、それが全ての雑音推定を使用するため、短期であるとみなされ、ある時間にわたってそれほど平滑ではない可能性がある。しかしながら、適応係数Ａ１３１８を計算するために使用されるＬｏｇＳＮＲ１３３１（式（２２）に示される）は、ゆっくりと変化し、より平滑でありうる。

上に示されたように、スペクトル拡張利得関数１３１４は、入力ＳＮＲの非線形関数である。スペクトル拡張利得関数１３１４の指数または電力関数Ｂ／Ａ１３４０は、ＳＮＲの関数

としてスペクトル大きさを拡張するように機能する。式（２２）および（２３）に従って、入力ＳＮＲ（例えば、ＬｏｇＳＮＲ１３３１）がＳＮＲ＿Ｌｉｍｉｔ１３４３よりも小さい場合、利得は、ＳＮＲの線形関数

である。入力ＳＮＲ（例えば、ＬｏｇＳＮＲ１３３１）がＳＮＲ＿Ｌｉｍｉｔ１３４３よりも大きい場合、利得は拡張され、スピーチまたは音声アーティファクトを最小化するために、ユニティに近づけられる。スペクトル拡張利得関数１３１４は、複数のＳＮＲ＿Ｌｍｉｍｉｔ１３４３またはターニングポイントをもたらすためにさらに変更され、それによって、利得Ｇ（ｎ，ｋ）１３４５は、異なるＳＮＲ領域に対して別々に決定されうる。スペクトル拡張利得関数１３１４は、音声品質および雑音抑制レベルの選好に基づいて利得曲線を調整するために柔軟性を提供する。

上で述べられた２つのＳＮＲ

が異なることに注意されたい。例えば、

は、瞬間的なＳＮＲの変化を追跡するため、より平滑な（および／または）平滑化されたＬｏｇＳＮＲ１３３１よりも、ある時間にわたってより迅速に変化しうる。適応係数Ａ１３１８は、上に示されたようにＬｏｇＳＮＲ１３３１の関数に比例して変化する。

式（２３）および図１３で示されるように、スペクトル拡張関数１３１４は、スペクトル大きさＡ（ｎ，ｋ）１３１３を、総合雑音推定Ａ_ｏｎ（ｎ，ｋ）１３１６の逆数１３３２ａと乗算しうる（１３８１ａ）。この積、

１３３４は、指数関数１３３６の基数を形成する。適応係数Ａ１３１８の逆数１３３２ｂと乗算された（１３８１ｂ）所望の雑音抑制限界Ｂ１３５４の積（例えば、Ｂ／Ａ）１３５８は、指数関数１３３６の指数１３４０（例えば、Ｂ／Ａ）を形成する。指数関数出力

１３４２は、ｂ１３５０と乗算１３８１ｃされ、最小関数１３４６の第１の項

１３４４が獲得される。最小関数１３４６の第２の項は、定数１３４８（例えば、１）でありうる。利得のセットＧ（ｎ，ｋ）１３４５を決定するために、最小関数１３４６は、第１の項と第２の定数１３４８項の最小値を決定する：

図１４は、電子デバイス１４０２で利用されうる様々なコンポーネントを示す。示されるコンポーネントは、同一の物理構造内に、あるいは、離れたハウジングまたは構造に位置づけられうる。図１および２に関して論述された電子デバイス１０２、２０２は、電子デバイス１４０２に類似して構成されうる。電子デバイス１４０２は、プロセッサ１４６６を含む。プロセッサ１４６６は、汎用のシングルチップまたはマルチチッププロセッサ（例えば、ＡＲＭ）、専用マイクロプロセッサ（例えば、デジタル信号プロセッサ（ＤＳＰ））、マイクロコントローラ、プログラマブルゲートアレイなどでありうる。プロセッサ１４６６は、中央処理装置（ＣＰＵ）と呼ばれうる。単一のプロセッサ１４６６だけが、図１４の電子デバイス１４０２に示されるが、代替の構成において、プロセッサの組み合わせ（例えば、ＡＲＭとＤＳＰ）が使用されうる。

電子デバイス１４０２は、プロセッサ１４６６と電子通信状態にあるメモリ１４６０を含みうる。すなわち、プロセッサ１４６６は、メモリ１４６０から情報を読み取ること、および／または、メモリ１４６０に情報を書き込むことができる。メモリ１４６０は、電子情報を記憶することができる任意の電子コンポーネントでありうる。メモリ１４６０は、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、磁気ディスク記憶媒体、光記憶媒体、ＲＡＭのフラッシュメモリデバイス、プロセッサに含まれるオンボードメモリ、プログラマブル読み取り専用メモリ（ＰＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ）、電気的消去可能ＰＲＯＭ（ＥＥＰＲＯＭ）、レジスタ、その他、および、それらの組み合わせでありうる。

データ１４６４ａおよび命令１４６２ａは、メモリ１４６０に記憶されうる。命令１４６２ａは、１または複数のプログラム、ルーティン、サブルーティン、機能、手順などを含みうる。命令１４６２ａは、単一のコンピュータ可読ステートメントまたは多数のコンピュータ可読ステートメントを含みうる。命令１４６２ａは、上に記述された方法７００、８００を実現するために、プロセッサ１４６６によって実行可能である。命令１４６２ａを実行することは、メモリ１４６０に記憶されたデータ１４６４ａの使用を含みうる。図１４は、プロセッサ１４６６にロードされているいくつかの命令１４６２ｂおよびデータ１４６４ｂを示す。

電子デバイス１４０２は、さらに、別の通信デバイスと通信するために１または複数の通信インターフェース１４６８を含みうる。通信インターフェース１４６８は、有線通信テクノロジ、無線通信テクノロジ、あるいは、両方に基づきうる。通信インターフェース１４６８の異なるタイプの例は、シリアルポート、パラレルポート、ＵＳＢ、イーサネット（登録商標）アダプタ、ＩＥＥＥ１３９４バスインターフェース、小コンピュータシステムインターフェース（ＳＣＳＩ）バスインターフェース、赤外線（ＩＲ）通信ポート、ブルートゥース無線通信アダプタ、その他を含みうる。

電子デバイス１４０２は、さらに、１または複数の入力デバイス１４７０および１または複数の出力デバイス１４７２を含みうる。異なる種類の入力デバイス１４７０の例は、キーボード、マウス、マイクロフォン、リモート制御デバイス、バトン、ジョイスティック、トラックボール、タッチパッド、ライトペン、その他を含む。出力デバイス１４７２の異なる種類の例は、スピーカ、プリンタ、その他を含む。電子デバイス１４０２に典型的に含まれうる出力デバイスの１つの特定の例は、ディスプレイデバイス１４７４である。本明細書に開示される構成で使用されるディスプレイデバイス１４７４は、ブラウン管（ＣＲＴ）、液晶ディスプレイ（ＬＣＤ）、発光ダイオード（ＬＥＤ）、ガスプラズマ、エレクトロルミネセンスなどの任意の適切な画像プロジェクション技術を利用しうる。ディスプレイコントローラ１４７６は、さらに、メモリ１４６０に記憶されたデータを、ディスプレイデバイス１４７４上に表示されるテキスト、グラフィックス、および／または、動画に（適宜）変換するために提供されうる。

電子デバイス１４０２の様々なコンポーネントは、電力バス、制御信号バス、状態信号バス、データバスなどを含みうる１または複数のバスによって互いに結合されうる。簡略化のために、様々なバスが、バスシステム１４７８として図１４に示される。図１４は、電子デバイス１４０２の１つの可能な構成しか示さないことに注意されたい。様々な別のアーキテクチャおよびコンポーネントが利用されうる。

図１５は、無線通信デバイス１５２６に含まれうる特定のコンポーネントを示す。前に記述された無線通信デバイス３２６、４２６、５２６ａ〜ｂは、図１５に示される無線通信デバイス１５２６と類似して構成されうる。無線通信デバイス１５２６は、プロセッサ１５６６を含む。プロセッサ１５６６は、汎用のシングルチップまたはマルチチップマイクロプロセッサ（例えば、ＡＲＭ）、専用マイクロプロセッサ（例えば、デジタル信号プロセッサ（ＤＳＰ））、マイクロコントローラ、プログラマブルゲートアレイなどでありうる。プロセッサ１５６６は、中央処理装置（ＣＰＵ）と呼ばれうる。単一のプロセッサ１５６６しか、図１５の無線通信デバイス１５２６に示されないが、代替の構成において、プロセッサの組み合わせ（例えば、ＡＲＭとＤＳＰ）が使用されうる。

無線通信デバイス１５２６は、さらに、プロセッサ１５６６と電気的に通信状態にあるメモリ１５６０を含みうる（すなわち、プロセッサ１５６６は、メモリ１５６０から情報を読み取ること、および／または、メモリ１５６０に情報を書き込むことが可能である）。メモリ１５６０は、電子情報を記憶することができる任意の電子コンポーネントでありうる。メモリ１５６０は、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、磁気ディスク記憶媒体、光記憶媒体、ＲＡＭのフラッシュメモリデバイス、プロセッサに含まれるオンボードメモリ、プログラマブル読み取り専用メモリ（ＰＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ）、電気的消去可能ＰＲＯＭ（ＥＥＰＲＯＭ）、レジスタ、その他、および、それらの組み合わせでありうる。

データ１５６４ａおよび命令１５６２ａは、メモリ１５６０に記憶されうる。命令１５６２ａは、１または複数のプログラム、ルーティン、サブルーティン、機能、手順などを含みうる。命令１５６２ａは、単一のコンピュータ可読ステートメントまたは多数のコンピュータ可読ステートメントを含みうる。命令１５６２ａは、上に記述された方法７００および８００を実現するために、プロセッサ１５６６によって実行可能でありうる。命令１５６２ａを実行することは、メモリ１５６０に記憶されるデータ１５６４ａの使用を含みうる。図１５は、プロセッサ１５６６にロードされているいくつかの命令１５６２ｂおよびデータ１５６４ｂを示す。

無線通信デバイス１５２６は、さらに、無線通信デバイス１５２６とリモートロケーション（例えば、基地局または別の無線通信デバイス）との間での信号の送受信を可能にするための送信機１５８２および受信機１５８４を含みうる。送信機１５８２および受信機１５８４は、集合的に、トランシーバ１５８０と呼ばれうる。アンテナ１５３４は、トランシーバ１５８０に電気的に結合されうる。無線通信デバイス１５２６は、さらに、複数の送信機、複数の受信機、複数のトランシーバ、および／または、複数のアンテナを含みうる（示されない）。

無線通信デバイス１５２６の様々なコンポーネントは、電力バス、制御信号バス、状態信号バス、データバスなどを含みうる１または複数のバスによって互いに結合されうる。簡潔さのために、様々なバスが、バスシステム１５７８として図１５に示される。

図１６は、基地局１６８４に含まれうる特定のコンポーネントを示す。前に論述された基地局５８４は、図１６に示されうる基地局１６８４と類似に構成されうる。基地局１６８４は、プロセッサ１６６６を含む。プロセッサ１６６６は、汎用のシングルチップまたはマルチチップマイクロプロセッサ（例えば、ＡＲＭ）、専用マイクロプロセッサ（例えば、デジタル信号プロセッサ（ＤＳＰ））、マイクロコントローラ、プログラマブルゲートアレイなどでありうる。プロセッサ１６６６は、中央処理装置（ＣＰＵ）と呼ばれうる。単一のプロセッサ１６６６のみが、図１６の基地局１６８４に示されるが、代替の構成において、プロセッサの組み合わせ（例えば、ＡＲＭとＤＳＰ）が使用されうる。

基地局１６８４は、さらに、プロセッサ１６６６と電気的に通信状態にあるメモリ１６６０を含みうる（すなわち、プロセッサ１６６６は、メモリ１６６０から情報を読み取ること、および／または、メモリ１６６０に情報を書き込むことが可能である）。メモリ１６６０は、電子情報を記憶することができる任意の電子コンポーネントでありうる。メモリ１６６０は、ランダムアクセスメモリ（ＲＡＭ）、読み取り専用メモリ（ＲＯＭ）、磁気ディスク記憶媒体、光記憶媒体、ＲＡＭのフラッシュメモリデバイス、プロセッサに含まれるオンボードメモリ、プログラマブル読み取り専用メモリ（ＰＲＯＭ）、消去可能プログラマブル読み取り専用メモリ（ＥＰＲＯＭ）、電気的消去可能ＰＲＯＭ（ＥＥＰＲＯＭ）、レジスタ、その他、および、それらの組み合わせでありうる。

データ１６６４ａおよび命令１６６２ａは、メモリ１６６０に記憶されうる。命令１６６２ａは、１または複数のプログラム、ルーティン、サブルーティン、機能、手順などを含みうる。命令１６６２ａは、単一のコンピュータ可読ステートメントまたは多数のコンピュータ可読ステートメントを含みうる。命令１６６２ａは、本明細書に記述された方法７００および８００を実現するために、プロセッサ１６６６によって実行可能でありうる。命令１６６２ａを実行することは、メモリ１６６０に記憶されるデータ１６６４ａの使用を含みうる。図１６は、プロセッサ１６６６にロードされているいくつかの命令１６６２ｂおよびデータ１６６４ｂを示す。

基地局１６８４は、さらに、基地局１６８４とリモートロケーション（例えば、無線通信デバイス）との間での信号の送受信を可能にするための送信機１６７８および受信機１６８０を含みうる。送信機１６７８および受信機１６８０は、集合的に、トランシーバ１６８６と呼ばれうる。アンテナ１６８２は、トランシーバ１６８６に電気的に結合されうる。基地局１６８４は、さらに、複数の送信機、複数の受信機、複数のトランシーバ、および／または、複数のアンテナを含みうる（示されない）。

基地局１６８４の様々なコンポーネントは、電力バス、制御信号バス、状態信号バス、データバスなどを含みうる１または複数のバスによって互いに結合されうる。簡潔さのために、様々なバスが、バスシステム１６８８として図１６に示される。

上の記述において、参照番号は、様々な用語を伴って使用されることがある。用語が参照番号を伴って使用される場合、これは、１または複数の図に示される特定のエレメントを指すことを意味する。用語が参照番号なしに使用される場合、これは、一般的に、任意の特定の図への限定なくその用語を指すことを意味する。

本明細書に開示されるシステムおよび方法に従って、回路は、電子デバイスにおいて、入力オーディオ信号を受信することに適応しうる。同じ回路、異なる回路、あるいは、同じまたは異なる回路の第２のセクションは、定常雑音推定、非定常雑音推定、および、超過雑音推定に基づいて総合雑音推定を計算することに適応しうる。加えて、同一の回路、異なる回路、または、同一または異なる回路の第３のセクションは、入力の信号対雑音比（ＳＮＲ）と１または複数のＳＮＲ限界とに基づいて適応係数を計算することに適応しうる。同一または異なる回路の第４のセクションは、スペクトル拡張利得関数を使用して利得のセットを計算することに適応しうる。ここで、スペクトル拡張利得関数は、総合雑音推定および適応係数に基づく。利得のセットを計算することに適応した回路の一部は、総合雑音推定を計算することに適応した回路の一部、および／または、適応係数を計算することに適応した回路の一部に結合されるか、あるいは、それは、同一の回路でありうる。同一または異なる回路の第５のセクションは、雑音抑制済みオーディオ信号を生成するために、利得のセットを入力オーディオ信号に適用することに適応しうる。利得のセットを入力オーディオ信号に適用することに適応された回路の一部は、第１のセクションおよび／または第４のセクションに結合されるか、あるいは、それは、同一の回路でありうる。同一または異なる回路の第６のセクションは、雑音抑制済み信号を提供することに適応しうる。第６のセクションは、有利に、回路の第５のセクションに結合されるか、あるいは、それは、第５のセクションとして同一の回路として組み込まれうる。

「決定すること（determining）」という用語は、広範囲の動作を包含し、それにより、「決定すること」は、計算すること（calculating）、算出すること（computing）、処理すること（processing）、導き出すこと（deriving）、探索すること（investigating）、ルックアップすることlooking up）（例えば、表、データベースまたは別のデータ構造をルックアップすること）、確認すること（ascertaining）などを含みうる。さらに、「決定すること」は、受信すること（receiving）（例えば、情報を受信すること）、アクセスすること（accessing）（例えば、メモリのデータにアクセスすること）などを含むことができる。さらに、「決定すること」は、解決すること（resolving）、選択すること（selecting）、選ぶこと（choosing）、確立すること（establishing）などを含むことができる。

「〜に基づいて（based on）」という表現は、そうでないと明確に示されない限り、「〜だけに基づいて（based only on）」を意味しない。換言すると、「〜に基づいて」という表現は、「〜だけに基づいて（based only on）」および「少なくとも〜に基づいて（based at least on）」の両方を表す。

本明細書に記述された関数は、プロセッサ可読またはコンピュータ可読媒体上の１または複数の命令として記憶されうる。「コンピュータ可読媒体（computer-readable medium）」という用語は、コンピュータまたはプロセッサによってアクセス可能な任意の利用可能な媒体を指す。それに制限されない例として、そのような媒体は、ＲＡＭ、ＲＯＭ、ＥＥＰＲＯＭ、フラッシュメモリ、ＣＤ−ＲＯＭまたは他の光学ディスク記憶装置、磁気ディスク記憶装置または他の磁気記憶デバイス、あるいは、コンピュータによってアクセスされることができ、命令やデータ構造形で所望のプログラムコードを搬送または記憶するために使用される任意の別媒体を備えうる。ディスク（ｄｉｓｋ）とディスク（ｄｉｓｃ）は、本明細書で使用される場合、コンパクトディスク（ＣＤ）、レーザディスク、光ディスク、デジタル多用途ディスク（ＤＶＤ）、フロッピー（登録商標）ディスク、ブルーレイ（登録商標）ディスクを含む。ディスク（ｄｉｓｋ）は通常磁気作用によってデータを再生し、ディスク（ｄｉｓｃ）はレーザーで光学的にデータを再生する。コンピュータ可読媒体が、有形、かつ、非一時的であることに注意されたい。「コンピュータプログラムプロダクト（computer-program product）」という用語は、計算デバイスまたはプロセッサによって実行、処理、または計算されうるコードまたは命令（例えば、「プログラム」）と結合して計算デバイスまたはプロセッサを指す。本明細書において使用される場合、「コード（code）」という用語は、計算デバイスまたはプロセッサによって実行可能であるソフトウェア、命令、コードまたはデータを指し、
ソフトウェアまたは命令は、さらに、送信媒体を通して送信されうる。例えば、同軸ケーブル、光ファイバーケーブル、撚線対、デジタル加入者回線（ＤＳＬ）、または赤外線、無線、マイクロ波などの無線テクノロジを使用してウェブサイト、サーバ、または他のリモートソースからソフトウェアが送信されると、この同軸ケーブル、光ファイバーケーブル、撚線対、ＤＳＬ、または赤外線、無線、マイクロ波などの無線テクノロジは媒体の定義に含まれる。

本明細書に開示された方法は、記述された方法を達成するための１または複数のステップあるいは動作を備える。方法のステップおよび／または動作は、本明細書の範囲を逸脱することなく互いに交換可能である。換言すると、ステップまたは動作の特定の順序が、記述されている方法の適切な動作のために要求されていない限り、この特定のステップおよび／または動作の順序および／または用途は、特許請求の範囲を逸脱することなく変更されうる。

特許請求の範囲が、上に示された通り設定およびコンポーネントに限定されないことは理解されるべきである。様々な変更、変化、および変形が、特許請求の範囲を逸脱することなく、上に記述されたシステム、方法および装置の配列、動作、および詳細に行われる。

Claims

オーディオ信号の雑音を抑制するための電子デバイスであって、
プロセッサと、
前記プロセッサと電気的に通信状態にあるメモリと、
前記メモリ内の命令と、
を備え、
前記命令は、
入力オーディオ信号を受信し、
定常雑音推定、非定常雑音推定、超過雑音推定に基づいて総合雑音推定を計算し、
入力の信号対雑音比（ＳＮＲ）と、１または複数のＳＮＲ限界とに基づいて適応係数を計算し、
スペクトル拡張利得関数を使用して利得のセットを計算し、ここにおいて、前記スペクトル拡張利得関数は、前記総合雑音推定および前記適応係数に基づき、
雑音抑制済みオーディオ信号を生成するために、前記利得のセットを前記入力オーディオ信号に適用し、
前記雑音抑制済みオーディオ信号を提供する
ように実行可能である、電子デバイス。
前記命令は、さらに、前記定常雑音推定、前記非定常雑音推定、および、前記超過雑音推定に対する重みを計算するように実行可能である、請求項１に記載の電子デバイス。
前記定常雑音推定は、前記入力オーディオ信号の電力レベルを追跡することによって計算される、請求項１に記載の電子デバイス。
前記入力オーディオ信号の電力レベルを追跡することは、スライディングウィンドウを使用して実現される、請求項３に記載の電子デバイス。
前記非定常雑音推定は、長期推定を備える、請求項１に記載の電子デバイス。
前記超過雑音推定は、短期推定を備える、請求項１に記載の電子デバイス。
前記スペクトル拡張利得関数は、さらに、短期ＳＮＲ推定に基づく、請求項１に記載の電子デバイス。
前記スペクトル拡張利得関数は、基数および指数を備え、前記基数は、前記総合雑音推定で割った入力信号電力を備え、前記指数は、前記適応係数で割った所望の雑音抑制レベルを備える、請求項１に記載の電子デバイス。
前記命令は、さらに、前記入力オーディオ信号をいくつかの周波数ビンに圧縮するように実行可能である、請求項１に記載の電子デバイス。
前記圧縮は、複数の周波数ビンにわたってデータを平均化することを備え、１または複数のより低い周波数ビンのより低い周波数データは、１または複数のより高い周波数ビンのより高い周波数データよりも圧縮されない、請求項９に記載の電子デバイス。
前記命令は、
前記入力オーディオ信号の離散フーリエ変換（ＤＦＴ）を計算し、
前記雑音抑制済みオーディオ信号の離散逆フーリエ変換（ＩＤＦＴ）を計算する
ように実行可能である、請求項１に記載の電子デバイス。
前記電子デバイスは、無線通信デバイスを備える、請求項１に記載の電子デバイス。
前記電子デバイスは、基地局を備える、請求項１に記載の電子デバイス。
前記命令は、さらに、前記雑音抑制済みオーディオ信号を前記メモリに記憶するように実行可能である、請求項１に記載の電子デバイス。
前記入力オーディオ信号は、リモート無線通信デバイスから受信される、請求項１に記載の電子デバイス。
前記１または複数のＳＮＲ限界は、異なるＳＮＲ領域に対して別々に利得を決定するための複数のターニングポイントである、請求項１に記載の電子デバイス。
前記スペクトル拡張利得関数は、式

に従って計算され、Ｇ（ｎ，ｋ）は利得のセットであり、ｎはフレーム番号であり、ｋはビン番号であり、Ｂは所望の雑音抑制限界であり、Ａは適応係数であり、ｂはＢに基づく係数であり、Ａ（ｎ，ｋ）は、入力大きさ推定であり、Ａ_ｏｎ（ｎ，ｋ）は総合雑音推定である、請求項１に記載の電子デバイス。
前記超過雑音推定は、式

に従って計算され、Ａ_ｅｎ（ｎ，ｋ）は超過雑音推定であり、ｎはフレーム番号であり、ｋはビン番号であり、β_ＮＳは所望の雑音抑制限界であり、Ａ（ｎ，ｋ）は入力大きさ推定であり、γ_ｃｎは結合されたスケーリング係数であり、Ａ_ｃｎ（ｎ，ｋ）は結合された雑音推定である、請求項１に記載の電子デバイス。
前記総合雑音推定は、式

に従って計算され、Ａ_ｏｎ（ｎ，ｋ）は総合雑音推定であり、ｎはフレーム番号であり、ｋはビン番号であり、γ_ｃｎは結合されたスケーリング係数であり、Ａ_ｃｎ（ｎ，ｋ）は結合された雑音推定であり、γ_ｅｎは超過雑音スケーリング係数であり、Ａ_ｅｎ（ｎ，ｋ）は超過雑音推定である、請求項１に記載の電子デバイス。
前記入力オーディオ信号は、複数の周波数帯域に分割される広帯域オーディオ信号であり、雑音抑制は、前記複数の周波数帯域の各々に対して実行される、請求項１に記載の電子デバイス。
前記命令は、さらに、前記定常雑音推定、結合雑音推定、入力ＳＮＲ、および、前記利得のセットを平滑化するように実行可能である、請求項１に記載の電子デバイス。
オーディオ信号の雑音を抑制するための方法であって、
入力オーディオ信号を受信することと、
電子デバイスにおいて、定常雑音推定、非定常雑音推定、超過雑音推定に基づいて総合雑音推定を計算することと、
前記電子デバイスにおいて、入力の信号対雑音比（ＳＮＲ）と、１または複数のＳＮＲ限界とに基づいて適応係数を計算することと、
前記電子デバイスにおいて、スペクトル拡張利得関数を使用して利得のセットを計算することと、ここにおいて、前記スペクトル拡張利得関数は、前記総合雑音推定および前記適応係数に基づき、
雑音抑制済みオーディオ信号を生成するために、前記利得のセットを前記入力オーディオ信号に適用することと、
前記雑音抑制済みオーディオ信号を提供することと
を備える、方法。
前記定常雑音推定、前記非定常雑音推定、および、前記超過雑音推定に対する重みを計算することをさらに備える、請求項２２に記載の方法。
前記定常雑音推定は、前記入力オーディオ信号の電力レベルを追跡することによって計算される、請求項２２に記載の方法。
前記入力オーディオ信号を追跡することは、スライディングウィンドウを使用して実現される、請求項２４に記載の方法。
前記非定常雑音推定は、長期推定を備える、請求項２２に記載の方法。
前記超過雑音推定は、短期推定を備える、請求項２２に記載の方法。
前記スペクトル拡張利得関数は、さらに、短期ＳＮＲ推定に基づく、請求項２２に記載の方法。
前記スペクトル拡張利得関数は、基数および指数を備え、前記基数は、前記総合雑音推定で割った入力信号電力を備え、前記指数は、前記適応係数で割った所望の雑音抑制レベルを備える、請求項２２に記載の方法。
前記入力オーディオ信号を多数の周波数ビンに圧縮することをさらに備える、請求項２２に記載の方法。
前記圧縮は、複数の周波数ビンにわたってデータを平均化することを備え、１または複数のより低い周波数ビンのより低い周波数データは、１または複数のより高い周波数ビンのより高い周波数データよりも圧縮されない、請求項３０に記載の方法。
前記入力オーディオ信号の離散フーリエ変換（ＤＦＴ）を計算することと、
前記雑音抑制済みオーディオ信号の離散逆フーリエ変換（ＩＤＦＴ）を計算することと
をさらに備える、請求項２２に記載の方法。
前記電子デバイスは、無線通信デバイスを備える、請求項２２に記載の方法。
前記電子デバイスは、基地局を備える、請求項２２に記載の方法。
前記雑音抑制済みオーディオ信号を前記メモリに記憶することをさらに備える、請求項２２に記載の方法。
前記入力オーディオ信号は、リモート無線通信デバイスから受信される、請求項２２に記載の方法。
前記１または複数のＳＮＲ限界は、異なるＳＮＲ領域に対して別々に利得を決定するための複数のターニングポイントである、請求項２２に記載の方法。
前記スペクトル拡張利得関数は、式

に従って計算され、Ｇ（ｎ，ｋ）は利得のセットであり、ｎはフレーム番号であり、ｋはビン番号であり、Ｂは所望の雑音抑制限界であり、Ａは適応係数であり、ｂはＢに基づく係数であり、Ａ（ｎ，ｋ）は、入力多きさ推定であり、Ａ_ｏｎ（ｎ，ｋ）は総合雑音推定である、請求項２２に記載の方法。
前記超過雑音推定は、式

に従って計算され、Ａ_ｅｎ（ｎ，ｋ）は超過雑音推定であり、ｎはフレーム番号であり、ｋはビン番号であり、β_ＮＳは所望の雑音抑制限界であり、Ａ（ｎ，ｋ）は入力大きさ推定であり、γ_ｃｎは結合されたスケーリング係数であり、Ａ_ｃｎ（ｎ，ｋ）は結合された雑音推定である、請求項２２に記載の方法。
前記総合雑音推定は、式

に従って計算され、Ａ_ｏｎ（ｎ，ｋ）は総合雑音推定であり、ｎはフレーム番号であり、ｋはビン番号であり、γ_ｃｎは結合されたスケーリング係数であり、Ａ_ｃｎ（ｎ，ｋ）は結合された雑音推定であり、γ_ｅｎは超過雑音スケーリング係数であり、Ａ_ｅｎ（ｎ，ｋ）は超過雑音推定である、請求項２２に記載の方法。
前記入力オーディオ信号は、複数の周波数帯域に分割される広帯域オーディオ信号であり、雑音抑制は、前記複数の周波数帯域の各々に対して実行される、請求項２２に記載の方法。
前記定常雑音推定、結合雑音推定、入力ＳＮＲ、および利得のセットを平滑化することをさらに備える、請求項２２に記載の方法。
命令を記憶する非一時的なコンピュータ可読媒体を備える、オーディオ信号の雑音を抑制するためのコンピュータプログラムプロダクトであって、前記命令は、
入力オーディオ信号を受信するためのコードと、
定常雑音推定、非定常雑音推定、超過雑音推定に基づいて総合雑音推定を計算するためのコードと、
入力の信号対雑音比（ＳＮＲ）と、１または複数のＳＮＲ限界とに基づいて適応係数を計算するためのコードと、
スペクトル拡張利得関数を使用して利得のセットを計算するためのコードと、ここにおいて、前記スペクトル拡張利得関数は、前記総合雑音推定および前記適応係数に基づき、
雑音抑制済みオーディオ信号を生成するために、前記利得のセットを前記入力オーディオ信号に適用するためのコードと、
前記雑音抑制済みオーディオ信号を提供するためのコードと
を備える、コンピュータプログラムプロダクト。
前記スペクトル拡張利得関数は、式

に従って計算され、Ｇ（ｎ，ｋ）は利得のセットであり、ｎはフレーム番号であり、ｋはビン番号であり、Ｂは所望の雑音抑制限界であり、Ａは適応係数であり、ｂはＢに基づく係数であり、Ａ（ｎ，ｋ）は、入力大きさ推定であり、Ａ_ｏｎ（ｎ，ｋ）は総合雑音推定である、請求項４３に記載のコンピュータプログラムプロダクト。
前記超過雑音推定は、式

に従って計算され、Ａ_ｅｎ（ｎ，ｋ）は超過雑音推定であり、ｎはフレーム番号であり、ｋはビン番号であり、β_ＮＳは所望の雑音抑制限界であり、Ａ（ｎ，ｋ）は入力大きさ推定であり、γ_ｃｎは結合されたスケーリング係数であり、Ａ_ｃｎ（ｎ，ｋ）は結合された雑音推定である、請求項４３に記載のコンピュータプログラムプロダクト。
前記総合雑音推定は、式

に従って計算され、Ａ_ｏｎ（ｎ，ｋ）は総合雑音推定であり、ｎはフレーム番号であり、ｋはビン番号であり、γ_ｃｎは結合されたスケーリング係数であり、Ａ_ｃｎ（ｎ，ｋ）は結合された雑音推定であり、γ_ｅｎは超過雑音スケーリング係数であり、Ａ_ｅｎ（ｎ，ｋ）は超過雑音推定である、請求項４３に記載のコンピュータプログラムプロダクト。
オーディオ信号の雑音を抑制するための装置であって、
入力オーディオ信号を受信するための手段と、
定常雑音推定、非定常雑音推定、超過雑音推定に基づいて総合雑音推定を計算するための手段と、
入力の信号対雑音比（ＳＮＲ）と、１または複数のＳＮＲ限界とに基づいて適応係数を計算するための手段と、
スペクトル拡張利得関数を使用して利得のセットを計算するための手段と、ここにおいて、前記スペクトル拡張利得関数は、前記総合雑音推定および前記適応係数に基づき、
雑音抑制済みオーディオ信号を生成するために、前記利得のセットを前記入力オーディオ信号に適用するための手段と、
前記雑音抑制済みオーディオ信号を提供するための手段と
を備える、装置。
前記スペクトル拡張利得関数は、式

に従って計算され、Ｇ（ｎ，ｋ）は利得のセットであり、ｎはフレーム番号であり、ｋはビン番号であり、Ｂは所望の雑音抑制限界であり、Ａは適応係数であり、ｂはＢに基づく係数であり、Ａ（ｎ，ｋ）は、入力大きさ推定であり、Ａ_ｏｎ（ｎ，ｋ）は総合雑音推定である、請求項４７に記載の装置。
前記超過雑音推定は、式

に従って計算され、Ａ_ｅｎ（ｎ，ｋ）は超過雑音推定であり、ｎはフレーム番号であり、ｋはビン番号であり、β_ＮＳは所望の雑音抑制限界であり、Ａ（ｎ，ｋ）は入力大きさ推定であり、γ_ｃｎは結合されたスケーリング係数であり、Ａ_ｃｎ（ｎ，ｋ）は結合された雑音推定である、請求項４７に記載の装置。
前記総合雑音推定は、式

に従って計算され、Ａ_ｏｎ（ｎ，ｋ）は総合雑音推定であり、ｎはフレーム番号であり、ｋはビン番号であり、γ_ｃｎは結合されたスケーリング係数であり、Ａ_ｃｎ（ｎ，ｋ）は結合された雑音推定であり、γ_ｅｎは超過雑音スケーリング係数であり、Ａ_ｅｎ（ｎ，ｋ）は超過雑音推定である、請求項４７に記載の装置。