JP2014518404A

JP2014518404A - 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制

Info

Publication number: JP2014518404A
Application number: JP2014518528A
Authority: JP
Inventors: トービアスヴォルフ，; クリスティアーンホフマン，
Original assignee: ニュアンスコミュニケーションズ，インコーポレイテッド
Priority date: 2011-07-07
Filing date: 2011-07-07
Publication date: 2014-07-28
Anticipated expiration: 2031-07-07
Also published as: US9858942B2; CN103765511B; US20140095156A1; WO2013006175A1; JP5752324B2; CN103765511A; EP2724340B1; EP2724340A1

Abstract

信号中のインパルス性干渉を低減させる方法および装置は、必ずしも信号中のピッチ周波数を確認することなしに、周波数に沿って相関し、非常に低い周波数から、可能性として、約数ｋＨｚまで及ぶ、大きな時間導関数に対して高エネルギー成分のスペクトルを検索することによって、インパルス性干渉の発生を検出する。インパルス性干渉のエネルギーが、推定され、これらの推定値は、インパルス性干渉を抑制するために使用される。随意に、所望の音声信号が、インパルス性干渉の抑制の結果として破損されることを防止するための技法が、採用される。

Description

本発明は、信号処理に関し、より具体的には、雑音の入った音声信号中のインパルス性干渉の抑制に関する。

インパルス性干渉は、その振幅、持続時間、および発生時間が、ランダムである、１つ以上の短パルスのバーストによって特徴付けられる、プロセスである。自動車等の雑音環境において使用される、自動音声認識（ＡＳＲ）システム等のヒト音声信号を処理するシステムは、道路上の段差または開放した窓から直撃する風等による、インパルス性干渉を被り得る。風のある環境または戦闘地域において使用されるモバイル通信デバイスおよび他のマイクロホンベースのシステムは、インパルス性干渉を被るシステムの他の実施例を提供する。

従来の単一チャネル雑音抑制アルゴリズムは、典型的には、車のエンジン雑音等の定常、すなわち、継続的雑音を抑制可能であるが、これは、これらの定常雑音は、比較的に容易に、音声信号から区別されることができるからである。しかしながら、多くのインパルス性干渉は、音声信号に酷似する、高度に非定常である特性を呈し、したがって、標準的な単一チャネル雑音低減アルゴリズムを使用して抑制することはできない。実際、インパルス性干渉が存在するとき、標準的単一チャネル雑音低減アルゴリズムを適用することは、多くの場合、音声認識性能および使用の容易性を低減させる。

風の雑音は、特に、問題となり得る。例えば、風雑音は、直接、マイクロホンのカプセル内において等、静かな周囲環境においてさえ、生じ得る。したがって、マイクロホンのユーザは、問題を認識さえしていない場合があり、したがって、より大きく話すこと等によって、雑音を補償しない場合がある。多重マイクロホンシステムは、ある場合には、マイクロホンのうちの１つ内で生成された風雑音を抑制することができる。しかしながら、多くの重要な用途は、単一マイクロホンのみ要求し、したがって、多重マイクロホンの解決策を受けることができない。

非定常雑音低減のためのいくつかの時間ドメインアプローチが、存在する。過渡信号を除去することによって、古い記録を復元するために、いわゆる、テンプレートまたはプロトタイプが、提案されている（例えば、［２］、［３］）。Ｖａｓｅｇｈｉ［２］は、それぞれのテンプレートに対して、整合フィルタを含み、補間器を用いた除去が続く、検出のための方法を提案している。しかしながら、古い記録を復元することは、リアルタイムで行なわれる必要はない。したがって、前述で検討された用途と異なり、これらの状況では、非一時的フィルタリングを採用することができる。Ｇｏｄｓｉｌｌは、２つの互いに独立で同一の分布に従う（ｉ．ｉ．ｄ．）変数によって引き起こされる、２つの自動音声認識プロセスとして、統計的アプローチならびにモデル信号および干渉を使用する。ガウス過程［３］では、除去は、前述のモデルを使用して、カルマンフィルタの所望の信号成分の軌道をトレースすることによって行なわれる。

特に、風雑音の除去に専念したこの話題に関するより最近の刊行物は、［４］ＫｉｎｇおよびＡｔｌａｓによるものである。提案される概念は、［５］に提案されるように、計算コストが高い、最小二乗高調波（ＬＳＨ）ピッチ推定値に完全に依拠する。（「ピッチ」または「ピッチ周波数」は、本明細書では、信号の基本または他の単一周波数成分を意味する。例えば、発話された母音の音声信号は、ピッチ周波数と、典型的には、ピッチ周波数に調和的に関連するいくつかの他の周波数とを含む。ピッチ周波数は、発話の開始と終了との間で変動し得る。）ＬＳＨ音声モデルの不整合は、エネルギー制約と一緒に、干渉検出のために使用される証拠を提供する。有声音声が不在の場合、約４ｋＨｚにおける単純高域通過が、全ての風雑音を遮断するために適用される。有声音声の存在下では、風雑音は、ベースバンドに復調されたサブバンド信号に適用される低次コムフィルタによって除去される。その後、有声音声のセグメントは、再合成される。十分に良好な基本周波数（ピッチ）の推定値が、利用可能である場合、コムフィルタリングは、風雑音を含む、高調波音声スペクトルのギャップ内のいかなるタイプのブロードバンド雑音も効果的に低減させることができる。しかしながら、音声強調のためのピッチ適応フィルタリングは、周知の手段である［１］。実を言うと、正確かつロバストなピッチ推定値を雑音の入った音声信号から得ることは、実際は、困難なタスクである。

２００９年、Ｎｅｍｅｒ、および、Ｌｅｂｌａｎｃ（ＢｒｏａｄｃｏｍＣｏｒｐ．）は、線形予測［７］に基づいて、風雑音を検出することを提案している。彼らは、風が、それに対して高調波構造が存在しないため、低次予測子を使用して、良好にモデル化され得ることを見出した。しかしながら、音声の場合、より高い予測子次数が、必要である。これは、音声を風雑音と区別するために使用することができ、故に、抑制フィルタを設定することができる。例えば、特許文献１を参照されたい。

ＫｏｔｔａＭａｎｏｈａｒ，他は、ＥｌｓｅｖｉｅｒｉｎＳｐｅｅｃｈＣｏｍｍｕｎｉｃａｔｉｏｎ４８（（２００６）９６−１０９）によって出版された「Ｓｐｅｅｃｈｅｎｈａｎｃｅｍｅｎｔｉｎｎｏｎｓｔａｔｉｏｎａｒｙｎｏｉｓｅｅｎｖｉｒｏｎｍｅｎｔｓｕｓｉｎｇｎｏｉｓｅｐｒｏｐｅｒｔｉｅｓ」において、短時間スペクトル減衰（ＳＴＳＡ）音声強調アルゴリズムに適用されるべき事後処理方式について論じている。

Ｔ．Ａ．Ｍａｈｍｏｕｎｄ，他は、ＨｉｎｄａｗｉＰｕｂｌｉｓｈｉｎｇＣｏｒｐｏｒａｔｉｏｎｉｎＥＵＲＡＳＩＰＪｏｕｒｎａｌｏｎＩｍａｇｅａｎｄＶｉｄｅｏＰｒｏｃｅｓｓｉｎｇ（Ｖｏｌｕｍｅ２００８，ＡｒｔｉｃｌｅＩＤ９７０３５３）によって出版された「Ｅｄｇｅ−ＤｅｔｅｃｔｅｄＧｕｉｄｅｄＭｏｒｐｈｏｌｏｇｉｃａｌＦｉｌｔｅｒｆｏｒＩｍａｇｅＳｈａｒｐｅｎｉｎｇ」において、デジタル画像を鮮鋭化するためのエッジ誘導によるモルフォロジーフィルタについて説明している。

ＰｅｔｒｏｓＭａｒａｇｏｓは、ＥｌｓｅｖｉｅｒＡｃａｄｅｍｉｃＰｒｅｓｓ（２００５，ｐｐ．１３５−１５６）によって出版されたＡ．Ｃ．Ｂｏｖｉｋ編の第２版である、「ＴｈｅＩｍａｇｅａｎｄＶｉｄｅｏＰｒｏｃｅｓｓｉｎｇＨａｎｄｂｏｏｋ」と題された書籍の第３．３章において、画像強調および特徴検出のためのモルフォロジーフィルタリングについて論じている。

Ｈｅｔｈｅｒｉｎｇｔｏｎ，他は、ＲｅｓｅａｒｃｈＩｎＭｏｔｉｏｎＬｔｄ．の子会社である、ＷａｖｅｍａｋｅｒｓｄｉｖｉｓｉｏｎｏｆＱＮＸＳｏｆｗａｒｅＳｙｓｔｅｍｓＧｍｂＨ＆Ｃｏ．ＫＧから利用可能である、風の直撃の抑制のための別のアプローチを提案している。例えば、特許文献２〜５を参照されたい。そのアプローチの核となる考えは、風のための割に単純なスペクトルモデルである。特に、風のモデルは、スペクトルエネルギーが背景雑音によって支配される点まで、低周波数において負勾配を伴う、対数スペクトルにおける直線を構成する。モデルと信号フレームとの間の種々の類似性評価基準が、風、風および音声、または風のみとして、入力フレームを分類するために使用される。さらに、モデルは、雑音抑制のために、モデルのスペクトル形状の使用を可能にする。無声フレームからのモデルの瞬間推定値にわたって平均化することによる、長期推定値の生成も、提案されている。

利用される線形モデルに加え、信号スペクトル中のピッチ周波数依存リップルが、最初に、検出され、次いで、干渉低減によって抑制されることから保護される。この機構の実践的実装は、振幅スペクトルにおけるピークを検出し、各ピークの幅を測定する。スペクトル的に狭く、かつ時間的にゆっくりと変化するピークは、有声音声を示す一方、スペクトル的に広く、かつ急に変化するものは、風を示す。

さらに、周波数軸に沿ったピーク間の高調波関係は、離散コサイン変換（ＤＣＴ）［６］を使用して測定される。これは、ＤＣＴが、対数スペクトルに適用される場合、直接、ケプストラムベースのピッチ推定値に変換する。そのようなピッチ追跡方法は、１９６０年代後半に提案されている。

この方法は、したがって、単純スペクトルモデルと一緒に、ピッチ周波数の仮定される知識に基づいて構築される。所望の信号に属することが分かっていない信号成分は、抑制される。抑制は、短時間フーリエ変換ドメインにおけるスペクトル重み付けを用いて実装される。風雑音抑制は、したがって、通常の雑音低減とともに使用され得る。

残念ながら、インパルス性干渉を低減させるためのこれらの先行技術方法は、１つ以上の不利点を被る。例えば、Ｈｅｔｈｅｒｉｎｇｔｏｎによって説明される方法は、いくつかの方法において、音声信号のピッチを考慮することを要求する。

米国特許出願公開第２０１０／０２２３０５４号明細書米国特許第７，８９５，０３６号明細書米国特許第７，８８５，４２０号明細書米国特許出願公開第２０１１／００２６７３４号明細書欧州特許出願公開第１４５０３５４号明細書

本発明の実施形態は、信号中のインパルス性干渉を低減させる方法を提供する。本方法は、自動的に、信号の高エネルギー成分を識別することを含むいくつかの演算を行なう。高エネルギー成分は、識別された高エネルギー成分の各々のエネルギーが、所定の閾値を超えるように識別される。識別された高エネルギー成分の時間導関数が、識別される。識別された時間導関数は、モルフォロジー的にフィルタリングされる。識別された時間導関数をモルフォロジー的にフィルタリングすることは、インパルス性干渉の発生を検出し、信号中の干渉エネルギーを推定することを含む。検出および推定は、少なくとも部分的に、識別された時間導関数に基づく。信号の一部は、推定された干渉エネルギーに基づいて、抑制される。

高エネルギー成分を識別することは、閾値が、信号のスペクトルエンベロープを下回るように、閾値を決定することを含み得る。随意に、または代替として、閾値は、少なくとも部分的に、信号のスペクトルエンベロープ、および少なくとも部分的に、信号中の定常雑音のパワースペクトル密度に基づいて、決定され得る。第１の条件下では、閾値は、信号のスペクトルエンベロープを下回る計算された値であり得、第２の条件下では、閾値は、定常雑音のパワースペクトル密度を上回る計算された値であり得る。

識別された時間導関数の各々は、周波数範囲に関連付けられ得る。識別された時間導関数に関連付けられた周波数範囲は、集合的に、約１００Ｈｚまたは約２００Ｈｚ等の所定の周波数を下回って開始する、周波数の連続的範囲を形成し得る。ギャップが、周波数の連続的範囲内に許され得る。その場合、各ギャップは、所定のサイズ未満である。

時間導関数を識別することは、識別された高エネルギー成分のスペクトル内の近接する時間導関数の領域を識別することを含み得る。すなわち、時間導関数はそれぞれ、周波数または周波数範囲の観点から、時間導関数の別のものと隣接するか、またはその近傍にあり得る。

複数の時間導関数を識別することは、所定の値を超える時間導関数を識別することを含み得る。

識別された複数の時間導関数をモルフォロジー的にフィルタリングすることは、２次元画像フィルタを識別された時間導関数に適用することを含み得る。

本方法は、識別された複数の時間導関数を２値化する、すなわち、各時間導関数を０および１等の２つの２進値のうちの１つに変換することを含み得る。

干渉エネルギーを推定することは、最初に、少なくとも、所定の時間期間の間、信号のパワースペクトル密度に基づいて、干渉エネルギーを推定し、その後、推定された干渉エネルギーに時間単調減衰を課すことを含み得る。

識別された時間導関数をモルフォロジー的にフィルタリングすることは、少なくとも部分的に、推定された干渉エネルギーに基づいて、干渉ビンに対する値を計算することを含み得る。インパルス性干渉の発生を検出することは、少なくとも部分的に、前の時間フレームの干渉ビンの計算された値に基づいて、インパルス性干渉の発生を検出することを含み得る。

本方法は、事後処理演算を含み得、その場合、開始周波数が、決定され、推定された干渉エネルギーが、決定された開始周波数から開始して、徐々により高い周波数に対して、徐々により小さい推定された干渉エネルギーを強制するように、自動的に、修正される。

随意に、信号対干渉比（ＳＩＲ）および／または総干渉対雑音比（ＩＮＲ）が、計算され得る。推定された干渉エネルギーが修正される方法に影響を及ぼす演算パラメータは、計算されたＳＩＲおよび／またはＩＮＲに基づいて、調節され得る。

本方法は、自動的に、信号対干渉比（ＳＩＲ）および／または総干渉対雑音比（ＩＮＲ）を計算することを含み得る。開始周波数は、計算されたＳＩＲおよび／またはＩＮＲに基づいて、調節され得る。

本発明の別の実施形態は、信号中のインパルス性干渉を低減させるためのフィルタを提供する。フィルタは、高エネルギー成分識別器と、成分識別器に連結された時間微分器と、時間微分器に連結されたモルフォロジーフィルタと、モルフォロジーフィルタに連結された雑音低減フィルタとを含む。高エネルギー成分識別器は、識別された高エネルギー成分の各々のエネルギーが、所定の閾値を超えるように、信号の高エネルギー成分を識別するように構成される。時間微分器は、識別された高エネルギー成分の時間導関数を識別するように構成される。モルフォロジーフィルタは、インパルス性干渉の発生を検出し、少なくとも部分的に、識別された時間導関数に基づいて、信号中の干渉エネルギーを推定するように構成される。雑音低減フィルタは、推定された干渉エネルギーに基づいて、信号の一部を抑制するように構成される。

所定の閾値は、信号のスペクトルエンベロープを下回り得る。随意に、または代替として、所定の閾値は、少なくとも部分的に、信号のスペクトルエンベロープに、および少なくとも部分的に、信号中の定常雑音のパワースペクトル密度に基づき得る。第１の条件下では、閾値は、信号のスペクトルエンベロープを下回る計算された値であり得、第２の条件下では、閾値は、定常雑音のパワースペクトル密度を上回る計算された値であり得る。

識別された時間導関数の各々は、周波数範囲に関連付けられ得る。識別された時間導関数に関連付けられた周波数範囲は、集合的に、約１００Ｈｚまたは約２００Ｈｚ等の所定の周波数を下回って開始する、周波数の連続的範囲を形成し得る。周波数の連続的範囲は、所定のサイズ未満の少なくとも１つのギャップを含み得る。時間微分器は、識別された高エネルギー成分のスペクトル内の近接する時間導関数の領域を識別することによって、時間導関数を識別するように構成され得る。すなわち、時間導関数はそれぞれ、周波数または周波数範囲の観点から、時間導関数の別のものに隣接する、またはその近傍にあり得る。

時間微分器は、識別された時間導関数の各々が所定の値を超えるように、時間導関数を識別するように構成され得る。

モルフォロジーフィルタは、２次元画像フィルタを識別された時間導関数に適用するように構成され得る。

モルフォロジーフィルタは、識別された時間導関数を２値化、すなわち、各時間導関数を０および１等の２つの２進数値のうちの１つに変換するように構成され得る。

モルフォロジーフィルタは、最初に、少なくとも、所定の時間期間の間、信号のパワースペクトル密度に基づいて、干渉エネルギーを推定し、その後、推定された干渉エネルギーに時間単調減衰を課すことによって、干渉エネルギーを推定するように構成され得る。

モルフォロジーフィルタは、少なくとも部分的に、推定された干渉エネルギーに基づいて、干渉ビンに対する値を計算するように構成され得る。モルフォロジーフィルタは、少なくとも部分的に、前の時間フレームの干渉ビンに対して計算された値に基づいて、発生を検出するように構成され得る。

随意に、フィルタは、自動的に、開始周波数を決定し、決定された開始周波数から開始して、徐々により高い周波数に対して、徐々により小さい推定された干渉エネルギーを強制するように、推定された干渉エネルギーを修正するように構成される、ポストプロセッサを含み得る。

随意に、フィルタは、ポストプロセッサに連結されたポストプロセッサコントローラを含み得る。ポストプロセッサコントローラは、自動的に、信号対干渉比（ＳＩＲ）および／または総干渉対雑音比（ＩＮＲ）を計算するように構成され得る。ポストプロセッサコントローラはさらに、自動的に、ポストプロセッサが複数の推定された干渉エネルギーを修正する方法に影響を及ぼす演算パラメータを調節するように構成され得る。ポストプロセッサコントローラはさらに、自動的に、開始周波数を調節するように構成され得る。いずれの場合も、自動調節は、計算されたＳＩＲおよび／またはＩＮＲに基づき得る。

本発明のさらに別の実施形態は、信号中のインパルス性干渉を低減させるためのコンピュータプログラム製品を提供する。コンピュータプログラム製品は、非一過性コンピュータ読み取り可能な媒体を含む。コンピュータ読み取り可能なプログラムコードは、コンピュータ読み取り可能な媒体上に記憶される。コンピュータ読み取り可能なプログラムコードは、信号の高エネルギー成分を識別するためのプログラムコードを含む。各識別された高エネルギー成分のエネルギーは、所定の閾値を超える。コンピュータ読み取り可能なプログラムコードもまた、識別された高エネルギー成分の時間導関数を識別するためのプログラムコードを含む。コンピュータ読み取り可能なプログラムコードはまた、インパルス性干渉の発生を検出し、少なくとも部分的に、識別された時間導関数に基づいて、信号中の干渉エネルギーを推定することを含む、識別された時間導関数をモルフォロジー的にフィルタリングするためのプログラムコードを含む。コンピュータ読み取り可能なプログラムコードはまた、推定された干渉エネルギーに基づいて、信号の一部を抑制するためのプログラムコードを含む。

本発明の他の実施形態は、総干渉対雑音比（ＩＮＲ）を計算し、少なくとも部分的に、計算されたＩＮＲに基づいて、干渉を検出するための方法および装置を提供する。本発明のさらに他の実施形態は、信号対干渉比（ＳＩＲ）を計算し、少なくとも部分的に、計算されたＳＩＲに基づいて、音声を検出するための方法および装置を提供する。

本発明は、図面と併せて、以下の発明を実施するための形態を参照することによって、より完全に理解されるであろう。
図１は、仮想信号中の仮想インパルス性干渉の発生を図示する。図２は、時々の風の直撃を伴う、音声信号の実際のスペクトログラムである。図３は、本発明のある実施形態による、図２のスペクトログラム内の高エネルギー成分を識別する実際の結果である。図４は、図３に示される結果のサブセットである。図５は、本発明のある実施形態による、図４の信号の時間導関数を描写する。図６は、図４の信号のスペクトル導関数を描写する。図７は、本発明のある実施形態による、信号中のインパルス性干渉を低減させるためのシステムの概略ブロック図である。図８は、本発明のある実施形態による、図７のモルフォロジー干渉推定器内の連続発生検出および干渉推定の概略ブロック図である。図９は、本発明の別の実施形態による、図７のモルフォロジー干渉推定器内のフィードバックループの概略ブロック図である。図１０は、本発明のある実施形態による、図５の時間導関数が閾値処理された後に検出された発生を描写する。図１１は、本発明のある実施形態による、モルフォロジーフィルタリング後の図１０の発生を描写する。図１２は、本発明のある実施形態による、再帰的モルフォロジーフィルタリングのために使用される、近隣セル（ピクセル）の概略ブロック図である。図１３は、本発明のある実施形態による、再帰的干渉エネルギー推定のために使用される、近隣セル（ピクセル）の概略ブロック図である。図１４は、図５の時間導関数のモルフォロジーフィルタリング後の発生を図示する。図１５は、本発明のある実施形態による、図９の再帰的モルフォロジーフィルタを使用する、図１４の結果からもたらされる干渉推定値を図示する。図１６は、図１５に示される結果を生成する間にもたらされる干渉ビンを図示する。図１７は、本発明のある実施形態による、事後処理前の予備干渉推定値を示す。図１８は、本発明のある実施形態による、事後処理後の干渉推定値を示す。図１９は、時々の風の直撃を伴う、音声信号の実際のスペクトログラムである。図２０は、本発明の実施形態による、図１９のスペクトログラムに対する、干渉および音声の存在を検出するために使用され得る、種々の比率を図示する。図２１は、本発明のいくつかの実施形態および代替の演算を図示する、概略流れ図である。

本発明の好ましい実施形態によると、必ずしも、信号中のピッチ周波数を確認することなしに、信号中のインパルス性干渉を低減させる方法および装置が、開示される。我々は、インパルス性干渉のエネルギーを推定し、次いで、インパルス性干渉によって影響されたことが分かった、信号中の周波数のエネルギーを低減させることによって、インパルス性干渉を抑制する。随意に、我々は、所望の音声信号が、インパルス性干渉の抑制の結果として破損されることを防止するための技法を採用する。すなわち、我々は、音声信号が、インパルス性干渉と間違えられる、または偶発的に劣化される程度を低減させる。

（概要）
音声信号等の信号は、周波数成分から成る。各周波数成分は、エネルギーレベルを有する。単語または音素の発話の過程の間等、経時的に、信号において見出される周波数および各周波数成分のエネルギーレベルは、変動し得る。我々は、多くのインパルス性干渉の開始が、ある一定の組の周波数成分（本明細書では、一組の周波数成分または一組の周波数と称される）のエネルギーにおける大きくかつ突然の変化によって特徴付けられることを発見した。我々は、経時的変化を「時間導関数」と称し、我々は、これらのエネルギーにおける大きくかつ突然の変化の開始を「発生」と称する。図１は、破線１００と１０３との間で境界される、仮想信号１０６中のインパルス性干渉の仮想発生を図示する、単一周波数ビンに対するエネルギー−時間のグラフである。発生は、インパルス性干渉より遥かに短いものであり得ることに留意されたい。干渉発生における特徴的な組の周波数成分は、非常に低い周波数から、可能性として、約数ｋＨｚまで及ぶ、比較的に高エネルギーレベルかつ連続的またはほぼ連続的な周波数（集合的に、本明細書では、連続的周波数、近接周波数、接続周波数または接続領域と称される）によって特徴付けられる。したがって、我々は、多くのインパルス性干渉が、周波数に沿って相関し、非常に低い周波数から、可能性として、約数ｋＨｚまで及ぶ、大きな時間導関数に対して、高エネルギー成分のスペクトルを検索することによって、検出されることができると考える。

図２は、時々の風の直撃を伴う、音声信号の実際のスペクトログラムである。ｘ軸は、時間フレーム指数（図２では、各時間フレーム指数は、約１１．６ｍＳｅｃ．を表すが、他の値が、使用され得る）として表現される時間を表し、ｙ軸は、任意に番号付与された周波数バンド（ビン）を表す。灰色の影は、エネルギーレベルを表し、白色は、無エネルギーを表し、黒色は、最大エネルギーを表す。例示的風の直撃２００および例示的音声２０３が、概略されるが、図２に表されるデータは、他の風の直撃および他の音声も含む。風の直撃２００は、連続的またはほぼ連続的な組の周波数を含むが、音声２０３は、空間によって分離されたいくつかの調和的に関連する周波数成分を含むことに留意されたい。図３は、図２の信号の高エネルギー成分を描写する。図４は、図３に表されるデータのサブセット（ｙ軸における周波数ビン０〜６０のみ）を含む。図５は、図３の信号の時間導関数を描写する。図５における灰色の影は、導関数の値を表し、中間灰色は、０を表し、黒色は、大きな正値を表し、白色は、大きな負値を表す。ｘ軸は、図２−５において同一である。風の発生は、円で囲まれた垂直接続領域５００によって識別される。

記載されるように、インパルス性干渉は、一組の連続的またはほぼ連続的な周波数を含む傾向がある。対照的に、音声信号は、ピッチ周波数に加え、ピッチ周波数に調和的に関連するいくつかの他の周波数を含み、調和的に関連する周波数の間の周波数において、無または比較的に低レベルのエネルギーを伴う傾向がある。例えば、一組の調和的に関連する周波数は、図２および３に示される例示的音声２０３において明白である。したがって、経時的ではなく、周波数にわたって、音声信号のエネルギーレベルの変化を計算しようとした場合、典型的に音声信号中に見出される周波数の範囲にわたっていくつかの大きな変化（「周波数導関数」）を見出すであろう。我々の方法および装置は、音声信号が、連続的またはほぼ連続的な組の周波数に対する我々の要件を満たさない傾向があるので、音声信号をインパルス性干渉と間違えない傾向がある。記載されるように、我々の方法および装置は、信号中のピッチ周波数を確認することを要求しない。

図７は、本明細書に説明される一般的原理のいくつかを図示する、本発明の実施形態７００の概略ブロック図である。入力信号χ（κ）は、定期的時間間隔（「時間フレーム」）において採取された一連のサンプルから成り、式中、「κ」は、時間フレーム指数である。入力信号χ（κ）の各サンプルは、周波数バンドに分割され、パワースペクトル密度（ＰＳＤ）をもたらす。すなわち、各時間フレームｋにおいて、入力信号χ（κ）は、各周波数バンド中のエネルギーの量を含む。ＰＳＤは、Φ_χχ（κ，μ）によって表され、式中、Φ_χχは、エネルギーの量を示し、κは、離散時間フレーム指数を示し、μは、離散周波数バンド（「ビン」）を示す。図７に示される実施形態は、ＰＳＤをもたらすために、一組のフィルタ７０３を含むが、ＰＳＤを推定するための任意の好適な機構または方法が、容認可能であろう。いくつかのそのような機構および方法は、フィルタバンクを使用し、他のものは、使用しない。エネルギーレベルは、実際のエネルギーレベルの対数によって表され得る。したがって、ＰＳＤは、対数スペクトルと称され得る。

エネルギー閾値検出器７０６は、高エネルギー成分、すなわち、そのエネルギーが閾値を超える周波数バンド（ビン）を識別する。時間導関数計算器７０９は、エネルギーが急上昇する、スペクトログラム内の領域を識別する。モルフォロジー干渉推定器７１２は、非常に低い周波数から、可能性として、約数ｋＨｚまで及ぶ、連続的またはほぼ連続的な組の周波数または周波数バンドが全て、急上昇エネルギーを経験するかどうかを確認する。その場合、急上昇エネルギーの開始（時間的に）は、風の直撃等のインパルス性干渉の発生と見なされる。モルフォロジー干渉推定器７１２は、インパルス性干渉の持続時間の間、周波数バンド（ビン）の各々のエネルギーの量を推定する。インパルス性干渉内のエネルギーの推定された量は、

によって表される。

いくつかの実施形態では、モルフォロジー干渉推定器７１２は、時間導関数計算器７０９の出力を２次元画像として取り扱い、時間指数（κ）は、一方の次元を表し、周波数バンド（ビン）（μ）は、画像の他の次元を表す。モルフォロジー干渉推定器７１２は、次いで、画像処理技法を使用して、インパルス性干渉としての前述の周波数特性（非常に低い周波数から、可能性として、約数ｋＨｚまで及ぶ、殆どまたは全くギャップを伴わない）を有する、時間導関数「画像」内の接続領域を識別し得る。

干渉エネルギーが、推定されると、推定値は、スペクトル重み付けフレームワークにおいて使用され、干渉を抑制し、それによって、音声を強調し得る。すなわち、推定されたエネルギーは、信号から減算され、インパルス性干渉抑制（「強調」）信号をもたらし得る。しかしながら、我々は、音声信号が歪曲されることを防止するための追加の手段を講じることを提案する。我々は、したがって、ポストプロセッサ７１５を含むことを提案する。ポストプロセッサ７１５は、インパルス性干渉エネルギー推定値を修正し、Φ_ｉｉ（κ，μ）によって表される修正された推定値は、雑音低減フィルタ７１８にフィードされる。雑音低減フィルタ７１８は、修正された推定値を入力信号χ（κ）から減算し、強調された信号をもたらす。随意に、ポストプロセッサ７１５は、音声、風、および／または他の信号または干渉情報の存在に関する情報等、外部情報に基づいて、コントローラ７２１によって制御され得る。いずれの場合も、事後処理は、随意である。

図式的に図８に図示されるように、所与の時間フレームに対する発生検出８００および干渉推定８０３は、前述のように、連続的に行なわれ得る。しかしながら、我々は、図９に描写されるように、モルフォロジー干渉推定器にフィードバックループを含むことを提案する。発生検出９００および干渉推定９０３に加え、フィードバックループでは、「干渉ビン」が、決定され９０６、記憶され９０９、次いで、以下により詳細に論じられるように、続く時間フレームの間、発生検出９００中に使用される。

（高エネルギー成分検出）
我々は、インパルス性干渉から生じる時間−周波数画像において、接続領域を構成する発生を見出すことを所望し、音声がそのような発生に間違えられることを所望しないので、高エネルギー成分に焦点を当てる。高ＳＮＲが存在するとき、有声音の間等、いくつかの音声発生が、接続領域を含むように見える場合があり、これらの見かけの接続領域は、インパルス性干渉の発生と間違えられる場合がある。音声発生は、一般に使用される図７におけるフィルタ７０３等の分析フィルタバンクが、通常、そのバンドパスフィルタの有限選択性に起因して、近隣周波数バンドからの成分の何らかのエイリアシングを呈するため、接続領域を含むように見える場合がある。したがって、エネルギーが、音声の調和的に関連する周波数間のギャップに漏出し、それによって、音声が接続領域を含むように見られ得る。

音声は、高エネルギー成分を含み得る。しかしながら、音声の調和的に関連する成分間の空間は、図２に示される例示的音声２０３において明白であるように、ほとんどエネルギーを含まない。その結果、高エネルギー成分のみ、考慮されるとき、調和的に関連する音声成分間の空間は、高調波成分とより強く対比し、高調波成分が、連続的な組の周波数として識別されることを防止する。したがって、高エネルギー成分に焦点を当てることによって、我々は、概して、音声による混乱を回避する。

一方、風の直撃および他のインパルス性干渉は、連続的な組の周波数を含む傾向があり、したがって、除外されない。その結果、我々は、最初に、入力信号中の高エネルギー成分を識別することによって、インパルス性干渉の発生を識別することを提案する。

本発明の実施形態において使用される基本量Ψ_ｈｅ（κ，μ）は、比較的に高エネルギーを伴う信号成分を含む、対数スペクトルである。ここでは、κは、時間フレームの離散指数を示し、μは、スペクトルサブバンド指数である。本文脈における「高エネルギー」は、入力信号Φ_χχ（κ，μ）のＰＳＤが閾値Ｔを超えることを意味する。一実施形態では、閾値は、入力信号のスペクトルエンベロープＨ_ｅｎｖ（κ，μ）を下回る、約２０ｄＢ等の値に設定される。スペクトルエンベロープは、当然ながら、経時的に変化し得るが、この変動は、インパルス性干渉の長さに対して、ゆっくりである。他の閾値またはより複雑な閾値も、以下に説明されるように、使用され得る。いくつかの実施形態によると、対数スペクトルは、式（１）に従って計算される。

ここで、Φ_ｎｎ（κ，μ）は、定常雑音のＰＳＤを示し、βは、過大推定係数である。高信号対雑音パワー比（ＳＮＲ）が存在する場合、Ψ_ｈｅ（κ，μ）は、定常雑音成分が、比較的に小さいので、Φ_ｎｎ（κ，μ）に依存せず、したがって、項ｍａｘ[Ｔ・Ｈ_ｅｎｖ（κ，μ），β・Φ_ｎｎ（κ，μ）]は、Ｔ・Ｈ_ｅｎｖ（κ，μ）を返す。Φ_χχ（κ，μ）中の大きなピークのみ、Ｔ・Ｈ_ｅｎｖ（κ，μ）を超え、したがって、対数項は、これらの大きなピークに対してのみ、０を超える。低ＳＮＲ状況では、すなわち、定常雑音が、比較的に高いとき、項ｍａｘ[Ｔ・Ｈ_ｅｎｖ（κ，μ），β・Φ_ｎｎ（κ，μ）]は、β・Φ_ｎｎ（κ，μ）を返し、したがって、Ψ_ｈｅ（κ，μ）は、係数βだけ、雑音ＰＳＤΦ_ｎｎ（κ，μ）を超える信号成分を含む。定常雑音の間、式（１）は、Ψ_ｈｅ（κ，μ）に対して、０を返すはずである。

（時間およびスペクトル導関数）
記載されるように、高エネルギー成分の時間導関数は、発生を識別するために算出される。原則として、また、周波数軸に沿って、導関数を算出し得る。これは、しかしながら、本明細書に開示される方法および装置に必須ではない。それでも、スペクトル導関数を算出後、風の直撃が現れる程度を考慮することは、有益であり得る。いくつかの演算子の任意のものは、導関数を算出するために採用され得る。例えば、Ｓｏｂｅｌ、Ｃａｎｎｙ、およびＰｒｅｗｉｔｔは、画像処理において使用される公知の演算子である。他の演算子もまた、使用され得る。演算子は、そのフィルタカーネルＤによって定義され得る。フィルタリングされた画像は、式（２）および（３）に従って、離散２Ｄ−畳み込みによって得られる。

Ｓｏｂｅｌ演算子の場合、時間導関数（Ｄ_κ）およびスペクトル導関数（Ｄ_μ）に対するフィルタカーネルは、式（４）に与えられる。

これらのカーネルは、１フレーム遅延を導入するが、良好な結果をもたらす。過去値と一緒に、現在の時間フレームのみを使用する他のカーネルは、低待ち時間アルゴリズムを提供し得る。そのようなカーネルの使用は、しかしながら、結果として生じるシステムの性能を劣化させ得る。記載されるように、図４は、図３に表されるデータのサブセット（周波数ビン０〜６０のみ）を含む。図５は、Ｓｏｂｅｌ演算子を使用して生成される図４の信号の時間導関数を描写し、図６は、同様にＳｏｂｅｌ演算子を使用して生成された図４の信号のスペクトル導関数を描写する。記載されるように、スペクトル導関数は、開示される方法および装置に対して計算される必要はない。

（モルフォロジー干渉推定）
集合的に、我々は、発生検出および干渉推定をモルフォロジー干渉推定と称する。記載されるように、発生検出および干渉推定は、図８に関連して論じられるように、連続的に行なわれ得、随意に、フィードバックループが、図９に関連して論じられるように、これらの演算間で採用され得る。

（発生検出）
発生検出は、いくつかの段階を伴い得る。我々は、閾値関数を高エネルギー成分の時間導関数Ｇ_κ（κ，μ）に適用することによって開始することを提案する。閾値関数は、式（５）によって定義される２進数画像Ｇ_ｂｉｎ（κ，μ）をもたらす。

この２進数画像における１は、Ｔ_ｂｉｎを上回る勾配を有する時間導関数の部分を示し、０は、閾値以下の部分を示す。我々は、約１ｄＢのＴ_ｂｉｎが十分であることを見出した。有意により高い値は、干渉の一部を逸失させ得る。図１０は、閾値関数を図５の時間導関数に適用する結果を図示する。２進数画像Ｇ_ｂｉｎ（κ，μ）は、１および０のみを含む。図１０における画像では、黒色は、１を表し、白色は、０を表す。

モルフォロジーフィルタリングが、次いで、使用され、我々がインパルス性干渉と考える、接続領域を抽出し得る。例えば、膨脹、収縮、開放、および閉鎖等の古典的モルフォロジー演算が、強調のために採用され得る。すなわち、本質的に、２進数画像内の所望の構造（接続領域）中のエッジを見出し、および／またはそのコントラストを増加させる。

我々は、式（６）によって定義されるフィルタ等の再帰的モルフォロジーフィルタを前述で計算された２進数画像Ｇ_ｂｉｎ（κ，μ）に適用することを提案する。

このフィルタのカーネルは、式（７）によって定義される。

再帰的モルフォロジーフィルタは、現在の２進数画像セル（ピクセル）Ｇ_ｂｉｎ（κ，μ）のみを考慮するのではなく、また、近隣セルも考慮し、近隣は、図１２に図示されるように、周波数（μ）および／または時間（κ）方向に、現在のセルからずらされ得る。図１２におけるセルコンテンツを式（６）における項と比較されたい。

我々は、Ｔ_{ｍｏｒｐｈ}＝２が、良好な結果を提供することを見出したが、しかしながら、他の値が、使用され得る。式（７）のカーネルおよびＴ_{ｍｏｒｐｈ}＝２の場合、モルフォロジーフィルタが、所与のビンＧ_ｂｉｎ（κ，μ）における発生を検出するために、そのビンおよびその近隣のうちの少なくとも１つは、１に等しくなければならず、またはビンは、０であり得るが、その近隣の全３つは、１に等しくなければならない。カーネルも、挙動を修正するために、異なるように選定され得る。

式（６）によって定義されるフィルタリングは、表１に示される基準等に従って、有効および無効にされ得る。

図１１は、モルフォロジーフィルタリング後の図１０の発生を描写する。

（干渉推定）
記載されるように、インパルス性干渉のエネルギーの推定が、必要とされ、したがって、それぞれの信号成分は、適切なフィルタリング手段を使用して抑制することができる。干渉の発生が決定されると、干渉エネルギーが、前述の発生検出に基づいて、推定される。本質的に、発生は、干渉エネルギー推定プロセスをトリガするために使用される。干渉エネルギーＰＳＤは、各時間フレームに対して推定される。

インパルス性干渉の開始時、入力信号中のスペクトルエネルギーは、典型的には、干渉の信号エネルギーが、短時間の間平坦域に達するか、または直ちに、減少し始めるまで、少なくとも比較的に短い時間の間、急上昇する。インパルス性干渉は、比較的に短命であり、したがって、干渉に帰する信号エネルギーは、図１に示される仮想信号１０６の部分１０９におけるように、干渉の発生後、すぐに減少し始めるであろうことに留意されたい。部分１１２の間等、信号エネルギーが増加している間、発生が検出されると、我々は、入力信号全体がインパルス性干渉の結果であると仮定し、入力信号のスペクトルエネルギー全体に等しい干渉エネルギー推定値を生成する。しかしながら、部分１１２の間等、発生が通過し、入力信号エネルギーが増加しなくなると、我々は、入力信号エネルギーのいかなる減少も、インパルス性干渉の減少に帰すると仮定し、推定された干渉エネルギーを適宜減少させる。

そうしなければ干渉エネルギーの除去とともに除去されるであろう音声を入力信号が含む可能性を考慮するために、入力信号エネルギーが増加しなくなると、我々は、単調減衰を推定された干渉エネルギーに課し、推定値が、完全に減衰されてしまうまで（すなわち、推定値が、０またはその時の定常雑音レベル等、所定または計算された値まで低減されるまで）、推定値が、再び上昇することを防止する。

したがって、発生の持続時間の間、我々は、干渉エネルギー

を入力信号ＰＳＤΦ_χχ（κ，μ）に等しいとして推定する。発生が通過した後、我々は、いくつか（好ましくは、２つ）の時間フレームの間、入力信号ＰＳＤΦ_χχ（κ，μ）を追跡する。この時間の間、推定された干渉エネルギーは、入力信号ＰＳＤに等しいままである。Ｓｏｂｅｌ演算子が採用される場合、Ｓｏｂｅｌカーネルが、２つのフレームにわたる導関数を測定するので、追跡のために、少なくとも２つのフレームを使用することは、合理的である。追跡期間後、エネルギー推定値

は、減少することのみ可能にされ、完全に減衰されるまで、再び、増加されない。減衰は、式（８）に従って、実装され得る。

ここで、α_ｔは、減衰率を制御するために使用される、１より小さい正の定数である。ｍａｘ演算子は、

が、定常雑音ＰＤＳ

を下回ることを防止する。

（再帰的モルフォロジー干渉推定）
前述の２つの演算（発生検出および干渉推定）は、別個の演算（図８に関連して論じられるように）として、連続して行なわれ得、または、記載されるように、フィードバックループを用いて、相互接続され得る（図９に関連して論じられるように）。そのようなフィードバックループが使用される場合、所与の時間フレームに対する計算は、１つ以上の前の時間フレームからのデータを使用し、それによって、再帰の要素を導入し得る。我々は、そのような再帰が、発生検出および干渉推定を有意に改善することができることを見出した。例えば、我々は、直前の時間フレームが、干渉を含んでいた場合、時間フレームが、干渉を含む可能性がより高いと考える。特に、我々は、後述されるように、フィードバックループ内側の「干渉ビン」と呼ばれるものを算出することが有用であることを見出した。

インパルス性干渉は、短いが、有限である時間量の間続く。したがって、単一干渉は、いくつかの連続的時間フレームに及び、したがって、その間、検出され得る。ビンから構成される時間−周波数平面では、干渉ビンは、干渉が、干渉ビンの時間フレームまで存在すると仮定され得るビンである。干渉ビンは、形式Ｗ_ｉ（κ，μ）の２進数マスクによって表され、このマスクの値は、再帰的手順において決定される。すなわち、ある時間フレームの干渉ビンの値は、Ｗ_ｉ（κ−１，μ）等の過去の時間フレーム内の少なくとも１つの干渉ビンに依存する。一実施形態によると、干渉ビンは、式（９）に従って計算され得る。

したがって、干渉ビンは、以下のうちの１つ以上を考慮することによって、計算され得る：干渉推定（現在の時間フレーム内において、少なくとも、推定がこれまで計算された範囲まで）、高エネルギー成分に関する情報、現在の発生、および干渉推定が背景雑音を超える範囲。当然ながら、他の要因も、干渉ビン計算に含まれ得る。しかしながら、我々は、式（９）が、良好な結果を提供することを見出した。

接続発生領域の周波数方向における比較的に小さいギャップは、干渉内においてさえ、生じ得る。そのようなギャップは、十分に小さい限り、すなわち、所定のサイズ（限界）より小さい限り、充填され得る。しかしながら、ギャップサイズがサイズ限界を超える場合、ギャップを上回る（すなわち、ギャップより高い）周波数における全ての干渉ビンは、０に設定されるべきである。なぜなら、大きなギャップを上回るビンは、干渉に属さず、大きなギャップを上回るビンは、現在検出されている干渉以外の信号成分によって生じたとみなすことが可能であるからである。ギャップを充填する方法の１つは、Ｗ_ｉ（κ，μ）＝１を設定することによるものである。

記載されるように、再帰は、前の時間フレームからの情報を使用して、現在の時間フレームに対する値を計算する。一実施形態によると、再帰は、式（６）を修正することによって、モルフォロジー干渉推定器内に実装することができる。式（６）におけるＧ_ｂｉｎ（κ−１，μ）を干渉ビンＷ_ｉ（κ−１，μ）と置換することによって、式（１０）をもたらす。

式（１０）によって定義されるフィルタの項は、現在の２進数画像セル（ピクセル）Ｇ_ｂｉｎ（κ，μ）および近隣セルを含み、近隣は、図１３に図示されるように、周波数（μ）および／または時間（κ）方向に、現在のセルからずらされ得る。

式（６）のように、式（１０）は、４つの項の線形組み合わせであり、その結果は、閾値と比較される。式（６）同様に、我々は、Ｔ_{ｍｏｒｐｈ}＝２が、良好な結果を提供することを見出した。図１４は、前述の再帰的干渉推定プロセスを使用する、図５の時間導関数のモルフォロジーフィルタリング後の発生Ｇ_ｏｎ（κ，μ）を図示する。図１４（再帰的モルフォロジーフィルタリング）と図１０（非再帰的モルフォロジーフィルタリング）の比較は、再帰的モルフォロジーフィルタリングが、多くの場合、発生を識別することにおいてより優れていることを明らかにする。図１５は、再帰的モルフォロジーフィルタを使用する、図１４の結果からもたらされた干渉推定

を図示する。図１６は、図１５に示される結果を生成する間、もたらされる干渉ビンＷ_ｉ（κ，μ）を図示する。

（事後処理）
干渉推定は、入力信号中の周波数を弱めるために使用されるであろうことに留意されたい。事後処理演算の目標は、非修正干渉推定が、所望の音声信号に及ぼし得る負の影響を低減させるように、これまで計算された干渉推定

を修正することである。例えば、事後処理は、存在し得るいかなる音声信号にも課される歪曲の量を制御するように、行なわれるインパルス性干渉低減の量を制御し得る。干渉推定に関して前述のものに類似する考慮およびプロセスも、事後処理に適用される。例えば、インパルス性干渉において、特定の周波数バンド内のエネルギーの量は、図１に関する前述のように、経時的に減少することが予期される。しかしながら、音声では、特定の周波数バンド内のエネルギーの量は、経時的に非常に増加し得る（特に、音声が、発話された母音の開始等、新しいピッチ周波数を含む場合）。したがって、我々は、周波数が弱められ得る量において、経時的に減衰を強制することを提案する。さらに、風の直撃およびいくつかの他のインパルス性干渉は、徐々により高い周波数において、徐々に少ないスペクトルエネルギーを呈する。インパルス性干渉のこの特性は、事後処理演算に利用することができる。

上で計算された干渉推定値

は、それを上回ると推定された干渉エネルギーが周波数増加に伴って単調に減少する（これは、前述の風雑音の特性に一致する）周波数指数μ_０を決定するために、分析され得る。我々は、μ_０を事後処理のための「開始ビン」と呼ぶ。なぜなら、事後処理のいくつかの側面が、音声が干渉とともに抑制されることを防止するために、開始ビンから開始する干渉推定を改変するからである。すなわち、我々は、

を最大限にし、μ_０を上回るμの値に対して、干渉推定値

が、単調に減少するように、μ_０を選定する。強制されるスペクトル減衰の量は、式（８）によって示される時間減衰と同様に制御される。我々は、式１１に示されるように、干渉推定を修正することを提案する。

正の係数α_ｆは、スペクトル減衰の量を制御する。式（８）と同様に、

は、ｍａｘ（・）演算子を用いて、定常雑音のレベルを下回って降下することから防止される。スペクトル減衰を強制することは、風雑音が、そのスペクトルピーク後、降下する傾向があるので、音声歪曲を低減させるのに役立つ。故に、信号が、エネルギーが周波数の増加によって上昇する成分を含む場合、これらの成分は、音声によるものである可能性が高い。

最終干渉推定は、式１２に示されるように、「積極性」係数γを使用してもたらされる。

この係数は、実際に行なわれるインパルス性干渉低減の量を制御する方法を導入する。図１７および１８は、図５の時間導関数の事後処理を通して得ることができる差異を図示する。図１７は、予備干渉推定

を示し、図１８は、事後処理によって修正された干渉推定Φ_ｉｉ（κ，μ）を示す。

（干渉抑制）
推定された干渉を抑制するために、Ｗｉｅｎｅｒフィルタ［８］または古典的スペクトル減算［１０］［９］等の任意の好適な雑音抑制フィルタが、使用され得、Φ_ｉｉ（κ，μ）が、Φ_ｎｎ（κ，μ）の代わりに使用される。雑音抑制技法の概要は、［１１］に提供される。Ｗｅｉｎｅｒフィルタと同様の特性を伴うフィルタの場合、フィルタ重みは、式（１３）に示されるようになるであろう。

Ｈ_ｍｉｎは、減衰に対する限界を導入する。これは、最大減衰をもたらし、楽音に対処可能等の利点を提供し得る。しかしながら、これらのフィルタ重み付けは、全可聴風雑音を抑制しない場合がある。したがって、我々は、干渉をより徹底して除去するために、別の係数を含むことを提案する。係数は、フィルタの出力における残留雑音が、ＰＳＤとして、Φ_ｎｎ（κ，μ）・Ｈ^２ _ｍｉｎを呈するように選定される。そのような係数は、式（１４）に示される。

強調された出力スペクトルは、式（１５）を使用して、スペクトル重み付けを通して、得られ得る。

時間ドメイン出力信号は、次いで、それぞれのサブバンドドメイン処理フレームワークに応じて、例えば、重畳加算または別の適切な方法を使用して、合成され得る。

（インパルス性干渉のブロードバンド検出）
事後処理段階を制御するために、我々は、モルフォロジー干渉推定から利用可能なブロードバンド情報を使用する。総干渉対雑音比（ＩＮＲ）を使用して、干渉の存在を検出することができ、信号対干渉比（ＳＩＲ）を採用して、干渉の存在下でも、音声を検出することができる。

図１９は、時々の風の直撃を伴う、音声信号の実際のスペクトログラムを図示する。図２０は、干渉および音声の存在を検出するために使用され得る、種々の比率を図示する。

干渉ＰＳＤ

の予備推定を使用して、式（１０）に従って、推定された総干渉対雑音比（ＩＮＲ）を算出し得る。

ここで、Ｎは、サブバンドμの数を示す。随意に、対数および総和は、交換され得る。推定器

は、いくつかの推定誤差を含む。それでも、和は、図１９および２０における実施例が実証するように、インパルス性干渉の存在を検出するために好適である。ＩＮＲは、より長い時間スケール基づいて機能する干渉検出器を構築するための良好な情報源である。例えば、「風の直撃／分」等の測定値を算出するために使用され得る。さらに、過去１０秒程度にわたって得られた平均ＩＮＲは、干渉のエネルギーの評価基準を提供し得る。

干渉の存在は、前述のように、事後処理を制御するために重要である。しかしながら、また、所望の信号成分の存在に関する情報を得ることも重要である。この目的を達成するために、我々は、入力ＰＳＤおよび推定された干渉ＰＳＤの比を積算し、式（１７）に示されるように、信号対干渉比を得る。

前述のように、対数および総和は、交換され得る。実数値関数Ｕ（κ，μ）は、和の各部に重みを割り当てる。式（１７）から得られる量は、インパルス性干渉の存在から独立した音声信号の存在を検出するために使用することができる。インパルス性干渉のない場合、ＳＩＲ（κ）は、

が、したがって、Φ_ｎｎ（κ，μ）と等しいので、「信号対雑音比」（ＳＮＲ）に変わる。

Ｕ（κ，μ）は、干渉のスペクトル近傍において生じる成分の強調を促進し、したがって、特別な予防措置が講じられない限り、歪曲される可能性がより高い。言い換えると、Ｕ（κ，μ）は、式（１７）において提案された評価基準を推定された干渉からスペクトル的に分離された成分に対して鈍感にするために使用することができる。これが該当する場合、事後処理は、例えば、高域周波数に所望の成分が存在する場合でも、干渉を除去するように制御することができる。任意の好適なコスト関数を使用して、重みＵ（μ）を導出することができる。図２０は、重みＵ（μ）を伴う場合と伴わない場合のＳＩＲの実施例を図示する。

事後処理の多くの側面は、ＳＩＲおよび／またはＩＮＲに基づいて、制御され得る。３つのそのような側面が、以下に論じられる。スペクトル減衰係数α_ｆは、前述のように、音声信号を保護する手段を提供する。高速減衰が強制される場合、μ_０を上回る音声成分は、事後処理によって保護される。これは、典型的には、フレーム毎に行なわれる。式（１７）に従って重み付けされたＳＩＲが、これが所望の信号を抑制する危険を示す場合、採用されることができる。

それを上回ると、推定された干渉エネルギーにおけるスペクトル減衰が強制される、開始ビンμ_０を低減させることができる。μ_０ビンの低減は、μ_０が、ピッチ周波数を含むビンと偶然一致する場合、特に、役立ち得る。言い換えると、予備干渉推定

に従って、開始ビンμ_０が、ピッチ周波数等の音声成分を含むことが偶然に決定される場合、対応する音声エネルギーは、偶発的に、干渉エネルギーの一部と見なされ、抑制されるであろう。我々は、より低い開始ビンμ_０を選択することが、この問題を軽減または緩和し得ることを見出した。決定された開始ビンμ_０は、最大エネルギーを有する周波数を表すので、より低い番号が付与された開始ビンは、最大未満のエネルギーを有する周波数を表す。したがって、より低い番号が付与された開始ビンを使用することによって、干渉推定におけるロールオフは、より低いエネルギーレベルから開始する。効果的に、我々は、音声エネルギーの少なくとも一部を推定された干渉エネルギーから除去する。したがって、我々は、音声エネルギーの少なくとも一部が抑制されることを防止する。より低い番号が付与された開始ビンを選択することは、あらゆる場合において適切ではない場合がある。例えば、より低い番号が付与された開始ビンを選択するかどうかの決定は、音声を抑制する危険が高いと見なされるとき等、重み付けされたＳＩＲに基づき得る。

積極性係数γは、干渉抑制の全体的量を低減させるために制御することができる。これは、主に、干渉が比較的に長い時間スケールに基づいて検出された場合、干渉抑制をオンにするための「スイッチ」として使用され得る。この目的のために、前述の「過去数秒間の平均ＩＮＲ」等の評価基準が、好ましくは、基礎として使用される。積極性を制御するために、我々は、

ではなく、

に基づいて、ＩＮＲを算出することを推奨する。これが行なわれる場合、積極性の制御は、前述の事後処理ステップ（式（１１））から恩恵を受ける。

図２１は、本発明のいくつかの実施形態および代替の演算を図示する、概略流れ図である。２１００では、入力信号の高エネルギー成分が、識別される。２１０３では、高エネルギー成分の時間導関数が、識別される。２１０６では、時間導関数は、モルフォロジー的にフィルタリングされる。モルフォロジーフィルタリングは、２１０９において、インパルス性干渉の発生を検出し、２１１２において、干渉エネルギーを推定することを含み得る。２１１５では、推定された干渉エネルギーは、μ_０を上回る周波数増加に伴って、推定された干渉エネルギーのロールオフを強制するように修正される。演算２１１５は、事後処理の実施例である。

図２１はまた、本発明のいくつかの実施形態の随意の演算の概略流れ図を含む。２１１８では、信号対干渉比（ＳＩＲ）が、自動的に、計算され、２１２１において、所定の周波数μ_０が、自動的に、計算されたＳＩＲに基づいて、調節される。２１２４では、信号対干渉比（ＳＩＲ）が、自動的に、計算され、２１２７において、音声が、少なくとも部分的に、計算されたＳＩＲに基づいて、検出される。２１３０では、総干渉対雑音比（ＩＮＲ）が、自動的に、計算され、２１３３において、干渉が、少なくとも部分的に、計算されたＩＮＲに基づいて、検出される。

本明細書に説明される、信号中のインパルス性干渉を低減させる方法および装置は、自動車用音声認識システム、携帯電話、軍事通信機器および他の状況における、風の直撃および他のインパルス性干渉の抑制に利するために使用され得る。開示される発明による、システムおよび方法は、例えば、これらのシステムおよび方法が、処理中の信号中のピッチ周波数を確認する必要がないので、先行技術に優る利点を提供する。さらに、これらのシステムおよび方法は、Ｈｅｔｈｅｒｉｎｇｔｏｎの提案のように、風雑音のモデルに依拠しない。加えて、いずれの先行技術も、我々が知る限り、本明細書に開示されるように、事後処理またはフィードバックループ処理を伴わない。

本明細書に開示される方法および装置はまた、ハードウェア、ファームウェア、および／またはそれらの組み合わせ内に実装され得る。例えば、図７−９に示される構成要素、ならびに図１２、１３、および２１を参照して説明される演算は、メモリ内に記憶される命令を実装するプロセッサによって実装され得る。インパルス性干渉を低減させる方法および装置は、メモリ内に記憶された命令によって制御されるプロセッサを含むように説明された。メモリは、ランダムアクセスメモリ（ＲＡＭ）、読取専用メモリ（ＲＯＭ）、フラッシュメモリ、または任意の他のメモリ、あるいは制御ソフトウェアまたは他の命令およびデータを記憶するために好適なそれらの組み合わせであり得る。本方法および装置によって行なわれる関数のいくつかが、流れ図および／またはブロック図を参照して説明された。当業者は、流れ図またはブロック図の各ブロックの全部あるいは一部、もしくはブロックの組み合わせの関数、演算、決定等が、コンピュータプログラム命令、ソフトウェア、ハードウェア、ファームウェア、またはそれらの組み合わせとして実装され得ることを容易に理解するはずである。当業者はまた、本発明の関数を定義する命令またはプログラムが、限定されないが、書込不可能記憶媒体（例えば、ＲＯＭ等のコンピュータ内の読取専用メモリデバイス、あるいはＣＤ−ＲＯＭまたはＤＶＤディスク等のコンピュータＩ／Ｏ接続によって読取可能なデバイス）上に恒久的に記憶された情報、書込可能記憶媒体（例えば、フロッピー（登録商標）ディスク、可撤性フラッシュメモリ、再書込可能光ディスク、およびハードドライブ）上に改変可能に記憶された情報、あるいは有線または無線コンピュータネットワークを含む、通信媒体を通して、コンピュータに伝送される情報を含む、多くの形態において、プロセッサに配信され得ることを容易に理解するはずである。加えて、本発明は、ソフトウェア内に具現化され得るが、本発明を実装するために必要な関数は、随意に、または代替として、組み合わせ論理、特定用途向け集積回路（ＡＳＩＣ）、フィールドプログラマブルゲートアレイ（ＦＰＧＡＳ）または他のハードウェア、あるいはハードウェア、ソフトウェア、および／またはファームウェア構成要素のいくつかの組み合わせ等、ファームウェアおよび／またはハードウェア構成要素を使用して、部分的または全体的に具現化され得る。

本発明は、前述の例示的実施形態を通して説明されるが、図示される実施形態に対する修正およびその変形例が、本明細書に開示される本発明の概念から逸脱することなく、行なわれ得ることは、当業者によって理解されるであろう。例えば、方法および装置のいくつかの側面が、流れ図を参照して説明されたが、当業者は、任意の流れ図の各ブロックまたは組み合わせブロックの全部あるいは一部の関数、演算、決定等が、組み合わせられる、別個の演算に分離される、または他の順序で行なわれ得ることを容易に理解するはずである。同様に、方法および装置のいくつかの側面が、ブロック図を参照して説明されたが、当業者は、任意のブロック図の各ブロックまたはブロックの組み合わせの全部あるいは一部の関数、演算、決定等が、組み合わせられる、別個の演算に分離される、または他の順序で行なわれ得ることを容易に理解するはずである。さらに、開示される側面またはこれらの側面の一部は、前述されていない方法で組み合わせられ得る。故に、本発明は、開示される実施形態に限定されるものと見なされるべきではない。

（参考文献）
［１］Ｅ．Ｈａｎｓｌｅｒ，Ｇ．Ｓｃｈｍｉｄｔ：ＡｃｏｕｓｔｉｃＥｃｈｏａｎｄＮｏｉｓｅＣｏｎｔｒｏｌ：ＡＰｒａｃｔｉｃａｌＡｐｐｒｏａｃｈ．ＷｉｌｅｙＩＥＥＥＰｒｅｓｓ，ＮｅｗＹｏｒｋ，ＮＹ（ＵＳＡ），２００４．
［２］Ｓ．Ｖ．Ｖａｓｅｇｈｉ、および、Ｐ．Ｊ．Ｗ．Ｒａｙｎｅｒ：Ａｎｅｗａｐｐｌｉｃａｔｉｏｎｏｆａｄａｐｔｉｖｅｆｉｌｔｅｒｓｆｏｒｒｅｓｔｏｒａｔｉｏｎｏｆａｒｃｈｉｖｅｄｇｒａｍｏｐｈｏｎｅｒｅｃｏｒｄｉｎｇｓ，Ｐｒｏｃ．ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ（ＩＣＡＳＳＰ），１９８８．
［３］Ｓ．Ｊ．Ｇｏｄｓｉｌｌ、および、Ｃ．Ｈ．Ｔａｎ：Ｒｅｍｏｖａｌｏｆｌｏｗｆｒｅｑｕｅｎｃｙｔｒａｎｓｉｅｎｔｎｏｉｓｅｆｒｏｍｏｌｄｒｅｃｏｒｄｉｎｇｓｕｓｉｎｇｍｏｄｅｌ−ｂａｓｅｄｓｉｇｎａｌｓｅｐａｒａｔｉｏｎｔｅｃｈｎｉｑｕｅｓ，ＩＥＥＥＡＳＳＰＷｏｒｋｓｈｏｐｏｎＡｐｐｌｉｃａｔｉｏｎｓｏｆＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇｔｏＡｕｄｉｏａｎｄＡｃｏｕｓｔｉｃｓ，１９９７．
［４］Ｂ．Ｋｉｎｇ、および、Ｌ．Ａｔｌａｓ：Ｃｏｈｅｒｅｎｔｍｏｄｕｌａｔｉｏｎｃｏｍｂｆｉｌｔｅｒｉｎｇｆｏｒｅｎｈａｎｃｉｎｇｓｐｅｅｃｈｉｎｗｉｎｄｎｏｉｓｅ，１１ｔｈＩｎｔｅｒｎａｔｉｏｎａｌＷｏｒｋｓｈｏｐｏｎＡｃｏｕｓｔｉｃＥｃｈｏａｎｄＮｏｉｓｅＣｏｎｔｒｏｌ（ＩＷＡＥＮＣ），２００８．
［５］Ｎ．Ａｂｕ−Ｓｈｉｋｈａｈ、および、Ｍ．Ｄｅｒｉｃｈｅ：Ａｒｏｂｕｓｔｔｅｃｈｎｉｑｕｅｆｏｒｈａｒｍｏｎｉｃａｎａｌｙｓｉｓｏｆｓｐｅｅｃｈ，Ｐｒｏｃ．ＩＥＥＥＩｎｔｅｒｎａｔｉｏｎａｌＣｏｎｆｅｒｅｎｃｅｏｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ａｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ（ＩＣＡＳＳＰ），２００１．
［６］Ｎ．Ａｈｍｅｄ，Ｔ．Ｎａｔａｒａｊａｎ、および、Ｋ．Ｒ．Ｒａｏ：Ｄｉｓｃｒｅｔｅｃｏｓｉｎｅｔｒａｎｓｆｏｍ，ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓｏｎＣｏｍｐｕｔｅｒｓ，Ｖｏｌ．１００，Ｎｏ．２３，１９７４．
［７］Ｅ．Ｎｅｍｅｒ、および、Ｗ．Ｌｅｂｌａｎｃ：Ｓｉｎｇｌｅ−Ｍｉｃｒｏｐｈｏｎｅｗｉｎｄｎｏｉｓｅｒｅｄｕｃｔｉｏｎｂｙａｄａｐｔｉｖｅｐｏｓｔ−ｆｉｌｔｅｒｉｎｇ，ＩＥＥＥＷｏｒｋｓｈｏｐｏｎＡｐｐｌｉｃａｔｉｏｎｓｏｆＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇｔｏＡｕｄｉｏａｎｄＡｃｏｕｓｔｉｃｓ，２００９．
［８］Ｅ．Ｈａｎｓｌｅｒ：ＳｔａｔｉｓｔｉｓｃｈｅＳｉｇｎａｌｅ．ＳｐｒｉｎｇｅｒＶｅｒｌａｇ，Ｂｅｒｌｉｎ（Ｇｅｒｍａｎｙ），２００１．
［９］Ｙ．Ｅｐｈｒａｉｍ，Ｄ．Ｍａｌａｈ：ＳｐｅｅｃｈＥｎｈａｎｃｅｍｅｎｔＵｓｉｎｇａＭｉｎｉｍｕｍＭｅａｎ−ＳｑｕａｒｅＥｒｒｏｒＳｈｏｒｔ−ＴｉｍｅＳｐｅｃｔｒａｌＡｍｐｌｉｔｕｄｅＥｓｔｉｍａｔｏｒ．ＩＥＥＥＴｒａｎｓａｃｔｉｏｎｓＯｎＡｃｏｕｓｔｉｃｓ，Ｓｐｅｅｃｈ，ＡｎｄＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，Ｖｏｌ．ＡＳＳＰ−３２，Ｎｏ．６，Ｄｅｃｅｍｂｅｒ１９８４．
［１０］Ｓ．Ｆ．Ｂｏｌｌ：ＳｕｐｐｒｅｓｓｉｏｎｏｆＡｃｏｕｓｔｉｃＮｏｉｓｅｉｎＳｐｅｅｃｈＵｓｉｎｇＳｐｅｃｔｒａｌＳｕｂｔｒａｃｔｉｏｎ．ＩＥＥＥＴｒａｎｓ．Ａｃｏｕｓｔ．ＳｐｅｅｃｈＳｉｇｎａｌＰｒｏｃｅｓｓ，Ｖｏｌ．２７，Ｎｏ．２，ｐｐ：１１３−１２０，１９７９．
［１１］Ｇ．Ｓｃｈｍｉｄｔ：Ｓｉｎｇｌｅ−ＣｈａｎｎｅｌＮｏｉｓｅＳｕｐｐｒｅｓｓｉｏｎＢａｓｅｄｏｎＳｐｅｃｔｒａｌＷｅｉｇｈｔｉｎｇ − ＡｎＯｖｅｒｖｉｅｗ．ＥｕｒａｓｉｐＮｅｗｓｌｅｔｔｅｒ，Ｖｏｌ．１５，Ｎｏ．１，ｐｐ．９−２４，Ｍａｒｃｈ２００４．

Claims

信号中のインパルス性干渉を低減させる方法であって、前記方法は、
前記信号の複数の高エネルギー成分を自動的に識別することであって、前記複数の識別された高エネルギー成分の各々のエネルギーは、所定の閾値を超えている、ことと、
前記複数の識別された高エネルギー成分の複数の時間導関数を自動的に識別することと、
前記識別された複数の時間導関数を自動的にモルフォロジー的にフィルタリングすることであって、前記モルフォロジー的にフィルタリングすることは、少なくとも部分的に前記複数の識別された時間導関数に基づいて、前記インパルス性干渉の発生を検出することと、前記信号中の複数の干渉エネルギーを推定することとを含む、ことと、
前記複数の推定された干渉エネルギーに基づいて、前記信号の一部を自動的に抑制することと
を含む、方法。
前記複数の高エネルギー成分を識別することは、前記閾値が、前記信号のスペクトルエンベロープを下回るように、前記閾値を決定することを含む、請求項１に記載の方法。
前記複数の高エネルギー成分を識別することは、少なくとも部分的に前記信号のスペクトルエンベロープに基づき、および、少なくとも部分的に前記信号中の定常雑音のパワースペクトル密度に基づいて、前記閾値を決定することを含む、請求項１に記載の方法。
前記閾値を決定することは、
第１の条件下で、前記閾値が、前記信号のスペクトルエンベロープを下回る計算された値であり、
第２の条件下で、前記閾値が、前記定常雑音のパワースペクトル密度を上回る計算された値であるように、
前記閾値を決定することを含む、請求項３に記載の方法。
前記複数の識別された時間導関数の各々は、周波数範囲に関連付けられ、
前記複数の識別された時間導関数に関連付けられた周波数範囲は、集合的に、所定の周波数を下回って開始する周波数の連続的範囲を形成する、
請求項１に記載の方法。
前記所定の周波数は、約２００Ｈｚである、請求項５に記載の方法。
前記所定の周波数は、約１００Ｈｚである、請求項５に記載の方法。
前記周波数の連続的範囲内のギャップを自動的に考慮することをさらに含み、各ギャップは、所定のサイズ未満である、請求項５に記載の方法。
前記複数の時間導関数を識別することは、所定の値を超える時間導関数を識別することを含む、請求項１に記載の方法。
前記複数の時間導関数を識別することは、前記複数の識別された高エネルギー成分のスペクトル内の近接する時間導関数の領域を識別することを含む、請求項１に記載の方法。
前記識別された複数の時間導関数をモルフォロジー的にフィルタリングすることは、２次元画像フィルタを前記複数の識別された時間導関数に適用することを含む、請求項１に記載の方法。
前記複数の識別された時間導関数を２値化することをさらに含む、請求項１に記載の方法。
前記複数の干渉エネルギーを推定することは、最初に、少なくとも所定の時間期間の間、前記信号のパワースペクトル密度に基づいて、前記干渉エネルギーを推定し、その後、前記推定された干渉エネルギーに時間単調減衰を課すことを含む、請求項１に記載の方法。
前記識別された複数の時間導関数をモルフォロジー的にフィルタリングすることは、少なくとも部分的に前記複数の推定された干渉エネルギーに基づいて、複数の干渉ビンに対する値を計算することを含む、請求項１に記載の方法。
前記インパルス性干渉の発生を検出することは、少なくとも部分的に前の時間フレームの複数の干渉ビンに対して計算された値に基づいて、前記インパルス性干渉の発生を検出することを含む、請求項１４に記載の方法。
開始周波数を自動的に決定することと、
前記決定された開始周波数から開始して、徐々により高い周波数に対して、徐々により小さい推定された干渉エネルギーを強制するように、前記複数の推定された干渉エネルギーを自動的に修正することと
をさらに含む、請求項１に記載の方法。
信号対干渉比（ＳＩＲ）および総干渉対雑音比（ＩＮＲ）のうちの少なくとも１つを自動的に計算することと、
前記計算されたＳＩＲおよびＩＮＲのうちの少なくとも１つに基づいて、前記複数の推定された干渉エネルギーが修正される方法に影響を及ぼす演算パラメータを自動的に調節することと
をさらに含む、請求項１６に記載の方法。
信号対干渉比（ＳＩＲ）および総干渉対雑音比（ＩＮＲ）のうちの少なくとも１つを自動的に計算することと、
前記計算されたＳＩＲおよびＩＮＲのうちの少なくとも１つに基づいて、前記開始周波数を自動的に調節することと
をさらに含む、請求項１６に記載の方法。
信号中のインパルス性干渉を低減させるためのフィルタであって、前記フィルタは、
前記信号の複数の高エネルギー成分を識別するように構成されている成分識別器であって、前記複数の識別された高エネルギー成分の各々のエネルギーは、所定の閾値を超えている、成分識別器と、
前記成分識別器に連結され、前記複数の識別された高エネルギー成分の複数の時間導関数を識別するように構成されている時間微分器と、
前記時間微分器に連結され、少なくとも部分的に前記複数の識別された時間導関数に基づいて、前記インパルス性干渉の発生を検出し、前記信号中の複数の干渉エネルギーを推定するように構成されているモルフォロジーフィルタと、
前記モルフォロジーフィルタに連結され、前記複数の推定された干渉エネルギーに基づいて、前記信号の一部を抑制するように構成されている雑音低減フィルタと
を備えている、フィルタ。
前記所定の閾値は、前記信号のスペクトルエンベロープを下回る、請求項１９に記載のフィルタ。
前記所定の閾値は、少なくとも部分的に前記信号のスペクトルエンベロープに基づき、および、少なくとも部分的に前記信号中の定常雑音のパワースペクトル密度に基づく、請求項１９に記載のフィルタ。
第１の条件下で、前記閾値は、前記信号のスペクトルエンベロープを下回る計算された値であり、
第２の条件下で、前記閾値は、前記定常雑音のパワースペクトル密度を上回る計算された値である、
請求項２１に記載のフィルタ。
前記複数の識別された時間導関数の各々は、周波数範囲に関連付けられ、
前記複数の識別された時間導関数に関連付けられた周波数範囲は、集合的に、所定の周波数を下回って開始する周波数の連続的範囲を形成する、
請求項１９に記載のフィルタ。
前記所定の周波数は、約２００Ｈｚである、請求項２３に記載のフィルタ。
前記所定の周波数は、約１００Ｈｚである、請求項２３に記載のフィルタ。
前記周波数の連続的範囲は、所定のサイズ未満の少なくとも１つのギャップを含む、請求項２３に記載のフィルタ。
前記時間微分器は、前記複数の識別された時間導関数の各々が所定の値を超えるように、前記複数の時間導関数を識別するように構成されている、請求項１９に記載のフィルタ。
前記時間微分器は、前記複数の識別された高エネルギー成分のスペクトル内の近接する時間導関数の領域を識別することによって、前記複数の時間導関数を識別するように構成されている、請求項１９に記載のフィルタ。
前記モルフォロジーフィルタは、２次元画像フィルタを前記複数の識別された時間導関数に適用するように構成されている、請求項１９に記載のフィルタ。
前記モルフォロジーフィルタは、前記複数の識別された時間導関数を２値化するように構成されている、請求項１９に記載のフィルタ。
前記モルフォロジーフィルタは、最初に、少なくとも所定の時間期間の間、前記信号のパワースペクトル密度に基づいて、前記干渉エネルギーを推定し、その後、前記推定された干渉エネルギーに時間単調減衰を課すことによって、前記複数の干渉エネルギーを推定するように構成されている、請求項１９に記載のフィルタ。
前記モルフォロジーフィルタは、少なくとも部分的に前記複数の推定された干渉エネルギーに基づいて、複数の干渉ビンに対する値を計算するように構成されている、請求項１９に記載のフィルタ。
前記モルフォロジーフィルタは、少なくとも部分的に前の時間フレームの複数の干渉ビンに対して計算された値に基づいて、発生を検出するように構成されている、請求項３２に記載のフィルタ。
ポストプロセッサをさらに備え、前記ポストプロセッサは、
開始周波数を自動的に決定し、
前記所定の開始周波数から開始して、徐々により高い周波数に対して、徐々により小さい推定された干渉エネルギーを強制するように、前記複数の推定された干渉エネルギーを自動的に修正する
ように構成されている、請求項１９に記載のフィルタ。
前記ポストプロセッサに連結されているポストプロセッサコントローラをさらに備え、前記ポストプロセッサコントローラは、
信号対干渉比（ＳＩＲ）および総干渉対雑音比（ＩＮＲ）のうちの少なくとも１つを自動的に計算し、
前記計算されたＳＩＲおよびＩＮＲのうちの少なくとも１つに基づいて、前記ポストプロセッサが、前記複数の推定された干渉エネルギーを修正する方法に影響を及ぼす演算パラメータを自動的に調節する
ように構成されている、請求項３４に記載のフィルタ。
前記ポストプロセッサに連結されているポストプロセッサコントローラをさらに備え、前記ポストプロセッサコントローラは、
信号対干渉比（ＳＩＲ）および総干渉対雑音比（ＩＮＲ）のうちの少なくとも１つを自動的に計算し、
前記計算されたＳＩＲおよびＩＮＲのうちの少なくとも１つに基づいて、前記開始周波数を自動的に調節する
ように構成されている、請求項３４に記載のフィルタ。
信号中のインパルス性干渉を低減させるためのコンピュータプログラム製品であって、前記コンピュータプログラム製品は、コンピュータ読み取り可能なプログラムコードを記憶している非一過性コンピュータ読み取り可能な媒体を備え、前記コンピュータ読み取り可能なプログラムは、
前記信号の複数の高エネルギー成分を識別するためのプログラムコードであって、前記複数の識別された高エネルギー成分の各々のエネルギーは、所定の閾値を超えている、プログラムコードと、
前記複数の識別された高エネルギー成分の複数の時間導関数を識別するためのプログラムコードと、
前記識別された複数の時間導関数をモルフォロジー的にフィルタリングするためのプログラムコードであって、前記モルフォロジー的にフィルタリングすることは、少なくとも部分的に前記複数の識別された時間導関数に基づいて、前記インパルス性干渉の発生を検出することと、前記信号中の複数の干渉エネルギーを推定することとを含む、プログラムコードと、
前記複数の推定された干渉エネルギーに基づいて、前記信号の一部を抑制するためのプログラムコードと
を含む、コンピュータプログラム製品。