JP2011007861A

JP2011007861A - 信号処理装置、信号処理方法、および信号処理プログラム

Info

Publication number: JP2011007861A
Application number: JP2009148777A
Authority: JP
Inventors: Naoji Matsuo; 直司松尾
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 2009-06-23
Filing date: 2009-06-23
Publication date: 2011-01-13
Anticipated expiration: 2029-06-23
Also published as: DE102010023615A1; US20100322437A1; JP5272920B2; DE102010023615B4; US8638952B2

Abstract

【課題】雑音が低減された信号を生成する。
【解決手段】信号処理装置10は、２つのスペクトル信号の周波数成分間の位相差を求める第１の計算部222と、周波数毎に、スペクトル信号の目的信号らしさ(D(f))を表す値を求めて、目的信号らしさを表す値に基づいて、スペクトル信号の各周波数成分が雑音を表すかどうかを決定する第２の計算部224と、雑音を表すと決定された周波数成分について、前記位相差に基づいて、２つのスペクトル信号のうちの一方のスペクトル信号の各成分を移相して同期化して、同期化されたスペクトル信号を生成し、同期化されたスペクトル信号と２つのスペクトル信号のうちの他方のスペクトル信号とを、減算または加算により合成して、濾波済みスペクトル信号を生成するフィルタ部300と、を具える。
【選択図】図３Ａ

Description

本発明は、音信号の雑音抑圧処理に関し、特に、周波数領域における音信号の雑音抑圧処理に関する。

マイクロホン・アレイは、少なくとも２個のマイクロホンを含むアレイを用い、受音して変換された音信号を処理することによって、受音したい目的音の音源方向に受音範囲を限定しまたは指向性を制御し、雑音抑圧または目的音強調を行うことができる。

既知のマイクロホン・アレイ装置においてＳ／Ｎ（信号対ノイズ）比を向上させるために、複数のマイクロホンからの受音信号の間の時間差に基づいて、指向性を制御し、減算処理または加算処理を行うことによって、目的音の受音方向と異なる方向または抑圧方向から到来する音波中の不要な雑音を抑圧し、目的音の受音方向と同じ方向または強調方向から到来うる音波中の目的音を強調することができる。

既知の或る音声識別装置では、音声電気信号変換部における音声を電気信号に変換する少なくとも第１と第２の音声入力部が発音者の近傍に間隔を置いて配置されている。第１のフィルタが、第１の音声入力部から出力される音声入力信号から予め定めた周波数帯域成分の音声信号を抽出する。第２のフィルタが、第２の音声入力部から出力される音声入力信号から同じ予め定めた周波数帯域成分の音声信号を抽出する。相関関係演算部が、第１と第２のフィルタから抽出された音声信号の相関関係を演算する。音声判別部が、その相関関係演算部からの演算結果に基づいて、その音声電気信号変換部から出力される音声信号がその発音者の発音した音声に基づくものであるかまたは騒音に基づくものであるかを判別する。

既知の自動車に使用される音声認識装置に設けられたマイクロホンの指向特性を制御する或る装置では、平面音波を入力する複数のマイクロホンが直線的に等間隔に配置される。マイクロホン回路が、複数のマイクロホンの出力信号を処理して各マイクロホンに入力する平面音波の位相の相違に基づいて話者の方向に感度がピークとなり且つ騒音の到来する方向に感度がディップとなるようにマイクロホンの指向特性を制御する。

既知の或るズームマイクロホン装置では、収音部が、音波を音声信号に変換し、ズーム制御部が、ズーム位置に対応したズーム位置信号を出力する。指向性制御部が、そのズーム位置信号に基づいてズームマイクロホン装置自体の指向特性を変化させる。推定部が、その収音部によって変換された音声信号に含まれる背景雑音の周波数成分を推定する。雑音抑圧部が、その推定部によるその背景雑音の周波数成分の推定結果に基づいて、そのズーム位置信号に応じて抑圧量を調整しつつ、その背景雑音を抑圧する。望遠時に、その指向性制御部がその目的音を強調するように指向特性を変化させるとともに、その音声信号に含まれる背景雑音が最終的に広角時よりも大きな度合で抑圧される。

特開昭５８−１８１０９９号公報特開平１１−２９８９８８号公報特許第４１３８２９０号

"小特集−マイクロホンアレー−"日本音響学会誌５１巻５号、１９９５、ｐｐ．３８４−４１４

複数の音入力部を有する音信号処理装置では、目的音の受音方向とは逆の方向に抑圧方向が形成できるように、各音信号を時間領域で処理して、各音信号のサンプル遅延および減算を行う。この処理では、その抑圧方向からの雑音は充分に抑圧することができる。しかし、例えば車内の走行雑音および雑踏の雑音などの背景雑音の到来方向が複数ある場合には抑圧方向からの背景雑音の到来方向が複数あり、その方向も時間的に変化し、音入力部の間の特性の差によっても音源方向が変化する。従って、その雑音を充分に抑圧することができない。

本発明の実施形態の目的は、複数方向からの雑音をより低減した信号を生成することである。

本発明の実施形態の一観点によれば、少なくとも２つのマイクロホンで受音した各音信号を周波数領域に変換した２つのスペクトル信号を用いて雑音を抑制する信号処理装置は、周波数毎にその２つのスペクトル信号の周波数成分間の位相差を求める第１の計算部と、周波数毎に、そのスペクトル信号の周波数成分の値に依存する目的信号らしさを表す値を求めて、その目的信号らしさを表す値に基づいて、そのスペクトル信号の各周波数成分が雑音を表すかどうかを決定する第２の計算部と、その第２の計算部によって雑音を表すと決定された周波数成分について、その第１の計算部によって求めたその位相差に基づいて、その２つのスペクトル信号のうちの一方のスペクトル信号の各成分を移相して同期化して、その同期化されたスペクトル信号を生成し、その同期化されたスペクトル信号とその２つのスペクトル信号のうちの他方のスペクトル信号とを、減算または加算により合成して、濾波済みのスペクトル信号を生成するフィルタ部と、を具えている。

本発明の実施形態によれば、複数の方向からの雑音を周波数領域で低減された信号を生成することができる。

図１は、本発明の実施形態において用いられる、それぞれ音入力部としての少なくとも２つのマイクロホンのアレイの配置を示している。図２は、本発明の実施形態による、図１の実際のマイクロホンを含むマイクロホン・アレイ装置の概略的装置構成の一例を示している。図３Ａおよび３Ｂは、図１のマイクロホンのアレイの配置を用いた雑音の抑圧によって雑音を相対的に低減することができるマイクロホン・アレイ装置の概略的装置構成の例を示している。 (図3Aで説明) 図４Ａおよび４Ｂは、目的音らしさがそれぞれ最大および最小の場合における、受音範囲、抑圧範囲および移行範囲の設定状態の例を示している。図５は、ディジタル入力信号のレベルに対する目的音らしさの値の決定の例を表している。図６Ａ〜６Ｃは、図１のマイクロホン・アレイの配置による、異なる値の目的音らしさにおける、位相差計算部によって計算された各周波数に対する位相スペクトル成分の位相差と、受音範囲、抑圧範囲および移行範囲との関係を示している。図７は、メモリに格納されたプログラムに従って図３Ａのディジタル信号プロセッサ（ＤＳＰ）によって実行される複素スペクトルの生成のためのフローチャートを示している。図８Ａおよび８Ｂは、センサ・データまたはキー入力データに基づいて設定された受音範囲、抑圧範囲および移行範囲の設定状態を示している。図７は、メモリに格納されたプログラムに従って図３Ａのディジタル信号プロセッサ（ＤＳＰ）によって実行される複素スペクトルの生成のための別のフローチャートを示している。図１０は、ディジタル入力信号のレベルに対する目的音らしさの値の決定の別の例を示している。

発明の目的および利点は、請求の範囲に具体的に記載された構成要素および組み合わせによって実現され達成される。

前述の一般的な説明および以下の詳細な説明は、典型例および説明のためのものであって、本発明を限定するためのものではない。

本発明の実施形態を、図面を参照して説明する。図面において、同様の構成要素には同じ参照番号が付されている。

図１は、本発明の実施形態において用いられる、それぞれ音入力部としての少なくとも２つのマイクロホンＭＩＣ１、ＭＩＣ２、．．．のアレイの配置を示している。

一般的には、複数のマイクロホンＭＩＣ１、ＭＩＣ２、．．．のアレイが、直線上に互いに既知の距離ｄだけ離して配置される。ここでは、典型例として、隣接する少なくとも２つのマイクロホンＭＩＣ１およびＭＩＣ２が直線上に互いに距離ｄだけ離して配置されているものとする。複数のマイクロホンの隣接間の距離は、等しい必要はなく、以下で説明するようにサンプリング定理を満たせば、既知の異なる距離であってもよい。

実施形態では、複数のマイクロホンの内のマイクロホンＭＩＣ１およびＭＩＣ２の２つのマイクロホンを用いた例について説明する。

図１において、目的音源ＳＳは、マイクロホンＭＩＣ１とＭＩＣ２を結ぶ直線上にあり、目的音源はマイクロホンＭＩＣ１の左側にあり、目的音源ＳＳの方向をマイクロホン・アレイＭＩＣ１、ＭＩＣ２の受音方向または目的方向とする。典型的には、受音目的の音源ＳＳは話者の口であり、受音方向は話者の口の方向である。受音角度方向付近の所定の角度範囲を受音角度範囲Ｒｓとしてもよい。また、受音方向とは逆の方向（＋π）を雑音の主要抑圧方向とし、主要抑圧角度方向付近の所定の角度範囲を雑音の抑圧角度範囲Ｒｎとしてもよい。雑音の抑圧角度範囲Ｒｎは周波数ｆ毎に決定してもよい。

マイクロホンＭＩＣ１とＭＩＣ２の間の距離ｄは、サンプリング定理またはナイキスト定理を満たすように、距離ｄ＜音速ｃ／サンプリング周波数ｆｓの条件を満たすように設定されることが好ましい。図１において、マイクロホン・アレイＭＩＣ１、ＭＩＣ２の指向特性または指向性パターン（例えば、カーディオイド形である単一指向性）が閉じた破線の曲線で示されている。マイクロホン・アレイＭＩＣ１、ＭＩＣ２によって受音され処理される入力音信号は、マイクロホン・アレイＭＩＣ１、ＭＩＣ２が配置された直線に対する音波の入射角度θ（＝−π／２〜＋π／２）に依存し、その直線に垂直な平面上の半径方向の入射方向（０〜２π）には依存しない。

目的音源ＳＳの音または音声は、右側のマイクロホンＭＩＣ２において、その左側のマイクロホンＭＩＣ１よりも遅延時間τ＝ｄ／ｃだけ遅延して検出される。一方、主要抑圧方向の雑音Ｎ１は、左側のマイクロホンＭＩＣ１において、その右側のマイクロホンＭＩＣ２よりも遅延時間τ＝ｄ／ｃだけ遅延して検出される。その主要抑圧方向の抑圧角度範囲Ｒｎ内のずれた抑圧方向の雑音Ｎ２は、左側のマイクロホンＭＩＣ１において、その右側のマイクロホンＭＩＣ２よりも遅延時間τ＝ｄ・sinθ／ｃだけ遅延して検出される。角度θは、想定される抑圧方向の雑音Ｎ２の到来方向である。図１において、一点鎖線は雑音Ｎ２の波面を示している。θ＝＋π／２の場合の雑音Ｎ１の到来方向が入力信号の主要な抑圧方向である。

或るマイクロホン・アレイでは、主要抑圧方向の雑音Ｎ１（θ＝＋π／２）は、左側のマイクロホンＭＩＣ１の入力信号ＩＮ１（ｔ）から、τ＝ｄ／ｃだけ遅延した右側の隣接のマイクロホンＭＩＣ２の入力信号ＩＮ２（ｔ）を減算することによって、抑圧することができる。しかし、そのようなマイクロホン・アレイでは、主要抑圧方向からずれた角度方向（０＜θ＜＋π／２）から到来する雑音Ｎ２を充分に抑圧することはできない。

発明者は、マイクロホンＭＩＣ１、ＭＩＣ２の入力音信号のスペクトルの一方を周波数毎にその２つの入力音信号の位相差に応じてその他方のスペクトルに位相を同期化し、一方と他方のスペクトルの差をとることによって、音信号における抑圧角度範囲Ｒｎの方向の雑音Ｎ２を充分に抑圧することができる、と認識した。また、発明者は、周波数毎にその入力音信号の目的音信号らしさまたは目的音信号の尤度または目的音信号である確からしさを判定し、その判定結果に基づいて抑圧角度範囲Ｒｎを変化させることによって雑音抑圧された音信号における歪みを低減できる、と認識した。

図２は、本発明の実施形態による、図１の実際のマイクロホンＭＩＣ１、ＭＩＣ２を含むマイクロホン・アレイ装置１００の概略的装置構成（configuration）の例を示している。マイクロホン・アレイ装置１００は、マイクロホンＭＩＣ１、ＭＩＣ２、増幅器１２２、１２４、低域通過フィルタ（ＬＰＦ）１４２、１４４、ディジタル信号プロセッサ（ＤＳＰ）２００、および、例えばＲＡＭ等を含むメモリ２０２を具えている。マイクロホン・アレイ装置１００は、例えば音声認識機能を有する車載装置またはカー・ナビゲーション装置、ハンズフリー電話機、または携帯電話機のような情報機器であってもよい。

さらに、マイクロホン・アレイ装置１００は、話者方向検出用センサ１９２および方向決定部１９４に結合されていても、またはそれらの要素を含んでいてもよい。プロセッサ１０およびメモリ１２は、利用アプリケーション４００を含む１つの装置に含まれていても、または別の情報処理装置に含まれていてもよい。

話者方向検出用センサ１９２は、例えば、ディジタル・カメラ、超音波センサまたは赤外線センサであってもよい。代替形態として、方向決定部１９４は、メモリ１２に格納された方向決定用のプログラムに従って動作するプロセッサ１０上で実装されてもよい。

マイクロホンＭＩＣ１、ＭＩＣ２によって音波から変換されたアナログ入力信号ＩＮａ１、ＩＮａ２は、増幅器（Amplifier）１２２、１２４にそれぞれ供給されて、増幅器１２２、１２４によって増幅される。増幅器１２２、１２４の出力の増幅されたアナログ音信号ＩＮａ１、ＩＮａ２は、例えば遮断周波数ｆｃ（例えば、３．９ｋＨｚ）の低域通過フィルタ（Low Pass Filter）１４２、１４４の入力にそれぞれ結合されて、後段のサンプリングのために低域通過濾波される。ここでは、低域通過フィルタのみを用いているが、帯域通過フィルタを用いても、または高域通過フィルタを併用してもよい。

低域通過フィルタ１４２、１４４の出力の濾波済みのアナログ信号ＩＮｐ１、ＩＮｐ２は、サンプリング周波数ｆｓ（例えば、８ｋＨｚ）（ｆｓ＞２ｆｃ）のアナログ−ディジタル変換器１６２、１６４の入力にそれぞれ結合されて、ディジタル入力信号に変換される。アナログ−ディジタル変換器１６２、１６４からの時間領域のディジタル入力信号ＩＮ１（ｔ）、ＩＮ２（ｔ）は、ディジタル信号プロセッサ（ＤＳＰ）２００の入力にそれぞれ結合される。

ディジタル信号プロセッサ２００は、メモリ２０２を用いて、時間領域のディジタル入力信号ＩＮ１（ｔ）、ＩＮ２（ｔ）を、例えばフーリエ変換などによって周波数領域のディジタル入力信号または複素スペクトルＩＮ１（ｆ）、ＩＮ２（ｆ）に変換する。ディジタル信号プロセッサ２００は、さらに、雑音の抑圧角度範囲（以下、単に抑圧範囲という）Ｒｎの方向の雑音Ｎ１、Ｎ２を抑圧するようディジタル入力信号ＩＮ１（ｆ）、ＩＮ２（ｆ）を処理する。ディジタル信号プロセッサ２００は、さらに、処理済みの周波数領域のディジタル入力信号ＩＮｄ（ｆ）を、例えば逆フーリエ変換などによって時間領域のディジタル音信号ＩＮｄ（ｔ）に逆変換して、雑音抑圧済みのディジタル音信号ＩＮｄ（ｔ）を生成する。

本実施形態において、マイクロホン・アレイ装置１００は、例えば音声認識機能を有するカー・ナビゲーション装置のような情報機器への適用をも意識しており、従ってマイクロホン・アレイ装置１００に対する、目的音源ＳＳとなるトライバの音声の到来方向の範囲または最小受音範囲を予め決めてもよい。その音声の到来方向の範囲に近いほど、目的音信号らしさが高いと判定してもよい。

ディジタル信号プロセッサ２００は、ディジタル入力信号ＩＮ１（ｆ）またはＩＮ２（ｆ）の目的音信号らしさＤ（ｆ）が高いと判定された場合は、受音角度範囲または非抑圧角度範囲（以下、単に受音範囲または非抑圧範囲という）Ｒｓを広く設定し、抑圧範囲Ｒｎを狭く設定する。目的音信号らしさは、例えば、目的音声信号らしさまたは目的音声信号の尤度であってもよい。雑音らしさまたは雑音の尤度は、目的音らしさまたは目的音の尤度とは逆の表現である。以下、目的音信号らしさを、単に目的音らしさという。ディジタル信号プロセッサ２００は、さらに、その設定された受音範囲Ｒｓおよび抑圧範囲Ｒｎに基づいて、ディジタル入力信号ＩＮ１（ｆ）またはＩＮ２（ｆ）を処理し、それによって狭い範囲で適度に雑音抑圧されたディジタル音信号ＩＮｄ（ｔ）が生成され得る。

一方、ディジタル信号プロセッサ２００は、ディジタル入力信号ＩＮ１（ｆ）またはＩＮ２（ｆ）の目的音らしさＤ（ｆ）が低くまたは雑音らしさが高いと判定された場合には、受音範囲Ｒｓを狭く設定し、抑圧範囲Ｒｎを広く設定する。ディジタル信号プロセッサ２００は、さらに、その設定された受音範囲Ｒｓおよび抑圧範囲Ｒｎに基づいて、ディジタル入力信号ＩＮ１（ｆ）またはＩＮ２（ｆ）を処理し、それによって広い範囲で充分に雑音抑圧されたディジタル音信号ＩＮｄ（ｔ）が生成され得る。

一般的に、例えば人の音声のような目的音源ＳＳの音を表すディジタル入力信号ＩＮ１（ｆ）は、ディジタル入力信号ＩＮ１（ｆ）の絶対値または振幅の平均値ＡＶ｛｜ＩＮ１（ｆ）｜｝よりも大きい絶対値または振幅を有する。また、一般的に、雑音Ｎ１、Ｎ２のディジタル入力信号ＩＮ１（ｆ）は、ディジタル入力信号ＩＮ１（ｆ）の絶対値または振幅の平均値ＡＶ｛｜ＩＮ１（ｆ）｜｝よりも小さい絶対値または振幅を有する。

ディジタル入力信号ＩＮ１（ｆ）の絶対値または振幅の平均値ＡＶ｛｜ＩＮ１（ｆ）｜｝は、雑音抑圧開始直後は、音信号の受信時間期間が短いので平均値の適用は適当でないことがあるが、この場合、平均値の代わりに或る初期値を用いてもよい。そのような初期値が設定されていない場合は、適切な平均値が求まるまで雑音の抑圧が不安定になることがあり、雑音抑圧が安定するまでに多少の時間を要することがある。

従って、ディジタル入力信号ＩＮ１（ｆ）がディジタル入力信号ＩＮ１（ｆ）の絶対値または振幅の平均値ＡＶ｛｜ＩＮ１（ｆ）｜｝よりも大きい絶対値または振幅を有するときは、ディジタル入力信号ＩＮ１（ｆ）の目的音らしさＤ（ｆ）が高いと推定してもよい。一方、ディジタル入力信号ＩＮ１（ｆ）がディジタル入力信号ＩＮ１（ｆ）の絶対値または振幅の平均値ＡＶ｛｜ＩＮ１（ｆ）｜｝よりも小さい絶対値または振幅を有するときは、ディジタル入力信号ＩＮ１（ｆ）の目的音らしさＤ（ｆ）が低く、雑音らしさが高い、と推定してもよい。ここで、目的音らしさＤ（ｆ）は例えば０≦Ｄ（ｆ）≦１の範囲の値であってもよい。この場合、Ｄ（ｆ）≧０．５の場合は、ディジタル入力信号ＩＮ１（ｆ）は目的音らしさが高く、Ｄ（ｆ）＜０．５の場合は、ディジタル入力信号ＩＮ１（ｆ）は目的音らしさが低く、雑音らしさが高い。但し、目的音らしさＤ（ｆ）の決定は、ディジタル入力信号の絶対値または振幅を用いることに限定されるものではなく、絶対値または振幅の大きさを表す値であればよく、例えば、ディジタル入力信号の絶対値、その絶対値または振幅の２乗の値、またはディジタル入力信号の電力を用いてもよい。

前述のように、ディジタル信号プロセッサ２００は、方向決定部１９４またはプロセッサ１０に結合されていてもよい。この場合、ディジタル信号プロセッサ２００は、方向決定部１９４またはプロセッサ１０からの最小受音範囲Ｒｓｍｉｎを表す情報に基づいて、可変な受音範囲Ｒｓ、抑圧範囲Ｒｎおよび移行範囲Ｒｔを設定し、その抑圧範囲Ｒｎおよび移行範囲Ｒｔ内の抑圧方向の雑音Ｎ１、Ｎ２を抑圧する。最小受音範囲Ｒｓｍｉｎは、目的音源ＳＳの音として処理する最小の受音範囲Ｒｓを表す。最小受音範囲Ｒｓｍｉｎを表すその情報は、例えば、受音範囲Ｒｓと抑圧範囲Ｒｎの間の角度境界θｔｂの最小値θｔｂ_ｍｉｎであってもよい。

方向決定部１９４またはプロセッサ１０は、ユーザによるキー入力によって入力された設定信号を処理して最小受音範囲Ｒｓｍｉｎを表す情報を生成してもよい。また、方向決定部１９４またはプロセッサ１０は、センサ１９２によって捕捉された検出データまたは画像データに基づいて、話者の存在を検出しまたは認識して、話者の存在する方向を決定し、最小受音範囲Ｒｓｍｉｎを表す情報を生成してもよい。

ディジタル音信号ＩＮｄ（ｔ）の出力は、例えば、音声認識または携帯電話機の通話に用いられる。ディジタル音信号ＩＮｄ（ｔ）は、後続の利用アプリケーション４００に供給され、そこで、例えば、ディジタル−アナログ変換器４０４でディジタル−アナログ変換され低域通過フィルタ４０６で低域通過濾波されてアナログ信号が生成され、またはメモリ４１４に格納されて音声認識部４１６で音声認識に使用される。音声認識部４１６は、ハードウェアとして実装されたプロセッサであっても、またはソフトウェアとして実装された例えばＲＯＭおよびＲＡＭを含むメモリ４１４に格納されたプログラムに従って動作するプロセッサであってもよい。

ディジタル信号プロセッサ２００は、ハードウェアとして実装された信号処理回路であっても、またはソフトウェアとして実装された例えばＲＯＭおよびＲＡＭを含むメモリ２０２に格納されたプログラムに従って動作する信号処理回路であってもよい。

図１において、マイクロホン・アレイ装置１００は、目的音源ＳＳの方向θ（＝−π／２）付近の角度範囲、例えば−π／２≦θ＜−π／１２を受音範囲または非抑圧範囲Ｒｓとする。また、マイクロホン・アレイ装置１００は、主要抑圧方向θ＝＋π／２付近の角度範囲、例えば＋π／１２＜θ≦＋π／２を抑圧範囲Ｒｎとしてもよい。また、マイクロホン・アレイ装置１００は、受音範囲Ｒｓと抑圧範囲Ｒｎの間の角度範囲Ｒｔ、例えば−π／１２≦θ≦＋π／１２を移行（切換）角度範囲Ｒｔ（以下、単に移行範囲Ｒｔという）としてもよい。

図３Ａおよび３Ｂは、図１のマイクロホンＭＩＣ１、ＭＩＣ２のアレイの配置を用いた雑音の抑圧によって雑音を相対的に低減することができるマイクロホン・アレイ装置１００の概略的装置構成（configuration）の例を示している。

ディジタル信号プロセッサ２００は、アナログ−ディジタル変換器１６２、１６４の出力に入力が結合された高速フーリエ変換器２１２、２１４、目的音らしさ判定部２１８、同期化係数生成部２２０、およびフィルタ部３００を含んでいる。この実施形態では、周波数変換または直交変換に、高速フーリエ変換を用いたが、他の周波数変換可能な関数（例えば、離散コサイン変換またはウェーブレット変換、等）を用いてもよい。

同期化係数生成部２２０は、例えば可聴周波数帯域のような或る周波数帯域の各周波数ｆ（０＜ｆ＜ｆｓ／２）の複素スペクトル間の位相差を計算する位相差計算部２２２、および同期化係数計算部２２４を含んでいる。フィルタ部３００は、同期化部３３２および減算部３３４を含んでいる。減算器３３４の代わりに、等価回路として、入力値を反転する符号反転器とその符号反転器に結合された加算器とを用いてもよい。代替形態として、目的音らしさ判定部２１８は、同期化係数生成部２２０に含まれていても、または同期化係数生成部２２０に含まれていてもよい。

目的音らしさ判定部２１８は、１つの高速フーリエ変換器２１２の出力に入力が結合されており、高速フーリエ変換器２１２からの複素スペクトルＩＮ１（ｆ）の絶対値または振幅に応じて、目的音らしさまたは目的音の尤度Ｄ（ｆ）を生成して同期化係数生成部２２０に供給する。目的音らしさＤ（ｆ）は、例えば、０≦Ｄ（ｆ）≦１の範囲の値であり、複素スペクトルＩＮ１（ｆ）の目的音らしさが最大の場合にＤ（ｆ）＝１の値を有する。この場合、目的音らしさまたは目的音の尤度Ｄ（ｆ）は、複素スペクトルＩＮ１（ｆ）の目的音らしさが最小の場合またはその雑音らしさが最大の場合にＤ（ｆ）＝０の値を有する。

図４Ａおよび４Ｂは、目的音らしさＤ（ｆ）がそれぞれ最大および最小の場合における、受音範囲または非抑圧範囲Ｒｓ、抑圧範囲Ｒｎおよび移行範囲Ｒｔの設定状態の例を示している。

目的音らしさＤ（ｆ）が最大（＝１）の場合は、同期化係数計算部２２４は、後で説明する同期化係数を求めるために、図４Ａに示されているように、受音範囲Ｒｓを最大受音範囲Ｒｓｍａｘに設定し、抑圧範囲Ｒｎを最小抑圧範囲Ｒｎｍｉｎに設定し、移行範囲Ｒｔをその間に設定する。最大受音範囲Ｒｓｍａｘは、例えば−π／２≦θ＜０の角度θの範囲に設定される。最小抑圧範囲Ｒｎｍｉｎは、例えば＋π／６＜θ≦＋π／２の角度θの範囲に設定される。移行範囲Ｒｔは、例えば０≦θ≦＋π／６の角度θの範囲に設定される。

目的音らしさＤ（ｆ）が最小（＝０）の場合は、同期化係数計計算部２２４は、図４Ｂに示されているように、受音範囲Ｒｓを最小受音範囲Ｒｓｍｉｎに設定し、抑圧範囲Ｒｎを最大抑圧範囲Ｒｎｍａｘに設定し、移行範囲Ｒｔをその間に設定する。最小受音範囲Ｒｓｍｉｎは、例えば−π／２≦θ＜−π／６の角度θの範囲に設定される。最大抑圧範囲Ｒｎｍａｘθは、例えば０＜θ≦＋π／２の角度の範囲に設定される。移行範囲Ｒｔは、例えば−π／６≦θ≦０の角度θの範囲に設定される。

目的音らしさＤ（ｆ）が最大値と最小値の間の値（０＜Ｄ（ｆ）＜１）の場合は、同期化係数計計算部２２４は、図１に示されているように、目的音らしさＤ（ｆ）の値に応じて、受音範囲Ｒｓおよび抑圧範囲Ｒｎを設定し、移行範囲Ｒｔをその間に設定する。この場合、目的音らしさＤ（ｆ）が大きくなるに従って目的音らしさＤ（ｆ）に比例して、受音範囲Ｒｓがより大きくなり、抑圧範囲Ｒｎがより小さくなる。例えば、目的音らしさＤ（ｆ）＝０．５に対して、受音範囲Ｒｓは、例えば−π／２≦θ＜−π／１２の角度θの範囲に設定され、抑圧範囲Ｒｎは、例えば＋π／１２＜θ≦＋π／２の角度θの範囲に設定される。この場合、移行範囲Ｒｔは、例えば−π／１２≦θ≦＋π／１２の角度θの範囲に設定される。

目的音らしさ判定部２１８は、例えば、高速フーリエ変換における時間的分析フレーム（窓）ｉ毎の複素スペクトルＩＮ１（ｆ）の絶対値｜ＩＮ１（ｆ，ｉ）｜の時間的平均値ＡＶ｛｜ＩＮ１（ｆ）｜｝を順次計算してもよい。ここで、ｉは分析フレームの時間的順序番号（０、１、２、．．．）を表す。
初期順序番号ｉ＝０に対して、
ＡＶ｛｜ＩＮ１（ｆ，ｉ）｜｝＝｜ＩＮ１（ｆ，ｉ）｜
順序番号ｉ＞０に対して、
ＡＶ｛｜ＩＮ１（ｆ，ｉ）｜｝
＝βＡＶ｛｜ＩＮ１（ｆ，ｉ−１）｜｝＋（１−β）｜ＩＮ１（ｆ，ｉ）｜
ここで、係数βは、平均値ＡＶ｛｜ＩＮ１（ｆ）｜｝を求めるための、前の分析フレームの平均値ＡＶ｛｜ＩＮ１（ｆ，ｉ−１）｜｝と現在の分析フレームの平均値ＡＶ｛｜ＩＮ１（ｆ，ｉ）｜｝の重み付けの割合を表し、０≦β＜１の範囲の予め設定された値である。
最初の数個の順序番号ｉ＝０〜ｍ（ｍ＜１以上の或る整数）に対して、次の固定値ＩＮｃを使用してもよい。
ＡＶ｛｜ＩＮ１（ｆ，ｉ）｜｝＝ＩＮｃ
固定値ＩＮｃは経験的に決定してもよい。

目的音らしさ判定部２１８は、複素スペクトルＩＮ１（ｆ）の絶対値をその絶対値の時間的平均値で除した、次の式で表される平均値に対する相対的レベルγを求める。
γ＝｜ＩＮ１（ｆ，ｉ）｜／ＡＶ｛｜ＩＮ１（ｆ，ｉ）｜｝
目的音らしさ判定部２１８は、複素スペクトルＩＮ１（ｆ）の目的音らしさＤ（ｆ）をレベルγに応じて決定する。代替形態として、複素スペクトルＩＮ１（ｆ）の絶対値｜ＩＮ１（ｆ，ｉ）｜の代わりに、その絶対値の２乗の値｜ＩＮ１（ｆ，ｉ）｜^２を用いてもよい。

図５は、ディジタル入力信号のレベルγに対する目的音らしさＤ（ｆ）の値の決定の例を示している。例えば、複素スペクトルＩＮ１（ｆ）の絶対値の相対的レベルγが或る閾値γ１（例えば、γ１＝０．７）以下の場合には、音声らしさ判定部２１８は目的音らしさＤ（ｆ）＝０と設定する。例えば、複素スペクトルＩＮ１（ｆ）の絶対値の相対的レベルγが別の閾値γ２（＞γ１）（例えば、γ２＝１．４）以上の場合には、音声らしさ判定部２１８は目的音らしさＤ（ｆ）＝１と設定する。例えば、複素スペクトルＩＮ１（ｆ）の絶対値の相対的レベルγが２つの閾値γ１とγ２の間の値（γ１＜γ＜γ２）である場合には、音声らしさ判定部２１８、比例配分により、目的音らしさＤ（ｆ）＝（γ−γ１）／（γ２−γ１）と決定する。相対的レベルγに対する目的音らしさＤ（ｆ）の関係は、図５に限定されることなく、例えばシグモイド関数のような、相対的レベルγが増大するに従って目的音らしさＤ（ｆ）が単調に増大する関係であってもよい。

図１０は、ディジタル入力信号のレベルγに対する目的音らしさＤ（ｆ）の値の決定の別の例を示している。図１０において、音源方向を示す位相スペクトル差ＤＩＦＦ（ｆ）に基づいて、目的音らしさＤ（ｆ）の値を決定する例を示している。ここでは，音源方向を示す位相スペクトル差ＤＩＦＦ（ｆ）が、例えばカー・ナビゲーションなどのアプリケーションに合せて予想される話者方向に近いほど、目的音らしさＤ（ｆ）が高くなるようにしている。なお、各閾値σ１〜σ４は、予想される話者方向に合せて設定する値であり、図１に示すようにマイクの並び方向に目的音源がある場合、例えば、σ１＝−０．２ｆπ／（ｆｓ／２）、σ２＝−０．４ｆπ／（ｆｓ／２）、σ３＝０．２ｆπ（ｆｓ／２）、σ４＝０．４ｆπ（ｆｓ／２）、とすればよい。

図１、図４Ａおよび４Ｂを参照すると、音声らしさ判定部２１８からの目的音らしさＤ（ｆ）＞０かつＤ（ｆ）＜１に対して、同期化係数計算部２２４は、図１の受音範囲Ｒｓ、抑圧範囲Ｒｎおよび移行範囲Ｒｔを設定する。音声らしさ判定部２１８からの目的音らしさＤ（ｆ）＝１に対して、同期化係数計算部２２４は、図４Ａの受音範囲Ｒｓ＝Ｒｓｍａｘ、抑圧範囲Ｒｎ＝Ｒｎｍｉｎおよび移行範囲Ｒｔを設定する。音声らしさ判定部２１８からの目的音らしさＤ（ｆ）＝０に対して、同期化係数計算部２２４は、図４Ｂの受音範囲Ｒｓ＝Ｒｓｍｉｎ、抑圧範囲Ｒｎ＝Ｒｎｍａｘおよび移行範囲Ｒｔを設定する。

移行範囲Ｒｔと抑圧範囲Ｒｎの間の角度境界θｔａは、θｔａ_ｍｉｎ≦θｔａ≦θｔａ_ｍａｘの範囲の値である。ここで、θｔａ_ｍｉｎはθｔａの最小値を表し、例えばθｔａ_ｍｉｎ＝０ラジアンであり、θｔａ_ｍａｘはθｔａの最大値を表し、例えばθｔａ_ｍａｘ＝＋π／６である。角度境界θｔａは、目的音らしさＤ（ｆ）に対して、比例配分により、θｔａ＝θｔａ_ｍｉｎ＋（θｔａ_ｍａｘ−θｔａ_ｍｉｎ）Ｄ（ｆ）で表される。

移行範囲Ｒｔと受音範囲Ｒｓの間の角度境界θｔｂは、θｔａ＞θｔｂを満たし、θｔｂ_ｍｉｎ≦θｔｂ≦θｔｂ_ｍａｘの範囲の値である。ここで、θｔｂ_ｍｉｎはθｔｂの最小値を表し、例えばθｔｂ_ｍｉｎ＝−π／６であり、θｔｂ_ｍａｘはθｔｂの最大値を表し、例えばθｔｂ_ｍａｘ＝０ラジアンである。角度境界θｔｂは、目的音らしさＤ（ｆ）に対して、比例配分により、θｔｂ＝θｔｂ_ｍｉｎ＋（θｔｂ_ｍａｘ−θｔｂ_ｍｉｎ）Ｄ（ｆ）で表される。

アナログ−ディジタル変換器１６２、１６４からの時間領域のディジタル入力信号ＩＮ１（ｔ）、ＩＮ２（ｔ）は、高速フーリエ変換器（ＦＦＴ）２１２、２１４の入力にそれぞれ供給される。高速フーリエ変換器２１２、２１４は、既知の形態で、ディジタル入力信号ＩＮ１（ｔ）、ＩＮ２（ｔ）の各信号区間に、オーバラップ窓関数を乗算してその積をフーリエ変換または直交変換して、周波数領域の複素スペクトルＩＮ１（ｆ）、ＩＮ２（ｆ）を生成する。ここで、ＩＮ１（ｆ）＝Ａ_１ｅ^{ｊ（２πｆｔ＋φ１（ｆ））}、ＩＮ２（ｆ）＝Ａ_２ｅ^{ｊ（２πｆｔ＋φ２（ｆ））}、ｆは周波数、Ａ_１およびＡ_２は振幅、ｊは単位虚数、φ１（ｆ）およびφ２（ｆ）は周波数ｆの関数である遅延位相である。オーバラップ窓関数として、例えば、ハミング窓関数、ハニング窓関数、ブラックマン窓関数、３シグマガウス窓関数、または三角窓関数を用いることができる。

位相差計算部２２２は、距離ｄだけ離れた隣接の２つのマイクロホンＭＩＣ１とＭＩＣ２の間での周波数ｆ（０＜ｆ＜ｆｓ／２）毎の音源方向を示す位相スペクトル成分の位相差ＤＩＦＦ（ｆ）（ラジアン、ｒａｄ）を次の式で求める。
ＤＩＦＦ（ｆ）
＝ｔａｎ^−１（Ｊ｛ＩＮ２（ｆ）／ＩＮ１（ｆ）｝／Ｒ｛ＩＮ２（ｆ）／ＩＮ１（ｆ）｝）
ここで、特定の周波数ｆに対応する音源は１つの音源しかないものと近似する。Ｊ｛ｘ｝は複素数ｘの虚数成分を表し、Ｒ｛ｘ｝は複素数ｘの実数成分を表す。
この位相差ＤＩＦＦ（ｆ）をディジタル入力信号ＩＮ１（ｔ）、ＩＮ２（ｔ）の遅延位相（φ１（ｆ）、φ２（ｆ））で表現すると、次のようになる。
ＤＩＦＦ（ｆ）＝ｔａｎ^−１（Ｊ｛（Ａ_２ｅ^{ｊ（２πｆｔ＋φ２（ｆ））}／Ａ_１ｅ^{ｊ（２πｆｔ＋φ１（ｆ））}｝／Ｒ｛（Ａ_２ｅ^{ｊ（２πｆｔ＋φ２（ｆ））}／Ａ_１ｅ^{ｊ（２πｆｔ＋φ１（ｆ））}｝）
＝ｔａｎ^−１（Ｊ｛（Ａ_２／Ａ_１）ｅ^{ｊ（φ２（ｆ）−φ１（ｆ））}｝／Ｒ｛（Ａ_２／Ａ_１）ｅ^{ｊ（φ２（ｆ）−φ１（ｆ））}｝）
＝ｔａｎ^−１（Ｊ｛ｅ^{ｊ（φ２（ｆ）−φ１（ｆ））}｝／Ｒ｛ｅ^{ｊ（φ２（ｆ）−φ１（ｆ））}｝）
＝ｔａｎ^−１（ｓｉｎ（φ２（ｆ）−φ１（ｆ））／ｃｏｓ（φ２（ｆ）−φ１（ｆ）））
＝ｔａｎ^−１（ｔａｎ（φ２（ｆ）−φ１（ｆ））
＝φ２（ｆ）−φ１（ｆ）

位相差計算部２２２は、隣接する２つの入力信号ＩＮ１（ｆ）、ＩＮ２（ｆ）の間の周波数ｆ毎の位相スペクトル成分の位相差ＤＩＦＦ（ｆ）の値を同期化係数計算部２２４に供給する。

図６Ａ〜６Ｃは、図１のマイクロホン・アレイＭＩＣ１およびＭＩＣ２の配置による、異なる目的音らしさＤ（ｆ）における、位相差計算部２２２によって計算された各周波数ｆに対する位相スペクトル成分の位相差ＤＩＦＦ（ｆ）と、受音範囲Ｒｓ、抑圧範囲Ｒｎおよび移行範囲Ｒｔとの関係を示している。

図６Ａ〜６Ｃにおいて、一次関数ａｆは、受音範囲Ｒｓと移行範囲Ｒｔの間の角度境界線θｔａに対応する位相差ＤＩＦＦ（ｆ）の境界線を表す。ここで、周波数ｆは０＜ｆ＜ｆｓ／２の範囲の値であり、ａは周波数ｆの係数であり、係数ａは最小値ａ_ｍｉｎと最大値ａ_ｍａｘの間の値（−２π／ｆｓ＜ａ_ｍｉｎ≦ａ≦ａ_ｍａｘ＜＋２π／ｆｓ）の範囲の値である。一次関数ｂｆは、抑圧範囲Ｒｎと移行範囲Ｒｔの間の角度境界線θｔｂに対応する位相差ＤＩＦＦ（ｆ）の境界線を表す。ここで、ｂは周波数ｆの係数であり、係数ｂは最小値ｂ_ｍｉｎと最大値ｂ_ｍａｘの間の値（−２π／ｆｓ＜ｂ_ｍｉｎ≦ｂ≦ｂ_ｍａｘ＜＋２π／ｆｓ）の範囲の値である。係数ａおよびｂはａ＞ｂの関係を満たす。

図６Ａの関数ａ_ｍａｘｆは、図４Ａの角度境界θｔａ_ｍａｘに対応する。図６Ａの関数ａ_ｍｉｎｆは、図４Ａの角度境界θｔａ_ｍｉｎに対応する。図６Ｃの関数ｂ_ｍａｘｆは、図４Ｂの角度境界θｔｂ_ｍａｘに対応する。図６Ｃの関数ｂ_ｍｉｎｆは、図４Ｂの角度境界θｔｂ_ｍｉｎに対応する。

図６Ａを参照すると、目的音らしさＤ（ｆ）が最大（１）の場合、受音範囲Ｒｓ＝Ｒｓｍａｘは、最大の位相差範囲−２πｆ／ｆｓ≦ＤＩＦＦ（ｆ）＜ｂ_ｍａｘｆに対応する。この場合、抑圧範囲Ｒｎ＝Ｒｎｍｉｎは、最小の位相差範囲ａ_ｍａｘｆ＜ＤＩＦＦ（ｆ）≦＋２πｆ／ｆｓに対応する。さらに、移行範囲Ｒｔは、その間の位相差範囲ｂ_ｍａｘｆ≦ＤＩＦＦ（ｆ）≦ａ_ｍａｘｆに対応する。例えば、係数ａの最大値はａ_ｍａｘ＝＋２π／３ｆｓであり、係数ｂの最大値はｂ_ｍａｘ＝０である。

図６Ｃを参照すると、目的音らしさＤ（ｆ）が最小（０）の場合、受音範囲Ｒｓ＝Ｒｓｍｉｎは、最小の位相差範囲−２πｆ／ｆｓ≦ＤＩＦＦ（ｆ）＜ｂ_ｍｉｎｆに対応する。この場合、抑圧範囲Ｒｎ＝Ｒｎｍａｘは、最大の位相差範囲ａ_ｍｉｎｆ＜ＤＩＦＦ（ｆ）≦＋２πｆ／ｆｓに対応する。さらに、移行範囲Ｒｔは、その間の位相差範囲ｂ_ｍｉｎｆ≦ＤＩＦＦ（ｆ）≦ａ_ｍｉｎｆに対応する。例えば、係数ａの最小値はａ_ｍｉｎ＝０であり、係数ｂの最小値はｂ_ｍｉｎ＝−２π／３ｆｓである。

図６Ｂを参照すると、目的音らしさＤ（ｆ）が最大値と最小値の間の値（０＜Ｄ（ｆ）＜１）の場合、受音範囲Ｒｓは、中間の位相差範囲−２πｆ／ｆｓ≦ＤＩＦＦ（ｆ）＜ｂｆに対応する。この場合、抑圧範囲Ｒｎは、中間の位相差範囲ａｆ＜ＤＩＦＦ（ｆ）≦＋２πｆ／ｆｓに対応する。さらに、移行範囲Ｒｔは、その間の位相差範囲ｂｆ≦ＤＩＦＦ（ｆ）≦ａｆに対応する。

周波数ｆの係数ａは、目的音らしさＤ（ｆ）に対して、比例配分により、ａ＝ａ_ｍｉｎ＋（ａ_ｍａｘ−ａ_ｍｉｎ）Ｄ（ｆ）で表される。周波数ｆの係数ｂは、目的音らしさＤ（ｆ）に対して、比例配分により、ｂ＝ｂ_ｍｉｎ＋（ｂ_ｍａｘ−ｂ_ｍｉｎ）Ｄ（ｆ）で表される。

図６Ａ〜６Ｃにおいて、位相差ＤＩＦＦ（ｆ）が抑圧範囲Ｒｎに対応する範囲に位置する場合には、同期化係数計算部２２４は、ディジタル入力信号ＩＮ１（ｆ）、ＩＮ２（ｆ）に対して雑音抑圧のための処理を行う。位相差ＤＩＦＦ（ｆ）が移行範囲Ｒｔに対応する範囲に位置する場合には、同期化係数計算部２２４は、ディジタル入力信号ＩＮ１（ｆ）、ＩＮ２（ｆ）に対して周波数ｆおよび位相差ＤＩＦＦ（ｆ）に応じて低減された雑音抑圧のための処理を行う。位相差ＤＩＦＦ（ｆ）が受音範囲Ｒｓに対応する範囲に位置する場合には、同期化係数計算部２２４は、ディジタル入力信号ＩＮ１（ｆ）、ＩＮ２（ｆ）に対して雑音抑圧のための処理を行わない。

同期化係数計算部２２４は、特定の周波数ｆについて、マイクロホンＭＩＣ１の位置における入力信号中の抑圧範囲Ｒｎ内の角度θ（例えば、＋π／１２＜θ≦＋π／２）の雑音は、マイクロホンＭＩＣ２の入力信号中の同じ雑音が位相差ＤＩＦＦ（ｆ）だけ遅れて到達したものである、と推定する。また、同期化係数計算部２２４は、マイクロホンＭＩＣ１の位置における移行範囲Ｒｔ内の角度θ（例えば、−π／１２≦θ≦＋π／１２）では、受音範囲Ｒｓにおける処理法と抑圧範囲Ｒｎにおける雑音抑圧処理レベルを徐々に変化させまたは切り換える。

同期化係数計算部２２４は、周波数ｆ毎の位相スペクトル成分の位相差ＤＩＦＦ（ｆ）に基づいて、次の式に従って同期化係数Ｃ（ｆ）を計算する。

（ａ）同期化係数計算部２２４は、高速フーリエ変換における時間的分析フレーム（窓）ｉ毎の同期化係数Ｃ（ｆ）を順次計算する。ｉは分析フレームの時間的順序番号（０、１、２、．．．）を表す。位相差ＤＩＦＦ（ｆ）が抑圧範囲Ｒｎ内の角度θ（例えば、＋π／１２＜θ≦＋π／２）に対応する位相差の値である場合の同期化係数Ｃ（ｆ，ｉ）＝Ｃｎ（ｆ，ｉ）：
初期順序番号ｉ＝０に対して、
Ｃ（ｆ，０）＝Ｃｎ（ｆ，０）
＝ＩＮ１（ｆ，０）／ＩＮ２（ｆ，０）
順序番号ｉ＞０に対して、
Ｃ（ｆ，ｉ）＝Ｃｎ（ｆ，ｉ）
＝αＣ（ｆ，ｉ−１）＋（１−α）ＩＮ１（ｆ，ｉ）／ＩＮ２（ｆ，ｉ）

ここで、ＩＮ１（ｆ，ｉ）／ＩＮ２（ｆ，ｉ）は、マイクロホンＭＩＣ２の入力信号の複素スペクトルに対するマイクロホンＭＩＣ１の入力信号の複素スペクトルの比、即ち振幅比と位相差を表している。また、ＩＮ１（ｆ，ｉ）／ＩＮ２（ｆ，ｉ）は、マイクロホンＭＩＣ１の入力信号の複素スペクトルに対するマイクロホンＭＩＣ２の入力信号の複素スペクトルの比の逆数を表しているともいえる。αは、同期化のための前の分析フレームの遅延移相量の加算割合または合成割合を示し、０≦α＜１の範囲の定数である。１−αは、同期化のための加算される現在の分析フレームの遅延移相量の合成割合を示す。現在の同期化係数Ｃ（ｆ，ｉ）は、前の分析フレームの同期化係数と現在の分析フレームのマイクロホンＭＩＣ２に対するマイクロホンＭＩＣ１の入力信号の複素スペクトルの比を、比率α：（１−α）で加算したものである。

（ｂ）位相差ＤＩＦＦ（ｆ）が受音範囲Ｒｓ内の角度θ（例えば、−π／２≦θ＜−π／１２）に対応する位相差の値である場合の同期化係数Ｃ（ｆ）＝Ｃｓ（ｆ）：
Ｃ（ｆ）＝Ｃｓ（ｆ）＝ｅｘｐ（−ｊ２πｆ／ｆｓ）または
Ｃ（ｆ）＝Ｃｓ（ｆ）＝０（同期化減算しない場合）

（ｃ）位相差ＤＩＦＦ（ｆ）が移行範囲Ｒｔ内の角度θ（例えば、−π／１２≦θ≦＋π／１２）に対応する位相差の値である場合の同期化係数Ｃ（ｆ）＝Ｃｔ（ｆ）は、角度θに応じて上記（ａ）のＣｓ（ｆ）とＣｎ（ｆ）の加重平均：
Ｃ（ｆ）＝Ｃｔ（ｆ）
＝Ｃｓ（ｆ）×（θ−θｔｂ）／（θｔａ−θｔｂ）
＋Ｃｎ（ｆ）×（θｔａ−θ）／（θｔａ−θｔｂ）
ここで、θｔａは移行範囲Ｒｔと抑圧範囲Ｒｎの間の境界の角度を表し、θｔｂは移行範囲Ｒｔと受音範囲Ｒｓの間の境界の角度を表す。

このようにして、位相差計算部２２２は、複素スペクトルＩＮ１（ｆ）およびＩＮ２（ｆ）に応じて同期化係数Ｃ（ｆ）を生成して、複素スペクトルＩＮ１（ｆ）およびＩＮ２（ｆ）、および同期化係数Ｃ（ｆ）をフィルタ部３００に供給する。

図３Ｂを参照すると、フィルタ部３００において、同期化部３３２は、次の式の乗算の計算を行って複素スペクトルＩＮ２（ｆ）を複素スペクトルＩＮ１（ｆ）に同期化して、同期化されたスペクトルＩＮｓ２（ｆ）を生成する。
ＩＮｓ２（ｆ）＝Ｃ（ｆ）×ＩＮ２（ｆ）

減算部３３４は、次の式に従って複素スペクトルＩＮ１（ｆ）から、係数δ（ｆ）を乗じた複素スペクトルＩＮｓ２（ｆ）を減算して、雑音が抑圧された複素スペクトルＩＮｄ（ｆ）を生成する。
ＩＮｄ（ｆ）＝ＩＮ１（ｆ）−δ（ｆ）×ＩＮｓ２（ｆ）
ここで、係数δ（ｆ）は０≦δ（ｆ）≦１の範囲の予め設定される値である。係数δ（ｆ）は、周波数ｆの関数であり、同期化係数に依存するスペクトルＩＮｓ２（ｆ）の減算の度合いを調整するための係数である。例えば、受音範囲Ｒｓから到来した音を表す音信号の歪みの発生を抑えつつ、抑圧範囲Ｒｎから到来した音を表す雑音を大きく抑圧するために、位相差ＤＩＦＦ（ｆ）によって表される音の到来方向が抑圧範囲Ｒｎにある場合の方が受音範囲Ｒｓにある場合よりも大きくなるように係数δ（ｆ）を設定してもよい。

ディジタル信号プロセッサ２００は、さらに逆高速フーリエ変換器（ＩＦＦＴ）３８２を含んでいる。逆高速フーリエ変換器３８２は、同期化係数計算部２２４からスペクトルＩＮｄ（ｆ）を受け取って逆フーリエ変換して、オーバラップ加算し、マイクロホンＭＩＣ１の位置における時間領域のディジタル音信号ＩＮｄ（ｔ）を生成する。

逆高速フーリエ変換器３８２の出力は、後段に位置する利用アプリケーション４００の入力に結合される。

ディジタル音信号ＩＮｄ（ｔ）の出力は、例えば、音声認識または携帯電話機の通話に用いられる。ディジタル音信号ＩＮｄ（ｔ）は、後続の利用アプリケーション４００に供給され、そこで、例えば、ディジタル−アナログ変換器４０４でディジタル−アナログ変換され低域通過フィルタ４０６で低域通過濾波されてアナログ信号が生成され、またはメモリ４１４に格納されて音声認識部４１６で音声認識に使用される。

図３Ａおよび３Ｂの要素２１２、２１４、２１８、２２０〜２２４、３００〜３３４および３８２は、集積回路として実装されたまたはプログラムで実装されたディジタル信号プロセッサ（ＤＳＰ）２００によって実行されるフロー図と見ることもできる。

図７は、メモリ２０２に格納されたプログラムに従って図３Ａのディジタル信号プロセッサ（ＤＳＰ）２００によって実行される複素スペクトルの生成のためのフローチャートを示している。従って、このフローチャートは、図３Ａの要素２１２、２１４、２１８、２２０、３００および３８２によって実現される機能に対応する。

図３Ａおよび７を参照すると、ステップ５０２において、ディジタル信号プロセッサ２００（高速フーリエ変換部２１２、２１４）は、アナログ−ディジタル変換器１６２、１６４から供給された時間領域の２つのディジタル入力信号ＩＮ１（ｔ）およびＩＮ２（ｔ）をそれぞれ入力し捕捉する。

ステップ５０４において、ディジタル信号プロセッサ２００（高速フーリエ変換部２１２、２１４）は、２つのディジタル入力信号ＩＮ１（ｔ）およびＩＮ２（ｔ）の各々にオーバラップ窓関数を乗算する。

ステップ５０６において、ディジタル信号プロセッサ２００（高速フーリエ変換部２１２、２１４）は、ディジタル入力信号ＩＮ１（ｔ）およびＩＮ２（ｔ）をフーリエ変換して周波数領域の複素スペクトルＩＮ１（ｆ）およびＩＮ２（ｆ）を生成する。

ステップ５０８において、ディジタル信号プロセッサ２００（同期化係数生成部２２０の位相差計算部２２２）は、スペクトルＩＮ１（ｆ）とＩＮ２（ｆ）の間の位相差：
ＤＩＦＦ（ｆ）
＝ｔａｎ^−１（Ｊ｛ＩＮ２（ｆ）／ＩＮ１（ｆ）｝／Ｒ｛ＩＮ２（ｆ）／ＩＮ１（ｆ）｝）
を計算する。

ステップ５０９において、ディジタル信号プロセッサ２００（目的音らしさ判定部２１８）は、高速フーリエ変換器２１２からの複素スペクトルＩＮ１（ｆ）の絶対値または振幅に応じて、目的音らしさＤ（ｆ）（０≦Ｄ（ｆ）≦１）を生成して同期化係数生成部２２０に供給する。ディジタル信号プロセッサ２００（同期化係数生成部２２０の同期化係数計算部２２４）は、目的音らしさＤ（ｆ）の値および最小受音範囲Ｒｓｍｉｎを表す情報に従って、周波数ｆ毎に、受音範囲Ｒｓ（−２πｆ／ｆｓ≦ＤＩＦＦ（ｆ）＜ｂｆ）、抑圧範囲Ｒｎ（ａｆ＜ＤＩＦＦ（ｆ）≦＋２πｆ／ｆｓ）、および移行範囲Ｒｔ（ｂｆ≦ＤＩＦＦ（ｆ）≦ａｆ）を設定する。

ステップ５１０において、ディジタル信号プロセッサ２００（同期化係数生成部２２０の同期化係数計算部２２４）は、位相差ＤＩＦＦ（ｆ）に基づいて、マイクロホンＭＩＣ２の入力信号に対するマイクロホンＭＩＣ１の入力信号の複素スペクトルの比Ｃ（ｆ）を前述のように次の式に従って計算する。

（ａ）位相差ＤＩＦＦ（ｆ）が抑圧角度範囲Ｒｎ内の角度θに対応する値である場合、同期化係数Ｃ（ｆ，ｉ）＝Ｃｎ（ｆ，ｉ）＝αＣ（ｆ，ｉ−１）＋（１−α）ＩＮ１（ｆ，ｉ）／ＩＮ２（ｆ，ｉ）。
（ｂ）位相差ＤＩＦＦ（ｆ）が受音角度範囲Ｒｓ内の角度θに対応する値である場合、同期化係数Ｃ（ｆ）＝Ｃｓ（ｆ）＝ｅｘｐ（−ｊ２πｆ／ｆｓ）またはＣ（ｆ）＝Ｃｓ（ｆ）＝０。
（ｃ）位相差ＤＩＦＦ（ｆ）が移行角度範囲Ｒｔ内の角度θに対応する値である場合、同期化係数Ｃ（ｆ）＝Ｃｔ（ｆ）、Ｃｓ（ｆ）とＣｎ（ｆ）の加重平均。

ステップ５１４において、ディジタル信号プロセッサ２００（フィルタ部３００の同期化部３３２）は、式：ＩＮｓ２（ｆ）＝Ｃ（ｆ）ＩＮ２（ｆ）を計算して複素スペクトルＩＮ２（ｆ）を複素スペクトルＩＮ１（ｆ）に同期化して、同期化されたスペクトルＩＮｓ２（ｆ）を生成する。

ステップ５１６において、ディジタル信号プロセッサ２００（フィルタ部３００の減算部３３４）は、複素スペクトルＩＮ１（ｆ）から、係数δ（ｆ）を乗じた複素スペクトルＩＮｓ２（ｆ）を減算し（ＩＮｄ（ｆ）＝ＩＮ１（ｆ）−δ（ｆ）×ＩＮｓ２（ｆ））、雑音が抑圧された複素スペクトルＩＮｄ（ｆ）を生成する。

ステップ５１８において、ディジタル信号プロセッサ２００（逆高速フーリエ変換部３８２）は、同期化係数計算部２２４からスペクトルＩＮｄ（ｆ）を受け取って逆フーリエ変換して、オーバラップ加算し、マイクロホンＭＩＣ１の位置における時間領域の音信号ＩＮｄ（ｔ）を生成する。

その後、手順はステップ５０２に戻る。ステップ５０２〜５１８は、所要の期間の入力を処理するために所要の時間期間だけ繰り返される。

このようにして、上述の実施形態によれば、マイクロホンＭＩＣ１、ＭＩＣ２の入力信号を周波数領域で処理して入力信号中の雑音を相対的に低減することができる。上述のように入力信号を周波数領域で処理するほうが、入力信号を時間領域で処理するよりも、より高い精度で位相差を検出することができ、従って雑音が低減されたより高い品質の音信号を生成することができる。また、少ない数のマイクロホンからの入力信号を用いて、雑音が充分に抑圧された音信号を生成することができる。上述の２つのマイクロホンからの入力信号の処理は、複数のマイクロホン（図１）の中の任意の２つマイクロホンの組み合わせに適用できる。

上述の実施形態によれば、背景雑音を含む或る録音した音データを処理した場合、通常の抑圧ゲイン約３ｄＢと比較して、約１０ｄＢ以上の抑圧ゲインが得られるであろう。

図８Ａおよび８Ｂは、センサ１９２のデータまたはキー入力データに基づいて設定された最小受音範囲Ｒｓｍｉｎの設定状態を示している。センサ１９２は話者の身体の位置を検出する。方向決定部１９４はその検出位置に応じて話者の身体をカバーするように最小受音範囲Ｒｓｍｉｎを設定する。その設定情報は、同期化係数生成部２２０の同期化係数計算部２２４に供給される。同期化係数計算部２２４は、最小受音範囲Ｒｓｍｉｎおよび目的音らしさＤ（ｆ）に基づいて、前述のように、受音範囲Ｒｓ、抑圧範囲Ｒｎおよび移行範囲Ｒｔを設定し同期化係数を計算する。

図８Ａにおいて、話者の顔はセンサ１９２の左側に位置し、センサ１９２は、例えば最小受音範囲Ｒｓｍｉｎにおける角度位置として角度θ＝θ１＝−π／４に話者の顔領域Ａの中心位置θを検出する。この場合、方向決定部１９４は、その検出データθ＝θ１に基づいて、顔領域Ａ全体を含むように最小受音範囲Ｒｓｍｉｎの角度範囲を角度πより狭く設定する。

図８Ｂにおいて、話者の顔はセンサ１９２の下側または正面側に位置し、センサ１９２は、例えば最小受音範囲Ｒｓｍｉｎにおける角度位置として角度θ＝θ２＝０に話者の顔領域Ａの中心位置θを検出する。この場合、方向決定部１９４は、その検出データθ＝θ２に基づいて、顔領域Ａ全体を含むように最小受音範囲Ｒｓｍｉｎの角度範囲を角度πより狭く設定する。顔の位置の代わりに、話者の身体の位置が検出されてもよい。

センサ１９２がディジタル・カメラの場合、方向決定部１９４は、そのディジタル・カメラから取り込んだ画像データを画像認識して、顔領域Ａとその中心位置θを判定する。方向決定部１９４は、顔領域Ａとその中心位置θに基づいて最小受音範囲Ｒｓｍｉｎを設定する。

このようにして、方向決定部１９４は、センサ１９２によって検出された話者の顔または身体の検出位置に従って最小受音範囲Ｒｓｍｉｎを可変設定することができる。代替形態として、方向決定部１９４は、キー入力に従って最小受音範囲Ｒｓｍｉｎを可変設定してもよい。そのように最小受音範囲Ｒｓｍｉｎを可変設定することによって、最小受音範囲Ｒｓｍｉｎをできるだけ狭くして、できるだけ広い抑圧範囲Ｒｎにおける各周波数の不要な雑音を抑圧することができる。

図１、図４Ａおよび４Ｂを再び参照すると、音声らしさ判定部２１８からの目的音らしさＤ（ｆ）≧０．５に対して、同期化係数計算部２２４は、図４Ａの受音範囲Ｒｓ＝Ｒｓｍａｘの角度境界θｔｂ＝＋π／２と設定し、即ち全ての角度範囲を受音範囲と設定してもよい。換言すれば、目的音らしさＤ（ｆ）≧０．５に対して、受音範囲および抑圧範囲を設定せずに、目的音信号として処理してもよい。音声らしさ判定部２１８からの目的音らしさＤ（ｆ）＜０．５に対して、同期化係数計算部２２４は、図４Ａの抑圧範囲Ｒｎ＝Ｒｎｍａｘの角度境界θｔａ＝−π／２と設定し、即ち全ての角度範囲を抑圧範囲と設定してもよい。換言すれば、目的音らしさＤ（ｆ）＜０．５に対して、受音範囲および抑圧範囲を設定せずに、雑音に由来する音信号として処理してもよい。

図９は、メモリ２０２に格納されたプログラムに従って図３Ａのディジタル信号プロセッサ（ＤＳＰ）２００によって実行される複素スペクトルの生成のための別のフローチャートを示している。

ステップ５０２〜５０８は、図７のものと同様である。

ステップ５２９において、ディジタル信号プロセッサ２００（目的音らしさ判定部２１８）は、高速フーリエ変換器２１２からの複素スペクトルＩＮ１（ｆ）の絶対値または振幅に応じて、目的音らしさＤ（ｆ）（０≦Ｄ（ｆ）≦１）を生成して同期化係数生成部２２０に供給する。ディジタル信号プロセッサ２００（同期化係数生成部２２０の同期化係数計算部２２４）は、目的音らしさＤ（ｆ）の値に従って、周波数ｆ毎に、目的音信号として処理するか、雑音信号として処理するかを判定する。

ステップ５３０において、ディジタル信号プロセッサ２００（同期化係数生成部２２０の同期化係数計算部２２４）は、位相差ＤＩＦＦ（ｆ）に基づいて、マイクロホンＭＩＣ２の入力信号に対するマイクロホンＭＩＣ１の入力信号の複素スペクトルの比Ｃ（ｆ）を前述のように次の式に従って計算する。

（ａ）目的音らしさＤ（ｆ）＜０．５の場合、同期化係数Ｃ（ｆ，ｉ）＝Ｃｎ（ｆ，ｉ）＝αＣ（ｆ，ｉ−１）＋（１−α）ＩＮ１（ｆ，ｉ）／ＩＮ２（ｆ，ｉ）。
（ｂ）目的音らしさＤ（ｆ）≧０．５の場合、同期化係数Ｃ（ｆ）＝Ｃｓ（ｆ）＝ｅｘｐ（−ｊ２πｆ／ｆｓ）またはＣ（ｆ）＝Ｃｓ（ｆ）＝０。

ステップ５１４〜５１８は、図７のものと同様である。

このように、受音範囲および抑圧範囲を調整せずまたは設定せずに、目的音らしさＤ（ｆ）だけに応じて、同期化係数を決定することによって、同期化係数の生成を簡単化することができる。

目的音らしさＤ（ｆ）の代替的な決定方法として、目的音らしさ判定部２１８は、位相差計算部２２２から位相差ＤＩＦＦ（ｆ）を受け取り、方向決定部１９４またはプロセッサ１０から最小受音範囲Ｒｓｍｉｎを表す情報を受け取ってもよい（図３、破線矢印参照）。位相差計算部２２２によって求めた位相差ＤＩＦＦ（ｆ）が、図６Ｃにおける方向決定部１９４から受け取った最小受音範囲Ｒｓｍｉｎ内に位置する場合には、目的音らしさ判定部２１８は目的音らしさＤ（ｆ）が高くＤ（ｆ）＝１と判定してもよい。一方、位相差ＤＩＦＦ（ｆ）が、図６Ｃにおける抑圧範囲Ｒｎｍａｘまたは移行範囲Ｒｔに位置する場合には、目的音らしさ判定部２１８は目的音らしさＤ（ｆ）が高くＤ（ｆ）＝０と判定してもよい。図７のステップ５０９または図９のステップ５２９において、このようにして目的音らしさＤ（ｆ）を求めてもよい。この場合にも、図７のステップ５１０〜５１８、または図９のステップ５３０、５１４〜５１８がディジタル信号プロセッサ２００によって実行される。

代替実施形態において、雑音抑圧を行う同期減算の代わりに、音信号強調を行う同期加算を用いてもよい。その同期加算の処理において、受音方向が受音範囲の場合には同期加算を行い、受音方向が抑圧範囲の場合には同期加算を行わずまたは加算信号の加算比率を小さくすればよい。

ここで挙げた全ての例および条件的表現は、発明者が技術促進に貢献した発明および概念を読者が理解するのを助けるためのものであり、ここで具体的に挙げたそのような例および条件に限定することなく解釈できる。また、明細書におけるそのような例の編成は本発明の優劣を示すこととは関係ない。本発明の実施形態を詳細に説明したが、本発明の精神および範囲から逸脱することなく、それに対して種々の変更、置換および変形を施すことができる。

１００マイクロホン・アレイ装置
ＭＩＣ１、ＭＩＣ２マイクロホン
１２２、１２４増幅器
１４２、１４４低域通過フィルタ
１６２、１６４アナログ−ディジタル変換器
２１２、２１４高速フーリエ変換器
２１８目的音らしさ判定部
２００ディジタル信号プロセッサ
２２０同期化係数生成部
２２２位相差計算部
２２４同期化係数計算部
３００フィルタ部
３３２同期化部
３３４減算部
３８２逆高速フーリエ変換器

Claims

少なくとも２つのマイクロホンで受音した各音信号を周波数領域に変換した２つのスペクトル信号を用いて雑音を抑制する信号処理装置であって、
周波数毎に前記２つのスペクトル信号の周波数成分間の位相差を求める第１の計算部と、
周波数毎に、前記スペクトル信号の周波数成分の値に依存する目的信号らしさを表す値を求めて、前記目的信号らしさを表す値に基づいて、前記スペクトル信号の各周波数成分が雑音を表すかどうかを決定する第２の計算部と、
前記第２の計算部によって雑音を表すと決定された周波数成分について、前記第１の計算部によって求めた前記位相差に基づいて、前記２つのスペクトル信号のうちの一方のスペクトル信号の各成分を移相して同期化して、前記同期化されたスペクトル信号を生成し、前記同期化されたスペクトル信号と前記２つのスペクトル信号のうちの他方のスペクトル信号とを、減算または加算により合成して、濾波済みのスペクトル信号を生成するフィルタ部と、
を具える信号処理装置。
少なくとも２つのマイクロホンで受音した各音信号を周波数領域に変換した２つのスペクトル信号を用いて雑音を抑制する信号処理装置であって、
前記２つのスペクトル信号間の位相差を求めて、音源方向を推定する第１の計算部と、
目的信号らしさを表す値を求めて、周波数毎に、雑音を抑圧する音信号抑圧位相差範囲を決定する第２の計算部と、
前記求めた位相差が前記音信号抑圧位相差範囲にある場合に、周波数毎に、前記２つのスペクトル信号のうちの一方のスペクトル信号の各成分を移相して同期化して、前記同期化されたスペクトル信号を生成し、前記同期化されたスペクトル信号と前記２つのスペクトル信号のうちの他方のスペクトル信号とを、減算または加算により合成して、濾波済みのスペクトル信号を生成するフィルタ部と、
を具える信号処理装置。
前記第２の計算部は、前記目的信号らしさを表す値が大きくなるに従って、前記音信号抑圧位相差範囲をより狭く設定し、雑音を抑圧しない受音位相差範囲を広く設定するものであることを特徴とする、請求項２に記載の信号処理装置。
さらに、前記２つのスペクトル信号のうちの１つのスペクトル信号の振幅の絶対値または該絶対値の２乗値に基づいて、前記目的信号らしさを表す値を判定する判定部を具える、請求項２または３に記載の信号処理装置。
さらに、前記２つのスペクトル信号のうちの１つのスペクトル信号の振幅の絶対値または該絶対値の２乗値の時間的平均値に対する前記１つのスペクトル信号の現在の振幅の絶対値または該絶対値の２乗値の比に基づいて、前記目的信号らしさを表す値を判定する判定部を具える、請求項２または３に記載の信号処理装置。
前記同期化係数計算部は、設定されたまたは検出された話者の方向を表す話者方向情報を受け取って、前記話者方向情報に基づいて、前記音信号抑圧位相差範囲を設定するものであることを特徴とする、請求項２乃至５のいずれかに記載の信号処理装置。
前記フィルタ部は、周波数に応じて減算の度合いを調整する係数が乗じられた前記移相されたスペクトル信号を、前記２つのスペクトル信号のうちの前記他方のスペクトル信号から減じて、前記濾波済みのスペクトル信号を生成し、前記位相差が前記音信号抑圧位相差範囲または受音位相差範囲のいずれにあるかに応じて、前記係数を計算するものであることを特徴とする、請求項２乃至６に記載の信号処理装置。
前記信号処理装置は、さらに、少なくとも２つの音入力部から入力された時間軸上の音信号のうちの２つの音信号をそれぞれ前記周波数軸上の２つのスペクトル信号に変換する直交変換部を具え、
前記２つのスペクトル信号間の前記求めた位相差は前記２つの音入力部における音の到来方向を表し、
前記目的信号らしさは目的音信号らしさであり、
前記第２の計算部は、さらに、前記２つのスペクトル信号間の前記求めた位相差に応じて、周波数毎に前記一方のスペクトル信号の各成分の移相量を表す同期化係数を計算するものであることを特徴とする、請求項２乃至７のいずれかに記載の信号処理装置。
前記第２の計算部は、前記位相差が前記抑圧位相差範囲にある場合、周波数毎に時間フレーム毎の前記２つのスペクトル信号の比に基づいて前記同期化係数を計算するものであることを特徴とする、請求項７に記載の信号処理装置。
複数のマイクロホンで受音して雑音を抑圧する雑音抑圧装置であって、
少なくとも２つのマイクロホンで受音する各音信号を時間軸上の音信号に変換する受音部と、
前記受音部によって生成された時間軸上の少なくとも２つの音信号を周波数軸上の少なくとも２つのスペクトル信号に変換する変換部と、
前記２つのスペクトル信号間の位相差を求めて、音源方向を推定する第１の計算部と、
目的信号らしさを表す値を求めて、周波数毎に、雑音を抑圧するか否かを決定する第２の計算部と、
前記求めた位相差と前記推定された音源方向に基づいて、周波数毎に、前記２つのスペクトル信号のうちの一方のスペクトル信号の各成分を移相して同期化して、前記同期化されたスペクトル信号を生成し、前記同期化されたスペクトル信号と前記２つのスペクトル信号のうちの他方のスペクトル信号とを、減算または加算により合成して、濾波済みのスペクトル信号を生成するフィルタ部と、
前記濾波済みのスペクトル信号を時間軸上の音信号に変換して出力する出力部と、
を具える雑音抑圧装置。
少なくとも２つのマイクロホンで受音した各音信号を周波数領域に変換した２つのスペクトル信号を用いて雑音を抑制する信号処理装置における信号処理方法であって、
周波数毎に前記２つのスペクトル信号の周波数成分間の位相差を求める工程と、
周波数毎に、前記スペクトル信号の周波数成分の値に依存する目的信号らしさを表す値を求めて、前記目的信号らしさを表す値に基づいて、前記スペクトル信号の各周波数成分が雑音を表すかどうかを決定する工程と、
前記第２の計算部によって雑音を表すと決定された周波数成分について、前記第１の計算部によって求めた前記位相差に基づいて、前記２つのスペクトル信号のうちの一方のスペクトル信号の各成分を移相して同期化して、前記同期化されたスペクトル信号を生成し、前記同期化されたスペクトル信号と前記２つのスペクトル信号のうちの他方のスペクトル信号とを、減算または加算により合成して、濾波済みのスペクトル信号を生成する工程と、
を含む、処理方法。
少なくとも２つのマイクロホンで受音した各音信号を周波数領域に変換した２つのスペクトル信号を用いて雑音を抑制する信号処理装置に用いられるプログラムであって、
周波数毎に前記２つのスペクトル信号の周波数成分間の位相差を求めるステップと、
周波数毎に、前記スペクトル信号の周波数成分の値に依存する目的信号らしさを表す値を求めて、前記目的信号らしさを表す値に基づいて、前記スペクトル信号の各周波数成分が雑音を表すかどうかを決定するステップと、
前記第２の計算部によって雑音を表すと決定された周波数成分について、前記第１の計算部によって求めた前記位相差に基づいて、前記２つのスペクトル信号のうちの一方のスペクトル信号の各成分を移相して同期化して、前記同期化されたスペクトル信号を生成し、前記同期化されたスペクトル信号と前記２つのスペクトル信号のうちの他方のスペクトル信号とを、減算または加算により合成して、濾波済みのスペクトル信号を生成するステップ、
を前記信号処理装置に実行させるための信号処理プログラム。