JP5593852B2

JP5593852B2 - 音声信号処理装置、音声信号処理方法

Info

Publication number: JP5593852B2
Application number: JP2010125502A
Authority: JP
Inventors: 雄司北澤; 宏平浅田; 康信村田; 徹徳板橋
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 2010-06-01
Filing date: 2010-06-01
Publication date: 2014-09-24
Anticipated expiration: 2030-06-01
Also published as: EP2392938A1; EP2392938B1; CN102271299A; CN102271299B; KR20110132245A; US8976978B2; US20110293107A1; JP2011254189A

Description

本発明は、特定の音源方向からの音声を得るための音声信号処理装置、音声信号処理方法に関する。

特開２０１０−１１１１７号公報特開２００７−１２９３８３号公報

例えば２つのマイクロホンからの入力音声について、指向性を形成するビームフォーミング技術が知られている。

図１０でノイズキャンセリングヘッドホン（以下、ＮＣヘッドホン）の例で説明する。ＮＣヘッドホン１００は左右のスピーカ１０１Ｌ，１０１Ｒによりユーザにステレオ音声を提供するが、外来ノイズの低減のために外部音を収音するマイクロホン（以下「マイク」と略称する）１０２Ｌ、１０２Ｒが設けられている。
このＮＣヘッドホン１００は例えば携帯型メディアプレーヤなどからの再生音楽の音声を再生出力する。

簡単に言えば、ノイズキャンセルのためには、マイク１０２Ｌ、１０２Ｒで収音された音声信号の逆相成分を生成し、それぞれ音楽信号に合成してスピーカ１０１Ｌ，１０１Ｒから出力する。これにより、外来ノイズが空間的に打ち消された状態で音楽信号の音声がユーザに聴取される。

ここで、マイク１０２Ｌ、１０２Ｒを、ノイズキャンセリングだけではなく、指向性をもった外部音声の収音のために用いることを考える。
ユーザにとっては、例えばＮＣヘッドホン１００を装着したままでも、会話等が普通にできることが好適であるが、ノイズキャンセル機能をオンとしていると、例えば正面にいる他人の声も低減されてしまい、会話音声が聞き取りにくい。
そこで、例えば会話等を行うときには再生音楽をオフとし、かつノイズキャンセル機能をオフとするモードが用意されている。
ところがノイズキャンセル機能をオフとすると、他人の声とともに周囲のノイズも大きく聞こえることとなる。このため交通量の激しい場所や、航空機の機内などでは、やはり会話音声等が聞き取りにくい状況は変わらない。

このような場合に、会話音声は聞きやすく、周囲のノイズは抑えられるようなスピーカ出力ができると好適である。
ユーザが図１０のように、ＮＣヘッドホン１００を掛けて正面を向いていることを考えると、大抵の場合、会話を行う対象の音声は、ユーザ正面からやってくると考えることができる。この時、図１０に示したように、ユーザから見れば、正面からの会話音声は強調しつつ、正面以外からの音源はすべてノイズとみなしてレベルを下げたいと考える。

これを実現するためには、仮に必要な音源方向を正面とした場合、所謂ビームフォーミングの手法をとることで、収音時の指向性を形成することができる。
図１１（ａ）はビームフォーミング処理の概念図であり、左右のマイク１０２Ｌ、１０２Ｒからの音声信号をビームフォーミング処理部１０３で処理して出力する。
もっとも簡単なビームフォーミング処理は、必要な指向性が正面または後ろだとすると、図１１（ｂ）のような左右のマイク１０２Ｌ、１０２Ｒからの音声信号の加算処理で良い。
この場合、正面又は後方からの音声、つまりマイク１０２Ｌ、１０２Ｒから等距離の音源からの音声についての左右チャンネルの音声信号成分は位相が一致しており、加算により強調される。他の方向からの音の音声信号成分は左右チャンネルの音声信号成分は位相がずれているため、その分、低減される。これによって例えば正面方向に指向性をもった音声信号を得ることができる。

なおビームフォーミング自体は正面以外の方向のものでも強調することができ、その場合は片側のチャンネルに遅延装置を組み込むことで、各マイクに到達する同一波面の時間差を吸収することができ、斜め方向や横方向のビームフォーミングも形成できるものである。

このビームフォーミングの精度（この場合、正面指向性強調、周囲ノイズ低減と同等の意味）を高めるためには、図１１（ｂ）のような簡易的なものではなく、図１２のようなバンドパスフィルタをメインとするノイズサプレッション装置が一般的に使われている。

マイク１０２Ｌで得られた音声信号はマイクアンプ１０４Ｌで増幅された後、それぞれが通過中心周波数をｆｃ１，ｆｃ２，ｆｃ３とされたバンドパスフィルタ１２１Ｌ、１２２Ｌ、１２３Ｌに供給される。バンドパスフィルタ１２１Ｌ、１２２Ｌ、１２３Ｌでは各帯域ＢＤ１，ＢＤ２，ＢＤ３の音声信号成分が抽出される。
またマイク１０２Ｒで得られた音声信号はマイクアンプ１０４Ｒで増幅された後、それぞれが通過中心周波数をｆｃ１，ｆｃ２，ｆｃ３とされたバンドパスフィルタ１２１Ｒ、１２２Ｒ、１２３Ｒに供給され、各帯域ＢＤ１，ＢＤ２，ＢＤ３の音声信号成分が抽出される。
なお中心周波数がｆｃ１とされたバンドパスフィルタの通過帯域を帯域ＢＤ１と表記することとしている。同様に、中心周波数がｆｃ２，ｆｃ３とされたバンドパスフィルタの通過帯域を帯域ＢＤ２，ＢＤ３と表記する

バンドパスフィルタ１２１Ｌ、１２１Ｒの出力である、帯域ＢＤ１の音声信号成分は音源方向角度解析部１２４及び加算器１２７に供給される。
バンドパスフィルタ１２２Ｌ、１２２Ｒの出力である、帯域ＢＤ２の音声信号成分は音源方向角度解析部１２５及び加算器１２８に供給される。
バンドパスフィルタ１２３Ｌ、１２３Ｒの出力である、帯域ＢＤ３の音声信号成分は音源方向角度解析部１２６及び加算器１２９に供給される。

音源方向角度解析部１２４，１２５，１２６は、それぞれ、帯域ＢＤ１，ＢＤ２，ＢＤ３の音声信号成分のうちで支配的な音の音源方向を判定する。
そして音源方向角度解析部１２４，１２５，１２６は、判定した方向に応じて、可変ゲインアンプ１３０，１３１，１３２のゲインを制御する。即ち判定方向が正面など目的の方向であればゲインアップ、他の方向ではゲインダウン制御する。

帯域ＢＤ１，ＢＤ２，ＢＤ３の各音声信号成分は、それぞれ加算器１２７、１２３，１２９でＬ、Ｒチャンネルが加算され、可変ゲインアンプ１３０，１３１，１３２に供給される。そして可変ゲインアンプ１３０，１３１，１３２が上記のように音源方向角度解析部１２４，１２５，１２６によって制御されることで、例えば正面方向からの音が支配的である帯域が強調され、他の帯域は低減される。そのようにバンド毎の重み付けとしてゲイン調整された各帯域ＢＤ１，ＢＤ２，ＢＤ３の出力が加算器１３３で加算されて、ビームフォーミング処理された出力音声信号Ｓｏｕｔとなる。
このようなノイズサプレッション装置を用いたビームフォーミング処理部１０３を用いることで、図１０のような状況で会話音声をノイズに埋もれにくく聞くことができる。

また、音声を強調しノイズサプレッションを行う一種として、ビームフォーミングを使わず、ノイズ除去のための従来の音声解析・合成の代表的な手法として、「スペクトルサブストラクション」を中心とするＦＦＴを用いたものがあげられる。

上記のように、ノイズ低減のための従来の音声解析・合成の代表的な手法として、バンドパスフィルタを用いたものと、ＦＦＴを用いたものの２つがあげられる。
ＦＦＴを用いる手法にはいくつかの欠点がある。一つ目は計算量が膨大になること、二つ目はミュージカルノイズと言われる違和感のある独特のノイズ音が発生することである。

これに対し、上記図１２のようにバンドパスフィルタを用いる手法では、計算量を少なく抑えられ、また原理上ミュージカルノイズも発生しない。さらに、大規模な変更を加えることなく、処理の質的・量的変化に対応できるという利点がある。
背景として、ＦＦＴは２のｎ乗単位のサンプル数でしか取り扱えないので、例えば計算量も離散的であり、計算リソースがあるので少しだけ増やす、ということができないということがある。一方で、バンドパスフィルタは、１つのバンドパスフィルタの計算量の単位が小さいため、バンド数の増減は容易であったり、計算リソースに合わせて細かく設定できる利点がある。したがって、バンドパスフィルタを用いる手法が好ましいと考えられる。

ところがバンドパスフィルタを用いる方式では、処理前と比べて音質が低下してしまうのが問題となっていた。
一般的にバンドパスフィルタを用いる音声解析・合成では、バンドパスフィルタよって分けられた各帯域の音データを解析し、各帯域の音データに並列的に処理を施して最後に全てを合成するという手法がとられる。
図１２のようなバンドパスフィルタを用いた音声解析及び合成する手法では、音質に関して上記ＦＦＴの場合よりは好ましい。ところが、バンドパスフィルタによる位相回転や、バンドによって加算する／しない、またはレベルを大きく／小さくする、などが制御調整されている。このため、バンド毎の加算時に、元の音源に比べて位相の不整合が起こり、結果、ノイズとして感じる音質劣化が否めなく、問題となっていた。

そこで本発明では、複数のマイクから得られる音声信号について、音声品質を保ちながらノイズを低減する、計算処理効率を向上させた信号処理手法（ビームフォーミングをベースとするノイズサプレッション手法）を提供する。

本発明の音声信号処理装置は、例えば複数のマイクロホン入力或いはライン入力等によって得られる、複数チャンネルの音声信号について、第１〜第ｎの帯域毎に、それぞれ音源方向を判定する音源方向判定部と、上記第１〜第ｎの帯域についての音声信号の強調又は減衰を行う直列接続された第１〜第ｎのフィルタを有し、上記第１〜第ｎのフィルタのそれぞれは、上記音源方向判定部で判定された第１〜第ｎの帯域の音源方向に基づいて強調又は減衰を行うフィルタ処理部とを備える。

また、上記音源方向判定部は、上記第１〜第ｎの帯域に対応する第１〜第ｎの音源方向角度解析部を備え、上記第１〜第ｎの音源方向角度解析部のそれぞれは、上記第１〜第ｎのフィルタのそれぞれに１：１で対応し、対応するフィルタを強調又は減衰の処理の制御対象としている。そして上記第１〜第ｎの音源方向角度解析部のそれぞれは、対応する帯域の音源方向が所定角度範囲内の方向と判定したときに制御対象のフィルタに強調処理を実行させ、対応する帯域の音源方向角度が所定角度範囲内の方向ではないと判定したときに制御対象のフィルタに減衰処理を実行させる。
さらに上記第１〜第ｎの音源方向角度解析部のそれぞれは、音源方向が分散状態であると判定したときには、制御対象のフィルタに減衰処理を実行させる。
また上記第１〜第ｎの音源方向角度解析部のそれぞれは、対応する帯域について、各チャンネルの音声信号のエネルギー差分に基づいて音源方向を判定する。
また上記フィルタ処理部の直列接続された第１〜第ｎのフィルタには、上記複数チャンネルの音声信号を合成した音声信号が入力される。
或いは上記フィルタ処理部の直列接続された第１〜第ｎのフィルタには、上記複数チャンネルのうちの一のチャンネルの音声信号が入力される。

本発明の音声信号処理方法は、複数チャンネルの音声信号について、第１〜第ｎの帯域毎に、それぞれ音源方向を判定する音源方向判定ステップと、上記第１〜第ｎの帯域についての音声信号の強調又は減衰を行う直列接続された第１〜第ｎのフィルタに音声信号を入力するとともに、上記第１〜第ｎのフィルタのそれぞれが、上記音源方向判定ステップで判定された第１〜第ｎの帯域の音源方向に基づいて強調又は減衰を行うフィルタ処理ステップとが行われ、上記フィルタ処理ステップは、上記第１〜第ｎの帯域における、対応する帯域の音源方向が上記音源方向判定ステップにより所定角度範囲内の方向と判定されたときに制御対象のフィルタに強調処理を実行し、対応する帯域の音源方向角度が上記音源方向判定ステップにより所定角度範囲内の方向ではないと判定されたときに制御対象のフィルタに減衰処理を実行するとともに、上記第１〜第ｎの帯域における、対応する帯域の音源方向が上記音源方向判定ステップにより分散状態であると判定されたときには、制御対象のフィルタに減衰処理を実行する

このような本発明は、２つ以上のマイクを使う機器において音声品質を保ちながらノイズを低減する、計算処理効率を向上させた信号処理手法（ビームフォーミングをベースとするノイズサプレッション手法）である。
ノイズ低減手法に伴う音質劣化の改善のため、一体又は別体の二つ以上のマイクによって得られた音声信号を複数の帯域ごとにわけて、帯域ごとにノイズかどうかの判定のための解析（音源方向判定）を行う。そして入力された音声信号の一つ、または複数の加算値を、音源方向の解析結果を用いて、位相の不整合が発生しない時間軸上で直列に並んだフィルタ群を用いて処理し、ノイズを低減する。
直列接続されたフィルタ群は複数個のゲイン制御可能な帯域強調または減衰フィルタより構成され、解析結果に基づいてこれが制御されるものとする。

本発明によれば、複数のマイクから得られる音声信号について、音声品質を保ちながらノイズを低減する、計算処理効率を向上させた音声信号処理が実現される。

本発明の実施の形態のノイズサプレッション装置のブロック図である。実施の形態のＭＰＦ特性の説明図である。実施の形態の音源方向判定の際のサンプルプロットの説明図である。実施の形態の音源方向判定の説明図である。実施の形態の音源方向判定に基づくＭＰＦ制御の説明図である。実施の形態の音源方向角度解析部の処理のフローチャートである。実施の形態のＮＣヘッドホンへの適用例の説明図である。実施の形態のＮＣヘッドホンのブロック図である。他の実施の形態のノイズサプレッション装置のブロック図である。ノイズ状況下での会話時の状況の説明図である。ビームフォーミング処理の説明図である。従来のノイズサプレッション装置のブロック図である。

以下、本発明の実施の形態について、次の順序で説明する。
＜１．実施の形態のノイズサプレッション装置＞
＜２．ＮＣヘッドホンに適用した例＞
＜３．各種機器への適用例及び変形例＞

＜１．実施の形態のノイズサプレッション装置＞

本発明の音声信号処理装置の実施の形態としてのノイズサプレッション装置１を図１に示す。
このノイズサプレッション装置１は、左右のマイク２Ｌ、２Ｒで収音された音声信号が入力され、例えば正面（又は後方）からの音声を強調し、他の方向から音声を減衰させることで、ノイズ環境での会話などに好適な音声信号を得るものである。

図１において、マイク２Ｌで得られた音声信号ＳｍＬはマイクアンプ３Ｌで増幅され、Ａ／Ｄ変換器４Ｌでデジタルデータに変換される。そしてデジタルデータ化された音声信号ＳｍＬはノイズサプレッション装置１に入力される。
またマイク２Ｒで得られた音声信号ＳｍＲはマイクアンプ３Ｒで増幅され、Ａ／Ｄ変換器４Ｒでデジタルデータに変換される。そしてデジタルデータ化された音声信号ＳｍＲはノイズサプレッション装置１に入力される。

ノイズサプレッション装置１は、音源方向判定部１Ａとフィルタ処理部１Ｂを有する構成とされる。
音源方向判定部１Ａは、Ｌ／Ｒチャンネルの音声信号ＳｍＬ，ＳｍＲについて、この例では第１〜第３の各帯域毎に、それぞれ音源方向を判定する。
フィルタ処理部１Ｂは、上記の第１〜第３の帯域についての音声信号の強調又は減衰を行う直列接続された第１〜第３のフィルタ（後述するＭＰＦ５８，５９，６０）を有する。

音源方向判定部１Ａは、バンドパスフィルタ５１Ｌ、５２Ｌ、５３Ｌ、５１Ｒ、５２Ｒ、５３Ｒ、音源方向角度解析部５４，５５，５６を備える。
バンドパスフィルタ５１Ｌ、５２Ｌ、５３Ｌは、それぞれが通過中心周波数をｆｃ１，ｆｃ２，ｆｃ３とされている。説明上、それぞれの通過帯域をＢＤ１，ＢＤ２，ＢＤ３と表記することとする。
またバンドパスフィルタ５１Ｒ、５２Ｒ、５３Ｒも、それぞれが通過中心周波数をｆｃ１，ｆｃ２，ｆｃ３とされている。それぞれの通過帯域は同じくＢＤ１，ＢＤ２，ＢＤ３である。
左チャンネルの音声信号ＳｍＬは、バンドパスフィルタ５１Ｌ、５２Ｌ、５３Ｌに入力され、各帯域ＢＤ１，ＢＤ２，ＢＤ３の音声信号成分が抽出される。
また右チャンネルの音声信号ＳｍＲは、バンドパスフィルタ５１Ｒ、５２Ｒ、５３Ｒに入力され、各帯域ＢＤ１，ＢＤ２，ＢＤ３の音声信号成分が抽出される。

バンドパスフィルタ５１Ｌ、５１Ｒの出力である、左右各チャンネルの帯域ＢＤ１の音声信号成分は音源方向角度解析部５４に供給される。
バンドパスフィルタ５２Ｌ、５２Ｒの出力である、左右各チャンネルの帯域ＢＤ２の音声信号成分は音源方向角度解析部５５に供給される。
バンドパスフィルタ５３Ｌ、５３Ｒの出力である、左右各チャンネルの帯域ＢＤ３の音声信号成分は音源方向角度解析部５６に供給される。

音源方向角度解析部５４は、帯域ＢＤ１に対応し、供給された帯域ＢＤ１の音声信号成分のうちで支配的な音の音源方向を判定する。
音源方向角度解析部５５は、帯域ＢＤ２に対応し、供給された帯域ＢＤ２の音声信号成分のうちで支配的な音の音源方向を判定する。
音源方向角度解析部５６は、帯域ＢＤ３に対応し、供給された帯域ＢＤ３の音声信号成分のうちで支配的な音の音源方向を判定する。
音源方向角度解析部５４，５５，５６での音源方向の判定手法については後述するが、音源方向角度解析部５４，５５，５６のそれぞれは、対応する帯域について、各チャンネルの音声信号のエネルギー差分に基づいて音源方向を判定する。
そして音源方向角度解析部５４，５５，５６は、判定した方向に応じて、制御信号ＳＧ１，ＳＧ２，ＳＧ３により、１：１で対応して設けられているミッドプレゼンスフィルタ（ＭＰＦ：Mid Presence Filter）５８、５９，６０を制御する。図からわかるように、音源方向角度解析部５４はＭＰＦ５８を、音源方向角度解析部５５はＭＰＦ５９、音源方向角度解析部５６はＭＰＦ６０を、それぞれ制御対象としている。

フィルタ処理部１Ｂは、加算器５７、ミッドプレゼンスフィルタ（ＭＰＦ）５８，５９，６０から成る。ＭＰＦ５８，５９，６０は直列接続されたフィルタ群とされている。
加算器５７は、左右チャンネルの音声信号ＳｍＬ，ＳｍＲを加算する。加算器５７による左右チャンネルの音声信号を合成した音声信号（ＬＲ加算信号）はＭＰＦ５８に供給される。

ＭＰＦ５８，５９，６０は、それぞれ対応する帯域の強調又は減衰を行う。ここで３つのＭＰＦが設けられているのは、音源方向判定部１Ａのバンドパスフィルタ５１Ｌ、５２Ｌ、５３Ｌ、５１Ｒ、５２Ｒ、５３Ｒが音声信号ＳｍＬ，ＳｍＲをそれぞれ３つの帯域にわけていることによる。
ＭＰＦ５８，５９，６０は、それぞれが中心周波数がｆｃ１，ｆｃ２，ｆｃ３とされる。そして図２のような特性を持ち、特定の対象帯域（周波数ｆｃを中心とする帯域）に対して、ゲインの増幅や低減を行うものとされる。ＭＰＦ５８，５９，６０では、このようなゲイン可変調整による対象の帯域の強調又は減衰が、上記のように、音源方向角度解析部５４，５５，５６によって制御される。

つまり、ＭＰＦ５８は、周波数ｆｃ１を中心とする帯域ＢＤ１の強調又は減衰を行うが、このＭＰＦ５８はバンドパスフィルタ５１Ｌ、５１Ｒ、音源方向角度解析部５４に対応する。
またＭＰＦ５９は、周波数ｆｃ２を中心とする帯域ＢＤ２の強調又は減衰を行うが、このＭＰＦ５９はバンドパスフィルタ５２Ｌ、５２Ｒ、音源方向角度解析部５５に対応する。
またＭＰＦ６０は、周波数ｆｃ３を中心とする帯域ＢＤ３の強調又は減衰を行うが、このＭＰＦ６０はバンドパスフィルタ５３Ｌ、５３Ｒ、音源方向角度解析部５６に対応する。

そして、このノイズサプレッション装置１が、正面（後面）方向を目的の方向とする場合は、音源方向が正面（後面）と判定された帯域についてはブーストされ、音源方向が他の方向と判定された帯域についてはアッテネートされる。ブースト（強調）／アッテネート（減衰）のレベルは、方向角度の判定による。

ＭＰＦ５８，５９，６０のそれぞれでは、音源方向角度解析部５４，５５，５６による制御で音声信号（ＬＲ加算信号）に対する強調又は減衰が行われる。そしてＭＰＦ６０の出力が、このノイズサプレッション装置１の出力信号Ｓｏｕｔとなる。

音源方向角度解析部５４，５５，５６の判定処理及びＭＰＦ５８，５９，６０に対する制御について説明する。
図３は音源方向角度解析部５４，５５，５６で行われる音源方向・角度の判定時のサンプル値のプロットを示している。
音源方向角度解析部５４，５５，５６には、それぞれ音声信号ＳｍＬ，ＳｍＲの帯域ＢＤ１，ＢＤ２，ＢＤ３の成分が入力されるが、音源方向角度解析部５４，５５，５６は、それぞれＬ、Ｒチャンネルの振幅値をプロットしていく。
この図３のＬＲ平面上のプロット位置は、Ｌ、Ｒ各チャンネルの音声信号ＳｍＬ，ＳｍＲのエネルギー差分を表すこととなる。

まず図３のＬＲ平面上に、対象の帯域のＬ／Ｒチャンネルの振幅値の絶対値をプロットしていき、これを一定時間内繰り返す。
例えば或る時点ｔ０の入力値として、Ｌチャンネル振幅絶対値が「Ａ１」、Ｒチャンネル振幅絶対値が「Ａ２」であったとすると、その入力値は黒丸で示すサンプルＳＰｔ０としてプロットされる。これを順次各時点ｔ１，ｔ２・・・で行い、図のようにサンプルＳＰｔ１、ＳＰｔ２・・・をプロットしていく。

或る単位時間内（例えば０．５秒〜５秒程度として決められる）で、多数のサンプルＳＰをプロットしたら、最小二乗法により原点からの直線ＬＬを求める。即ちすべてのサンプルＳＰからの距離の二乗の和が最小となるが直線を求め、それを直線ＬＬとする。
この直線ＬＬの角度θを音源方向の角度とみなす。

或る帯域の音声信号について、角度θ（直線ＬＬ）がＬＲ平面の中央付近（図の４５°付近）に来た場合、その帯域での振幅値の差は小さく、左右等距離からの音源と考えることができる。つまり正面方向が音源方向と推定できる。
一方で、角度θ（直線ＬＬ）がＬＲ平面の縦軸寄り、または横軸寄りとなったときは、その帯域の音声の左右の振幅値の差は大きく、右方向側或いは左方向側からの音と考えることができる。

そこで例えば図４（ａ）（ｂ）（ｃ）に斜線部として示すように、直線ＬＬが４５°近辺と成る角度θの範囲をセンター領域とする。センター領域とは、音源方向が正面（又は後面）であるとみなす領域である。一方、図の「右領域」「左領域」はそれぞれ音源方向が右側、左側とみなされる領域となる。なお図４（ａ）（ｂ）（ｃ）において黒丸がサンプルＳＰのプロット点である。

例えば図１０で述べた状況を考えた場合、他人からの会話音の音源方向は正面方向と考えることができる。その場合、音源方向が正面となっている帯域の音声信号成分は、例えば会話音声、つまりユーザが聞き取りたい音声であると推定できる。一方、音源方向が他の方向となっている帯域の音声信号成分は、ノイズ音声、つまり低減させたい音声信号成分と推定できる。
その場合、図４（ａ）のように、角度θがＬＲ平面上でセンター領域の範囲内にあるときは、その帯域は会話音声（ボイス音声）と判定する。
また図４（ｂ）のように角度θがＬＲ平面上でセンター領域外、即ち右領域（又は左領域）に或る場合は、正面からの音である可能性は低く、その帯域の音はノイズ音と判定する。

なお、角度θがセンター領域内であっても、ノイズと判定すべき場合もある。図４（ｃ）のようにサンプル点がＬＲ平面上で広く分散している場合、最小二乗法による直線ＬＬは４５°近辺の傾きとなり、角度θがセンター領域内に入ることがある。
このように分散度合いが大きい場合とは、周囲の反射音等により、ノイズ音声が広く多方向、全方向から到達する場合などである。例えば飛行機の客室のように反射音も含め音があらゆる方向から鳴っているような場合がある。
そこで、分散度合いが所定以上の場合は、角度θがセンター領域内であっても、その帯域の音はノイズと判定する。
具体的な一例としては、最小二乗法で直線ＬＬを求めたときの距離の二乗和が、或る閾値以上となっているときは、分散度合いが大きいと判定することができる。サンプルのプロット点がセンター領域内に集中していれば各サンプルＳＰから直線ＬＬまでの距離の二乗和は小さくなり、逆に図４（ｃ）のような場合は大きくなるからである。

図５に各音源方向角度解析部５４，５５，５６の制御の例を示す。
ここでは音源方向角度解析部５４が帯域ＢＤ１について上記の解析を行ったところ、直線ＬＬの角度θがセンター領域内となったとする。上記のように音源方向角度解析部５４は制御信号ＳＧ１により、ＭＰＦ５８を制御するが、この場合は、目的音声と判定されることで、図のようにＭＰＦ５８で周波数ｆｃ１を中心とする帯域ＢＤ１をブーストさせることとなる。
また音源方向角度解析部５５が帯域ＢＤ２について上記の解析を行ったところ、直線ＬＬの角度θがセンター領域外となったとする。音源方向角度解析部５５は制御信号ＳＧ２により、ＭＰＦ５９を制御するが、この場合は、ノイズと判定されることで、図のようにＭＰＦ５９で周波数ｆｃ２を中心とする帯域ＢＤ２を減衰させることとなる。
また音源方向角度解析部５６が帯域ＢＤ３について上記の解析を行ったところ、直線ＬＬの角度θがセンター領域内となったとする。しかし、サンプル点の分散度合いが所定以上であることから、帯域ＢＤ３の音はノイズと判定する。音源方向角度解析部５６は制御信号ＳＧ３により、ＭＰＦ６０を制御するが、この場合もノイズと判定することで、図のようにＭＰＦ６０で周波数ｆｃ３を中心とする帯域ＢＤ３を減衰させることとなる。

このように帯域毎の音源方向の判定に基づき、ＭＰＦ５８，５９，６０のフィルタ特性が可変制御されることで、ＭＰＦ５８，５９，６０で処理された出力信号Ｓｏｕｔは、正面からの音が強調され、他のノイズは減衰された音声信号となる。

以上述べてきた音源方向角度解析部５４，５５，５６の処理は、図６のようになる。音源方向角度解析部５４の処理として説明する。
まず音源方向角度解析部５４は、ステップＦ１０１，Ｆ１０２で所定の単位時間、入力される帯域ＢＤ１の音声信号ＳｍＬ，ＳｍＲの入力値を上述のＬＲ平面上にプロットしていく。
単位時間での多数のサンプル点のプロットを行ったら、音源方向角度解析部５４はステップＦ１０３に進み、最小二乗法により直線ＬＬを求め、直線ＬＬの角度θを求める。
そしてステップＦ１０４で、まず角度θがセンター領域内に入っているか否かを判定する。もしセンター領域内でなければ、音源方向角度解析部５４はステップＦ１０７に進み、当該帯域ＢＤ１の音はノイズと判定する。そして制御信号ＳＧ１によりＭＰＦ５８で帯域ＢＤ１の減衰処理を実行させる。
なお、この場合の減衰量は、例えばこのときの角度θと、センター領域の中心の角度（例えば４５°）の差分に応じた減衰量とすることが考えられる。

一方、ステップＦ１０４で角度θがセンター領域内と判定されたら、音源方向角度解析部５４はステップＦ１０５に進み、分散状態が所定以上であるか否かを判断する。上述のように、各サンプルと直線ＬＬの距離の二乗和が所定の閾値以上であるか否かを判断すればよい。
分散状態が所定以上であると判断したときは、音源方向角度解析部５４はステップＦ１０８に進み、当該帯域ＢＤ１の音はノイズと判定する。そして制御信号ＳＧ１によりＭＰＦ５８で帯域ＢＤ１の減衰処理を実行させる。
なお、この場合の減衰量は、例えば距離の二乗和の値に応じた減衰量とすることが考えられる。

角度θがセンター領域内であって、かつ分散状態が所定以上ではないと判断したときは、音源方向角度解析部５４はステップＦ１０６に進み、当該帯域ＢＤ１の音は目的の音と判定する。そして制御信号ＳＧ１によりＭＰＦ５８で帯域ＢＤ１の強調処理を実行させる。
なお、この場合のブースト量は、例えばこのときの角度θと、センター領域の中心の角度（例えば４５°）の差分及び分散度合いに応じたブースト量とすることが考えられる。即ち角度θが４５°に近いほどブースト量を多くし、また分散度合いが小さいほどブースト量を多くする。

ステップＦ１０６，Ｆ１０７，Ｆ１０８のいずれかの制御を行ったら、音源方向角度解析部５４はステップＦ１０９でプロットしたサンプルをクリアし、ステップＦ１０１に戻って、再び単位時間内のプロットを行う。そして以降、同様に処理を繰り返す。
音源方向角度解析部５４は以上のような処理を継続的に繰り返し実行する。音源方向角度解析部５５，５６も同様である。
従って単位時間毎に、各帯域の音源方向判定及びそれに基づいたＭＰＦ５８，５９，６０のフィルタ特性の制御が実行されることとなる。

以上の説明から理解されるように本例のノイズサプレッション装置１は、入力された音声信号ＳｍＬ，ＳｍＲをバンドパスフィルタ５１Ｌ、５２Ｌ、５３Ｌ、５１Ｒ、５２Ｒ、５３Ｒで帯域ＢＤ１，ＢＤ２，ＢＤ３にわける。そしてその帯域ＢＤ１，ＢＤ２，ＢＤ３ごとに、音源方向角度解析部５４，５５，５６にて、ノイズかどうかの判定のための解析を行う。その一方で、音声信号ＳｍＬ，ＳｍＲは加算されて直列接続されたＭＰＦ５８，５９，６０に供給される。各ＭＰＦ５８，５９，６０は、音源方向角度解析部５４，５５，５６の判定結果に基づいて、フィルタ特性が可変制御される。

この場合、音声ストリームへの制御は直列的なフィルタ処理であり、一般に言われるイコライザと同様なシステムである。このため、上述の図１２の構成で発生する位相不整合による音質劣化は原理上起こらない。従って音質劣化のない出力信号Ｓｏｕｔを得ることができる。

またＦＦＴ処理を用いないため、計算量を低く抑えることができる。
さらに使用リソース量応じてバンドパスフィルタをスケーラブルに設計することが可能である。これはＦＦＴを用いる処理では不可能なことである。
それに加えて、システム全体を低遅延で実装することが可能となり、特に音声コミュニケーション等、非常に早いレスポンスを求められている分野に適している。

＜２．ＮＣヘッドホンに適用した例＞

上述した本実施の形態のノイズサプレッション装置１をノイズキャンセリングヘッドホン１０に適用した例を説明する。
図７は、携帯用のメディアプレーヤ２０等の音楽再生機器に接続して用いるノイズキャンセリングヘッドホン（ＮＣヘッドホン）１０を模式的に示している。
メディアプレーヤ２０は、内部の記録媒体に記録された音楽等のデータを再生し、Ｌ、Ｒの２チャンネル音声信号を、接続されたＮＣヘッドホン１０に出力する。

ＮＣヘッドホン１０は、ヘッドホン部１１とノイズキャンセルユニット１４から成る。
ヘッドホン部１１は、ユーザの左右両耳に対応した各スピーカハウジング内にＬチャンネルとＲチャンネルのスピーカ１３Ｌ、１３Ｒを有する。
この例の場合、いわゆるフィードフォワード方式のノイズキャンセル処理を行うものとしており、マイク２Ｌ、２Ｒが、左右の各スピーカハウジングの外部音声を集音するように設けられている。

なおヘッドホン部１１は、図のようなスピーカハウジングを有するタイプでなく、イヤホン型や、耳当て型のようなタイプでもよい。本例の場合は、いずれにしてもマイク２Ｌ、２Ｒが設けられていればよい。

上記のようにマイク２Ｌ、２Ｒが設けられたヘッドホン部１１に対してノイズキャンセルユニット１４が接続される。ノイズキャンセルユニット１４にはモニタスイッチ４３が設けられ、ユーザがモニタモードのオン／オフ操作ができるようにされている。
なおここでいうモニタモードとは、メディアプレーヤ２０で再生中の音楽等の出力を停止し、ノイズキャンセル機能をオンとしたまま、会話音声等を良好に聞き取れるようにするモードである。

ノイズキャンセルユニット１４は、メディアプレーヤ２０から供給されてくる再生音楽等の音声信号に対してノイズ低減音声信号をミックスすることで、外部ノイズの低減された音声信号をスピーカ１３Ｌ、１３Ｒから出力させるものである。
簡単に言えば次のようにノイズ低減を行う。
スピーカハウジングに取り付けられたマイク２Ｌ、２Ｒは、スピーカハウジングを介してユーザの耳に達する外部ノイズを集音する。ノイズキャンセルユニット１４は、このマイク２Ｌ、２Ｒで集音した外部ノイズの音声信号から、外部ノイズとは音響的に逆相のノイズ低減音声信号を生成する。そして生成したノイズ低減音声信号を、再生音楽等の音声信号に合成してスピーカ１３Ｌ、１３Ｒに供給する。
従ってスピーカ１３Ｌ、１３Ｒから出力される音声には、外部ノイズの逆相成分が含まれているため、この逆相成分と、実際にスピーカハウジングを介して漏れ込む外部ノイズとが空間的に相殺されることになり、ユーザの聴覚には外部ノイズ成分が低減されて本来の再生音楽の出力音声が届くものとなる。

ノイズキャンセルユニット１４の内部構成例を図８に示す。
ノイズキャンセルユニット１４は、マイクアンプ３Ｌ、３Ｒ、Ａ／Ｄ変換器４Ｌ、４Ｒ、ＤＳＰまたはＣＰＵによる主処理部３３、メモリ部４０、パワーアンプ４２Ｌ、４２Ｒ、Ａ／Ｄ変換器４１Ｌ、４１Ｒ、モニタスイッチ４３を有する。
主処理部３３には、ノイズキャンセル部３４，ゲイン部３５、加算器３６Ｌ、３６Ｒ、ノイズサプレッション装置１、制御部３８、イコライザ３９、スイッチＳＷ１，ＳＷ２が設けられる。

まずメディアプレーヤ２０からの再生音楽等の音声信号は次のように処理される。
メディアプレーヤ２０からは、いわゆるヘッドホン出力としてのＬチャンネル、Ｒチャンネルの再生音声信号ＳＡ−Ｌ，ＳＡ−Ｒが供給される。
この再生音声信号ＳＡ−Ｌ，ＳＡ−Ｒは、Ａ／Ｄ変換器４１Ｌ、４１Ｒでデジタル信号化される。そしてイコライザ３９で振幅−周波数特性補正や位相−周波数特性補正、あるいはその両方などの音質補正がなされる。
イコライザ３９の補正処理は制御部３８からの制御信号に基づいて実行される。例えば周波数特性の指示などが制御信号によってなされる。

イコライザ３９で音質補正された再生音声信号ＳＡ−Ｌ，ＳＡ−Ｒは、Ｔｅ端子に接続されているスイッチＳＷ１，ＳＷ２を介して、それぞれ加算器３６Ｌ、３６Ｒに供給される。そして加算器３６Ｌ、３６Ｒでノイズ低減音声信号と加算されたうえで、パワーアンプ４２Ｌ、４２Ｒに供給される。
パワーアンプ４２Ｌ、４２Ｒはデジタルアンプで構成されても良いし、Ｄ／Ａ変換器とアナログアンプで構成されても良い。
そしてパワーアンプ４２Ｌ、４２Ｒからの出力が、スピーカ１３Ｌ、１３Ｒに対する駆動信号とされ、スピーカ１３Ｌ、１３Ｒから再生音声信号ＳＡ−Ｌ，ＳＡ−Ｒに基づく音声出力が行われる。

一方、上述のノイズキャンセルのための処理が次のように行われる。
マイク２Ｌ、２Ｒで集音された音声信号ＳｍＬ，ＳｍＲは、ノイズキャンセルユニット１４におけるマイクアンプ３Ｌ、３Ｒで増幅された後、Ａ／Ｄ変換器４Ｌ、４Ｒでデジタル信号化される。
Ａ／Ｄ変換器４Ｌ、４Ｒから出力されるデジタル化された音声信号ＳｍＬ，ＳｍＲは、ノイズキャンセル部３４に供給される。ノイズキャンセル部３４は上述したフィードフォワード方式でのノイズ低減音声信号を生成するデジタルフィルタとされる。このノイズキャンセル部３４は、制御部３８から制御信号で指示されるフィルタ係数で、音声信号ＳｍＬ，ＳｍＲのそれぞれについてのフィルタ処理を行い、Ｌチャンネル及びＲチャンネルのノイズ低減音声信号を生成する。

生成されたＬチャンネル及びＲチャンネルのノイズ低減音声信号はゲイン部３５に供給される。ゲイン部３５は、制御部３８からの制御信号で指示されるゲイン係数により、Ｌチャンネル及びＲチャンネルのノイズ低減音声信号に対するゲインを与える。
そしてゲイン部３５からのＬチャンネル及びＲチャンネルのノイズ低減音声信号は加算器３６Ｌ、３６Ｒに供給される、上述のように再生音声信号ＳＡ−Ｌ，ＳＡ−Ｒとそれぞれ加算される。
このようなノイズ低減音声信号が加算された再生音声信号ＳＡ−Ｌ，ＳＡ−Ｒにより、スピーカ１３Ｌ、１３Ｒから再生音声が出力されることで、上述のようなノイズ低減機能が発揮される。

制御部３８は、ノイズキャンセルユニットの全体を制御する。例えば上記のように制御信号によってイコライザ３９，ノイズキャンセル部３４，ゲイン部３５の制御を行う。またメディアプレーヤ２０に対して制御信号を送信することもできる。また制御部３８はスイッチＳＷ１，ＳＷ２の切換制御も行う。

メモリ部４０は、制御部３８が制御処理において参照する情報が記憶されている。例えばメモリ部４０には、ノイズキャンセル部３４やイコライザ３９におけるフィルタ係数の情報等が記憶されている。

本例のノイズキャンセルユニット１４は、さらに図１で述べた構成のノイズサプレッション装置１を備える。
Ａ／Ｄ変換器４Ｌ、４Ｒから出力されるデジタル化された音声信号ＳｍＬ，ＳｍＲは、ノイズサプレッション装置１に供給される。ノイズサプレッション装置１は図１〜図６で説明した構成及び動作を、入力された音声信号ＳｍＬ，ＳｍＲに対して行う。
従って、このノイズサプレッション装置１からは、正面方向からの音声が会話音声等の目的音声として強調され、他の方向からの音は減衰された出力信号Ｓｏｕｔが得られる。
出力信号ＳｏｕｔはスイッチＳＷ１，ＳＷ２のＴｎ端子に供給される。

特に本例では、制御部３８はユーザがモニタスイッチ４３により、モニタモードをオンとしたことを検知したときは、次のような制御を行う。
モニタモードがオンとされると、制御部３８は、スイッチＳＷ１，ＳＷ２をＴｎ端子に切り換える。なおモニタモードがオフであるときは、制御部３８はスイッチＳＷ１，ＳＷ２をＴｅ端子に接続しており、再生音楽がスピーカ１３Ｌ、１３Ｒから出力される状態としている。
また制御部３８はメディアプレーヤ２０に対して再生動作の停止を指示する。これによってメディアプレーヤ２０は再生を停止する。

制御部３８がこのように制御することで、加算器３６Ｌ、３６Ｒには、ノイズサプレッション装置１の出力信号Ｓｏｕｔが供給されることになる。
従って加算器３６Ｌ、３６Ｒではゲイン部３５からのノイズ低減音声信号と、ノイズサプレッション装置１の出力信号Ｓｏｕｔが加算され、パワーアンプ４２Ｌ、４２Ｒに供給される。そしてスピーカ１３Ｌ、１３Ｒから音声として出力される。
これは、モニタモードとして周囲のノイズは低減されながら、例えば正面方向からの会話音声は明瞭に聞き取れるようなスピーカ出力音となる。

このようにＮＣヘッドホン１０に本実施の形態のノイズサプレッション装置１を搭載した場合、モニタモード動作として、会話音声等を明瞭に聞き取れるスピーカ出力を実現できる。
即ちＮＣヘッドホン１０の使用時には、ノイズだけでなく人の声まで削減されてしまうが、上記の構成とすることで、マイク２Ｌ、２Ｒから等距離にある正面からの人の声は削減せず、周囲からのノイズを削減することができる。これによりＮＣヘッドホン１０をしたまま、より快適に会話することができる。

その上で、上述のようにノイズサプレッション装置１では音声ストリームへの制御は直列的なフィルタ処理で行っており、位相不整合による音質劣化は起こらず、音質劣化のない音声出力を実現できる。
また低計算量、低リソースの処理であることで、ノイズキャンセルユニット１４などの小型機器での搭載にも適している。
それに加えて、システム全体を低遅延で実装することが可能となる。
ＮＣヘッドホン１０のモニターモード機能においては、実際の直接音と、ノイズサプレッション装置１の処理後の音声は空間的に重なってユーザの耳に届く。このため処理遅延が大きいと不快なエコーとして聞こえてしまうが、ノイズサプレッション装置１が低遅延で処理できることで、このようなことを避けることが可能となる。

＜３．各種機器への適用例及び変形例＞

本実施の形態のノイズサプレッション装置１は、さらに多様な機器に適用できる。
例えば携帯電話機での送話ノイズリダクション機能に用いることが考えられる。
ノイズサプレッション装置１を、携帯電話用のヘッドセットに搭載することにより、マイクから等距離にある自分の口から発せられた声は削減されず、周囲のノイズを削減し、相手側へと音声を送ることが可能となる。
もちろん、パーソナルコンピュータ（ＰＣ）やテレビジョン受像器で行うボイスコミュニケーションも同様である。

また音声認識フロントエンドでの適用も考えられる。
昨今、携帯電話機や小型ＰＣなどで使われる音声認識機能付き「自動翻訳」などが日常的に使用できるような実用レベルまで来ており、今後、屋外でこのような機能は使われると考えられる。一方で屋外での音声入力は、音声認識の精度を落とすようなノイズが入ってくることも多い。
したがって、たとえば携帯型の機器の両端にマイクをつけて本実施の形態のノイズサプレッション装置１でフロントエンド処理を行うことで、自動翻訳システムが、ユーザの満足すべきシステムとなりえる。

またボーカル等の抜き出しシステムとしての適用も考えられる。
上述した実施の形態ではマイク入力としての応用であったが、ライン入力や音楽ファイルへの適用を考えることもできる。
例えばボーカルやドラム音などは、一般的な楽音ではセンターに定位するように作られるため、本実施の形態のノイズサプレッション装置１を適用すれば、これらボーカルやドラム音が分離できる。もちろん、この後に帯域をわければボーカル・ドラムの分離も可能である。

実施の形態の変形例も多様に考えられる。
図９にノイズサプレッション装置１としての構成の変形例を挙げる。これは、ＬチャンネルとＲチャンネルで独立した２系統の直列フィルタ群を設けた例である。
即ちＬチャンネルの音声信号ＳｍＬは、ＭＰＦ５８Ｌ，５９Ｌ，６０Ｌの直列フィルタ系に入力される。Ｒチャンネルの音声信号ＳｍＲは、ＭＰＦ５８Ｒ，５９Ｒ，６０Ｒの直列フィルタ系に入力される。
ＭＰＦ５８Ｌ、５８Ｒは、音源方向角度解析部５４の判定に基づく制御信号ＳＧ１によって、フィルタ特性が可変制御される。
ＭＰＦ５９Ｌ、５９Ｒは、音源方向角度解析部５５の判定に基づく制御信号ＳＧ２によって、フィルタ特性が可変制御される。
ＭＰＦ６０Ｌ、６０Ｒは、音源方向角度解析部５６の判定に基づく制御信号ＳＧ３によって、フィルタ特性が可変制御される。
つまり、動作は図１の構成と同様であるが、処理後の信号として、Ｌ／Ｒ２チャンネルの出力信号ＳｏｕｔＬ、ＳｏｕｔＲを出力する構成例である。
このような構成として、ノイズサプレッション装置１を各種機器に適用してもよい。

また図示しないが、３チャンネル以上のマイク入力音声について、音源方向判定を行なうことも考えられる。
その場合の直列フィルタ処理を行う音声信号は合成して１チャンネルとしても良いし、図８のように２チャンネルとしてもよい。さらには３チャンネル以上の各マイク入力音声信号をそれぞれ独立して直列フィルタ処理し、３チャンネル以上の出力信号Ｓｏｕｔを得るようにしても良い。
さらに、１系統の直列フィルタを設ける場合に、入力される複数チャンネルの音声信号のうち、１つのチャンネルの音声信号を供給することも考えられる。例えば図１のように１系統の直列フィルタ（ＭＰＦ５８，５９，６０）を設ける場合に、音声信号ＳｍＬのみをＭＰＦ５８，５９，６０のフィルタ群に供給し、出力信号Ｓｏｕｔを得るような構成である。

またバンドパスフィルタによる帯域分割数や、１つの帯域の帯域幅などは、搭載する機器や目的とする音声、使用形態などに応じて設定されることはいうまでもない。直列接続されるＭＰＦの数については、基本的にはバンドパスフィルタによる分割帯域の数に応じて設定される。
また実施の形態では正面又は後面からの音を目的の音として強調する処理を説明したが、例えば右側からの音を目的の音として強調し、他の方向からの音を低減させるような処理も可能である。これは例えば図４（ｂ）のように角度θが右領域の場合に、当該帯域を目的音声の帯域として対応するＭＰＦにブースト処理させ、角度θがセンター領域や左領域の帯域については、対応するＭＰＦにアッテネート処理させればよい。
つまり目的の音声の音源方向の設定はどのようにでも可能である。

また実施の形態では、図１のようにＡ／Ｄ変換器４Ｌ、４Ｒを設け、ノイズサプレッション装置１は、デジタルデータ処理を行うものとしたが、ＭＰＦ５８，５９，６０によるフィルタ処理やバンドパスフィルタによる帯域分割はアナログ信号処理で行っても良い。

１ノイズサプレッション装置、１Ａ音源方向判定部、１Ｂフィルタ処理部、２Ｌ，２Ｒマイク、３Ｌ，３Ｒマイクアンプ、４Ｌ，４ＲＡ／Ｄ変換器、１０ＮＣヘッドホン、１１ヘッドホン部、１３Ｌ、１３Ｒスピーカ、１４ノイズキャンセルユニット、２０メディアプレーヤ、３４ノイズキャンセル部、３５ゲイン部、３８制御部、３９イコライザ、５１Ｌ，５２Ｌ，５３Ｌ，５１Ｒ，５２Ｒ，５３Ｒバンドパスフィルタ、５４，５５，５６音源方向角度解析部、５８，５９，６０ＭＰＦ

Claims

複数チャンネルの音声信号について、第１〜第ｎの帯域毎に、それぞれ音源方向を判定する音源方向判定部と、
上記第１〜第ｎの帯域についての音声信号の強調又は減衰を行う直列接続された第１〜第ｎのフィルタを有し、上記第１〜第ｎのフィルタのそれぞれは、上記音源方向判定部で判定された第１〜第ｎの帯域の音源方向に基づいて強調又は減衰を行うフィルタ処理部とを備え、
上記音源方向判定部は、上記第１〜第ｎの帯域に対応する第１〜第ｎの音源方向角度解析部を含み、
上記第１〜第ｎの音源方向角度解析部のそれぞれは、上記第１〜第ｎのフィルタのそれぞれに１：１で対応し、対応するフィルタを強調又は減衰の処理の制御対象としており、上記第１〜第ｎの音源方向角度解析部のそれぞれは、対応する帯域の音源方向が所定角度範囲内の方向と判定したときに制御対象のフィルタに強調処理を実行させ、対応する帯域の音源方向角度が所定角度範囲内の方向ではないと判定したときに制御対象のフィルタに減衰処理を実行させるとともに、
上記第１〜第ｎの音源方向角度解析部のそれぞれは、音源方向が分散状態であると判定したときには、制御対象のフィルタに減衰処理を実行させる
音声信号処理装置。
上記第１〜第ｎの音源方向角度解析部のそれぞれは、対応する帯域について、各チャンネルの音声信号のエネルギー差分に基づいて音源方向を判定する請求項１に記載の音声信号処理装置。
上記フィルタ処理部の直列接続された第１〜第ｎのフィルタには、上記複数チャンネルの音声信号を合成した音声信号が入力される請求項１に記載の音声信号処理装置。
上記フィルタ処理部の直列接続された第１〜第ｎのフィルタには、上記複数チャンネルのうちの一のチャンネルの音声信号が入力される請求項１に記載の音声信号処理装置。
複数チャンネルの音声信号について、第１〜第ｎの帯域毎に、それぞれ音源方向を判定する音源方向判定ステップと、
上記第１〜第ｎの帯域についての音声信号の強調又は減衰を行う直列接続された第１〜第ｎのフィルタに音声信号を入力するとともに、上記第１〜第ｎのフィルタのそれぞれが、上記音源方向判定ステップで判定された第１〜第ｎの帯域の音源方向に基づいて強調又は減衰を行うフィルタ処理ステップとが行われ、
上記フィルタ処理ステップは、上記第１〜第ｎの帯域における、対応する帯域の音源方向が上記音源方向判定ステップにより所定角度範囲内の方向と判定されたときに制御対象のフィルタに強調処理を実行し、対応する帯域の音源方向角度が上記音源方向判定ステップにより所定角度範囲内の方向ではないと判定されたときに制御対象のフィルタに減衰処理を実行するとともに、上記第１〜第ｎの帯域における、対応する帯域の音源方向が上記音源方向判定ステップにより分散状態であると判定されたときには、制御対象のフィルタに減衰処理を実行する
音声信号処理方法。