JP2018037844A

JP2018037844A - 収音装置、プログラム及び方法

Info

Publication number: JP2018037844A
Application number: JP2016169349A
Authority: JP
Inventors: 一浩片桐; Kazuhiro Katagiri
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2016-08-31
Filing date: 2016-08-31
Publication date: 2018-03-08
Anticipated expiration: 2036-08-31
Also published as: JP6241520B1; WO2018042773A1

Abstract

【課題】エリア収音を行う際のミュージカルノイズ等を抑制する。
【解決手段】本発明は、収音装置に関する。そして本発明の収音装置は、入力信号からビームフォーマにより目的エリア方向に指向性を形成する指向性形成手段と、指向性形成手段で形成された指向性による目的エリア方向に存在する非目的エリア音を抽出する非目的エリア音抽出手段と、非目的エリア音抽出手段で抽出された非目的エリア音とビームフォーマの出力に入力信号の位相情報を用いて、非目的エリア音の位相を反転させ、ビームフォーマの出力に加算する目的エリア音強調手段とを有することを特徴とする。
【選択図】図１

Description

本発明は、収音装置、プログラム及び方法に関し、例えば特定のエリアの音を強調し、それ以外のエリアの音を抑圧する装置に適用し得る。

複数の音源が存在する環境下において、ある特定の方向の音のみ分離し収音する技術として、マイクロホンアレイを用いたビームフォーマ（ＢｅａｍＦｏｒｍｅｒ；以下ＢＦ）がある。ＢＦとは、各マイクロホンに到達する信号の時間差を利用して指向性を形成する技術である（非特許文献１参照）。ＢＦは、加算型と減算型の大きく２つの種類に分けられる。

特に減算型ＢＦは、加算型ＢＦに比べ、少ないマイクロホン数で指向性を形成できるという利点がある。

図７は、従来の減算型ＢＦに係る構成を示すブロック図である。

図７に示す従来の減算型ＢＦでは、マイクロホン数が２個となっている。

従来の減算型ＢＦは、まず遅延器により目的とする方向に存在する音（以下、「目的音」とも呼ぶ）が各マイクロホンに到来する信号の時間差を算出し、遅延を加えることにより目的音の位相を合わせる。従来の減算型ＢＦの遅延器では、時間差は下記（１）式により算出される。

下記の（１）式において、ｄはマイクロホン間の距離、ｃは音速、τ_ｉは遅延量である。また、下記の（１）式において、θ_Ｌは、各マイクロホンを結んだ直線に対する垂直方向から目的方向への角度である。
τ_Ｌ＝（ｄｓｉｎθ_Ｌ）／ｃ …（１）

ここで、死角が第１のマイクロホンと第２のマイクロホンの中心に対し、第１のマイクロホンの方向に存在する場合、従来の減算型ＢＦにおける遅延器は、第１のマイクロホンの入力信号ｘ_１（ｔ）に対し遅延処理を行う。その後、遅延処理された入力信号ｘ_１（ｔ）は、（２）式に従い減算処理される。
ｍ_１（ｔ）＝ｘ_２（ｔ）−ｘ_１（ｔ−τ_Ｌ） …（２）

従来の減算型ＢＦにおける減算処理は、周波数領域でも同様に行うことができ、その場合（２）式は以下の（３）式のように変更される。

ここでθ_Ｌ＝±π／２の場合、形成される指向性は図８（Ａ）に示すように、カージオイド型の単一指向性となり、θ_Ｌ＝０，πの場合は、図８（Ｂ）のような８の字型の双指向性となる。以下では、入力信号から単一指向性を形成するフィルタを単一指向性フィルタ、双指向性を形成するフィルタを双指向性フィルタと呼ぶものとする。

また、従来の収音装置において、スペクトル減算法（ＳｐｅｃｔｒａｌＳｕｂｔｒａｃｔｉｏｎ；以下「ＳＳ」とも呼ぶ）を用いることで、双指向性の死角に強い指向性を形成することもできる。ＳＳによる指向性は、（４）式に従い全周波数、もしくは指定した周波数帯域で形成される。（４）式では、第１のマイクロホンの入力信号Ｘ_１を用いているが、第２のマイクロホンの入力信号Ｘ_２でも同様の効果を得ることができる。ここでβはＳＳの強度を調節するための係数である。減算時に値がマイナスなった場合は、０または元の値を小さくした値に置き換えるフロアリング処理を行う。この方式は、双指向性フィルタにより目的方向以外に存在する音（以下、「非目的音」とも呼ぶ）を抽出し、抽出した非目的音の振幅スペクトル｜Ｍ_１｜を入力信号の振幅スペクトル｜Ｘ_１｜から減算することで、目的音｜Ｙ_１｜を強調することができる。なお周波数毎の振幅スペクトル｜Ｘ_１ｋ｜，｜Ｍ_１ｋ｜は（５）式及び（６）式から算出する。ここでＲｅとＩｍはそれぞれ実数部と虚数部、ｋは周波数を表している。

ある特定のエリア内（収音対象のエリア内）に存在する音（以下、「目的エリア音」と呼ぶ）だけを収音したい場合、従来の減算型ＢＦの指向性は直線的に形成されるため、その指向性を目的エリア方向に向けるだけでは、目的エリアの外に存在する音源（以下、「非目的エリア音」と呼ぶ）であっても、目的エリア方向に存在する音源は全て収音してしまう。

そこで特許文献１では、複数のマイクロホンアレイを用い、それぞれ別々の方向から目的エリアへ指向性を向け、指向性を目的エリアで交差させることで目的エリア音を収音する手法（エリア収音）を提案している。

特許文献１に記載されたエリア収音手法では、まず、各マイクロホンアレイのＢＦ出力に含まれる目的エリア音のパワーの比率を推定し、それを補正係数とする。例えば、２つのマイクロホンアレイを用いて、特許文献１に記載されたエリア収音を行う場合、目的エリア音パワーの補正係数は、（７）式または（８）式により算出される。

（７）式、（８）式において、｜Ｙ_１ｋ｜は第１のマイクロホンアレイのＢＦ出力の振幅スペクトル、｜Ｙ_２ｋ｜は第２のマイクロホンアレイのＢＦ出力の振幅スペクトル、ｍは周波数ビンの総数、α_１はＢＦ出力に対するパワー補正係数である。また、（７）式、（８）式において、ｍｏｄｅは最頻値、ｍｅｄｉａｎは中央値を表している。

特許文献１に記載されたエリア収音手法では、その後、補正係数により各ＢＦ出力を補正し、ＳＳすることで、目的エリア方向に存在する非目的エリア音を抽出する。特許文献１に記載されたエリア収音手法では、更に抽出した非目的エリア音を各ＢＦの出力からＳＳすることにより目的エリア音を抽出することができる。

そして、特許文献１に記載されたエリア収音手法では、第１のマイクロホンアレイからみた目的エリア方向に存在する非目的エリア音｜Ｎ_１｜を抽出する際、（９）式に示すように、第１のマイクロホンアレイのＢＦ出力｜Ｙ_１｜から、第２のマイクロホンアレイのＢＦ出力｜Ｙ_２｜にパワー補正係数α_１を掛けたものをＳＳする。
｜Ｎ_１｜＝｜Ｙ_１｜−α_１｜Ｙ_２｜ …（９）

その後、特許文献１に記載されたエリア収音手法では、（１０）式に従い、ＢＦ出力から非目的エリア音をＳＳして目的エリア音を抽出する。γ_１はＳＳ時の強度を変更するための係数である。
｜Ｚ_１｜＝｜Ｙ_１｜−γ_１｜Ｎ_１｜ …（１０）

特開２０１４−７２７０８号公報

浅野太著，"音響テクノロジーシリーズ１６音のアレイ信号処理−音源の定位・追跡と分離−"，日本音響学会編，コロナ社，２０１１年２月２５日発行

しかしながら、特許文献１のエリア収音手法では、背景雑音や非目的エリア音の音量レベルが大きい場合、目的エリア音抽出の際にＳＳを行うと、雑音の引き残しによりミュージカルノイズという耳障りな異音が発生したり、非目的エリア音だけでなく目的エリア音も抑圧してしまい音が歪んだりする可能性がある。

そのため、特許文献１のエリア収音手法では、これらの影響により音が聞き取り難くなり、音による円滑なコミュニケーションが阻害される恐れがある。

そのため、エリア収音を行う際のミュージカルノイズ等を抑制することができる収音装置、プログラム及び方法が望まれている。

第１の本発明の収音装置は、（１）入力信号からビームフォーマにより目的エリア方向に指向性を形成する指向性形成手段と、（２）前記指向性形成手段で形成された指向性による目的エリア方向に存在する非目的エリア音を抽出する非目的エリア音抽出手段と、（３）前記非目的エリア音抽出手段で抽出された非目的エリア音と前記ビームフォーマの出力に前記入力信号の位相情報を用いて、前記非目的エリア音の位相を反転させ、前記ビームフォーマの出力に加算する目的エリア音強調手段とを有することを特徴とする。

第２の本発明の収音プログラムは、コンピュータを、（１）入力信号からビームフォーマにより目的エリア方向に指向性を形成する指向性形成手段と、（２）前記指向性形成手段で形成された指向性による目的エリア方向に存在する非目的エリア音を抽出する非目的エリア音抽出手段と、（３）前記非目的エリア音抽出手段で抽出された非目的エリア音と前記ビームフォーマの出力に前記入力信号の位相情報を用いて、前記非目的エリア音の位相を反転させ、前記ビームフォーマの出力に加算する目的エリア音強調手段として機能させることを特徴とする。

第３の本発明は、収音装置が行う収音方法において、（１）指向性形成手段、非目的エリア音抽出手段、及び目的エリア音強調手段を有し、（２）前記指向性形成手段は、入力信号からビームフォーマにより目的エリア方向に指向性を形成し、（３）前記非目的エリア音抽出手段は、前記指向性形成手段で形成された指向性による目的エリア方向に存在する非目的エリア音を抽出し、（４）前記目的エリア音強調手段は、前記非目的エリア音抽出手段で抽出された非目的エリア音と前記ビームフォーマの出力に前記入力信号の位相情報を用いて、前記非目的エリア音の位相を反転させ、前記ビームフォーマの出力に加算することを特徴とする。

本発明によれば、エリア収音を行う際のミュージカルノイズ等を抑制することができる。

第１の実施形態に係る収音装置の機能的構成について示したブロック図である。第１の実施形態に係る２つのマイクロホンアレイのビームフォーマ（ＢＦ）による指向性を別々の方向から目的エリアへ向けた場合の構成例について示した説明図である。第１の実施形態に係る収音装置で処理するＢＦ出力の例について示した説明図である。第１の実施形態に係る収音装置の性能を確認するための実験結果について示した説明図である。第２の実施形態に係る収音装置の機能的構成について示したブロック図である。第３の実施形態に係る収音装置の機能的構成について示したブロック図である。従来の収音装置の構成について示したブロック図である。従来の指向性フィルタにより形成される指向特性の一例を説明する説明図である。

（Ａ）第１の実施形態
以下、本発明による収音装置、プログラム及び方法の第１の実施形態を、図面を参照しながら詳述する。

（Ａ−１）第１の実施形態の構成
図１は、この実施形態の収音装置１００の機能的構成について示したブロック図である。

収音装置１００は、２つのマイクロホンアレイＭＡ（ＭＡ１、ＭＡ２）を用いて、目的エリアの音源からの目的エリア音を収音する目的エリア音収音処理を行う。

マイクロホンアレイＭＡ１、ＭＡ２は、目的エリアが存在する空聞の任意の場所に配置される。目的エリアに対するマイクロホンアレイＭＡ１、ＭＡ２の位置は、例えば、図２に示すように、指向性が目的エリアでのみ重なればどこでも良く、例えば目的エリアを挟んで対向に配置しても良い。各マイクロホンアレイＭＡは２つ以上のマイクロホンＭから構成され、各マイクロホンＭにより音響信号を収音する。この実施形態では、各マイクロホンアレイＭＡに、音響信号を収音する２つのマイクロホンＭ（Ｍ１、Ｍ２）が配置されるものとして説明する。すなわち、各マイクロホンアレイＭＡは、２ｃｈマイクロホンアレイを構成している。なお、マイクロホンアレイＭＡの数は２つに限定するものではなく、目的エリアが複数存在する場合、全てのエリアをカバーできる数のマイクロホンアレイＭＡを配置する必要がある。なお、この実施系他愛では、マイクロホンアレイの代わりにショットガンマイクなどの指向性マイクロホンを使用するようにしてもよい。

収音装置１００は、信号入力部１、指向性形成部２、遅延補正部３、空間座標データ４、目的エリア音パワー補正係数算出部５、非目的エリア音抽出部６、目的エリア音強調部７を有している。収音装置１００を構成する各機能ブロックの詳細処理については後述する。

収音装置１００は、全てハードウェア（例えば、専用チップ等）により構成するようにしてもよいし一部又は全部についてソフトウェア（プログラム）として構成するようにしてもよい。収音装置１００は、例えば、プロセッサ及びメモリを有するコンピュータにプログラム（実施形態の収音プログラムを含む）をインストールすることにより構成するようにしてもよい。

（Ａ−２）第１の実施形態の動作
次に、以上のような構成を有する第１の実施形態の収音装置１００の動作（実施形態に係る収音方法）を説明する。

信号入力部１は、各マイクロホンアレイＭＡ１、ＭＡ２で収音した音響信号をアナログ信号からデジタル信号に変換する。そして、信号入力部１は、当該デジタル信号について、変換処理（例えば、高速フーリエ変換等を用いて時間領域から周波数領域へ変換する処理）を行う。

指向性形成部２は、マイクロホンアレイＭＡ毎に、目的方向以外に存在する非目的エリア音を抽出（例えば、双指向性フィルタにより抽出）し、抽出した非目的エリア音の振幅スペクトルを入力信号の振幅スペクトルから減算することで、目的エリア方向に指向性を形成した音（ＢＦ出力）を取得する。具体的には、指向性形成部２は、マイクロホンアレイＭＡ毎に雑音抑圧部８により背景雑音を抑圧した信号に対し、（４）式に従いＢＦにより目的エリア方向に指向性を形成した音をＢＦ出力として取得する。なお、入力される信号が、マイクロホンアレイＭＡではなく、指向性マイクロホンから入力される信号である場合、指向性形成部２の処理を省略して、入力信号をそのまま後段側に供給するようにしてもよい。

遅延補正部３は、目的エリアと各マイクロホンアレイの距離の違いにより発生する遅延を算出し、補正する。まず空間座標データ４から目的エリアの位置とマイクロホンアレイの位置を取得し、各マイクロホンアレイへの目的エリア音の到達時間の差を算出する。次に最も目的エリアから遠い位置に配置されたマイクロホンアレイを基準として、全てのマイクロホンアレイに目的エリア音が同時に到達するように遅延を加える。

空間座標データ４は、全ての目的エリアと各マイクロホンアレイと各マイクロホンアレイを構成するマイクロホンの位置情報を保持する。

目的エリア音パワー補正係数算出部５は、各ＢＦ出力に含まれる目的エリア音成分のパワーを同じにするための補正係数を上記の（７）式または（８）式に従い算出する。

非目的エリア音抽出部６は、目的エリア音パワー補正係数算出部５で算出した補正係数により補正した各ＢＦ出力データを以下の（９）式に従いＳＳし、目的エリア方向に存在する非目的エリア音を抽出する。

目的エリア音強調部７は、ミュージカルノイズ発生の原因になり得る目的エリア音抽出時のＳＳを行わず、位相情報を用いて非目的エリア音を抑圧し、目的エリア音を強調する。

入力信号の位相情報は、離散フーリエ変換を行った入力信号の実数部と虚数部をそれぞれ入力信号の振幅スペクトルで除算して得ることが出来る。目的エリア音強調部７では、この位相情報を非目的エリア音とＢＦ出力の振幅スペクトルに乗算することで、入力信号と同じ位相を持たせることができる。入力信号の位相情報には、もともとＢＦにおける目的音の位相が含まれている。ＢＦ出力には目的エリア音と非目的エリア音が含まれているので、ＢＦ出力に入力信号の位相情報を付与すれば、ＢＦ出力中の目的エリア音と非目的エリア音の位相が復元することができる。また、目的エリア音強調部７では、同様に抽出した非目的エリア音の位相も復元することができる。このことから、目的エリア音強調部７では、抽出した非目的エリア音の位相を逆位相にしてＢＦ出力と足し合わせれば、ＢＦ出力中の非目的エリア音成分は、抽出した非目的エリア音成分と打ち消し合って抑圧される。その結果、目的エリア音強調部７では、ＢＦ出力中の目的エリア音のみを強調することが可能となる。

以下、目的エリア音強調部７の具体的な処理の例について説明する。

上述の通り、エリア収音処理の過程で抽出された非目的エリア音は、振幅スペクトルであり位相情報が失われているので、目的エリア音強調部７では、これに入力信号の位相情報を付与する。また、ＢＦ出力も振幅スペクトルなので、目的エリア音強調部７は、同様に入力信号の位相情報を与える。

目的エリア音強調部７は、具体的には以下の（１１）式に従い、抽出した非目的エリア音｜Ｎ_１｜に入力信号の位相情報を与える。また、目的エリア音強調部７は、以下のお（１２）式に従い、ＢＦ出力｜Ｙ_１｜にも入力信号の位相情報を与える。

目的エリア音強調部７は、その後、全帯域もしくは制限した帯域で（１３）式に従い非目的エリア音の位相を反転させ、ＢＦ出力に足し合わせてＢＦ出力中の非目的エリア音成分を抑圧し、目的エリア音を強調する。ここでμ_１は非目的エリア音の振幅の大きさを制御する係数である。目的エリア音強調部７では、非目的エリア音の抑圧は、周波数領域で行っても良いし、逆フーリエ変換により時間領域に戻した後に行っても良い。

（Ａ−３）第１の実施形態の効果
この実施形態によれば、以下のような効果を奏することができる。

第１の実施形態の収音装置１００では、非目的エリア音の抑圧に、ミュージカルノイズ発生の原因になり得る目的エリア音抽出時のＳＳを行わずに、ＢＦ出力中の非目的エリア音成分に対して、抽出した非目的エリア音を逆位相にして打ち消すことにより目的エリア音を強調している。これにより、第１の実施形態の収音装置１００では、ミュージカルノイズの発生を低減し、かつ、目的エリア音を抑圧して歪ませてしまうことを低減するという効果を奏する。非目的エリア音を逆位相にして打ち消す処理は、ＳＳのように非線形的な処理ではなく線形的な処理となるため、ＳＳのようにミュージカルノイズを発生させることを抑制することができる。

次に、出願人が実際に第１の実施形態の収音装置１００を構築して行った実験（以下、「本実験」と呼ぶ）について図４、図５のグラフを用いて説明する。

図４は、本実験において目的エリア音強調部７で処理される信号のスペクトルについて示したグラフである。図４（ａ）は、本実験において目的エリア音強調部７に供給されたＢＦ出力のスペクトルについて示したグラフである。図４（ｂ）は、図４（ａ）に示すＢＦ出力に含まれる目的エリア音のスペクトルについて示したグラフである。

図５は、この実施形態の収音装置１００（目的エリア音強調部７）を用いて、非目的エリア音を抑圧して目的エリア音を強調した場合の性能について示したグラフである。

図５（ａ）は、従来のスペクトル減算（ＳＳ）により、図４（ａ）に示すＢＦ出力から非目的エリア音を抑圧して目的エリア音を強調した信号のスペクトルについて示したグラフである。

一方、図５（ｂ）は、目的エリア音強調部７を用いて、図４（ａ）に示すＢＦ出力から非目的エリア音を抑圧して目的エリア音を強調した信号のスペクトルについて示したグラフである。すなわち、図５（ｂ）に示すスペクトルは、図４（ａ）に示すＢＦ出力から、非目的エリア音を逆位相にして打ち消した結果について示している。

図５に示す実験結果から、グラフ上の見た目では、この実施形態の非目的エリア音の抑圧方式（ＢＦ出力から非目的エリア音を逆位相にして打ち消す方式）を用いても、従来のスペクトル減算（ＳＳ）と非目的エリア音の抑圧性能は同程度であることが分かる。したがって、図５に示す実験結果から、この実施形態の非目的エリア音の抑圧方式（ＢＦ出力から非目的エリア音を逆位相にして打ち消す方式）を用いた場合でも、従来のスペクトル減算（ＳＳ）と比較して非目的エリア音の抑圧性能を維持しつつ、ミュージカルノイズや目的エリア音の歪みの発生を抑制することができるということが分かる。

（Ｂ）第２の実施形態
以下、本発明による収音装置、プログラム及び方法の第２の実施形態を、図面を参照しながら詳述する。

（Ｂ−１）第２の実施形態の構成
図５は、この実施形態の収音装置１００Ａの機能的構成について示したブロック図である。図５では、上述の図１と同一部分又は対応部分に同一符号又は対応符号を付している。

以下では、第２の実施形態の収音装置１００Ａについて、第１の実施形態との差異を説明する。

収音装置１００Ａでは、目的エリア音強調部７が目的エリア音強調部７Ａに置き換わり、さらに、雑音抑圧部８が追加されている点で、第１の実施形態と異なっている。

雑音抑圧部８は、信号入力部１で取得した信号に含まれる背景雑音の成分を推定して抑圧する処理を行う。また、雑音抑圧部８は、圧背景雑音のレベルを、目的エリア音強調部７Ａに供給する。

目的エリア音強調部７Ａは、背景雑音のレベルと非目的エリア音の振幅スペクトルの値に基づき、上記の（１３）式におけるμ_１を更新する処理を行う。

（Ｂ−２）第２の実施形態の動作
次に、以上のような構成を有する第２の実施形態の収音装置１００Ａの動作を説明する。

以下では、第２の実施形態の収音装置１００Ａについて、第１の実施形態との差異点についてのみ説明する。

雑音抑圧部８は、信号入力部１で取得した信号に含まれる背景雑音の成分を推定し、雑音抑圧後の信号を、指向性形成部２に供給する。雑音抑圧部８において、雑音抑圧には、例えばＳＳやウィーナーフィルタリング法（Ｗｉｅｎｅｒｆｉｌｔｅｒｉｎｇ）などを用いることができる。

目的エリア音強調部７Ａは、雑音抑圧部８において推定した背景雑音のレベルと非目的エリア音抽出部６で抽出した非目的エリア音の振幅スペクトルの値から上記の（１３）式のμ_１を更新する。

背景雑音が大きく雑音抑圧部８で背景雑音が抑圧しきれない場合、上記の（９）式により抽出した非目的エリア音の振幅スペクトルが小さくなる可能性がある。この状態では上記の（１３）式による非目的エリア音の抑圧効果が弱くなるため、目的エリア音強調部７Ａは、雑音抑圧部８で推定した背景雑音のレベルに比例してμ_１の値を大きくすることが望ましい。なお非目的エリア音の振幅スペクトルが予め設定した閾値Τ_１よりも小さい場合、目的エリア音強調部７Ａは、目的エリア音が存在していないとみなし、μ_１を初期値（予め設定された所定の初期値）に戻すようにしてもよい。

（Ｂ−３）第２の実施形態の効果
第２の実施形態によれば、第１の実施形態と比較して以下のような効果を奏することができる。

第２の実施形態の収音装置１００Ａでは、雑音抑圧部８を追加することで、入力信号の背景雑音を抑制した上で目的エリア音の強調を行うため、目的エリア音の音声等がより強調されることになる。

また、第２の実施形態の収音装置１００Ａでは、雑音抑圧部８で推定した背景雑音のレベルに比例して、μ_１（非目的エリア音の振幅の大きさを制御する係数）の値を大きくしている。これにより、第２の実施形態の収音装置１００Ａでは、背景雑音が大きく雑音抑圧部８で背景雑音が抑圧しきれない場合であっても、十分に非目的エリア音を抑圧（目的エリア音を強調）する係数μ_１を設定することが可能となる。

（Ｃ）第３の実施形態
以下、本発明による収音装置、プログラム及び方法の第３の実施形態を、図面を参照しながら詳述する。

（Ｃ−１）第３の実施形態の構成
図６は、この実施形態の収音装置１００Ｂの機能的構成について示したブロック図である。図６では、上述の図２と同一部分又は対応部分に同一符号又は対応符号を付している。

以下では、第３の実施形態の収音装置１００Ｂについて、第２の実施形態との差異を説明する。

収音装置１００Ｂでは、目的エリア音強調部７Ａが目的エリア音強調部７Ｂに置き換わっている点で、第２の実施形態と異なっている。

目的エリア音強調部７Ｂは、位相による非目的エリア音の抑圧と、ＳＳによる非目的エリア音の抑圧を状況により切替えて目的エリア音を強調する。

目的エリア音強調部７Ｂは、位相による非目的エリア音の抑圧処理を行う非目的エリア音位相抑圧部７−１と、ＳＳによる非目的エリア音の抑圧処理を行う非目的エリア音スペクトル減算部７−２とを有し、いずれか一方に切り替えて非目的エリア音の抑圧（目的エリア音の強調）を行う。

（Ｃ−２）第３の実施形態の動作
次に、以上のような構成を有する第３の実施形態の収音装置１００Ｂの動作を説明する。

以下では、第３の実施形態の収音装置１００Ｂについて、第２の実施形態との差異点についてのみ説明する。

目的エリア音強調部７Ｂは、雑音抑圧部８で推定した背景雑音のレベルと非目的エリア音抽出部６で抽出した非目的エリア音の振幅スペクトルの値から、非目的エリア音位相抑圧部７−１と非目的エリア音スペクトル減算部７−２を切替えて非目的エリア音の抑圧を行う。

非目的エリア音位相抑圧部７−１は、上記の（１３）式に従い非目的エリア音の抑圧を行い、非目的エリア音スペクトル減算部７−２は上記の（１０）式に従い非目的エリア音の抑圧を行う。

目的エリア音強調部７Ｂにおいて、これらの処理の切り替え条件は限定されないものである。目的エリア音強調部７Ｂは、例えば、「背景雑音のレベルが閾値Τ_２よりも小さい」、かつ、「非目的エリア音の振幅スペクトルが閾値Τ_３よりも小さい」という条件を満たす場合に、非目的エリア音スペクトル減算部７−２による非目的エリア音の抑圧を行い、上述の条件を満たさない場合に非目的エリア音位相抑圧部７−１による非目的エリア音の抑圧処理を行うようにしてもよい。なおμ_１を設定する際の非目的エリア音の振幅スペクトルの閾値Τ_１とΤ_３の関係はΤ_１＜Τ_３とする。

（Ｃ−３）第３の実施形態の効果
第３の実施形態によれば、以下のような効果を奏することができる。

第３の実施形態の収音装置１００Ｂでは、雑音抑圧部８で推定した背景雑音のレベルと非目的エリア音抽出部６で抽出した非目的エリア音の振幅スペクトルの値に基づき、非目的エリア音位相抑圧部７−１と非目的エリア音スペクトル減算部７−２のうち、適切な手法（より高品質な処理を行うことができる手法）を選択して、非目的エリア音の抑圧（目的エリア音の強調）に適用している。

具体的には、第３の実施形態の収音装置１００Ｂでは、背景雑音や非目的エリア音の音量レベルが大きい場合に、非目的エリア音位相抑圧部７−１を適用することで、雑音の引き残しによりミュージカルノイズの発生や、目的エリア音も抑圧してしまうことを低減している。また、第３の実施形態の収音装置１００Ｂでは、背景雑音や非目的エリア音の音量レベルが小さい場合に非目的エリア音スペクトル減算部７−２を適用することで、精度良く非目的エリア音の抑圧を行うことができる。また、背景雑音や非目的エリア音の音量レベルが小さい場合には、ＳＳによる目的エリア音の抑圧処理を行っても、ミュージカルノイズの発生や目的エリア音も抑圧してしまうことを低減することができ、さらに、非目的エリア音位相抑圧部７−１による処理よりも精度よく非目的エリア音の抑圧を行うことができる。

（Ｄ）他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。

（Ｄ−１）第２の実施形態の収音装置１００Ａにおいて、雑音抑圧部８を、信号入力部１で取得した信号に含まれる背景雑音の成分を推定して背景雑音レベルの取得のみを行い目的エリア音強調部７に供給する手段（以下、「推定手段」と呼ぶ）に置き換えるようにしてもよい。この場合、第１の実施形態と同様に、信号入力部１から出力される信号は、そのまま指向性形成部２に供給される。

また、第３の実施形態の１００Ｂにおいても同様に、雑音抑圧部８を、信号入力部１で取得した信号に含まれる背景雑音の成分を推定して背景雑音レベルの取得のみを行い目的エリア音強調部７に供給する推定手段に置き換えるようにしてもよい。

（Ｄ−２）第３の実施形態において、目的エリア音強調部７Ｂでは、非目的エリア音位相抑圧部７−１と非目的エリア音スペクトル減算部７−２の処理を同時に行い、それぞれの出力を混合して最終出力としても良い。

（Ｄ−３）第３の実施形態において、目的エリア音強調部７Ｂは、背景雑音のレベル及び非目的エリア音の振幅スペクトルを考慮して、非目的エリア音の抑圧手法（非目的エリア音位相抑圧部７−１又は、非目的エリア音スペクトル減算部７−２）を選択しているが、背景雑音のレベル又は非目的エリア音の振幅スペクトルの一方のみを用いて、非目的エリア音の抑圧手法を選択するようにしてもよい。

例えば、目的エリア音強調部７Ｂは、背景雑音のレベルが閾値Τ_２よりも小さい場合に、非目的エリア音スペクトル減算部７−２を選択し、そうでない場合に非目的エリア音位相抑圧部７−１を選択するように構成してもよい。また、目的エリア音強調部７Ｂは、非目的エリア音の振幅スペクトルが閾値Τ_３よりも小さい場合に、非目的エリア音スペクトル減算部７−２を選択し、そうでない場合に非目的エリア音位相抑圧部７−１を選択するように構成してもよい。

１００、１００Ａ、１００Ｂ…収音装置、１…信号入力部、２…指向性形成部、３…遅延補正部、４…空間座標データ、５…目的エリア音パワー補正係数算出部、６…目的エリア音抽出部、７、７Ａ、７Ｂ…目的エリア音強調部、７−１…非目的エリア音位相抑圧部、７−２…非目的エリア音スペクトル減算部。

Claims

入力信号からビームフォーマにより目的エリア方向に指向性を形成する指向性形成手段と、
前記指向性形成手段で形成された指向性による目的エリア方向に存在する非目的エリア音を抽出する非目的エリア音抽出手段と、
前記非目的エリア音抽出手段で抽出された非目的エリア音と前記ビームフォーマの出力に前記入力信号の位相情報を用いて、前記非目的エリア音の位相を反転させ、前記ビームフォーマの出力に加算する目的エリア音強調手段と
を有することを特徴とする収音装置。
前記入力信号に含まれる背景雑音レベルを推定する推定手段をさらに有し、
前記目的エリア音強調手段は、前記推定手段が推定した背景雑音レベルと、前記非目的エリア音抽出手段で抽出された非目的エリア音の振幅スペクトルの値とに基づいて、前記ビームフォーマの出力に加算する非目的エリア音の振幅の大きさを制御する制御係数を更新する
ことを特徴とする請求項１に記載の収音装置。
非目的エリア音の振幅スペクトルが第１の閾値以下の場合、前記制御係数を所定の初期値に戻すことを特徴とする請求項２に記載の収音装置。
前記入力信号に含まれる背景雑音レベルを推定する推定手段をさらに有し、
前記目的エリア音強調手段は、
前記非目的エリア音抽出手段で抽出された非目的エリア音と前記ビームフォーマの出力に前記入力信号の位相情報を用いて、前記非目的エリア音の位相を反転させ、前記ビームフォーマの出力に加算する第１の抑圧手段と、
前記ビームフォーマの出力から前記非目的エリア音に基づく信号をスペクトル減算することで、前記ビームフォーマの出力の非目的エリア音の成分を抑圧する第２の抑圧手段とを有し、
前記目的エリア音強調手段は、前記推定手段が推定した背景雑音レベルと、前記非目的エリア音抽出手段で抽出された非目的エリア音の振幅スペクトルの値とに基づいて、前記第１の抑圧手段又は前記第２の抑圧手段のいずれかを選択して前記ビームフォーマの出力における非目的エリア音の成分を抑圧する
ことを特徴とする請求項１に記載の収音装置。
前記目的エリア音強調手段は、背景雑音のレベルが第２の閾値よりも小さい、かつ、非目的エリア音の振幅スペクトルが第３の閾値よりも小さいという所定の条件を満たす場合に、前記第２の抑圧手段を選択し、前記所定の条件を満たさない場合に前記第１の抑圧手段を選択することを特徴とする請求項４に記載の収音装置。
コンピュータを、
入力信号からビームフォーマにより目的エリア方向に指向性を形成する指向性形成手段と、
前記指向性形成手段で形成された指向性による目的エリア方向に存在する非目的エリア音を抽出する非目的エリア音抽出手段と、
前記非目的エリア音抽出手段で抽出された非目的エリア音と前記ビームフォーマの出力に前記入力信号の位相情報を用いて、前記非目的エリア音の位相を反転させ、前記ビームフォーマの出力に加算する目的エリア音強調手段と
して機能させることを特徴とする収音プログラム。
収音装置が行う収音方法において、
指向性形成手段、非目的エリア音抽出手段、及び目的エリア音強調手段を有し、
前記指向性形成手段は、入力信号からビームフォーマにより目的エリア方向に指向性を形成し、
前記非目的エリア音抽出手段は、前記指向性形成手段で形成された指向性による目的エリア方向に存在する非目的エリア音を抽出し、
前記目的エリア音強調手段は、前記非目的エリア音抽出手段で抽出された非目的エリア音と前記ビームフォーマの出力に前記入力信号の位相情報を用いて、前記非目的エリア音の位相を反転させ、前記ビームフォーマの出力に加算する
ことを特徴とする収音装置。