JP2020010196A

JP2020010196A - 方向別収音装置及びプログラム

Info

Publication number: JP2020010196A
Application number: JP2018130035A
Authority: JP
Inventors: 陽佐々木; Akira Sasaki
Original assignee: Nippon Hoso Kyokai NHK; Japan Broadcasting Corp
Current assignee: Japan Broadcasting Corp
Priority date: 2018-07-09
Filing date: 2018-07-09
Publication date: 2020-01-16
Anticipated expiration: 2038-07-09
Also published as: JP7112269B2

Abstract

【課題】事前に観測、或いは予測した各マイクロホンの方向毎の感度等の先験情報を用いることなく、複数個のマイクロホンを用いて収音した複数方向の音源信号を個別に低雑音化して抽出する方向別収音装置及びプログラムを提供する。【解決手段】本発明の方向別収音装置１は、複数個のマイクロホン１０を用いて収音した複数方向の音源信号についてそれぞれ周波数領域の観測信号に変換するＤＦＴ処理部２０、各観測信号についてＰＳＤを算出するＰＳＤ算出部３０、感度比推定部４３により推定算出した所定の複素感度比及びＰＳＤ和推定部５０により推定算出したＰＳＤ和を用いてｍ番目のマイクロホンの観測信号から雑音成分を除去するための第ｍウィーナーフィルタを構成し、該観測信号に適用して雑音除去信号を生成する第ｍ雑音抑圧部４０及びその雑音除去信号に対しＩＤＦＴを施し時間領域信号に変換するＩＤＦＴ処理部６０を備える。【選択図】図２

Description

本発明は、複数個のマイクロホンを用いて収音した複数方向の音源信号についてウィーナーフィルタを応用し個別に低雑音化して抽出する方向別収音装置及びプログラムに関する。

従来、任意方向の音源信号を強調して抽出するために指向性収音技術とウィーナーフィルタを組み合わせた技法が知られている（例えば、非特許文献１、特許文献１参照）がある。これらの技法では、複数個の指向性マイクロホンよりなるマイクロホンアレイでビームフォーミングを行った後に、ウィーナーフィルタを用いて、目的方向外からの雑音を除去することで方向別収音を実現している。

特開２０１７−１４３３２５号公報

Y.Hioka and K.Furuya, K.Kobayashi, K.Niwa, Y.Haneda,’ Underdetermined Sound Source Separation Using Power Spectrum Density Estimated by Combination of Directivity Gain,’ IEEE Transaction on audio, speech, and language processing, Vol.21, No.6, June 2013

従来技術における、複数個の指向性マイクロホンよりなるマイクロホンアレイと、ウィーナーフィルタを用いて、方向別収音を行う技法では、そのウィーナーフィルタのフィルタ設計に、マイクロホンアレイ周囲方向毎の感度が既知である必要があり、事前にそれらを計測しておかなければならなかった。

そのため、各マイクロホンの方向毎の感度が未知の場合には直ちに適応できないという問題がある。

従って、複数個のマイクロホンを用いて収音した複数方向の音源信号を個別に抽出する際に、事前に観測、或いは予測した各マイクロホンの方向毎の感度等の先験情報を用いることなく、当該複数方向の音源信号を個別に低雑音化して抽出する技法が望まれる。

本発明の目的は、上述の問題に鑑みて、事前に観測、或いは予測した各マイクロホンの方向毎の感度等の先験情報を用いることなく、複数個のマイクロホンを用いて収音した複数方向の音源信号を個別に低雑音化して抽出する方向別収音装置及びプログラムを提供することにある。

本発明に係る方向別収音装置においては、複数個のマイクロホンを用いて収音した複数方向の音源信号を個別に抽出する際に、各マイクロホンの正面外に存在する雑音源方向の感度と正面に存在する所望音源方向の感度比を推定してウィーナーフィルタを適用することにより所望方向外からの雑音を除去し、当該複数方向の音源信号を個別に低雑音化して抽出する。

即ち、本発明の方向別収音装置は、複数個のマイクロホンを用いて収音した複数方向の音源信号について個別に低雑音化して抽出する方向別収音装置であって、前記複数個のマイクロホンを用いて収音した複数方向の音源信号についてそれぞれ離散フーリエ変換を施し周波数領域の観測信号に変換するＤＦＴ処理手段と、それぞれの当該観測信号についてパワースペクトル密度を算出するＰＳＤ算出手段と、推定算出した所定の複素感度比、及び推定算出した各マイクロホンの正面方向の音源信号のパワースペクトル密度の総和であるＰＳＤ和を用いて、ｍ番目のマイクロホンの観測信号から他の特定のマイクロホンの観測信号の成分を除去するためのクロススペクトル密度に基づくウィーナーフィルタを個別に算出して総乗し、当該ｍ番目のマイクロホンの観測信号から他の全てのマイクロホンの観測信号の成分を除去するための第ｍウィーナーフィルタを構成するウィーナーフィルタ構成手段と、当該ｍ番目のマイクロホンの観測信号に対し前記第ｍウィーナーフィルタを施して該観測信号に関する雑音除去信号を生成するウィーナーフィルタ処理手段と、前記雑音除去信号に対し逆離散フーリエ変換を施し、時間領域信号に変換して出力するＩＤＦＴ処理手段と、を備えることを特徴とする。

また、本発明の方向別収音装置において、前記ｍ番目のマイクロホンの観測信号と、該観測信号に関する前記雑音除去信号とを用いて単位時間毎に前記所定の複素感度比を推定算出し、当該個別に算出したウィーナーフィルタを単位時間毎に更新する感度比推定手段を更に備えることを特徴とする。

また、本発明の方向別収音装置において、前記感度比推定手段は、前記複数個（Ｍ個）のマイクロホンのうち周波数ωにおける当該ｍ番目のマイクロホンの正面方向の感度とｌ番目のマイクロホンの正面方向における該ｍ番目のマイクロホンの感度との複素感度比について当該推定算出した推定複素感度比ｇ_ｌ ^ｍ(ω) （ｌ＝１，２，…，ｍ−１，ｍ＋１，…，Ｍ）を用いて、単位時間τ毎の更新を考慮した重み係数αを、所定の算出法（後述する［数２５］）に基づいて推定算出することを特徴とする。

また、本発明の方向別収音装置において、前記複数個のマイクロホンの全てに関する当該複素感度比を用いて重み係数を算出し、該重み係数による重み付き線形和により、各マイクロホンの正面方向の音源信号のＰＳＤの総和であるＰＳＤ和を推定算出するＰＳＤ和推定手段を更に備えることを特徴とする。

また、本発明の方向別収音装置において、前記ＰＳＤ和推定手段は、各マイクロホンで収音される信号のパワースペクトル密度Ｐ_Ｘｉ(ω，τ) （ｉ＝１，２，…，Ｍ）に対し当該重み係数α_ｉを用いて所定の算出法（後述する［数２６］）で表される重み付き線形和により、前記ＰＳＤ和を推定算出することを特徴とする。

また、本発明のプログラムは、コンピューターを、本発明の方向別収音装置として機能させるためのプログラムとして構成する。

本発明によれば、事前に観測、或いは予測した各マイクロホンの方向毎の感度等の先験情報を用いることなく、目的方向の音源信号だけを明瞭に収音することができる。

本発明による一実施形態の方向別収音装置に係るウィーナーフィルタを適用する音響モデルの概略図である。本発明による一実施形態の方向別収音装置の概略構成を示すブロック図である。（ａ）,（ｂ）は、それぞれ本発明による一実施形態の方向別収音装置に係る雑音抑圧処理の有無を比較した収音例を示す図である。

まず、図１を参照して本発明による一実施形態の方向別収音装置１に係るウィーナーフィルタを適用する音響モデルについて説明し、続いて図２を参照して、ウィーナーフィルタを応用した本発明による一実施形態の方向別収音装置１について説明する。

〔ウィーナーフィルタを適用する音響モデル〕
図１は、本発明による一実施形態の方向別収音装置１に係るウィーナーフィルタ１００を適用する音響モデルの概略図である。

図１に示すように、Ｍ個の音源からの音源信号を個別に抽出するために各音源方向に向けたＭ個のマイクロホン（指向性マイクロホン）１０で構成されたマイクロホンアレイにより収音することを想定する。そして、ｍ番目のマイクロホン正面に位置する互いに無相関な音源信号をＳ_ｍ(ω，τ)とし、ｍ番目のマイクロホン１０の観測信号Ｘ_ｍ(ω，τ)を式（１）のようにモデル化する。

ｈ_ｉ ^ｍ（ω）は、周波数ωにおけるｍ番目のマイクロホン１０の正面方向の感度とｉ番目のマイクロホン１０の正面方向におけるｍ番目のマイクロホン１０の感度との比（以下、複素感度比とする）を表し、｜ｈ_ｉ ^ｍ(ω)｜＜１であると想定する。即ち、ｍ番目のマイクロホン１０の角度ごとの感度を角度θの関数としてｈ_ｍ(θ，ω)とすると、ｍ番目のマイクロホン１０の正面方向（θ＝θ_ｍ）とｉ番目のマイクロホン１０の正面方向との開き角がθ_ｉのとき、ｈ_ｉ ^ｍ（ω）＝ｈ_ｍ(θ＝θ_ｍ＋θ_ｉ, ω)／ｈ_ｍ（θ＝θ_ｍ, ω）となる。ここで、ω、τはそれぞれ周波数のインデックス、時間フレームのインデックスを表す。

このとき、ウィーナーフィルタ１００において、観測信号Ｘ_ｍ(ω，τ)を、式（２）のウィーナーフィルタｗ_ｌ(ω，τ)で式（３）のようにフィルタリングすることで、観測信号Ｘ_ｍ(ω，τ)から不所望な音源信号Ｓ_ｌ(ω，τ)のみを除去することができる。

ここで、Ｐ_ｍ(ω，τ)はｍ番目のマイクロホン１０で収音する音源信号Ｓ_ｍ(ω，τ)のパワースペクトル密度（ＰＳＤ）である。Ｅ［＊］は期待値演算を表すが、実用においては過去数フレームの平均によって推定されるため、τフレームにおける推定値をＰ_ｍ(ω，τ)としている。

また、０≦｜ｋ_ｉ｜≦１（ｉ＝１，２,…,Ｍ）となる任意の係数ｋ_ｉについて、ウィーナーフィルタｗ_ｌ(ω，τ)を式（４）とする。

式（４）でウィーナーフィルタｗ_ｌ(ω，τ)を表わすと、特定の音源信号Ｓ_ｉ(ω，τ)（ｉ≠ｌ，ｍ）に影響を与えるものの、ｍ番目のマイクロホンの観測信号Ｘ_ｍ(ω，τ)から、所望の音源信号Ｓ_ｍ(ω，τ)を損なうことなく、不所望な音源信号Ｓ_ｌ(ω，τ)を除去することができる。

したがって、ウィーナーフィルタ１００において、観測信号Ｘ_ｍ(ω，τ)から所望の音源信号Ｓ_ｍ(ω，τ)のみを復元するには、式（５）で表されるウィーナーフィルタＷ (ω，τ)によって観測信号Ｘ_ｍ(ω，τ)を式（６）のようにフィルタリングすればよい。

以下、ウィーナーフィルタ１００における、式（５）のウィーナーフィルタＷ(ω，τ)の設計手法について詳細に述べる。

各マイクロホン１０の正面方向に位置する音源が互いに無相関であると仮定すると、観測信号Ｘ_ｍ(ω，τ)のＰＳＤを示すＰ_Ｘｍ(ω，τ) は、式（７）のように推定できる。

Ｅ［＊］は期待値演算を表し、実際の処理の際には複数フレームにおける平均で代用する。

また、ｌ番目のマイクロホン１０の観測信号Ｘ_ｌ(ω，τ)とｍ番目のマイクロホン１０の観測信号Ｘ_ｍ(ω，τ)のクロススペクトル密度（ＣＳＤ：Cross Spectral Density）であるＣ_ｌｍ(ω，τ)は、式（８）のように推定できる。

ここで、観測信号Ｘ_ｍ(ω，τ)のＰＳＤを示すＰ_Ｘｍ(ω，τ)から、観測信号Ｘ_ｌ(ω，τ)のＰＳＤを示すＰ_ｌ(ω，τ)の項を除去するために式（９）の計算を行う。

ここで、Ｒｅ［＊］は複素数の実部を示す。式（９）から式（１０）が得られる。

そして、ウィーナーフィルタ１００では、Ｍ個の観測信号Ｘ_ｉ(ω，τ)に基づくＰ_Ｘｉ(ω，τ) （ｉ＝１，２,…,Ｍ）の重み付け線形和の信号として処理する。

ここで、Ｐ_Ｘｉ(ω，τ)に対する重みα＝［α_１α_２α_３…α_Ｍ］^Ｔが式（１３）を満たすとする。ここで、［＊］^Ｔはベクトル・行列の転置、［＊］^−１は逆行列を表す。

式（１３）を満たすとき、式（１４）が得られる。

ここで、ｍ番目のマイクロホン１０とｉ番目のマイクロホン１０の正面方向の複素感度比ｈ_ｉ ^ｍ（ω）は未知であるが、雑音対象のｌ番目のマイクロホン１０について後述するように推定複素感度比ｇ_ｌ ^ｍ(ω)が得られるとすると、ｈ_ｌ ^ｍ(ω) ≒ｇ_ｌ ^ｍ(ω)として扱うことができ、式（１３）は式（１５）のようにｈ_ｌ ^ｍ(ω)をｇ_ｌ ^ｍ(ω)で代用することができる。

従って、式（１１）と式（１４），（１５）から、ウィーナーフィルタｗ_ｌ(ω，τ)を式（１６）とすることができる。

続いて、ｇ_ｌ ^ｍ(ω)≒ｈ_ｌ ^ｍ(ω)の推定方法について詳細を述べる。

まず、式（１７）のように、ウィーナーフィルタ１００を用いて観測信号Ｘ_ｌ(ω，τ)から音源信号Ｓ_ｌ(ω，τ)を復元できたとする。

ｈ_ｌ ^ｍ（ω）は、ｌ番目のマイクロホン１０で観測される音源信号Ｓ_ｌ(ω，τ)とｍ番目のマイクロホン１０で観測される観測信号Ｘ_ｍ(ω，τ)に含まれるＳ_ｌ(ω，τ)成分との感度比であり、適応アルゴリズムを用いて逐次的に同定することが可能である。適応アルゴリズムは様々なアルゴリズムが考案されているが、ここでは例えばＬＭＳアルゴリズムを用いると、ｇ_ｌ ^ｍ(ω，τ)は、式（１８），（１９）のようにフレーム毎に更新することができる。

μはステップサイズパラメータと呼ばれる、学習の速度を調整するパラメータであり、ユーザーが任意に決定することができる。

このように、複数個のマイクロホン１０を用いて収音した複数方向の音源信号を個別に抽出する際に、各マイクロホン１０の雑音方向の感度と雑音方向の感度比を推定してウィーナーフィルタ１００を適用することにより所望方向外からの雑音を除去し、当該複数方向の音源信号を個別に低雑音化して抽出することができる。

以上を踏まえ、図２を参照して、ウィーナーフィルタを応用した本発明による一実施形態の方向別収音装置１について説明する。

〔方向別収音装置〕
図２に示すように、本発明による一実施形態の方向別収音装置１は、Ｍ（Ｍ＞１）個のマイクロホン１０を用いて収音した複数方向の音源信号についてウィーナーフィルタを応用し個別に低雑音化して抽出する装置であり、Ｍ個のＤＦＴ処理部２０、Ｍ個のＰＳＤ算出部３０、Ｍ個の雑音抑圧部４０（４０‐１，４０‐２，…，４０‐Ｍ）、１個のＰＳＤ和推定部５０、及びＭ個のＩＤＦＴ処理部６０を備える。

以下、方向別収音装置１が備える各構成要素について、Ｍ個のマイクロホン１０から出力される出力信号を処理する順に説明する。

まず、Ｍ個のマイクロホン１０は、それぞれ図１に示したように収音を所望する音源に向けられており、各マイクロホン１０の正面方向に当該音源が位置している。

Ｍ個のＤＦＴ処理部２０は、それぞれＭ個のマイクロホン１０の出力信号を入力し、それぞれ当該出力信号に対し離散フーリエ変換（ＤＦＴ）を施し周波数領域の観測信号Ｘ_ｉ(ω，τ) （ｉ＝１，２,…,Ｍ）に変換して、Ｍ個のＰＳＤ算出部３０にそれぞれ出力する。ここで、ω、τはそれぞれ周波数のインデックス、時間フレームのインデックスを表す。

Ｍ個のＰＳＤ算出部３０は、それぞれＭ個のＤＦＴ処理部２０から入力された観測信号Ｘ_ｉ(ω，τ) （ｉ＝１，２，…，Ｍ）についてパワースペクトル密度（ＰＳＤ）を算出し、Ｍ個の雑音抑圧部４０の全てに出力する。

尚、各観測信号Ｘ_ｉ(ω，τ)のＰＳＤであるＰ_Ｘｉ(ω，τ)は、上述した式（７）と同様に次式から算出する。

ここで、Ｅ［＊］は期待値演算を表し、実際の処理の際には複数フレームにおける平均で代用する。

これにより、着目するｍ番目のマイクロホン１０の観測信号Ｘ_ｍ(ω，τ)のＰＳＤを示すＰ_Ｘｍ(ω，τ)、当該観測信号Ｘ_ｍ(ω，τ)から除去したいｌ番目のマイクロホン１０の観測信号Ｘ_ｌ(ω，τ)のＰＳＤを示すＰ_ｌ(ω，τ)が得られる。

Ｍ個の雑音抑圧部４０（４０‐１，４０‐２，…，４０‐Ｍ）は、それぞれ同様の構成要素を有し、代表して図２に示すように、ｍ番目のマイクロホン１０の観測信号Ｘｍ(ω，τ)を雑音抑圧の処理対象とする第ｍ雑音抑圧部４０‐ｍについて説明する。

（ウィーナーフィルタによる雑音抑圧処理）
第ｍ雑音抑圧部４０‐ｍは、ウィーナーフィルタ構成部４１、ウィーナーフィルタ処理部４２、及び感度比推定部４３を備える。また、ウィーナーフィルタ構成部４１は、ＣＳＤ算出部４１１、第ｍ‐ｌウィーナーフィルタ算出部４１２、及びフィルタ乗算部４１３を有する。

第ｍ雑音抑圧部４０‐ｍにおいて、まずＣＳＤ算出部４１１は、第ｍマイクロホン１０の観測信号Ｘ_ｍ(ω，τ)と、他のマイクロホン１０である第ｌマイクロホン１０の観測信号Ｘ_ｌ(ω，τ)とのクロススペクトル密度（ＣＳＤ）であるＣ_ｍｌ(ω，τ)を、上述した式（８）に基づいて算出し、第ｍ‐ｌウィーナーフィルタ算出部４１２に出力する。

尚、式（８）に基づいたＣＳＤの算出において、Ｅ［＊］は期待値演算を表し、実際の処理の際には複数フレームにおける平均で代用する。

第ｍ‐ｌウィーナーフィルタ算出部４１２は、後述する感度比推定部４３によって推定算出した複素感度比ｇ_ｌ ^ｍ(ω，τ) 、及び後述するＰＳＤ和推定部５０によって推定算出した各マイクロホン正面方向の音源信号のＰＳＤの総和であるＰＳＤ和｛Σ^Ｍ _ｉ＝１Ｐ_ｉ(ω，τ)｝を用いて、第ｍマイクロホン１０の観測信号Ｘ_ｍ(ω，τ)から他のマイクロホン１０である第ｌマイクロホン１０の観測信号Ｘ_ｌ(ω，τ)の成分を除去するためのクロススペクトル密度（ＣＳＤ）に基づくウィーナーフィルタを算出する機能部である（ｌ＝１，２，…，ｍ−１，ｍ＋１，…，Ｍ）。

より具体的に、第ｍ‐ｌウィーナーフィルタ算出部４１２は、当該観測信号Ｘ_ｍ(ω，τ)のＰＳＤを示すＰ_Ｘｍ(ω，τ)、観測信号Ｘ_ｌ(ω，τ)のＰＳＤを示すＰ_ｌ(ω，τ)、及び、観測信号Ｘ_ｌ(ω，τ)とマイクロホンｍの観測信号Ｘ_ｍ(ω，τ)のクロススペクトル密度（ＣＳＤ）であるＣ_ｍｌ(ω，τ)と、後述する推定複素感度比ｇ_ｌ ^ｍ(ω，τ)及びＰＳＤ和｛Σ^Ｍ _ｉ＝１Ｐ_ｉ(ω，τ)｝とを用いて、次式によって第ｍ‐ｌウィーナーフィルタｗ_ｍ−ｌ(ω，τ)を算出し、フィルタ乗算部４１３に出力する。

フィルタ乗算部４１３は、各第ｍ‐ｌウィーナーフィルタｗ_ｍ−ｌ(ω，τ) （ｌ＝１，２，…，ｍ−１，ｍ＋１，…，Ｍ）を入力して、次式のように、得られた第ｍ‐ｌウィーナーフィルタ（ｌ≠ｍ）の関数をＭ個総乗することで第ｍウィーナーフィルタＷ_ｍ(ω，τ)を算出し、ウィーナーフィルタ処理部４２に出力する。

このようにして、第ｍ雑音抑圧部４０‐ｍは、当該観測信号Ｘ_ｍ(ω，τ)のＰＳＤを示すＰ_Ｘｍ(ω，τ)、観測信号Ｘ_ｌ(ω，τ)のＰＳＤを示すＰ_ｌ(ω，τ)、及び、観測信号Ｘ_ｌ(ω，τ)とマイクロホンｍの観測信号Ｘ_ｍ(ω，τ)のクロススペクトル密度（ＣＳＤ）であるＣ_ｍｌ(ω，τ)と、後述する推定複素感度比ｇ_ｌｍ(ω，τ)及びＰＳＤ和｛Σ^Ｍ _ｉ＝１Ｐ_ｉ(ω，τ)｝とを用いて、第ｍウィーナーフィルタＷ_ｍ(ω，τ)を算出し、ウィーナーフィルタ処理部４２に出力する。

ウィーナーフィルタ処理部４２は、次式のように、当該観測信号Ｘ_ｍ(ω，τ)に対し第ｍウィーナーフィルタＷ_ｍ(ω，τ)を施して当該観測信号Ｘ_ｍ(ω，τ)に関する雑音除去信号を生成し、ＩＤＦＴ処理部６０に出力する。

ＩＤＦＴ処理部６０は、ウィーナーフィルタ処理部４２から得られる雑音除去信号に対し逆離散フーリエ変換を施し、時間領域信号に変換して出力する。

（ウィーナーフィルタ算出に用いる感度比推定処理）
続いて第ｍ雑音抑圧部４０‐ｍにおける感度比推定部４３の処理について説明する。

感度比推定部４３は、ｍ番目のマイクロホンで観測される観測信号Ｘ_ｍ(ω，τ)とウィーナーフィルタ処理部４２から得られる雑音除去信号を基に、ｌ番目のマイクロホンで観測される音源信号Ｓ_ｌ(ω，τ)と、ｍ番目のマイクロホンで観測される観測信号Ｘ_ｍ(ω，τ)に含まれる音源信号Ｓ_ｌ(ω，τ)の成分との感度比である推定複素感度比ｇ_ｌ ^ｍ(ω，τ)を単位時間毎に算出し、第ｍ‐ｌウィーナーフィルタ算出部４１２に出力する。これにより、各第ｍ‐ｌウィーナーフィルタｗ_ｍ−ｌ(ω，τ) （ｌ＝１，２，…，ｍ−１，ｍ＋１，…，Ｍ）は単位時間毎に更新されるようになる。

推定複素感度比ｇ_ｌ ^ｍ(ω，τ)は、適応アルゴリズムを用いて逐次的に同定することが可能である。適応アルゴリズムは様々なアルゴリズムが考案されているが、ここでは例えばＬＭＳアルゴリズムを用いると、推定複素感度比ｇ_ｌ ^ｍ(ω，τ)は、次式のようにフレーム毎に更新することができる。

μ はステップサイズパラメータと呼ばれる、学習の速度を調整するパラメータであり、ユーザーが任意に決定することができる。

Ｍ個の雑音抑圧部４０（４０‐１，４０‐２，…，４０‐Ｍ）は、それぞれ上記の第ｍ雑音抑圧部４０‐ｍと同様の処理を並行して行うことで全てのマイクロホン１０に関する複素感度比ｇ_ｌ ^ｍ(ω，τ)（ｌ＝１，２，…，ｍ−１，ｍ＋１，…，Ｍ）を推定算出することができる。

（ウィーナーフィルタ算出に用いるＰＳＤ和推定処理）
ＰＳＤ和推定部５０は、重み乗算部５１及びＰＳＤ和算出部５２を有する。

重み乗算部５１は、Ｍ個の雑音抑圧部４０（４０‐１，４０‐２，…，４０‐Ｍ）から、全てのマイクロホン１０に関する推定複素感度比ｇ_ｌ ^ｍ(ω，τ)を入力し、ｇ_ｌ ^ｍ(ω，τ)（ｌ＝１，２，…，ｍ−１，ｍ＋１，…，Ｍ；ｍ＝１，２，…，Ｍ）を用いて、上述した式（１５）に示したものに単位時間毎の更新を考慮し、次式のように重み係数αを推定算出する。

ここで、重み乗算部５１は、周波数ωにおける当該ｍ番目のマイクロホン１０の正面方向の感度とｌ番目のマイクロホン１０正面方向におけるｍ番目のマイクロホン１０の感度との複素感度比について、Ｍ個の雑音抑圧部４０によって当該推定算出した推定複素感度比ｇ_ｌ ^ｍ(ω，τ)に関する重み係数α_ｉをＰＳＤ和算出部５２に出力する。

ＰＳＤ和算出部５２は、重み係数α_ｉを用いて、各マイクロホン１０の正面方向の音源信号のＰＳＤの総和であるＰＳＤ和｛Σ^Ｍ _ｉ＝１Ｐ_ｉ(ω，τ)｝について推定算出し、Ｍ個の雑音抑圧部４０（４０‐１，４０‐２，…，４０‐Ｍ）における第ｍ‐ｌウィーナーフィルタ算出部４１２に出力する。

ＰＳＤ和｛Σ^Ｍ _ｉ＝１Ｐ_ｉ(ω，τ)｝は、次式のように各マイクロホン１０で収音される観測信号のＰＳＤであるＰＸ_ｉ(ω，τ) （ｉ＝１，２，…，Ｍ）に対する重み係数α_ｉによる重み付き線形和で得ることができる。

これにより、推定複素感度比ｇ_ｌ ^ｍ(ω，τ)によって各第ｍ‐ｌウィーナーフィルタｗ_ｍ−ｌ(ω，τ) （ｌ＝１，２，…，ｍ−１，ｍ＋１，…，Ｍ）について単位時間毎に更新した場合でも、第ｍウィーナーフィルタＷ_ｍ(ω，τ)についてＰＳＤ和で正規化することができ、当該観測信号Ｘ_ｍ(ω，τ)に対し第ｍウィーナーフィルタＷ_ｍ(ω，τ)を施して得られる雑音除去信号を安定化させることができる。

以上のように、本実施形態の方向別収音装置１では、複数個のマイクロホン１０を用いて収音した複数方向の音源信号を個別に抽出する際に、各マイクロホン１０の雑音方向の感度と雑音方向の感度比を推定してウィーナーフィルタＷ_ｍを構成し、これを適用することにより所望方向外からの雑音を除去し、当該複数方向の音源信号を個別に低雑音化して抽出するようにした。

これにより、本実施形態の方向別収音装置１によれば、事前に観測、或いは予測した各マイクロホン１０の方向毎の感度等の先験情報を用いることなく、適応的に目的音方向にマイクロホン１０を向けた場合でも、目的方向の音源信号だけを明瞭に収音することができるようなる。

図３（ａ）,（ｂ）には、それぞれ本発明による一実施形態の方向別収音装置１に係る雑音抑圧処理の有無を比較した収音例を示している。より具体的には、図３（ａ）,（ｂ）にそれぞれ示す収音例１，２は周波数毎の雑音レベルを示すスペクトラム図であり、或る音源Ｍに向けられた第ｍマイクロホンの出力信号の特性（雑音抑圧処理無し）と、当該第ｍマイクロホンの出力信号に対し本実施形態の方向別収音装置１により雑音除去を行って抽出した出力信号の特性（雑音抑圧処理有り）とを比較して示している。図３（ａ）,（ｂ）から理解されるように、本発明による一実施形態の方向別収音装置１によれば全体として雑音除去が有効に作用していることが分かる。

以上の実施形態における方向別収音装置１は、コンピューターにより構成することができ、方向別収音装置１の各処理部を機能させるためのプログラムを好適に用いることができる。具体的には、方向別収音装置１の各処理部を制御するための制御部をコンピューター内の中央演算処理装置（ＣＰＵ）で構成でき、且つ、各処理部を動作させるのに必要となるプログラムを適宜記憶する記憶部を少なくとも１つのメモリで構成させることができる。即ち、そのようなコンピューターに、ＣＰＵによって該プログラムを実行させることにより、方向別収音装置１の各処理部の有する機能を実現させることができる。更に、方向別収音装置１の各処理部の有する機能を実現させるためのプログラムを、前述の記憶部（メモリ）の所定の領域に格納させることができる。そのような記憶部は、装置内部のＲＡＭ又はＲＯＭなどで構成させることができ、或いは又、外部記憶装置（例えば、ハードディスク）で構成させることもできる。また、そのようなプログラムは、コンピューターで利用されるＯＳ上のソフトウェア（ＲＯＭ又は外部記憶装置に格納される）の一部で構成させることができる。更に、そのようなコンピューターに、方向別収音装置１の各処理部として機能させるためのプログラムは、コンピューター読取り可能な記録媒体に記録することができる。また、方向別収音装置１の各処理部をハードウェア又はソフトウェアの一部として構成させ、各々を組み合わせて実現させることもできる。

以上、特定の実施形態の例を挙げて本発明を説明したが、本発明は前述した例に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、上述した例では、特定の音源方向に向けたマイクロホン１０について指向性マイクロホンを想定して説明したが、任意の音源方向を収音する任意の指向性のマイクロホンに対して本発明に係る方向別収音装置１を適用できる。従って、本発明に係る方向別収音装置１は、上述した実施形態の例に限定されるものではなく、特許請求の範囲の記載によってのみ制限される。

本発明によれば、事前に観測、或いは予測した各マイクロホンの方向毎の感度等の先験情報を用いることなく、適応的に目的音方向にマイクロホンを向けた場合でも、目的方向の音源信号だけを明瞭に収音することができるので、マイクロホンアレイを用いた音源信号を収音する用途に有用である。

１方向別収音装置
１０マイクロホン（指向性マイクロホン）
２０ＤＦＴ処理部
３０ＰＳＤ算出部
４０，４０‐ｍ，４０‐Ｍ雑音抑圧部
４１ウィーナーフィルタ構成部
４２ウィーナーフィルタ処理部
４３感度比推定部
５０ＰＳＤ和推定部
５１重み乗算部
５２ＰＳＤ和算出部
６０ＩＤＦＴ処理部
１００ウィーナーフィルタ
４１１ＣＳＤ算出部
４１２ウィーナーフィルタ算出部
４１３フィルタ乗算部

Claims

複数個のマイクロホンを用いて収音した複数方向の音源信号について個別に低雑音化して抽出する方向別収音装置であって、
前記複数個のマイクロホンを用いて収音した複数方向の音源信号についてそれぞれ離散フーリエ変換を施し周波数領域の観測信号に変換するＤＦＴ処理手段と、
それぞれの当該観測信号についてパワースペクトル密度を算出するＰＳＤ算出手段と、
推定算出した所定の複素感度比、及び推定算出した各マイクロホンの正面方向の音源信号のパワースペクトル密度の総和であるＰＳＤ和を用いて、ｍ番目のマイクロホンの観測信号から他の特定のマイクロホンの観測信号の成分を除去するためのクロススペクトル密度に基づくウィーナーフィルタを個別に算出して総乗し、当該ｍ番目のマイクロホンの観測信号から他の全てのマイクロホンの観測信号の成分を除去するための第ｍウィーナーフィルタを構成するウィーナーフィルタ構成手段と、
当該ｍ番目のマイクロホンの観測信号に対し前記第ｍウィーナーフィルタを施して該観測信号に関する雑音除去信号を生成するウィーナーフィルタ処理手段と、
前記雑音除去信号に対し逆離散フーリエ変換を施し、時間領域信号に変換して出力するＩＤＦＴ処理手段と、
を備えることを特徴とする方向別収音装置。
前記ｍ番目のマイクロホンの観測信号と、該観測信号に関する前記雑音除去信号とを用いて単位時間毎に前記所定の複素感度比を推定算出し、当該個別に算出したウィーナーフィルタを単位時間毎に更新する感度比推定手段を更に備えることを特徴とする、請求項１に記載の方向別収音装置。
前記感度比推定手段は、前記複数個（Ｍ個）のマイクロホンのうち周波数ωにおける当該ｍ番目のマイクロホンの正面方向の感度とｌ番目のマイクロホンの正面方向における該ｍ番目のマイクロホンの感度との複素感度比について当該推定算出した推定複素感度比ｇ_ｌ ^ｍ(ω) （ｌ＝１，２，…，ｍ−１，ｍ＋１，…，Ｍ）を用いて、単位時間τ毎の更新を考慮した重み係数αを、
に基づいて推定算出することを特徴とする、請求項２に記載の方向別収音装置。
前記複数個のマイクロホンの全てに関する当該複素感度比を用いて重み係数を算出し、該重み係数による重み付き線形和により、各マイクロホンの正面方向の音源信号のＰＳＤの総和であるＰＳＤ和を推定算出するＰＳＤ和推定手段を更に備えることを特徴とする、請求項３に記載の方向別収音装置。
前記ＰＳＤ和推定手段は、各マイクロホンで収音される信号のパワースペクトル密度Ｐ_Ｘｉ(ω，τ) （ｉ＝１，２，…，Ｍ）に対し当該重み係数α_ｉを用いて
で表される重み付き線形和により、前記ＰＳＤ和を推定算出することを特徴とする、請求項４に記載の方向別収音装置。
コンピューターを、請求項１から５のいずれか一項に記載の方向別収音装置として機能させるためのプログラム。