JP7112269B2 - 方向別収音装置及びプログラム - Google Patents

方向別収音装置及びプログラム Download PDF

Info

Publication number
JP7112269B2
JP7112269B2 JP2018130035A JP2018130035A JP7112269B2 JP 7112269 B2 JP7112269 B2 JP 7112269B2 JP 2018130035 A JP2018130035 A JP 2018130035A JP 2018130035 A JP2018130035 A JP 2018130035A JP 7112269 B2 JP7112269 B2 JP 7112269B2
Authority
JP
Japan
Prior art keywords
microphone
signal
sum
wiener filter
psd
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018130035A
Other languages
English (en)
Other versions
JP2020010196A (ja
Inventor
陽 佐々木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Japan Broadcasting Corp
Original Assignee
Japan Broadcasting Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Japan Broadcasting Corp filed Critical Japan Broadcasting Corp
Priority to JP2018130035A priority Critical patent/JP7112269B2/ja
Publication of JP2020010196A publication Critical patent/JP2020010196A/ja
Application granted granted Critical
Publication of JP7112269B2 publication Critical patent/JP7112269B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)

Description

本発明は、複数個のマイクロホンを用いて収音した複数方向の音源信号についてウィーナーフィルタを応用し個別に低雑音化して抽出する方向別収音装置及びプログラムに関する。
従来、任意方向の音源信号を強調して抽出するために指向性収音技術とウィーナーフィルタを組み合わせた技法が知られている(例えば、非特許文献1、特許文献1参照)がある。これらの技法では、複数個の指向性マイクロホンよりなるマイクロホンアレイでビームフォーミングを行った後に、ウィーナーフィルタを用いて、目的方向外からの雑音を除去することで方向別収音を実現している。
特開2017-143325号公報
Y.Hioka and K.Furuya, K.Kobayashi, K.Niwa, Y.Haneda,’ Underdetermined Sound Source Separation Using Power Spectrum Density Estimated by Combination of Directivity Gain,’ IEEE Transaction on audio, speech, and language processing, Vol.21, No.6, June 2013
従来技術における、複数個の指向性マイクロホンよりなるマイクロホンアレイと、ウィーナーフィルタを用いて、方向別収音を行う技法では、そのウィーナーフィルタのフィルタ設計に、マイクロホンアレイ周囲方向毎の感度が既知である必要があり、事前にそれらを計測しておかなければならなかった。
そのため、各マイクロホンの方向毎の感度が未知の場合には直ちに適応できないという問題がある。
従って、複数個のマイクロホンを用いて収音した複数方向の音源信号を個別に抽出する際に、事前に観測、或いは予測した各マイクロホンの方向毎の感度等の先験情報を用いることなく、当該複数方向の音源信号を個別に低雑音化して抽出する技法が望まれる。
本発明の目的は、上述の問題に鑑みて、事前に観測、或いは予測した各マイクロホンの方向毎の感度等の先験情報を用いることなく、複数個のマイクロホンを用いて収音した複数方向の音源信号を個別に低雑音化して抽出する方向別収音装置及びプログラムを提供することにある。
本発明に係る方向別収音装置においては、複数個のマイクロホンを用いて収音した複数方向の音源信号を個別に抽出する際に、各マイクロホンの正面外に存在する雑音源方向の感度と正面に存在する所望音源方向の感度比を推定してウィーナーフィルタを適用することにより所望方向外からの雑音を除去し、当該複数方向の音源信号を個別に低雑音化して抽出する。
即ち、本発明の方向別収音装置は、複数個のマイクロホンを用いて収音した複数方向の音源信号について個別に低雑音化して抽出する方向別収音装置であって、前記複数個のマイクロホンを用いて収音した複数方向の音源信号についてそれぞれ離散フーリエ変換を施し周波数領域の観測信号に変換するDFT処理手段と、それぞれの当該観測信号についてパワースペクトル密度を算出するPSD算出手段と、推定算出した所定の複素感度比、及び推定算出した各マイクロホンの正面方向の音源信号のパワースペクトル密度の総和であるPSD和を用いて、m番目のマイクロホンの観測信号から他の特定のマイクロホンの観測信号の成分を除去するためのクロススペクトル密度に基づくウィーナーフィルタを個別に算出して総乗し、当該m番目のマイクロホンの観測信号から他の全てのマイクロホンの観測信号の成分を除去するための第mウィーナーフィルタを構成するウィーナーフィルタ構成手段と、当該m番目のマイクロホンの観測信号に対し前記第mウィーナーフィルタを施して該観測信号に関する雑音除去信号を生成するウィーナーフィルタ処理手段と、前記雑音除去信号に対し逆離散フーリエ変換を施し、時間領域信号に変換して出力するIDFT処理手段と、を備えることを特徴とする。
また、本発明の方向別収音装置において、前記m番目のマイクロホンの観測信号と、該観測信号に関する前記雑音除去信号とを用いて単位時間毎に前記所定の複素感度比を推定算出し、当該個別に算出したウィーナーフィルタを単位時間毎に更新する感度比推定手段を更に備えることを特徴とする。
また、本発明の方向別収音装置において、前記感度比推定手段は、前記複数個(M個)のマイクロホンのうち周波数ωにおける当該m番目のマイクロホンの正面方向の感度とl番目のマイクロホンの正面方向における該m番目のマイクロホンの感度との複素感度比について当該推定算出した推定複素感度比g (ω) (l=1,2,…,m-1,m+1,…,M)を用いて、単位時間τ毎の更新を考慮した重み係数αを、所定の算出法(後述する[数25])に基づいて推定算出することを特徴とする。
また、本発明の方向別収音装置において、前記複数個のマイクロホンの全てに関する当該複素感度比を用いて重み係数を算出し、該重み係数による重み付き線形和により、各マイクロホンの正面方向の音源信号のPSDの総和であるPSD和を推定算出するPSD和推定手段を更に備えることを特徴とする。
また、本発明の方向別収音装置において、前記PSD和推定手段は、各マイクロホンで収音される信号のパワースペクトル密度PXi(ω,τ) (i=1,2,…,M)に対し当該重み係数αを用いて所定の算出法(後述する[数26])で表される重み付き線形和により、前記PSD和を推定算出することを特徴とする。
また、本発明のプログラムは、コンピューターを、本発明の方向別収音装置として機能させるためのプログラムとして構成する。
本発明によれば、事前に観測、或いは予測した各マイクロホンの方向毎の感度等の先験情報を用いることなく、目的方向の音源信号だけを明瞭に収音することができる。
本発明による一実施形態の方向別収音装置に係るウィーナーフィルタを適用する音響モデルの概略図である。 本発明による一実施形態の方向別収音装置の概略構成を示すブロック図である。 (a),(b)は、それぞれ本発明による一実施形態の方向別収音装置に係る雑音抑圧処理の有無を比較した収音例を示す図である。
まず、図1を参照して本発明による一実施形態の方向別収音装置1に係るウィーナーフィルタを適用する音響モデルについて説明し、続いて図2を参照して、ウィーナーフィルタを応用した本発明による一実施形態の方向別収音装置1について説明する。
〔ウィーナーフィルタを適用する音響モデル〕
図1は、本発明による一実施形態の方向別収音装置1に係るウィーナーフィルタ100を適用する音響モデルの概略図である。
図1に示すように、M個の音源からの音源信号を個別に抽出するために各音源方向に向けたM個のマイクロホン(指向性マイクロホン)10で構成されたマイクロホンアレイにより収音することを想定する。そして、m番目のマイクロホン正面に位置する互いに無相関な音源信号をS(ω,τ)とし、m番目のマイクロホン10の観測信号X(ω,τ)を式(1)のようにモデル化する。
Figure 0007112269000001
(ω)は、 周波数ωにおけるm番目のマイクロホン10の正面方向の感度とi番目のマイクロホン10の正面方向におけるm番目のマイクロホン10の感度との比(以下、複素感度比とする)を表し、|h (ω)|<1であると想定する。即ち、m番目のマイクロホン10の角度ごとの感度を角度θの関数としてh(θ,ω)とすると、m番目のマイクロホン10の正面方向(θ=θ)とi番目のマイクロホン10の正面方向との開き角がθのとき、h (ω) = h(θ=θ +θ, ω)/h(θ=θ, ω)となる。ここで、ω、τはそれぞれ周波数のインデックス、時間フレームのインデックスを表す。
このとき、ウィーナーフィルタ100において、観測信号X(ω,τ)を、式(2)のウィーナーフィルタw(ω,τ)で式(3)のようにフィルタリングすることで、観測信号X(ω,τ)から不所望な音源信号S(ω,τ)のみを除去することができる。
Figure 0007112269000002
Figure 0007112269000003
ここで、P(ω,τ)はm番目のマイクロホン10で収音する音源信号S(ω,τ)のパワースペクトル密度(PSD)である。E[*]は期待値演算を表すが、実用においては過去数フレームの平均によって推定されるため、τフレームにおける推定値をP(ω,τ)としている。
また、0≦|k|≦1(i=1,2,…,M)となる任意の係数kについて、ウィーナーフィルタw(ω,τ)を式(4)とする。
Figure 0007112269000004
式(4)でウィーナーフィルタw(ω,τ)を表わすと、特定の音源信号S(ω,τ)(i≠l,m)に影響を与えるものの、m番目のマイクロホンの観測信号X(ω,τ)から、所望の音源信号S(ω,τ)を損なうことなく、不所望な音源信号S(ω,τ)を除去することができる。
したがって、ウィーナーフィルタ100において、観測信号X(ω,τ)から所望の音源信号S(ω,τ)のみを復元するには、式(5)で表されるウィーナーフィルタW (ω,τ)によって観測信号X(ω,τ)を式(6)のようにフィルタリングすればよい。
Figure 0007112269000005
Figure 0007112269000006
以下、ウィーナーフィルタ100における、式(5)のウィーナーフィルタW(ω,τ)の設計手法について詳細に述べる。
各マイクロホン10の正面方向に位置する音源が互いに無相関であると仮定すると、観測信号X(ω,τ)のPSDを示すPXm(ω,τ) は、式(7)のように推定できる。
Figure 0007112269000007
E[*]は期待値演算を表し、実際の処理の際には複数フレームにおける平均で代用する。
また、l番目のマイクロホン10の観測信号X(ω,τ)とm番目のマイクロホン10の観測信号X(ω,τ)のクロススペクトル密度(CSD:Cross Spectral Density)であるClm(ω,τ)は、式(8)のように推定できる。
Figure 0007112269000008
ここで、観測信号X(ω,τ)のPSDを示すPXm(ω,τ)から、観測信号X(ω,τ)のPSDを示すP(ω,τ)の項を除去するために式(9)の計算を行う。
Figure 0007112269000009
ここで、Re[*]は複素数の実部を示す。式(9)から式(10)が得られる。
Figure 0007112269000010
Figure 0007112269000011
Figure 0007112269000012
そして、ウィーナーフィルタ100では、M個の観測信号X(ω,τ)に基づくPXi(ω,τ) (i=1,2,…,M)の重み付け線形和の信号として処理する。
Figure 0007112269000013
ここで、PXi(ω,τ)に対する重みα=[ααα…αが式(13)を満たすとする。ここで、[*]はベクトル・行列の転置、[*]-1は逆行列を表す。
Figure 0007112269000014
式(13)を満たすとき、式(14)が得られる。
Figure 0007112269000015
ここで、m番目のマイクロホン10とi番目のマイクロホン10の正面方向の複素感度比h (ω)は未知であるが、雑音対象のl番目のマイクロホン10について後述するように推定複素感度比g (ω)が得られるとすると、h (ω) ≒g (ω)として扱うことができ、式(13)は式(15)のようにh (ω)をg (ω)で代用することができる。
Figure 0007112269000016
従って、式(11)と式(14),(15)から、ウィーナーフィルタw(ω,τ)を式(16)とすることができる。
Figure 0007112269000017
Figure 0007112269000018
続いて、g (ω)≒h (ω)の推定方法について詳細を述べる。
まず、式(17)のように、ウィーナーフィルタ100を用いて観測信号X(ω,τ)から音源信号S(ω,τ)を復元できたとする。
Figure 0007112269000019
(ω)は、l番目のマイクロホン10で観測される音源信号S(ω,τ)とm番目のマイクロホン10で観測される観測信号X(ω,τ)に含まれるS(ω,τ)成分との感度比であり、適応アルゴリズムを用いて逐次的に同定することが可能である。適応アルゴリズムは様々なアルゴリズムが考案されているが、ここでは例えばLMSアルゴリズムを用いると、g (ω,τ)は、式(18),(19)のようにフレーム毎に更新することができる。
Figure 0007112269000020
Figure 0007112269000021
μはステップサイズパラメータと呼ばれる、学習の速度を調整するパラメータであり、ユーザーが任意に決定することができる。
このように、複数個のマイクロホン10を用いて収音した複数方向の音源信号を個別に抽出する際に、各マイクロホン10の雑音方向の感度と雑音方向の感度比を推定してウィーナーフィルタ100を適用することにより所望方向外からの雑音を除去し、当該複数方向の音源信号を個別に低雑音化して抽出することができる。
以上を踏まえ、図2を参照して、ウィーナーフィルタを応用した本発明による一実施形態の方向別収音装置1について説明する。
〔方向別収音装置〕
図2に示すように、本発明による一実施形態の方向別収音装置1は、M(M>1)個のマイクロホン10を用いて収音した複数方向の音源信号についてウィーナーフィルタを応用し個別に低雑音化して抽出する装置であり、M個のDFT処理部20、M個のPSD算出部30、M個の雑音抑圧部40(40‐1,40‐2,…,40‐M)、1個のPSD和推定部50、及びM個のIDFT処理部60を備える。
以下、方向別収音装置1が備える各構成要素について、M個のマイクロホン10から出力される出力信号を処理する順に説明する。
まず、M個のマイクロホン10は、それぞれ図1に示したように収音を所望する音源に向けられており、各マイクロホン10の正面方向に当該音源が位置している。
M個のDFT処理部20は、それぞれM個のマイクロホン10の出力信号を入力し、それぞれ当該出力信号に対し離散フーリエ変換(DFT)を施し周波数領域の観測信号X(ω,τ) (i=1,2,…,M)に変換して、M個のPSD算出部30にそれぞれ出力する。ここで、ω、τはそれぞれ周波数のインデックス、時間フレームのインデックスを表す。
M個のPSD算出部30は、それぞれM個のDFT処理部20から入力された観測信号X(ω,τ) (i=1,2,…,M)についてパワースペクトル密度(PSD)を算出し、M個の雑音抑圧部40の全てに出力する。
尚、各観測信号X(ω,τ)のPSDであるPXi(ω,τ)は、上述した式(7)と同様に次式から算出する。
Figure 0007112269000022
ここで、E[*]は期待値演算を表し、実際の処理の際には複数フレームにおける平均で代用する。
これにより、着目するm番目のマイクロホン10の観測信号X(ω,τ)のPSDを示すPXm(ω,τ)、当該観測信号X(ω,τ)から除去したいl番目のマイクロホン10の観測信号X(ω,τ)のPSDを示すP(ω,τ)が得られる。
M個の雑音抑圧部40(40‐1,40‐2,…,40‐M)は、それぞれ同様の構成要素を有し、代表して図2に示すように、m番目のマイクロホン10の観測信号Xm(ω,τ)を雑音抑圧の処理対象とする第m雑音抑圧部40‐mについて説明する。
(ウィーナーフィルタによる雑音抑圧処理)
第m雑音抑圧部40‐mは、ウィーナーフィルタ構成部41、ウィーナーフィルタ処理部42、及び感度比推定部43を備える。また、ウィーナーフィルタ構成部41は、CSD算出部411、第m‐lウィーナーフィルタ算出部412、及びフィルタ乗算部413を有する。
第m雑音抑圧部40‐mにおいて、まずCSD算出部411は、第mマイクロホン10の観測信号X(ω,τ)と、他のマイクロホン10である第lマイクロホン10の観測信号X(ω,τ)とのクロススペクトル密度(CSD)であるCml(ω,τ)を、上述した式(8)に基づいて算出し、第m‐lウィーナーフィルタ算出部412に出力する。
尚、式(8)に基づいたCSDの算出において、E[*]は期待値演算を表し、実際の処理の際には複数フレームにおける平均で代用する。
第m‐lウィーナーフィルタ算出部412は、後述する感度比推定部43によって推定算出した複素感度比g (ω,τ) 、及び後述するPSD和推定部50によって推定算出した各マイクロホン正面方向の音源信号のPSDの総和であるPSD和{Σ i=1(ω,τ)}を用いて、第mマイクロホン10の観測信号X(ω,τ)から他のマイクロホン10である第lマイクロホン10の観測信号X(ω,τ)の成分を除去するためのクロススペクトル密度(CSD)に基づくウィーナーフィルタを算出する機能部である(l=1,2,…,m-1,m+1,…,M)。
より具体的に、第m‐lウィーナーフィルタ算出部412は、当該観測信号X(ω,τ)のPSDを示すPXm(ω,τ)、観測信号X(ω,τ)のPSDを示すP(ω,τ)、及び、観測信号X(ω,τ)とマイクロホンmの観測信号X(ω,τ)のクロススペクトル密度(CSD)であるCml(ω,τ)と、後述する推定複素感度比g (ω,τ)及びPSD和{Σ i=1(ω,τ)}とを用いて、次式によって第m‐lウィーナーフィルタwm-l(ω,τ)を算出し、フィルタ乗算部413に出力する。
Figure 0007112269000023
フィルタ乗算部413は、各第m‐lウィーナーフィルタwm-l(ω,τ) (l=1,2,…,m-1,m+1,…,M)を入力して、次式のように、得られた第m‐lウィーナーフィルタ(l≠m)の関数をM個総乗することで第mウィーナーフィルタW(ω,τ)を算出し、ウィーナーフィルタ処理部42に出力する。
Figure 0007112269000024
このようにして、第m雑音抑圧部40‐mは、当該観測信号X(ω,τ)のPSDを示すPXm(ω,τ)、観測信号X(ω,τ)のPSDを示すP(ω,τ)、及び、観測信号X(ω,τ)とマイクロホンmの観測信号X(ω,τ)のクロススペクトル密度(CSD)であるCml(ω,τ)と、後述する推定複素感度比glm(ω,τ)及びPSD和{Σ i=1(ω,τ)}とを用いて、第mウィーナーフィルタW(ω,τ)を算出し、ウィーナーフィルタ処理部42に出力する。
ウィーナーフィルタ処理部42は、次式のように、当該観測信号X(ω,τ)に対し第mウィーナーフィルタW(ω,τ)を施して当該観測信号X(ω,τ)に関する雑音除去信号を生成し、IDFT処理部60に出力する。
Figure 0007112269000025
IDFT処理部60は、ウィーナーフィルタ処理部42から得られる雑音除去信号に対し逆離散フーリエ変換を施し、時間領域信号に変換して出力する。
(ウィーナーフィルタ算出に用いる感度比推定処理)
続いて第m雑音抑圧部40‐mにおける感度比推定部43の処理について説明する。
感度比推定部43は、m番目のマイクロホンで観測される観測信号X(ω,τ)とウィーナーフィルタ処理部42から得られる雑音除去信号を基に、l番目のマイクロホンで観測される音源信号S(ω,τ)と、m番目のマイクロホンで観測される観測信号X(ω,τ)に含まれる音源信号S(ω,τ)の成分との感度比である推定複素感度比g (ω,τ)を単位時間毎に算出し、第m‐lウィーナーフィルタ算出部412に出力する。これにより、各第m‐lウィーナーフィルタwm-l(ω,τ) (l=1,2,…,m-1,m+1,…,M)は単位時間毎に更新されるようになる。
推定複素感度比g (ω,τ)は、適応アルゴリズムを用いて逐次的に同定することが可能である。適応アルゴリズムは様々なアルゴリズムが考案されているが、ここでは例えばLMSアルゴリズムを用いると、推定複素感度比g (ω,τ)は、次式のようにフレーム毎に更新することができる。
Figure 0007112269000026
μ はステップサイズパラメータと呼ばれる、学習の速度を調整するパラメータであり、ユーザーが任意に決定することができる。
M個の雑音抑圧部40(40‐1,40‐2,…,40‐M)は、それぞれ上記の第m雑音抑圧部40‐mと同様の処理を並行して行うことで全てのマイクロホン10に関する複素感度比g (ω,τ)(l=1,2,…,m-1,m+1,…,M)を推定算出することができる。
(ウィーナーフィルタ算出に用いるPSD和推定処理)
PSD和推定部50は、重み乗算部51及びPSD和算出部52を有する。
重み乗算部51は、M個の雑音抑圧部40(40‐1,40‐2,…,40‐M)から、全てのマイクロホン10に関する推定複素感度比g (ω,τ)を入力し、g (ω,τ)(l=1,2,…,m-1,m+1,…,M;m=1,2,…,M)を用いて、上述した式(15)に示したものに単位時間毎の更新を考慮し、次式のように重み係数αを推定算出する。
Figure 0007112269000027
ここで、重み乗算部51は、周波数ωにおける当該m番目のマイクロホン10の正面方向の感度とl番目のマイクロホン10正面方向におけるm番目のマイクロホン10の感度との複素感度比について、M個の雑音抑圧部40によって当該推定算出した推定複素感度比g (ω,τ)に関する重み係数αをPSD和算出部52に出力する。
PSD和算出部52は、重み係数αを用いて、各マイクロホン10の正面方向の音源信号のPSDの総和であるPSD和{Σ i=1(ω,τ)}について推定算出し、M個の雑音抑圧部40(40‐1,40‐2,…,40‐M)における第m‐lウィーナーフィルタ算出部412に出力する。
PSD和{Σ i=1(ω,τ)}は、次式のように各マイクロホン10で収音される観測信号のPSDであるPX(ω,τ) (i=1,2,…,M)に対する重み係数αによる重み付き線形和で得ることができる。
Figure 0007112269000028
これにより、推定複素感度比g (ω,τ)によって各第m‐lウィーナーフィルタwm-l(ω,τ) (l=1,2,…,m-1,m+1,…,M)について単位時間毎に更新した場合でも、第mウィーナーフィルタW(ω,τ)についてPSD和で正規化することができ、当該観測信号X(ω,τ)に対し第mウィーナーフィルタW(ω,τ)を施して得られる雑音除去信号を安定化させることができる。
以上のように、本実施形態の方向別収音装置1では、複数個のマイクロホン10を用いて収音した複数方向の音源信号を個別に抽出する際に、各マイクロホン10の雑音方向の感度と雑音方向の感度比を推定してウィーナーフィルタWを構成し、これを適用することにより所望方向外からの雑音を除去し、当該複数方向の音源信号を個別に低雑音化して抽出するようにした。
これにより、本実施形態の方向別収音装置1によれば、事前に観測、或いは予測した各マイクロホン10の方向毎の感度等の先験情報を用いることなく、適応的に目的音方向にマイクロホン10を向けた場合でも、目的方向の音源信号だけを明瞭に収音することができるようなる。
図3(a),(b)には、それぞれ本発明による一実施形態の方向別収音装置1に係る雑音抑圧処理の有無を比較した収音例を示している。より具体的には、図3(a),(b)にそれぞれ示す収音例1,2は周波数毎の雑音レベルを示すスペクトラム図であり、或る音源Mに向けられた第mマイクロホンの出力信号の特性(雑音抑圧処理無し)と、当該第mマイクロホンの出力信号に対し本実施形態の方向別収音装置1により雑音除去を行って抽出した出力信号の特性(雑音抑圧処理有り)とを比較して示している。図3(a),(b)から理解されるように、本発明による一実施形態の方向別収音装置1によれば全体として雑音除去が有効に作用していることが分かる。
以上の実施形態における方向別収音装置1は、コンピューターにより構成することができ、方向別収音装置1の各処理部を機能させるためのプログラムを好適に用いることができる。具体的には、方向別収音装置1の各処理部を制御するための制御部をコンピューター内の中央演算処理装置(CPU)で構成でき、且つ、各処理部を動作させるのに必要となるプログラムを適宜記憶する記憶部を少なくとも1つのメモリで構成させることができる。即ち、そのようなコンピューターに、CPUによって該プログラムを実行させることにより、方向別収音装置1の各処理部の有する機能を実現させることができる。更に、方向別収音装置1の各処理部の有する機能を実現させるためのプログラムを、前述の記憶部(メモリ)の所定の領域に格納させることができる。そのような記憶部は、装置内部のRAM又はROMなどで構成させることができ、或いは又、外部記憶装置(例えば、ハードディスク)で構成させることもできる。また、そのようなプログラムは、コンピューターで利用されるOS上のソフトウェア(ROM又は外部記憶装置に格納される)の一部で構成させることができる。更に、そのようなコンピューターに、方向別収音装置1の各処理部として機能させるためのプログラムは、コンピューター読取り可能な記録媒体に記録することができる。また、方向別収音装置1の各処理部をハードウェア又はソフトウェアの一部として構成させ、各々を組み合わせて実現させることもできる。
以上、特定の実施形態の例を挙げて本発明を説明したが、本発明は前述した例に限定されるものではなく、その技術思想を逸脱しない範囲で種々変形可能である。例えば、上述した例では、特定の音源方向に向けたマイクロホン10について指向性マイクロホンを想定して説明したが、任意の音源方向を収音する任意の指向性のマイクロホンに対して本発明に係る方向別収音装置1を適用できる。従って、本発明に係る方向別収音装置1は、上述した実施形態の例に限定されるものではなく、特許請求の範囲の記載によってのみ制限される。
本発明によれば、事前に観測、或いは予測した各マイクロホンの方向毎の感度等の先験情報を用いることなく、適応的に目的音方向にマイクロホンを向けた場合でも、目的方向の音源信号だけを明瞭に収音することができるので、マイクロホンアレイを用いた音源信号を収音する用途に有用である。
1 方向別収音装置
10 マイクロホン(指向性マイクロホン)
20 DFT処理部
30 PSD算出部
40,40‐m,40‐M 雑音抑圧部
41 ウィーナーフィルタ構成部
42 ウィーナーフィルタ処理部
43 感度比推定部
50 PSD和推定部
51 重み乗算部
52 PSD和算出部
60 IDFT処理部
100 ウィーナーフィルタ
411 CSD算出部
412 ウィーナーフィルタ算出部
413 フィルタ乗算部

Claims (6)

  1. 複数個のマイクロホンを用いて収音した複数方向の音源信号について個別に低雑音化して抽出する方向別収音装置であって、
    前記複数個のマイクロホンを用いて収音した複数方向の音源信号についてそれぞれ離散フーリエ変換を施し周波数領域の観測信号に変換するDFT処理手段と、
    それぞれの当該観測信号についてパワースペクトル密度を算出するPSD算出手段と、
    推定算出した所定の複素感度比、及び推定算出した各マイクロホンの正面方向の音源信号のパワースペクトル密度の総和であるPSD和を用いて、m番目のマイクロホンの観測信号から他の特定のマイクロホンの観測信号の成分を除去するためのクロススペクトル密度に基づくウィーナーフィルタを個別に算出して総乗し、当該m番目のマイクロホンの観測信号から他の全てのマイクロホンの観測信号の成分を除去するための第mウィーナーフィルタを構成するウィーナーフィルタ構成手段と、
    当該m番目のマイクロホンの観測信号に対し前記第mウィーナーフィルタを施して該観測信号に関する雑音除去信号を生成するウィーナーフィルタ処理手段と、
    前記雑音除去信号に対し逆離散フーリエ変換を施し、時間領域信号に変換して出力するIDFT処理手段と、
    を備えることを特徴とする方向別収音装置。
  2. 前記m番目のマイクロホンの観測信号と、該観測信号に関する前記雑音除去信号とを用いて単位時間毎に前記所定の複素感度比を推定算出し、当該個別に算出したウィーナーフィルタを単位時間毎に更新する感度比推定手段を更に備えることを特徴とする、請求項1に記載の方向別収音装置。
  3. 前記感度比推定手段は、前記複数個(M個)のマイクロホンのうち周波数ωにおける当該m番目のマイクロホンの正面方向の感度とl番目のマイクロホンの正面方向における該m番目のマイクロホンの感度との複素感度比について当該推定算出した推定複素感度比g (ω) (l=1,2,…,m-1,m+1,…,M)を用いて、単位時間τ毎の更新を考慮した重み係数αを、
    Figure 0007112269000029
    に基づいて推定算出することを特徴とする、請求項2に記載の方向別収音装置。
  4. 前記複数個のマイクロホンの全てに関する当該複素感度比を用いて重み係数を算出し、該重み係数による重み付き線形和により、各マイクロホンの正面方向の音源信号のPSDの総和であるPSD和を推定算出するPSD和推定手段を更に備えることを特徴とする、請求項3に記載の方向別収音装置。
  5. 前記PSD和推定手段は、各マイクロホンで収音される信号のパワースペクトル密度PXi(ω,τ) (i=1,2,…,M)に対し当該重み係数αを用いて
    Figure 0007112269000030
    で表される重み付き線形和により、前記PSD和を推定算出することを特徴とする、請求項4に記載の方向別収音装置。
  6. コンピューターを、請求項1から5のいずれか一項に記載の方向別収音装置として機能させるためのプログラム。
JP2018130035A 2018-07-09 2018-07-09 方向別収音装置及びプログラム Active JP7112269B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018130035A JP7112269B2 (ja) 2018-07-09 2018-07-09 方向別収音装置及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018130035A JP7112269B2 (ja) 2018-07-09 2018-07-09 方向別収音装置及びプログラム

Publications (2)

Publication Number Publication Date
JP2020010196A JP2020010196A (ja) 2020-01-16
JP7112269B2 true JP7112269B2 (ja) 2022-08-03

Family

ID=69152270

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018130035A Active JP7112269B2 (ja) 2018-07-09 2018-07-09 方向別収音装置及びプログラム

Country Status (1)

Country Link
JP (1) JP7112269B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111812404B (zh) * 2020-09-14 2021-01-01 湖南国科雷电子科技有限公司 一种信号处理方法以及处理装置

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012173584A (ja) 2011-02-23 2012-09-10 Nippon Telegr & Teleph Corp <Ntt> 音源分離装置、その方法及びプログラム

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012173584A (ja) 2011-02-23 2012-09-10 Nippon Telegr & Teleph Corp <Ntt> 音源分離装置、その方法及びプログラム

Also Published As

Publication number Publication date
JP2020010196A (ja) 2020-01-16

Similar Documents

Publication Publication Date Title
CN109686381B (zh) 用于信号增强的信号处理器和相关方法
CN111133511B (zh) 声源分离系统
JP5227393B2 (ja) 残響除去装置、残響除去方法、残響除去プログラム、および記録媒体
WO2019113253A1 (en) Voice enhancement in audio signals through modified generalized eigenvalue beamformer
CN107316649A (zh) 基于人工智能的语音识别方法及装置
US9564144B2 (en) System and method for multichannel on-line unsupervised bayesian spectral filtering of real-world acoustic noise
US20220068288A1 (en) Signal processing apparatus, signal processing method, and program
JP2003534570A (ja) 適応ビームフォーマーにおいてノイズを抑制する方法
US11373667B2 (en) Real-time single-channel speech enhancement in noisy and time-varying environments
JP6225245B2 (ja) 信号処理装置、方法及びプログラム
JP6334895B2 (ja) 信号処理装置及びその制御方法、プログラム
JP6724905B2 (ja) 信号処理装置、信号処理方法、およびプログラム
WO2014079483A1 (en) Method and device for reconstructing a target signal from a noisy input signal
CN112201273B (zh) 一种噪声功率谱密度计算方法、系统、设备及介质
CN108010536A (zh) 回声消除方法、装置、系统及存储介质
KR102410850B1 (ko) 잔향 제거 오토 인코더를 이용한 잔향 환경 임베딩 추출 방법 및 장치
JP7112269B2 (ja) 方向別収音装置及びプログラム
JP6182169B2 (ja) 収音装置、その方法及びプログラム
CN110199528B (zh) 远场声音捕获
JP2014532891A (ja) オーディオ信号ノイズ減衰
Spalt et al. A background noise reduction technique using adaptive noise cancellation for microphone arrays
Blacodon et al. Reverberation cancellation in a closed test section of a wind tunnel using a multi-microphone cesptral method
WO2021007902A1 (zh) 语音滤波方法、装置、介质和电子设备
JP5376635B2 (ja) 雑音抑圧処理選択装置,雑音抑圧装置およびプログラム
JP5263020B2 (ja) 信号処理装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20210607

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20220518

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220628

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220722

R150 Certificate of patent or registration of utility model

Ref document number: 7112269

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150