JP6294805B2 - 収音装置 - Google Patents

収音装置 Download PDF

Info

Publication number
JP6294805B2
JP6294805B2 JP2014212283A JP2014212283A JP6294805B2 JP 6294805 B2 JP6294805 B2 JP 6294805B2 JP 2014212283 A JP2014212283 A JP 2014212283A JP 2014212283 A JP2014212283 A JP 2014212283A JP 6294805 B2 JP6294805 B2 JP 6294805B2
Authority
JP
Japan
Prior art keywords
microphones
microphone
sound
collection device
spatial arrangement
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014212283A
Other languages
English (en)
Other versions
JP2016082414A (ja
Inventor
健太 丹羽
健太 丹羽
小林 和則
和則 小林
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014212283A priority Critical patent/JP6294805B2/ja
Publication of JP2016082414A publication Critical patent/JP2016082414A/ja
Application granted granted Critical
Publication of JP6294805B2 publication Critical patent/JP6294805B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Details Of Audible-Bandwidth Transducers (AREA)
  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、複数のマイクロホンで構成された音響アレイ装置を用いて、任意の音源信号や位置といった情報を推定、抽出するビームフォーミング技術に関連する。
非特許文献1が、ビームフォーミング技術の従来技術として知られている。
非特許文献1では、反射構造体により擬似的な拡散音場を生成し、その中にマイクロホンアレイを設置して、拡散センシングを実現している。
また、全方位に対してマイクロホンが配置されている構成として、非特許文献2が知られている。
K. Niwa, S. Sakauchi, K. Furuya, M. Okamoto, and Y. Haneda, "Diffused sensing for sharp directivity microphone array", ICASSP 2012, 2012, pp. 225 - 228 "Eigenmike microphone", [on line], mh acoustics LLC, [平成26年9月10日検索]、インターネット<URL:http://www.mhacoustics.com/products>
非特許文献2には、マイクロホンアレイの収音信号を用いて適応ビームフォーミングを行うことが記載されているが、具体的なビームフォーミング技術については記載されておらず、従来のビームフォーミング技術を用いていると考えられる。
本発明は、複数の方向に対してビームを形成するときに従来よりもビームフォーミングの計算量を削減可能な収音装置を提供することを目的とする。
上記の課題を解決するために、本発明の一態様によれば、収音装置は、Mを4以上の整数とし、M個のマイクロホンを含み、M個のマイクロホンの空間的配置の中心を通るある回転軸に対して1回転させたときに、M個のマイクロホンの空間的配置と同一の空間的配置が複数回現れるように、かつ、M個のマイクロホンの全てが同一平面上に存在しないように、M個のマイクロホンが配置される。
上記の課題を解決するために、本発明の他の態様によれば、収音装置は、Mを4以上の整数とし、M個のマイクロホンを含み、M個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つである第一マイクロホンとを通る回転軸の軸方向から到来する音波の第一マイクロホンに対する遅延時間と、M個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つである第二マイクロホンとを通る回転軸の軸方向から到来する音波の第二マイクロホンに対する遅延時間とが、同じになるようにM個のマイクロホンの1つである第三マイクロホンが配置され、かつ、M個のマイクロホンの全てが同一平面上に存在しないように、M個のマイクロホンが配置される。
上記の課題を解決するために、本発明の他の態様によれば、収音装置は、Mを4以上の整数、M^を2以上の整数とし、M個のマイクロホンで収音された収音信号とフィルタ係数とを用いて、(i)M^個の所定の何れかの方向若しくは位置から到来する音を強調した、又は/及び、(ii)M^個の所定の何れかの方向若しくは位置から到来する音を抑圧した出力信号を生成する信号処理部を含み、M個のマイクロホンは、M個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つである第一マイクロホンとを通る回転軸の軸方向である第一方向から到来する音波の第一マイクロホンに対する遅延時間と、M個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つである第二マイクロホンとを通る回転軸の軸方向である第二方向から到来する音波の第二マイクロホンに対する遅延時間とが、同じになるようにM個のマイクロホンの1つである第三マイクロホンが配置され、かつ、M個のマイクロホンの全てが同一平面上に存在しないように、配置され、第三マイクロホンに係るフィルタ係数のうち、第一方向に対応するフィルタ係数と第二方向に対応するフィルタ係数とを共通する値とする。
本発明に係る収音装置で収音した収音信号を用いれば、複数の方向に対してビームを形成するときに従来よりもビームフォーミングに必要な計算量を減らすことができるという効果を奏する。
マイクロホンアレイを用いた観測過程をモデル化した図。 マイクロホンアレイの構成例を示す図。 第一実施形態に係る収音装置の機能構成例を示す図。 第一実施形態に係る収音装置処理フローの例を示す図。 図5Aは組立構造体の構成例を示す図、図5Bは組立構造体の構成例を示す図。
以下、本発明の実施形態について説明する。なお、以下の説明に用いる図面では、同じ機能を持つ構成部や同じ処理を行うステップには同一の符号を記し、重複説明を省略する。以下の説明において、テキスト中で使用する記号「^」、「~」、「」、「」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。また、ベクトルや行列の各要素単位で行われる処理は、特に断りが無い限り、そのベクトルやその行列の全ての要素に対して適用されるものとする。
<第一実施形態>
<本実施形態の概要>
[収音信号のモデル化]
マイクロホンアレイを用いて収音した収音信号を用いて、対象となる音源の発する音を推定するための基本的な信号処理として線形フィルタリングがある。線形フィルタリングでは、M個のマイクロホンを用いて収音した収音信号それぞれに異なるフィルタを畳み込み、加算することで、出力信号を生成する。ここでは、線形フィルタリングを用いた信号強調について説明する。
(受音系)
マイクロホンアレイを用いた観測過程についてモデル化する。図1に示すように、強調して収音したい1つのターゲット音と抑圧して収音したいK(≧1)個の干渉雑音がある音場を想定する。これらの音により構成される音場をM(≧2)個のマイクロホンを用いて観測する。m(m=1,2,…,M)番目のマイクロホンとターゲット音との間の時間応答(インパルス応答)をa0,m(t)とし、m番目のマイクロホンとk(k=1,2,…,K)番目の雑音との間のインパルス応答をak,m(t)とする。ただし、インパルス応答長をLとし、t=0,1,…,L-1とする。なお、インパルス応答長Lは、装置の規模や構造、設置された部屋の状況によって定まる残響時間により、実験的に定めればよい。AD変換後の時間インデックスtにおけるターゲット音、k番目の雑音の音源信号をそれぞれs0(t)、sk(t)とする。また、m番目のマイクロホンに混在する背景雑音(センサの内部雑音を含む)をnm(t)とする。背景雑音は、チャネル毎に独立で平均0のガウス分布に従うこととする。m番目のマイクロホンにおける収音信号xm(t)は、次式でモデル化される。
Figure 0006294805
xm(t)を短時間フーリエ変換することで、式(1)の畳み込み混合は、次式のような周波数領域における瞬時混合として近似される。
Figure 0006294805
ここで、ω、τはそれぞれ角周波数、フレーム時間のインデックスを表わす。フレーム時間とは、短時間フーリエ変換を行う時間間隔のインデックスであり、たとえば10ms毎に短時間フーリエ変換を行う場合、時刻10msはフレーム時間のインデックスτ=1,時刻100msはフレーム時間のインデックスτ=10となる。また、Xm(ω,τ)、S0(ω,τ)、Sk(ω,τ)、Nm(ω,τ)は、それぞれ収音信号xm(t)、ターゲット音の音源信号s0(t)、k番目の雑音の音源信号sk(t)、背景雑音nm(t)の時間周波数表現を表わす。A0,m(ω)、Ak,m(ω)は、それぞれターゲット音とm番目のマイクロホンとの間の周波数応答(伝達特性)、k番目の雑音とm番目のマイクロホンとの間の周波数応答(伝達特性)を表す。式(2)をM個のマイクロホンについてまとめて行列形式で表記すると、次式のようになる。
Figure 0006294805
ここで、
Figure 0006294805
であり、Tは転置を表わす。
(線形フィルタリング)
受音系から出力されたM個の収音信号Xm(ω,τ)を入力とし、ターゲット音を強調するための信号処理として、線形フィルタリングを説明する。M^個の線形フィルタリングがありM^個のビームが形成されているものとする。まず、時間領域の信号処理を説明する。観測信号xm(t)と線形フィルタwm^,m(i)とを畳み込み、加算することで、m^番目のビームの出力信号ym^(t)を得る。
Figure 0006294805
ここで、Jはフィルタ長を表わし、インパルス応答長Lと同程度とすればよい。y m^ (t)の時間周波数表現であるYm^(ω,τ)をM^個のビームについてまとめて行列表現としたy(ω,τ)は、次式で近似的に求められる。
Figure 0006294805
ここで、Hは共役転置を表し、
Figure 0006294805
ここで、M^はビームフォーミングにおいて形成するビームの個数を表し、m^=1,2,…,M^とする。ビームの個数M^は、マイクロホンの個数Mと同程度の数であると仮定して話を進める。フィルタ係数Wm^,m(ω)は、例えば、遅延和法や最尤法等で生成することができる。
このとき、M^個の出力信号Ym^(ω,τ)を得るために、次式のように各周波数ω毎にM×M^回の乗算(W* m^,m(ω)Xm(ω,τ))と(M-1)×M^回の加算(ビームの方向m^毎にΣm=1 MW* m^,m(ω)Xm(ω,τ))とが必要になる。
Figure 0006294805
ただし、a*はaの共役複素数を表す。マイクロホンの個数Mが多い(例えば4本以上)ほど、鋭い指向形成が可能となるが、多くの出力信号Ym^(ω,τ)を得るためのビームフォーミングの計算量が大きくなる。例えば、20個のマイクロホンを用いて、20方向に対して指向形成する場合には、400回の乗算と380回の加算とが周波数毎に必要になる。
[本実施形態のポイント]
本実施形態では、マイクロホンアレイを構成するマイクロホンの指向性やマイクロホンの位置関係とフィルタ係数の関係を利用して、複数の方向に対してビームを形成するときに従来よりもビームフォーミングに必要な計算量を減らすことができる。
フィルタ係数は、以下のように格納されている。
Figure 0006294805
以下の場合、ビームフォーミングの計算量を削減することができる。
(1)Wm^,m(ω)に0の出現率が高いこと。
(2)m番目のマイクロホンに係るフィルタ係数に共通する数字が多いこと、言い換えると、Wi,m(ω)とWj,m(ω)とが同値であること、ただしi≠jである。
まず、(1)の場合、フィルタ係数Wm^,m(ω)が0であれば、乗算W* m^,m(ω)Xm(ω,τ)を行わずに、乗算結果を0として処理することができる。また、0を加算する際には、加算処理を行わずに、0を加算される値又は0に加算する値をそのまま加算結果として処理することができる。よって、乗算結果W* m^,m(ω)Xm(ω,τ)の総和を求める際に、乗算結果が0であれば、その分だけ加算処理を削減できる。よって、0であるフィルタ係数Wm^,m(ω)の個数分だけ乗算処理及び加算処理を削減できる。
また、(2)の場合、各マイクロホンmに係るフィルタ係数Wm^,mが共通であれば、乗算回数を削減することができる。つまり、Wi,m(ω)とWj,m(ω)とが同値の場合、Wi,m(ω)とXm(ω,τ)との乗算結果を得れば、この乗算結果をWi,m(ω)とXm(ω,τ)との乗算結果として利用できるため、実際に乗算処理を行う必要がない。
そこで、本実施形態では、以下のようなマイクロホンアレイの構成により、(1)、(2)の状況を作る。
(1)の状況を作り出しやすいのは、一部のマイクロホンに対して高い強度で音が混在する場合である。例えば、指向性のあるマイクロホンを異なる向きになるように配置することで達成される。一部のマイクロホンに対する空間情報のみを使ってフィルタ計算することで、フィルタ係数Wm^,m(ω)=0と収音信号Xm(ω,τ)との乗算処理を削減する。
(2)の状況を作り出しやすいのは、M個のマイクロホンが所定の条件を満たす位置に配置された場合である。例えば、(2-i)M個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つであるマイクロホンa-1とを通る回転軸の軸方向(以下、単に「a-1方向」ともいう)から到来する音波のマイクロホンa-1に対する遅延時間及び振幅レベルの差と、M個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つであるマイクロホンa-2(ただし、a-1≠a-2)とを通る回転軸の軸方向(以下、単に「a-2方向」ともいう)から到来する音波のマイクロホンa-2に対する遅延時間及び振幅レベルの差とが、同じになるようにM個のマイクロホンの1つであるマイクロホンb(≠a-1,a-2)が配置される場合である。また、(2-ii)M個のマイクロホンの空間的配置の中心を通るある回転軸(例えばM個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つであるマイクロホンaとを通る回転軸)に対して1回転させたときに、回転前のM個のマイクロホンの空間的配置と同一の空間的配置が複数回現れるように、言い換えると、回転対称性を満たすように、M個のマイクロホンが配置される場合といってもよい。なお、Mは4以上の整数とし、M個のマイクロホンの全てが同一平面上に存在しないように配置することで、より立体的に三次元空間にビームを形成することができる。例えば、正多面体の頂点にマイクロホンを配置することで、上記条件を満たすことができる。このとき、M個のマイクロホンの位置関係が、正多面体の頂点の位置関係に対応するように、M個のマイクロホンが配置される。
例えば、図2に示すように、正十二面体の頂点(20箇所)にガンマイクを配置する。このとき各ガンマイクは、それぞれ異なる方向に指向性を有するように配置される。図2では、各頂点に配置される各ガンマイクは、M個のマイクロホンの空間的配置の中心(つまり正十二面体の中心)と各頂点とを結ぶ軸方向であって、外方向に指向性を有するように配置される。ここで、M個のマイクロホンのうちの1個をマイクロホンbとし、マイクロホンbが配置された正十二面体の頂点から等距離かつ最短距離にある別の頂点に配置されたマイクロホンをマイクロホンa-1、マイクロホンa-2、マイクロホンa-3とする。このとき、b方向から到来する音波のマイクロホンbに対するマイクロホンa-1,a-2及びa-3の遅延時間及び振幅レベル差が同じになる。別の言い方をすると、(1)a-1方向かつ外方向から到来する音波のマイクロホンa-1に対するマイクロホンbの遅延時間及び振幅レベル差と、(2)a-2方向かつ外方向から到来する音波のマイクロホンa-2に対するマイクロホンbの遅延時間及び振幅レベル差と、(3)a-3方向かつ外方向から到来する音波のマイクロホンa-3に対するマイクロホンbの遅延時間及び振幅レベル差とが同じとなる。同様に、マイクロホンbが配置された正十二面体の頂点から等距離かつ二番目に短い距離にある別の頂点に配置されたマイクロホンをマイクロホンa-4、マイクロホンa-5、マイクロホンa-6、マイクロホンa-7、マイクロホンa-8、マイクロホンa-9とする。このとき、b方向から到来する音波のマイクロホンbに対するマイクロホンa-4、a-5、a-6、a-7、a-8及びa-9の遅延時間及び振幅レベル差が同じになる。別の言い方をすると、a-4方向、a-5方向、a-6方向、a-7方向、a-8方向又はa-9方向、かつ、外方向からそれぞれ到来する音波のマイクロホンa-4、a-5、a-6、a-7、a-8又はa-9に対するマイクロホンbの遅延時間及び振幅レベル差が同じとなる。よって、マイクロホンbの収音信号に乗じるフィルタ係数のうち、a-1方向、a-2方向及びa-3方向に対応するフィルタ係数を共通の値とすることができる。また、a-4方向、a-5方向、a-6方向、a-7方向、a-8方向及びa-9方向に対応するフィルタ係数を共通の値とすることができる。また、正十二面体の中心とその他のマイクロホンとを結ぶ軸方向であって、外方向に対して、マイクロホンbは全く指向性を有していないため、それらの方向に対応するフィルタ係数を0に設定する。このような構成により、ビームフォーミングの計算量を削減することができる。
<第一実施形態に係る収音装置10>
[収音装置10の信号処理]
第一実施形態に係る収音装置10の機能構成及び処理フローを図3と図4に示す。この第一実施形態の収音装置10は、M個のマイクロホン211−m、AD変換部120、周波数領域変換部130、フィルタリング部160、時間領域変換部170、フィルタ計算部150、伝達特性記憶部140を含む。m=1,2,…,Mであり、M≧4である。
収音装置10は、M個のマイクロホン211−mで音を収音し、M^個の出力信号を生成し、出力する。M^≧2である。
<マイクロホン211−m>
M個のマイクロホン211−mを用いて収音し(s1)、アナログ信号(収音信号)をAD変換部120に出力する。なお、マイクロホン211−mとマイクロホン211−m’とは、それぞれ異なる方向に指向性を有するように配置される。ここでは、m’は1,2,…,Mの何れかであり、m≠m’である。
M個のマイクロホンは、M個のマイクロホンの全てが同一平面上に存在しないように、かつ、(2-i)M個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つであるマイクロホンa-1とを通る回転軸の軸方向から到来する音波のマイクロホンa-1に対する遅延時間及び振幅レベルの差と、M個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つであるマイクロホンa-2(ただし、a-1≠a-2)とを通る回転軸の軸方向から到来する音波のマイクロホンa-2に対する遅延時間及び振幅レベルの差とが、同じになるようにM個のマイクロホンの1つであるマイクロホンb(≠a-1,a-2)が配置されるように、又は、(2-ii)M個のマイクロホンの空間的配置の中心を通るある回転軸(例えばM個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つであるマイクロホンaとを通る回転軸)に対して1回転させたときに、回転前のM個のマイクロホンの空間的配置と同一の空間的配置が複数回現れるように、言い換えると、回転対称性を満たすように、配置される。
例えば、M個のマイクロホンの位置関係が、正多面体の頂点の位置関係に対応するように、M個のマイクロホンが配置される。このとき、正多面体の頂点の必ずしも全部にマイクロホンが配置される必要はなく、(2-i)〜(2-ii)を満たすように一部に配置されてもよい。例えば、予め音波の到来方向が分かっている場合には、到来方向側に位置する頂点のみにマイクロホンを配置してもよい。
本実施形態では、図2に示すように、正十二面体の頂点(20箇所)にガンマイクを、配置する。このとき各ガンマイクは、それぞれ異なる方向に指向性を有するように配置される。図2では、各頂点に配置される各ガンマイクは、M個のマイクロホンの空間的配置の中心(つまり正十二面体の中心)と各頂点とを結ぶ軸方向であって、外方向に指向性を有するように配置される。
M個のマイクロホン211−mを支持する構造物は、図2に示すように、正十二面体の辺を構成する線状の構造物であってもよいし、他の形状であってもよい。例えば、球状の構造物の、正多面体の頂点に対応する箇所にM個のマイクロホン211−mを固定してもよい。また、構造体は、1つの部品からなる必要はなく、C(≧2)個の組立構造体からなってもよい。例えば、図5Aに示すような五角錐や図5Bに示すような五角形の辺を成す剛体を組立構造体として12個を用意し、20個のマイクロホンを12個の組立構造物の何れかに対して固定する。その際、20個のマイクロホンがそれぞれ正十二面体の頂点に重複しないように配置する。このような構成とすれば、12個の組立構造体を組み立てることにより、20個のマイクロホンが正十二面体の頂点に位置するような空間的配置となる。このような組立構造体を用いれば、必要に応じて簡単に構造体の形状を変形することができる。例えば、6個の組立構造体で半球状の構造体を構成し、そこに10個のマイクロホンを配置することができる。
<AD変換部120>
AD変換部120は、M個のマイクロホン211−mで収音されたM個のアナログ信号を入力とし、ディジタル信号x(t)=[x1(t),…,xM(t)]Tへ変換し(s2)、周波数領域変換部130に出力する。tは離散時間のインデックスを表す。
<周波数領域変換部130>
周波数領域変換部130は、まず、AD変換部120が出力したディジタル信号x(t)=[x1(t),…,xM(t)]Tを入力とし、チャネルごとにPサンプルをバッファに貯めてフレーム単位のディジタル信号x(τ)=[x 1(τ),…,x M(τ)]Tを生成する。τはフレーム番号のインデックスである。x m(τ)=[xm((τ-1)P+1),…,xm(τP)](1≦m≦M)である。Pはサンプリング周波数にもよるが、48kHzサンプリングの場合には2048点あたりが妥当である。次に、周波数領域変換部130は、各フレームのディジタル信号x(τ)を周波数領域の信号X(ω,τ)=[X1(ω,τ),…,XM(ω,τ)]Tに変換し(s3)、出力する。ωは離散周波数のインデックスである。時間領域信号を周波数領域信号に変換する方法の一つに高速離散フーリエ変換があるが、これに限定されず、周波数領域信号に変換する他の方法を用いてもよい。生成された周波数領域信号X(ω,τ)は、各周波数ω、フレームτごとに出力される。
<伝達特性記憶部140>
伝達特性記憶部140は、予め収音装置10を使って測定された伝達特性A(ω)=[a 1(ω),…,a M^(ω)]を記憶しておく。a m^(ω)=[am^,1(ω),…,am^,M(ω)]Tを、ビームの方向m^から到来する音とM本のマイクロホンとの間の周波数ωでの伝達特性、換言すれば、a m^(ω)=[am^,1(ω),…,am^,M(ω)]Tは、マイクロホンアレイに含まれる各マイクロホンへのビームの方向m^から到来する音の周波数ωでの伝達特性とする。なお、伝達特性記憶部140に記憶する伝達特性A(ω)は、事前測定によらず、理論式やシミュレーションにより事前に用意したものであってもよい。
伝達特性を事前測定する方法の一例を説明する。例えば、スピーカを、収音装置10を中心として上下左右、全方位に移動させ、各位置における伝達特性を測定する。さらに、収音装置10の中心からスピーカまでの距離を変更して、各位置における伝達特性を測定してもよい。
伝達特性記憶部140には、利用状況と同じ状況(M個の同じ配置の、同じマイクロホン211−m)で、事前に測定された伝達特性を記憶されていればよい。
<フィルタ計算部150>
フィルタ計算部150は、伝達特性記憶部140から伝達特性A(ω)を取り出し、フィルタW(ω)を計算し、フィルタリング部160に出力する。例えば、M^個の所定の位置又は方向からの音響信号を強調又は抑圧する信号処理に用いるフィルタW(ω)を計算する。
本実施形態のビームフォーミング技術の要点は、フィルタ係数Wm^,m(ω)に0の出現率を高め、m番目のマイクロホンに係るフィルタ係数に共通する数字が多くなるようにすることで、計算量を削減することである。そこで、まず、従来技術と同様の方法により、フィルタW(ω)を設計する。次に、ビームの方向m^に全く指向性を有していないマイクロホンmの収音信号に対するフィルタ係数Wm^,m(ω)を0に置き換える。また、a-1方向から到来する音波のマイクロホンa-1に対する遅延時間及び振幅レベルの差と、a-2方向から到来する音波のマイクロホンa-2に対する遅延時間及び振幅レベルの差とが、同じになるようにマイクロホンbが配置されている場合、マイクロホンbに係るフィルタ係数のうち、a-1方向に対応するフィルタ係数とa-2方向に対応するフィルタ係数とを共通する値に統一する。なお、ビームの方向m^に全く指向性を有していないマイクロホンmの収音信号に対するフィルタ係数Wm^,m(ω)は本来、0になるはずであるが、ノイズの影響から必ずしも0にはならないため、このような置き換えを行う。同様に、ノイズの影響を取り除くために、遅延時間が同じとなる複数の方向に対応するフィルタ係数を共通する値に統一する。
フィルタW(ω)を設計するための従来技術の概要を説明する。例えば、参考文献1に記載されている<1>SN比最大化規準によるフィルタ設計法、<2>パワーインバージョン(Power Inversion)に基づくフィルタ設計法、<3>一つ以上の死角(雑音のゲインが抑圧される方向)を拘束条件に持つ最小分散無歪応答法によるフィルタ設計法、<4>遅延合成(Delay-and-Sum Beam Forming)法によるフィルタ設計法、<5>最尤法によるフィルタ設計法、<6>AMNOR(Adaptive Microphone-array for noise reduction)法等によって、フィルタW(ω)を設計することができる。
[参考文献1]国際公開第WO2012/086834号パンフレット
例えば、遅延和法をベースとする場合、式(21)により、フィルタW DS1(ω)を計算する。
Figure 0006294805
また例えば、最尤法をベースとする場合、式(22)により、フィルタW DS2(ω)を計算する。
Figure 0006294805
ただし、R(ω)は、空間相関行列を表わす。
また例えば、一つ以上の死角を拘束条件に持つ最小分散無歪応答法によるフィルタ設計法の場合、次式により、フィルタW DS3(ω)を計算する。
Figure 0006294805
ただし、fm^(ω)はビームの方向m^に関する周波数ωでの通過特性を表す。例えば、式(23)において、伝達特性A(ω)が方向θに依存する伝達特性A(ω,θ)として事前に用意できる場合には、伝達特性A(ω,θ)を用いて、フィルタW(ω,θ)を計算し、フィルタリング部160において、特定の方向θの信号処理が行える。また、伝達特性A(ω)が方向θ、距離Dに依存する伝達特性A(ω,θ,D)として事前に用意できる場合には、伝達特性A(ω,θ,D)を用いて、フィルタW(ω,θ,D)を計算し、フィルタリング部160において、特定の位置(特定の方向θと距離Dにより特定される位置)の信号処理が行える。なお、フィルタ計算部150での処理は、各利用状況や設定したいフィルタに応じて1回計算すればよく、例えば、動作中に1回計算してもよいし、事前に各利用状況や設定したいフィルタを想定してフィルタ係数を計算しておき保持してもよい。
<フィルタリング部160>
フィルタリング部160は、予めフィルタ計算部150からフィルタW(ω)を受け取って保持している。フィルタリング部160は、周波数領域変換部130から出力された周波数領域信号x(ω,τ)を入力とし、フレームτごとに、各周波数ω∈Ωについて、周波数領域信号x(ω,τ)=[X1(ω,τ),…,XM(ω,τ)]Tに、フィルタW(ω)を適用して(式(13)〜(16)参照、s4)、出力信号y(ω,τ)を生成し、出力する。
Figure 0006294805
例えば、フィルタリング部160はマイクロホン211−mによる収音信号とマイクロホン211−m’による収音信号とに基づき、空間上の少なくとも複数の位置又は方向から発せられた音響信号の収音特性を異ならせるものであればよい。「収音特性を異ならせる」とは、例えば、特定の位置や方向で発せられた音響信号を局所収音して他の位置で発せられた音響信号を極力収音しないようにしたり、逆に特定の位置や方向で発せられた音響信号を抑圧(消音)して他の位置で発せられた音響信号のみを収音したりすることを意味する。なお、フィルタリング部のことを信号処理部ともいう。
<時間領域変換部170>
時間領域変換部170は、第τフレームの各周波数ω∈Ωの出力信号Y1(ω,τ),Y2(ω,τ),…,YM^(ω,τ)を入力とし、時間領域に変換して(s5)、第τフレームのフレーム単位時間領域信号y1(τ),y2(τ),…,yM^(τ)を得て、さらに、得られたフレーム単位時間領域信号y1(τ),y2(τ),…,yM^(τ)をフレーム番号のインデックスの順番に連結して時間領域信号y1(t),y2(t),…,yM^(t)を生成し、出力する。周波数領域信号を時間領域信号に変換する方法は、s3の処理で用いた変換方法に対応する逆変換であり、例えば高速離散逆フーリエ変換である。
<効果>
本実施形態では、マイクロホンアレイを構成するマイクロホンの指向性やマイクロホンの位置関係とフィルタ係数の関係を利用して、複数の方向に対してビームを形成するときに従来よりもビームフォーミングに必要な計算量を減らすことができる。
このような構成により、複数の方向に対してビームを形成するときに従来よりもビームフォーミングに必要な計算量を減らすことができる。多数の出力信号を生成するためのビームフォーミング処理において、マイクロホンアレイを構成する複数のマイクロホンの指向性をそれぞれ異なる方向とすることでフィルタ係数に0が現れる。また、複数のマイクロホンを所定の条件を満たすように配置することで、各マイクロホンに共通のフィルタ係数が現れる。その性質を利用して、計算量を削減することができる。
<変形例>
本実施形態では、(1)Wm^,m(ω)に0の出現率が高いことと、(2)m番目のマイクロホンに係るフィルタ係数に共通する数字が多いこととの両方を満たすようにマイクロホンアレイを構成しているが、何れか一方のみを満たすようにマイクロホンアレイを構成した場合であっても、従来よりもビームフォーミングに必要な計算量を減らすことができる。
第一実施形態では、M^個の出力信号ym^(t)を出力しているが、M^個のうちの2個以上M^個未満の出力信号ym^(t)を出力する場合であっても、その2個以上M^個未満の出力信号ym^(t)を求める際に用いるフィルタ係数の中に、共通する数字が現れれば、従来よりもビームフォーミングに必要な計算量を減らすことができる。
第一実施形態では、正多面体として、正十二面体を例示したが、他の多面体、正四面体、正六面体、正八面体、正二十面体であってもよい。頂点の数が多いほど、計算量を減らす効果を期待できるため、特に正十二面体や正二十面体のときに効果が大きい。
第一実施形態では、各ガンマイクは、M個のマイクロホンの空間的配置の中心と各頂点とを結ぶ軸方向であって、外方向に指向性を有するように配置されているが、例えば、内方向に指向性を有するように配置されてもよい。また、各マイクロホンは、それぞれ異なる方向に指向性を有すればよく、空間的配置の中心と各頂点とを結ぶ軸方向以外の方向に指向性を有してもよい。また、指向性を有するマイクロホンとして、ガンマイク以外のマイクロホンを用いてもよい。
本実施形態では、収音装置10は、M個のマイクロホン211−m、AD変換部120、周波数領域変換部130、フィルタリング部160、時間領域変換部170、フィルタ計算部150、伝達特性記憶部140を含むが、収音装置10は、M個のマイクロホン211−mのみを含む構成であってもよい。ただし、収音装置10で収音したM個の収音信号に対して、別装置においてフィルタリング部160でなされたフィルタリング処理がなされるものとする。また、収音装置10は、フィルタリング部160のみを含む構成であってもよい。ただし、フィルタリング部160に入力される収音信号は、第一実施形態で説明したM個のマイクロホン211−mと同様の構成により収音されたものとする。また、フィルタリング部160で用いるフィルタ係数は、第一実施形態のフィルタ計算部150と同様の方法で求められたフィルタ係数とする。
本発明は上記の実施形態及び変形例に限定されるものではない。例えば、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能である。
<プログラム及び記録媒体>
また、上記の実施形態及び変形例で説明した各装置における各種の処理機能をコンピュータによって実現してもよい。その場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記各装置における各種の処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶部に格納する。そして、処理の実行時、このコンピュータは、自己の記憶部に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実施形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよい。さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。また、サーバコンピュータから、このコンピュータへのプログラムの転送は行わず、その実行指示と結果取得のみによって処理機能を実現する、いわゆるASP(Application Service Provider)型のサービスによって、上述の処理を実行する構成としてもよい。なお、プログラムには、電子計算機による処理の用に供する情報であってプログラムに準ずるもの(コンピュータに対する直接の指令ではないがコンピュータの処理を規定する性質を有するデータ等)を含むものとする。
また、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (6)

  1. Mを4以上の整数とし、M個のマイクロホンを含み、
    前記M個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つである第一マイクロホンとを通る回転軸の軸方向である第一方向から到来する音波の前記第一マイクロホンに対する遅延時間と、M個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つである第二マイクロホンとを通る回転軸の軸方向である第二方向から到来する音波の第二マイクロホンに対する遅延時間とが、同じになるようにM個のマイクロホンの1つである第三マイクロホンが配置され、かつ、前記M個のマイクロホンの全てが同一平面上に存在しないように、
    さらに、
    前記M個のマイクロホンは、その位置関係が、正多面体の頂点の位置関係に対応するように配置され、
    前記M個のマイクロホンに含まれる各マイクロホンに対応する頂点と隣接する全ての頂点にそれぞれ配置されたマイクロホンは、前記空間的配置の中心と前記各マイクロホンとを通る回転軸の軸方向から到来する音波に対する遅延時間と振幅が同一になるように配置され、
    マイクロホンの位置関係とフィルタ係数の関係を利用して、所望の指向特性を得るフィルタリングを行うため、前記第三マイクロホンに係るフィルタのうち、前記第一方向に対応するフィルタ係数と、前記第二方向に対応するフィルタ係数と、が同一になるよう前記M個のマイクロホンが配置される、
    収音装置。
  2. 請求項1の収音装置であって、
    M個のマイクロホンは、それぞれ異なる方向に指向性を有する、かつ、前記M個のマイクロホンの空間的配置の中心と各マイクロホンとを結ぶ軸方向であって、外方向に指向性を有する、
    収音装置。
  3. 請求項1または請求項の何れかの収音装置であって、
    前記M個のマイクロホンはマイクロホンアレイとして機能させるものである、
    収音装置。
  4. 請求項1から請求項の何れかの収音装置であって、
    M^を2以上の整数とし、前記M個のマイクロホンの収音信号を用いて、(i)M^個の所定の何れかの方向若しくは位置から到来する音を強調した、又は/及び、(ii)M^個の所定の何れかの方向若しくは位置から到来する音を抑圧した出力信号を生成する信号処理部を含む、
    収音装置。
  5. 請求項1から請求項の何れかの収音装置であって、
    Cを2以上の整数とし、C個の組立構造物を含み、
    前記M個のマイクロホンがC個の組立構造物の何れかに対して固定され、前記C個の組立構造体を組み立てることにより、前記M個のマイクロホンが前記空間的配置となる、
    収音装置。
  6. Mを4以上の整数、M^を2以上の整数とし、M個のマイクロホンで収音された収音信号とフィルタ係数とを用いて、(i)M^個の所定の何れかの方向若しくは位置から到来する音を強調した、又は/及び、(ii)M^個の所定の何れかの方向若しくは位置から到来する音を抑圧した出力信号を生成する信号処理部を含み、
    前記M個のマイクロホンは、前記M個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つである第一マイクロホンとを通る回転軸の軸方向である第一方向から到来する音波の前記第一マイクロホンに対する遅延時間と、M個のマイクロホンの空間的配置の中心とM個のマイクロホンの1つである第二マイクロホンとを通る回転軸の軸方向である第二方向から到来する音波の第二マイクロホンに対する遅延時間とが、同じになるようにM個のマイクロホンの1つである第三マイクロホンが配置され、かつ、前記M個のマイクロホンの全てが同一平面上に存在しないように、配置され、
    前記第三マイクロホンに係るフィルタ係数のうち、前記第一方向に対応するフィルタ係数と前記第二方向に対応するフィルタ係数とを共通する値とする、
    収音装置。
JP2014212283A 2014-10-17 2014-10-17 収音装置 Active JP6294805B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014212283A JP6294805B2 (ja) 2014-10-17 2014-10-17 収音装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014212283A JP6294805B2 (ja) 2014-10-17 2014-10-17 収音装置

Publications (2)

Publication Number Publication Date
JP2016082414A JP2016082414A (ja) 2016-05-16
JP6294805B2 true JP6294805B2 (ja) 2018-03-14

Family

ID=55956577

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014212283A Active JP6294805B2 (ja) 2014-10-17 2014-10-17 収音装置

Country Status (1)

Country Link
JP (1) JP6294805B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11510000B2 (en) 2018-08-08 2022-11-22 Nippon Telegraph And Telephone Corporation Sound collection apparatus
JP7205192B2 (ja) 2018-11-22 2023-01-17 日本電信電話株式会社 収音装置

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5592441A (en) * 1995-10-06 1997-01-07 Martin Marietta Corporation High-gain directional transducer array
JP5175239B2 (ja) * 2009-04-03 2013-04-03 日本放送協会 収音装置
GB0906269D0 (en) * 2009-04-09 2009-05-20 Ntnu Technology Transfer As Optimal modal beamformer for sensor arrays
WO2012086834A1 (ja) * 2010-12-21 2012-06-28 日本電信電話株式会社 音声強調方法、装置、プログラム、記録媒体
JP5734329B2 (ja) * 2013-02-28 2015-06-17 日本電信電話株式会社 音場収音再生装置、方法及びプログラム

Also Published As

Publication number Publication date
JP2016082414A (ja) 2016-05-16

Similar Documents

Publication Publication Date Title
JP6458738B2 (ja) 音場再現装置および方法、並びにプログラム
JP6594222B2 (ja) 音源情報推定装置、音源情報推定方法、およびプログラム
RU2015129784A (ru) Фильтр и способ для информированной пространственной фильтрации, используя многочисленные мгновенные оценки направления прибытия
JP6106571B2 (ja) 音源位置推定装置、方法及びプログラム
JP6294805B2 (ja) 収音装置
JP6117142B2 (ja) 変換装置
JP4787727B2 (ja) 音声収音装置、その方法、そのプログラム、およびその記録媒体
Georgiou et al. Incorporating directivity in the Fourier pseudospectral time-domain method using spherical harmonics
JP2018077139A (ja) 音場推定装置、音場推定方法、プログラム
CN116309921A (zh) 基于cuda技术的延迟求和声成像并行加速方法
JP6691494B2 (ja) 収音装置、及び収音方法
JP5337189B2 (ja) フィルタ設計における反射物の配置決定方法、装置、プログラム
JP6063890B2 (ja) 変換装置
Hoffmann et al. Theoretical study of acoustic circular arrays with tangential pressure gradient sensors
US11830471B1 (en) Surface augmented ray-based acoustic modeling
JP5172909B2 (ja) 反射音情報推定装置、反射音情報推定方法、プログラム
Torres et al. Room acoustics analysis using circular arrays: A comparison between plane-wave decomposition and modal beamforming approaches
JP5660665B2 (ja) 反射音情報推定装置、反射音情報推定方法、プログラム
JP6685943B2 (ja) 分離行列設計装置、フィルタ係数算出装置、その方法、及びプログラム
Sanalatii et al. Estimation of loudspeaker frequency response and directivity using the radiation-mode method
JP5285665B2 (ja) 反射音情報推定装置、反射音情報推定方法、プログラム
JP5948259B2 (ja) 収音装置及び再生装置
JP5216056B2 (ja) 反射音情報推定装置、反射音情報推定方法、プログラム
JP5713933B2 (ja) 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム
JP2014143569A (ja) 収音装置及び再生装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20161019

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170829

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20171027

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20180213

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20180216

R150 Certificate of patent or registration of utility model

Ref document number: 6294805

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150