JP5713933B2 - 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム - Google Patents

音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム Download PDF

Info

Publication number
JP5713933B2
JP5713933B2 JP2012038298A JP2012038298A JP5713933B2 JP 5713933 B2 JP5713933 B2 JP 5713933B2 JP 2012038298 A JP2012038298 A JP 2012038298A JP 2012038298 A JP2012038298 A JP 2012038298A JP 5713933 B2 JP5713933 B2 JP 5713933B2
Authority
JP
Japan
Prior art keywords
signal
sound
direct
frequency domain
power estimation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2012038298A
Other languages
English (en)
Other versions
JP2013174480A (ja
Inventor
裕輔 日岡
裕輔 日岡
古家 賢一
賢一 古家
羽田 陽一
陽一 羽田
健太 丹羽
健太 丹羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012038298A priority Critical patent/JP5713933B2/ja
Publication of JP2013174480A publication Critical patent/JP2013174480A/ja
Application granted granted Critical
Publication of JP5713933B2 publication Critical patent/JP5713933B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、例えば、音声入力によって機器を操作するハンズフリー方式等に応用可能な、マイクロホンアレーを用いてマイクロホンアレーから音源までの距離を推定する音源距離測定装置、雑音除去装置、それらに用いられる音響直間比推定装置、それらの方法、及びプログラムに関する。
特許文献1に示す従来技術では、直間比を求めるためにマイクロホンアレーの受音信号を周波数領域に変換し、その信号から求められる空間相関行列を用いて直接音と間接音のそれぞれのパワーを求めている(例えば、実施例1の段落[0025]〜[0039]参照)。
特開2011−53062号公報
特許文献1に開示された方法では、直接音とそれと同じ方向から到来する間接音との区別がつかないため、直接音の方向から到来する音はすべて直接音と判断されてしまう。結果として直接音パワーを過大評価(または間接音パワーを過小評価)してしまい、最終的に求められる直間比が真の値よりも大きくなってしまう。
本発明はこのような点に鑑みてなされたものであり、音響信号の直間比推定値を精度よく求める技術を提供することを目的とする。
本発明では以下のように音響信号の直間比推定値を得る。
マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、当該周波数領域信号のパワー推定値を得る。また、上記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、上記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る。直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、上記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得、上記周波数領域信号のパワー推定値及び間接音のパワー推定値を用い、間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る。
本発明では、直接音源方向から到来する間接音を直接音と区別して、間接音のパワーを推定する。従って従来手法に比べ音響信号の直間比推定値を精度よく求めることができる。
音源距離測定装置を利用する場面の一例を示す図。 屋内での音の伝搬経路を例示する図。 直間比推定値とマイクロホンから音源までの距離との関係を例示する図。 座標系を説明するための図。 指向性の形状を例示する概念図。 音源距離推定装置の機能構成を例示する図。 音源距離推定装置の動作フローを例示する図。 周波数領域変換部及び直間比計算部を例示する図。 直間比計算部の機能構成を例示する図。 雑音除去装置の機能構成を例示する図。 雑音除去装置の動作フローを例示する図。
以下、図面を参照して本発明の実施形態を説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。また、以下の説明において、テキスト中で使用する記号「 ̄」や「^」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。
実施例の説明の前にこの発明の考えについて説明する。
〔この発明の考え〕
この発明は、単一のマイクロホンアレーを用いて、マイクロホンアレーと音源との間の距離を推定するものである。図1にこの発明の音源距離推定装置400を利用する場面を例示する。残響特性を持つ部屋10の中に、マイクロホンアレー11と、発話者12が存在している。マイクロホンアレー11と発話者12は距離を置いて配置されている。
この状況において、発話者12とマイクロホンアレー11との間の距離Dを推定したい。そこで、この発明は、直間比推定値を用いて音源とマイクロホンアレー間の距離を推定する。
直間比とは、受信音に含まれる直接音と間接音(残響音)との比(例えば、パワーの比、パワースペクトルの比、パワースペクトル密度の比、振幅の単調増加関数値の比)である。間接音のパワー推定値に対する直接音のパワー推定値の比率を表す値を「直間比推定値」と呼ぶ。例えば、直接音のパワー推定値を間接音のパワー推定値で除した値を直間比推定値としてもよいし、間接音のパワー推定値を直接音のパワー推定値で除した値を直間比推定値としてもよいし、それら何れかの関数値を直間比推定値としてもよい。パワー推定値とは、パワーの増加に応じて増加する値を意味する。パワー推定値の例は、パワー、パワースペクトル、パワースペクトル密度、振幅の単調増加関数値、それらの推定値などである。
図2に屋内にマイクロホンを置いて音を収録した際の、音源21からマイクロホン22までの音の伝搬経路を示す。直接音とは、音源21からマイクロホンまで直接到達する太い実線で示す音波である。一方の残響音とは、音源21から発した音が壁や床や天井などで反射してからマイクロホン22に到達する破線で示す音波である。
図3に直間比とマイクロホン間距離との関係を示す。図3の横軸はマイクロホンから音源までの距離、縦軸は直間比である。一般的に間接音はマイクロホンからの距離に依存しない一定の大きさを示す。その間接音に対して直接音は、マイクロホンからの距離の増加に伴って単調に減少する特性を示す。その直接音を間接音で除した直間比は、直接音と同様に距離の増加に伴って単調に減少する特性になる。
この発明の音源距離推定装置は、この直間比を用いることで、マイクロホンアレーで受音した受信音からマイクロホンアレーと音源との間の距離の推定を可能にする。この発明の音響直間比推定装置は、直間比推定値を出力する。また、この発明の雑音除去装置は、音響直間比推定装置が出力する直間比推定値に応じて受音信号の雑音を除去する。
直間比推定値を精度よく求めることができる原理を説明する。
<間接音の等方到来モデル>
提案方式では、間接音の等方性を考慮した信号モデルを導入する。ここでは、パワー推定値としてパワースペクトル密度又はその推定値を用いた例を説明するが、これは本発明を限定しない。
M(M≧2)個のマイクロホンからなるマイクロホンアレーのm番目のマイクロホンでの受音信号を短時間フーリエ変換等によって周波数領域に変換すると、以下の周波数領域信号X(ω,t)が得られる。
X(ω,t)=(HD (m)(ω)+HR (m)(ω))S(ω,t) (1)
ただし、ωは周波数であり、H (m)(ω)は直接音源からm番目のマイクロホンまでの直接音の伝達関数であり、H (m)(ω)は直接音源からm番目のマイクロホンまでの間接音の伝達関数であり、S(ω,t)は直接音源での音を周波数領域に変換して得られる信号である。tは所定の時間区間であるフレームのインデックスであり、インデックスtに対応するフレームを「フレームt」と表現する。
ここで直接音はコヒーレント(coherent)である一方、間接音はその主な成分が残響であることから拡散音(diffuse)であると仮定する。すなわち、それぞれの到来方向に着目した場合、直接音は音源の方向からのみ到来するのに対し、間接音はあらゆる方向から一様なパワーで到来する性質(以下「等方性」という)を持つ。提案方式ではこれら空間的な到来特性の違いに着目して間接音パワーを推定して直間比推定値を求める。
前提条件として直接音の到来方向(以下「直接音源方向」という)は既知であり、直接音及び任意の方向から到来する間接音は平面波とみなせるとし、拡散音の定義より直接音と間接音は互いに無相関とする。このとき直接音源からm番目のマイクロホンまでの直接音,間接音の伝達関数H (m)(ω),H (m)(ω)は、それぞれ以下のように表現できる。
Figure 0005713933

ただし、HDref(ω)は直接音源からマイクロホンアレーの基準点(「基準点」という)までの伝達関数の直接音成分であり、HRref,θ(ω)は基準点からみて方向θから到来する間接音成分である。基準点はマイクロホンアレーの内部に存在してもよいし、マイクロホンアレーの外部に存在してもよい。マイクロホンアレーの内部とは、例えば、マイクロホンアレーを構成する複数のマイクロホンを通る直線上、当該複数のマイクロホンを通る線分で囲まれた平面の内部、又は当該複数のマイクロホンを通る面で囲まれた立体の内部を意味する。マイクロホンアレーの外部とは、マイクロホンアレーの内部以外の位置を意味する。例えば、マイクロホンアレーを構成する複数のマイクロホンそれぞれと基準点との距離は、マイクロホンそれぞれと直接音源との距離よりも短い。基準点の例は、マイクロホンアレーの中心点、何れかマイクロホンの位置である。このとき方向θから到来する音の上記基準点からm番目のマイクロホンまでの間での伝搬遅延τθ (m)は、次式のように表される。
τθ (m)=-(1/c)uTpm
ここで第m番目のマイクロホンの位置pは、
pm=[pm,x, pm,y, pm,z]T
であり、図4A及び4Bに示すように直接音源方向を表す単位ベクトルuは、
u=[sinθ, cosθ, 0]T
であり、cは音波の伝搬速度である。またθは基準点からみた直接音源方向であり、jは虚数単位であり、eは自然対数である。また、θについての積分は0≦θ<2πの範囲で行われる(以下の積分についても同様)。
すなわち直接音と間接音の伝達関数HD (m)(ω),H (m)(ω)のそれぞれは、直接音源から基準点までの伝達関数成分と、基準点からm番目のマイクロホンまでの伝搬遅延による位相差成分とに分解して表すことができる。従って、周波数領域信号X(ω,t)(m∈{1,...,M})を要素とするマイクロホンアレー入力ベクトルX(ω,t)=[X(ω,t),...,X(ω,t)]は次式で表される。
Figure 0005713933

ただし、αはαの転置を表し、S(ω,t)=HDref(ω)S(ω,t),SR,θ(ω,t)=HRref,θ(ω)S(ω,t)である。また、Aθ(ω)は、方向θからマイクロホンアレーに到来する周波数ωの音の基準点からm番目のマイクロホンまでの経路の伝達関数を要素とするM次元ベクトルである。Aθ(ω)の具体例は、マイクロホンアレーの基準点からみた方向θのアレイ・マニフォールド・ベクトル(array manifold vector)である。以下にアレイ・マニフォールド・ベクトルをAθ(ω)とした例を示す。
Figure 0005713933
アレイ・マニフォールド・ベクトルの各要素は伝搬遅延τθ (m)に依存する。直接音及び間接音が平面波とみなせる場合、伝搬遅延τθ (m)はマイクロホンアレーの基準点に対する各マイクロホンの相対位置及び方向θに依存する。なお、アレイ・マニフォールド・ベクトルの詳細については、例えば、参考文献1「浅野太著,“音のアレイ信号処理−音源の定位・追跡と分離(日本音響学会編 音響テクノロジーシリーズ)”,株式会社コロナ社,2011年2月25日,ISBN978−4−339−01116−6」の第1章(P1〜26)を参照されたい。
このマイクロホンアレー入力に任意のビームフォーマ(BF: beamformer)を適用すると、その出力のパワースペクトル密度(PSD: power spectral density)PBM(ω)は以下のようになる。
Figure 0005713933

ただし、P(ω)=E[|S(ω,t)|、PR,θ(ω)=E[|SR,θ(ω,t)|である。W(ω)は、周波数領域のビームフォーマのフィルタ係数W(ω),...,W(ω)を要素とするベクトルW(ω)=[W(ω),...,W(ω)]である(参考文献1の第4.1章(P70,71)等参照)。U(ω)は、pq成分(p,q∈{1,...,M})に要素Upq(ω)=E[X(ω,t)X (ω,t)]を持つM×M行列(マイクロホンアレーの入力信号空間相関行列)である。E[α(t)]はα(t)のtについての期待値演算を表し、αはαの複素共役転置を表し、αはαの複素共役を表す。D(ω,θ)はビームフォーマによって形成される指向特性を表す関数(ω,θを定義域とする関数)である。すなわち、D(ω,θ)はビームフォーマによって形成される指向性の形状を表す。例えば、D(ω,θ)は以下のように表される。
Figure 0005713933
<ビームフォーマを用いた直間比推定>
式(4)において間接音がマイクロホンアレーに等方的に到来すると仮定できる音場では、PR,θ(ω)はθに依らない値P (ω)に置き換えることができる。この場合、式(4)は以下のように変形できる。
Figure 0005713933
次に、直接音源方向θから到来した信号成分を抑圧するビームフォーマを想定する。言い換えると、直接音源方向θにヌル(指向性の感度の低い点)を向けた指向特性形状(例えば図5参照)が得られるビームフォーマを想定する。さらに言い換えると、直接音源方向θに空間的なノッチを持った指向特性を実現するビームフォーマを想定する。このようなビームフォーマは、直接音源方向θの情報から容易に設定できる。例えば、参考文献1の第4.6章(P90〜97)に記載された「ブロッキング行列」によって表されるフィルタをこのようなビームフォーマとして用いることができる。直接音源方向θから到来した信号成分を抑圧するビームフォーマは、理想的には直接音源方向θから到来した信号成分をゼロにする。すなわち理想的にはD(ω,θ)=0となる。このような理想的なビームフォーマの出力パワースペクトル密度をPND(ω)とすると、式(6)から以下が成り立つ。
Figure 0005713933
ここで、D(ω,θ)がすべてのθについて間接音成分を抑圧しない指向特性を表すといえるのであれば、PND(ω)は間接音のパワースペクトル密度P(ω)であるとみなせる。しかしながら、方向θから到来する音のみを抑圧し、方向θ≠θから到来する信号を全く抑圧しない指向特性を得ることは困難である。仮に方向θ≠θから到来する信号を全く抑圧しない指向特性を得ることができたとしても、ここで想定しているビームフォーマは直接音源方向θから到来した音(間接音成分も含む)を抑圧するものであるため、少なくともこの方向θから到来する間接音成分は抑圧される。したがって、D(ω,θ)がすべてのθについて間接音成分を抑制しない指向特性を表すとは言えない。
そこで提案方式では、D(ω,θ)を用いて指向性形状補正係数R(ω)を求め、指向性形状補正係数R(ω)を用いてPND(ω)を補正し、間接音のパワースペクトル密度P(ω)を推定する。
PR(ω)=R(ω)PND(ω) (9)
例えば、周波数ωごとの|D(ω,θ)|の最大値をmaxθ’|D(ω,θ’)|とし、以下のように指向性形状補正係数R(ω)が設定されてもよい(指向性形状補正係数の具体例1)。
Figure 0005713933

ただし、θ’は|D(ω,θ)|を最大化するθを意味する。
或いは、特定の角度領域Θでの|D(ω,θ’’)|(θ’’∈Θ)の平均値を分子とし、以下のように指向性形状補正係数R(ω)が設定されてもよい(指向性形状補正係数の具体例2)。
Figure 0005713933

ただし、||Θ||は角度領域Θの大きさを表す0より大きな有理数である。例えば、||Θ||は以下を満たす。
Figure 0005713933

角度領域Θの具体例は、直接音源方向θを除く何れかの角度領域、直接音源方向θの逆方向を含む角度領域、|D(ω,θ)|を最大化する方向θを含む角度領域、予め定められた角度領域の候補のうち|D(ω,θ)|の平均値を最大化する角度領域などである。
その他、式(10)又は式(11)に補正定数が乗じられたものが指向性形状補正係数R(ω)とされてもよい(指向性形状補正係数の具体例3)。この場合、音響特性を考慮した周波数依存の補正定数が乗じられてもよいし、周波数不依存の補正定数が乗じられてもよい。或いは、式(8)の分子が周波数依存又は不依存の定数であってもよい(指向性形状補正係数の具体例4)。
提案方式では、指向性形状補正係数R(ω)を用いてビームフォーマの出力パワースペクトル密度PND(ω)を補正し、間接音のパワースペクトル密度の推定値P(ω)を求める。これにより、直接音源方向θから到来し、ビームフォーマによって抑圧された間接音成分を補正でき、間接音のパワースペクトル密度の推定値P(ω)を精度よく求めることができる。
間接音のパワースペクトル密度の推定値P(ω)が得られれば、さらに周波数領域信号X(ω,t),...,X(ω,t)から得られるパワースペクトル密度の推定値P(ω)を用い、直間比推定値DRRを得ることができる。例えば、以下の直間比推定値DRRを得ることができる(直間比推定値DRRの具体例1)。
Figure 0005713933
或いは、以下のようなデシベル表記の直間比推定値DRRであってもよい(直間比推定値DRRの具体例2)。
Figure 0005713933
或いは、以下のように周波数ωごとに直間比推定値DRR(ω)が得られてもよい(直間比推定値DRRの具体例3)。
Figure 0005713933
或いは、式(12)−(15)の何れかに定数が乗じられたものが直間比推定値とされてもよいし(直間比推定値DRRの具体例4)、式(12)−(15)の何れかの逆数が直間比推定値とされてもよいし(直間比推定値DRRの具体例5)、式(12)−(15)の何れかの逆数に定数が乗じられたものが直間比推定値とされてもよい(直間比推定値DRRの具体例6)。その他、式(12)−(15)の単調増加関数値が直間比推定値とされてもよい(直間比推定値DRRの具体例7)。
或いは、K個のフレームt=(L−1)+1,...,(L−1)+KからなるブロックLに対応する受音信号のみを対象としてPND(ω),P(ω),P(ω)を求め、ブロックLごとに直間比推定値DRR又はDRR(ω)(直間比推定値DRRの具体例1〜7)を求め、それをブロックLでの直間比推定値DRR又はDRR(ω)としてもよい。ただし、Kは1以上の整数定数であり、Lはブロックに対応する1以上の整数インデックスである。(直間比推定値DRRの具体例8)。この場合、K=1としたブロック、すなわちフレームごとに直間比推定値DRR又はDRR(ω)が得られてもよい。以下においてK=1のブロックはフレームと同義であるとする(直間比推定値DRRの具体例9)。その他、様々な直間比推定値が想定できる。以下では、このような直間比推定値を総称して「直間比推定値DRR」と表現する。
その他、互いに位置の異なる直接音源が複数存在し、直接音源方向θが複数存在する場合も上記と同様に考えることができる。
図6にこの発明の音源距離推定装置400の機能構成例を示す。その動作フローを図7に示す。音源距離推定装置400は、マイクロホンアレー41と、複数の周波数領域変換部421〜42Mと、直間比計算部43と、距離−直間比データベース(以降、距離−直間比DBと称する)44と、距離判定部45と、を具備する。マイクロホンアレー41を除く各機能構成部は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
マイクロホンアレー41は複数のマイクロホン1,…Mから成る。複数の周波数領域変換部421,…,42Mは、複数のマイクロホン1,…Mで受音された受音信号xm(n)がそれぞれ入力され、各受音信号を周波数領域信号に変換する(ステップS42)。周波数領域変換部421,…,42Mは、受音信号xm(n)を、例えばサンプリング周波数16kHzでサンプリングしてディジタル信号に変換し、例えば256個のサンプルを1フレームとして、それぞれのフレームにおいて離散フーリエ変換を行い、周波数成分Xm(ω,t)を出力する(ステップS42)。ωは周波数、tはフレーム番号である。なお、受音信号xm(n)をディジタル信号に変換するA/D変換器は省略している。
直間比計算部43は、複数の周波数領域変換部421,…,42mが出力する周波数領域信号Xm(ω,t)を入力として受音信号の直間比推定値DRRを生成する(ステップS43)。
距離−直間比DB44は、直間比推定値とマイクロホンアレーと音源との距離との関係を記録している。距離判定部45は、直間比推定値DRRを入力として距離−直間比DB44を参照してその直間比推定値DRRと対応する距離を推定する(ステップS45)。ステップS42〜ステップS45までの動作は、全ての受音信号xm(n)が終了するまで継続される。
以上の動作により、マイクロホンアレーによって、例えば、特定の距離範囲にある音だけを強調し、その範囲外の音は抑圧して雑音除去が行われる。以降、各部のより具体的な機能構成例を示して更に詳しくこの発明を説明する。
〔直間比計算部〕
以下ではパワースペクトル密度又はその推定値をパワー推定値とした例を示す。
図9に例示するように、直間比計算部43は、受音パワー推定部431と、重み係数記憶部432と、指向性形成部433と、直接音抑圧パワー推定部434と、指向性形状分析部435と、間接音パワー推定部436と、直間比推定部437とを備える。
図8及び9に例示するように、周波数領域変換部42,…,42から出力された周波数領域信号X(ω,t),…,X(ω,t)は、直間比計算部43の受音パワー推定部431と指向性形成部433に入力される。受音パワー推定部431は、周波数領域信号X(ω,t),…,X(ω,t)を用い、受音信号に対応する周波数領域信号のパワー推定値を生成して出力する。このパワー推定値は、何れか1個のマイクロホンm(m∈{1,…,M})に対応する周波数領域信号X(ω,t)のパワー推定値であってもよいし、周波数領域信号X(ω,t),…,X(ω,t)それぞれのパワー推定値を重み付け平均したものであってもよい。実施例1では、受音信号に対応する周波数領域信号のパワー推定値としてパワースペクトル密度P(ω)を求める。ここでは、K個のフレーム(L−1)+1,...,(L−1)+KからなるブロックLごとにパワースペクトル密度P(ω)が得られる例を示し、ブロックLで得られるパワースペクトル密度P(ω)をPX,L(ω)と表す。式(16)は1個のマイクロホンmのパワースペクトル密度をPX,L(ω)とする例であり、式(17)は周波数領域信号X(ω,t),…,X(ω,t)それぞれのパワースペクトル密度の重み付け平均値をPX,L(ω)とする例である。
Figure 0005713933
重み係数記憶部432には、前述した直接音源方向θから到来した信号成分を抑圧するビームフォーマのフィルタ係数W(ω),...,W(ω)が格納されている。指向性形成部433は、重み係数記憶部432から読み出したフィルタ係数W(ω),...,W(ω)を用い、入力された周波数領域信号X(ω,t),…,X(ω,t)に対して直接音源方向θから到来した信号成分を抑圧する処理を行い、それによって得られた直接音抑圧信号ND(ω,t)を生成して出力する。例えば、指向性形成部433は、以下のように直接音抑圧信号ND(ω,t)を生成する。
Figure 0005713933
直接音抑圧パワー推定部434には、直接音抑圧信号ND(ω,t)を入力とし、直接音抑圧信号ND(ω,t)のパワー推定値を生成して出力する。実施例1では、直接音抑圧信号X(ω,t)のパワー推定値としてパワースペクトル密度PND(ω)を求める。ここでは、ブロックLごとにパワースペクトル密度PND(ω)が得られる例を示し、ブロックLで得られるパワースペクトル密度PND(ω)をPND,L(ω)と表す。
Figure 0005713933
指向性形状分析部435は、重み係数記憶部432から読み出したフィルタ係数W(ω),…,W(ω)を用い、前述した直接音源方向θから到来した信号成分を抑圧するビームフォーマによって形成される指向特性を表す関数D(ω,θ)、すなわち指向性の形状を生成して出力する。例えば、指向性形状分析部435は、マイクロホンアレー41の基準点及びマイクロホン1,…,Mに対応するAθ(ω)等の情報を事前に取得しており、これらとフィルタ係数W(ω),…,W(ω)とを用い、例えば式(5)に従ってD(ω,θ)を生成する。さらに指向性形状分析部435は、D(ω,θ)を用いて指向性形状補正係数R(ω)を生成して出力する。指向性形状補正係数R(ω)の例は、前述した指向性形状補正係数の具体例1〜4である。
間接音パワー推定部436には、直接音抑圧信号ND(ω,t)のパワー推定値であるパワースペクトル密度をPND,L(ω)と、指向性形状補正係数R(ω)とが入力される。間接音パワー推定部436は、指向性形状補正係数R(ω)を用い、直接音抑圧信号ND(ω,t)のパワー推定値であるパワースペクトル密度PND,L(ω)を補正し、間接音のパワー推定値を生成して出力する。実施例1では、以下のように間接音のパワースペクトル密度の推定値P(ω)をブロックLごとに求める。なお、ブロックLでのパワースペクトル密度の推定値P(ω)をPR,L(ω)と表現する。
PR,L(ω)=R(ω)PND,L(ω) (20)
直間比推定部437には、周波数領域信号のパワー推定値であるパワースペクトル密度PX,L(ω)及び間接音のパワー推定値であるパワースペクトル密度の推定値PR,L(ω)が入力される。直間比推定部437は、これらを用いて周波数領域信号X1(ω,t),…,XM(ω,t)の直間比推定値DRRを生成して出力する。直間比推定値DRRの例は、直間比推定値DRRの具体例1〜9である。実施例1では、直間比推定値DRRの具体例1又は2のP(ω)をPX,L(ω)に、P(ω)をPR,L(ω)に、それぞれ置換して得られる直間比推定値DRRが、DRRとして得られることにする。
以上説明した直間比計算部43と、マイクロホンアレー41と、複数の周波数領域変換部421〜42Mの構成で、直間比推定値DRRを出力する音響直間比推定装置71が構成できる。
距離−直間比DB44には、距離と直間比推定値との関係に関する情報が予め記録されている。距離と直間比推定値との関係に関する情報とは、実際に実験により求めた距離と直間比とを対応付けた組(d1,E1),(d2,E2),…を線形補間して得られる関数や、(d1,E1),(d2,E2),…の組から求めた近似関数等の距離と直間比推定値との関係を示す関数式d=f(DRR)とする。関数f(DRR)は、例えば、参考文献「M.Tohyama et. al.”The Nature and Technology of Acoustic Space,”Academic Press,1995.」に記載されている。
距離判定部45は、直間比計算部43から入力される直間比推定値DRRと、距離−直間比DB44に記録されている距離と直間比推定値との関係を参照して、直間比推定値DRRに対応する音源距離推定値d^を出力する。
距離と直間比とを対応付けた組(d1,E1),(d2,E2),…そのものが距離−直間比DB44に格納されている場合は、次の三つのステップにより音源距離推定値d^を求めて出力する。
第一ステップ:距離−直間比DB44に格納されたE1,E2,…の内、直間比計算部43で求めた直間比推定値DRRに隣接する2つの直間比EmとEnを求める。
第二ステップ:直間比EmとEnのそれぞれに対応する距離dmとdnを距離−直間比DB44より求める。
第三ステップ:距離dmとdnとから音源距離推定値d^を式(21)に示すように線形補間して求める。
Figure 0005713933

また、距離判定部45は、関数式d=f(DRR)が距離−直間比DB44に格納されている場合には、直間比計算部43から入力される直間比推定値DRRから音源距離推定値d^を計算して出力する。
図10に、この発明の雑音除去装置700の機能構成例を示す。その動作フローを図11に示す。雑音除去装置700は、実施例1で述べた音響直間比推定装置71と、処理対象信号生成部72と、対象信号調整部73と、逆周波数領域変換部74と、を具備する。
処理対象信号生成部72は、音響直間比推定装置71内の複数の周波数領域変換部421〜42Mが出力する周波数領域信号Xm(ω,t)を入力として処理対象信号X(ω,t)を出力する(ステップS71,S72)。処理対象信号Y(ω,t)は、周波数領域信号Xm(ω,t)を例えば図示しない加算手段等で合成したものである。加算する前に、各周波数領域信号Xm(ω,t)に、重みを乗じる様にしても良い。
対象信号調整部73は、音響直間比推定装置71が出力する直間比推定値DRRと、処理対象信号生成部72が出力する処理対象信号X(ω,t)を入力として、処理対象信号X(ω,t)の振幅を調整した処理後信号Y(ω,t)を生成する(ステップS73)。逆周波数領域変換部74は、処理後信号Y(ω,t)を時間領域の信号y(n)に変換する(ステップS74)。
対象信号調整部73は、例えば、距離算出手段721、フィルタ形成手段722、乗算手段723、を備える。距離算出手段721は、マイクロホンアレー41と音源との間の距離と、直間比推定値DRRとの関係を示す関数式d=f(DRR)を内蔵し、入力される直間比推定値DRRに応じた音源距離推定値d^を算出する(距離算出ステップS721)。
フィルタ形成手段722は、式(22)に示すように、音源距離推定値d^が、2つの大きさが異なる閾値dfとdnの間の値を取る時間周波数成分を強調するように設定し、2つの距離区間内の帯状の領域にある音源だけを強調するフィルタを形成する。
Figure 0005713933

ここで、G(ω,t)は、或る周波数領域Ωに含まれる全ての周波数について、同じG(ω,t)が乗算される。周波数領域Ωは、例えば信号成分の集中する周波数帯域を選択するなどして決定される。例えば、任意のm番目のマイクロホンに接続された周波数領域変換部42mの出力Xm(ω,t)のうち、式(23)に示す様にXm(ω,t)の絶対値が予め設定された閾値Pthより大きい値を持つ周波数ωを選んだり、Xm(ω,t)の絶対値が大きい方からκ番目までの周波数ωを選ぶことで決定される。
Figure 0005713933

ここで、Pthは、例えば|Xm(ω, t)|の全周波数の平均値などが用いられる。また、式(22)においてG(ω,t)の値は必ずしも1と0である必要は無く、例えば、0.9と0.1のように十分大きさが異なる値でも良い。
乗算手段723は、処理対象信号X(ω,t)に、フィルタG(ω,t)を乗じて処理後信号Y(ω,t)を生成する。したがって、処理後信号Y(ω,t)は、2つの距離区間内、つまり、マイクロホンアレー41から特定の距離範囲に位置する音源の音声が、強調若しくは抑圧されたものとなる。この処理後信号Y(ω,t)は、逆周波数領域変換部74で時間領域の信号y(n)に変換される。
なお、本発明は上述の実施形態に限定されるものではない。
例えば、周波数ω単位で求めたDRR(ω)を直間比推定値として実施例2が実行されてもよい。DRR(ω)の具体例は、式(14)若しくは式(15)の直間比推定値、又は、式(14)若しくは式(15)のP(ω)をPX,L(ω)に、P(ω)をPR,L(ω)に、それぞれ置換して得られる直間比推定値である。この場合には、あらかじめ周波数ωごとに用意した関係式d(ω)=f(DRR(ω))に直間比推定値DRR(ω)を代入してd^(ω)を求め、式(24)のようにフィルタを形成する。
Figure 0005713933

ただし、d(ω)とd(ω)は、あらかじめ用意された互いに大きさが異なる閾値である。
或いは例えば、上述の周波数領域で行われた処理の一部が時間領域で実行されてもよい。例えば、上述の実施形態では、指向性形成部433が、周波数領域のフィルタ係数W(ω),...,W(ω)を周波数領域信号X(ω,t),…,X(ω,t)に適用し、それによって直接音源方向θから到来した信号成分を抑圧した直接音抑圧信号ND(ω,t)を生成した。しかしながら、時間領域で受音信号x(n),…,x(n)のディジタル信号に対して直接音源方向から到来した信号成分を抑圧する処理を行い、それによって得られた信号を周波数領域に変換して直接音抑圧信号ND(ω,t)が生成されてもよい。すなわち、受音信号x(n),…,x(n)のディジタル信号に対し、フィルタ係数W(ω),...,W(ω)に対応する時間領域のフィルタ係数を畳み込み、その結果を周波数領域に変換して直接音抑圧信号ND(ω,t)が生成されてもよい。
音源距離測定装置、音響直間比推定装置、又は雑音除去装置に含まれる機能構成が外部の装置によって実現されてもよい。例えば、音源距離測定装置400や雑音除去装置700が、マイクロホンアレーが含まず、外部のマイクロホンアレーに接続されて同様の機能が実現されてもよい。同様に、雑音除去装置700が、周波数領域変換部や逆周波数領域変換部を含まず、外部の周波数領域変換部や逆周波数領域変換部を利用して同様の機能が実現されてもよい。
その他、上述の各種の処理は、記載に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されてもよい。その他、本発明の趣旨を逸脱しない範囲で適宜変更が可能であることはいうまでもない。
また、上述の構成をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、上記処理機能がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体の例は、非一時的な(non-transitory)記録媒体である。このような記録媒体の例は、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等である。
このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記憶装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
このようなプログラムを実行するコンピュータは、例えば、まず、可搬型記録媒体に記録されたプログラムもしくはサーバコンピュータから転送されたプログラムを、一旦、自己の記憶装置に格納する。そして、処理の実行時、このコンピュータは、自己の記録装置に格納されたプログラムを読み取り、読み取ったプログラムに従った処理を実行する。また、このプログラムの別の実行形態として、コンピュータが可搬型記録媒体から直接プログラムを読み取り、そのプログラムに従った処理を実行することとしてもよく、さらに、このコンピュータにサーバコンピュータからプログラムが転送されるたびに、逐次、受け取ったプログラムに従った処理を実行することとしてもよい。
実施例では、コンピュータ上で所定のプログラムを実行させることにより、各装置を構成することとしたが、これらの処理内容の少なくとも一部がハードウェアで実現されてもよい。
71 音響直間比推定装置
400 音源距離測定装置
700 雑音除去装置

Claims (7)

  1. マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定部と、
    前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定部と、
    前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定部と、
    前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比推定部と、
    前記直間比推定値と距離との関係を記録した距離−直間比データベースと、
    前記直間比推定値を入力として前記距離−直間比データベースを参照して当該直間比推定値と対応する音源距離推定値を推定する距離判定部と、
    を具備する音源距離測定装置。
  2. マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定部と、
    前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定部と、
    前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定部と、
    前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得て出力する直間比推定部と、
    を具備する音響直間比推定装置。
  3. 請求項2に記載した音響直間比推定装置と、
    前記受音信号を周波数領域に変換して得られる前記周波数領域信号を入力として処理対象信号を生成する処理対象信号生成部と、
    請求項2に記載した音響直間比推定装置が出力する直間比推定値と、前記処理対象信号とを入力として、前記処理対象信号の振幅を、当該直間比推定値に基づくマイクロホンアレーからの音源距離推定値が所望の距離区間内にある場合には大きく、そうでない場合は小さくなるように調整した処理後信号を生成する対象信号調整部と、
    を具備する雑音除去装置。
  4. マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定ステップと、
    前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定ステップと、
    前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定ステップと、
    前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比推定ステップと、
    前記直間比推定値を入力として、前記直間比推定値と距離との関係を記録した距離−直間比データベースを参照して当該直間比推定値と対応する音源距離推定値を推定する距離判定ステップと、
    を具備する音源距離測定方法。
  5. マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受音パワー推定ステップと、
    前記周波数領域信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた直接音抑圧信号のパワー推定値、又は、前記受音信号に対して直接音源方向から到来した信号成分を抑圧する処理を行って得られた信号を周波数領域に変換して得られた直接音抑圧信号のパワー推定値を得る直接音抑圧パワー推定ステップと、
    前記直接音源方向から到来した信号成分を抑圧する指向特性を表す関数から得られた指向性形状補正係数を用い、前記直接音抑圧信号のパワー推定値を補正し、間接音のパワー推定値を得る間接音パワー推定ステップと、
    前記周波数領域信号のパワー推定値及び前記間接音のパワー推定値を用い、前記間接音のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得て出力する直間比推定ステップと、
    を具備する音響直間比推定方法。
  6. 請求項5に記載した音響直間比推定方法の各ステップと、
    前記受音信号を周波数領域に変換して得られる前記周波数領域信号を入力として処理対象信号を生成する処理対象信号生成ステップと、
    請求項5に記載した音響直間比推定方法の直間比推定ステップで出力される直間比推定値と、前記処理対象信号とを入力として、前記処理対象信号の振幅を、当該直間比推定値に基づくマイクロホンアレーからの音源距離推定値が所望の距離区間内にある場合には大きく、そうでない場合は小さくなるように調整した処理後信号を生成する対象信号調整ステップと、
    を具備する雑音除去方法。
  7. 請求項1から3の何れかの装置としてコンピュータを機能させるためのプログラム。
JP2012038298A 2012-02-24 2012-02-24 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム Active JP5713933B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012038298A JP5713933B2 (ja) 2012-02-24 2012-02-24 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012038298A JP5713933B2 (ja) 2012-02-24 2012-02-24 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013174480A JP2013174480A (ja) 2013-09-05
JP5713933B2 true JP5713933B2 (ja) 2015-05-07

Family

ID=49267513

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012038298A Active JP5713933B2 (ja) 2012-02-24 2012-02-24 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5713933B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR102105752B1 (ko) * 2018-03-14 2020-04-29 한국과학기술원 반사 인지를 통한 음원 위치 추적 방법 및 시스템

Family Cites Families (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2792338B2 (ja) * 1992-06-04 1998-09-03 三菱電機株式会社 信号処理装置
JP2743719B2 (ja) * 1992-07-23 1998-04-22 三菱電機株式会社 伝搬経路長計測装置
JP3613120B2 (ja) * 2000-02-29 2005-01-26 三菱電機株式会社 バイスタティックレーダ装置
JP5079761B2 (ja) * 2009-09-01 2012-11-21 日本電信電話株式会社 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム
JP5143802B2 (ja) * 2009-09-01 2013-02-13 日本電信電話株式会社 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム

Also Published As

Publication number Publication date
JP2013174480A (ja) 2013-09-05

Similar Documents

Publication Publication Date Title
JP5079761B2 (ja) 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム
JP5493850B2 (ja) 信号処理装置、マイクロホン・アレイ装置、信号処理方法、および信号処理プログラム
US20140056106A1 (en) Sound source signal filtering apparatus based on calculated distance between microphone and sound source
JP4724054B2 (ja) 特定方向収音装置、特定方向収音プログラム、記録媒体
Huleihel et al. Spherical array processing for acoustic analysis using room impulse responses and time-domain smoothing
Padois et al. On the use of modified phase transform weighting functions for acoustic imaging with the generalized cross correlation
CN111819862B (zh) 音频编码设备和方法
JP4928382B2 (ja) 特定方向収音装置、特定方向収音方法、特定方向収音プログラム、記録媒体
JP5738218B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
Melon et al. Evaluation of a method for the measurement of subwoofers in usual rooms
JP4787727B2 (ja) 音声収音装置、その方法、そのプログラム、およびその記録媒体
JP5635024B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
JP2011119898A (ja) 音声取得装置、音声取得方法、音声取得プログラム
JP5986966B2 (ja) 音場収音再生装置、方法及びプログラム
JP5698166B2 (ja) 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム
JP5713933B2 (ja) 音源距離測定装置、音響直間比推定装置、雑音除去装置、それらの方法、及びプログラム
JP5143802B2 (ja) 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム
JPH09261792A (ja) 受音方法及びその装置
JP5235725B2 (ja) 発話向き推定装置、方法及びプログラム
JP3862685B2 (ja) 音源方向推定装置、信号の時間遅延推定装置及びコンピュータプログラム
JP5235722B2 (ja) 発話向き推定装置、方法及びプログラム
JP6650245B2 (ja) インパルス応答生成装置及びプログラム
JP5826465B2 (ja) 瞬時直間比推定装置、雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム
JP2005062096A (ja) 話者位置検出方法、装置、プログラム、および記録媒体
JP2010103617A (ja) 発話向き推定装置、方法及びプログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140821

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140826

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141002

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150303

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150310

R150 Certificate of patent or registration of utility model

Ref document number: 5713933

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150