JP5738218B2 - 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム - Google Patents

音響信号強調装置、遠近判定装置、それらの方法、及びプログラム Download PDF

Info

Publication number
JP5738218B2
JP5738218B2 JP2012041052A JP2012041052A JP5738218B2 JP 5738218 B2 JP5738218 B2 JP 5738218B2 JP 2012041052 A JP2012041052 A JP 2012041052A JP 2012041052 A JP2012041052 A JP 2012041052A JP 5738218 B2 JP5738218 B2 JP 5738218B2
Authority
JP
Japan
Prior art keywords
signal
power
sound
value
direct
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2012041052A
Other languages
English (en)
Other versions
JP2013179388A (ja
Inventor
裕輔 日岡
裕輔 日岡
古家 賢一
賢一 古家
羽田 陽一
陽一 羽田
健太 丹羽
健太 丹羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2012041052A priority Critical patent/JP5738218B2/ja
Publication of JP2013179388A publication Critical patent/JP2013179388A/ja
Application granted granted Critical
Publication of JP5738218B2 publication Critical patent/JP5738218B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音響信号の直間比を推定する技術に関する。
特許文献1に示す従来技術では、直間比を求めるためにマイクロホンアレーの受音信号を周波数領域に変換し、その信号から求められる空間相関行列を用いて直接音と間接音のそれぞれのパワーを求めている(例えば、実施例1の段落〔0034〕〜〔0061〕参照)。
特開2009−201724号公報
特許文献1に開示された方法では、直接音とそれと同じ方向から到来する間接音との区別がつかないため、直接音の方向から到来する音はすべて直接音と判断されてしまう。結果として直接音パワーを過大評価(または間接音パワーを過小評価)してしまい、最終的に求められる直間比が真の値よりも大きくなってしまう課題がある。
本発明は、このような課題に鑑みてなされたものであり、直接音の方向から到来する残響音を区別して、直接音パワーと残響音パワーを推定することで、従来手法に比べてより真値に近い直間比推定値(DRR:Direct-to-Reverberation energy Ratio)を得、その正確な直間比推定値に基づいて音源の音響信号を精度よく再生する音響信号強調装置と遠近判定装置と、それらの方法及びプログラムを提供することを目的とする。
本発明の音響信号強調装置は、受信音パワー推定部と、直接音方向パワー推定部と、残響音方向パワー推定部と、減算部と、直間比算出部と、対象信号調整部を有する。受信音パワー推定部は、マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、当該周波数領域信号のパワー推定値を得る。直接音方向パワー推定部は、直接音源方向から到来した信号成分を主に通過させるように指向性形状のメインビームを向ける第1のビームフォーマを、周波数領域信号に対して適用して得られるパワー推定値、又は、第1のビームフォーマを、受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、直接音方向信号のパワー推定値として得る。残響音方向パワー推定部は、第1のビームフォーマと同じ指向性形状で、なおかつ指向性感度の低い点を直接音源方向に向ける第2のビームフォーマを、周波数領域信号に対して適用して得られるパワー推定値、又は、第2のビームフォーマを、受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、残響音方向信号のパワー推定値として得る。減算部は、直接音方向信号のパワー推定値から残響音方向信号のパワー推定値を減算したパワー推定値を、第1のビームフォーマの直接音源の到来方向におけるパワーゲイン値と第2のビームフォーマの直接音源の到来方向におけるパワーゲイン値との差分によって除算することで正規化した直接音パワー推定値を出力する。直間比算出部は、周波数領域信号のパワー推定値及び直接音パワー推定値を用い、残響音方向信号のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る。対象信号調整部は、直間比推定値に応じたゲインを、受音信号から得られる処理対象信号に乗じて処理後信号を得る。そして、直間比推定値が表す比率が所定の閾値よりも大きい処理対象信号に乗じられるゲインは、比率が上記所定の閾値よりも小さな処理対象信号に乗じられる上記ゲインよりも大きい。
また、本発明の遠近判定装置は、上記した音響信号強調装置と同じ、受信音パワー推定部と、直接音方向パワー推定部と、残響音方向パワー推定部と、減算部と、直間比算出部と、を備え、更に遠近判定部を備える。その遠近判定部は、1個以上のフレームからなる判定区間で受音された前記受音信号に基づいて得られた前記直間比推定値に対応する判定値と、前記判定区間よりも多くの個数のフレームからなる基準区間で受音された前記受音信号に基づいて得られた複数の前記直間比推定値に対応する基準値とを用いた比較判定によって、前記判定区間での前記直接音源の遠近判定を行う。
本発明の音響信号強調装置は、この発明が提案する直間比推定方法で求めた直間比推定値を用いて音源の音響信号を強調する。その直間比推定方法は、残響音の拡散性が強いことによる到来方向の等方性に着目した新しい方法であり、マイクロホンアレーにより実現される指向性形状が同一な2つ以上のビームフォーマによって、直接音方向から到来する信号のうち直接音と残響音を区別して、それぞれのパワーを正しく推定する。その結果として直間比の推定精度を向上させることができるので、音源の音響信号を正確に強調することを可能にする。
また、本発明の遠近判定装置は、この発明の直間比推定方法で求めた直間比推定値に基づいて、発音時刻が異なる音の音源の距離の遠近を判定するので、従来のものよりも正確な判定をすることができる。
音響信号強調装置400を利用する場面の一例を示す図。 屋内での音の伝搬経路を示す図。 直間比とマイクロホン間距離との関係を示す図。 各実施例に対応する原理を概念的に示す図。 同じ指向性形状を持ち、メインビームが異なる方向に向けられた2つのビームフォーマを示す図であり、(a)は音源方向にビームを向けたビームフォーマ、(b)は音源方向にヌルを向けたビームフォーマを示す。 実施例1の音響信号強調装置400の機能構成例を示す図。 音響信号強調装置400の動作フローを示す図。 処理対象信号生成部43の機能構成例を示す図。 直間比計算部44の機能構成例を示す図。 直間比計算部44′の機能構成例を示す図。 各残響指向性形成部4431〜4431の指向性形状の例を模式的に示す図。 直間比計算部44″の機能構成例を示す図。 実施例2の遠近判定装置130の機能構成例を示す図。 効果確認実験の実験条件を示す図。 直間比推定のシミュレーション結果を示す図。 直間比推定装置160の機能構成例を示す図。
以下、本発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。また、以下の説明において、テキスト中で使用する記号「 ̄」や「^」等は、本来直後の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直前に記載する。式中においてはこれらの記号は本来の位置に記述している。
実施例の説明の前に、各実施例に対応する原理について説明する。
〔原理〕
実施例1の音響信号強調装置は、単一のマイクロホンアレーを用いて、マイクロホンアレーから特定の距離範囲にある音だけを強調若しくは抑圧して、所定の範囲内の音源の音を収音することを目的とするものである。また、実施例2の遠近判定装置は、受音信号の音源位置の遠近を判定するものである。
図1に、実施例1の音響信号強調装置400を利用する場面を例示する。小型マイクロホンアレー11を、例えば4人の発話者12〜14が取り囲んで会議をしている場面を想定する。その会議室内には、テレビ16、電話17、館内放送用のスピーカ18が配置されているものとする。このような場面において、館内放送の音声や、電話の音等を収音せずに、小型マイクロホンアレー11を中心として所定の距離範囲内(破線で示す円内)に位置する発話者12〜14の発話だけを収音したい。
そこで、マイクロホンアレーから音源までの距離を見分けるために、受信音に含まれる直接音と間接音(残響音とも称する)との比(以降、直間比と称する)に着目する。図2に屋内にマイクロホンを置いて音を収録した際の、音源21からマイクロホン22までの音の伝搬経路を示す。直接音とは、音源21からマイクロホンまで直接到達する太い実線で示す音波である。一方の残響音とは、音源21から発した音が壁や床や天井などで反射してからマイクロホン22に到達する破線で示す音波である。
図3に直間比とマイクロホン間距離との関係を示す。図3の横軸はマイクロホンから音源までの距離、縦軸は直間比である。一般的に間接音はマイクロホンからの距離に依存しない一定の大きさを示す。その間接音に対して直接音は、マイクロホンからの距離の増加に伴って単調に減少する特性を示す。その直接音を間接音で除した直間比は、直接音と同様に距離の増加に伴って単調に減少する特性になる。
この直間比から、マイクロホンアレー11を中心とした所定の距離範囲を推定することが可能である。したがって、この直間比を用いることで所望の音源からの音響信号のみを強調することが可能になる。
図4に、本発明の直間比推定の原理の考えを概念的に示す。一般に残響が十分ある場合には残響音に拡散性を仮定することができ、マイクロホンから見た場合に残響音はあらゆる方向から同じ大きさで到来する音としてモデル化できることが知られている。小型マイクロホンアレー11の出力信号に任意のビームフォーマBF1を適用すると、所定の指向性形状Dで残響音方向パワー23を受音することができる。残響音方向パワー23の3本の矢印は、指向性形状Dで得られる残響音の大きさを模式的に表現している。
いま音源21の位置が既知であると仮定した場合、音源21から小型マイクロホンアレー11に直接到来する直接音パワー25は、ビームフォーマBF0の指向性形状Dを、Dと同じとし、その指向方向を音源21方向とすることで、残響音方向パワー23と同じ大きさの残響音方向パワーを含む直接音方向パワー26を受音することができる。
残響音方向パワー23と同じ残響成分を含む直接音方向パワー26から、残響音方向パワー23を差し引くことで直接音パワー25を得ることができる。次に、この原理を理論的に説明する。
<残響音の等方到来モデル>
提案方式では、残響音の等方性を考慮したモデルを導入する。ここでは、パワー推定値としてパワースペクトル密度又はその推定値を用いた例を説明するが、これは本発明を限定するものではない。
M(M≧2)個のマイクロホンからなるマイクロホンアレーのm番目のマイクロホンでの受音信号を短時間フーリエ変換等によって周波数領域に変換すると、以下の周波数領域信号X(m)(ω,t)が得られる。
Figure 0005738218
ただし、ωは周波数であり、H (m)(ω)は音源からm番目のマイクロホンまでの直接音の伝達関数であり、H (m)(ω)は音源からm番目のマイクロホンまでの間接音の伝達関数であり、S(ω,t)は音源の音を周波数領域に変換して得られる信号である。tは時間フレームのインデックスである。
ここで直接音はコヒーレント(coherent)である一方、間接音はその主な成分が残響であることから拡散音(diffuse)であると仮定する。すなわち、それぞれの到来方向に着目した場合、直接音は音源の方向からのみ到来するのに対し、間接音はあらゆる方向から一様なパワーで到来する性質(以下等方性という)を持つ。提案方法ではこれら空間的な到来特性の違いに着目して直接音パワーと間接音パワーを推定して直間比を求める。
前提条件として直接音の到来方向(以下「直接音源方向」という)は既知であり、直接音及び任意の方向から到来する間接音は平面波とみなせるとし、拡散音の定義より直接音と間接音は互いに無相関とする。このとき音源からm番目のマイクロホンまでの直接音、間接音の伝達関数H (m)(ω),H (m)(ω)は、それぞれ以下のように表現できる。
Figure 0005738218
ただし、HDref(ω)は音源からマイクロホンアレーの基準点(「基準点」という)までの伝達関数の直接音成分であり、HRref,θ(ω)は基準点からみた方向θの間接音成分である。基準点はマイクロホンアレーの内部に存在してもよいし、マイクロホンアレーのマイクの何れかの位置に存在してもよい。
直接音と間接音の伝達関数H (m)(ω),H (m)(ω)のそれぞれは、音源から基準点までの伝達関数成分と、基準点からm番目のマイクロホンまでの伝搬遅延による位相差成分とに分解して表すことができる。従って、周波数領域信号X(m)(ω,t)(m∈{1,…,M})を要素とするマイクロホンアレー入力ベクトルx(ω,t)=[X(1)(ω,t),…,X(M)(ω,t)]は次式で表される。Tは転置を表す。
Figure 0005738218
ただし、S(ω,t)=HDref(ω)S(ω,t),SR,θ(ω,t)=HRref,θ(ω)S(ω,t)である。θ(ω)は式(5)で表されるθ方向のアレイ・マニフォールド・ベクトルである。アレイ・マニフォールド・ベクトルの各要素は伝搬遅延τθ (m)に依存する。直接音及び間接音が平面波とみなせる場合、伝搬遅延τθ (m)はマイクロホンアレーの基準点に対する各マイクロホンの相対位置及び方向θに依存する。なお、アレイ・マニフォールド・ベクトルの詳細については、例えば、参考文献1「浅野太著,“音のアレイ信号処理−音源の定位・追跡と分離(日本音響学会編 音響テクノロジーシリーズ)”,株式会社コロナ社,2011年2月25日,ISBN978-4-339-01116-6」の第1章(P1〜26)を参照されたい。
このマイクロホンアレー入力に任意のビームフォーマ(BF)を適用すると、その出力パワースペクトル密度(PSD)は、式(6)に示す直接音と間接音のそれぞれの出力パワースペクトル密度(PSD)にビームフォーマ(BF)のパワーゲイン|Dθ(ω)|を乗じた和となる。
Figure 0005738218
ただし、P(ω)=E[|S(ω,t)|],PR,θ(ω)=E[|S(ω,t)|]w(ω)はビームフォーマ(BF)のフィルタ係数、R(ω)はij成分にRij(ω)=E[X(ω,t)X (ω,t)]を持つマイクロホンアレーの入力信号空間相関行列である。E[・]は期待値演算を表している。
<複数のビームフォーマを用いた直間比推定>
式(6)において間接音が等方的に到来すると仮定できる音場では、残響音パワーPθ(ω)は方向θに依らない定数 ̄P(ω)で置き換えることができ、出力パワースペクトル密度は式(7)で表せる。
Figure 0005738218
ここで、図5に示すように同じ指向性形状を持ち、メインビームが異なる方向に向けられた2つのビームフォーマBF0とBF1があるとすると、式(7)の右辺第二項∫θ|Dθ(ω)|dθは等しくなり、各ビームフォーマの出力は、右辺第一項すなわち直接音に対するビームフォーマのパワーゲインによってのみ変化する。
そこで、音源方向にビームを向けたビームフォーマBF0の出力パワースペクトル密度P(ω)から音源方向にヌル(指向性感度の低い点)を向けたビームフォーマBF1の出力パワースペクトル密度P(ω)を減算することで、直接音パワー25を求めることができる。
Figure 0005738218
以上の原理により、直接音源方向から到来する残響音を区別することができ、結果として直間比の推定精度を向上させることが可能になる。
図6に、実施例1の音響信号強調装置400の機能構成例を示す。その動作フローを図7に示す。音響信号強調装置400は、マイクロホンアレー41と、複数の周波数領域変換部421〜42Mと、処理対象信号生成部43と、直間比計算部44と、対象信号調整部45と、逆周波数領域変換部46と、を具備する。マイクロホンアレー41を除く各機能構成部は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
マイクロホンアレー41は複数のマイクロホンm1,…mMから成る。複数の周波数領域変換部421,…,42Mは、複数のマイクロホンm1,…mMで受音された受音信号xm(n)がそれぞれ入力され、各受音信号を周波数領域の信号に変換する(ステップS42)。周波数領域変換部421,…,42Mは、受音信号xm(n)を、例えばサンプリング周波数16kHzでサンプリングしてディジタル信号に変換し、例えば256個のサンプルを1フレームとして、それぞれのフレームにおいて離散フーリエ変換を行い周波数成分Xm(ω,t)を出力する(ステップS42)。ωは周波数、tはフレーム番号である。なお、受音信号xm(n)をディジタル信号に変換するA/D変換器は省略している。
処理対象信号生成部43は、複数の周波数領域変換部421,…,42Mが出力する周波数領域の信号Xm(ω,t)を合成して処理対象信号Y(ω,t)を生成する(ステップS43)。
直間比計算部44は、複数の周波数領域変換部421,…,42mが出力する周波数領域の信号Xm(ω,t)を入力として受音信号の直間比推定値DRR(ω,t)を計算する(ステップS44)。直間比計算部44の詳しい動作説明は後述する。
対象信号調整部45は、処理対象信号Y(ω,t)と、直間比推定値DRR(ω,t)を入力としてその値に応じて処理対象信号Y(ω,t)の振幅を調整した処理後信号Z(ω,t)を生成する(ステップS45)。
逆周波数領域変換部46は、処理後信号Z(ω,t)を時間領域の信号z(n)に変換する(ステップS46)。ステップS41〜ステップS46までの動作は、全ての受音信号xm(n)が終了するまで継続される。
ここで、直間比推定値DRR(ω,t)の値に応じて調整とは、DRR(ω,t)の閾値処理や、その値が大きいほど処理後信号Z(ω,t)の振幅を大きくする処理や、その値が大きいほど処理後信号Z(ω,t)の振幅を小さくする等の処理を含む。詳しくは後述する。
以上の動作により、マイクロホンアレーによって、例えば、特定の距離範囲にある音だけを強調し、その範囲外の音は抑圧して収音する雑音除去が行われる。以降、各部のより具体的な機能構成例を示して更に詳しく本発明を説明する。
〔処理対象信号生成部〕
図8に処理対象信号生成部43のより具体的な機能構成例を示す。処理対象信号生成部43は、複数の重み乗算手段4311〜431Mと、加算手段432を備える。複数の重み乗算手段4311〜431Mは、M個のマイクロホンで受音した複数の受音信号xm(n)の、それぞれの周波数成分X1(ω,t),…,XM(ω,t)に重み係数wm(ω)を乗ずる。
重み乗算手段4311〜431Mで使用する重みには、例えばM個のマイクロホンが無指向性の場合にはwm=1/Mとすることで全ての周波数成分X1(ω,t),…,XM(ω,t)の平均を取ることで、処理対象信号Y(ω,t)を安定化させる。また、M個のマイクロホンが指向性を持つ場合には、w1=1,wm=0(m={2,…,M})とすることで、特定のマイクロホンの信号だけを使用することができる。例えば、参考文献2「大賀、山崎、金田著、“音響システムとディジタル信号処理”電子情報通信学会発行」に記載されているような方法を利用して、重みビームフォーミングのフィルタ係数を使用すれば、マイクロホンアレーで任意の指向性を形成することもできる。
加算手段432は、重みが乗ぜられた全ての周波数成分X1(ω,t),…,XM(ω,t)を加算して処理対象信号Y(ω,t)を出力する。
加算手段を用いず、音源に近い位置にマイクロホンアレーとは別にマイクロホンを設置して、設置したマイクロホンの収音信号を処理対象信号Y(ω,t)としてもよい。
〔直間比計算部〕
図9に直間比計算部44の機能構成例を示す。直間比計算部44は、受信音パワー推定部441と、直接音方向パワー推定部442と、残響音方向パワー推定部443と、減算部444と、直間比算出部445と、を備える。
受信音パワー推定部441は、マイクロホンアレー41に含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号X(ω,t),…,X(ω,t)を用い、受音信号に対応する周波数領域信号のパワー推定値を生成して出力する。このパワー推定値は、式(9)のように何れか1個のマイクロホンm(m∈{1,…,M})に対応する周波数領域信号X(ω,t)のパワー推定値であってもよいし、式(10)のように周波数領域信号X(ω,t),…,X(ω,t)それぞれのパワー推定値を重み付け平均したものであってもよい。実施例1では、受音信号に対応する周波数領域信号のパワー推定値としてパワースペクトル密度PX,L(ω)を求める。
Figure 0005738218
ただし、Lはフレーム数、αは式(11)と成るように設定されるマイクロホンmへの非負の重みである。E[・]は期待値演算を表している。
Figure 0005738218
直接音方向パワー推定部442は、周波数領域信号X(ω,t),…,X(ω,t)に対して直接音源方向から到来した信号成分のみを通過する処理を行って得られた直接音方向信号のパワー推定値PDD(ω)、又は、受音信号に対して直接音源方向から到来した信号成分のみを通過する処理を行った信号を周波数領域に変換して得られた直接音方向信号のパワー推定値PDD(ω)を得る。直接音方向信号のパワーPDD(ω)は、前記した式(8)のP(ω)と同じものである。
直接音方向パワー推定部442は、指向性形成部4421とパワー推定部4422を備える。指向性形成部4421は、あらかじめ与えられた方向に指向性のビームが向くように指向性を形成し、その指向性を通過した信号を出力する。指向性形成部4421の指向性は、直接音方向に指向性のメインビームが向くように設定される。指向性形成の方法としては、例えば参考文献1(浅野太著,「音のアレイ信号処理−音源の定位・追跡と分離」コロナ社,pp.70-79))に記載されている遅延和ビームフォーミングなどの方法を用いることができる。
指向性形成部4421の出力をYBF(ω,t)と表記した場合、パワー推定部4422の出力する直接音方向信号のパワー推定値PDD(ω)は、式(12)によって得られる。
Figure 0005738218
また、直接音方向信号のパワー推定値PDD(ω)の出力パワースペクトル密度は式(13)で表される。
Figure 0005738218
ここで|D0θ(ω)|は、図4で説明したビームフォーマBF0のパワーゲインに当たる。
残響音方向パワー推定部443は、主に直接音源方向以外から到来した信号成分を、直接音方向パワー推定部442の直接音源方向から到来した信号成分を主に通過させる処理と同じ指向性形状で通過させる処理を行って得られた残響音方向信号のパワー推定値、又は、主に受音信号に対して直接音源方向以外から到来した信号成分を通過する処理を行った信号を周波数領域に変換して有られた残響音方向信号のパワー推定値を得る。
理想的には、残響音方向パワー推定部443は、残響指向性形成部4431と残響パワー推定部4432を備える。残響指向性形成部4431の指向性は、指向性のメインビームが直接音方向を避けるように設定される。その指向性形状は指向性形成部4421と同じに設定される。残響指向性形成部4431と指向性形成部4421の指向性形状は、極力同じ形状になるように設定するのが望ましい。その指向性形状の設定は従来技術で容易に実現することができる。音源の方向の推定については、例えば、参考文献2「大賀,山崎,金田著,“音響システムとディジタル信号処理”電子情報通信学会発行」の7.2章に記載されている。
残響パワー推定部4432は、直接音方向を避けるようにして受音された残響音を入力として残響音方向信号のパワー推定値PRD(ω)を出力する(式14)。残響音方向信号のパワー推定値PRD(ω)には、直接音方向を避けるようにして受音しているので、|D1,θD (ω)≪1と設定することで、直接音成分|D ,θ (ω)|(ω)は、十分小さくなる。
Figure 0005738218
ここで|D (ω)|は、図4で説明したビームフォーマBF1のパワーゲインに当たる。
減算部444は、直接音方向パワー推定部442が出力する直接音方向信号のパワー推定値PDD(ω)から、残響パワー推定部4432が出力する残響音方向信号のパワー推定値PRD(ω)を減算した直接音パワー推定値^P(ω)を出力する(式(15))。
Figure 0005738218
式(15)の分母は、指向性形成部4421と残響指向性形成部4431のそれぞれのビームフォーマ(BF)のパワーゲインの差によって直接音パワー推定値^P(ω)を正規化するための項である。
直間比算出部445は、受信音パワー推定部441が出力するパワースペクトル密度PX,L(ω)及び直接音パワー推定値^P(ω)を用い、直接音パワー推定値^P(ω)と、残響音方向信号のパワー推定値のパワーの比である直間比推定値DRR(ω)を得る(式(16))。
Figure 0005738218
また、受信音パワー推定部441の出力する受信音パワーが、何れか1個のマイクロホンm(m∈{1,…,M})に対応する式(9)で表記される場合、直間比は式(17)で推定することもできる。
Figure 0005738218
さらに、直間比は周波数によらない直間比として式(18),(19)で推定することもできる。なお、フレーム数Lごとに求めた値であるのでDRR(ω)と表記しているが、1フレームごと周波数ごとに求めた値はDRR(ω,t)と表記される。
Figure 0005738218
以上説明した直間比推定法は、残響音は拡散性が強い信号であることからマイクロホンアレーに対して等方的に到来することに着目した新しい方法である。マイクロホンアレーにより実現される指向性形状が同一な2つのビームフォーマによって、直接音と残響音を含む信号と、残響音のみを含む信号と、を得ることで直接音成分と間接音成分を正しく分離することができ、その結果として直間比の推定精度を向上させることができる。
なお、式(16),(17),(18),(19)は、以下のようにデシベル表記しない直間比推定値DRRであってもよい。
Figure 0005738218
〔変形例1〕
図10に、直間比計算部44の残響音方向パワー推定部443の機能構成を変形した直間比計算部44′の機能構成例を示す。直間比計算部44′は、残響音方向パワーPRD(ω)を、複数(2個以上)の指向方向の残響音方向パワーPRD1(ω)〜PRDN(ω)を平均して求めるようにしたものである。
直間比計算部44′の残響音方向パワー推定部443′は、2個以上の残響指向性形成部4431〜4431と、2個以上の残響パワー推定部4432〜4432と、残響方向パワー算出部4433を備える点で、直間比計算部44と異なる。残響指向性形成部4431のビームフォーマのメインビームの方向は例えば基準点から方向θである。残響指向性形成部4431のビームフォーマのメインビームの方向は方向θであり、残響指向性形成部4431のビームフォーマのメインビームの方向は方向θである。
図11に各残響指向性形成部4431〜4431の指向性形状を模式的に示す。各残響指向性形成部4431〜4431の指向性形状は、そのメインビームの方向θのみが異なりその形状は同じものである。各々の残響指向性形成部4431〜4431の指向性を通過した信号から、それぞれに接続された残響パワー推定部44321〜4432Nによって各指向方向の残響音パワー推定値PRD1(ω)〜PRDN(ω)が求められる。
残響方向パワー算出部4433は、複数のパワー推定値PRD1(ω)〜PRDN(ω)を、重み付け平均(式20)して残響音方向パワーPRD(ω)を算出する。
Figure 0005738218
ただし、βは非負の重み係数であり、式(21)を満たすようにあらかじめ設定される。このようにして求めた残響音方向パワーPRD(ω)は、複数の方向の残響音方向パワーを平均して求めた値なので、その精度を向上させることができる。その結果、直間比推定値DRR(ω)の精度を向上させることができる。
〔変形例2〕
図12に、直間比計算部44の残響音方向パワー推定部443の機能構成を変更した直間比計算部44″の機能構成例を示す。直間比計算部44″は、指向性形成部4421と残響指向性形成部4431のビームフォーマのメインビームの方向を自動的に設定できるようにしたものである。
直間比計算部44″は、音源方向推定部446と、ビームフォーマ生成部447と、を備える点で、直間比計算部44と異なる。音源方向推定部446は、マイクロホンアレー41に含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号X(ω,t),…,X(ω,t)を入力として、音源の方向を推定して音源方向信号を出力する。音源の方向は、例えば、周波数領域信号X(ω,t),…,X(ω,t)の位相差等から従来技術で求めることが可能である。
ビームフォーマ生成部447は、音源方向信号を入力として、その音源方向にメインビームを持つビームフォーマBF0と、その音源方向を避けるようにメインビームが設定されたビームフォーマBF1とを生成して、ビームフォーマBF0を直接音方向パワー推定部442へ、ビームフォーマBF1を残響音方向パワー推定部443に出力する。直接音方向パワー推定部442の指向性形成部4421は、ビームフォーマBF0を適用して上記した出力信号YBF(ω,t)を出力する。残響音方向パワー推定部443は、ビームフォーマBF1を適用して残響音方向パワーPRD(ω)を出力する。
このように直間比計算部44″は、自動的に直接音方向パワー推定部442と残響音方向パワー推定部443の指向性形状を設定することができる。以上、直間比計算部44,44′,44″の動作を周波数領域で動作する例で説明を行ったが、変形例を含めて本発明の技術思想は、そのまま時間領域の動作に適用することが可能である。また、直間比計算部44″の考えを、直間比計算部44′に適用することも可能である。
〔対象信号調整部〕
対象信号調整部45は、処理対象信号Y(ω,t)と直間比推定値DRR(ω,t)を入力とし、直間比推定値DRR(ω,t)に応じて処理対象信号Y(ω,t)の振幅を調整した処理後信号Z(ω,t)を生成して出力する。言い換えると、対象信号調整部45は、直間比推定値DRR(ω,t)に応じたゲイン(フィルタ係数)を処理対象信号Y(ω,t)に乗じ、それによって処理後信号Z(ω,t)を生成して出力する(ステップS45)。
直間比推定値DRRに応じてどのような大きさのゲインを定めるかは、マイクロホンアレー41からどのような距離範囲にある直接音源から発せられた音を強調するのかに依存する。例えば、マイクロホンアレー41に近い直接音源から発せられた音をより強調する場合には、直間比推定値DRRが表す間接音のパワー推定値に対する直接音のパワー推定値の比率が第1値である場合に処理対象信号に乗じられるゲインを、当該比率が第1値よりも小さな第2値である場合に処理対象信号に乗じられるゲインよりも大きくする。例えば、マイクロホンアレー41に遠い直接音源から発せられた音をより強調する場合には、直間比推定値DRRが表す間接音のパワー推定値に対する直接音のパワー推定値の比率が第1値である場合に処理対象信号に乗じられるゲインG(ω,t)を、当該比率が第1値よりも小さな第2値である場合に処理対象信号に乗じられるゲインよりも小さくする。
対象信号調整部45は、例えば、フィルタ係数算出手段451と、乗算手段452とで構成できる(図6)。フィルタ係数算出部45は、直間比推定値DRR(ω,t)を入力としてフィルタ係数G(ω,t)を算出して出力する。フィルタ係数G(ω,t)の算出には、例えば式(22),(23)に示すように閾値を用いた2値のフィルタなどが用いられる。
Figure 0005738218
なお、閾値Thは、直間比推定値DRR(ω,t)の最小値と最大値の間の任意の値が設定できる。閾値Thを最小値(0)に近づけると音質は向上する。逆に閾値Thを最大値に近づけると雑音抑圧効果は高めるが受音信号の歪みが大きくなり音質が劣化する。
このように閾値Thは、音質と雑音抑圧との関係でトレードオフの関係を持つ。よって、閾値Thは、このトレードオフの関係を考慮した上で、利用目的に応じて経験的に決定される。
また、フィルタ係数G(ω,t)の算出に際して式(24),(25)に示すように、直間比推定値が閾値Thを下回る時間周波数帯域を強調するようにすれば、特定の距離範囲より遠くの音源を強調することができる。
Figure 0005738218
なお、フィルタ係数G(ω,t)の例として0か1の2値のフィルタを挙げたが、フィルタ係数G(ω,t)は必ずしも0と1である必要はなく、例えば、0.1と0.9のように十分異なる値であれば良い。
また、フィルタ係数G(ω,t)には、1以上の実数を設定するようにしても良い。つまり、処理対象信号Y(ω,t)を増幅するゲインG(ω,t)が定められてもよい。また、処理対象信号Y(ω,t)を大きく抑圧するゲインG(ω,t)(例えば0.1以下の値)が定められてもよい。また、閾値判定によってゲインG(ω,t)を定めるのではなく、直間比推定値やその関数値がゲインG(ω,t)とされてもよい。例えば、以下の式(26)〜(29)のようにゲインG(ω,t)が定められてもよい。
Figure 0005738218
ただし、Fは単調増加関数又は単調減少関数などの関数である。
このようにして求めたフィルタ係数G(ω,t)が、乗算手段452において、処理対象信号Y(ω,t)に乗じて処理後信号Z(ω,t)=G(ω,t)・Y(ω,t)が生成される。よって、処理後信号Z(ω,t)を、直間比推定値DRR(ω,t)の大きな処理対象信号Y(ω,t)のみで構成することができる。つまり、直接音のみを抽出することができる。
実施例2として、実施例1で述べた直間比推定値DRR(ω,t)を用いて音源の遠近を判定する遠近判定装置120を説明する。図13に遠近判定装置120の機能構成例を示す。遠近判定装置120は、マイクロホンアレー41と、複数の周波数領域変換部411〜41mと、直間比計算部44と、遠近判定部121と、を備える。マイクロホンアレー41と、複数の周波数領域変換部411〜41mと、直間比計算部44とは、雑音除去装置400のものと同じである。遠近判定装置120も、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現される。
遠近判定装置120は、複数の異なる距離にある音源が異なる時刻に発音するときに、ある時刻に受音された音の音源が遠くにあるのか近くにあるのかを判定するものである。遠近判定装置120を構成する遠近判定部121は、周波数平均手段1210と、蓄積手段1211と、判定手段1212と、を備える。
遠近判定部121は、1個以上のフレームからなる判定区間で受音された受音信号に基づいて得られた直間比推定値に対応する判定値と、判定区間よりも多くの個数のフレームからなる基準区間で受音された受音信号に基づいて得られた複数の直間比推定値に対応する基準値とを用いた比較判定によって、判定区間での直接音源の遠近判定を行う。
周波数平均手段1210は、直間比推定値DRR(ω,t)を入力として、当該値を周波数方向に平均して周波数平均直間比推定値 ̄Eを出力する(式(30))。
Figure 0005738218
ここで、Kは周波数領域変換部421〜42Mで行ったフーリエ変換の周波数ビンの総数である。
蓄積手段1211は、周波数平均直間比推定値 ̄Eを過去L時間フレーム分蓄積して、比較対象直間比推定値^Eを出力する。比較対象直間比推定値^Eには、例えば蓄積された周波数平均直間比推定値 ̄Eの平均値^E=1/LΣ L ̄Eや、最小値と最大値の平均値E^=1/2(max ̄E+min ̄E)等が用いられる。
判定手段1212は、周波数平均直間比相当値 ̄Eと、比較対象直間比相当値^Eを比較して、 ̄E>^Eの時には遠近判定結果Ylに距離が近いことを表す例えば1を、 ̄El<^Eの時には遠近判定結果Yに距離が遠いことを表す例えば0を出力する。この遠近判定結果Yは、直近の過去L時間分の受音信号が、比較的近い音源からの音であるか、又は、比較的遠い音源からの音であるかを表すものである。
この遠近判定結果Yを用いることで、逐次入力される受音信号を、マイクロホンとその音源間との距離によって切り分けることが可能である。つまり、複数の音源の音を、マイクロホンからの距離に応じて選択することができる。
〔実験結果〕
本発明の効果を確認する目的で、鏡像法を用いたシミュレーション実験を行った。
図14にシミュレーション条件を示す。図14は平面図であり、幅4m、奥行き6mで、高さが2.7mの部屋を想定した。壁の吸音率はα=0.05(残響時間T60=1.8秒)に設定した。8個のマイクロホンを円状に配置したマイクロホンアレーを用い、その基準点の高さは1.5mとした。音源の高さも1.5mとした。
この条件において、インパルス応答から推定したDRRの実測値DRRactual(□)と、本発明(▽)と、従来法(○)と、を比較した結果を図15に示す。この発明の方法により推定したDRR(▽)は、従来法と比べて実測値DRRactual(□)に近づいており、特に音源が遠方にある場合では3dB程度改善している。
一般に間接成分のパワーは音源の距離によらず一定であるのに対して、直接成分のパワーは距離の2乗に反比例する。このため遠方の音源の場合、直接成分のパワーは間接成分のそれと比べて微小になり、推定された直接成分に含まれる誤差が小さくてもDRRの推定結果には大きな影響を与える。この発明の方法では、マイクロホンアレーの指向性制御により、音源方向から到来する信号の影響を極力抑えて間接音のパワーを求めることから、より精度の高い推定が可能となり、より遠方の音源までDRRを正しく推定できるようになる。
以上説明したように、この発明の新しい直間比推定方法は、残響音は拡散性が強い信号であることからマイクロホンアレーに対して等方的に到来すると仮定する新しい方法である。マイクロホンアレーにより実現される指向性形状が同一でメインビームの方向が直接音源方向に設定されたビームフォーマと、メインビームの方向が直接音源方向を避けるように設定されたビームフォーマと、によって音源方向から到来する直接成分と間接成分とを正しく分離することができ、その結果として直間比の推定値精度を上げることができる。
上記した説明では、本発明の直間比推定方法を、音響信号強調装置400または遠近判定装置130に組み込んだ例で説明を行ったが、図16に示すようにこの発明の直間比推定方法のみを実現する直間比推定装置160として構成するようにしてもよい。その場合、直間比推定装置160は、マイクロホンアレー41と、複数の周波数領域変換部42〜42と、直間比計算部44と、で構成することが可能である。
なお、直間比推定値DRRとしてデジベル表記した例を式(16)〜(19)に示したが、直間比推定値はパワースペクトル密度の比で求めてよいことは言うまでもないことであり、上記した式で表されるDRRの値に、何れかの定数が乗じられたものを直間比推定値としてもよいし、上記した式で表されたDRRの値の逆数に定数が乗じられたものを直間比推定値としてもよい。また、その定数は単調増加関数値であってもよい。つまり、この発明の直間比推定値DRRは、上記した式(16)〜(19)で表されたものに限定されない。
なお、上記方法及び装置において説明した処理は、記載の順に従って時系列に実行され
るのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしてもよい。
また、上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (9)

  1. マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受信音パワー推定部と、
    直接音源方向から到来した信号成分を主に通過させるように指向性形状のメインビームを向ける第1のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第1のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、直接音方向信号のパワー推定値として得る直接音方向パワー推定部と、
    前記第1のビームフォーマと同じ指向性形状で、なおかつ指向性感度の低い点を前記直接音源方向に向ける第2のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第2のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、残響音方向信号のパワー推定値として得る残響音方向パワー推定部と、
    前記直接音方向信号のパワー推定値から前記残響音方向信号のパワー推定値を減算したパワー推定値を、前記第1のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値と前記第2のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値との差分によって除算することで正規化した直接音パワー推定値を出力する減算部と、
    前記周波数領域信号のパワー推定値及び前記直接音パワー推定値を用い、前記残響音方向信号のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比算出部と、
    前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整部を有し、
    前記直間比推定値が表す前記比率が所定の閾値よりも大きい前記処理対象信号に乗じられる前記ゲインは、前記比率が前記所定の閾値よりも小さな前記処理対象信号に乗じられる前記ゲインよりも大きい、音響信号強調装置。
  2. マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受信音パワー推定部と、
    直接音源方向から到来した信号成分を主に通過させるように指向性形状のメインビームを向ける第1のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第1のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、直接音方向信号のパワー推定値として得る直接音方向パワー推定部と、
    前記第1のビームフォーマと同じ指向性形状で、なおかつ指向性感度の低い点を前記直接音源方向に向ける第2のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第2のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、残響音方向信号のパワー推定値として得る残響音方向パワー推定部と、
    前記直接音方向信号のパワー推定値から前記残響音方向信号のパワー推定値を減算したパワー推定値を、前記第1のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値と前記第2のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値との差分によって除算することで正規化した直接音パワー推定値を出力する減算部と、
    前記周波数領域信号のパワー推定値及び前記直接音パワー推定値を用い、前記残響音方向信号のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比算出部と、
    前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整部を有し、
    前記直間比推定値が表す前記比率が所定の閾値よりも大きい前記処理対象信号に乗じられる前記ゲインは、前記比率が前記所定の閾値よりも小さな前記処理対象信号に乗じられる前記ゲインよりも小さい、音響信号強調装置。
  3. マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受信音パワー推定部と、
    直接音源方向から到来した信号成分を主に通過させるように指向性形状のメインビームを向ける第1のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第1のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、直接音方向信号のパワー推定値として得る直接音方向パワー推定部と、
    前記第1のビームフォーマと同じ指向性形状で、なおかつ指向性感度の低い点を前記直接音源方向に向ける第2のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第2のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、残響音方向信号のパワー推定値として得る残響音方向パワー推定部と、
    前記直接音方向信号のパワー推定値から前記残響音方向信号のパワー推定値を減算したパワー推定値を、前記第1のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値と前記第2のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値との差分によって除算することで正規化した直接音パワー推定値を出力する減算部と、
    前記周波数領域信号のパワー推定値及び前記直接音パワー推定値を用い、前記残響音方向信号のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比算出部と、
    前記直間比推定値を用い、前記直接音源の遠近判定を行って遠近判定結果を得る遠近判定部を有し、
    前記直間比推定値は、所定の時間区間であるフレームで受音された前記受音信号に基づいて得られ、
    前記遠近判定部は、1個以上のフレームからなる判定区間で受音された前記受音信号に基づいて得られた前記直間比推定値に対応する判定値と、前記判定区間よりも多くの個数のフレームからなる基準区間で受音された前記受音信号に基づいて得られた複数の前記直間比推定値に対応する基準値とを用いた比較判定によって、前記判定区間での前記直接音源の遠近判定を行う、遠近判定装置。
  4. マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受信音パワー推定部と、
    直接音源方向から到来した信号成分を主に通過させるように指向性形状のメインビームを向ける第1のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第1のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、直接音方向信号のパワー推定値として得る直接音方向パワー推定部と、
    前記第1のビームフォーマと同じ指向性形状で、なおかつ指向性感度の低い点を前記直接音源方向に向ける第2のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第2のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、残響音方向信号のパワー推定値として得る残響音方向パワー推定部と、
    前記直接音方向信号のパワー推定値から前記残響音方向信号のパワー推定値を減算したパワー推定値を、前記第1のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値と前記第2のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値との差分によって除算することで正規化した直接音パワー推定値を出力する減算部と、
    前記周波数領域信号のパワー推定値及び前記直接音パワー推定値を用い、前記残響音方向信号のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比算出部と、
    前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整部を有し、
    前記直間比推定値が表す前記比率が第1値である場合に前記処理対象信号に乗じられる前記ゲインは、前記比率が前記第1値よりも小さな第2値である場合に前記処理対象信号に乗じられる前記ゲインよりも大きい、音響信号強調装置。
  5. マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受信音パワー推定部と、
    直接音源方向から到来した信号成分を主に通過させるように指向性形状のメインビームを向ける第1のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第1のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、直接音方向信号のパワー推定値として得る直接音方向パワー推定部と、
    前記第1のビームフォーマと同じ指向性形状で、なおかつ指向性感度の低い点を前記直接音源方向に向ける第2のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第2のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、残響音方向信号のパワー推定値として得る残響音方向パワー推定部と、
    前記直接音方向信号のパワー推定値から前記残響音方向信号のパワー推定値を減算したパワー推定値を、前記第1のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値と前記第2のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値との差分によって除算することで正規化した直接音パワー推定値を出力する減算部と、
    前記周波数領域信号のパワー推定値及び前記直接音パワー推定値を用い、前記残響音方向信号のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比算出部と、
    前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整部を有し、
    前記直間比推定値が表す前記比率が第1値である場合に前記処理対象信号に乗じられる前記ゲインは、前記比率が前記第1値よりも小さな第2値である場合に前記処理対象信号に乗じられる前記ゲインよりも小さい、音響信号強調装置。
  6. マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受信音パワー推定ステップと、
    直接音源方向から到来した信号成分を主に通過させるように指向性形状のメインビームを向ける第1のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第1のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、直接音方向信号のパワー推定値として得る直接音方向パワー推定ステップと、
    前記第1のビームフォーマと同じ指向性形状で、なおかつ指向性感度の低い点を前記直接音源方向に向ける第2のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第2のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、残響音方向信号のパワー推定値として得る残響音方向パワー推定ステップと、
    前記直接音方向信号のパワー推定値から前記残響音方向信号のパワー推定値を減算したパワー推定値を、前記第1のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値と前記第2のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値との差分によって除算することで正規化した直接音パワー推定値を出力する減算ステップと、
    前記周波数領域信号のパワー推定値及び前記直接音パワー推定値を用い、前記残響音方向信号のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比算出ステップと、
    前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整ステップを有し、
    前記直間比推定値が表す前記比率が所定の閾値よりも大きい前記処理対象信号に乗じられる前記ゲインは、前記比率が前記所定の閾値よりも小さな前記処理対象信号に乗じられる前記ゲインよりも大きい、音響信号強調方法。
  7. マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受信音パワー推定ステップと、
    直接音源方向から到来した信号成分を主に通過させるように指向性形状のメインビームを向ける第1のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第1のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、直接音方向信号のパワー推定値として得る直接音方向パワー推定ステップと、
    前記第1のビームフォーマと同じ指向性形状で、なおかつ指向性感度の低い点を前記直接音源方向に向ける第2のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第2のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、残響音方向信号のパワー推定値として得る残響音方向パワー推定ステップと、
    前記直接音方向信号のパワー推定値から前記残響音方向信号のパワー推定値を減算したパワー推定値を、前記第1のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値と前記第2のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値との差分によって除算することで正規化した直接音パワー推定値を出力する減算ステップと、
    前記周波数領域信号のパワー推定値及び前記直接音パワー推定値を用い、前記残響音方向信号のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比算出ステップと、
    前記直間比推定値に応じたゲインを前記受音信号から得られる処理対象信号に乗じ、処理後信号を得る対象信号調整ステップを有し、
    前記直間比推定値が表す前記比率が所定の閾値よりも大きい前記処理対象信号に乗じられる前記ゲインは、前記比率が前記所定の閾値よりも小さな前記処理対象信号に乗じられる前記ゲインよりも小さい、音響信号強調方法。
  8. マイクロホンアレーに含まれる複数個のマイクロホンで受音された受音信号を周波数領域に変換して得られる周波数領域信号を用い、前記周波数領域信号のパワー推定値を得る受信音パワー推定ステップと、
    直接音源方向から到来した信号成分を主に通過させるように指向性形状のメインビームを向ける第1のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第1のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、直接音方向信号のパワー推定値として得る直接音方向パワー推定ステップと、
    前記第1のビームフォーマと同じ指向性形状で、なおかつ指向性感度の低い点を前記直接音源方向に向ける第2のビームフォーマを、前記周波数領域信号に対して適用して得られるパワー推定値、又は、前記第2のビームフォーマを、前記受音信号に対して適用した後に周波数領域に変換して得られるパワー推定値を、残響音方向信号のパワー推定値として得る残響音方向パワー推定ステップと、
    前記直接音方向信号のパワー推定値から前記残響音方向信号のパワー推定値を減算したパワー推定値を、前記第1のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値と前記第2のビームフォーマの前記直接音源の到来方向におけるパワーゲイン値との差分によって除算することで正規化した直接音パワー推定値を出力する減算ステップと、
    前記周波数領域信号のパワー推定値及び前記直接音パワー推定値を用い、前記残響音方向信号のパワー推定値に対する直接音のパワー推定値の比率を表す直間比推定値を得る直間比算出ステップと、
    前記直間比推定値を用い、前記直接音源の遠近判定を行って遠近判定結果を得る遠近判定ステップを有し、
    前記直間比推定値は、所定の時間区間であるフレームで受音された前記受音信号に基づいて得られ、
    前記遠近判定ステップは、1個以上のフレームからなる判定区間で受音された前記受音信号に基づいて得られた前記直間比推定値に対応する判定値と、前記判定区間よりも多くの個数のフレームからなる基準区間で受音された前記受音信号に基づいて得られた複数の前記直間比推定値に対応する基準値とを用いた比較判定によって、前記判定区間での前記直接音源の遠近判定を行う、遠近判定方法。
  9. 請求項1若しくは2の音響信号強調装置、又は請求項3の遠近判定装置、又は請求項4若しくは5の音響信号強調装置としてコンピュータを機能させるためのプログラム。
JP2012041052A 2012-02-28 2012-02-28 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム Expired - Fee Related JP5738218B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2012041052A JP5738218B2 (ja) 2012-02-28 2012-02-28 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2012041052A JP5738218B2 (ja) 2012-02-28 2012-02-28 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム

Publications (2)

Publication Number Publication Date
JP2013179388A JP2013179388A (ja) 2013-09-09
JP5738218B2 true JP5738218B2 (ja) 2015-06-17

Family

ID=49270675

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2012041052A Expired - Fee Related JP5738218B2 (ja) 2012-02-28 2012-02-28 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム

Country Status (1)

Country Link
JP (1) JP5738218B2 (ja)

Families Citing this family (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104699445A (zh) * 2013-12-06 2015-06-10 华为技术有限公司 一种音频信息处理方法及装置
EP2884491A1 (en) * 2013-12-11 2015-06-17 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Extraction of reverberant sound using microphone arrays
JP6476938B2 (ja) * 2015-02-04 2019-03-06 富士ゼロックス株式会社 音声解析装置、音声解析システムおよびプログラム
JP6594222B2 (ja) * 2015-12-09 2019-10-23 日本電信電話株式会社 音源情報推定装置、音源情報推定方法、およびプログラム
WO2017147325A1 (en) * 2016-02-25 2017-08-31 Dolby Laboratories Licensing Corporation Multitalker optimised beamforming system and method
JP6984559B2 (ja) 2018-08-02 2021-12-22 日本電信電話株式会社 集音拡声装置、その方法、およびプログラム

Family Cites Families (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4873913B2 (ja) * 2004-12-17 2012-02-08 学校法人早稲田大学 音源分離システムおよび音源分離方法、並びに音響信号取得装置
JP5143802B2 (ja) * 2009-09-01 2013-02-13 日本電信電話株式会社 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム

Also Published As

Publication number Publication date
JP2013179388A (ja) 2013-09-09

Similar Documents

Publication Publication Date Title
US8238569B2 (en) Method, medium, and apparatus for extracting target sound from mixed sound
JP5738218B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
JP6335985B2 (ja) マルチセンサ音源定位
US8229129B2 (en) Method, medium, and apparatus for extracting target sound from mixed sound
JP6196320B2 (ja) 複数の瞬間到来方向推定を用いるインフォ−ムド空間フィルタリングのフィルタおよび方法
JP6389259B2 (ja) マイクロホンアレイを使用した残響音の抽出
US8085949B2 (en) Method and apparatus for canceling noise from sound input through microphone
US8891785B2 (en) Processing signals
JP5079761B2 (ja) 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム
US20090034756A1 (en) System and method for extracting acoustic signals from signals emitted by a plurality of sources
RU2760097C2 (ru) Способ и устройство для захвата аудиоинформации с использованием формирования диаграммы направленности
JP3582712B2 (ja) 収音方法および収音装置
JP6065028B2 (ja) 収音装置、プログラム及び方法
TW200904226A (en) Enhanced beamforming for arrays of directional microphones
JP2017503388A5 (ja)
CN107018470A (zh) 一种基于环形麦克风阵列的语音记录方法及系统
JP5143802B2 (ja) 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム
JP5635024B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
JP5698166B2 (ja) 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム
JPH09261792A (ja) 受音方法及びその装置
JP4116600B2 (ja) 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体
JP3588576B2 (ja) 収音装置および収音方法
JP5683140B2 (ja) 耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム
JP5815489B2 (ja) 音源別音声強調装置、方法、プログラム
JP5826465B2 (ja) 瞬時直間比推定装置、雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20140122

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140918

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20141007

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20141128

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150414

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150421

R150 Certificate of patent or registration of utility model

Ref document number: 5738218

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees