JP2011259398A - 耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム - Google Patents

耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム Download PDF

Info

Publication number
JP2011259398A
JP2011259398A JP2010134495A JP2010134495A JP2011259398A JP 2011259398 A JP2011259398 A JP 2011259398A JP 2010134495 A JP2010134495 A JP 2010134495A JP 2010134495 A JP2010134495 A JP 2010134495A JP 2011259398 A JP2011259398 A JP 2011259398A
Authority
JP
Japan
Prior art keywords
noise
sound
direct
power
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2010134495A
Other languages
English (en)
Other versions
JP5683140B2 (ja
Inventor
Yusuke Hioka
裕輔 日岡
Sumitaka Sakauchi
澄宇 阪内
Kenichi Furuya
賢一 古家
Yoichi Haneda
陽一 羽田
Kenta Niwa
健太 丹羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2010134495A priority Critical patent/JP5683140B2/ja
Publication of JP2011259398A publication Critical patent/JP2011259398A/ja
Application granted granted Critical
Publication of JP5683140B2 publication Critical patent/JP5683140B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Obtaining Desirable Characteristics In Audible-Bandwidth Transducers (AREA)
  • Circuit For Audible Band Transducer (AREA)

Abstract

【課題】雑音が重畳しても直間比を精度よく推定する。
【解決手段】直間比推定部は、空間相関行列算出手段と、信号パワー推定手段と、直間比算出手段と、を具備する。空間相関行列算出手段は、複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する。信号パワー推定手段は、予め与えられるマイクロホンの配置情報と、空間相関行列とから直接音のパワーと残響音のパワーと雑音のパワーとで構成されるベクトルを求め、そのベクトル要素の内の直接音のパワーと残響音のパワーを出力する。直間比算出手段は、直接音のパワーを残響音のパワーで除した直間比を算出する。
【選択図】図4

Description

この発明は、例えば、音声通話や、音声入力によって機器を操作するハンズフリー方式等に応用でき、マイクロホンから特定の距離範囲内に位置する音源の音だけを強調して収音する際に用いられる耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置、各装置の方法と各装置プログラムに関する。
従来、音源との距離を識別し特定の距離範囲にある音源からの音だけを強調若しくは抑圧する目的で、マイクロホンから受信した信号から、直接音と残響音のそれぞれのパワーを推定して直間比を求める考えがある(例えば、非特許文献1)。図面を参照して従来の直間比推定装置が直間比を求める考えを説明する。
図1に直間比推定装置を利用する場面を例示する。小型マイクロホンアレー11を、例えば4人の発話者12〜14が取り囲んで会議をしている場面を想定する。その会議室内には、テレビ16、電話17、館内放送用のスピーカ18が配置されているものとする。このような場面において、館内放送の音声や、電話の音等を収音せずに、小型マイクロホンアレー11を中心として所定の距離範囲内(破線で示す円内)に位置する発話者12〜14の発話だけを収音したい。
マイクロホンアレーから音源までの距離を見分けるために、受信音に含まれる直接音と間接音(残響音)との比(以降、直間比と称する)に着目する。図2に屋内にマイクロホンを置いて音を収録した際の、音源21からマイクロホン22までの音の伝搬経路を示す。直接音とは、音源21からマイクロホンまで直接到達する太い実線で示す音波である。一方の残響音とは、音源21から発した音が壁や床や天井などで反射してからマイクロホン22に到達する破線で示す音波である。
図3に直間比とマイクロホン間距離との関係を示す。図3の横軸はマイクロホンから音源までの距離、縦軸は直間比である。一般的に間接音はマイクロホンからの距離に依存しない一定の大きさを示す。その間接音に対して直接音は、マイクロホンからの距離の増加に伴って単調に減少する特性を示す。その直接音を間接音で除した直間比は、直接音と同様に距離の増加に伴って単調に減少する特性になる。
従来の直間比推定装置は、受信音からこの直間比を推定し、音源のマイクロホンアレーからの距離を推定することができる。
Y.Hioka, K.Niwa, S.Sakauchi, K.Furuya, and Y.Haneda. Estimating direct-to-reverberant energy ratio based on spatial correlation model segregating direct sound and reverberation. Proceedings of 2010 IEEE International Conference of Acoustics, Speech and Signal Processing(ICASSP2010), pages 149-152, 2010. 日岡裕輔,阪内澄宇,古家賢一,羽田陽一,"受音信号の直間比に基づく距離別収音の検討",日本音響学会平2009年秋季研究発表会,pp.633-634
しかし、一般にマイクロホンで収音した信号には、直接音と残響音の他に、各マイクロホン固有の雑音が重畳される。上記した従来の方法では雑音が考慮されておらず、雑音レベルが大きい場合に直間比の推定精度が劣化する課題がある。
この発明は、このような問題点に鑑みてなされたものであり、雑音による直間比推定精度の劣化を防ぎ、雑音が存在しても高い精度で直間比を推定することができる耐雑音直間比推定装置と、それを用いた干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラムを提供することを目的とする。
この発明の耐雑音直間比推定装置は、複数の周波数領域変換部と、直間比推定部とを備える。複数の周波数領域変換部は、複数のマイクロホンで受音された受音信号を周波数領域の信号に変換する。直間比推定部は、空間相関行列算出手段と、信号パワー推定手段と、直間比算出手段と、を具備する。空間相関行列算出手段は、複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する。信号パワー推定手段は、予め与えられるマイクロホンの配置情報と、受信音から算出される空間相関行列とから直接音のパワーと残響音のパワーと雑音のパワーとで構成されるベクトルを求め、そのベクトル要素の内の直接音のパワーと残響音のパワーを出力する。直間比算出手段は、直接音のパワーを残響音のパワーで除した直間比を算出する。
また、この発明の干渉雑音除去装置等は、この発明の耐雑音直間比推定装置を含むものであって、その他に1個のマイクロホンアレーと、処理対象信号生成部と、対象信号調整部と、逆周波数領域変換部と、を具備する。
この発明の耐雑音直間比推定装置は、直間比推定を行う際に利用するマイクロホン間相互相関の情報に、雑音が持つ相互相関のモデルを新たに追加して信号のパワーを求める。これにより、直接音、残響音、雑音の3つの成分のパワーを別々に推定することが可能であり、直間比の推定精度を向上させることができる。
また、この発明の干渉雑音除去装置は、雑音のある環境でもマイクロホンに近い音源の音を強調し、遠い音源からの音を除去することができる。
従来の直間比推定装置を利用する場面の一例を示す図。 屋内での音の伝搬経路を示す図。 直間比とマイクロホン間距離との関係を示す図。 この発明の耐雑音直間比推定装置100の機能構成例を示す図 耐雑音直間比推定装置100の動作フローを示す図。 この発明の干渉雑音除去装置200の機能構成例を示す図。 干渉雑音除去装置200の動作フローを示す図。 処理対象信号生成部43の機能構成例を示す図。 この発明の遠近判定装置300の機能構成例を示す図。 この発明の音源距離推定装置400の機能構成例を示す図。 この発明の干渉雑音除去装置500の機能構成例を示す図。 等間隔配置のマイクロホンアレーの例を示す図。 小アレーを移動させる概要を示す図。 効果確認実験の実験条件を示す図。 SNR:10dBのときに従来方法とこの発明の方法で求めた直間比を示す図。 SNR:20dBのときに従来方法とこの発明の方法で求めた直間比を示す図。
以下、この発明の実施の形態を図面を参照して説明する。複数の図面中同一のものには同じ参照符号を付し、説明は繰り返さない。また、以下の説明において、テキスト中で使用する記号「 ̄」や「^」等は、本来直前の文字の真上に記載されるべきものであるが、テキスト記法の制限により、当該文字の直後に記載する。式中においてはこれらの記号は本来の位置に記述している。
図4にこの発明の耐雑音直間比推定装置100の機能構成例を示す。その動作フローを図5に示す。耐雑音直間比推定装置100は、複数の周波数領域変換部421〜42Mと、直間比推定部44とから成る。複数の周波数領域変換部421〜42Mのそれぞれには、マイクロホンアレー41を構成する複数のマイクロホンm1〜mMで受音された受音信号が入力される。直間比推定部44は、空間相関行列算出手段441と、信号パワー推定手段442と、直間比算出手段443と、を具備する。耐雑音直間比推定装置100の各部と各手段とは、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
複数の周波数領域変換部421,…,42Mは、複数のマイクロホンm1,…mMで受音された受音信号xm(n)を周波数領域の信号に変換する(ステップS42)。周波数領域変換部421,…,42Mは、受音信号xm(n)を、例えばサンプリング周波数16kHzでサンプリングしてディジタル信号に変換し、例えば256個のサンプルを1フレームとして、それぞれのフレームにおいて離散フーリエ変換を行い周波数成分Xm(ω,l)を出力する(ステップS42)。ωは周波数、lはフレーム番号である。なお、受音信号xm(n)をディジタル信号に変換するA/D変換器は省略している。
空間相関行列算出手段441は、複数の周波数領域変換手段421,…,42Mが出力する周波数領域の信号X1(ω,l),…,XM(ω,l)を入力として、周波数領域の信号X1(ω,l),…,XM(ω,l)をベクトル化し、その入力信号を用いて式(1)に示す空間相関行列R(ω,l)を算出する(ステップS441)。
Figure 2011259398
ここでTは行列の転置、Hは共役転置を、Lは平均を求めるフレームの数を表す。空間相関行列R(ω,l)は、信号パワー推定手段442に入力される。
信号パワー推定手段442は、空間相関行列算出手段441が出力する空間相関行列R(ω,l)の各成分Rij(ω,l)と、予め与えられているマイクロホンアレーのマイクロホン配置と、音源の方向より与えられる行列Rd(ω)(式(3))と、行列Rr(ω)(式(4))と行列R(ω)(式(5))の各成分、dij(ω)と、rij(ω)と、n ij(ω)と、のそれぞれで構成される式(6)に示す行列A(ω)と、式(7)に示すB(ω)を用いる。行列R(ω)(式(5))はM×Mの単位行列である。
Figure 2011259398
ここで、Dmnはm番目のマイクロホンとn番目のマイクロホンの距離、θはマイクロホンアレーの正面から見た音源の方向である。ここでは、マイクロホンアレーの形状は直線配置とし、マイクロホンアレーの正面とはマイクロホンの並ぶ直線の法線方向を意味する。
Figure 2011259398
Figure 2011259398
そして、式(8)に示す連立方程式を立て、これを解くことで直接音のパワーPd(ω,l)と残響音のパワーPr(ω,l)と雑音のパワーP(ω,l)で構成されるベクトルP(ω,l)(式(9))を求め、直接音パワーPd(ω,l)と残響音パワーPr(ω,l)を出力する。
Figure 2011259398
なお、マイクロホンアレーの配置が直線以外の配置の場合の行列Rd(ω)は、より一般的な式(10)に示す形式で表せる。
Figure 2011259398
ここでDmn(θ) ̄は、角度θ°方向から見たときのm番目のマイクロホンとn番目のマイクロホンの距離差を表す。また、式(8)の連立方程式の解の導出は、例えば式(12)に示すようにA(ω)の擬似逆行列A(ω)(式(11))を、B(ω,l)の左から掛ける方法で行われる。
Figure 2011259398
直間比算出手段443は、直接音パワーPd(ω,l)と残響音パワーPr(ω,l)より、式(13)によって直間比ER(l)を算出して出力する。
Figure 2011259398
この実施例1の方法は、雑音のパワーを除いて直接的に直間比を求めるので、正確な直間比の推定が可能である。この耐雑音直間比推定装置100は、干渉雑音除去装置に利用することができる。図6に、耐雑音直間比推定装置100を含む干渉雑音除去装置200の機能構成例を示す。その動作フローを図7に示す。
干渉雑音除去装置200は、1個のマイクロホンアレー41と、耐雑音直間比推定装置100と、処理対象信号生成部43と、対象信号調整部45と、逆周波数領域変換部46と、を具備する。耐雑音直間比推定装置100は、複数の周波数領域変換部421,…,42Mと直間比推定部44を備える図4で説明済みのものと同じものである。マイクロホンアレー41を除く各機能構成部は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
マイクロホンアレー41は複数のマイクロホンm1,…mMから成る。複数の周波数領域変換部421,…,42Mは、複数のマイクロホンm1,…mMで受音された受音信号xm(n)がそれぞれ入力され、各受音信号を周波数領域の信号に変換する(ステップS42)。
処理対象信号生成部43は、複数の周波数領域変換部421,…,42Mが出力する周波数領域の信号Xm(ω,l)を合成して処理対象信号Y(ω,l)を生成する(ステップS43)。耐雑音直間比推定装置100は、上記したのと同じ動作を行い直間比ER(ω,l)を算出して出力する(ステップS44)。ただし、ここで述べる干渉雑音除去装置では、直間比として式(13)の分母と分子における総和演算を除いた式(14)を使用する。
Figure 2011259398
対象信号調整部45は、処理対象信号Y(ω,l)と、直間比ER(ω,l)を入力としてその値に応じて処理対象信号Y(ω,l)の振幅を調整した処理後信号Z(ω,l)を生成する(ステップS45)。
逆周波数領域変換部46は、処理後信号Z(ω,l)を時間領域の信号z(n)に変換する(ステップS46)。ステップS42〜ステップS46までの動作は、全ての受音信号xm(n)が終了するまで継続される。
ここで、直間比ER(ω,l)の値に応じて調整とは、ER(ω,l)の閾値処理や、その値が大きいほど処理後信号Z(ω,l)の振幅を大きくする処理や、その値が大きいほど処理後信号Z(ω,l)の振幅を小さくする等の処理を含む。詳しくは後述する。
以上の動作により、1個のマイクロホンアレーによって、例えば、特定の距離範囲にある音だけを強調し、その範囲外の音は抑圧して収音する雑音除去が行われる。以降、各部のより具体的な機能構成例を示して更に詳しくこの発明を説明する。
〔処理対象信号生成部〕
図8に処理対象信号生成部43のより具体的な機能構成例を示す。処理対象信号生成部43は、複数の重み乗算手段4311〜431Mと、加算手段432を備える。複数の重み乗算手段4311〜431Mは、M個のマイクロホンで受音した複数の受音信号xm(n)の、それぞれの周波数成分X1(ω,l),…,XM(ω,l)に重み係数wm(ω)を乗ずる。
重み乗算手段4311〜431Mで使用する重みには、例えばM個のマイクロホンが無指向性の場合にはwm=1/Mとすることで全ての周波数成分X1(ω,l),…,XM(ω,l)の平均を取ることで、処理対象信号Y(ω,l)を安定化させる。また、M個のマイクロホンが指向性を持つ場合には、w1=1,wm=0(m={2,…,M})とすることで、特定のマイクロホンの信号だけを使用することができる。例えば、参考文献「大賀、山崎、金田著、“音響システムとディジタル信号処理”電子情報通信学会発行」に記載されているような方法を利用して、重みビームフォーミングのフィルタ係数を使用すれば、マイクロホンアレーで任意の指向性を形成することもできる。
加算手段432は、重みが乗ぜられた全ての周波数成分X1(ω,l),…,XM(ω,l)を加算して処理対象信号Y(ω,l)を出力する。
〔対象信号調整部〕
対象信号調整部45は、例えば、フィルタ係数算出手段451と、乗算手段452とで構成できる(図6)。フィルタ係数算出手段451は、直間比ER(ω,l)を入力としてフィルタ係数G(ω,l)を算出して出力する。フィルタ係数G(ω,l)の算出には、例えば式(15)に示すように閾値を用いた2値のフィルタなどが用いられる。
Figure 2011259398
なお、閾値Thは、直間比ER(ω,l)の最小値と最大値の間の任意の値が設定できる。閾値Thを最小値(0)に近づけると音質は向上する。逆に閾値Thを最大値に近づけると雑音抑圧効果は高めるが受音信号の歪みが大きくなり音質が劣化する。
このように閾値Thは、音質と雑音抑圧との関係でトレードオフの関係を持つ。よって、閾値Thは、このトレードオフの関係を考慮した上で、利用目的に応じて経験的に決定される。
また、フィルタ係数G(ω,l)の算出に際して式(16)に示すように、直間比の値が閾値Th2を下回る時間周波数帯域を強調するようにすれば、特定の距離範囲より遠くの音源を強調することができる。
Figure 2011259398
なお、フィルタ係数G(ω,l)の例として0か1の2値のフィルタを挙げたが、フィルタ係数G(ω,l)は必ずしも0と1である必要はなく、例えば、0.1と0.9のように十分異なる値であれば良い。
また、フィルタ係数G(ω,l)には、1以上の実数を設定するようにしても良い。つまり、処理対象信号Y(ω,l)を増幅するようにしても良い。また、0.1以下の値に設定して処理対象信号Y(ω,l)を大きく抑圧するようにしても良い。
このようにして求めたフィルタ係数G(ω,l)が、乗算手段452において、処理対象信号Y(ω,l)に乗じて処理後信号Z(ω,l)=G(ω,l)・Y(ω,l)が生成される。よって、処理後信号Z(ω,l)を、直間比ER(ω,l)の大きな処理対象信号Y(ω,l)のみで構成することができる。つまり、直接音のみを抽出することができる。
この発明の実施例2として、実施例1で述べた直間比ER(l)を用いて音源の遠近を判定する遠近判定装置300を説明する。図9に遠近判定装置300の機能構成例を示す。遠近判定装置300は、マイクロホンアレー41と、耐雑音直間比推定装置100と、遠近判定部121と、を備える。マイクロホンアレー41と、耐雑音直間比推定装置100は、干渉雑音除去装置200のものと同じである。遠近判定装置300も、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現される。
遠近判定装置300は、複数の異なる距離にある音源が異なる時刻に発音するときに、ある時刻に受音された音の音源が遠くにあるのか近くにあるのかを判定するものである。遠近判定装置300を構成する遠近判定部121は、蓄積手段1211と、判定手段1212と、を備える。
蓄積手段1211は、直間比ERを過去L時間フレーム分蓄積して、比較対象直間比E^を出力する。比較対象直間比E^には、例えば蓄積された直間比ER(l)の平均値E^=1/LΣl LR(l)や、最小値と最大値の平均値E^=1/2(maxER(l)+minER(l))等が用いられる。
判定手段1212は、直間比ER(l)と、比較対象直間比E^を比較して、ER(l)>E^の時には遠近判定結果Ylに距離が近いことを表す例えば1を、ER(l)<E^の時には遠近判定結果Ylに距離が遠いことを表す例えば0を出力する。この遠近判定結果Ylは、直近の過去L時間分の受音信号が、比較的近い音源からの音であるか、又は、比較的遠い音源からの音であるかを表すものである。
この遠近判定結果Ylを用いることで、逐次入力される受音信号を、マイクロホンとその音源間との距離によって切り分けることが可能である。つまり、複数の音源の音を、マイクロホンからの距離に応じて選択することができる。
図10にこの発明の音源距離測定装置400の機能構成例を示す。音源距離測定装置400は、1個のマイクロホンアレー41と、耐雑音直間比推定装置100と、距離−直間比データベース(以降、距離−直間比DBと称する)45と、距離判定部46と、を具備する。耐雑音直間比推定装置100は、複数の周波数領域変換部421,…,42Mと直間比推定部44を含む。マイクロホンアレー41を除く各機能構成部は、例えばROM、RAM、CPU等で構成されるコンピュータに所定のプログラムが読み込まれて、CPUがそのプログラムを実行することで実現されるものである。
マイクロホンアレー41は複数のマイクロホンm1,…mMから成る。複数の周波数領域変換部421,…,42Mは、複数のマイクロホンm1,…mMで受音された受音信号xm(n)がそれぞれ入力され、各受音信号を周波数領域の信号に変換する。周波数領域変換部421,…,42Mは、フレーム毎に離散フーリエ変換を行い周波数成分Xm(ω,l)を出力する。
直間比推定部44は、複数の周波数領域変換部421,…,42mが出力する周波数領域の信号Xm(ω,l)を入力として受音信号の直間比ERを推定する。
距離−直間比DB45は、直間比ERとマイクロホンアレーと音源との距離との関係を記録している。距離判定部45は、直間比を入力として距離−直間比DB44を参照してその直間比と対応する音源距離推定値d^を推定する。
受音信号の中には、特定の周波数帯域に成分が集中しているものもある。そのような受音信号の直間比ERを、直間比算出手段443で算出した場合、直間比ERの推定精度は劣化してしまう。
そこで、式(17)に示すように、特定の周波数領域Ωにおける直間比Eを算出する直間比算出手段443′(図4)を用いることで、直間比の推定精度を向上させることが出来る。
Figure 2011259398
ここで周波数領域Ωは、例えば信号成分の集中する周波数帯域を選択するなどして決定される。例えば、任意のm番目のマイクロホンに接続された周波数領域変換部42mの出力Xm(ω,l)のうち、式(18)に示す様にXm(ω,l)の絶対値が予め設定された閾値Pthより大きい値を持つ周波数ωを選んだり、Xm(ω,l)の絶対値が大きい方からK番目までの周波数ωを選ぶことで決定される。
Figure 2011259398
ここで、Pthは、例えば|Xm(ω,l)|の全周波数の平均値などが用いられる。
図11に、この発明の干渉雑音除去装置500の機能構成例を示す。干渉雑音除去装置500は、実施例1で述べた耐雑音直間比推定装置100と、処理対象信号生成部72と、対象信号調整部73と、逆周波数領域変換部74と、を具備する。
処理対象信号生成部72は、耐雑音直間比推定装置100内の複数の周波数領域変換部421〜42Mが出力する周波数領域の信号Xm(ω,l)を入力として処理対象信号X(ω,l)を出力する。処理対象信号X(ω,l)は、周波数領域の信号Xm(ω,l)を例えば図示しない加算手段等で合成したものである。加算する前に、各周波数領域の信号Xm(ω,l)に、重みを乗じる様にしても良い。
対象信号調整部73は、耐雑音直間比推定装置100が出力する直間比E(ω)と、処理対象信号生成部72が出力する処理対象信号X(ω,l)を入力として、処理対象信号X(ω,l)の振幅を調整した処理後信号Y(ω,l)を生成する。逆周波数領域変換部74は、処理後信号Y(ω,l)を時間領域の信号y(n)に変換する。
対象信号調整部73は、例えば、距離算出手段721、フィルタ形成手段722、乗算手段723、を備える。距離算出手段721は、マイクロホンアレー41と音源との間の距離と、直間比ER(ω,l)との関係を示す関数式d=f(ER(ω,l))を内蔵し、入力される直間比Eに応じた音源距離推定値d^を算出する。
フィルタ形成手段722は、式(19)に示すように、音源距離推定値d^が、2つの大きさが異なる閾値dfとdnの間の値を取る時間周波数成分を強調するように設定し、2つの距離区間内の帯状の領域にある音源だけを強調するフィルタを形成する。
Figure 2011259398
ここで、G(ω,l)のlとωは、上記した直間比推定部43の処理の内、空間相関行列算出手段431において式(1)で平均を行ったL個のフレーム及び直間比算出手段443において平均を行った周波数Ω(式(17))に含まれる全ての周波数に対して、同じG(ω,l)が乗算される。また、式(19)においてG(ω,l)の値は必ずしも1と0である必要は無く、例えば、0.9と0.1のように十分大きさが異なる値でも良い。
乗算手段723は、処理対象信号X(ω,l)に、フィルタG(ω,l)を乗じて処理後信号Y(ω,l)を生成する。したがって、処理後信号Y(ω,l)は、2つの距離区間内、つまり、マイクロホンアレー41から特定の距離範囲に位置する音源の音声が、強調若しくは抑圧されたものとなる。この処理後信号Y(ω,l)は、逆周波数領域変換部73で時間領域の信号y(n)に変換される。
上記した実施例の空間相関行列R(ω,l)は、式(1)から明らかなように、フレーム数Lの平均値を元にしたものである。従って、音源の位置が移動する場合には、正確に直間比を求めることができない。そこで、音源の位置が移動する場合でも、正確に直間比を求めることができる耐雑音直間比推定装置600を説明する。
この実施例では、例えば図12に示すような等間隔配置のマイクロホンアレー130を利用する。この実施例による直間比推定部44の機能構成は、図4に示したものと同じである。
信号パワー推定手段442′(図4)は、空間相関行列算出手段441′が出力する小空間相関行列R′(ω,l)の各成分R′i,j(ω,l)と、予め与えられているマイクロホンアレーのマイクロホン配置と、音源の方向より与えられる行列Rd(ω)(式(3))と、行列Rr(ω)(式(4))と行列Rn(ω)(式(5))の各成分、di,j(ω)と、ri,j(ω)と、ni,j(ω)より、それぞれ構成される式(20)に示す行列A(ω)と、式(21)に示すB(ω,l)を用いる。ここで、小空間相関行列R′(ω,l)とは、小マイクロホンアレー毎に求めた空間相関行列の和で求まる行列である(式(22))。
Figure 2011259398
但し、B(ω,l)の各成分であるR11′(ω,l),R12′(ω,l),R21′(ω,l),R22′(ω,l)は、式(22)に示すR′(ω,l)で求められる。
Figure 2011259398
但し、
Figure 2011259398
式(22)と式(23)は、図13に示すように隣接するマイクロホンを2個ずつの小アレーとして移動した場合の空間相関行列の和で求まる小空間相関行列を算出する。つまり、隣接するマイクロホンを2個ずつ括った小アレーを移動(130a→130b→ … →130g)して空間相関行列の和を求める。マイクロホンの数をM′個とすると、式(20)は式(24)、式(21)は式(25)、式(22)は式(26)で表せる。
Figure 2011259398
そして、式(8)に示す連立方程式を立て、これを解くことで直接音のパワーPd(ω,l)と残響音のパワーPr(ω,l)と雑音のパワーP(ω,l)で構成されるベクトルP(ω,l)(式(9))を求め、直接音パワーPd(ω,l)と残響音パワーPr(ω,l)を出力する。
直間比算出手段443は、実施例1と全く同じ処理を行う。以上説明したように空間相関行列算出手段441′のように、小アレー毎に求めた空間相関行列の和で求まる小空間相関行列を算出することで、移動する音源に対しても正確な直間比を求めることができる。
なお、小アレーを構成するマイクロホンの数を2個の例で説明したが、その数はいくつでも良い。また、そのマイクロホンの配置も等間隔に直線配置されたリニアアレーに限定されない。長方形平面アレー、三角形平面アレー、直方体アレー等、一定規則で配列された複数のマイクロホンから成る小マイクロホンアレーの平行移動で重なる位置に、マイクロホンが設けられるマイクロホンアレーであれば何でも良い。
〔実験結果〕
この発明の効果を確認する目的で、音源21から白色雑音が発せられたときにマイクロホンアレーで受音した信号を用いて直間比を推定し、従来方法と比較する実験を行った。
図14にシミュレーション条件を示す。平面サイズが4×6mで、高さが2.7mの部屋を想定した。なお図14は部屋を上から見た図である。8個のマイクロホンを半径6cmの円状に配置したマイクロホンアレーを用いた。マイクロホンアレーは床から高さを1.5mの位置に配置した。そして円の中心軸から角度10°の方向で、高さ1.5mの位置に音源21を配置した。部屋の残響時間は約550ms、サンプリング周波数は16kHz、処理における1フレームの長さは512サンプルである。
図15にSNR:10dBとした時、図16にSNR:20dBとした時を示す。それぞれ(a)が従来方法、(b)がこの発明である。横軸は距離(cm)、縦軸は直間比(dB)である。○実線が推定した直間比、●破線が正しい直間比を示す。
図15と16の(a)と(b)を比較すると、どちらもこの発明の方が誤差が少ないことが分かる。例えばSNR:10dB(図15)の距離10cmの音源に対する直間比の推定誤差は、従来技術が10dBであるのに対して本発明による耐雑音直間比推定装置では約5dBである。また、雑音のパワーが10分の1の関係にある図15と16とを比較すると、図15(b)と図16(b)との間にはほとんど差がないことが分かる。この結果は、この発明の方法が、重畳する雑音の大きさに影響を受け難いことを示している。このように、この発明による耐雑音直間比推定方法によればマイクロホンに無相関な雑音が重畳した場合でも精度よく直間比を推定する効果を奏する。
なお、上記方法及び装置において説明した処理は、記載の順に従って時系列に実行されるのみならず、処理を実行する装置の処理能力あるいは必要に応じて並列的にあるいは個別に実行されるとしても良い。また、上記装置及び方法を実装したマイクロホンアレーを2つ以上利用することで、干渉雑音除去システムなどを構築しても良い。
また、上記装置における処理手段をコンピュータによって実現する場合、各装置が有すべき機能の処理内容はプログラムによって記述される。そして、このプログラムをコンピュータで実行することにより、各装置における処理手段がコンピュータ上で実現される。
この処理内容を記述したプログラムは、コンピュータで読み取り可能な記録媒体に記録しておくことができる。コンピュータで読み取り可能な記録媒体としては、例えば、磁気記録装置、光ディスク、光磁気記録媒体、半導体メモリ等どのようなものでもよい。具体的には、例えば、磁気記録装置として、ハードディスク装置、フレキシブルディスク、磁気テープ等を、光ディスクとして、DVD(Digital Versatile Disc)、DVD−RAM(Random Access Memory)、CD−ROM(Compact Disc Read Only Memory)、CD−R(Recordable)/RW(ReWritable)等を、光磁気記録媒体として、MO(Magneto Optical disc)等を、半導体メモリとしてEEP−ROM(Electronically Erasable and Programmable-Read Only Memory)等を用いることができる。
また、このプログラムの流通は、例えば、そのプログラムを記録したDVD、CD−ROM等の可搬型記録媒体を販売、譲渡、貸与等することによって行う。さらに、このプログラムをサーバコンピュータの記録装置に格納しておき、ネットワークを介して、サーバコンピュータから他のコンピュータにそのプログラムを転送することにより、このプログラムを流通させる構成としてもよい。
また、各手段は、コンピュータ上で所定のプログラムを実行させることにより構成することにしてもよいし、これらの処理内容の少なくとも一部をハードウェア的に実現することとしてもよい。

Claims (9)

  1. 複数のマイクロホンで受音された受音信号がそれぞれ入力され、上記受音信号を周波数領域の信号に変換する複数の周波数領域変換部と、上記周波数領域の信号を入力として直接音のパワーと残響音のパワーと雑音のパワーを求め、上記直接音のパワーを上記残響音のパワーで除した直間比を算出する直間比推定部とから成る耐雑音直間比推定装置であって、
    上記直間比推定部は、
    上記複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する空間相関行列算出手段と、
    予め与えられる上記マイクロホンの配置情報と、上記空間相関行列とから直接音のパワーと残響音のパワーと雑音のパワーとで構成されるベクトルを求め、そのベクトル要素の内の直接音のパワーと残響音のパワーを出力する信号パワー推定手段と、
    上記直接音のパワーを上記残響音のパワーで除した上記直間比を算出する直間比算出手段と、
    を具備する耐雑音直間比推定装置。
  2. 請求項1に記載した耐雑音直間比推定装置を含む干渉雑音除去装置であって、
    上記複数の周波数領域変換部に受音された受音信号をそれぞれ入力する複数のマイクロホンから成るマイクロホンアレーと、
    上記複数の周波数領域変換部の出力する周波数領域の信号を合成して処理対象信号を生成する処理対象信号生成部と、
    上記処理対象信号と、上記直間比を入力として当該直間比が大きいほど上記処理対象信号の振幅を大きく調整した処理後信号を生成する対象信号調整部と、
    上記処理後信号を時間領域の信号に変換する逆周波数領域変換部と、
    を具備する干渉雑音除去装置。
  3. 請求項1に記載した耐雑音直間比推定装置を含む干渉雑音除去装置であって、
    上記複数の周波数領域変換部に受音された受音信号をそれぞれ入力する複数のマイクロホンから成るマイクロホンアレーと、
    上記複数の周波数領域変換部の出力する周波数領域の信号を合成して処理対象信号を生成する処理対象信号生成部と、
    上記処理対象信号と、上記直間比を入力として当該直間比が小さいほど上記処理対象信号の振幅を大きく調整した処理後信号を生成する対象信号調整部と、
    上記処理後信号を時間領域の信号に変換する逆周波数領域変換部と、
    を具備する干渉雑音除去装置。
  4. 請求項1に記載した耐雑音直間比推定装置を含み、遠近判定部を備えた遠近判定装置であって、
    上記遠近判定部は、
    上記直間比を、周波数方向に平均して周波数平均直間比を出力する周波数平均手段と、
    上記周波数平均直間比を過去の所定時間分のフレームを蓄積して、比較対象直間比を出力する蓄積手段と、
    上記周波数平均直間比と、上記比較対象直間比とを比較して遠近判定結果を出力する判定手段と、
    を具備する遠近判定装置。
  5. 請求項1に記載した耐雑音直間比推定装置を含む音源距離測定装置であって、
    上記複数の周波数領域変換部に受音された受音信号をそれぞれ入力する複数のマイクロホンから成るマイクロホンアレーと、
    上記直間比と距離との関係を記録した距離−直間比データベースと、
    上記直間比を入力として上記距離−直間比データベースを参照して当該直間比と対応する音源距離推定値を推定する距離判定部と、
    を具備する音源距離測定装置。
  6. 請求項5に記載した音源距離測定装置において、
    上記直接音のパワーと上記残響音のパワーと上記雑音のパワーのそれぞれが、特定の周波数領域における加算値であることを特徴とする音源距離測定装置。
  7. 請求項1に記載した耐雑音直間比推定装置を含む干渉雑音除去装置であって、
    上記複数の周波数領域変換部が出力する周波数領域の信号を入力として処理対象信号を出力する処理対象信号生成部と、
    上記耐雑音直間比推定装置が出力する直間比と、上記処理対象信号とを入力として上記マイクロホンアレーから特定の距離範囲に位置する音源の音声を、強調若しくは抑圧した処理後信号を生成する対象信号調整部と、
    上記処理後信号を時間領域の信号に変換する逆周波数領域変換部と、
    を具備する干渉雑音除去装置。
  8. 複数の周波数領域変換部が、複数のマイクロホンで受音された受音信号を周波数領域の信号に変換する周波数領域変換過程と、
    空間相関行列算出部が、上記複数の周波数領域変換部の出力する周波数領域の信号を入力としてその周波数領域の信号をベクトル化して空間相関行列を算出する空間相関行列算出過程と、
    信号パワー推定部が、予め与えられる上記マイクロホンの配置情報と、上記空間相関行列とから直接音のパワーと残響音のパワーと雑音のパワーとで構成されるベクトルを求め、そのベクトル要素の内の直接音のパワーと残響音のパワーを出力する信号パワー推定過程と、
    直間比算出部が、上記直接音パワーを上記残響音パワーで除した上記直間比を算出する直間比算出過程と、
    を含む耐雑音直間比推定方法。
  9. 請求項1に記載した耐雑音直間比推定装置、または、請求項2又は請求項3又は請求項7に記載した干渉雑音除去装置、または、請求項4に記載した遠近判定装置、または、請求項5又は6に記載した音源距離測定装置としてコンピュータを機能させるための装置プログラム。
JP2010134495A 2010-06-11 2010-06-11 耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム Expired - Fee Related JP5683140B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010134495A JP5683140B2 (ja) 2010-06-11 2010-06-11 耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010134495A JP5683140B2 (ja) 2010-06-11 2010-06-11 耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム

Publications (2)

Publication Number Publication Date
JP2011259398A true JP2011259398A (ja) 2011-12-22
JP5683140B2 JP5683140B2 (ja) 2015-03-11

Family

ID=45475035

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010134495A Expired - Fee Related JP5683140B2 (ja) 2010-06-11 2010-06-11 耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム

Country Status (1)

Country Link
JP (1) JP5683140B2 (ja)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013117964A1 (en) * 2012-02-09 2013-08-15 Nokia Corporation Estimating distances between devices
JP2013178110A (ja) * 2012-02-28 2013-09-09 Nippon Telegr & Teleph Corp <Ntt> 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001166025A (ja) * 1999-12-14 2001-06-22 Matsushita Electric Ind Co Ltd 音源の方向推定方法および収音方法およびその装置
JP2008079256A (ja) * 2006-09-25 2008-04-03 Toshiba Corp 音響信号処理装置、音響信号処理方法及びプログラム
JP2009036810A (ja) * 2007-07-31 2009-02-19 National Institute Of Information & Communication Technology 近傍場音源分離プログラム、及びこのプログラムを記録したコンピュータ読取可能な記録媒体、並びに近傍場音源分離方法
JP2010103617A (ja) * 2008-10-21 2010-05-06 Nippon Telegr & Teleph Corp <Ntt> 発話向き推定装置、方法及びプログラム
JP2011053062A (ja) * 2009-09-01 2011-03-17 Nippon Telegr & Teleph Corp <Ntt> 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001166025A (ja) * 1999-12-14 2001-06-22 Matsushita Electric Ind Co Ltd 音源の方向推定方法および収音方法およびその装置
JP2008079256A (ja) * 2006-09-25 2008-04-03 Toshiba Corp 音響信号処理装置、音響信号処理方法及びプログラム
JP2009036810A (ja) * 2007-07-31 2009-02-19 National Institute Of Information & Communication Technology 近傍場音源分離プログラム、及びこのプログラムを記録したコンピュータ読取可能な記録媒体、並びに近傍場音源分離方法
JP2010103617A (ja) * 2008-10-21 2010-05-06 Nippon Telegr & Teleph Corp <Ntt> 発話向き推定装置、方法及びプログラム
JP2011053062A (ja) * 2009-09-01 2011-03-17 Nippon Telegr & Teleph Corp <Ntt> 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2013117964A1 (en) * 2012-02-09 2013-08-15 Nokia Corporation Estimating distances between devices
JP2013178110A (ja) * 2012-02-28 2013-09-09 Nippon Telegr & Teleph Corp <Ntt> 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム

Also Published As

Publication number Publication date
JP5683140B2 (ja) 2015-03-11

Similar Documents

Publication Publication Date Title
JP5079761B2 (ja) 直間比推定装置、音源距離測定装置、雑音除去装置、各装置の方法と、装置プログラム
KR101449433B1 (ko) 마이크로폰을 통해 입력된 사운드 신호로부터 잡음을제거하는 방법 및 장치
KR101456866B1 (ko) 혼합 사운드로부터 목표 음원 신호를 추출하는 방법 및장치
JP6584930B2 (ja) 情報処理装置、情報処理方法およびプログラム
US8238569B2 (en) Method, medium, and apparatus for extracting target sound from mixed sound
JP3582712B2 (ja) 収音方法および収音装置
JP5738218B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
JP2007147732A (ja) 雑音低減システム及び雑音低減方法
JP6225245B2 (ja) 信号処理装置、方法及びプログラム
JP5060465B2 (ja) 収音装置、収音方法、収音プログラム、記録媒体
JP5143802B2 (ja) 雑音除去装置、遠近判定装置と、各装置の方法と、装置プログラム
JP5175262B2 (ja) 音声取得装置
JP5683140B2 (ja) 耐雑音直間比推定装置、干渉雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム
JP5635024B2 (ja) 音響信号強調装置、遠近判定装置、それらの方法、及びプログラム
JP5826465B2 (ja) 瞬時直間比推定装置、雑音除去装置、遠近判定装置、音源距離測定装置と、各装置の方法と、装置プログラム
JP5698166B2 (ja) 音源距離推定装置、直間比推定装置、雑音除去装置、それらの方法、及びプログラム
KR20190073852A (ko) 우도 최대화를 이용한 빔포밍 방법
JP6517124B2 (ja) 雑音抑圧装置、雑音抑圧方法、およびプログラム
JPH09261792A (ja) 受音方法及びその装置
CN116106826A (zh) 声源定位方法、相关装置和介质
JP5815489B2 (ja) 音源別音声強調装置、方法、プログラム
JP3720795B2 (ja) 音源受音位置推定方法、装置、およびプログラム
KR20090098552A (ko) 위상정보를 이용한 자동 이득 조절 장치 및 방법
JP2006066988A (ja) 収音方法、収音装置、収音プログラム、およびこれを記録した記録媒体
JP2009005261A (ja) 収音装置、収音方法、その方法を用いた収音プログラム、および記録媒体

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121004

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20130725

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20130924

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20131031

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A132

Effective date: 20140430

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20140522

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150106

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150113

R150 Certificate of patent or registration of utility model

Ref document number: 5683140

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees