JP2004078021A - 収音方法、収音装置、および収音プログラム - Google Patents
収音方法、収音装置、および収音プログラム Download PDFInfo
- Publication number
- JP2004078021A JP2004078021A JP2002240986A JP2002240986A JP2004078021A JP 2004078021 A JP2004078021 A JP 2004078021A JP 2002240986 A JP2002240986 A JP 2002240986A JP 2002240986 A JP2002240986 A JP 2002240986A JP 2004078021 A JP2004078021 A JP 2004078021A
- Authority
- JP
- Japan
- Prior art keywords
- sound
- covariance
- sound source
- source position
- filter
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Landscapes
- Circuit For Audible Band Transducer (AREA)
- Measurement Of Velocity Or Position Using Acoustic Or Ultrasonic Waves (AREA)
Abstract
【解決手段】有音・無音検出部12はマイクロホン111〜11Mで収音された受音信号から有音、無音を検出する。共分散行列計算部13は受音信号からチャネル間の共分散行列を算出する。共分散行列記憶部14は有音(無音)と判定された有音共分散(無音共分散)として記憶する。フィルタ計算部15は記憶された有音共分散と無音共分散に基づき入力音声のパワーが最も大きいチャネルのフィルタ係数を計算する。マルチチャネルフィルタ部16は前記フィルタ係数で前記チャネルの信号をフィルタリングする。
【選択図】 図1
Description
【発明の属する技術分野】
本発明は収音方法、装置、および収音プログラムに関する。
【0002】
【従来の技術】
図9は特開2002―62895号公報に開示された従来例の収音装置のブロック図である。この収音装置はマイクロホン111〜11Mと、有音・無音検出部12と、マルチチャネルフィルタ部16と、目的音源位置・受音位置設定部71と、仮想目的音生成部72と、フィルタ学習部73を有している。マルチチャネルフィルタ部16はフィルタ161〜16Mと加算器162で構成される。
【0003】
目的音源位置・受音位置設定部71は目的音源位置と受音位置を設定する。仮想目的音生成部72は、目的音源位置・受音位置設定部71で設定された目的音源位置と受音位置から、目的音源位置からマイクロホンに到達した信号を仮想的に生成する。これは、目的音源位置と各受音位置間の遅延時間差を求め、白色雑音等の信号源にこの遅延を各々与えることにより生成できる。また、これと同時に、最適出力信号として、前記白色雑音等の信号源を一定時間遅延させただけの信号も生成する。次に、有音・無音区間検出部12は、マイクロホン111〜11Mで受音された信号より雑音のみが存在する無音区間を検出する。この検出があった期間のみ、フィルタ学習部73は動作をする。フィルタ学習部73は、マイクロホン111〜11Mで受音された雑音信号の各々と、仮想目的音生成部72で仮想的に生成された目的音がマイクロホンに到達した信号を各々加算し、これをマルチチャネルフィルタでフィルタリングした信号を求める。この信号が、仮想目的音生成部72で生成された最適出力信号と等しくなるようにNLMSアルゴリズム等の適応アルゴリズムでマルチチャネルフィルタの係数を更新し、最適なフィルタ係数を求める。このフィルタ係数は、マルチチャネルフィルタ部16にコピーされる。マルチチャネルフィルタ部16は、マイクロホン111〜11Mで受信された信号をフィルタ1611〜161Mでフィルタリングし、加算器162で加算した出力信号を出力する。
【0004】
このように従来技術の収音方法では、あらかじめマイクロホン位置を計測しておく必要があり、目的音源位置もあらかじめ設定しておくことが必要である。また、フィルタを学習することが必要で、その収束も遅い。
【0005】
次に、これから数式で使用する記号を定義する。サンプリング周期により離散化された時刻をnとし、時刻nにi番目マイクロホン11iで収音された信号をxi(n)とし、Lサンプル分を取り出して行列で表したものを
【0006】
【外1】
【0007】
とする。仮想目的音生成部72で生成されるi番目のチャネルの仮想目的音受音信号をui(n)として、Lサンプル分を取り出して行列で表したものを
【0008】
【外2】
【0009】
とする。また、仮想目的音生成部72で生成される最適出力信号をν(n−τ0)とする。マルチチャネルフィルタ部16およびフィルタ学習部73内のマルチチャネルフィルタの係数行列
【0010】
【外3】
【0011】
で表す。ただし、hi(n−l−1)は、時刻nにおけるi番目のマイクロホンに対するフィルタのlタップ目のフィルタ係数を表す。フィルタ学習部73内のマルチチャネルフィルタの出力信号をy(n)と表し、これから、最適出力信号ν(n−τ0)を減算したものをe(n)と表す。
【0012】
次に、マルチチャネルフィルタの収束解および修正式の導出を行う。
【0013】
まず、e(n)の二乗平均を求める。この二乗平均誤差が小さくなれば、マイクロホンで受音した雑音成分のパワーが小さくなり、最適出力信号ν(n−τ0)に近くなるので、この二乗平均誤差を最小とするフィルタが最適なフィルタとなる。
【0014】
【数1】
【0015】
雑音と仮想目的音は無相関であるので、式(1)は式(2)のように変形できる。
【0016】
【数2】
【0017】
適応フィルタ
【0018】
【外4】
【0019】
をLタップのFIRフィルタとして、式(2)をベクトル表記すれば、式(3)のようになる。
【0020】
【数3】
【0021】
ただし、仮想目的信号v(n)は、平均パワー
【0022】
【外5】
【0023】
の定常的な信号であるとし、また、
【0024】
【外6】
【0025】
である。
【0026】
式(3)を最小化するフィルタが最適なフィルタであるので、式(3)を
【0027】
【外7】
【0028】
で偏微分し、0とおいて、極小点を求める。
【0029】
【数4】
【0030】
式(4)を
【0031】
【外8】
【0032】
について解けば、式(3)を最小化する最適フィルタ
【0033】
【外9】
【0034】
が求められる。
【0035】
【数5】
【0036】
式(5)の最適フィルタを求める方法として、LMSアルゴリズム、NLMSアルゴリズム、射影アルゴリズムなどの適応アルゴリズムがある。今回はNLMS法を例にとって修正式を示す。修正式は式(6)で表される。
【0037】
【数6】
【0038】
ただし、
【0039】
【外10】
【0040】
は式(7)で表される。
【0041】
【数7】
【0042】
ただし、αは更新係数で0〜1の値を取る。
【0043】
ここまでで、式(6)の修正式を用いて、式(5)の最適フィルタを求められることを示した。
【0044】
次に、以上説明した従来装置の収束特性を図10に示す。この図より、従来技術では、非常に収束が遅く最適フィルタまで収束していないことがわかる。この原因は、信号間の相関が高いためであり、特に低周波成分の収束が遅い。このため、従来技術では、環境の変化に対する追従性能が低く。十分な性能が得られない。
【0045】
以上、従来技術では、受音位置、目的音源位置をあらかじめ設定しなくてはならず、マイクロホンの自由な配置や移動ができなく、またフィルタの学習にも時間がかかるので、雑音の移動等の環境の変化に対して追従性能が劣るという問題がある。
【0046】
【発明が解決しようとする課題】
雑音を抑圧し、目的音をクリアに収音したい場合に、従来技術の収音方法では、あらかじめ受音位置を計測しておき、さらに目的音源位置もあらかじめ決めておかなくてはならず、マイクロホンの自由な配置、移動ができないという問題がある。また、従来技術の収音方法では、フィルタの学習に時間がかかるため、雑音の移動などの環境の変化に対する追従性能が低く、十分な性能が得られないという問題がある。
【0047】
本発明の目的は、受音位置、目的音源位置が未知であっても雑音の抑圧を可能とし、マイクロホンの自由な配置と、設置、移動を簡易にし、さらに雑音の移動等の環境変化に対する追従性能を高める収音方法、装置、およびプログラムを提供することにある。
【0048】
【課題を解決するための手段】
本発明の収音方法は、
複数の収音手段の各々で受音された受音信号から有音、無音を検出する有音・無音検出段階と、
収音手段の各々で受音された受音信号からチャネル間の共分散を算出する共分散計算段階と、
有音と判定された場合の共分散を有音共分散として、無音と判定された場合の共分散を無音共分散として記憶手段に逐次記憶する共分散記憶段階と、
記憶された有音共分散と無音共分散に基づき、入力音声のパワーが最も大きいチャネルのフィルタ係数を算出するフィルタ計算段階と、
前記フィルタ係数で、チャネル信号をフィルタリングするフィルタリング段階とを有する。
【0049】
本発明は、有音・無音判定を行い、有音時のチャネル間(入力信号)の共分散と無音時のチャネル間(入力信号の)共分散に基づきチャネルごとのフィルタを算出し、このフィルタにより各チャネル入力信号をフィルタリングすることにより、雑音を抑圧した目的音を得るものである。
【0050】
【発明の実施の形態】
次に、本発明の実施の形態について図面を参照して説明する。
【0051】
第1の実施形態
図1は本発明の第1の実施形態の収音装置のブロック図である。
【0052】
本実施形態の収音装置はマイクロホン111〜11Mと有音・無音検出部12と共分散行列計算部13と共分散行列記憶部14とフィルタ計算部15とマルチチャネルフィルタ部16とにより構成される。
【0053】
本実施形態は、位置がわからない目的音源から発せられた音を、位置がわからない複数のマイクロホンにより受音し、その信号から目的音を収音し、雑音を抑圧するフィルタ係数を求め、受音信号をフィルタリングすることにより雑音を抑圧した目的音を得るものである。
【0054】
まず、有音・無音検出部12は、マイクロホン111〜11Mで収音された受音信号のパワーから有音区間、無音区間を検出する。例えば、それぞれの受音信号について、短時間平均パワー(0.1〜1s程度)と長時間平均パワー(1s〜100s程度)を求め、短時間平均パワーと長時間平均パワーの比が有音の閾値を超える場合に有音と判定し、無音の閾値未満の場合に無音と判定し、その判定結果が、すべての受音信号について有音であった場合を有音と判定し、すべて無音であった場合を無音と判定する。
【0055】
次に、共分散行列計算部13は、マイクロホン111〜11Mで受音された受音信号のチャネル間共分散を求め、それを行列にする。有音・無音検出部12で有音であった場合を目的音共分散行列
【0056】
【外11】
【0057】
とし、無音であった場合を雑音共分散行列
【0058】
【外12】
【0059】
とする。以下にその行列の求め方を示す。
【0060】
まず、i番目マイクロホンで受音された信号をxi(t)とし、それを周波数領域に変換したものをxi(ω)とし、i番目のマイクロホンで受音された信号とj番目のマイクロホンで受音された信号の共分散Rij(ω)を求めれば、式(8)となる。
【0061】
【数8】
【0062】
次に、共分散行列
【0063】
【外13】
【0064】
は、式(9)で表される。
【0065】
【数9】
【0066】
有音・無音検出部12で有音であった場合に、式(9)の共分散行列
【0067】
【外14】
【0068】
を目的音共分散行列
【0069】
【外15】
【0070】
とし、無音であった場合に雑音共分散行列
【0071】
【外16】
【0072】
とする。
【0073】
次に、共分散行列記憶部14は、目的音共分散行列
【0074】
【外17】
【0075】
と雑音共分散行列
【0076】
【外18】
【0077】
を記憶する。
【0078】
次に、フィルタ計算部15は、目的音を収音し、雑音を抑圧するフィルタを計算する。まず、マルチチャネルフィルタ部16のi番目のチャネルのフィルタ161iを周波数領域に変換したものをHi(ω)とし、それを行列にしたものを式(10)に示す
【0079】
【外19】
【0080】
とする。
【0081】
【数10】
【0082】
また、マイクロホンで受音された信号を周波数変換したものを行列にしたのを式(11)に示す
【0083】
【外20】
【0084】
とする。
【0085】
【数11】
【0086】
有音・無音検出部12で有音であった場合に、式(9)の行列を目的音行列
【0087】
【外21】
【0088】
とし、無音であった場合に雑音行列
【0089】
【外22】
【0090】
とする。
【0091】
最適なフィルタは、目的音行列
【0092】
【外23】
【0093】
と雑音行列
【0094】
【外24】
【0095】
をフィルタ
【0096】
【外25】
【0097】
でフィルタリングした信号が所望の信号となっていればよい。所望の信号を、最も目的音が大きなパワーで入力されているマイクロホンで受音した目的音信号XSmax(ω)とすれば、最適なフィルタは式(12)の関係となる。
【0098】
【数12】
【0099】
次に、式(11)を最小二乗解でフィルタ
【0100】
【外26】
【0101】
について解けば、式(13)となる。
【0102】
【数13】
【0103】
ただし、
【0104】
【外27】
【0105】
は、最も目的音が大きなパワーで入力されているマイクロホンを選択するための行列であり、
【0106】
【外28】
【0107】
の対角成分のパワーが最大である行だけが1であり、それ以外はすべて0である。M行1列の行列である。これは式(14)で表される。
【0108】
【数14】
【0109】
cは雑音の抑圧量と、目的音の劣化量を調整する定数であり、これを大きくすれば、雑音の消去量が大きくなり、小さくすれば目的音の劣化量が小さくなる。
【0110】
ここまでで式(13)により、雑音を抑圧する最適なフィルタを求める式を導出した。また、式(13)は、共分散行列記憶部14で記憶されている目的音共分散行列
【0111】
【外29】
【0112】
と雑音共分散行列
【0113】
【外30】
【0114】
のみから求めることができる。
【0115】
式(13)により求められた最適なフィルタは、マルチチャネルフィルタ部16にコピーされ、マイクロホンの受音信号をフィルタリングすることで、雑音を抑圧した目的音を得ることができる。
【0116】
次に、本実施形態の有効性を示すために、図2にシミュレーション結果を示す。マイクロホン、目的音源、雑音源の配置は図3に示すとおりであり、部屋の残響は400msである。このときの目的音源、雑音源からの周波数応答(残響を含む)を図2に示す。この図より雑音は約15dB低減していることがわり、本実施形態が有効であることが確認できる。
【0117】
以上説明したように、本実施形態では、目的音源位置、マイクロホン位置がわからなくても、雑音を抑圧した目的音を得ることができる。さらに、式(13)により直接フィルタを求めることができ、学習の必要がないので、雑音の移動や、目的音の移動等の環境の変動に対して、瞬時に追従することができる。
【0118】
第2の実施形態
図4は本発明の第2の実施形態の収音装置のブロック図である。
【0119】
第2の実施形態は、図1の第1の実施形態に受音位置設定部21と音源位置検出部22と音源位置記憶部23と収音位置設定部24とを追加した例である。
【0120】
受音位置設定部21は、あらかじめ計測したマイクロホン111〜11Mの位置を記憶する。音源位置推定部22は、有音・無音検出部12で有音と検出された場合にマイクロホン111〜11Mで受音された信号と、受音位置設定部21で記憶されているマイクロホンの位置とから音源位置を検出する。検出された音源位置は音源位置記憶部23に記憶される。共分散計算部13は、マイクロホン111〜11Mで受音された受音信号の共分散を求め、それを行列にする。有音・無音検出部12で有音であった場合を、k番目音源の共分散行列
【0121】
【外31】
【0122】
とし、無音であった場合を雑音共分散行列
【0123】
【外32】
【0124】
とする。共分散行列記憶部14は、音源の共分散行列
【0125】
【外33】
【0126】
と雑音共分散行列
【0127】
【外34】
【0128】
を記憶する。次に、収音位置設定部24は、音源位置記憶部23に記憶されている音源位置に、収音したい音源位置と収音したくない音源位置を設定する。設定の方法は、例えば検出された複数の音源位置を画面に表示し、その中から収音したい音源位置と、収音したくない音源位置をユーザが設定するという方法や、あらかじめ収音したい範囲と収音したくない範囲を決めておき、それで判定する方法などがある。次に、フィルタ計算部15は、収音したい音源位置の音を収音し、収音したくない音源位置の音および雑音を抑圧するフィルタを計算する。計算されたフィルタはマルチチャネルフィルタ部16にコピーされ、出力信号が求められる。
【0129】
以下、本実施形態を詳細に説明する。
【0130】
まず、音源位置推定部22(特願2002―223923に記載)は、例えば以下の方法で実現される。
【0131】
M個のマイクロホンがあると想定し、i番目のマイクロホンとj番目のマイクロホンで受音された信号より求められる受音信号間遅延時間差をτijとする。受音信号間遅延時間差は、信号間の相互相関を求め、その最大ピーク位置から求めることができる。次に、m番目の受音位置
【0132】
【外35】
【0133】
、n推定音源位置を
【0134】
【外36】
【0135】
と表す。これらの位置から求められる推定受音信号間遅延時間差
【0136】
【外37】
【0137】
は式(15)で表される。
【0138】
【数15】
【0139】
ただし、cは音速である。
【0140】
次に、受音信号間遅延時間差
【0141】
【外38】
【0142】
に音速cを乗じ、距離に換算したものを、それぞれ受音位置間距離差
【0143】
【外39】
【0144】
とし、測定値
【0145】
【外40】
【0146】
の二乗平均誤差
【0147】
【外41】
【0148】
を求めれば、式(16)となる。
【0149】
【数16】
【0150】
式(16)の二乗平均誤差
【0151】
【外42】
【0152】
を最小化する解を求めれば、受音信号間遅延時間差の測定値と推定値の誤差が最小となる推定音源位置を求めることができる。ただし、式(16)は非線形連立方程式となっており、解析的に解くことは困難であり、ここでは、逐次修正を用いた数値解析により求めることとする。
【0153】
式(16)を最小化する推定音源位置
【0154】
【外43】
【0155】
を求めるには、ある点における勾配を求め、誤差が小さくなる方向に推定音源位置を修正していき、勾配が0となる点を求めればよいので、修正式は式(17)のようになる。
【0156】
【数17】
【0157】
ただし、αは修正のステップサイズ、
【0158】
【外44】
【0159】
は、u回修正後の
【0160】
【外45】
【0161】
を表し、gradは勾配を表し、式(18)〜式(22)で表される。
【0162】
【数18】
【0163】
以上、式(17)を繰り返し計算することで、誤差が最小となる推定音源位置を求めることができる。
【0164】
次に、フィルタ係数計算部15について説明する。
【0165】
まず、共分散行列の求め方については、第1の実施形態と同様であるので説明を省略する。
【0166】
まず、共分散行列記憶部14で記憶されている音源に対する共分散行列を
【0167】
【外46】
【0168】
とし、雑音共分散行列を
【0169】
【外47】
【0170】
とする。音源に対する共分散行列
【0171】
【外48】
【0172】
のうち、収音したい音源に対する共分散行列を
【0173】
【外49】
【0174】
とし、収音したくない音源痛いする共分散行列を
【0175】
【外50】
【0176】
とする。
【0177】
次に、第1の実施形態と同様にしてフィルタ
【0178】
【外51】
【0179】
の最適解を求めれば、式(23)となる。
【0180】
【数19】
【0181】
ただし、
【0182】
【外52】
【0183】
は、最もその音源に近いマイクロホンを選択するための行列であり、音源位置記憶部23で記憶されている音源位置と、受音位置設定部21の受音位置から、マイクロホンと音源間の距離を計算し、その音源に最も近いマイクロホンの行だけが1であり、それ以外はすべて0であるM行1列の行列である。これは、式(24)で表される。
【0184】
【数20】
【0185】
am、bn、cは、それぞれ収音したい音源の劣化量、収音したくない音の抑圧量、雑音の抑圧量を調整する定数であり、amを大きくすれば、収音したい音源の劣化量が減少し、bnを大きくすれば、収音したくない音源の抑圧量が増加し、cを大きくすれば雑音の抑圧量が増加する。
【0186】
ここまでで、雑音を抑圧する最適なフィルタを求める式を導出した。
【0187】
以上説明したように、本実施形態では、マイクロホン位置が既知であれば、任意の音源と雑音を抑圧し、収音したい目的音だけを収音することができる。さらに、式(23)により直接フィルタを求めることができ、学習の必要がないので、雑音の移動や、目的音の移動等の環境の変動に対して、瞬時に追従することができる。
【0188】
これら以外の部分に関しては、第1の実施形態と同じであるので、説明を省略する。
【0189】
第3の実施形態
図5は本発明の第3の実施形態の収音装置のブロック図である。第3の実施形態は、第1の実施形態に音源位置・受音位置検出部31と音源位置・受音位置記憶部32と収音位置設定部24とを追加した例である。
【0190】
音源位置・受音位置検出部31(特願2002―223923に記載)はマイクロホン111〜11Mで受音された信号から音源位置・受音位置を検出する。音源位置、受音位置記憶部32は、音源位置・受音位置検出部31で検出された音源位置・受音位置を記憶する。収音位置設定部24は、音源位置・受音位置記憶部32に記憶されている音源位置に、収音したい音源位置と収音したくない音源位置を設定する。設定の方法は、例えば、検出された複数の音源位置を画面に表示し、その中から収音したい音源位置と、収音したくない音源位置をユーザーが設定するという方法や、あらかじめ収音したい範囲と収音したくない範囲を決めておき、それで判定する方法などがある。次に、フィルタ計算部15では、収音したい音源位置の音を収音し、収音したくない音源位置の音および雑音を抑圧するフィルタを計算する。計算の方法は第2の実施形態と同じであるので省略する。計算されたフィルタはマルチチャネルフィルタ部16にコピーされ、出力信号が求められる。
【0191】
以下に音源位置・受音位置検出の方法の例を示す。
【0192】
M個のマイクロホンとN個の音源があると想定し、k番目音源から音が発せられている場合に、i番目のマイクロホンとj番目のマイクロホンで受音された信号より求められる受音信号間遅延時間差をτijkとする。次に、m番目の推定受音位置を
【0193】
【外53】
【0194】
、n番目の推定音源位置を
【0195】
【外54】
【0196】
と表す。ただし、受音位置および音源位置のすべてが未知であるので、位置を推定する前に、座標の基準位置を設ける必要がある。ここでは、1番目受音位置を原点として、2番目受音位置と3番目受音位置とを通る平面をx−y平面として座標を定義する。このようにすれば、
【0197】
【外55】
【0198】
となり、これらは定数となる。
【0199】
これらの位置から求められる推定受音信号間遅延時間差
【0200】
【外56】
【0201】
は、式(25)で表される。
【0202】
【数21】
【0203】
ただし、cは音速である。
【0204】
次に、受音信号間遅延時間差
【0205】
【外57】
【0206】
に音速cを乗じ、距離に換算したものを、それぞれ受音位置間距離差
【0207】
【外58】
【0208】
とし、測定値
【0209】
【外59】
【0210】
の二乗平均誤差
【0211】
【外60】
【0212】
を求めれば、式(26)となる。
【0213】
【数22】
【0214】
式(26)の二乗平均誤差
【0215】
【外61】
【0216】
を最小化する解を求めれば、受音信号間遅延時間差の測定値と推定値の誤差が最小となる推定受音位置、推定音源位置を求めることができる。ただし、式(26)は非線形連立方程式となっており、解析的に解くことは困難であり、ここでは、逐次修正を用いた数値解析により求めることとする。式(26)を最小化する推定受音位置
【0217】
【外62】
【0218】
と、推定音源位置
【0219】
【外63】
【0220】
を求めるには、ある点における勾配を求め、誤差が小さくなる方向に推定受音位置と推定音源位置を修正していき、勾配が0になる点を求めればよいので、修正式は式(27)のようになる。
【0221】
【数23】
【0222】
ただし、αは修正のステップサイズ
【0223】
【外64】
【0224】
は、u回修正後の
【0225】
【外65】
【0226】
を表し、gradは勾配を表し、式(28)〜(35)で表される。
【0227】
【数24】
【0228】
初期位置を設定し、式(27)の修正式を用いて繰り返し計算することにより、推定受音位置、推定音源位置を求めることができる。
【0229】
以上説明したように、本実施形態では、音源位置、受音位置が未知であっても、任意の音源と雑音を抑圧し、収音したい目的音だけを収音することができる。さらに、学習をせずに直接フィルタを求めることができるので、雑音の移動や、目的音の移動等の環境の変動に対して、瞬時に追従することができる。
【0230】
これら以外の部分に関しては、第1の実施形態または第2の実施形態と同じであるので、説明を省略する。
【0231】
第4の実施形態
図6は本発明の第4の実施形態の収音装置のブロック図である。第4の実施形態は、第1から第3の実施形態において、共分散行列計算部13をFFT部1311〜131Mとスペクトル乗算部132とにより実現する例である。
【0232】
FFT部1311〜131Mは、マイクロホン111〜11Mにより受音された 信号を各々周波数領域に変換する。スペクトル乗算部132は、周波数領域に変換された受音信号をチャネル間で乗算し、共分散行列を求める。
【0233】
共分散行列は式(36)、式(37)により表される。
【0234】
【数25】
【0235】
ただし、Xi(ω)は、i番目のマイクロホンで受音された信号を周波数領域に変換したものであり、Rij(ω)はi番目のマイクロホンで受音された信号とj番目マイクロホンで受音された信号の共分散であり、*は共役を表す。
【0236】
以上により、共分散行列を求めることができる。
【0237】
これら以外の部分に関しては、第1から第3の実施形態と同じであるので、説明を省略する。
【0238】
第5の実施形態
図7は本発明の第5の実施形態の収音装置のブロック図である。第5の実施形態は、第1から第3の実施形態において、共分散行列計算部13をFFT部1311〜131Mとスペクトル乗算部132と白色化部133とにより実現する例である。
【0239】
FFT部1311〜131Mは、マイクロホン111〜11Mにより受音された信号を各々周波数領域に変換する。スペクトル乗算部132は、周波数領域に変換された受音信号をチャネル間で乗算し、共分散行列を求める。白色化部133は、共分散行列を周波数領域で白色化(フラット)にする。
【0240】
白色化された共分散行列は式(38)、式(39)により表される。
【0241】
【数26】
【0242】
ただし、Xi(ω)は、i番目マイクロホンで受音された信号を周波数領域に変換したものであり、
【0243】
【外66】
【0244】
はi番目のマイクロホンで受音された信号とj番目のマイクロホンで受音された信号の共分散を白色化したものであり、RKK(ω)は、白色化前の共分散行列の対角成分のうち最もパワーの大きい対角成分、または、その音源と最も近いマイクロホンに対応する共分散行列の対角成分であり、*は共役を表す。
【0245】
以上により、白色化された共分散行列を求めることができる。これにより、音源や雑音の周波数特性に依存しないフィルタの計算ができ、音源や雑音の周波数特性が変化してもフィルタが変化しない安定した収音が行える。
【0246】
これら以外の部分に関しては、第1から第3の実施形態と同じであるので、説明を省略する。
【0247】
第6の実施形態
図8は本発明の第6の実施形態の収音装置のブロック図である。第6の実施形態は、第1から第3の実施形態において、共分散行列計算部13をFFT部1311〜131Mとスペクトル乗算部132と雑音共分散記憶部134と減算部135と白色化部133とにより実現した例である。
【0248】
FFT部1311〜131Mは、マイクロホン111〜11Mにより受音された信号を各々周波数領域に変換する。スペクトル乗算部132は、周波数領域に変換された受音信号をチャネル間で乗算し、共分散行列を求める。雑音共分散記憶部134は雑音区間の共分散行列を記憶する。減算部135は、有音区間の共分散行列から、記憶された雑音共分散行列を減算する。白色化部133は、減算器出力の共分散行列を周波数領域で白色化(フラット)にする。
【0249】
これにより、音源に対する共分散行列の雑音成分を除去することができ、音源に対する共分散行列を正確に求めることができる。また、白色化により、音源や雑音の周波数特性に依存しないフィルタの計算ができ、音源や雑音の周波数特性が変化してもフィルタが変化しない安定した収音が行える。
【0250】
これら以外の部分に関しては、第1から第3の実施形態と同じであるので、説明を省略する。
【0251】
なお、以上説明した本発明の収音方法は専用のハードウェアにより実現されるもの以外に、その機能を実現するためのプログラムを、コンピュータ読み取り可能な記録媒体に記録して、この記録媒体に記録されたプログラムをコンピュータシステムに読み込ませ、実行するものであってもよい。コンピュータ読み取り可能な記録媒体とは、フロッピーディスク、光磁気ディスク、CD−ROM等の記録媒体、コンピュータシステムに内蔵されるハードディスク装置等の記憶装置を指す。さらに、コンピュータ読み取り可能な記録媒体は、インターネットを介してプログラムを送信する場合のように、短時間の間、動的にプログラムを保持するもの(伝送媒体もしくは伝送波)、その場合のサーバとなるコンピュータシステム内部の揮発性メモリのように、一定時間プログラムを保持しているものも含む。
【0252】
【発明の効果】
以上説明したように、本発明によれば、有音・無音判定を行い、有音時のチャネル間(入力信号の)共分散と無音時のチャネル間(入力信号の)共分散に基づきチャネルごとのフィルタを算出し、このフィルタにより各チャネル入力信号をフィルタリングすることにより、雑音、収音したくない音源の信号を抑圧し、収音したい音源の信号を収音することが可能となる。
【図面の簡単な説明】
【図1】本発明の第1の実施形態の収音装置を示すブロック図である。
【図2】本発明のシミュレーション結果を示す図である。
【図3】マイクロホン、目的音源、雑音源の配置図である。
【図4】本発明の第2の実施形態の収音装置を示すブロック図である。
【図5】本発明の第3の実施形態の収音装置を示すブロック図である。
【図6】本発明の第4の実施形態の収音装置を示すブロック図である。
【図7】本発明の第5の実施形態の収音装置を示すブロック図である。
【図8】本発明の第6の実施形態の収音装置を示すブロック図である。
【図9】従来例の収音装置を示すブロック図である。
【図10】図8の従来の収音装置における収束特性を示す図である。
【符号の説明】
111〜11M マイクロホン
12 有音・無音検出部
13 共分散行列計算部
14 共分散行列記憶部
15 フィルタ計算部
16 マルチチャネルフィルタ部
21 受音位置設定部
22 音源位置検出部
23 音源位置記憶部
24 収音位置設定部
31 音源位置・受音位置検出部
32 音源位置・受音位置記憶部
1311〜131M FFT部
132 スペクトル乗算部
133 白色化部
134 雑音共分散記憶部
135 減算部
1611〜161M フィルタ
162 加算器部
Claims (8)
- 複数の収音手段の各々で受音された受音信号から有音、無音を検出する有音・無音検出段階と、
前記収音手段の各々で受音された受音信号からチャネル間の共分散を算出する共分散計算段階と、
有音と判定された場合の前記共分散を有音分散として、無音と判定された場合の前記共分散を無音共分散として記憶手段に逐次記憶する共分散記憶段階と、
前記記憶された有音共分散と無音共分散に基づき、入力音声のパワーが最も大きいチャネルのフィルタ係数を算出するフィルタ計算段階と、
前記フィルタ係数で前記チャネルの信号をフィルタリングするフィルタリング段階とを有する収音方法。 - 複数の収音手段の各々で受音された受音信号から有音、無音を検出する有音・無音検出手段と、
前記収音手段の各々で受音された受音信号からチャネル間の共分散を算出する共分散計算手段と、
有音と判定された場合の前記共分散を有音共分散として、無音と判定された場合の前記共分散を無音共分散として記憶手段に逐次記憶する共分散記憶手段と、
前記記憶された有音共分散と無音共分散に基づき、入力音声のパワーが最も大きいチャネルのフィルタ係数を算出するフィルタ計算手段と、
前記フィルタ係数で前記チャネルの信号をフィルタリングするフィルタ手段とを有する収音装置。 - 複数の収音手段の各々で受音された受音信号から有音、無音を検出する有音・無音検出手段と、
前記収音手段の位置を記憶する受音位置設定手段と、
前記有音・無音検出手段の検出結果が有音である場合に、前記収音手段の各々で受音された受音信号と、受音位置設定手段で設定された受音位置とから音源位置を検出する音源位置検出手段と、
前記音源位置検出手段で検出された音源位置を記憶する音源位置記憶手段と、
前記音源位置記憶手段に記憶されている音源位置から、収音したい音源位置と、収音したくない音源位置を設定する収音位置設定手段と、
前記収音手段の各々で受音された受音信号からチャネル間の共分散を算出する共分散計算手段と、
有音と判定された場合の前記共分散を前記各音源位置ごとに有音共分散として、無音と判定された場合の前記共分散を無音共分散として記憶手段に逐次記憶する共分散記憶手段と、
前記記憶された有音共分散と無音共分散に基づき、収音したい音源位置のそれぞれに最も近い収音手段に対応するチャネルのフィルタ係数を算出するフィルタ計算手段と、
前記フィルタ係数で前記チャネルの信号をフィルタリングするフィルタ手段とを有する収音装置。 - 複数の収音手段の各々で受音された受音信号から有音、無音を検出する有音・無音検出手段と、
前記有音・無音検出手段の検出結果が有音である場合に、前記収音手段の各々で受音された受音信号から音源位置と受音位置を検出する音源位置・受音位置検出手段と、
前記音源位置・受音位置検出手段で検出された音源位置と受音位置を記憶する音源位置・受音位置記憶手段と、
前記音源位置・受音位置記憶手段で記憶されている音源位置から、収音したい音源位置と、収音したくない音源位置を設定する収音位置設定手段と、
前記収音手段の各々で受音された受音信号からチャネル間の共分散を算出する共分散行列計算手段と、
有音と判定された場合の前記共分散を前記各音源位置ごとに有音共分散として、無音と判定された場合の前記共分散を無音共分散として記憶手段に逐次記憶する共分散記憶手段と、
前記記憶された有音共分散と無音共分散に基づき、収音したい音源位置のそれぞれに最も近い収音手段に対応するチャネルのフィルタ係数を算出するフィルタ計算手段と、
前記フィルタ係数で前記チャネルの受音信号をフィルタリングするフィルタ手段とを有する収音装置。 - 前記共分散計算手段が、
複数の収音手段の各々で受音された受音信号を周波数領域に変換するFFT手段と、
周波数領域に変換された信号の各々を周波数成分ごとに乗算し、共分散行列を求めるスペクトル乗算手段とを含む、請求項2から4のいずれか1項に記載の収音装置。 - 前記共分散計算手段が、
複数の収音手段の各々で受音された受音信号を周波数領域に変換するFFT手段と、
周波数領域に変換された信号の各々を周波数成分ごとに乗算し、共分散行列を求めるスペクトル乗算手段と、
前記共分散行列のうち、対角成分で最もパワーの大きい対角成分、またはその音源に最も近い収音手段に対応する対角成分の周波数特性がフラットとなるようなゲインを、周波数成分ごとに行列に乗算する白色化手段とを含む、請求項2から4のいずれか1項に記載の収音装置。 - 前記共分散計算手段が、
複数の収音手段の各々で受音された受音信号を周波数領域に変換するFFT手段と、
周波数領域に変換された信号の各々を周波数成分ごとに乗算し、共分散行列を求めるスペクトル乗算手段と、
前記有音・無音区間検出手段で無音が検出された場合に、前記共分散行列を時間平均し記憶する雑音共分散記憶手段と、
前記有音・無音検出手段で有音が検出された場合に、前記共分散行列から、前記雑音共分散記憶手段で記憶されている雑音の共分散行列を減算する減算手段と、
前記減算手段の出力である共分散行列のうち、対角成分で最もパワーの大きい対角成分、またはその音源に最も近い収音手段に対応する対角成分の周波数特性がフラットとなるようなゲインを周波数成分ごとに行列に乗算する白色化部とを含む、請求項2から4のいずれか1項に記載の収音装置。 - 複数の収音手段の各々で受音された受音信号から有音、無音を検出する有音・無音検出手順と、
前記収音手段の各々で受音された受音信号からチャネル間の共分散を算出する共分散計算手順と、
有音と判定された場合の前記共分散を有音共分散として、無音と判定された場合の前記共分散を無音共分散として記憶手段に逐次記憶する共分散記憶手順と、
前記で記憶された有音共分散と無音共分散に基づき、入力音声のパワーが最も大きいチャネルのフィルタ係数を算出するフィルタ計算手順と、
前記フィルタ係数で前記チャネルの信号をフィルタリングするフィルタリング手順とをコンピュータに実行させるための収音プログラム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002240986A JP3878892B2 (ja) | 2002-08-21 | 2002-08-21 | 収音方法、収音装置、および収音プログラム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2002240986A JP3878892B2 (ja) | 2002-08-21 | 2002-08-21 | 収音方法、収音装置、および収音プログラム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2004078021A true JP2004078021A (ja) | 2004-03-11 |
JP3878892B2 JP3878892B2 (ja) | 2007-02-07 |
Family
ID=32023615
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2002240986A Expired - Lifetime JP3878892B2 (ja) | 2002-08-21 | 2002-08-21 | 収音方法、収音装置、および収音プログラム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP3878892B2 (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005136709A (ja) * | 2003-10-30 | 2005-05-26 | Nippon Telegr & Teleph Corp <Ntt> | 収音方法、装置、プログラム、および記録媒体 |
WO2006064699A1 (ja) * | 2004-12-17 | 2006-06-22 | Waseda University | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
JP2009037032A (ja) * | 2007-08-02 | 2009-02-19 | Nippon Telegr & Teleph Corp <Ntt> | 信号抽出装置、その方法、およびそのプログラム |
JPWO2008004499A1 (ja) * | 2006-07-03 | 2009-12-03 | 日本電気株式会社 | 雑音抑圧の方法、装置、及びプログラム |
JP2010054728A (ja) * | 2008-08-27 | 2010-03-11 | Hitachi Ltd | 音源抽出装置 |
JP2010114829A (ja) * | 2008-11-10 | 2010-05-20 | Yamaha Corp | 信号処理装置およびプログラム |
WO2011004503A1 (ja) * | 2009-07-08 | 2011-01-13 | 株式会社日立製作所 | 雑音除去装置及び雑音除去方法 |
US8271110B2 (en) | 2005-02-28 | 2012-09-18 | Nec Corporation | Sound source supply apparatus and sound source supply method |
US10094862B2 (en) | 2016-08-30 | 2018-10-09 | Fujitsu Limited | Sound processing device and sound processing method |
WO2020026726A1 (ja) | 2018-08-02 | 2020-02-06 | 日本電信電話株式会社 | 集音拡声装置、その方法、およびプログラム |
WO2020027061A1 (ja) | 2018-08-02 | 2020-02-06 | 日本電信電話株式会社 | 会話サポートシステム、その方法、およびプログラム |
CN115881151A (zh) * | 2023-01-04 | 2023-03-31 | 广州市森锐科技股份有限公司 | 一种基于高拍仪的双向拾音消噪方法、装置、设备及介质 |
-
2002
- 2002-08-21 JP JP2002240986A patent/JP3878892B2/ja not_active Expired - Lifetime
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005136709A (ja) * | 2003-10-30 | 2005-05-26 | Nippon Telegr & Teleph Corp <Ntt> | 収音方法、装置、プログラム、および記録媒体 |
WO2006064699A1 (ja) * | 2004-12-17 | 2006-06-22 | Waseda University | 音源分離システムおよび音源分離方法、並びに音響信号取得装置 |
US8213633B2 (en) | 2004-12-17 | 2012-07-03 | Waseda University | Sound source separation system, sound source separation method, and acoustic signal acquisition device |
US8271110B2 (en) | 2005-02-28 | 2012-09-18 | Nec Corporation | Sound source supply apparatus and sound source supply method |
JPWO2008004499A1 (ja) * | 2006-07-03 | 2009-12-03 | 日本電気株式会社 | 雑音抑圧の方法、装置、及びプログラム |
US10811026B2 (en) | 2006-07-03 | 2020-10-20 | Nec Corporation | Noise suppression method, device, and program |
JP5435204B2 (ja) * | 2006-07-03 | 2014-03-05 | 日本電気株式会社 | 雑音抑圧の方法、装置、及びプログラム |
JP2009037032A (ja) * | 2007-08-02 | 2009-02-19 | Nippon Telegr & Teleph Corp <Ntt> | 信号抽出装置、その方法、およびそのプログラム |
JP2010054728A (ja) * | 2008-08-27 | 2010-03-11 | Hitachi Ltd | 音源抽出装置 |
JP2010114829A (ja) * | 2008-11-10 | 2010-05-20 | Yamaha Corp | 信号処理装置およびプログラム |
JP5382745B2 (ja) * | 2009-07-08 | 2014-01-08 | 株式会社日立製作所 | 雑音除去装置及び雑音除去方法 |
WO2011004503A1 (ja) * | 2009-07-08 | 2011-01-13 | 株式会社日立製作所 | 雑音除去装置及び雑音除去方法 |
US10094862B2 (en) | 2016-08-30 | 2018-10-09 | Fujitsu Limited | Sound processing device and sound processing method |
WO2020026726A1 (ja) | 2018-08-02 | 2020-02-06 | 日本電信電話株式会社 | 集音拡声装置、その方法、およびプログラム |
WO2020027061A1 (ja) | 2018-08-02 | 2020-02-06 | 日本電信電話株式会社 | 会話サポートシステム、その方法、およびプログラム |
CN115881151A (zh) * | 2023-01-04 | 2023-03-31 | 广州市森锐科技股份有限公司 | 一种基于高拍仪的双向拾音消噪方法、装置、设备及介质 |
Also Published As
Publication number | Publication date |
---|---|
JP3878892B2 (ja) | 2007-02-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9210504B2 (en) | Processing audio signals | |
JP4104626B2 (ja) | 収音方法及び収音装置 | |
US8824693B2 (en) | Processing audio signals | |
CN1926911B (zh) | 啸叫抑制装置、程序、集成电路及啸叫抑制方法 | |
US8238569B2 (en) | Method, medium, and apparatus for extracting target sound from mixed sound | |
US20170140771A1 (en) | Information processing apparatus, information processing method, and computer program product | |
JP6019969B2 (ja) | 音響処理装置 | |
JP5919516B2 (ja) | 多入力雑音抑圧装置、多入力雑音抑圧方法、プログラムおよび集積回路 | |
JP4532576B2 (ja) | 処理装置、音声認識装置、音声認識システム、音声認識方法、及び音声認識プログラム | |
US20070088544A1 (en) | Calibration based beamforming, non-linear adaptive filtering, and multi-sensor headset | |
JP2010232717A (ja) | 受音信号処理装置、方法およびプログラム | |
KR101581885B1 (ko) | 복소 스펙트럼 잡음 제거 장치 및 방법 | |
CN111048061B (zh) | 回声消除滤波器的步长获取方法、装置及设备 | |
GB2571371A (en) | Signal processing for speech dereverberation | |
JP2004078021A (ja) | 収音方法、収音装置、および収音プログラム | |
JP4422662B2 (ja) | 音源位置・受音位置推定方法、その装置、そのプログラム、およびその記録媒体 | |
US11039242B2 (en) | Audio capture using beamforming | |
JP4119328B2 (ja) | 収音方法、その装置、そのプログラム、およびその記録媒体。 | |
JPH09261792A (ja) | 受音方法及びその装置 | |
JP3756828B2 (ja) | 反響消去方法、この方法を実施する装置、プログラムおよびその記録媒体 | |
JP2003309493A (ja) | 反響低減方法、反響低減装置、反響低減プログラム | |
JP4051325B2 (ja) | 話者位置検出方法、装置、プログラム、および記録媒体 | |
JP4478045B2 (ja) | エコー消去装置、エコー消去方法、エコー消去プログラムおよびその記録媒体 | |
CN113611322A (zh) | 一种语音信号去混响方法及装置 | |
JP2014150368A (ja) | エコー抑圧ゲイン推定方法とそれを用いたエコー消去装置とプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20040729 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20040729 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20040729 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20050614 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20050914 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20051114 |
|
RD03 | Notification of appointment of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7423 Effective date: 20051114 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20061031 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20061106 |
|
R150 | Certificate of patent or registration of utility model |
Free format text: JAPANESE INTERMEDIATE CODE: R150 Ref document number: 3878892 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101110 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101110 Year of fee payment: 4 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111110 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111110 Year of fee payment: 5 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121110 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20121110 Year of fee payment: 6 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20131110 Year of fee payment: 7 |
|
S531 | Written request for registration of change of domicile |
Free format text: JAPANESE INTERMEDIATE CODE: R313531 |
|
R350 | Written notification of registration of transfer |
Free format text: JAPANESE INTERMEDIATE CODE: R350 |
|
EXPY | Cancellation because of completion of term |