JP3583980B2 - Sound collecting device and receiving device - Google Patents

Sound collecting device and receiving device Download PDF

Info

Publication number
JP3583980B2
JP3583980B2 JP2000247172A JP2000247172A JP3583980B2 JP 3583980 B2 JP3583980 B2 JP 3583980B2 JP 2000247172 A JP2000247172 A JP 2000247172A JP 2000247172 A JP2000247172 A JP 2000247172A JP 3583980 B2 JP3583980 B2 JP 3583980B2
Authority
JP
Japan
Prior art keywords
sound
channel
inverse filter
signal
target
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2000247172A
Other languages
Japanese (ja)
Other versions
JP2002062900A (en
Inventor
賢一 古家
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2000247172A priority Critical patent/JP3583980B2/en
Publication of JP2002062900A publication Critical patent/JP2002062900A/en
Application granted granted Critical
Publication of JP3583980B2 publication Critical patent/JP3583980B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

【0001】
【発明の属する技術分野】
本発明は、複数のマイクロホンを用いて目的の音声を良好に収録するための収音装置及び複数のアンテナを用いて目的の発信源の電波を良好に受信するための受信装置に関する。
【0002】
【従来の技術】
近年、マルチメディア技術の進歩に伴い、マイクロホンとスピーカを用いた拡声通話形態によるテレビ会議などの通信会議が普及してきている。その場合、机上に話者数分のマイクロホンを設置することなく、マイクロホンを意識しない自然な通話が可能で、かつ音声品質を劣化させる騒音や残響音を抑圧し目的とする音声のみを収音する収音装置が求められている。
【0003】
そのような従来技術の一つとして、MINT(Multiple−Input/Output Inverse Filtering Theorem)法がある。(M.Miyoshi and Y.Yamada,”Inverse Filtering of Room acoustics,”IEEE Trans.Acoust,Speech Signal Process,vol.ASSP−36,no2,pp.145−152,Feb.1988.)
図1は、MINT法による目的音抽出の原理を説明する図である。
図1において、1〜1はマイクロホン(Nはマイクロホン数)、2〜2はフィルタ(Nはフィルタ数)、3は加算器、7はスピーカ、8は測定用信号発生部、9はインパルス応答計算部、10は逆フィルタ計算部、6は目的音源、6〜6(Mは音源数)は騒音源である。
【0004】
MINT法では、まず、スピーカ7を目的音源6の位置に設置して測定用信号発生部8より発生される測定用信号を出力し、各マイクロホン1〜1で収録し、インパルス応答計算部9で収録された音と測定用信号とスピーカ位置から各マイクロホンまでのインパルス応答を計算する。次に、騒音源6〜6の位置にスピーカを設置して、同様にインパルス応答を測定する。
次に、それらインパルス応答から逆フィルタ計算部において次式の連立方程式を解いて逆フィルタを計算する。
Hc=b (1)
【0005】
【数1】

Figure 0003583980
Hはインパルス応答畳み込み行列、Hmnは第m番目の音源から第n番目のマイクロホン1までのインパルス応答畳み込み行列、cは逆フィルタ係数ベクトル、cは第n番目の逆フィルタ係数ベクトル、bは目的インパルス応答係数ベクトル、hmn(k)は第m番目の音源6から第n番目のマイクロホン1までのインパルス応答係数、c(l)は第n番目の逆フィルタ係数、Mは音源数、Nはマイクロホン数、Kはインパルス応答タップ数、Lは逆フィルタタップ数、m=1,・・・,M、n=1,・・・,Nである。
【0006】
式(1)において、インパルス応答畳み込み行列Hと目的インパルス応答係数ベクトルbを与えて、連立一次方程式を解き、逆フィルタ係数ベクトルcを計算することにより逆フィルタ係数c(l)を求める。
式(1)の連立一次方程式が解けるためには、MINT理論から次の条件が成り立っていなければならない。
N≧M+1 (2)
【0007】
【数2】
Figure 0003583980
求めた逆フィルタ係数をフィルタ2〜2に転送して、マイクロホン1からの信号に畳み込み、それら出力を加算器3において全て加算し、その結果を最終的な出力として出力する。
【0008】
この出力は、騒音および残響音を抑圧し、目的音のみを抽出したものになっている。
また、一般の受信装置においては不要電波の抑圧手段を特に備えていない。
【0009】
【発明が解決しようとする課題】
MINT法では、事前に音源からマイクロホンまでのインパルス応答を測定しておく必要がある。しかし、テレビ会議など目的音源を高品質に収音したい場合、音源(目的音源、騒音源)の位置にスピーカを設置してインパルス応答を測定することは非常に困難であるという問題点があった。また、従来の受信装置においては、雑音電波、反射電波の抑圧して目的とする電波を受信することが困難であった。
【0010】
本発明の目的は、インパルス応答の事前測定が必要ない収音装置、及び雑音電波、反射電波を抑圧して目的とする電波を受信する受信装置を提供することにある。
【0011】
【課題を解決するための手段】
上記課題を解決するため、本発明では以下のような手段を有する。
請求項1の発明は、複数のマイクロホンで収録された音響信号を各々独立なフィルタを通し、加算して収音信号を得る収音装置として実現される。
該装置は複数のマイクロホンと、前記複数マイクロホンからの信号間の相関関数を計算する相関関数計算部と、前記相関関数計算部で計算された相関関数を用いて逆フィルタを計算するブラインド逆フィルタ計算部と、前記複数マイクロホンからの信号を、前記ブラインド逆フィルタ計算部で計算された逆フィルタ係数でフィルタリングするフィルタ部と、前記フィルタ部の出力を加算する加算器を具備し、前記複数マイクロホンからの信号間の相関関数のみから逆フィルタ係数を計算することを、特徴とする。
【0012】
従来の技術とは、逆フィルタ係数を計算するのに音源からマイクロホンまでのインパルス応答を用いない点が異なる。
次に、相関関数のみから逆フィルタ係数を計算する原理について述べる。
MINT法において、式(1)の連立一次方程式を解く上で、音源からマイクロホンまでのインパルス応答が分かっていなければ、インパルス応答行列Hが分からず逆フィルタ係数ベクトルcについて解くことができない。ここに、MINT法の欠点がある。
【0013】
本発明では、式(1)をそのまま計算するのではなく、次のように式を変形して考える。
まず、式(1)の両辺にHを左側からかける。
Hc=H b (4)
ここで、HはMINT理論によれば、式(2)、式(3)が成り立ち、各インパルス応答の零点が重ならなければ、正則である。したがって、その転置行列Hも正則であり、式(4)の解は、式(1)の解と等しくなる。
【0014】
次に、H HをR’とおくと式(4)は、
R’ c=H b (5)
ここで、
【0015】
【数3】
Figure 0003583980
であり、
【0016】
【数4】
Figure 0003583980
である。
また、各マイクロホン1からの信号をそれぞれx(r)とすると、各チャネル間の相関関数は、
【0017】
【数5】
Figure 0003583980
となる。ここで、
【0018】
【数6】
Figure 0003583980
であり、s(r)は第m番目の音源の原信号であることを用いてrij(p)を書き直すと、
【0019】
【数7】
Figure 0003583980
となる。ここで、
【0020】
【数8】
Figure 0003583980
であり、第m番目の音源の自己相関関数を表す。
ここで、音源の自己相関関数をデルタ関数で近似できるとすると、
【0021】
【数9】
Figure 0003583980
となる。
(なお、上記では音源の自己相関関数をデルタ関数で近似されることを仮定したが、その近似が成立したとみなされない場合、音源の自己相関関数はインパルス応答の一部として計算される。つまり、処理された出力信号として音源の自己相関関数の逆フィルタがかけられ白色化されたものが得られる。音源の自己相関は各チャネルに共通にかかるが、自己相関関数は零位相なので周波数軸上に零点が無い限り安定に逆フィルタが求まる。)
したがって、Rを
【0022】
【数10】
Figure 0003583980
とすると、式(5)は次式のようになる。
【0023】
Rc=H b (8)
次に、右辺は
【0024】
【数11】
Figure 0003583980
から、次式となることがわかる。
【0025】
b=d’ (9)
ここで、
【0026】
【数12】
Figure 0003583980
である。
【0027】
第n:closest番目のマイクロホンに目的音源6に最も近く最初に音が届くとすると
Figure 0003583980
となる。
したがって、式(9)は、
Figure 0003583980
【0028】
【数13】
Figure 0003583980
となる。ここで、
Figure 0003583980
である。
【0029】
式(8)と式(10)より、
Rc=h1n:closest(0)d (11)
となる。さらに、
Rc’=d (12)
とかける。ここで、
【0030】
【数14】
Figure 0003583980
である。
c’は、真の逆フィルタ係数ベクトルcのスカラー倍されたものであるが、出力結果のスカラー倍は重要ではないので、c’が計算されれば十分である。
【0031】
したがって、式(12)の連立一次方程式を解くことにより、スカラー倍を除き等価的に式(1)の連立一次方程式の解、つまり逆フィルタ係数ベクトルを求めることができる。
目的音源に最も近いマイクロホンがどれかを設定するには次の方法が考えられる。
(a)使用者が目的音源に近い場所にn:closest番目のマイクロホンを設置する。
(b)すでに設置しているマイクロホンの中で、最も近い目的音源に近いマイクロホンをn:closest番目とする。
(c)全てのマイクロホンにについて n:closest番目であると仮定して処理し、処理結果から使用者が聞くかあるいは機械的な認識手段でどのマイクロホンをn:closest番目にした場合に目的音源が出力されているか判断して、そのマイクロホンをn:closest番目とする。
(d)一般の音源位置検出手段を用いて、目的音源の位置を検出し、マイクロホンとの位置関係からn:closest番目のマイクロホンを設定する。
【0032】
式(12)において、Rは複数マイクロホンの出力信号間の相関関数から計算でき、dは音源と最も近いマイクロホンの位置関係からわかるので音源から各マイクロホンまでのインパルス応答を使わずに逆フィルタ係数ベクトルを計算できる。
また、請求項6の発明は、請求項1の発明において、音声を電波に、マイクロホンを受信アンテナに、ブラインド収音装置をブラインド受信装置にそれぞれ置き換えたものであり、動作は請求項1の発明と同様である。
(作用)
前記請求項1の発明では、逆フィルタ係数は音源から前記複数マイクロホンまでのインパルス応答を用いずに、前記複数マイクロホンの信号間の相関関数を用いて逆フィルタ係数を計算するので、事前に音源から前記複数マイクロホンまでのインパルス応答を測定する必要がない。したがって、事前に音源(目的音源、騒音源)の位置にスピーカを設置してインパルス応答を測定する必要がなくなり、本発明の目的であるインパルス応答の事前測定が必要ない収音装置が可能となる。
【0033】
また、前記請求項6の発明では、雑音電波、反射電波を抑制して目的とする電波を受信することができる。
【0034】
【発明の実施の形態】
(実施例1)
以下、図面を参照しながら、本発明の実施例について説明する。
図2は、本発明にかかる収音装置の第1の実施例である。
〜1はマイクロホン(Nはマイクロホン数)、2〜2はフィルタ、3は加算器、4は相関関数計算部、5はブラインド逆フィルタ計算部、6は目的音源、6〜6は騒音源である。これを動作するには、まず、マイクロホン1〜1で騒音の鳴っている環境で目的音を収録する。収録された各マイクロホンからの信号をそれぞれx(r)〜x(r)とする。
【0035】
次に、相関関数計算部4において各マイクロホン1で収録された信号x(r)〜x(r)の間の相関関数r11(p),r12(p),・・・,r1N(p),r21(p),・・・,r2N(p),・・・,rN1(p),・・・rNN(p)を計算する。ここで、
【0036】
【数15】
Figure 0003583980
である。
次に、ブラインド逆フィルタ計算部5において、次式の連立一次方程式を解くことにより逆フィルタを計算する。
Rc=d (13)
ここで、
【0037】
【数16】
Figure 0003583980
ここで、Rはチャネル間相関関数行列(Rijはi番目のマイクロホン1とj番目のマイクロホン1の相関関数行列)、cは逆フィルタ係数ベクトル(cは第n番目の逆フィルタ係数ベクトル)、dはブラインド目的インパルス応答係数ベクトル(dは第n番目のブラインド目的インパルス応答ベクトル)、c(l)は第n番目の逆フィルタ係数、Mは音源数、Kはインパルス応答タップ数、Nはマイクロホン数、Lは逆フィルタタップ数である。
【0038】
δは、目的音源6がマイクロホンの中で第n番目のマイクロホン1に最も近いときに1となり、それ以外は0とする。
式(4)においてチャネル間相関関数行列Rとブラインド目的インパルス応答係数ベクトルdを与えて、連立一次方程式を解き、逆フィルタ係数ベクトルcを計算することにより逆フィルタ係数c(l)を求める。
式(4)の連立一次方程式が解けるためには、MINT理論と同様の条件が成り立っていなければならない。
N≧M+1 (2)
【0039】
【数17】
Figure 0003583980
求めた逆フィルタ係数をフィルタ部2〜2に転送し、フィルタ部で各マイクロホン1からの信号x(r)に畳み込み、その出力y(r)を加算器3において全て加算し、その結果を最終的な出力w(r)として出力する。
【0040】
この出力w(r)は、騒音および残響音を抑圧し、目的音のみを抽出したものになっている。
次に、実際の部屋を模擬したシュミレーション結果について説明する。
図3は、実験系の図であり、N=3,M=2の場合である。目的音源は、男性音声をスピーカから再生したもの、騒音源は白色雑音をスピーカから再生したものである。
【0041】
図4(a)はマイクロホン1の処理前の信号であり、図4(b)はブラインド収音装置で処理後の出力結果である。見て分かるように、処理後ははっきりと音声のみが抽出できていることがわかる。
図5(a)は目的音源からマイクロホン1までの処理前のインパルス応答であり、図5(b)はブラインド収音装置で処理後のインパルス応答である。数百タップ付近の初期反射音が図5(b)で小さくなっており、残響音を抑圧できていることがわかる。
【0042】
このように、該装置では各マイクロホンからの信号間の相関関数を用いて逆フィルタを計算しているので、音源からマイクロホンまでのインパルス応答を用いずに、逆フィルタ係数を計算することが可能であり、従来技術に比べて事前にインパルス応答を測定する必要がなく、簡易に設置可能となった。
(実施例2)
図6は、本発明にかかる収音装置の第2の実施例である。
【0043】
〜1はマイクロホン(Nはマイクロホン数)、6は目的音源、6〜6は騒音源、7はスピーカ、11はアンプ、101はブラインド収音装置である。
第2の実施例は、本発明を場内拡声に利用した場合である。目的音源から発せられた音は、本発明により騒音と分離され、また残響音を抑圧されて収音される。収音された音をアンプ11で増幅し、スピーカ7から拡声する。ここで、拡声された音は再びマイクロホンに入るが、目的音よりも遅れて到達する相関の大きな音なので本発明により残響の一部として取り除かれ、通常、場内拡声系で生じる音のループにより生じるハウリングが抑圧される。このように、第2の実施例では騒音、残響を抑圧するだけでなく、場内拡声系で生じるハウリングも押さえる効果がある。
(実施例3)
図7は、本発明にかかる収音装置の第3の実施例である。
【0044】
〜1はマイクロホン(Nはマイクロホン数)、6は目的音源、6〜6は騒音源、7はスピーカ、11はアンプ、101はブラインド収音装置である。
第3の実施例は、本発明を拡声通話系に利用した場合である。目的音源から発せられた音は、本発明により騒音と分離され、また残響音が抑圧されて収音され、送話信号として通信相手に送られる。また、受話信号はアンプで増幅されスピーカから拡声され、再びマイクロホンに入るが、目的音とは相関のない相手側の音なので、本発明により、騒音の一部として取り除かれ、通常、音響エコーとして相手側に帰ってしまう音を取り除くことができる。このように、第3の実施例では騒音、残響を抑圧するだけでなく、拡声通話系で生じる音響エコーを押さえる効果がある。
(実施例4)
図8は本発明にかかる収音装置の第4の実施例である。
【0045】
13〜13は受信アンテナ、12は目的発信源、12〜12は雑音電波源、102はブラインド受信装置である。第4の実施例は、本発明を歪なく、目的電波を受信することに利用した場合である。基本的には、実施例1において、音を電波に、マイクロホンを受信アンテナに置き換えたものである。目的発信源からの電波は、受信アンテナで受信されブラインド受信装置で雑音電波信号、反射電波が取り除かれ目的電波を得ることができる。このように、第4の実施例では、騒音、残響音の抑圧だけでなく、電波受信における雑音電波、反射電波を抑圧する効果もある。
【0046】
【発明の効果】
以上説明したように、本発明では各マイクロホンからの信号間の相関関数を用いて逆フィルタを計算しているので、音源からマイクロホンまでのインパルス応答を用いずに、逆フィルタ係数を計算することが可能であり、従来技術に比べて事前にインパルス応答を測定する必要がなく、簡易に設置することが可能となった。また、本発明では雑音電波、反射電波を抑圧して目的電波を受信できる。
【図面の簡単な説明】
【図1】従来技術であるMINT収音装置の構成図。
【図2】本発明の第1実施例である収音装置の構成図。
【図3】本発明を用いて実験をおこなった際の実験系を説明する図。
【図4】実験の結果として音声の抽出を示す図であり、(a)は処理前、(b)は処理後を示す。
【図5】実験の結果として残響音の抑圧を示す図であり、(a)は処理前、(b)は処理後を示す。
【図6】本発明の第2の実施例である収音装置の構成図。
【図7】本発明の第3の実施例である収音装置の構成図。
【図8】本発明の第4の実施例である受信装置の構成図。
【符号の説明】
〜1 マイクロホン
〜2 フィルタ
3 加算器
4 相関関数計算部
5 ブラインド逆フィルタ計算部
目的音源
〜6 騒音源
7 スピーカ
8 測定用信号発生部
9 インパルス応答計算部
10 逆フィルタ計算部
11 アンプ
12 目的発信源
12〜12 雑音電波源
13〜13 受信アンテナ
100 MINT収音装置
101 ブラインド収音装置
102 ブラインド受信装置[0001]
TECHNICAL FIELD OF THE INVENTION
The present invention relates to a sound collection device for satisfactorily recording a target voice using a plurality of microphones and a receiving device for satisfactorily receiving a radio wave of a target transmission source using a plurality of antennas.
[0002]
[Prior art]
2. Description of the Related Art In recent years, with the progress of multimedia technology, communication conferences such as video conferences using a voice call using a microphone and a speaker have become widespread. In that case, without placing microphones for the number of speakers on the desk, it is possible to make a natural call without being conscious of the microphone, and suppress only noise and reverberation that degrades voice quality and collect only the intended voice There is a need for a sound collection device.
[0003]
One of such prior arts is the MINT (Multiple-Input / Output Inverse Filtering Theorem) method. (M. Miyoshi and Y. Yamada, "Inverse Filtering of Room acoustics," IEEE Trans. Acoustic, Speech Signal Process, vol. ASSP-36, no2, pp. 145-152, Feb.).
FIG. 1 is a diagram illustrating the principle of target sound extraction by the MINT method.
In FIG. 1, 1 1 to 1 N are microphones (N is the number of microphones), 2 1 to 2 N are filters (N is the number of filters), 3 is an adder, 7 is a speaker, 8 is a measurement signal generator, 9 the impulse response calculation unit, 10 inverse filter calculation unit, 6 1 target source, 6 2 to 6 M (M is the number of sound sources) is noise source.
[0004]
The MINT method, first, outputs a measurement signal generated from the measurement signal generator 8 by installing a speaker 7 to the position of the target sound source 61, recorded at the microphone 1 1 to 1 N, the impulse response calculation The unit 9 calculates an impulse response from the sound, the measurement signal, and the speaker position to each microphone. Next, by installing a speaker in the position of the noise source 6 2 to 6 M, similarly to measure the impulse response.
Next, from the impulse responses, an inverse filter is calculated by solving the following simultaneous equations in an inverse filter calculation unit.
Hc = b (1)
[0005]
(Equation 1)
Figure 0003583980
H is an impulse response convolution matrix, H mn is an impulse response convolution matrix from the mth sound source to the nth microphone 1 n , c is an inverse filter coefficient vector, c n is an nth inverse filter coefficient vector, b Is the target impulse response coefficient vector, h mn (k) is the impulse response coefficient from the m-th sound source 6 m to the n-th microphone 1 n , c n (l) is the n-th inverse filter coefficient, and M is The number of sound sources, N is the number of microphones, K is the number of impulse response taps, L is the number of inverse filter taps, m = 1,..., M, n = 1,.
[0006]
In the equation (1), an impulse response convolution matrix H and a target impulse response coefficient vector b are given, a simultaneous linear equation is solved, and an inverse filter coefficient vector c is calculated to obtain an inverse filter coefficient c n (l).
In order to solve the simultaneous linear equation of the equation (1), the following conditions must be satisfied from the MINT theory.
N ≧ M + 1 (2)
[0007]
(Equation 2)
Figure 0003583980
The inverse filter coefficient obtained by transferring the filter 2 1 to 2 N, convolution on the signal from the microphone 1 n, all added in the adder 3 their output, and outputs the result as a final output.
[0008]
This output suppresses noise and reverberation and extracts only the target sound.
Further, a general receiving apparatus does not particularly include a means for suppressing unnecessary radio waves.
[0009]
[Problems to be solved by the invention]
In the MINT method, it is necessary to measure an impulse response from a sound source to a microphone in advance. However, there is a problem that it is very difficult to install a speaker at the position of the sound source (target sound source, noise source) and measure the impulse response when it is desired to pick up the target sound source with high quality such as in a video conference. . Further, in the conventional receiving apparatus, it has been difficult to suppress a noise radio wave and a reflected radio wave to receive a target radio wave.
[0010]
An object of the present invention is to provide a sound collection device that does not require prior measurement of an impulse response, and a receiving device that suppresses a noise radio wave and a reflected radio wave and receives a target radio wave.
[0011]
[Means for Solving the Problems]
In order to solve the above problems, the present invention has the following means.
The invention according to claim 1 is realized as a sound collection device that obtains a sound collection signal by adding sound signals recorded by a plurality of microphones through respective independent filters and adding them.
The apparatus includes a plurality of microphones, a correlation function calculation unit that calculates a correlation function between signals from the plurality of microphones, and a blind inverse filter calculation that calculates an inverse filter using the correlation function calculated by the correlation function calculation unit. Unit, a filter unit that filters signals from the plurality of microphones with an inverse filter coefficient calculated by the blind inverse filter calculation unit, and an adder that adds an output of the filter unit. It is characterized in that an inverse filter coefficient is calculated only from a correlation function between signals.
[0012]
The difference from the conventional technique is that the impulse response from the sound source to the microphone is not used to calculate the inverse filter coefficient.
Next, the principle of calculating the inverse filter coefficient from only the correlation function will be described.
In the MINT method, if the impulse response from the sound source to the microphone is not known in solving the simultaneous linear equation of the equation (1), the impulse response matrix H cannot be determined and the inverse filter coefficient vector c cannot be solved. Here are the disadvantages of the MINT method.
[0013]
In the present invention, the equation (1) is not calculated as it is, but the equation is modified as follows.
First, apply a H T from the left both sides of the equation (1).
H T Hc = H T b (4)
Here, according to the MINT theory, H is an equation (2) and an equation (3), and is regular if the impulse response zeros do not overlap. Therefore, the transposed matrix H T is also regular, and the solution of equation (4) is equal to the solution of equation (1).
[0014]
Next, the H T H R 'far To equation (4)
R ′ c = H T b (5)
here,
[0015]
(Equation 3)
Figure 0003583980
And
[0016]
(Equation 4)
Figure 0003583980
It is.
If the signals from the microphones 1 n are x n (r), the correlation function between the channels is
[0017]
(Equation 5)
Figure 0003583980
It becomes. here,
[0018]
(Equation 6)
Figure 0003583980
, And the Rewriting r ij (p) using the s m (r) is the original signal of the m-th sound source,
[0019]
(Equation 7)
Figure 0003583980
It becomes. here,
[0020]
(Equation 8)
Figure 0003583980
And represents the autocorrelation function of the m-th sound source.
Here, assuming that the autocorrelation function of the sound source can be approximated by the delta function,
[0021]
(Equation 9)
Figure 0003583980
It becomes.
(In the above description, it is assumed that the autocorrelation function of the sound source is approximated by a delta function. However, if the approximation is not considered to hold, the autocorrelation function of the sound source is calculated as a part of the impulse response. As a processed output signal, a whitened version is obtained by applying an inverse filter of the autocorrelation function of the sound source.The autocorrelation of the sound source is applied to each channel in common, but since the autocorrelation function is zero-phase, it is on the frequency axis. As long as there is no zero at, an inverse filter can be obtained stably.)
Therefore, R is
(Equation 10)
Figure 0003583980
Then, equation (5) becomes as follows.
[0023]
Rc = H T b (8)
Next, the right side is
(Equation 11)
Figure 0003583980
It can be seen from the following equation:
[0025]
H T b = d ′ (9)
here,
[0026]
(Equation 12)
Figure 0003583980
It is.
[0027]
If you nearest first sound reaches the closest th microphone to the target sound source 6 1: n-th
Figure 0003583980
It becomes.
Therefore, equation (9) becomes
Figure 0003583980
[0028]
(Equation 13)
Figure 0003583980
It becomes. here,
Figure 0003583980
It is.
[0029]
From equations (8) and (10),
Rc = h 1n: closest (0) d (11)
It becomes. further,
Rc '= d (12)
And multiply. here,
[0030]
[Equation 14]
Figure 0003583980
It is.
Although c ′ is a scalar multiplication of the true inverse filter coefficient vector c, it is sufficient if c ′ is calculated because the scalar multiplication of the output result is not important.
[0031]
Therefore, by solving the simultaneous linear equation of the equation (12), the solution of the simultaneous linear equation of the equation (1) except for the scalar multiplication, that is, the inverse filter coefficient vector can be obtained.
The following method can be considered to set the microphone closest to the target sound source.
(A) The user installs the n: closest microphone near the target sound source.
(B) Among the microphones already installed, the microphone closest to the closest target sound source is set to the n: closest.
(C) All microphones are processed assuming that they are n: closest, and the target sound source is obtained when the user hears from the processing result or which microphone is set to n: closest by mechanical recognition means. It is determined whether the microphone is output and the microphone is set to the n: closest-th microphone.
(D) The position of the target sound source is detected by using a general sound source position detecting means, and an n: closest microphone is set based on the positional relationship with the microphone.
[0032]
In the equation (12), R can be calculated from the correlation function between the output signals of a plurality of microphones, and d can be obtained from the positional relationship between the sound source and the nearest microphone. Therefore, the inverse filter coefficient vector can be calculated without using the impulse response from the sound source to each microphone. Can be calculated.
According to a sixth aspect of the present invention, in the first aspect of the present invention, the voice is replaced with a radio wave, the microphone is replaced with a receiving antenna, and the blind sound collecting device is replaced with a blind receiving device. Is the same as
(Action)
According to the first aspect of the present invention, the inverse filter coefficient is calculated using a correlation function between signals of the plurality of microphones without using an impulse response from the sound source to the plurality of microphones. There is no need to measure the impulse response up to the plurality of microphones. Therefore, there is no need to install a speaker at the position of the sound source (target sound source, noise source) in advance and measure the impulse response, and it is possible to provide a sound collection device that does not require the prior measurement of the impulse response, which is the object of the present invention. .
[0033]
According to the sixth aspect of the present invention, a target radio wave can be received while suppressing a noise radio wave and a reflected radio wave.
[0034]
BEST MODE FOR CARRYING OUT THE INVENTION
(Example 1)
Hereinafter, embodiments of the present invention will be described with reference to the drawings.
FIG. 2 is a first embodiment of a sound collection device according to the present invention.
1 1 to 1 N microphones (N is the number of microphones), 2 1 to 2 N filter, 3 adders, four correlation function calculating unit, 5 blind inverse filter calculation unit, 6 1 target source, 6 2 ~6 M is a noise source. To operate this, first, to record the target sound in an environment that rang of noise at the microphone 1 1 ~1 N. From been signals from each microphone and each x 1 (r) ~x N ( r).
[0035]
Next, the correlation function calculator 4 calculates correlation functions r 11 (p), r 12 (p),..., R between the signals x 1 (r) to x N (r) recorded by the microphones 1. 1N (p), r 21 (p),..., R 2N (p),..., R N1 (p) ,. here,
[0036]
(Equation 15)
Figure 0003583980
It is.
Next, the blind inverse filter calculation unit 5 calculates an inverse filter by solving the following simultaneous linear equations.
Rc = d (13)
here,
[0037]
(Equation 16)
Figure 0003583980
Here, R represents the channel correlation function matrix (R ij is the i-th microphone 1 i and j th microphone 1 j correlation function matrix), c is inverse filter coefficient vector (c n is the n-th inverse filter coefficients vector), d blind purposes impulse response coefficient vector (d n is the n-th blind purposes impulse response vector), c n (l) is the n-th inverse filter coefficients, M is the number of sound sources, K is the impulse response taps The number, N is the number of microphones, and L is the number of inverse filter taps.
[0038]
δ n is 1 when the target sound source 61 is closest to the n-th microphone 1 n among the microphones, and is 0 otherwise.
In Equation (4), the inter-channel correlation function matrix R and the blind objective impulse response coefficient vector d are given, a simultaneous linear equation is solved, and an inverse filter coefficient vector c is calculated to obtain an inverse filter coefficient c n (l).
In order to solve the simultaneous linear equation of equation (4), the same conditions as in the MINT theory must be satisfied.
N ≧ M + 1 (2)
[0039]
[Equation 17]
Figure 0003583980
Transfer the inverse filter coefficients obtained in the filter unit 2 1 to 2 N, convolution in the signal x n (r) from the microphone 1 n by the filter unit, all adds at its output y n (r) an adder 3 , And outputs the result as a final output w (r).
[0040]
This output w (r) is obtained by suppressing noise and reverberation sound and extracting only the target sound.
Next, a simulation result simulating an actual room will be described.
FIG. 3 is a diagram of an experimental system, where N = 3 and M = 2. The target sound source is a male voice reproduced from a speaker, and the noise source is a white noise reproduced from a speaker.
[0041]
4 (a) is a pre-processing of the signals of the microphone 1 1, FIG. 4 (b) is an output result after treatment with the blind and collection device. As can be seen, after the processing, it is clear that only the voice has been extracted.
5 (a) is a pretreatment of the impulse response from a target sound source to the microphone 1 1, FIG. 5 (b) is the impulse response after treatment with the blind and collection device. The initial reflected sound near several hundred taps is small in FIG. 5B, and it can be seen that the reverberant sound can be suppressed.
[0042]
As described above, the device calculates the inverse filter using the correlation function between the signals from the microphones, so that the inverse filter coefficient can be calculated without using the impulse response from the sound source to the microphone. There is no need to measure the impulse response in advance as compared with the prior art, and the device can be easily installed.
(Example 2)
FIG. 6 is a second embodiment of the sound collection device according to the present invention.
[0043]
1 1 to 1 N microphones (N is the number of microphones), 6 1 target source, 6 2 to 6 M is the noise source, 7 speakers, 11 amp, 101 is a blind sound pickup device.
The second embodiment is a case where the present invention is used for loud speech in a hall. The sound emitted from the target sound source is separated from noise by the present invention, and the sound is collected while suppressing reverberation sound. The collected sound is amplified by the amplifier 11 and is amplified from the speaker 7. Here, the loudspeaked sound enters the microphone again, but since it has a large correlation arriving later than the target sound, it is removed as a part of reverberation according to the present invention, and is usually caused by a sound loop generated in an in-field loudspeaker system. Howling is suppressed. As described above, the second embodiment not only suppresses noise and reverberation, but also has an effect of suppressing howling generated in a loudspeaker system.
(Example 3)
FIG. 7 is a third embodiment of the sound collection device according to the present invention.
[0044]
1 1 to 1 N microphones (N is the number of microphones), 6 1 target source, 6 2 to 6 M is the noise source, 7 speakers, 11 amp, 101 is a blind sound pickup device.
The third embodiment is a case where the present invention is applied to a loudspeaker system. The sound emitted from the target sound source is separated from the noise by the present invention, the reverberant sound is suppressed and collected, and sent to the communication partner as a transmission signal. Also, the received signal is amplified by an amplifier, amplified by a speaker, and then re-enters the microphone. However, since the received signal has no correlation with the target sound, the received signal is removed as a part of noise by the present invention, and is usually recognized as an acoustic echo. The sound that returns to the other party can be removed. As described above, the third embodiment not only suppresses noise and reverberation, but also has an effect of suppressing acoustic echo generated in a loudspeaker system.
(Example 4)
FIG. 8 shows a fourth embodiment of the sound collection device according to the present invention.
[0045]
13 1 to 13 N is receiving antenna, 12 1 object source, 12 1 to 12 M is radio noise source, 102 is a blind receiver. The fourth embodiment is a case where the present invention is used for receiving a target radio wave without distortion. Basically, in the first embodiment, the sound is replaced with a radio wave and the microphone is replaced with a receiving antenna. The radio wave from the target transmission source is received by the receiving antenna, and the blind radio receiver removes the noise radio signal and the reflected radio wave to obtain the target radio wave. As described above, the fourth embodiment has the effect of suppressing not only noise and reverberation but also noise radio waves and reflected radio waves in radio wave reception.
[0046]
【The invention's effect】
As described above, in the present invention, since the inverse filter is calculated using the correlation function between signals from the microphones, it is possible to calculate the inverse filter coefficient without using the impulse response from the sound source to the microphone. It is possible, and it is not necessary to measure the impulse response in advance as compared with the related art, and it is possible to easily install the apparatus. Further, in the present invention, the target radio wave can be received by suppressing the noise radio wave and the reflected radio wave.
[Brief description of the drawings]
FIG. 1 is a configuration diagram of a conventional MINT sound pickup device.
FIG. 2 is a configuration diagram of a sound collection device according to a first embodiment of the present invention.
FIG. 3 is a diagram illustrating an experimental system when an experiment is performed using the present invention.
FIGS. 4A and 4B are diagrams showing extraction of speech as a result of an experiment, wherein FIG. 4A shows a state before processing and FIG.
5A and 5B are diagrams showing suppression of reverberation as a result of an experiment, wherein FIG. 5A shows a state before processing and FIG. 5B shows a state after processing.
FIG. 6 is a configuration diagram of a sound pickup device according to a second embodiment of the present invention.
FIG. 7 is a configuration diagram of a sound collection device according to a third embodiment of the present invention.
FIG. 8 is a configuration diagram of a receiving apparatus according to a fourth embodiment of the present invention.
[Explanation of symbols]
Reference numerals 1 1 to 1 N microphone 2 1 to 2 N filter 3 Adder 4 Correlation function calculator 5 Blind inverse filter calculator 6 1 Target sound source 6 2 to 6 M noise source 7 Speaker 8 Measurement signal generator 9 Impulse response calculator REFERENCE SIGNS LIST 10 inverse filter calculation unit 11 amplifier 12 1 target transmission source 12 2 to 12 M noise radio wave source 13 1 to 13 N receiving antenna 100 MINT sound pickup device 101 blind sound pickup device 102 blind reception device

Claims (6)

複数のマイクロホンで収録されたNチャネル(Nは2以上の整数)の音響信号を各々独立なフィルタを通し、加算して収音信号を得る収音装置において、
前記Nチャネルの音響信号間の相関関数を計算する相関関数計算手段と、
前記Nチャネルの相関関数からなる行列に畳み込み演算をすると、目的音源に最も近いチャネルについてインパルスが得られ、その他のチャネルについてはゼロとなるベクトルが得られるベクトルを、各チャネルの逆フィルタ係数として計算する逆フィルタ係数計算手段と、
前記逆フィルタ係数を前記各Nチャネルの音響信号に畳み込むN個のフィルタ手段と、
前記N個のフィルタ手段の出力を加算して収音信号を得る加算手段を備えたこと
を特徴とする収音装置。
In a sound pickup device that obtains a sound pickup signal by adding N-channel (N is an integer of 2 or more) acoustic signals recorded by a plurality of microphones through respective independent filters and adding them,
Correlation function calculation means for calculating a correlation function between the N-channel acoustic signals,
When the convolution operation is performed on the matrix composed of the N channel correlation functions, an impulse is obtained for the channel closest to the target sound source, and a vector that is zero for the other channels is calculated as an inverse filter coefficient of each channel. Inverse filter coefficient calculating means,
N filter means for convolving the inverse filter coefficient with the sound signal of each of the N channels,
The N sound collecting device, characterized in that by adding the output of the filter means and a summing means for obtaining a collected sound signal.
請求項に記載の収音装置において、
前記目的音源に最も近いチャネルを前記相関関数が最大のチャネル間時間差を用いて決定すること
を特徴とする収音装置。
The sound pickup device according to claim 1 ,
A sound pickup apparatus, wherein a channel closest to the target sound source is determined using a time difference between channels having the largest correlation function.
請求項1乃至のいずれか1項に記載の収音装置において、
前記収音信号を拡声する拡声手段を備えたこと
を特徴とする収音装置。
The sound pickup device according to any one of claims 1 to 2 ,
A sound pickup device comprising: a speaker for loudspeaking the pickup signal.
請求項1乃至のいずれか1項に記載の収音装置において、
前記収音信号を送話信号として通信相手に送信する送信手段と、
前記通信相手から受話信号を受信して拡声する受信・拡声手段を備えたこと
を特徴とする収音装置。
The sound pickup device according to any one of claims 1 to 2 ,
Transmission means for transmitting the sound pickup signal to a communication partner as a transmission signal,
A sound pickup apparatus comprising a receiving / loudspeaking means for receiving a reception signal from the communication partner and loudspeaking.
複数のアンテナで受信されたNチャネル(Nは2以上の整数)の受信信号を各々独立なフィルタを通し、加算して目的受信信号を得る受信装置において、
前記Nチャネルの受信信号間の相関関数を計算する相関関数計算手段と、
前記Nチャネルの相関関数からなる行列に畳み込み演算をすると、目的発信源に最も近いチャネルについてインパルスが得られ、その他のチャネルについてはゼロとなるベクトルが得られるベクトルを、各チャネルの逆フィルタ係数として計算する逆フィルタ係数計算手段と、
前記逆フィルタ係数を前記各Nチャネルの受信信号に畳み込むN個のフィルタ手段と、
前記N個のフィルタ手段の出力を加算して目的受信信号を得る加算手段を備えたこと
を特徴とする受信装置。
In a receiving apparatus that obtains a target reception signal by adding N-channel (N is an integer of 2 or more) reception signals received by a plurality of antennas through respective independent filters and adding them,
Correlation function calculation means for calculating a correlation function between the received signals of the N channels,
When a convolution operation is performed on a matrix composed of the correlation functions of the N channels, an impulse is obtained for the channel closest to the target source, and a vector that is a vector that is zero for the other channels is obtained as an inverse filter coefficient of each channel. An inverse filter coefficient calculating means for calculating;
N filter means for convolving the inverse filter coefficient with the received signal of each of the N channels,
Receiving apparatus being characterized in that an adding means for obtaining the desired received signal by adding the output of said N filter means.
請求項に記載の受信装置において、
前記目的発信源に最も近いチャネルを前記相関関数が最大のチャネル間時間差を用いて決定すること
を特徴とする受信装置。
The receiving device according to claim 5 ,
A receiving apparatus, wherein a channel closest to the target transmission source is determined using an inter-channel time difference having a maximum correlation function.
JP2000247172A 2000-08-17 2000-08-17 Sound collecting device and receiving device Expired - Fee Related JP3583980B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2000247172A JP3583980B2 (en) 2000-08-17 2000-08-17 Sound collecting device and receiving device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2000247172A JP3583980B2 (en) 2000-08-17 2000-08-17 Sound collecting device and receiving device

Publications (2)

Publication Number Publication Date
JP2002062900A JP2002062900A (en) 2002-02-28
JP3583980B2 true JP3583980B2 (en) 2004-11-04

Family

ID=18737320

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2000247172A Expired - Fee Related JP3583980B2 (en) 2000-08-17 2000-08-17 Sound collecting device and receiving device

Country Status (1)

Country Link
JP (1) JP3583980B2 (en)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006227152A (en) * 2005-02-16 2006-08-31 Nippon Telegr & Teleph Corp <Ntt> Computing device, and sound collecting device using the same
JP4568193B2 (en) * 2005-08-29 2010-10-27 日本電信電話株式会社 Sound collecting apparatus and method, program and recording medium
JP4891805B2 (en) * 2007-02-23 2012-03-07 日本電信電話株式会社 Reverberation removal apparatus, dereverberation method, dereverberation program, recording medium
JP5106936B2 (en) * 2007-07-20 2012-12-26 クラリオン株式会社 Sound field reproduction filter calculation device and sound field reproduction system
JP4933975B2 (en) * 2007-08-02 2012-05-16 日本電信電話株式会社 Signal extraction apparatus, method thereof, and program thereof
JP5312248B2 (en) * 2008-08-28 2013-10-09 本田技研工業株式会社 Reverberation suppression system and reverberation suppression method
JP5605071B2 (en) * 2010-08-10 2014-10-15 株式会社Jvcケンウッド Coefficient setting method of digital filter, coefficient setting device, coefficient setting program, and sound field correction method using digital filter

Also Published As

Publication number Publication date
JP2002062900A (en) 2002-02-28

Similar Documents

Publication Publication Date Title
CN107636758B (en) Acoustic echo cancellation system and method
US8180067B2 (en) System for selectively extracting components of an audio input signal
JP5007442B2 (en) System and method using level differences between microphones for speech improvement
JP4286637B2 (en) Microphone device and playback device
US6002776A (en) Directional acoustic signal processor and method therefor
CN102164328B (en) Audio input system used in home environment based on microphone array
EP3189521B1 (en) Method and apparatus for enhancing sound sources
WO2013009949A1 (en) Microphone array processing system
WO2020020247A1 (en) Signal processing method and device, and computer storage medium
CN110379439A (en) A kind of method and relevant apparatus of audio processing
JP2009141560A (en) Sound signal processor, and sound signal processing method
JP3583980B2 (en) Sound collecting device and receiving device
KR101587844B1 (en) Microphone signal compensation apparatus and method of the same
Rombouts et al. Generalized sidelobe canceller based combined acoustic feedback-and noise cancellation
JP2001313992A (en) Sound pickup device and sound pickup method
US10249286B1 (en) Adaptive beamforming using Kepstrum-based filters
JP4173469B2 (en) Signal extraction method, signal extraction device, loudspeaker, transmitter, receiver, signal extraction program, and recording medium recording the same
Westner et al. Applying blind source separation and deconvolution to real-world acoustic environments
Garre et al. An Acoustic Echo Cancellation System based on Adaptive Algorithm
JP2002261659A (en) Multi-channel echo cancellation method, its apparatus, its program, and its storage medium
Nishiura et al. Speech enhancement by multiple beamforming with reflection signal equalization
JP6075783B2 (en) Echo canceling apparatus, echo canceling method and program
CN102387269A (en) Method, device and system for cancelling echo out under single-talking state
JP2002261660A (en) Multi-channel echo cancellation method, its apparatus, its program, and its storage medium
The et al. An Effective Post-Filtering for Minimum Variance Distortionless Response Beamformer

Legal Events

Date Code Title Description
A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20040427

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20040609

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20040706

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20040730

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080806

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080806

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090806

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090806

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100806

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100806

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110806

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120806

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130806

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees