JPH0126598B2 - - Google Patents

Info

Publication number
JPH0126598B2
JPH0126598B2 JP57182355A JP18235582A JPH0126598B2 JP H0126598 B2 JPH0126598 B2 JP H0126598B2 JP 57182355 A JP57182355 A JP 57182355A JP 18235582 A JP18235582 A JP 18235582A JP H0126598 B2 JPH0126598 B2 JP H0126598B2
Authority
JP
Japan
Prior art keywords
target signal
noise
signals
delay
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP57182355A
Other languages
Japanese (ja)
Other versions
JPS5972295A (en
Inventor
Yutaka Kaneda
Toshiro Ooga
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP57182355A priority Critical patent/JPS5972295A/en
Priority to US06/539,891 priority patent/US4536887A/en
Priority to CA000439141A priority patent/CA1208758A/en
Priority to NLAANVRAGE8303589,A priority patent/NL190568C/en
Publication of JPS5972295A publication Critical patent/JPS5972295A/en
Publication of JPH0126598B2 publication Critical patent/JPH0126598B2/ja
Granted legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04RLOUDSPEAKERS, MICROPHONES, GRAMOPHONE PICK-UPS OR LIKE ACOUSTIC ELECTROMECHANICAL TRANSDUCERS; DEAF-AID SETS; PUBLIC ADDRESS SYSTEMS
    • H04R3/00Circuits for transducers, loudspeakers or microphones
    • H04R3/005Circuits for transducers, loudspeakers or microphones for combining the signals of two or more microphones

Landscapes

  • Health & Medical Sciences (AREA)
  • General Health & Medical Sciences (AREA)
  • Otolaryngology (AREA)
  • Physics & Mathematics (AREA)
  • Engineering & Computer Science (AREA)
  • Acoustics & Sound (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

【発明の詳細な説明】[Detailed description of the invention]

この発明は複数のマイクロホン素子を用いて音
響信号を選択的に受音する多点受音装置に関する
ものである。 <従来技術> 目的とする音響信号(以降目的信号と記す)を
受音する時、騒音、音声などの不必要な音響信号
(以降これを雑音と総称する)が同時に受音され
て、SN比の低下、ハウリングの発生などを引き
起こすことがある。この現象の解決は、拡声通話
系、PA(パブリツク アドレス)システムなどに
おいて重要な課題であつた。この問題を解決する
ため、これまでは指向性マイクロホンの利用が多
くなされてきた。しかし、この場合、指向性パタ
ーンは固定となるので通話者の位置がマイクロホ
ンの向きにより制限されるなど、実用上多くの問
題点が存在した。また近年、鋭い指向性を実現す
るために直接配列マイクロホンの利用がされてい
る(R.L.Wallance他:米国特許4311874号
(1982)、城戸他:日本音響学会講演論文集、昭和
53年10月P.181)。しかし、この手法では設定理論
が平面波に限定されているため、現実の多くの場
合のように音波が球面波の時には動作が論理通り
にはいかず、さらに配列の長さが1m〜数m程度
の規模の大きなマイクロホン配列が必要となると
いう欠点があつた。 <発明の概要> この発明の目的は小規模に構成することがで
き、かつ目的信号源や雑音源の移動などに対し、
適応的にその目的信号を選択することを可能とす
ることができる多点受音装置を提供することにあ
る。 この発明によれば、複数のマイクロホン素子の
各出力がそれぞれ遅延手段によりそれぞれ遅延時
間が異なる遅延を受け、これら遅延された複数の
信号は荷重加算手段により荷重加算されて出力さ
れる。仮想目的信号が電気的に発生され、この仮
想目的信号と、前記複数のマイクロホン素子の出
力を前記と同様に遅延した各複数の信号との相関
がそれぞれとられ、あらかじめ定められた評価量
が最小になるように、その相関関係より、前記荷
重加算における係数を設定する。この結果その荷
重加算出力として雑音が抑圧され、目的信号が抽
出される。 <実施例> 第1図はこの発明の実施例を示し、複数のマイ
クロホン素子11〜1Nより成る多点受音部1は遅
延回路2及び、加算回路31〜3Nよりなる加算部
3に接続される。遅延回路2の出力は荷重加算部
4に接続される。仮想目的信号発生器5が設けら
れ、その出力側は仮想目的信号遅延回路61〜6N
よりなる遅延回路部6に接続され、遅延回路6の
出力側は加算部3に接続される。加算部3の出力
側は遅延回路7に接続され、遅延回路7の出力側
は荷重係数決定部8に接続される。荷重係数決定
部8には仮想目的信号発生器5の出力側が遅延素
子9を通じて接続され、荷重係数決定部8は荷重
加算部4の設定入力側に接続される。 まず最初にこの実施例の基本動作を説明する。
多点受音部1において、N個のマイクロホン素子
1……1Nにより目的信号と雑音とが重畳した信
号u1(t)、……uN(t)を受音する。次にこれら
信号を遅延回路2に入力する。こゝで遅延回路2
は第2図に示すように、遅延時間Tdの遅延素子
11をM個直列につないだ遅延ユニツトのN個1
1……11Nよりなり、各遅延ユニツトは入力さ
れた信号と各遅延素子11の出力信号とよりのM
+1個の信号を出力する。したがつてN個の入力
信号u1(t)、……、uN(t)に対してL個(L=
N×(M+1))のx〓1(t)、……、x〓L(t)を得
る。 第1図において荷重加算部4において、遅延回
路2の出力信号x〓1(t)、……x〓L(t)を荷重加算
する。この荷重加算は荷重係数h1、……、hLを用
いて次式 y(t)=〓T・XI〜(t)=Li=1 hi・x〓i(t) (1) 但し、
The present invention relates to a multipoint sound receiving device that selectively receives acoustic signals using a plurality of microphone elements. <Prior art> When a target acoustic signal (hereinafter referred to as the target signal) is received, unnecessary acoustic signals such as noise and voice (hereinafter collectively referred to as noise) are received at the same time, resulting in an increase in the SN ratio. This may cause a decrease in performance, howling, etc. Solving this phenomenon has been an important issue in public address systems, PA (public address) systems, etc. To solve this problem, directional microphones have often been used. However, in this case, since the directivity pattern is fixed, there are many problems in practical use, such as the position of the caller being limited by the direction of the microphone. In addition, in recent years, direct array microphones have been used to achieve sharp directivity (RL Wallance et al.: U.S. Patent No. 4311874 (1982), Kido et al.: Proceedings of the Acoustical Society of Japan, Showa
October 1953, p. 181). However, since the setting theory of this method is limited to plane waves, the operation does not follow the logic when the sound waves are spherical waves, as is the case in many real cases. The drawback was that it required a large microphone array. <Summary of the invention> The object of the invention is to be able to be configured on a small scale, and to be able to prevent movement of target signal sources and noise sources.
An object of the present invention is to provide a multipoint sound receiving device that can adaptively select a target signal. According to this invention, each output of a plurality of microphone elements is delayed by the delay means, each having a different delay time, and these delayed signals are weighted and outputted by the weight addition means. A virtual target signal is electrically generated, and the virtual target signal is correlated with each of the plurality of signals obtained by delaying the outputs of the plurality of microphone elements in the same manner as described above, and a predetermined evaluation amount is minimized. Based on the correlation, the coefficients in the load addition are set so that As a result, noise is suppressed as the weighted addition output, and the target signal is extracted. <Embodiment> FIG. 1 shows an embodiment of the present invention, in which a multi-point sound receiving section 1 consisting of a plurality of microphone elements 1 1 to 1 N includes a delay circuit 2 and an adding section consisting of adding circuits 3 1 to 3 N. Connected to 3. The output of the delay circuit 2 is connected to a load adder 4. A virtual target signal generator 5 is provided, and its output side is connected to virtual target signal delay circuits 6 1 to 6 N
The output side of the delay circuit 6 is connected to the adder 3. The output side of the adder 3 is connected to a delay circuit 7, and the output side of the delay circuit 7 is connected to a weighting factor determining section 8. The output side of the virtual target signal generator 5 is connected to the weighting factor determination section 8 through a delay element 9, and the weighting factor determination section 8 is connected to the setting input side of the weighting addition section 4. First, the basic operation of this embodiment will be explained.
In the multi-point sound receiving section 1, signals u 1 (t), . . . u N ( t) in which a target signal and noise are superimposed are received by N microphone elements 1 1 . Next, these signals are input to the delay circuit 2. Here, delay circuit 2
As shown in FIG.
1 1 ... 11 N , and each delay unit has M of the input signal and the output signal of each delay element 11.
+1 signal is output. Therefore, for N input signals u 1 (t), ..., u N (t), L (L=
Obtain x〓 1 (t), ..., x〓 L (t) of N×(M+1)). In FIG. 1, the load adding section 4 adds the output signals x〓 1 (t), . . . x〓 L (t) of the delay circuit 2 with a load. This load addition is performed using the following formula y(t)=〓 T・XI~(t ) =L 〓 i= 1 h i・x〓 i (t) (1) using the load coefficient h 1 ,..., h L however,

【式】 T:転置行列 で表わされるもので、この装置の出力y(t)を
得る。この時、次に述べる方法であらかじめ定め
た評価量を最小とするように荷重係数〓を定める
ことにより、入力信号ui(t)(i=1、……、
N)に含まれている雑音成分が抑圧されて目的信
号が抽出された出力y(t)が得られる。 荷重係数の決定にあたつては次の2つの仮定を
おく。 (仮定−) 各マイクロホン素子間における目的信号の到達
時間差が既知である。 (仮定−) 目的信号には無音時間区間があり、その時に抑
圧すべき雑音のみが受音される。 こゝで、仮定−における到達時間差とは、各
マイクロホン素子が空間的に配置されているため
に生じる目的信号(音波)が各マイクロホン素子
に到達する時刻の差のことである。例えば第3図
において目的信号源12から距離d1,d2だけ離れ
てマイクロホン素子11,12が設けられている場
合、到達時間差τは次式 τ=(d2−d1)/C C:音速 (2) で表わされる量である。したがつて目的信号の音
波が平面波であるとみなせる場合には目的信号の
到来方向が、また球面波である場合には目的信号
源の位置がそれぞれ既知ならば仮定−の条件は
満足されるものである。 また、仮定−を満たす無音時間区間を持つ音
響信号の代表例としては音声信号、音楽信号があ
げられる。 さて、荷重係数の決定は、仮定−を満たす条
件下で、即ち、目的信号は存在せず、N個のマイ
クロホン素子には抑圧すべき雑音のみが受音され
ている時に以下の手順で実行される。 まず、最初に仮想目的信号発生器5より、仮想
目的信号S′(t)を発生する。次にこの信号
S′(t)を仮想信号遅延回路部6を通してN個の
マイクロホン素子11〜1Nで受音された雑音と加
算する。こゝで、仮想目的信号遅延回路部6は1
つの入力S′(t)に対してN個の遅延回路61……
NでN種の遅延量τ1、……τNをそれぞれ付加し
てN個の信号S′(t−τ1)、……S′(t−τN)を作
り出す。遅延量τ1、……τNの値は仮定−で既知
とした実際の目的信号が各マイクロホン素子11
……1Nに到達する際の時間差の関係を満足した
値であるものとする。したがつてS′(t−τ1)、…
…S′(t−τN)を仮定−より雑音のみが含まれ
ている各マイクロホン素子出力u1(t)、……、uN
(t)とを加算回路部3で加算することは、実際
の目的信号源から、仮想目的信号が発せられてお
り、これを雑音とともにN個のマイクロホン素子
1……1Nで受音する状態をシミユレートしてい
ることに相当する。 次に実際の雑音と仮想目的信号とを加算した信
号u〓i(t)(i=1、……N)は遅延回路2と同一
の構造を持つた遅延回路7を通してL個の信号XI
(t)=(x1(t)、……xL(t))Tを得る。この時

この信号XI(t)を荷重加算した結果と、遅延素
子9で適切な遅延τ0を加えた仮想目的信号S′(t
−τ0)との2乗平均誤差Eを評価量として 但し、−:時間平均 これを最小とするように最小2乗原理に基づい
て荷重係数〓を決定する。(3)式がゼロであること
はマイクロホン素子11……1Nよりの雑音が完全
に抑圧された状態を示す。(3)式はhiの2次関数と
なるので、これをhiについて偏微分して0とおい
て解けば以下のように評価量Eの最小値を与える
荷重係数〓を求めることができる。 ∂E/∂〓=∂/∂〓|′(−0)−〓TXI()
2=∂/∂〓(′(−02 −2〓T′(−0)XI()+〓T〓x〓)=−
2′(−0)XI()+2〓x〓=0(4) 但し、 このように、各xi(t)(i=1、……、L)の
相関行列〓xにより、(5)式で表わされた荷重係数
〓を用いて荷重加算部4における荷重加算を行え
ば、雑音成分が抑圧された出力y(t)を得るこ
とができる。 こゝで、仮想目的信号として実際に受音される
目的信号と全く同一の信号を用いることができる
なら得られた荷重係数は実際の目的信号に対する
2乗誤差最小の意味での最適な係数となつてい
る。しかし、そのような場合には仮想目的信号そ
のものを出力とするのが最適な解となり、非現実
的である。また仮想目的信号として、実際の目的
信号と類似した信号、例えば音声に対する擬似音
声などを用いるなら、2乗誤差最少の意味で最適
解に近い係数を得ることができる。しかし、実際
の目的信号の周波数パワースペクトルが平担でな
い場合、それと同様なパワースペクトルを持つ仮
想目的信号を用いて行つた2乗誤差最少の意味で
の最適化は主としてパワーの大きな周波数成分に
ついて行われることになる。その結果、目的信号
に対するこの方式の周波数感度特性は、目的信号
のパワーの大きな周波数帯域では平担であるが、
パワーの小さな周波数帯域では平担とはならな
い。 そこで、この点を改善するための第1の方法と
して仮想目的信号としては所望する周波数帯域内
で平担なパワースペクトルを持つ信号(例えば白
色雑音)を用いる。その結果、各周波数成分に対
して一様な最適化が行われることになり、目的信
号の周波数感度特性がより平担なものとして得ら
れる。また、第2の方法として仮想目的信号とし
て、抑圧すべき雑音と類似したパワースペクトル
を持つた信号(例えば有色雑音)を用いる方法が
あげられる。この方法では各周波数成分における
仮想目的信号と雑音との比率を一定にして最適化
の一様化をねらうもので、雑音のパワースペクト
ルの時間的な変動が小さい場合に有効であり、目
的信号の周波数感度特性の平担化が行える。 以上のように仮想目的信号を選んで(5)式を解け
ば、好ましい荷重係数を得ることができるが、〓
(t)の相関行列〓xが正則でない場合には、逆
行列〓-1 xは存在せず、(5)式を計算することができ
ない。そこで、この問題を解決する第1の方法と
して、〓-1 xの代わりに一般化逆行列〓+ xを用いる
ことが可能である。こゝで、一般化逆行列〓+ x
は、対称行列〓xを直行分解する直交行列を〓、
その列ベクトルを〓i(i=1、……L)(〓=
(〓1、……〓L))として、 と表わされる時、 と表わされるものである。また〓xが正則でない
場合に対する第2の方法として、各XI(t)に無
相関な雑音を付加して〓xを正則にする方法が考
えられる。この方法は〓-1 xの代りとして を用いることに相当し、qが十分小さな場合には
近似的な最適解を与えることに相当する。 また、荷重係数の決定法としては、SN比を評
価量とし、これを最小とする原理に基づいても可
能である。遅延回路部7の出力XI(t)は仮想目
的信号成分〓(t)と雑音成分〓(t)とを用い
て、 x(t)=〓(t)+〓(t) 但し、〓(t)=(S1(t)、……、SL(t))T 〓(t)=(n1(t)、……、nL(t))T と表わすことができる。これを係数〓で荷重加算
した信号のパワーは、雑音と仮想目的信号とが無
相関であるとすれば、 但し、(〓xs)ij=()・() (〓xN)ij=()・() と表わすことができる。こゝで荷重加算後のSN
比を、 と定義した時、SN比を最大とする〓は次のよう
に求めることができる。まず最初に〓xs、〓xN
は共に対称行列であるので次に示す関係を満たす
正則行列〓が存在する。 そこで、次に示すような係数の変数変換 〓=〓-1〓 (12) を行うとSN比は と表わすことができる。このときαMαi(i=
1、……L)とするならSN比を最大とするgは
明らかに g=(g1、g2、……、gLT gi= 1 i=M 0 i≠M (14) となり、これよりSN比を最大とする荷重係数〓
は、 〓=〓〓 (15) の関係を用いて得ることができる。 以上述べたこの発明を実現する第1の手段とし
て全系をデイジタル系で構成する方法がある。第
4図にその構成図を示す。第4図において、第1
図と対応する部分には同一符号を付けてある。マ
イクロホン素子11……1Nの各出力はA/D変換
器部13でそれぞれデイジタル信号に変換されて
遅延回路2及び加算回路部3へ供給される。荷重
加算部4の出力はD/A変換器14によりアナロ
グ信号に変換されて出力される。 この構成における遅延回路2,7の一実施例を
第5図に示す。遅延ユニツト111はM段のシフ
トレジスタ15よりなり、その各シフト段より出
力が導出される。その他の遅延ユニツトも同様に
構成される。荷重加算部4は第6図に示すように
遅延回路2の出力x〓1(n)、……x〓L(n)はそれぞ
れ各別の乗算器16で係数h1……hLと掛算され、
その結果が加算器17で加算される。第4図で荷
重係数決定部8は演算能力を有してプロセツサで
あり、前記(5)式または(15)式を直接計算するこ
とにより荷重係数〓を得るものである。 荷重係数の決定は上記の方法以外に種々の遂次
近似法を用いることが可能である。遂次近似法を
用いる場合にはアルゴリズムの収束性などに特に
留意を要するが、一方、前記(5)式、または(15)
式を直接計算するよりも少ない計算量、メモリ量
で荷重係数〓を得ることができる。 この場合の構成を第7図に示す。第7図におい
て、第4図と対応する部分は同一符号を付けてい
る。遅延回路7の出力は荷重加算部4と同一の荷
重加算部18に入力されると共に遂次形荷重係数
決定部19に入力される。荷重加算部18の出力
は遅延素子9の出力と加算器21で加算されて荷
重係数決定部19に入力される。この決定された
荷重係数で荷重加算部4,18の荷重係数が制御
される。 2乗平均誤差を評価量として用いる遂次近似法
としてsteepest descent法もしくはLMSアルゴリ
ズムとして知られる方法を用いる場合、各時刻時
刻における荷重係数〓(n)(ただし、nは時刻
を表わすパラメータ)は遂次形荷重係数決定部1
9において、次式 〓(n)=〓(o-1)+ksXI(o-1)・l(o-1) (16) 但し、l(o-1)=S′(o-0)−〓T (o-1)・XI(o-1) により計算される。 この発明を実現する第2の手段として全系をア
ナログ系により構成する方法がある。この方法に
おける構成例は第1図に示したものでその各部の
素子構成例は以下のようになる。まず遅延回路
2,7の構成は第2図に示したもので、各遅延素
子はBBD、CCDなどのアナログ遅延素子により
実現する。荷重加算部4は第6図に示したデイジ
タル系の場合と同様の構成を持ち、第6図におい
て乗算器16をアナログ乗算器、加算器17をア
ナログ加算器と置き換えたものとする。また、荷
重係数の決定をアナログ系において行う場合に、
逆行列の算出などの演算を行うことは困難であ
る。そこで荷重係数の決定は遂次近似法で行うも
のとし、第1図における荷重係数決定部8を例え
ば第8図に示す回路構成により実現する。 即ち遅延回路7の出力XI(t)はL個のアナロ
グ乗算器23に供給されると共にL個のアナログ
相関器24へ供給される。L個のアナログ乗算器
23の出力はアナログ加算器25で加算され、そ
の出力と遅延素子9の出力とが加算器26で加算
されて各相関器24へ供給される。各相関器24
の出力はアナログ乗算器27をそれぞれ通じてL
個の積分器28へ供給される。これら積分器28
より荷重係数が得られ、乗算器23へ供給され
る。 この回路は2乗平均誤差を評価量として用いる
場合の連続系における荷重係数の遂次近似方程式
である次式 dhi(t)/dt=s()・() を満足したものとなつている。 またこの発明を実現する第3の手段としては、
デイジタル回路とアナログ回路の組合せた構成が
考えられる。この方法の一例としては例えば第1
図における遅延回路2及び荷重加算部4より成る
部分をアナログ回路で構成し、荷重係数の決定に
関連するその他の部分をデイジタル系で構成する
方法などが考えられる。 さて、前記したようにこの発明の装置が所望の
動作をするためには次の2つの仮定 (仮定−) 各マイクロホン素子間における目的信号の到達
時間差が既知である。 (仮定−) 目的信号には無音区間があり、その時に抑圧す
べき雑音のみが受音される。 を満足する必要がある。しかし雑音のレベルが目
的信号のレベルに比べて小さく、実質的に目的信
号のみが受音されているとみなせる場合、もしく
は雑音に無音区間があつてそのような時間区間が
存在する場合には、以下にその一例を述べるよう
な目的信号の到達時間差を検出する手段を付加す
ることにより(仮定−)が満足される。まず最
初に各マイクロホン素子出力信号u1(t)、……、
uN(t)の間の相互相関関数を計算する。そして、
ui(t)とuj(t)との間の相互相関関数φsij(τ)
の最大値をとる値τの値τMijを求めればマイクロ
ホン素子iとマイクロホン素子jの間における目
的信号の到達時間差とみることができる。この到
達時間差τMijの検出をデイジタル化された信号ui
(n)、uj(n)(n=……、−1、0、1、……)
より決定する場合、精度良くτMijを求めるために
は信号のサンプリング周波数を十分高くするか、
もしくは低いサンプリング周波数より得られた相
互相関関数に対して内挿法を適用した後、到達時
間差を求める必要がある。この結果(仮定−)
が満足される。 以上の考え方に基づいたこの発明の一実施例を
第9図に示す。第9図において第4図に示した構
成に目的信号の到達時間差検出部29が設けら
れ、これにA/D変換器13の出力が分岐入力さ
れる。この検出部29の検出結果により遅延回路
部6の各遅延量が設定される。目的信号の到達時
間差検出部29は第10図に示すようにA/D変
換器13の各出力は相互相関関数算出部31に入
力されてマイクロホン出力ui(n)とuj(n)の間
の相互相関関数φsij(τ)を計算し、最大値検出
部32においてφsij(τ)が最大値をとるτの値
τMijを検出する。次に仮想目的信号遅延量決定部
34において、τMij(i=1、2、……N、j=
1、2、……N)より十分大きな値〓を用いて、
仮想目的信号遅延量〓=(τ1、……、τNTを次式 τi=〓−τMij(jは1jNの任意の値) により決定する。 次にこの発明の装置の動作を完全に自動化する
場合について説明する。この装置の動作を自動と
する一手段として、実質的に雑音のみが受音され
ている状態及び実質的に目的信号のみが受音され
ている状態の判定を行う手段を付加する方法があ
る。その判定結果より実質的に目的信号のみが受
音されている状態において、例えば前記相互相関
関数を用いた方法などにより目的信号の到達時間
差が既知となり、仮定−が満足される。また、
実質的に雑音のみが受音されている状態と判断さ
れた時刻においては、仮定−が満足されるのは
明らかである。 雑音のみが受音されている状態及び目的信号の
みが受音されている状態の判定を行う場合のこの
発明の実施例を第11図及び第12図に示す。第
11図は会議電話方式におけるこの発明の実施例
で多点受音部35の出力は前述したこの発明によ
る多点受音システム部36に入力される。受話信
号路37の信号によりスピーカ38が駆動され、
多点受音システム部36の出力は送話信号路39
より出力される。また第12図は拡声電話機に応
用したこの発明の実施例で、多点受音部35はこ
の発明による多点受音システム部36を通じて送
話信号路39へ出力される。受話信号路37より
の信号によりスピーカ38が駆動される。ダイヤ
ル41が設けられている。 この2例において、スピーカ38から発せられ
る音声を多点受音部35で受音して送話信号路3
9に伝送してしまうと、ハウリングの発生、通話
品質の劣化などさまざまな障害が発生する。そこ
でこの2例においては雑音はスピーカ38から発
生される音声であり、目的信号は送話者の発声す
る音声である。したがつて音声には必ず無音区間
が存在するので、雑音のみが存在する状態及び目
的信号のみが存在する状態が存在する。かつ、ス
ピーカ38に対する入力レベル(受話信号レベ
ル)を監視することにより、例えば受話信号レベ
ルが0であるが、マイクロホン(多点受音部3
5)出力レベルが上昇した場合には、目的信号の
みが存在する状態であり、受話信号レベルが一定
量以上であつて、かつマイクロホン出力レベルが
受話信号レベル、スピーカ38の電気音響変換
量、スピーカ−マイク間の音響結合量、マイクロ
ホン感度より決まる値以下の場合には雑音のみが
存在する状態と判定することが可能である。その
結果、この装置は所望の動作が可能となり、雑音
の抑圧を行い目的信号の選択受音を行うことがで
きる。 また、目的信号音源の位置もしくは雑音源の位
置がほゞ固定とみなせる場合には事前学習により
上記の仮定の1つもしくは2つを満足させること
ができる。例えば、第12図に示した一体形の拡
声電話機において雑音となるのはスピーカ38か
ら放射される受話音声及びそれに伴うきよう体振
動、きよう体内音圧がマイクロホン素子に与える
振動であるが、この雑音源の各マイクロホン素子
に対する位置関係はほゞ固定的である。そこで事
前にスピーカ38からテスト信号(例えば白色雑
音、有色雑音など)を発生させてこれを受音し、
このシステム部36内に記憶しておけば(仮定−
)は満足されることになる。したがつて通話時
においては受話信号レベルが実質的に零の時にお
ける目的信号の到達時間差の検出のみを行えば、
この装置は所望の動作が可能となる。 さらに荷重係数の決定を半固定的に行う実施例
としては次の手段が考えられる。まず、雑音源の
位置はほゞ固定されているものとして事前に雑音
のみを発生させて系内に記憶させておく。次に予
想される目的信号源の位置を定めてその位置にス
ピーカを設置して音響信号を発生させて多点受音
し、これと先の雑音とより荷重係数の決定を行
う。次に予想される目的信号の他の位置にスピー
カを設置して同様に荷重係数の決定を行う。この
ようにしてK個の予想される目的信号源の位置
p1、p2、……pKに対応してK個の荷重係数〓1
2、……〓Kが事前に決定される。この中で荷重
係数〓iを用いてシステム部36の動作を行え
ば、目的信号源が位置piにある時、雑音が抑圧さ
れ目的信号の抽出が最大限に行えることが保障さ
れている。そこで予想される目的信号源の位置の
数を十分に大としておくなら目的信号の位置は
ほゞいずれかの位置pjの近傍となる。したがつて
K個の出力y1=〓1 TXI、……yK=〓T Kxを作成し
ておき、その中で例えば信号レベルの最大のもの
を選ぶなどの方法により、最も目的信号成分が多
く含まれていると予想されるものを出力すること
により、所望の動作が可能となる。 この方法は雑音に対しては感度が低く、piの位
置にある目的信号に対しては感度の高い指向性マ
イクロホンをK個用意しておき、それらのK個の
マイクロホンを選択的に使用することに相当す
る。また、この方式の出力として、 y=Ki=1 yi とすれば、雑音に対しては感度が低く、かつ予想
される目的信号のある範囲内での任意の位置に対
して感度の高い受音系が構成される。 次にこの方式の有効性を確認するために行つた
シユミレーシヨン結果及び実験結果について述べ
る。 まずシミユレーシヨンにおける音場は2次元音
場であるものとし、雑音及び目的信号はそれぞれ
平面波であるものとした。雑音及び目的信号の到
来方向は第13図に示すように雑音は2方向(θ
=60゜、100゜)から目的信号は一方向(θ=−60゜)
から到来するものとした。また考える信号の帯域
は300〜3000Hzとして2つの雑音としてはその帯
域で白色なスペクトルを持ちそれぞれ独立な雑音
を考えた。 この装置の構成要素として、まずマイクロホン
素子の配置は第14図A,B,Cに示すように平
面上半径8.5cmの円周上に等角度で5個及び3個
配置したもの及び8.5cmの間隔で2個配置したも
のをそれぞれ考えた。 装置の構成は第4図に示したようにデイジタル
系における構成を考え、A/D変換器13、D/
A変換器14のサンプリング周波数は8KHzとし
た。遅延回路2における各遅延素子の遅延時間は
サンプリング周期(125μsec)とし、各マイクロ
ホン入力に対する遅延素子数は8個として行つ
た。また仮想目的信号発生器5からはデイジタル
化された300〜3000Hzの帯域で白色なスペクトル
を持つ仮想目的信号を発生させた。先に述べた
(仮定−)及び(仮定−)を満たすものとし
て、第14図に示す種々のマイクロホン配置を持
つこの装置の動作をシミユレートして荷重係数〓
の計算を行つた。 配置Aにより得られた荷重係数〓を用いた場合
のこの多点受音装置の指向性感度パターンを第1
5図に示す。第13図より指向性感度の最大方向
と目的信号の到来方向とは必ずしも一到していな
いが、2つの雑音の到来方向の感度は十分に低下
した指向性感度パターンがこの発明により自動的
に形成されていることがわかる。 また、第16図に各マイクロホン素子の配置に
より得られた荷重係数〓を用いた場合のこの装置
の到来方向ごとの周波数感度特性を示す。第16
図Aは、配置Aをとる場合の周波数感度特性で雑
音成分は目的信号成分に比べて20dB以上抑圧さ
れることがわかり、この発明の有効性が確認でき
る。次に配置Bを用いた場合、雑音の到来方向を
第13図に示したように2方向とした場合にはほ
とんど雑音成分の抑圧効果は得られなかつた。こ
れはこの装置が雑音と目的信号の到来方向の違い
を利用して雑音抑圧を行つており、2つのマイク
ロホン素子を結ぶ線上に対して線対称の方向(θ
=60゜とθ=−60゜)から雑音と目的信号とが到来
する場合にはその到来方向が区別できないことを
示している。マイクロホン素子を直線上に配列し
た場合には、マイクロホン素子の個数を増加させ
てもその配置が一次元である限りこの問題は解決
できない。したがつて、マイクロホン素子の配置
は雑音と目的信号の到来方向の分離検出を良くす
るために実用上問題とならない限り多次元に配置
することが望ましい。しかしながら雑音と目的信
号の到来方向が2つのマイクロホン素子を結ぶ線
上に対して線対称の方向では無い場合には、マイ
クロホン素子の個数が2個であつても十分な雑音
抑圧効果が得られる。第11図Bは配置Bを用い
て雑音の到来方向を一方向(θ=110゜)のみとし
た時の結果であり、このことが確認できる。 次に配置Cに示すようにマイクロホンの個数を
3個とした場合の結果を第16図Cに示す。第1
6図Cを第16図A(マイクロホン素子が5個の
場合)と比較してわかるように第16図Cの場合
には目的信号に対する周波数感度特性が平担とは
なつていない。この2つの結果が示すように一般
にはマイクロホン素子の個数を増加させればより
細かな制御が可能となり、装置の性能も向上す
る。しかし、実用的には性能向上の度合、実装の
可能性、コスト等を考慮して配置規模の大きさに
対応したマイクロホン個数を決定する必要があ
る。 次に実験結果について述べる。実験は残響時間
が0.6秒の室内において行つた。実験条件は第1
7図に示すもので、机44上に4個のマイクロホ
ン素子を持つ多点受音部1を設置し、スピーカ4
5及びスピーカ46を4個のマイクロホン素子の
中心よりそれぞれ60cm、50cmの距離を離して設置
した。4個のマイクロホン素子は半径8.5cmの円
周上に等角度で3個、円の中心に1個配置するも
のとした。スピーカ45からは目的信号として
300〜3000Hzで帯域制限した音声を発し、スピー
カ46からは雑音として300〜3000Hzで帯域制限
した白色雑音を発した。荷重係数〓の決定にあた
つては一時的にスピーカ45及びスピーカ46の
出力を停止し、それぞれ雑音のみ及び目的信号の
みの受音を行つた。この結果得られた荷重係数〓
を用いたこの装置のスピーカ45及びスピーカ4
6に対する感度を第18図に示す。この図より雑
音(スピーカ46)に対する感度は曲線47に示
すように目的信号(スピーカ45)に対する感度
(曲線48)より低域では20dB、高域でも7〜
8dB低下していることがわかり、雑音を抑圧し、
目的信号を抽出するというこの発明の効果が発揮
されていることが確認できた。 しかしながら、第16図、第18図からわかる
ように、この装置が目的信号成分に対する周波数
感度特性は必ずしも平担なものとはならない。そ
こでこの点を改善するために、この装置の最終段
に等化器を設け、前記周波数感度特性を補正する
方法の一実施例を第19図に示す。第19図にお
いて第1図と異なる点は等化器49を設け、この
特性を目的信号成分に対する周波数感度特性を例
えば仮想目的信号遅延量〓=(τ1、τ2、……τN
と定められた荷重係数〓とから計算し、その逆特
性とする。 上述において遅延回路2,7を兼用し、1個を
切替えて用いてもよい。遅延回路2,7内の遅延
素子11の数は多い方がよく、かつ、1つの遅延
時間は短かい方がよい。何れにしても、マイクロ
ホン素子11……1N中の最も離れている素子間の
音波伝ぱん時間よりは、直列遅延素子の全体での
遅延量を大とする。 以上説明したように、この発明装置は多点受音
した信号を遅延回路を通した後荷重加算して出力
を得るもので、荷重加算における荷重係数にあた
つては、各マイクロホン間における目的信号の到
達時間差及び目的信号が無音区間の時に受音され
た雑音のみを情報として用いるものである。した
がつて雑音の到来方向や目的信号の性質が未知で
あつてもまた目的信号源や雑音源が移動しても適
応的に荷重係数の変更を行つて雑音成分を抑圧
し、目的信号の抽出を行うことが可能である。更
に従来の配列マイクロホン設計理論で必要とされ
ていた音波の平面波性を仮定する必要もなく、ま
た実際のマイクロホン配置規模も十数cmの大きさ
があれば十分な雑音抑圧効果が得られるという利
点のあることが実験的に確認されている。
[Equation] T: Expressed as a transposed matrix, which obtains the output y(t) of this device. At this time, the input signal ui(t) (i=1, ...,
An output y(t) is obtained in which the noise components contained in N) are suppressed and the target signal is extracted. The following two assumptions are made when determining the load coefficient. (Assumption-) The arrival time difference of the target signal between each microphone element is known. (Assumption-) The target signal has a silent time period, and only the noise to be suppressed is received at that time. Here, the arrival time difference under the assumption is the difference in time at which the target signal (sound wave), which is generated due to the spatial arrangement of the microphone elements, arrives at each microphone element. For example, in FIG. 3, when microphone elements 1 1 and 1 2 are provided at distances d 1 and d 2 from the target signal source 12, the arrival time difference τ is calculated by the following formula: τ = (d 2 - d 1 )/C C: A quantity expressed by the speed of sound (2). Therefore, if the sound wave of the target signal can be considered to be a plane wave, the arrival direction of the target signal is known, and if it is a spherical wave, the position of the target signal source is known, then the condition of assumption - is satisfied. It is. Furthermore, typical examples of audio signals having silent time intervals that satisfy the assumption - are voice signals and music signals. Now, the determination of the weighting coefficient is carried out using the following procedure under conditions that satisfy the assumption - that is, when there is no target signal and only the noise to be suppressed is received by the N microphone elements. Ru. First, the virtual target signal generator 5 generates the virtual target signal S'(t). Then this signal
S'(t) is added to the noise received by the N microphone elements 1 1 to 1 N through the virtual signal delay circuit section 6. Here, the virtual target signal delay circuit section 6 is 1
N delay circuits 6 1 for one input S'(t)...
6N , N types of delay amounts τ 1 , . The values of the delay amounts τ 1 , ...τ N are assumed to be known, and the actual target signals are transmitted to each microphone element 1 1 ,
...1N is assumed to be a value that satisfies the relationship of the time difference when reaching N. Therefore, S'(t-τ 1 ),...
...S'(t-τ N ) - each microphone element output containing only noise u 1 (t), ..., u N
(t) in the adder circuit 3 means that a virtual target signal is emitted from the actual target signal source, and this is received along with noise by N microphone elements 1 1 ... 1 N. This corresponds to simulating the situation. Next, the signal u〓i(t) (i=1, . . . N) obtained by adding the actual noise and the virtual target signal is passed through the delay circuit 7, which has the same structure as the delay circuit 2, to the L signals XI
(t) = (x 1 (t), ... x L (t)) Obtain T. At this time,
A virtual target signal S (t
−τ 0 ) with the root mean square error E as the evaluation quantity. However, -: Time average The weighting coefficient 〓 is determined based on the least squares principle so as to minimize this. The fact that equation (3) is zero indicates that the noise from the microphone elements 1 1 . . . 1 N is completely suppressed. Since equation (3) is a quadratic function of hi, by partially differentiating it with respect to hi and solving it by setting it to 0, it is possible to find the weighting coefficient 〓 that gives the minimum value of the evaluation amount E as shown below. ∂E/∂〓=∂/∂〓|′(− 0 )−〓 T XI()
| 2 = ∂/∂〓(′(− 0 ) 2 −2〓 T ′(− 0 )XI()+〓 T 〓x〓)=−
2'(- 0 )XI()+2〓x〓=0(4) However, In this way, using the correlation matrix 〓x of each xi(t) (i=1, . . . , L), the weight addition unit 4 performs weight addition using the weighting coefficient 〓 expressed by equation (5). For example, it is possible to obtain an output y(t) in which noise components are suppressed. Here, if it is possible to use exactly the same signal as the target signal actually received as the virtual target signal, the obtained weighting coefficient will be the optimal coefficient in the sense of minimizing the square error for the actual target signal. It's summery. However, in such a case, the optimal solution would be to output the virtual target signal itself, which is unrealistic. Furthermore, if a signal similar to the actual target signal, such as a pseudo-voice for voice, is used as the virtual target signal, it is possible to obtain coefficients close to the optimal solution in the sense of minimizing the squared error. However, if the frequency power spectrum of the actual target signal is not flat, optimization in the sense of minimizing the squared error using a virtual target signal with a similar power spectrum is mainly performed on frequency components with large power. You will be killed. As a result, the frequency sensitivity of this method to the target signal is flat in the frequency band where the power of the target signal is large;
It does not level out in frequency bands with small power. Therefore, as a first method to improve this point, a signal (for example, white noise) having a flat power spectrum within a desired frequency band is used as the virtual target signal. As a result, uniform optimization is performed for each frequency component, resulting in a more even frequency sensitivity characteristic of the target signal. A second method is to use a signal (for example, colored noise) having a power spectrum similar to the noise to be suppressed as a virtual target signal. This method aims to achieve uniform optimization by keeping the ratio of the virtual target signal and noise constant for each frequency component, and is effective when the temporal fluctuation of the power spectrum of the noise is small. The frequency sensitivity characteristics can be flattened. By selecting the virtual target signal as described above and solving equation (5), it is possible to obtain a preferable weighting coefficient, but 〓
If the correlation matrix 〓 x of (t) is not regular, the inverse matrix 〓 −1 x does not exist, and Equation (5) cannot be calculated. Therefore, as a first method to solve this problem, it is possible to use the generalized inverse matrix 〓 + x instead of 〓 -1 x . Here, the generalized inverse matrix 〓 + x is the orthogonal matrix that orthogonally decomposes the symmetric matrix 〓 x,
The column vector is 〓i(i=1,...L)(〓=
(〓 1 , ...〓 L )), When expressed as This is expressed as Further, as a second method for the case where 〓x is not regular, a method can be considered in which uncorrelated noise is added to each XI(t) to make 〓x regular. This method is 〓 -1 instead of x This corresponds to using q, and when q is sufficiently small, it corresponds to providing an approximate optimal solution. Furthermore, as a method for determining the weighting coefficient, it is also possible to use the SN ratio as the evaluation quantity and based on the principle of minimizing this. The output XI(t) of the delay circuit section 7 is calculated using the virtual target signal component 〓(t) and the noise component 〓(t), x(t)=〓(t)+〓(t) However, 〓(t )=(S 1 (t), . . . , S L (t)) T 〓(t)=(n 1 (t), . . . , n L (t)) T. The power of the signal obtained by adding the weight with the coefficient 〓 is, assuming that the noise and the virtual target signal are uncorrelated, However, it can be expressed as (〓x s )ij=()・() (〓x N )ij=()・(). Here is the SN after adding the load.
The ratio, When defined, 〓 that maximizes the S/N ratio can be found as follows. First of all, 〓xs, 〓x N
Since both are symmetric matrices, there exists a regular matrix 〓 that satisfies the following relationship. Therefore, by performing variable conversion of the coefficients as shown below 〓=〓 -1 〓 (12), the SN ratio becomes It can be expressed as At this time α M αi (i=
1,...L), then the g that maximizes the SN ratio is clearly g = (g 1 , g 2 , ..., g L ) T gi = 1 i = M 0 i≠M (14), From this, the load coefficient that maximizes the SN ratio is
can be obtained using the relationship 〓=〓〓 (15). As a first means of realizing the invention described above, there is a method of configuring the entire system as a digital system. Figure 4 shows its configuration. In Figure 4, the first
Parts corresponding to those in the figure are given the same reference numerals. Each output of the microphone elements 1 1 . The output of the load adder 4 is converted into an analog signal by the D/A converter 14 and output. An embodiment of the delay circuits 2 and 7 in this configuration is shown in FIG. The delay unit 111 consists of an M-stage shift register 15, and an output is derived from each shift stage. The other delay units are similarly configured. As shown in FIG. 6, the load adder 4 multiplies the outputs x〓 1 (n ) , . . . x〓 L (n) of the delay circuit 2 by coefficients h 1 . is,
The results are added by an adder 17. In FIG. 4, the weighting factor determination unit 8 is a processor having calculation ability, and obtains the weighting factor 〓 by directly calculating the above-mentioned equation (5) or (15). In addition to the method described above, various successive approximation methods can be used to determine the weighting coefficient. When using the successive approximation method, special attention must be paid to the convergence of the algorithm, but on the other hand, the above equation (5) or (15)
It is possible to obtain the weighting coefficient 〓 with a smaller amount of calculation and memory than directly calculating the formula. The configuration in this case is shown in FIG. In FIG. 7, parts corresponding to those in FIG. 4 are given the same reference numerals. The output of the delay circuit 7 is input to a load adder 18 which is the same as the load adder 4, and is also input to a sequential load coefficient determiner 19. The output of the weight adder 18 is added to the output of the delay element 9 by an adder 21, and the result is input to the weight factor determiner 19. The load coefficients of the load adders 4 and 18 are controlled by the determined load coefficient. When using a method known as the steepest descent method or LMS algorithm as a successive approximation method that uses the root mean square error as an evaluation quantity, the weighting coefficient 〓(n) at each time (where n is a parameter representing time) is Shape load coefficient determining section 1
9, the following formula〓(n)=〓 (o-1) +k s XI (o-1)・l (o-1) (16) However, l (o-1) =S′ (o-0 ) −〓 Calculated by T (o-1)・XI (o-1) . As a second means for realizing the present invention, there is a method in which the entire system is constructed from an analog system. An example of the configuration in this method is shown in FIG. 1, and an example of the element configuration of each part is as follows. First, the configurations of the delay circuits 2 and 7 are shown in FIG. 2, and each delay element is realized by an analog delay element such as a BBD or a CCD. The load adder 4 has the same configuration as the digital system shown in FIG. 6, except that the multiplier 16 in FIG. 6 is replaced with an analog multiplier and the adder 17 is replaced with an analog adder. Also, when determining the load coefficient in an analog system,
It is difficult to perform operations such as calculating the inverse matrix. Therefore, the load coefficients are determined by a successive approximation method, and the load coefficient determining section 8 in FIG. 1 is realized, for example, by the circuit configuration shown in FIG. 8. That is, the output XI(t) of the delay circuit 7 is supplied to L analog multipliers 23 and L analog correlators 24. The outputs of the L analog multipliers 23 are added by an analog adder 25, and the outputs thereof and the output of the delay element 9 are added by an adder 26 and supplied to each correlator 24. Each correlator 24
The outputs of L are passed through analog multipliers 27 respectively.
is supplied to two integrators 28. These integrators 28
A weighting coefficient is then obtained and supplied to the multiplier 23. This circuit satisfies the following equation dhi(t)/dt= s ()·(), which is a successive approximation equation for the weighting coefficient in a continuous system when the root mean square error is used as the evaluation quantity. Moreover, as a third means to realize this invention,
A configuration combining digital circuits and analog circuits is conceivable. As an example of this method, for example, the first
A method may be considered in which the portion consisting of the delay circuit 2 and the load adder 4 in the figure is configured with an analog circuit, and the other portions related to determining the weight coefficient are configured with a digital system. Now, as described above, in order for the device of the present invention to perform the desired operation, the following two assumptions are made: The arrival time difference of the target signal between each microphone element is known. (Assumption-) There is a silent section in the target signal, and only the noise to be suppressed is received at that time. need to be satisfied. However, if the level of the noise is lower than the level of the target signal and it can be considered that only the target signal is being received, or if there is a silent period in the noise, (Assumption -) is satisfied by adding means for detecting the arrival time difference of the target signal, an example of which will be described below. First, each microphone element output signal u 1 (t),...
Compute the cross-correlation function between u N (t). and,
Cross-correlation function φsij(τ) between ui(t) and uj(t)
If the value τ M ij of the value τ that takes the maximum value is found, it can be regarded as the arrival time difference of the target signal between the microphone element i and the microphone element j. The detection of this arrival time difference τ M ij is performed using the digitized signal ui
(n), uj(n) (n=..., -1, 0, 1,...)
When determining τ M ij with high accuracy, the sampling frequency of the signal must be made high enough, or
Alternatively, it is necessary to apply an interpolation method to the cross-correlation function obtained from a low sampling frequency and then find the arrival time difference. This result (assumption-)
is satisfied. An embodiment of the present invention based on the above concept is shown in FIG. In FIG. 9, a target signal arrival time difference detection section 29 is provided in the configuration shown in FIG. 4, and the output of the A/D converter 13 is branched into this. Each delay amount of the delay circuit section 6 is set based on the detection result of the detection section 29. As shown in FIG. 10, the target signal arrival time difference detection section 29 inputs each output of the A/D converter 13 to a cross-correlation function calculation section 31 and calculates the difference between the microphone outputs ui(n) and uj(n). The cross-correlation function φsij (τ) is calculated, and the maximum value detection unit 32 detects the value τ M ij of τ at which φsij (τ) takes the maximum value. Next, in the virtual target signal delay amount determination unit 34, τ M ij (i=1, 2,...N, j=
Using a value sufficiently larger than 1, 2,...N),
The virtual target signal delay amount 〓=(τ 1 , . . . , τ N ) T is determined by the following formula τi=〓−τ M ij (j is an arbitrary value of 1jN). Next, a case will be described in which the operation of the apparatus of the present invention is completely automated. One way to make the operation of this device automatic is to add means for determining whether substantially only noise is being received or whether substantially only a target signal is being received. As a result of the determination, in a state in which only the target signal is substantially being received, the arrival time difference of the target signal is known by, for example, a method using the above-mentioned cross-correlation function, and the assumption - is satisfied. Also,
It is clear that the assumption - is satisfied at a time when it is determined that substantially only noise is being received. FIGS. 11 and 12 show an embodiment of the present invention in which it is determined whether only noise is being received or if only a target signal is being received. FIG. 11 shows an embodiment of the present invention in a conference telephone system, and the output of the multipoint sound receiving section 35 is inputted to the multipoint sound receiving system section 36 according to the present invention described above. The speaker 38 is driven by the signal on the reception signal path 37,
The output of the multipoint sound receiving system section 36 is transmitted through the transmitting signal path 39.
It is output from FIG. 12 shows an embodiment of the present invention applied to a loudspeaker telephone, in which the multipoint sound receiving section 35 is outputted to the transmission signal path 39 through the multipoint sound receiving system section 36 according to the present invention. A speaker 38 is driven by a signal from the reception signal path 37. A dial 41 is provided. In these two examples, the sound emitted from the speaker 38 is received by the multi-point sound receiving section 35, and the transmission signal path 3 receives the sound emitted from the speaker 38.
9, various problems will occur, such as howling and deterioration of call quality. Therefore, in these two examples, the noise is the voice generated from the speaker 38, and the target signal is the voice uttered by the speaker. Therefore, since there is always a silent section in speech, there are states in which only noise exists and states in which only the target signal exists. By monitoring the input level (received signal level) to the speaker 38, for example, even if the received signal level is 0, the microphone (multipoint sound receiving section 3
5) When the output level increases, it means that only the target signal is present, the received signal level is above a certain level, and the microphone output level is equal to the received signal level, the electroacoustic conversion amount of the speaker 38, and the speaker 38. - If the amount of acoustic coupling between the microphones is less than a value determined by the microphone sensitivity, it is possible to determine that only noise exists. As a result, this device can perform desired operations, suppress noise, and selectively receive target signals. Further, if the position of the target signal sound source or the position of the noise source can be considered to be substantially fixed, one or two of the above assumptions can be satisfied by prior learning. For example, in the integrated loudspeaker telephone shown in FIG. 12, the noise is the received voice emitted from the speaker 38, the vibration of the body that accompanies it, and the vibration that the sound pressure inside the body gives to the microphone element. The positional relationship of this noise source with respect to each microphone element is substantially fixed. Therefore, a test signal (for example, white noise, colored noise, etc.) is generated from the speaker 38 in advance and received.
If it is stored in this system section 36 (assuming -
) will be satisfied. Therefore, during a call, if only the difference in arrival time of the target signal is detected when the received signal level is substantially zero,
This device is capable of desired operation. Furthermore, the following means can be considered as an embodiment in which the load coefficient is semi-fixed. First, assuming that the position of the noise source is substantially fixed, only noise is generated and stored in the system in advance. Next, the expected position of the target signal source is determined, a speaker is installed at that position, an acoustic signal is generated, the sound is received at multiple points, and a weighting coefficient is determined based on this and the previous noise. Next, a speaker is installed at another position of the expected target signal, and the load coefficient is determined in the same manner. In this way, K expected target signal source positions
p 1 , p 2 , ...K weighting coefficients 〓 1 , corresponding to p K
2 ,...〓 K is determined in advance. If the system section 36 operates using the weighting coefficient 〓i, it is guaranteed that when the target signal source is at position pi, noise will be suppressed and extraction of the target signal will be maximized. Therefore, if the number of expected positions of the target signal source is made sufficiently large, the position of the target signal will be approximately in the vicinity of one of the positions pj. Therefore, by creating K outputs y 1 =〓 1 T XI,...y K =〓 T K Desired operation becomes possible by outputting a component that is expected to contain a large amount of components. This method involves preparing K directional microphones that are less sensitive to noise but more sensitive to the target signal at position pi, and then selectively using these K microphones. corresponds to Also, as the output of this method, if we set y= Ki=1 yi , then the output is low sensitivity to noise and high sensitivity to any position within a certain range of the expected target signal. A sound receiving system is configured. Next, we will discuss the simulation results and experimental results conducted to confirm the effectiveness of this method. First, the sound field in the simulation was assumed to be a two-dimensional sound field, and the noise and target signals were each plane waves. As shown in Fig. 13, the directions of arrival of the noise and the target signal are two directions (θ
= 60°, 100°), the target signal is in one direction (θ = -60°)
It was assumed that it would arrive from In addition, the band of the signal to be considered is 300 to 3000 Hz, and the two noises are independent noises that have a white spectrum in that band. As shown in Fig. 14A, B, and C, the components of this device are five microphone elements, three microphone elements arranged at equal angles on a circle with a radius of 8.5 cm on a plane, and microphone elements with a radius of 8.5 cm. We considered two pieces arranged at intervals. The configuration of the device is based on the configuration of a digital system as shown in FIG.
The sampling frequency of the A converter 14 was 8KHz. The delay time of each delay element in the delay circuit 2 was a sampling period (125 μsec), and the number of delay elements for each microphone input was eight. Further, the virtual target signal generator 5 generated a digital virtual target signal having a white spectrum in a band of 300 to 3000 Hz. Assuming that the above-mentioned (assumption-) and (assumption-) are satisfied, the operation of this device with various microphone arrangements shown in FIG. 14 is simulated to calculate the load coefficient
I did the calculations. The directional sensitivity pattern of this multipoint sound receiving device when using the load coefficient 〓 obtained by arrangement A is
It is shown in Figure 5. As shown in Fig. 13, although the direction of maximum directional sensitivity and the direction of arrival of the target signal are not necessarily the same, the present invention automatically creates a directional sensitivity pattern in which the sensitivity of the direction of arrival of the two noises is sufficiently reduced. It can be seen that it is formed. Further, FIG. 16 shows the frequency sensitivity characteristics of this device for each direction of arrival when using the weighting coefficients obtained by the arrangement of each microphone element. 16th
Figure A shows the frequency sensitivity characteristics when arrangement A is used, and it can be seen that the noise component is suppressed by 20 dB or more compared to the target signal component, confirming the effectiveness of the present invention. Next, when arrangement B was used, when the directions of arrival of noise were set to two directions as shown in FIG. 13, almost no noise component suppression effect was obtained. This is because this device performs noise suppression by utilizing the difference in the direction of arrival of the noise and the target signal, and the direction is symmetrical to the line connecting the two microphone elements (θ
This shows that when the noise and the target signal arrive from angles of θ=60° and θ=−60°, the directions of arrival cannot be distinguished. If the microphone elements are arranged in a straight line, this problem cannot be solved even if the number of microphone elements is increased as long as the arrangement is one-dimensional. Therefore, it is desirable to arrange the microphone elements in a multi-dimensional manner, unless this poses a practical problem, in order to improve separation and detection of the direction of arrival of the noise and the target signal. However, if the arrival directions of the noise and the target signal are not symmetrical with respect to the line connecting the two microphone elements, a sufficient noise suppression effect can be obtained even with two microphone elements. FIG. 11B shows the result when arrangement B is used and the direction of arrival of noise is set to only one direction (θ=110°), and this can be confirmed. Next, the results when the number of microphones is three as shown in arrangement C are shown in FIG. 16C. 1st
As can be seen by comparing FIG. 6C with FIG. 16A (in the case of five microphone elements), in the case of FIG. 16C, the frequency sensitivity characteristics with respect to the target signal are not flat. As these two results show, in general, increasing the number of microphone elements allows for more detailed control and improves the performance of the device. However, in practice, it is necessary to determine the number of microphones corresponding to the size of the arrangement, taking into consideration the degree of performance improvement, possibility of implementation, cost, etc. Next, we will discuss the experimental results. The experiment was conducted in a room with a reverberation time of 0.6 seconds. The experimental conditions are the first
7, a multi-point sound receiving unit 1 having four microphone elements is installed on a desk 44, and a speaker 4
5 and speaker 46 were placed at a distance of 60 cm and 50 cm from the center of the four microphone elements, respectively. The four microphone elements were arranged on the circumference of a circle with a radius of 8.5 cm, three at equal angles, and one at the center of the circle. From the speaker 45 as a target signal
A voice with a band limit of 300 to 3000 Hz was emitted, and a white noise with a band limit of 300 to 3000 Hz was emitted as noise from the speaker 46. In determining the weighting coefficient, the outputs of the speakers 45 and 46 were temporarily stopped, and only noise and only the target signal were received, respectively. The resulting load coefficient〓
Speaker 45 and speaker 4 of this device using
The sensitivity to 6 is shown in FIG. From this figure, the sensitivity to noise (speaker 46) is 20 dB lower than the sensitivity to the target signal (speaker 45) (curve 48), as shown by curve 47, and 7 to 7 dB even in higher frequencies.
It was found that the noise was reduced by 8dB, suppressing the noise,
It was confirmed that the effect of this invention in extracting the target signal was exhibited. However, as can be seen from FIGS. 16 and 18, the frequency sensitivity characteristics of this device to the target signal component are not necessarily flat. In order to improve this point, FIG. 19 shows an embodiment of a method for correcting the frequency sensitivity characteristic by providing an equalizer at the final stage of this device. The difference in FIG. 19 from FIG. 1 is that an equalizer 49 is provided, and the frequency sensitivity characteristics for the target signal component are expressed as, for example, virtual target signal delay amount = (τ 1 , τ 2 , ...τ N )
It is calculated from the specified load coefficient 〓, and its inverse characteristic is assumed. In the above, the delay circuits 2 and 7 may be used in common, and one may be used by switching. It is better that the number of delay elements 11 in the delay circuits 2 and 7 is larger, and the delay time of each one is shorter. In any case, the delay amount of the series delay elements as a whole is made larger than the sound wave propagation time between the farthest elements among the microphone elements 1 1 . . . 1 N. As explained above, the device of this invention obtains an output by adding the weight after passing the signals received at multiple points through a delay circuit. In this method, only the arrival time difference between the signals and the noise received when the target signal is in a silent section are used as information. Therefore, even if the arrival direction of the noise or the properties of the target signal are unknown, or even if the target signal source or noise source moves, the weighting coefficients can be adaptively changed to suppress the noise component and extract the target signal. It is possible to do this. Another advantage is that there is no need to assume the plane wave nature of sound waves, which is required in conventional array microphone design theory, and sufficient noise suppression effects can be obtained as long as the actual microphone arrangement is a dozen or more centimeters in size. It has been experimentally confirmed that there is.

【図面の簡単な説明】[Brief explanation of drawings]

第1図はこの発明装置の一実施例を示すブロツ
ク図、第2図は遅延回路2の一例を示す図、第3
図は目的信号の到達時間差の説明図、第4図はこ
の発明装置をデジタル系で実現した一実施例を示
すブロツク図、第5図はこの発明装置をデイジタ
ル系で実現した場合の遅延回路2の一実施例を示
す図、第6図はこの発明装置をデイジタル系で実
現した場合の荷重加算部4の一実施例を示す図、
第7図はこの発明装置における荷重係数を遂次近
似法で決定する方法をデイジタル系で実現した一
実施例を示すブロツク図、第8図はこの発明装置
において荷重係数を遂次近似法で決定する方法を
アナログ系で実現するための荷重係数決定部8の
一実施例を示すブロツク図、第9図はこの発明装
置において目的信号の到達時間差の検出手段を有
する場合の一実施例を示すブロツク図、第10図
はその目的信号の到達時間差の検出手段29の一
例を示すブロツク図、第11図は会議電話システ
ムにおけるこの発明の実施例を示す概略図、第1
2図は拡声電話機におけるこの発明の実施例を示
す概略図、第13図はシミユレーシヨン実験にお
ける雑音と目的信号の到来方向を示す図、第14
図はシミユレーシヨン実験におけるマイクロホン
配置の図、第15図はシミユレーシヨン結果のこ
の装置の指向性感度パターンを示す図、第16図
はシミユレーシヨン結果の周波数感度特性図、第
17図は実験条件を示す図、第18図は実験結果
の周波数感度特性図、第19図はこの発明装置に
等化器を付加した例を示すブロツク図である。 1:複数のマイクロホンよりなる多点受音部、
2,7:遅延回路、4,18:荷重加算部、5:
仮想目的信号発生器、6:仮想目的信号遅延回
路、8:荷重係数決定部、9:遅延素子、13:
A/D変換器、14:D/A変換器、19:遂次
形荷重係数決定部、29:目的信号の到達時間差
検出部。
FIG. 1 is a block diagram showing one embodiment of the device of the present invention, FIG. 2 is a diagram showing an example of the delay circuit 2, and FIG.
The figure is an explanatory diagram of the arrival time difference of the target signal, Figure 4 is a block diagram showing an embodiment of this invention device realized in a digital system, and Figure 5 is a delay circuit 2 when this invention device is realized in a digital system. FIG. 6 is a diagram showing an embodiment of the load adding section 4 when the device of the present invention is implemented in a digital system.
Fig. 7 is a block diagram showing an example of a digital system implementing the method of determining the load coefficient in the device of this invention by the successive approximation method, and Fig. 8 shows the method for determining the load coefficient in the device of the invention by the successive approximation method. FIG. 9 is a block diagram showing an embodiment of the weighting coefficient determining section 8 for realizing the method of determining the signal in an analog system. FIG. 10 is a block diagram showing an example of the means 29 for detecting the arrival time difference of the target signal, and FIG. 11 is a schematic diagram showing an embodiment of the present invention in a conference telephone system.
Fig. 2 is a schematic diagram showing an embodiment of the present invention in a public address telephone; Fig. 13 is a diagram showing the direction of arrival of noise and a target signal in a simulation experiment; and Fig. 14.
The figure is a diagram of the microphone arrangement in the simulation experiment, Figure 15 is a diagram showing the directional sensitivity pattern of this device as a result of the simulation, Figure 16 is a diagram showing the frequency sensitivity characteristic of the simulation result, and Figure 17 is a diagram showing the experimental conditions. FIG. 18 is a frequency sensitivity characteristic diagram of experimental results, and FIG. 19 is a block diagram showing an example in which an equalizer is added to the device of the present invention. 1: Multi-point sound receiving section consisting of multiple microphones,
2, 7: Delay circuit, 4, 18: Load addition section, 5:
Virtual target signal generator, 6: Virtual target signal delay circuit, 8: Loading coefficient determination unit, 9: Delay element, 13:
A/D converter, 14: D/A converter, 19: Sequential weighting coefficient determination section, 29: Target signal arrival time difference detection section.

Claims (1)

【特許請求の範囲】 1 音響信号を受音する複数のマイクロホン素子
と、 これらマイクロホン素子の出力信号を互に異な
る時間遅延させて複数の信号を出力する第一の遅
延手段と、 これら複数の出力信号を荷重加算して、上記複
数のマイクロホン素子により受音された音響信号
中より不要な音響信号を抑圧して抽出を必要とす
べき音響信号を抽出する手段と、 仮想目的信号を電気的に発生する手段と、 その発生手段から発生する仮想目的信号に適切
な時間遅延を付加した複数の信号を出力する第二
の遅延手段と、 第二の遅延手段より出力される複数の遅延信号
と上記複数のマイクロホン素子により受音された
信号とを加算する手段と、 その加算手段の出力信号に上記複数のマイクロ
ホン素子の出力信号に対する第一の遅延手段と同
様の遅延を付加した複数の信号を出力する第三の
遅延手段と、 その遅延手段の出力信号と仮想目的信号との相
関関係を求め、あらかじめ定められた評価量が最
小となるように、その相関関係より上記荷重加算
手段の係数を設定する手段とを具備する多点受音
装置。
[Scope of Claims] 1. A plurality of microphone elements that receive acoustic signals; a first delay means that outputs a plurality of signals by delaying the output signals of these microphone elements by mutually different times; and a plurality of outputs of the plurality of microphone elements. means for extracting an acoustic signal that needs to be extracted by suppressing unnecessary acoustic signals from among the acoustic signals received by the plurality of microphone elements by adding the weights of the signals; a second delay means for outputting a plurality of signals obtained by adding an appropriate time delay to the virtual target signal generated from the generation means; a plurality of delayed signals output from the second delay means; means for adding signals received by a plurality of microphone elements, and outputting a plurality of signals in which a delay similar to that of the first delay means for the output signals of the plurality of microphone elements is added to the output signal of the addition means. find the correlation between the third delay means, the output signal of the delay means, and the virtual target signal, and set the coefficient of the weight addition means based on the correlation so that a predetermined evaluation amount is minimized. A multi-point sound receiving device comprising means for.
JP57182355A 1982-10-18 1982-10-18 Multipoint sound receiving device Granted JPS5972295A (en)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP57182355A JPS5972295A (en) 1982-10-18 1982-10-18 Multipoint sound receiving device
US06/539,891 US4536887A (en) 1982-10-18 1983-10-07 Microphone-array apparatus and method for extracting desired signal
CA000439141A CA1208758A (en) 1982-10-18 1983-10-17 Microphone array apparatus and method for extracting desired signal
NLAANVRAGE8303589,A NL190568C (en) 1982-10-18 1983-10-18 Microphone configuration.

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP57182355A JPS5972295A (en) 1982-10-18 1982-10-18 Multipoint sound receiving device

Publications (2)

Publication Number Publication Date
JPS5972295A JPS5972295A (en) 1984-04-24
JPH0126598B2 true JPH0126598B2 (en) 1989-05-24

Family

ID=16116859

Family Applications (1)

Application Number Title Priority Date Filing Date
JP57182355A Granted JPS5972295A (en) 1982-10-18 1982-10-18 Multipoint sound receiving device

Country Status (1)

Country Link
JP (1) JPS5972295A (en)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6457899A (en) * 1987-08-28 1989-03-06 Central Res Inst Elect Microphone and speaker
JP5034607B2 (en) * 2006-11-02 2012-09-26 株式会社日立製作所 Acoustic echo canceller system
US8526632B2 (en) * 2007-06-28 2013-09-03 Microsoft Corporation Microphone array for a camera speakerphone
US8330787B2 (en) 2007-06-29 2012-12-11 Microsoft Corporation Capture device movement compensation for speaker indexing
US8165416B2 (en) 2007-06-29 2012-04-24 Microsoft Corporation Automatic gain and exposure control using region of interest detection
JP5382745B2 (en) * 2009-07-08 2014-01-08 株式会社日立製作所 Noise removing apparatus and noise removing method
EP2642768B1 (en) * 2010-12-21 2018-03-14 Nippon Telegraph And Telephone Corporation Sound enhancement method, device, program, and recording medium
US10951859B2 (en) 2018-05-30 2021-03-16 Microsoft Technology Licensing, Llc Videoconferencing device and method

Also Published As

Publication number Publication date
JPS5972295A (en) 1984-04-24

Similar Documents

Publication Publication Date Title
JP3701940B2 (en) System and method for processing a signal emitted from a target signal source into a noisy environment
EP3384684B1 (en) Conference system with a microphone array system and a method of speech acquisition in a conference system
US9961437B2 (en) Dome shaped microphone array with circularly distributed microphones
US4536887A (en) Microphone-array apparatus and method for extracting desired signal
US8204247B2 (en) Position-independent microphone system
US10331396B2 (en) Filter and method for informed spatial filtering using multiple instantaneous direction-of-arrival estimates
US9591404B1 (en) Beamformer design using constrained convex optimization in three-dimensional space
CA2407855C (en) Interference suppression techniques
KR101715779B1 (en) Apparatus for sound source signal processing and method thereof
EP2749042B1 (en) Processing signals
KR100831655B1 (en) Method for adjusting adaptation control of adaptive interference canceller
US8615392B1 (en) Systems and methods for producing an acoustic field having a target spatial pattern
WO2005065012A2 (en) A method for efficient beamforming using a complementary noise separation filter
KR20140089580A (en) Near-field null and beamforming
WO2018158558A1 (en) Device for capturing and outputting audio
KR101613683B1 (en) Apparatus for generating sound directional radiation pattern and method thereof
JP2009141560A (en) Sound signal processor, and sound signal processing method
JPH0126598B2 (en)
JP2007027939A (en) Acoustic signal processor
Jian et al. Performance study of time delay estimation in a room environment [microphone arrays]
JP2002261659A (en) Multi-channel echo cancellation method, its apparatus, its program, and its storage medium
JPH0435300A (en) Sound reception processor
Masgrau et al. Performance comparison of several adaptive schemes for microphone array beamforming.
Abe et al. Estimation of the waveform of a sound source by using an iterative technique with many sensors
Zhang et al. Adaptive null-forming algorithm with auditory sub-bands