JP3355598B2 - Sound source separation method, apparatus and a recording medium - Google Patents

Sound source separation method, apparatus and a recording medium

Info

Publication number
JP3355598B2
JP3355598B2 JP25231297A JP25231297A JP3355598B2 JP 3355598 B2 JP3355598 B2 JP 3355598B2 JP 25231297 A JP25231297 A JP 25231297A JP 25231297 A JP25231297 A JP 25231297A JP 3355598 B2 JP3355598 B2 JP 3355598B2
Authority
JP
Japan
Prior art keywords
band
sound source
signal
channel
sound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP25231297A
Other languages
Japanese (ja)
Other versions
JPH10313497A (en
Inventor
弘行 松井
豊 西野
真理子 青木
茂明 青木
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority to JP24672696 priority Critical
Priority to JP7667297 priority
Priority to JP7669597 priority
Priority to JP8-246726 priority
Priority to JP9-76695 priority
Priority to JP9-76672 priority
Priority to JP25231297A priority patent/JP3355598B2/en
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Publication of JPH10313497A publication Critical patent/JPH10313497A/en
Application granted granted Critical
Publication of JP3355598B2 publication Critical patent/JP3355598B2/en
Anticipated expiration legal-status Critical
Application status is Expired - Lifetime legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To separate sound accurately into respective components and to attain real time processing. SOLUTION: A difference &Delta;&tau; in time required for a sound signal to travel from a sound source to microphones 1, 2 is detected from output channel signals L, R of the microphones 1, 2, where the signals L, R are divided into frequency bands L(f1 )-L(fn ), R(f1 )-R(fn ) by Fourier transform, and an arrival time difference &Delta;&tau;i (i=1, 2,...n) to the microphones 1, 2 of a corresponding frequency band of the L(f1 )-L(fn ), R(f1 )-R(fn ) and a signal level difference &Delta;Li are detected. Then L(f1 )-L(fn ), R(f1 )-R(fn ) are divided into low frequencies f1 <1/(2&Delta;&tau;), medium frequencies 1/(2&Delta;&tau;)<f1 <1/&Delta;&tau;, and high frequencies fi >1/&Delta;&tau;, and it is determined from which sound source the L(fi ), R(fi ) arrive, based on &Delta;&tau;i , in the case of low frequencies, on &Delta;Li , &Delta;&tau;i in the case of medium frequencies, and on &Delta;Li in the case of high frequencies, and the result is outputted for each sound source and the output is subject to inverse Fourier transform by each sound source and the results are synthesized.

Description

【発明の詳細な説明】 DETAILED DESCRIPTION OF THE INVENTION

【0001】 [0001]

【発明の属する技術分野】この発明は音声信号源や各種環境音源などの複数の音源から発せられた複数の音響信号が混ざった信号から少なくとも1つの音源の信号を分離抽出する方法、その方法に用いた音源分離装置、およびその方法をコンピュータにより実行するためのプログラを記録した記録媒体に関する。 BACKGROUND OF THE INVENTION Method This invention for extracting separating at least one sound source signals from a plurality of sound signals are mixed signals emitted from a plurality of sound sources, such as audio signal source and various environmental sound, its method sound source separation apparatus using, and a recording medium which programs were recorded for executing the method by a computer.

【0002】この種の音源分離装置は、例えばテレビ会議における収音装置、騒音環境下で発声した音声信号の伝送のための収音装置、音源の種類を識別する装置の収音装置など各種のものに適用される。 [0002] This kind of sound source separation apparatus, for example, the sound collection device in the video conference, and collection device for the transmission of voice signals uttered in noisy environments, such as the sound collection device of the apparatus identifies the type of sound sources various It applies to those. 従来の音源分離技術は、周波数領域において各信号の基本周波数を推定し、調波構造を抜き出すことにより、同一音源からの成分を集めて合成する方法が用いられてきた。 Conventional sound source separation techniques, estimates the fundamental frequency of the signals in the frequency domain, by extracting the harmonic structure, a method of synthesis have been used to collect components from the same source.

【0003】しかしこの方法では、(1)分離可能な信号が、音声の母音や楽音のような調波構造を持つものに限定されるという問題があった、(2)基本周波数の推定は一般に長い処理時間を必要とするため、実時間で音源を分離することは困難であった、(3)調波構造の推定誤りなどにより、抽出された信号に他の音源の周波数成分が混じり、それが雑音として知覚されるため分離精度が不十分であった。 [0003] However, in this method, (1) separable signals, there is a problem that is limited to those with a harmonic structure as a voice vowels and tone, (2) estimation of the fundamental frequency generally requires a long processing time, separating the sound sources in real time has been difficult, (3) due to estimation errors of the harmonic structure, the extracted signal mixed frequency components of other sound sources, it separation accuracy for but is perceived as noise is insufficient.

【0004】 [0004]

【発明の解決しようとする課題】この発明の目的は調波構造を持たない音源の音響信号でも分離抽出することとし、つまり音源の種類に依存することなく音源分離を可能とし、かつ実時間での音源分離を可能とする方法、装置、及びプログラム記録媒体を提供することにある。 A problem you attempt OF THE INVENTION An object of the invention is directed also to separate and extract with excitation of an acoustic signal without a harmonic structure, that is it possible to sound source separation without depending on the type of the sound source, and in real time how to enable the sound source separation is to provide apparatus and a program recording medium.

【0005】この発明の他の目的は分離精度が高く、雑音の混入が少ない音源分離方法、装置及びプログラム記録媒体を提供することにある。 Another object of the invention has high separation accuracy, the sound source separation method contamination is less noise is to provide an apparatus and a program recording medium.

【0006】 [0006]

【課題を解決するための手段】この発明の音源分離方法は互いに離して設けられた複数のマイクロホンを用い、 Sound source separation method of the Means for Solving the Problems] The present invention uses a plurality of microphones arranged apart from each other,
上記各マイクロホンの各出力チャネル信号を、帯域分割過程で複数の周波数帯域に分割し、その各帯域には主として1つの音源信号成分のみ存在するようにし、これら分割された各出力チャネル信号の各同一帯域ごとに、上記複数のマイクロホンの位置に起因して変化する、マイクロホンに到達する音響信号のパラメータ、つまりレベル(パワー)、到達時間の値の差を、帯域別チャネル間パラメータ値差として検出し、上記各帯域の帯域別チャネル間パラメータ値差にもとづき、その帯域の上記帯域分割された各出力チャネル信号の何れがいずれの音源から入力された信号であるかを音源信号判定過程で判定し、この音源信号判定過程の判定にもとづき、上記帯域分割された各出力チャネル信号から、同一音源から入力された信号を少なく Each output channel signals of each microphone, is divided into a plurality of frequency bands by the band division process, so as to present essentially only one source signal component in the respective bands, each same of each divided output channel signals for each band, changes due to the position of the plurality of microphones, the parameter of the acoustic signals reaching the microphone, i.e. the level (power), the difference between the value of the arrival time is detected as between the per-band channel parameter value differences , based on the band-by-band channel between the parameter value difference of each band, determines whether a signal either is input from any source of each output channel signal above band division in the band sound source signal determination process, based on the determination of the sound source signal determination process, from each output channel signal the band division, less the signal input from the same source も1つ、音源信号選択過程で選択し、その音源信号選択過程で同一音源からの信号として選択された、複数の帯域信号を音源信号として音源合成過程で合成する。 Also one selected by the sound source signal selection process, selected by the sound source signal selection process as the signal from the same sound source, synthesized by the sound source synthesis process a plurality of band signals as a sound source signal.

【0007】この発明の音源分離方法の実施例によれば、上記帯域分割過程で分割された各出力チャネル信号の帯域別レベルをそれぞれ検出し、これらが検出された各帯域別レベルを同一帯域についてチャネル間で比較した結果にもとづき発音をしていない音源を検出し、その発音をしていない音源の検出信号により、上記音源合成過程で合成された音源信号のうち、上記発音していない音源と対応する合成信号を抑圧する。 [0007] According to an embodiment of the sound source separation method of the present invention, the per-band level of each output channel signals divided by the band division process to detect respectively, each band-by-band level it has been detected for the same band detecting a sound source which is not a sound based on a result of comparison between the channels, the detection signal of the sound source which is not the sound, of the sound source signal synthesized by the sound source synthesis process, a sound source which is not the sounding to suppress the corresponding synthetic signal.

【0008】この発明の音源分離方法の他の実施例によると、上記帯域分離過程で分割された各出力チャネル信号のそのマイクロホンへの到達時間差を同一帯域ごとに検出し、これら検出された各帯域別到達時間差を、同一帯域についてチャネル間で比較した結果にもとづき発音をしていない音源を検出し、その発音をしていない音源の検出信号により、上記音源合成過程で合成された音源信号のうち、上記発音していない音源と対応する合成信号を抑圧する。 [0008] According to another embodiment of the sound source separation method of the present invention, the arrival time difference to the microphone of the respective output channel signals divided by the band separation process was detected for each same band, each being these detection zone another arrival time difference, for the same band to detect a sound source that does not have any sound based on a result of comparison between the channels, the detection signal of the sound source which is not the sound, of the sound source signal synthesized by the sound synthesis process , to suppress the synthesized signal corresponding to the sound source that is not the sound.

【0009】 [0009]

【発明の実施の形態】図1にこの発明の実施例を示す。 DETAILED DESCRIPTION OF THE INVENTION Figure 1 shows an embodiment of the present invention.
マイクロホン1,2が間隔、例えば20cm程度をあけて配され、これらマイクロホン1,2はそれぞれ音源A,Bからの音響信号を収集して電気信号に変換する。 Microphones 1 and 2 interval, for example, disposed at an approximately 20 cm, and converts their respective microphones 1 and 2 sound source A, into an electric signal by collecting acoustic signals from B.
マイクロホン1の出力をLチャネル信号と、マイクロホン2の出力をRチャネル信号と称する。 The output of the microphone 1 and the L-channel signal, the output of the microphone 2 is referred to as R-channel signal. Lチャネル信号とRチャネル信号はチャネル間時間差/レベル差検出部3と、帯域分割部4へ供給され、帯域分割部4ではそれぞれ複数の周波数帯域信号に分割されて帯域別チャネル間時間差/レベル差検出部5と音源判定信号選別部6へ供給される。 And L channel signal and R-channel signals between channel time difference / level difference detector 3 is supplied to the band dividing unit 4, the band in the division portion 4 respectively divided into a plurality of frequency band signals by band-specific channel time difference / level difference It is supplied to the detecting section 5 and the sound source determination signal sorting unit 6. 検出部3,5の各検出出力に応じて選別部6において各帯域ごとに何れかのチャネル信号がA成分又はB成分として選別され、これら選択された帯域ごとのA成分信号、B成分信号はそれぞれ音源信号合成部7 Any channel signals for each band in a selection unit 6 in response to the detection output of the detecting unit 3, 5 is selected as component A or component B, those selected A component signal for each band, B component signals each sound source signal synthesis section 7
A,7Bでそれぞれ合成されて、音源A信号と音源B信号とに分離出力される。 A, are synthesized respectively 7B, it is separated output to the sound source A signal and the sound source B signal. 音源Aがマイクロホン2よりマイクロホン1に近いと、音源Aよりマイクロホン1に到達する信号SA1は音源Aよりマイクロホン2に到達する信号SA2より早く到達し、かつレベルが大きい、また音源Bがマイクロホン1よりマイクロホン2に近いと、音源Bからマイクロホン1,2にそれぞれ到達する信号SB1,SB2は後者が早くマイクロホン2に到達し、レベルも大きい。 When the sound source A is close to the microphone 1 from the microphone 2, the signal SA1 to reach from the sound source A to the microphone 1 is reached earlier than the signal SA2 to reach from the sound source A microphone 2, and level is high, also the sound source B is a microphone 1 When close to the microphone 2, a signal SB1 reaching respectively from the sound source B to the microphone 1, 2, SB2 latter has reached the early microphone 2, the level is large. このようにこの発明では、音源のマイクロホン1,2に対する位置に起因する両マイクロホン1,2に到達する音響信号の変化量、この例では両信号の到達時間差とレベル差を利用する。 Thus in this invention, the variation of the acoustic signal arriving at both microphones 1 and 2 due to the position relative to the microphone 1 of the sound source, in this example utilizes time difference of arrival and level difference between the two signals.

【0010】図1に示した装置は以下に示すように動作する。 [0010] device shown in FIG. 1 operates as follows. 図2に示すように、マイクロホン1,2に2つの音源A,Bからの信号が取り込まれる(S01)。 As shown in FIG. 2, two sound sources A microphone 1, the signal from B is captured (S01). チャネル間時間差/レベル差検出部3は、Lチャネル信号とRチャネル信号からチャネル間時間差またはレベル差を検出する。 Inter-channel time difference / level difference detector 3 detects the time difference or level difference between the channels from the L channel signal and R-channel signal. 時間差の検出に用いるパラメータとしては、 The parameters used for the detection of the time difference,
Lチャネル信号とRチャネル信号との相互相関関数を用いた場合で説明する。 Described in the case of using the cross-correlation function between the L channel signal and R-channel signal. 図3に示すようにまず、Lチャネル信号とRチャネル信号との各サンプルL(t),R First, as shown in FIG. 3, each sample L of the L channel signal and R-channel signal (t), R
(t)を読み込み(S02)、これらサンプル間の相互相関関数を算出する(S03)。 (T) reads (S02), calculates a cross-correlation function between the samples (S03). この算出は両チャネル信号が同一サンプル時点についての相互相関を求め、また一方のチャネル信号に対し他方のチャネル信号をサンプル時点を1つだけずらした場合、2つだけずらした場合・・・の各場合の相互相関をそれぞれ求めて相互相関関数を求める。 If this calculation is that both channel signal determined cross-correlations for the same sample point of time, also shifted by one sample period and the other channel signals to one channel signal, each case is shifted by two, ... If the cross-correlation of seeking respectively obtaining a cross-correlation function. これら相互相関を多数求め、これらをパワーで正規化したヒストグラムを作成する(S04)。 Seeking a number of these cross-correlations, it creates a histogram normalized with power (S04).
次に、ヒストグラムの累積度数順位第一位、第二位をそれぞれとる時点差Δα Next, the cumulative frequency ranking first place histogram, time difference Δα take second place respectively 1 ,Δα 2を求める(S05)。 1, determine the Δα 2 (S05).
これらの時点差Δα 1 ,Δα 2を、次式によりそれぞれチャネル間時間差Δτ 1 ,Δτ 2に変換して出力する(S06)。 These time differences [Delta] [alpha] 1, the [Delta] [alpha] 2, respectively interchannel time differences .DELTA..tau 1 by the following equation, and outputs the converted to Δτ 2 (S06).

【0011】 Δτ 1 =1000×Δα 1 /F (1) Δτ 2 =1000×Δα 2 /F (2) ただしFはサンプリング周波数であり、1000倍にするのは演算の便宜上値をある程度大きくするためである。 [0011] Δτ 1 = 1000 × Δα 1 / F (1) Δτ 2 = 1000 × Δα 2 / F (2) provided that F is the sampling frequency, since for 1000 times to some extent increase the convenience value calculation it is. 時間差Δτ 1 ,Δτ 2は、音源A,Bそれぞれの信号のLチャネル信号とRチャネル信号のチャネル間時間差である。 Time difference Δτ 1, Δτ 2 is the inter-channel time differences of the sound source A, B L-channel signal of the respective signal and the R-channel signal.

【0012】図1、2の説明に戻って帯域分割部4はL [0012] band dividing unit 4 back to the description of FIGS. 1 and 2 L
チャネル信号とRチャネル信号をそれぞれ各周波数帯域の信号L(f1),L(f2),…,(fn)と、信号R(f1),R(f2),…,(fn)に分割する(S Signal channel signal and R-channel signals, respectively each frequency band L (f1), L (f2), ..., and (fn), the signal R (f1), R (f2), ..., is divided into (fn) ( S
04)。 04). この分割は例えば各チャネル信号をそれぞれ離散的フーリエ変換して周波数領域信号に変換した後、各周波数帯域に分割することにより行う。 After conversion into a frequency domain signal This division by discrete Fourier transform, respectively each channel signal, for example, carried out by dividing each frequency band. この帯域分割は、音源A,Bの各信号の周波数特性の差から各帯域において、一方の音源の信号成分のみが主として存在する程度、音声信号の場合は、例えば20Hz帯域幅で分割する。 The band division, the sound source A, in each band from the difference between the frequency characteristics of signals B, the extent of only the signal components of one sound source is present mainly in the case of speech signals, divides, for example, 20Hz bandwidth. 音源Aのパワースペクトルが例えば図4Aに示すように得られ、音源Bのパワースペクトルが図4Bに示すように得られ、この各スペクトルが分離できる程度の帯域幅Δfで分割する。 Power spectrum of the sound source A is obtained as shown in FIG. 4A for example, the power spectrum of the sound source B is obtained as shown in FIG. 4B, the respective spectrum is divided by the bandwidth Δf enough to be separated. この時、例えば破線で対応するスペクトルを示すように、一方の音源のスペクトルに対し他方の音源のスペクトルは無視できる。 In this case, for example, as shown the corresponding spectra by a broken line, the spectrum of the other sound source with respect to the spectrum of one of the sound source can be ignored. またこの図4 The FIG. 4
A、4Bから理解されるように帯域幅2Δfで分離してもよい。 A, it may be separated in bandwidth 2Δf As understood from 4B. つまり、各帯域に1本のスペクトルのみが含まれるようにしなくてもよい。 That may not be to include only one spectrum of each band. なお、離散的フーリエ変換は例えば20〜40msごとに行う。 Incidentally, the discrete Fourier transform is performed for each example 20~40Ms.

【0013】次に、帯域別チャネル間時間差/レベル差検出部5は、例えばL(f1)とR(f1),…L(f [0013] Next, the per-band channel time difference / level difference detector 5, for example, L (f1) and R (f1), ... L (f
n)とR(fn)といった各対応する帯域信号のチャネル間について、帯域別チャネル間時間差またはレベル差を検出する(S05)。 n) and the inter-channel band signal to the corresponding like R (fn), for detecting a time difference or level difference between the band-by-band channel (S05). ここで、帯域別チャネル間時間差は、チャネル間時間差検出部3で検出したチャネル間時間差Δτ 1 ,Δτ 2を利用することにより一意的に検出される。 Here, the difference between the per-band channel time, inter-channel time differences .DELTA..tau 1 detected by the inter-channel time difference detecting unit 3, it is uniquely detected by utilizing .DELTA..tau 2. この検出に用いる式は以下のとおりである。 Formula used for the detection is as follows.

【0014】 Δτ 1 −{(Δφi/(2πfi)+(ki1/fi)}=ε i 1 (3) Δτ 2 −{(Δφi/(2πfi)+(ki2/fi)}=ε i 2 (4) i=1,2,…,n、Δφiは信号L(fi)と信号R [0014] Δτ 1 - {(Δφi / ( 2πfi) + (ki1 / fi)} = ε i 1 (3) Δτ 2 - {(Δφi / (2πfi) + (ki2 / fi)} = ε i 2 (4 ) i = 1,2, ..., n, Δφi the signal to the signal L (fi) R
(fi)の位相差である。 It is the phase difference of (fi). これら式でε i 1,ε i 2が最小になるように整数ki1,ki2を決める。 These expressions epsilon i 1, as epsilon i 2 is minimized decide integer ki1, Ki2. 次に、 next,
その最小値のε i 1とε i 2とを比べて小さい方のチャネル時間差Δτ Smaller channel time difference Δτ as compared to the epsilon i 1 of the minimum value epsilon i 2 and j (j=1,2)を、その帯域iのチャネル間時間差Δτ ijとする。 j The (j = 1, 2), and inter-channel time difference .DELTA..tau ij of the band i. つまり一方の音源信号のその帯域でのチャネル間時間差とする。 It means an inter-channel time difference in the band of one of the source signal.

【0015】音源判定信号選別部6は、帯域別チャネル間時間差/レベル差検出部5で検出された帯域別チャネル間時間差Δτ 1j 〜τ njを用いて各帯域信号L(f1) The sound source determination signal sorting unit 6, each band signal by using the detected per-band channel time difference Δτ 1jnj in the band-by-band channel time difference / level difference detector 5 L (f1)
〜L(fn)とR(f1)〜R(fn)との各対応するものについて何れを選択するか判定を音源信号判定部6 ~L (fn) and R (f1) ~R (fn) determining whether to select either for what each corresponding with a sound source signal determination unit 6
01で行う(S06)。 Carried out in 01 (S06). 例えば、チャネル間時間差/レベル差検出部3で算出された時間差Δτ 1 ,Δτ 2のうち、Δτ 1が、L側のマイクロホンに近い、音源Aからの信号のチャネル間時間差であり、Δτ 2が、R側のマイクロホンに近い、音源Bからの信号のチャネル間時間差である場合で説明する。 For example, the time difference .DELTA..tau 1 calculated between channel time difference / level difference detector 3, of .DELTA..tau 2, .DELTA..tau 1 is close to the L side of the microphone, an inter-channel time difference of the signals from the sound source A, .DELTA..tau 2 is , close to the R-side microphone described in the case of inter-channel time difference of the signals from the sound source B.

【0016】この場合、帯域別チャネル間時間差/レベル差検出部5で算出された時間差Δτ ijがΔτ 1である帯域iは、音源信号判定部601によりゲート602L [0016] In this case, the band i time difference .DELTA..tau ij calculated in the band-by-band channel time difference / level difference detector 5 is .DELTA..tau 1, the gate 602L by the sound source signal determination unit 601
iが開とされてL側の入力信号L(fi)がそのままS i is opened and has been the L side of the input signal L (fi) is intact S
A(fi)として出力され、R側の帯域iの入力信号R Is output as A (fi), the input signal of the band i of R-side R
(fi)は音源信号判定部601によりゲート602R (Fi) is the gate 602R by the sound source signal determination unit 601
が閉とされてSB(fi)は0として出力される。 There SB is closed (fi) is output as 0. 時間差Δτ ijがΔτ 2となる帯域iは、逆に、L側は信号L Band i the time difference .DELTA..tau ij is .DELTA..tau 2, on the contrary, L side signal L
(fi)はSA(fi)=0として出力され、R側は入力信号R(fi)がそのままSB(fi)として出力される。 (Fi) is output as SA (fi) = 0, R side input signal R (fi) is output as SB (fi) as it is. つまり図1に示すように帯域信号L(f1)〜L That band signal L (f1) as shown in FIG. 1 ~L
(fn)はそれぞれゲート602L1〜602Lnを通じて音源信号合成部7Aへ供給され、帯域信号R(f (Fn) is supplied to the sound source signal synthesizer 7A through gates 602L1~602Ln, band signal R (f
1)〜R(fn)はそれぞれゲート602R1〜602 1) ~R (fn), each gate 602R1~602
Rnを通じて音源信号合成部7へ供給される。 It is supplied to the source signal synthesizing unit 7 through Rn. 音源判定信号選別部6内の音源信号判定部601ではΔτ 1j 〜Δ In the sound source determination signal sorting unit in the 6 source signal determination unit 601 Δτ 1j
τ njが入力され、Δτ ijがΔτ 1と判定された帯域iについてはゲート制御信号CLi=1とCRi=0が生成され、対応するゲート602Liが開、602Riが閉にそれぞれ制御され、Δτ ijがΔτ 2と判定された帯域iについてはゲート制御信号CLi=0と、CRi=1 tau nj is input, .DELTA..tau ij is for band i, which is determined .DELTA..tau 1 gate control signal CLi = 1 and CRi = 0 is generated, the corresponding gate 602Li is opened, 602Ri is controlled respectively in the closed, .DELTA..tau ij a gate control signal CLi = 0 for band i but it is determined that Δτ 2, CRi = 1
が生成され、対応するゲート602Liが閉、602R There are generated, the corresponding gate 602Li is closed, 602R
iが開にそれぞれ制御される。 i is controlled to open. 以上の説明は機能構成であって、実際には例えばデジタルシグナルプロセッサにより処理される。 The above description a functional structure is processed actually, for example, by a digital signal processor.

【0017】音源信号合成部7Aで信号SA(fi)〜 [0017] The sound source signal synthesis section 7A in the signal SA (fi) ~
SA(fn)が合成され、前記帯域分割の例ではそれぞれ逆フーリエ変換され、信号SAとして出力端子t Aに出力され、また音源信号合成部7Bで信号SB(fi) SA (fn) are combined, the band in the example of the division is the inverse Fourier transform respectively, is output to the output terminal t A as a signal SA, and the signal SB by the sound source signal synthesizer 7B (fi)
〜SB(fn)が同様に合成されて信号SBとして出力端子t Bに出力される。 To SB (fn) is output to the output terminal t B as similarly synthesized by the signal SB. 以上の説明で明らかなように、 As apparent from the above description,
この発明装置においては、各チャネル信号の細かく帯域分割した、各帯域成分がそれぞれどの音源からのものであるかを判定し、判定された成分は全て出力する、すなわち、音源A,Bの信号の周波数成分が互いに重なっていなければ、特定の周波数帯域を欠落させることなく処理を行うため、調波構造のみ抜き出す従来の方法に比べて音質を高く保ったまま音源A,Bの各信号を分離することが可能である。 In the present invention apparatus, finely band division for each channel signal, determines whether each band component is from any source, respectively, the determined component outputs all, i.e., the sound source A, B of the signal if the frequency components do not overlap each other, for performing the process without missing a specific frequency band, to separate the signals of the sound source a, B while maintaining a high sound quality compared with the conventional method of extracting only harmonic structure It is possible.

【0018】以上の説明は、チャネル間時間差/レベル差検出部3及び帯域別チャネル間時間差/レベル差検出部5で検出した、チャネル間時間差と、帯域別チャネル間時間差のみを利用して、音源判定信号部601で判定条件を決定した。 [0018] the above description, detected by inter-channel time difference / level difference detector 3 and the band-by-band channel time difference / level difference detector 5, by using the inter-channel time difference, only time difference between the per-band channel, the sound source It was determined determination condition by the determination signal 601. 次にこの判定条件の決定をチャネル間のレベル差を用いて処理する実施例を説明する。 Next will be described an example of processing using a level difference between channels determination of the determination condition. この実施例は図5に示すようにマイクロホン1,2からLチャネル信号とRチャネル信号を取込み(S02)、これらLチャネル信号とRチャネル信号のチャネル間レベル差ΔLをチャネル間時間差/レベル差検出部3(図1)で検出する(S03)。 This embodiment takes the L channel signal and R-channel signal from the microphone 1 as shown in FIG. 5 (S02), between the inter-channel level difference ΔL of L channel signal and R-channel signal channel time difference / level difference detection part detected in 3 (FIG. 1) (S03). 図2中のステップS04と同様に、Lチャネル信号、Rチャネル信号をそれぞれn個の帯域別チャネル信号L(f1)〜L(fn),R(f Similar to step S04 in FIG. 2, L-channel signal, the R-channel signal each of n band-specific channel signal L (f1) ~L (fn), R (f
1)〜R(fn)に分割し(S04)、帯域別チャネル信号L(f1)〜L(fn)とR(f1)〜R(fn) 1) is divided into ~R (fn) (S04), the band-by-band channel signal L (f1) ~L (fn) and R (f1) ~R (fn)
との対応帯域、つまりL(f1)とR(f1),L(f Corresponding bands, i.e. L (f1) and R (f1), L (f and
2)とR(f2),…,L(fn)とR(fn)について帯域別チャネル間レベル差ΔL1,ΔL2,…,ΔL 2) and R (f2), ..., L (fn) and R (fn) the band-by-band channel level difference ΔL1 for, ΔL2, ..., ΔL
nを検出する(S05)。 To detect the n (S05).

【0019】人間の音声は、20ms〜40ms程度の間は定常状態とみなすことが出来る。 [0019] The human voice is, between about 20ms~40ms can be regarded as a steady state. そのため、音源信号判定部601(図1)においては、20ms〜40m Therefore, in the sound source signal determination unit 601 (FIG. 1), 20ms~40m
s毎に、チャネル間レベル差ΔLの対数を取った値の符号と、帯域別チャネル間レベル差ΔLiの対数を取った値の符号とが、全帯域のうち何割以上の帯域で、同じ符号(+又は−)になるのかを算出し、所定値、例えば8 For each s, and the sign of the value obtained by taking the logarithm of the inter-channel level differences [Delta] L, the sign of the value obtained by taking the logarithm of the per-band channel level difference ΔLi is what% or more of the band of the entire band, the same reference numerals (+ or -) to become the one calculated the predetermined value, for example 8
割以上の帯域で両者が同じ符号を持てば(S06,S0 If able to have both the same sign at a rate more bandwidth (S06, S0
7)、そこから20ms〜40msの間はチャネル間レベル差ΔLのみで判定し(S08)、同じ符号を持つのが8割以下の帯域であれば、そこから20ms〜40m 7), wherein between the 20ms~40ms determines only the level difference ΔL between the channel (S08), if 80% or less of the band that have the same sign, 20Ms~40m therefrom
sの間は帯域毎に、帯域別チャネル間レベル差ΔLiを用いて判定する(S09)。 It s during determines for each band, using a level difference ΔLi between the per-band channel (S09). 判定の仕方は、全帯域をチャネル間レベル差ΔLで判定する場合は、ΔLが正であれば、Lチャネル信号L(t)がそのまま信号SAとして出力され、Rチャネル信号R(t)は信号SB=0として出力される。 Manner of determination, when determining the total bandwidth channel level difference ΔL, if any positive ΔL is, L channel signal L (t) is directly output as the signal SA, R channel signal R (t) is the signal is output as SB = 0. ΔLが0以下であれば逆に、Lチャネル信号L(t)は信号SA=0として出力され、Rチャネル信号R(t)がそのまま信号SBとして出力される。 Conversely if ΔL is less than or equal to 0, L channel signal L (t) is output as the signal SA = 0, R channel signal R (t) is directly output as the signal SB. ただし、これは、チャネル間レベル差としてL側からR側を引いた値を用いた場合の説明である。 However, this is a description of a case of using a value obtained by subtracting the R side from the L-side as a level difference between the channels. また、帯域別チャネル間レベル差ΔLiを用いて帯域毎に判定する場合は、各帯域fiごとに帯域別チャネル間レベル差ΔLiが正であれば、L側分割信号L(fi)がそのまま信号SA(fi)として出力され、R側分割信号R Further, when determining for each band using the level difference ΔLi between band-by-band channels, if positive bandwidth per channel level difference ΔLi each band fi, L-side divided signal L (fi) is intact the signal SA It is output as (fi), R-side divided signals R
(fi)は信号SB(fi)=0として出力される。 (Fi) is output as the signal SB (fi) = 0. レベル差ΔLiが0以下であれば逆に、L側は分割信号L Conversely if the level difference ΔLi is 0 or less, L side divided signals L
(fi)は信号SA(fi)=0として出力され、R側は分割信号R(fi)が信号SB(fi)として出力される。 (Fi) is output as the signal SA (fi) = 0, R side divided signal R (fi) is output as the signal SB (fi). 以上のようにして音源信号判定部601からゲート制御信号CL1〜CLn,CR1〜CRnが出力され、ゲート602L1〜602Ln,602R1〜60 Above manner, the gate control signal from the sound source signal determination unit 601 CL 1 to CLn, CR1~CRn is outputted, the gate 602L1~602Ln, 602R1~60
2Rnがそれぞれ制御される。 2Rn are controlled respectively. これも、前者と同様、帯域別チャネル間レベル差として、L側からR側を引いた値を用いた場合の説明である。 This is also, like the former, as the level difference between the per-band channel is a description of a case of using a value obtained by subtracting the R side from the L side. 信号SA(f1)〜SA Signal SA (f1) ~SA
(fn)、信号SB(f1)〜SB(fn)は先の実施例と同様にそれぞれ合成された信号SA,SBとして出力端子t A ,t Bにそれぞれ出力される(S10)。 (Fn), the signal SB (f1) ~SB (fn) signals are respectively similar to the previous embodiments the synthetic SA, an output terminal t A as SB, are output to t B (S10).

【0020】前記実施例では、音源信号判定部601で用いる判定条件として、到達時間差とレベル差のうちどちらかの片方のみを利用する。 [0020] In the above embodiment, as a determination condition used in the sound source signal determination unit 601, to use only either one of the arrival time difference and the level difference. しかし、レベル差のみを利用した場合、低域の周波数帯域ではL(fi)とR However, when using only the level difference, a low frequency band and L (fi) R
(fi)とのレベルが拮抗する場合があり、その場合はレベル差を正確に求めることが困難になる。 May (fi) and the level of antagonizing, it is difficult to obtain the level difference precisely the case. また、時間差のみを利用した場合は、高い周波数帯域においては、 Also, the case of using only the time difference, the higher frequency band,
位相の回転が起こるため時間差を正しく算出することが困難な場合がある。 It may be difficult to accurately calculate the time difference for the phase rotation occurs. これらの点から、低域の周波数帯域では時間差を、高域ではレベル差を判定に用いた方が、 From these points, the time difference in the low frequency band, is better used for determining the level difference in the high frequency range,
全帯域に渡り単一のパラメータを用いるよりも有利である場合がある。 It may be advantageous than using a single parameter over the entire band.

【0021】そこで、音源信号判定部601で帯域別チャネル間時間差と帯域別チャネル間レベル差を共に用いる実施例を図6以下の図面を参照して説明する。 [0021] Therefore, describing both used in Example level difference between the band-by-band channel between the time difference and the band-by-band channel sound source signal determination unit 601 with reference to FIG. 6 following drawings. この実施例の機能構成のブロックとしては図1と同一であるが、チャネル間時間差/レベル差検出部分3、帯域別チャネル間時間差/レベル差検出部5と音源信号判定部6 As the blocks of the functional configuration of this embodiment is the same as FIG. 1, inter-channel time difference / level difference detection portion 3, a band-by-band channel time difference / level difference detector 5 source signal determination unit 6
01での処理が以下のように異なる。 01 processing in different as follows. チャネル間時間差/レベル差検出部3は、検出された時間差Δτ 1 ,Δτ Inter-channel time difference / level difference detector 3, the time difference .DELTA..tau 1 detected, .DELTA..tau
2の各絶対値の平均、又はΔτ 1 ,Δτ 2が比較的近い値であれば、その一方のみなど、一つの時間差Δτを出力する。 The average of the absolute value of 2, or .DELTA..tau 1, if .DELTA..tau 2 is relatively close values, such that only one, and outputs a single time difference .DELTA..tau. なおチャネル間時間差Δτ 1 ,Δτ 2 ,Δτをチャネル信号L(t),R(t)を周波数軸上で帯域分割する前に算出したが、帯域分割した後に算出することも可能である。 Note difference between channel time Δτ 1, Δτ 2, Δτ channel signal L (t), was calculated R (t) before the band split on the frequency axis, it is also possible to calculate after band division.

【0022】図5に示すように、Lチャネル信号L As shown in FIG. 5, L-channel signal L
(t)、Rチャネル信号R(t)をフレーム(例えば2 (T), R channel signal R (t) to frame (e.g. 2
0〜40ms)毎に読み込み(S02)、帯域分割部4 0~40Ms) read for each (S02), the band dividing unit 4
でLチャネル信号、Rチャネル信号をそれぞれ複数の周波数帯域に分割する。 In L-channel signal, it divides the R-channel signal into a plurality of frequency bands, respectively. この例ではLチャネル信号L In this example the L channel signal L
(t)、Rチャネル信号R(t)にそれぞれハニング窓をかけ(S03)、それぞれフーリエ変換を施して分割された信号L(f1)〜L(fn)、R(f1)〜R (T), multiplying each Hanning window to the R channel signal R (t) (S03), the signal is divided respectively by performing a Fourier transform L (f1) ~L (fn), R (f1) ~R
(fn)を得る(S04)。 (Fn) to obtain a (S04).

【0023】次に、帯域別チャネル間時間差/レベル差検出部5では分割された信号の周波数fiが1/(2Δ Next, the frequency fi of the per-band channel time difference / level difference detector 5 in divided signal 1 / (2.DELTA.
τ)(Δτはチャネル時間差)以下の帯域(以下、低域と呼ぶ)であるかを調べ(S05)、以下であれば帯域別チャネル間位相差Δφiを出力し(S08)、分割された信号の周波数fが1/(2Δτ)より大きく1/Δ tau) (.DELTA..tau the difference channel time) following band (hereinafter, examine whether it is called a low frequency) (S05), and outputs a phase difference Δφi between the per-band channel if less (S08), divided signal greater than the frequency f 1 / (2Δτ) 1 / Δ
τ未満の帯域(以下、中域と呼ぶ)であるかがチェックされ(S06)、この中域であれば帯域別チャネル間位相差Δφi及びレベル差ΔLiを出力し(S09)、分割された信号の周波数fが1/Δτ以上の帯域(以下、 Band below tau (hereinafter, referred to as midrange) or a is checked (S06), if the midrange output per-band channel phase difference Δφi and level difference ΔLi (S09), divided signal the frequency f 1 / .DELTA..tau or more bands (hereinafter,
高域と呼ぶ)かがチェックされ(S07)、高域であれば帯域別チャネル間レベル差ΔLiを出力する(S1 High-frequency hereinafter) or not is checked (S07), and outputs the band-by-band channel level difference ΔLi if high-frequency (S1
0)。 0).

【0024】音源信号判定部601は、帯域別チャネル間時間差/レベル差検出部5で検出された帯域別チャネル間位相差、レベル差を用いてL(f1)〜L(f The sound source signal determination unit 601, the detected per-band channel phase difference in the per-band channel time difference / level difference detector 5, with the level difference L (f1) ~L (f
n)、R(f1)〜R(fn)それぞれについて何れを出力するかの判定を行う。 n), performs or decision outputs either for each R (f1) ~R (fn). なお、位相差Δφi、レベル差ΔLについては、この例では共にL側からR側の値を引いて算出した値を用いる。 The phase difference [Delta] [phi] i, the level difference ΔL, in this example using a value calculated by subtracting the value of the R-side together from L side.

【0025】低域と判定された信号L(fi),R(f [0025] determines that the low-frequency signal L (fi), R (f
i)については図7に示すようにまず位相差Δφiがπ i) For the 7 first phase difference Δφi is π
以上かを調べ(S15)、π以上であればΔφiから2 Examine the greater than or equal to (S15), 2 from Δφi equal to or greater than π
πを減算した値をΔφiとし(S17)、ステップS1 The value obtained by subtracting the π and [Delta] [phi] i (S17), step S1
5でΔφiがπ以上でなければ、−π以下かを調べ(S Unless 5 Δφi more than π, checks whether -π below (S
16)、以下であればΔφiに2πを加算した値をΔφ 16), a value obtained by adding 2π to Δφi not more than Δφ
iとし(S18)、ステップS16で−π以下でなければΔφiをそのまま用いる(S19)。 And i (S18), as it is used Δφi unless -π less in step S16 (S19). ステップS1 Step S1
7,S18,S19で求めた帯域別チャネル間位相差Δ 7, S18, among the band-by-band channel determined in S19 phase difference Δ
φiを時間差Δσiに次式で変換する(S20)。 The φi on the time difference Δσi converted by the following equation (S20).

【0026】 Δσi=1000・Δφi/2πfi (5) 分割された信号L(fi),R(fi)が中域と判定された場合は図8に示すように帯域別チャネル間レベル差ΔL(fi)を利用して、位相差Δφiを一意に決定する。 [0026] Δσi = 1000 · Δφi / 2πfi (5) split signal L (fi), R (fi) is the midrange and the determined between the per-band channel level difference [Delta] L (fi as shown in FIG. 8 if ) is used to uniquely determine the phase difference Δφi. 即ちΔL(fi)が正かを調べ(S23)、正であれば、その帯域別チャネル間位相差Δφiが正であるかを調べ(S24)、正であればそのΔφiをそのまま出力し(S26)、ステップS24で正でなければΔφi That If [Delta] L (fi) is examined either positive (S23), positive, checks whether the band-by-band channel between the phase difference Δφi is positive (S24), the Δφi output as it if it is positive (S26 ) be positive at step S24 [Delta] [phi] i
に2πを加算した値をΔφiとして出力する(S2 Output as Δφi a value obtained by adding 2π to (S2
7)。 7). ステップS23でΔL(fi)が正でなければ、 If [Delta] L (fi) is positive at step S23,
その帯域別チャネル間位相差Δφiが負であるかを調べ(S25)、負であれば、そのΔφiをそのままΔφi The band-specific channel between the phase difference Δφi is checked whether a negative (S25), if it is negative, the Δφi as Δφi
として出力し(S28)、ステップS25で負でなければΔφiから2πを減算した値をΔφiとして出力する(S29)。 Output as (S28), if negative in step S25 outputs a value obtained by subtracting 2π from the [Delta] [phi] i as [Delta] [phi] i (S29). これらステップS26〜S29の何れかのΔφiが次式によりその帯域別チャネル間時間差Δσi Either Δφi its inter-band-specific channel time difference by the following equation in steps S26 to S29 Derutashigumaai
として演算される(S30)。 It is calculated as (S30).

【0027】 Δσi=1000・Δφi/2πfi (6) 以上のようにして低域、中域における帯域別チャネル間時間差Δσiと、高域における帯域別チャネル間レベル差ΔL(fi)が得られ、これらに応じて音源信号の判別が次のようになされる。 [0027] Δσi = 1000 · Δφi / 2πfi (6) above way low frequency, and the band-by-band channel time difference Derutashigumaai at mid-band-specific channel level difference [Delta] L (fi) is obtained in the high frequency range, these determination of the sound source signal is made as follows according to. 図9に示すように低域と中域においては位相差Δφiを、高域においてはレベル差Δ A phase difference Δφi in low and mid range, as shown in FIG. 9, in the high-frequency level difference Δ
Liを利用して両チャネルの各周波数成分を該当するどちらかの音源の信号として判別する。 Using the Li to determine the frequency components of both channels as either sound source signal corresponding. 具体的には、低域と中域においては図7、8でそれぞれ求められた帯域別チャネル間時間差Δσiが正であるかを調べ(S3 Specifically, in the low and mid Determine the per-band channel time difference Δσi obtained respectively in Figure 7 and 8 is positive (S3
4)、正であれば、その帯域iのL側チャネル信号L 4), if it is positive, L-side channel signal of the band i L
(fi)を信号SA(fi)として出力し、R側帯域チャネル信号R(fi)を0の信号SB(fi)として出力する(S36)。 Outputs (fi) as a signal SA (fi), the R-side band channel signal R (fi) is output as 0 signal SB (fi) (S36). ステップS34で帯域別チャネル時間差Δσiが正でない場合は逆にSA(fi)として0 0 as SA (fi) in the opposite case the per-band channel time difference Δσi is not positive at step S34
を出力し、SB(fi)としてR側チャネル信号R(f Outputs, SB (fi) as R-side channel signal R (f
i)を出力する(S37)。 i) to output (S37).

【0028】また、高域においては、図6中のステップS10で検出した帯域別チャネル間レベル差ΔL(f Further, in the high-frequency, inter-band-by-band channel level difference has been detected in step S10 in FIG. 6 [Delta] L (f
i)が正であるかを調べ(S35)、正であれば信号S i) it is checked whether there is positive (S35), the signal S if it is positive
A(fi)としてL側チャネル信号L(fi)を出力し、SB(fi)として0を出力する(S38)。 Outputs A (fi) as L-side channel signal L (fi), and outputs 0 as SB (fi) (S38). ステップS35でレベル差ΔLiが正でなければSA(f If the level difference ΔLi is positive at step S35 SA (f
i)として0を出力し、SB(fi)としてR側帯域チャネル信号R(fi)を出力する(S39)。 i) as the outputs 0, and outputs a SB (fi) as R-side band channel signal R (fi) (S39).

【0029】以上のようにして各帯域についてL側又はR側が出力され、音源信号合成部7A,7Bでそれぞれ判別した各周波数成分を全帯域に渡り加算し(S4 [0029] is L side or R side outputs for the to each band as described above, the sound source signal synthesizer 7A, the respective frequency components is determined respectively 7B adds across the entire band (S4
0)、かつ、加算した各信号を逆フーリエ変換し(S4 0), and inverse Fourier transforming each signal obtained by adding (S4
1)、その変換した信号SA,SBを出力する(S4 1), the converted signal SA, and outputs a SB (S4
2)。 2). 以上説明したように、この実施例においては、周波数帯域毎に音源分離に有利なパラメータを用いることにより、全帯域に渡り単一のパラメータを用いる場合に比べてより分離性能の高い音源分離を実現することが可能である。 As described above, in this embodiment, by using the advantageous parameter to the sound source separation for each frequency band, realized sound source separation having higher separation performance compared to using a single parameter over the entire band it is possible to.

【0030】この発明は音源の数が3個以上でも適用できる。 [0030] The present invention can be applied to any number of sound sources is three or more. 例として、音源数が3、マイクロホン数が2である場合でマイクロホンへの到達時間差を利用して音源分離する場合を説明する。 As an example, the number of sound source 3, by using the arrival time difference of the microphones in the case where the number of microphones is two will be described a case where the sound source separation. この場合、チャネル間時間差/ In this case, inter-channel time difference /
レベル差検出部3で各音源についてLチャネル信号、R L-channel signal for each sound source at the level difference detector 3, R
チャネル信号のチャネル間時間差を算出する際に、図3 When calculating the inter-channel time difference channel signal, FIG. 3
に示したように相互相関のパワーで正規化したヒストグラムの、累積度数(ピーク値)第一位から第三位までをとる各時点を求めることによって各音源信号についてのチャネル間時間差Δτ 1 ,Δτ 2 ,Δτ Histogram normalized with the power of cross-correlation, as shown in, inter-channel time differences .DELTA..tau 1 for each sound source signal by obtaining each time point to take the first of the cumulative frequency (peak value) to the third place, .DELTA..tau 2, Δτ 3を算出する。 3 is calculated.
そして、帯域別チャネル間時間差/レベル差検出部5においても、各帯域の帯域別チャネル間時間差をΔτ 1からΔτ 3のどれかに決定する。 Also in the band-by-band channel time difference / level difference detector 5, which determines the bandwidth per channel time differences for each band in any of .DELTA..tau 1 of .DELTA..tau 3. この決定の仕方は、前記実施例で述べた計算式(3),(4)と同様である。 This manner of determination, the calculation formula (3) described in Example is the same as (4). 音源信号判定部601では、例として、Δτ 1 >0、Δτ In the sound source signal determination unit 601, as an example, Δτ 1> 0, Δτ
2 >0、Δτ 3 <0である場合で説明する。 2> 0, is described in the case of .DELTA..tau 3 <0. ここで、Δ Here, Δ
τ 1 ,Δτ 2 ,Δτ 3はそれぞれ、音源A,B,C各信号のチャネル間時間差と仮定し、さらに、これらの値はL側からR側の値を引いて算出した値と仮定する。 τ 1, Δτ 2, Δτ 3, respectively, assuming a sound source A, B, and inter-channel time difference C signals further, these values assume the value calculated by subtracting the value of the R side from the L side. この場合、音源AはL側のマイクロホン1に近く、音源BはR側のマイクロホン2の近くにある。 In this case, the sound source A close to the microphone 1 of the L side, the sound source B is located near the microphone 2 of the R side. よって、Lチャネルの信号から、帯域別チャネル間時間差がΔτ 1となる帯域の信号を加算して音源Aの信号を、またΔτ 2となる帯域を加算して、音源Bの信号をそれぞれ分離することが可能である。 Therefore, from the signal of the L channel, the signal of the sound source by adding the bandwidth of the signal difference between the per-band channel time is .DELTA..tau 1 A, also by adding the band of .DELTA..tau 2, to separate the signals of the sound source B, respectively It is possible. また、Rチャネル信号から、帯域別チャネル間時間差がΔτ 3となる帯域の信号を加算して出力することにより、音源Cの信号を分離する。 Further, the R-channel signal, by difference between the per-band channel time adding and outputting band signals to be .DELTA..tau 3, to separate the signals of the sound source C.

【0031】上述では音源信号を分離し、分離された各音源信号SA,SBを各別に出力した。 [0031] In the above separating sound source signals, each sound source signal SA which is separated and output SB to each other. しかし、例えば一方の音源Aは発話者による音声であり、他方の音源B However, for example, one of the sound source A is speech by the speaker, the other sound B
は騒音のような場合、騒音と混合された音源Aの信号音を分離抽出し、騒音を抑圧するためにもこの発明を適用することができる。 Can if such noise, which separates and extracts a signal sound of the sound source A mixed with noise, also apply this invention to suppress noise. その場合は図1において音源信号合成部7Aを残し、1点鎖線で示す枠9中の音源信号合成部7B、ゲート602R1〜602Rnを省略すればよい。 In that case leaving the excitation signal synthesizing unit 7A in FIG. 1, the sound source signal synthesizer 7B in the frame 9 shown by a dashed line, it may be omitted gate 602R1~602Rn.

【0032】一方の音源Aが他方の音源Bより周波数帯域が広い場合でその各周波数帯域が予め知られている場合は、図10に示すように図1において帯域分離部10 [0032] When one of the sound sources A, the respective frequency bands in the case than the frequency band is wide the other sound source B is known in advance, the band separation unit 10 in FIG. 1, as shown in FIG. 10
において、両音源信号の重なっていない周波数帯域を分離する。 In, separating the frequency bands not overlapping with both the source signal. 例えば音源Aの信号A(t)の周波数帯域はf For example the frequency band of the sound source A signal A (t) is f
1〜fnであるが音源Bの信号B(t)の周波数帯域はf1〜fn(fn>fm)の場合、重なっていない帯域fm+1〜fnの信号をマイクロホン1,2の出力から分離し、この帯域fm+1〜fnの信号については、音源信号判定部601の判定処理、場合によっては帯域別チャネル間時間差/レベル差検出部5の処理を行わず、 Frequency band signal B (t) of is a 1~Fn source B For f1~fn (fn> fm), to separate the signal of the band fm + 1~fn not overlapping the output of the microphone 1 and 2, the the signal band fm + 1~fn, the determination process of the sound source signal determination unit 601, without performing the processing of per-band channel time difference / level difference detector 5 in some cases,
音源信号判定部601は、音源Bの信号として選出するチャネル信号SB(t)として選出するRの分割された帯域チャネル信号R(fm+1)〜R(fn)をそれぞれSB(fm+1)〜SB(fn)として出力し、SA Sound source signal determination unit 601 selects a channel signal SB (t) to elect as a signal of the sound source B R divided bands channel signal R (fm + 1) ~R the (fn) each SB (fm + 1) ~SB (fn ) and output as, SA
(fm+1)〜SA(fn)は0を出力させるように音源信号選択部602を制御する。 (Fm + 1) ~SA (fn) controls the sound source signal selecting unit 602 so as to output a zero. 即ちゲート602Lm That is, the gate 602Lm
+1〜602Lnは常閉とし、ゲート602Rm+1〜 + 1~602Ln is a normally closed, gate 602Rm + 1~
602Rnは常開とする。 602Rn is normally open.

【0033】上述では各帯域別チャネル間時間差Δσ The difference between the band-by-band channel by the above-described time Δσ
i、正か負かにより、また各帯域別チャネル間レベル差ΔLiが正か負かにより、つまり、いずれも0をしきい値として、その帯域信号が何れのマイクロホンに近いかを判別した。 i, a positive or negative crab, also each band-by-band channel level difference ΔLi a positive or negative crab, i.e., both the 0 as the threshold value, it is determined whether the band signal is close to one of the microphones. これはマイクロホン1として結ぶ線の2等分線に対して音源Aと音源Bと左右対称に位置している場合である。 This is the case which is located symmetrically between the sound source A and source B with respect to a bisector of a line connecting the microphone 1. この関係にない場合は判別しきい値を以下のように決めればよい。 The case is not in this relationship determination threshold may be determined as follows.

【0034】音源Aの信号がマイクロホン1、マイクロホン2に到達する帯域別チャネル間レベル差をΔL A The sound source signal A microphone 1, the inter-band-by-band channel level differences to arrive at the microphone 2 [Delta] L A,
到達する帯域別チャネル間時間差をΔτ A 、音源Bの信号がマイクロホン1、マイクロホン2に到達する帯域別チャネル間レベル差をΔL B 、到達する帯域別チャネル間時間差をΔτ Bとそれぞれする。 Arriving per-band channel between the time difference .DELTA..tau A, signal microphone 1 of the sound source B, [Delta] L B the level difference between the band-by-band channel that reaches the microphone 2, respectively and .DELTA..tau B the time difference between the arriving band-by-band channel. このとき、帯域別チャネル間レベル差のしきい値ΔLthは ΔLth=(ΔL A +ΔLi)/2 とし、帯域別チャネル間時間差のしきい値Δτthは Δτth=(Δτ A +Δτ B )/2 とすればよい。 In this case, the threshold DerutaLth the per-band channel level difference is set to ΔLth = (ΔL A + ΔLi) / 2, the threshold Derutatauth the per-band channel between the time difference if Δτth = (Δτ A + Δτ B ) / 2 good. 先に述べた実施例ではΔL B =−Δ In the embodiment described above [Delta] L B = - [delta
A 、Δτ B =−Δτ Aの場合でΔLth=0、Δτth= L A, ΔLth = 0 in the case of Δτ B = -Δτ A, Δτth =
0となる。 0. 音源A,Bを分離できるように、二つの音源をマイクロホン1,2に対し、互いに異なる側となるように、マイクロホン1,2を位置させ、マイクロホン1,2に対する距離、方向は必ずしも正しくはわかっていない場合があり、しきい値ΔLth,Δτthを可変として、分離がよく行われるようにΔLth,Δτthを調整可能としてもよい。 Instrument A, to allow separation of B, with respect to the microphone 1 and 2 the two sound sources, so as to be mutually different sides, to position the microphone 1, the distance to the microphone 1, the direction is always correct found may not, threshold DerutaLth, the Derutatauth as a variable, DerutaLth as separation is often carried out, may be adjustable Derutatauth.

【0035】前記実施例では部屋の残響や回折の影響により、帯域別チャネル間時間差や帯域別チャネル間レベル差に誤りが生じ、各音源信号を精度よく分離することができない場合がある。 [0035] The effects of reverberation and diffraction of the room in the embodiment, an error occurs on the level difference between the per-band channel time difference and the band-by-band channels, each sound source signal may not be able to accurately separate. このような問題を改善した実施例を次に述べる。 Described below an example in which improved these problems. 図11に示すように、マイクロホンM As shown in FIG. 11, a microphone M
1,M2,M3は、例えば1辺が20cmの正三角形の頂点の位置に配置されている。 1, M2, M3, for example one side is disposed at a position of the vertex of 20cm of an equilateral triangle. マイクロホンM1〜M3 Microphone M1~M3
の指向特性に基づいて空間が分割して設定され、その各分割された空間を音源ゾーンと呼ぶ。 Is set by dividing the space based on the directional characteristics of, it referred to the respective divided spaces as a sound source zone. 全てのマイクロホンM1〜M3が無指向で同じ特性を有する場合には、例えば図12に示すように、ゾーンZ1〜Z6のように6 If all microphones M1~M3 have the same characteristics in non-directional, for example, as shown in FIG. 12, as the zones Z1 to Z6 6
個に分割される。 It is divided into pieces. つまり、各マイクロホンM1,M2, In other words, the microphones M1, M2,
M3と、その中心点Cp をそれぞれ通る直線により、中心点Cpを中心に等角間隔で6分割された6つのゾーンZ1〜Z6が形成される。 And M3, the straight line passing through the center point Cp respectively, six zones Z1~Z6 which is divided into six portions at equiangular intervals around the center point Cp is formed. 音源AはゾーンZ3に、音源BはゾーンZ4に位置している。 Sound source A to the zone Z3, sound source B is located in the zone Z4. つまり、1個の音源ゾーンには1個の音源が属するよう、マイクロホンM1〜 In other words, one of the sound source zone so that the one of the sound source belongs, microphone M1~
M3の配置や特性に基づいて各音源ゾーンを決定する。 Determining the respective sound source zone based on the arrangement and characteristics of M3.

【0036】図11において、帯域分割部41は、マイクロホンM1で収音した第1チャネルの音響信号S1をn個の周波数帯域信号S1(f1)〜S1(fn)に分割し、分割部42でマイクロホンM2で収音した第2チャネルの音響信号S2をn個の周波数帯域信号S2(f [0036] In FIG. 11, band dividing section 41 divides the sound signal S1 of the first channel which is collected by the microphone M1 into n frequency band signals S1 (f1) ~S1 (fn), division section 42 the acoustic signal S2 of the second channel picked up by the microphone M2 n number of frequency bands signal S2 (f
1)〜S2(fn)に分割し、帯域分割部43は、マイクロホンM3で収音した第3チャネルの音響信号S3をn個の周波数帯域信号S3(f1)〜S3(fn)に分割する。 1) is divided into ~S2 (fn), the band division section 43 divides the sound signal S3 of the third channel that is collected by the microphone M3 in n frequency band signals S3 (f1) ~S3 (fn). これら各帯域f1〜fnは帯域分割部41〜4 Each of these bands f1~fn the band division unit 41-4
3で共通であり、このような帯域分割は離散的フーリエ変換器を利用することができる。 A common 3, such band division may utilize discrete Fourier transformer.

【0037】音源分離部80は図1乃至図10を参照して説明した手法を用いて音源信号を分離するものである。 The sound source separation unit 80 is to separate the sound source signal by using the technique described with reference to FIGS. 1-10. ただし図11ではマイクロホンが3つであるから、 In However Figure 11 because the microphone is three,
この3つのチャネルの信号の各2つの組合せについて同様な処理を行う。 It performs the same process for each of two combinations of signals of the three channels. 従って音源分離部80内の帯域分割部と帯域分割部41〜43を兼用することもできる。 Thus it may work simultaneously as the band division unit and the band division portion 41 to 43 in the sound source separation unit 80. 帯域別レベル(パワー)検出部S1で帯域分割部41で得られた各帯域の信号S1(f1)〜S1(fn)のレベル(パワー)信号P(S1f1)〜P(S1fn)が検出され、同様に帯域別レベル検出部52,53でそれぞれ帯域分割部42,43で得られた各帯域信号S2(f Per-band level (power) level of each band of the signal S1 obtained by the band division portion 41 in the detecting unit S1 (f1) ~S1 (fn) (power) signal P (S1f1) ~P (S1fn) is detected, Similarly the band signal obtained by respectively band-by-band level detector 52 and 53 band divider 42, 43 S2 (f
1)〜S2(fn),S3(f1)〜S3(fn)の各P(S2f1)〜P(S2fn),P(S3f1)〜P 1) ~S2 (fn), S3 (f1) ~S3 each P (S2F1 of (fn)) ~P (S2fn), P (S3f1) ~P
(S3fn)がそれぞれ検出される。 (S3fn) are detected, respectively. これら帯域別レベル検出もフーリエ変換器で実現できる。 These per-band level detection can be implemented by Fourier transformer. つまり各チャネル信号を離散的フーリエ変換によりスペクトルに分解し、その各スペクトルの電力を求めればよい。 That is decomposed into a spectrum by discrete Fourier transform of each channel signal may be determined power of each spectrum. 従って、 Therefore,
各チャネル信号について、パワースペクトルを求め、そのパワースペクトルを帯域分割してもよい。 For each channel signal to obtain the power spectrum may be divided into bands its power spectrum. 各マイクロホンM1〜M3の各チャネル信号を、帯域別レベル検出部400で各帯域に分割すると共にそのレベル(パワー)を出力することになる。 Each channel signal of each microphone M1 to M3, will output the level (power) as well as divided into bands by band-by-band level detector 400.

【0038】一方全帯域レベル検出部61でマイクロホンM1で収音された第1チャネルの音響信号S1の全周波数成分のレベル(パワー)P(S1)が検出され、全帯域レベル検出部62,63でそれぞれマイクロホンM On the other hand the level of all frequency components of the audio signal S1 of the first channel which is collected by the microphone M1 at the full-band level detecting unit 61 (power) P (S1) is detected, the entire band level detector 62 and 63 in each microphone M
2,M3でそれぞれ収音された第2、第3チャネル2, 2, the second picked up respectively by M3, a 3-channel 2,
3の各音響信号S2,S3の全周波数成分のレベルP Third level P of all frequency components of each acoustic signal S2, S3
(S2),P(S3)が検出される。 (S2), P (S3) are detected.

【0039】音源状態判定部70では、コンピュータ処理により、音響を発していない音源ゾーンを判定する。 [0039] determines the sound source state determination unit 70, the computer processing, the sound source zone that does not emit sound.
まず、帯域別レベル検出部50により得られる帯域別レベルP(S1f1)〜P(S1fn)、P(S2f1) First, the band-by-band level obtained by the band-by-band level detector 50 P (S1f1) ~P (S1fn), P (S2f1)
〜P(S2fn)、P(S3f1)〜P(S3fn) ~P (S2fn), P (S3f1) ~P (S3fn)
を、同一の帯域の信号について相互に比較する。 And compared with each other for the same band signal. そして各帯域f1〜fn毎に、最も大きなレベルのチャネルを特定する。 And each band f1 to fn, identifies the largest level of the channel.

【0040】帯域分割の数nを所定数以上にすることにより、前述したように、1つの帯域には1個の音源の音響信号しか含まれないと見なせるようにすることができるので、同一帯域fi [0040] By the number n of bands divided into a predetermined number or more, as described above, since the one band can be made to be regarded as only it contains audio signals of a single sound source, the same band fi のレベルP(S1fi),P Level P (S1fi), P of
(S2fi),P(S3fi)は、同一音源からの音響のレベルと見なすことができる。 (S2fi), P (S3fi) can be regarded as sound level from the same source. よって、第1〜第3チャネルについて同一の帯域のレベルP(S1fi),P Therefore, the level P of the first to third channels the same bandwidth for (S1fi), P
(S2fi),P(S3fi)に差があるときは、音源に最も近いマイクロホンのチャネルの帯域のレベルが最も大きくなる。 (S2fi), when there is a difference between the P (S3fi), the level of the band of the channel nearest the microphone to the sound source becomes the largest.

【0041】前記処理の結果、各帯域f1〜fnについて、最もレベルの大きなチャネルがそれぞれ割り当てられる。 [0041] of the processing result, for each band f1 to fn, allocated the largest channel level, respectively. n個の帯域中で第1〜第3各チャネルについて、 For first to third channel in the n bands,
最もレベルが大きな帯域の合計数χ1,χ2,χ3を算出する。 The most level sum of a large number of bands .chi.1, chi-square, calculates the Kai3. この合計数の値が大きいチャネルのマイクロホンほど、音源に近いとみなすことができる。 More microphone channels value of this total number is large, it can be regarded as close to the sound source. 合計数値が例えば90n/100以上程度であればそのチャネルのマイクロホンに音源が近いと判定することができる。 Sound source to the microphone of the channel as long as the total number is e.g. 90n / 100 than it can be determined that the closer. しかし、最もレベルが大きい帯域の合計数が53n/10 However, the total number of the most level is high bandwidth 53n / 10
0、次に合計値が大きい値が49n/100の場合はそのそれぞれの対応マイクロホンに音源が近いか明確ではない。 0, if then the total value is a large value of 49n / 100 sound source is not or clear near their respective corresponding microphones. 従って当該合計数が予め設定した基準値ThP、 Therefore the reference value ThP which the total number is set in advance,
例えばn/3程度を越えたとき、当該合計数と対応するチャネルのマイクロホンにその音源が最も近いと判定する。 For example, when in excess of n / 3 degree, determines that the sound source to the microphone of a channel corresponding to the total number of the closest.

【0042】また、この音源状態判定部70には、全帯域レベル検出部60で検出された各チャネルのレベルP Further, the tone generator state determining section 70, the level of each channel detected by the full-band level detector 60 P
(S1)〜P(S3)も入力されていて、そのレベルの全てが予め設定した基準値ThR以下の場合には、何れのゾーンにも、音源がないと判定する。 (S1) ~P (S3) be entered, if all of the levels of the reference value ThR below the preset is either the zone, it is determined that the sound source is not. この音源状態判定部70による判定結果に基づき、制御信号を発生して、音源分離部80で分割された音響信号A,Bに対する抑圧を信号抑圧部90で行う。 Based on the determination result by the tone generator state determining section 70, it generates a control signal and divided acoustic signals A sound source separation unit 80, the oppression of B by the signal suppression unit 90. つまり制御信号SAi That control signal SAi
により音響信号SAを抑圧(減衰ないし削除)し、制御信号SBiにより音響信号SBを抑圧し、制御信号SA By suppressing the acoustic signal SA and (attenuated or deleted), and suppresses the audio signal SB by the control signals SBi, control signal SA
Biにより両音響信号SA,SBを抑圧する。 It suppresses both acoustic signal SA, and SB by Bi. 例えば信号抑圧部90内に常閉スイッチ9A,9Bが設けられ、 Normally closed switch 9A, 9B are provided for example in the signal suppressor 90,
音源分離部80の出力端子t A ,t Bが常閉スイッチ9 Output terminal t A sound source separation unit 80, t B is normally closed switch 9
A,9Bを通じて、出力端子t A ′,t B ′に接続され、制御信号SAiによりスイッチ9Aが開とされ、制御信号SBiによりスイッチ9Bが開とされ、制御信号SABiによりスイッチ9A,9Bが共に開にされる。 A, through 9B, is connected an output terminal t A ', t B', the control by the signal SAi is a switch 9A is opened, controlled by the signal SBi is a switch 9B is opened, the switch 9A by the control signal SABi, 9B are both It is in the open.
当然のことであるが、音源分離部80で行う分離処理するフレームの信号と、信号抑圧部90での抑圧に用いる制御信号を得るフレームの信号とは同一のものを用いる。 Of course, a signal of the frame separating process performed by the sound source separation unit 80, used as identical to the signal of a frame to obtain a control signal for use in the suppression of the signal suppression unit 90. 抑圧(制御)信号SAi,SBi,SABiの発生についてわかり易く説明する。 Suppression (Control) signals SAi, SBi, clearly explained generation of SABi.

【0043】いま、図12に示すように音源A,Bが位置している時マイクロホンM1〜M3を図に示したように配置し、ゾーンZ1〜Z6を決定し、音源AとBが別個のゾーンZ3,Z4にそれぞれ位置するようにする。 [0043] Now, the sound source A as shown in FIG. 12, B is arranged as shown in FIG microphone M1~M3 when positioned to determine the zones Z1 to Z6, the sound source A and B are distinct so as to position each of the zone Z3, Z4.
この時、音源AのマイクロホンM1〜M3に対する距離SA1,SA2,SA3は、SA2<SA3<SA1となる。 At this time, the distance SA1, SA2, SA3 to the microphone M1~M3 of the sound source A is a SA2 <SA3 <SA1. また、音源Bの各マイクロホンM1〜M3に対する距離SB1,SB2,SB3は、SB3<SB2<S The distance SB1, SB2, SB3 for each microphone M1~M3 sound source B is, SB3 <SB2 <S
B1となる。 The B1.

【0044】全帯域レベル検出部60の検出信号P(S The detection signal P (S total band level detector 60
1)〜P(S3)のすべてが基準値ThRよりも小さいとき、音源A,Bは発音、例えば発話していないと見なし、制御信号SABiにより、両音響信号SA,SBを抑圧する。 1) When all ~P of (S3) is smaller than the reference value ThR, sound source A, the B considers pronunciation, for example, not speaking, by the control signal SABi, both acoustic signal SA, to suppress the SB. このとき、出力音響信号SA,SBは無音信号となる(図13の101,102)。 At this time, the output sound signals SA, SB becomes silent signal (101, 102 in FIG. 13). 音源Aのみが発音しているときは、その音響信号のすべての帯域の周波数成分がマイクロホンM2へ一番大きな音圧レベル(パワー)で到達するので、このマイクロホンM2のチャネルの合計帯域数χ2が最も多くなる。 When only the sound source A is pronounced, since all of the band of the frequency components of the acoustic signals arrive at the largest sound pressure level to the microphone M2 (power), the total number of bands χ2 channels of the microphone M2 most often made.

【0045】また、音源Bのみが発音しているときは、 [0045] In addition, when only the sound source B is pronounced,
その音響信号のすべての帯域の周波数成分がマイクロホンM3へ一番大きな音圧レベルで到達するので、このマイクロホンM3のチャネルの合計帯域数χ3が最も多くなる。 Since all of the band of the frequency components of the acoustic signals arrive at the largest sound pressure level to the microphone M3, total number of bands χ3 channels of the microphone M3 is the most. さらに、音源A,Bが共に発音している場合には、音響信号が最も大きな音圧レベルで到達する帯域数がマイクロホンM2とM3で拮抗する。 Further, when the sound source A, B are both pronounced is the number of bands in which the acoustic signal to reach the largest sound pressure level antagonize the microphone M2 and M3.

【0046】したがって、前記した基準値ThPにより、音響信号があるマイクロホンへ最も大きな音圧レベルで到達する合計帯域数が、当該基準値ThPを越えた場合、当該マイクロホンが司るゾーンに音源が存在すると判定することにより、発音している音源ゾーンを検出することができる。 [0046] Therefore, the reference value ThP mentioned above, the total number of bands to reach the largest sound pressure level to the microphone there is a sound signal, when it exceeds the reference value ThP, the sound source to a zone where the microphone is responsible is present by determining, it is possible to detect the sound source zone that sound. 上記の例では、音源Aのみが発音しているときは、χ2のみが基準値ThPを越えて、発音している音源が存在するのはマイクロホンM2が司るゾーンZ3であると検出されるので、制御信号SBiにより音声信号SBを抑制して、音響信号SAのみを出力させる(図13の103,104)。 In the above example, when only the sound source A is pronounced, beyond the reference value ThP only chi-square, since the sound source is sound to the presence is detected as the zone Z3 that governs the microphone M2, by suppressing the audio signal SB by the control signals SBi, to output only the sound signal SA (103 and 104 in FIG. 13).

【0047】また、音源Bのみが発音しているときは、 [0047] In addition, when only the sound source B is pronounced,
χ3のみが基準値ThPを越えて、発音している音源が存在するのは、マイクロホンM3が司るゾーンZ4であると検出されるので、制御信号SAiにより音響信号S Beyond the reference value ThP only Kai3, are there sound source is pronounced, since it is detected as a zone Z4 of the microphone M3 is responsible, the sound signal S by the control signal SAi
Aを抑制して、音響信号SBのみを出力させる(図13 To suppress A, to output only the sound signal SB (FIG. 13
の105,106)。 Of 105 and 106). さらに、音源A,Bが共に発音していて、χ2,χ3ともに基準値ThPを越えるときは、例えば音源Aに優先度を与えて、音源Aのみが発音していると処理することができる。 Further, the sound source A, and B are not both pronounced, chi-square, when exceeding χ3 both reference value ThP, for example giving priority to the sound source A, can be processed only sound source A is pronounced. 図13の処理手順はそのようにしてある。 The procedure of FIG. 13 are so. また、χ2,χ3が共に基準値T Further, χ2, χ3 both the reference value T
hPに達していない場合は、レベルP(S1)〜P(S If you do not reach the hP, the level P (S1) ~P (S
3)が基準値ThRを越えている限り、両音源A,Bともに発音していると判断し、制御信号SAi,SBi, 3) As long as exceeds the reference value ThR, determined to be sound both sound source A, B together, control signals SAi, SBi,
SABiの何れも出力せず、音声抑圧部90では合成信号SA,SBに対する抑圧は行われない(図13の10 Both not output SABi, the voice suppression unit 90 combined signal SA, oppression of SB is not performed (10 in FIG. 13
7)。 7).

【0048】以上のようにして、音源分離部80で分離された音源信号SA,SBは、音源状態判定部70によって発音していないと判定された音源に対応するものが、信号抑圧部90で抑圧され、不要音が抑圧されるようになる。 [0048] As described above, the sound source signal SA, SB separated by the sound source separation unit 80, which corresponds to the sound source is determined not to be sounded by the sound source state determination unit 70, the signal suppression unit 90 It is suppressed, so that unnecessary noise is suppressed. 図12に示した状態に対して、図14に示すように音源CをゾーンZ6に加えた場合は、図示しないが音源分離部80からは、音源Aに対応する信号SA、 Figure 12 relative to the state shown in, when added to the zone Z6 sound source C as shown in FIG. 14, from the not shown source separation unit 80, the signal SA corresponding to the sound source A,
音源Bに対応する信号SBの他に、音源Cに対応する信号SCを出力する。 Other signal SB corresponding to the sound source B, and outputs a signal SC corresponding to the sound source C.

【0049】また、信号抑圧部90に対して、音源状態判定部70から、信号SAを抑圧する制御信号SAi、 [0049] Further, with respect to the signal suppression unit 90, the sound source state determination unit 70, a control signal for suppressing the signal SA SAi,
信号SBを抑圧する制御信号SBiの他に、信号SCを抑圧する制御信号SCiが出力する。 Other control signals SBi for suppressing the signal SB, the control signal SCi for suppressing the signal SC is outputted. また、信号SAとSBを抑圧する制御信号SABiの他に、信号SBとS In addition to the control signal SABi for suppressing signals SA and SB, the signal SB and S
Cを抑圧する制御信号SBCi、信号SCとSAを抑圧する制御信号SCAi、信号SAとSBとSCの全部を抑圧する制御信号SABCiが出力する。 Control signal SBCi for suppressing C, control signal SCAi for suppressing the signal SC and SA, a control signal SABCi for suppressing all the signals SA and SB and SC to output. この音源状態判定部70は、図15に示すような処理を行う。 The sound source state determination unit 70 performs the processing as shown in FIG. 15.

【0050】まず、レベルP(S1)〜P(S3)の全部が基準値ThRを越えていない場合は、いずれの音源A〜Cも発音していないものと判断して、音源状態判定部70からSABCiを出力して、信号SA,SB,S Firstly, the level P (S1) if all to P (S3) does not exceed the reference value ThR, it is judged that not even sound either sound A through C, the sound source state determination unit 70 and it outputs the SABCi from the signal SA, SB, S
Cのいずれもが抑圧される(図15の201〜20 Any C of are suppressed (201-20 in FIG. 15
2)。 2). 次に、音源A,B,Cがそれぞれ単独で発音している場合は、P(S1)〜P(S3)の何れかはThR Then, when the sound source A, B, C is sound alone respectively, either the P (S1) ~P (S3) ThR
より大となり、前記した音源が2個の場合と同様に、その音源に最も近いマイクロホンのチャネルのレベルが最も大きくなるので、そのチャネルの帯域数χ1,χ2, Larger becomes, similarly to the sound source is two, the level of the channel nearest the microphone to the sound source is the largest, the number of bands χ1 for the channel, chi-square,
χ3のいずれかが基準値ThPを越える。 Either χ3 exceeds the reference value ThP. そして、音源Cのみが発音している場合は、χ1がThPを越え、制御信号SABiを出力して信号SA,SBが抑圧される(図15の203,204)。 Then, when only the sound source C is sound, .chi.1 exceeds the ThP, signal SA and outputs the control signal SABi, SB is suppressed (203, 204 in FIG. 15). また、音源Aのみが発音している場合は、制御信号SBCiが出力して信号S Further, if only the sound source A is pronounced, the signal S and outputs a control signal SBCi
B,SCが抑圧される。 B, SC is suppressed. さらに、音源Aのみが発音している場合は、制御信号SBCiが出力して信号SB,S Further, when only the sound source A is pronounced, the signal SB by outputting the control signal SBCI, S
Cが抑圧される(図15の205〜208)。 C is suppressed (205-208 in FIG. 15).

【0051】次に、3つの音源A〜Cのうちのいずれか2つが発音する場合は、発音していない音源に対応するゾーンにあるマイクロホンのレベルが最も大きくなる帯域数が、他のマイクロホンのものに比べて小さくなる。 Next, the three case where two of pronunciation any of the sound sources A through C, the number of bands in which the level of the microphone in the zone corresponding to the sound source that does not sound is largest is the other microphones smaller than that.
例えば、音源Cのみが発音していない場合には、マイクロホンM1のレベルが最も大きくなる帯域数χ1が、他の2個のマイクロホンM2,M3の帯域数χ2,χ3に比べて小さくなる。 For example, when only the sound source C is not pronounced, the number of bands χ1 level of the microphone M1 is largest is the number of bands χ2 other two microphones M2, M3, smaller than the Kai3.

【0052】よって、予めある基準値ThQ(<Th [0052] Thus, in advance a reference value ThQ (<Th
P)を設定し、χ1がその基準値ThQ以下になる場合は、マイクロホンM1とマイクロホンM3で空間を2分割したゾーンZ5,Z6の内、マイクロホンM1に近いゾーンZ6では、音源は信号を発していないと判定する。 Set P), if χ1 is below the reference value THQ, among zone Z5, Z6 was divided into two spaces by the microphone M1 and the microphone M3, in zone Z6 close to the microphone M1, the sound source is not emit a signal It determined that there is no. さらに、マイクロホンM1とM2で空間を2分割したゾーンZ1,Z2のうちマイクロホンM1に近いゾーンZ1では音源は信号を発していないと判定する。 Further determines a sound source in zone Z1 close to the microphone M1 of the zones Z1, Z2 were divided into two spaces by the microphone M1 and M2 does not emit a signal.

【0053】すなわち、ゾーンZ1,Z6にある音源は信号を発していないと判定するのである。 [0053] In other words, the sound source in the zone Z1, Z6 is to determined not to emit a signal. これらのゾーンにある音源は音源Cであることから、音源Cが信号を発していないと判定される。 Since the sound source in these zones is a sound source C, it is determined that the sound source C is not emitting a signal. つまり、音源A,Bのみが信号を発していると判定され、制御信号SCiを生成し、信号SCが抑圧される。 That is, it is determined that the sound source A, only B is emitting a signal, generates a control signal SCi, the signal SC is suppressed. 図14に示した状態で3つの音源A〜Cのうち1つのみが発音していない場合は通常は何れのマイクロホンについても最大となる帯域数χ The number of bands only one of the three sound sources A~C in the state shown is that the maximum for any normal microphone if not pronounced in FIG. 14 chi
1,χ2,χ3は基準値ThP以下となるため、図15 1, chi-square, since χ3 is equal to or less than the reference value ThP, 15
においてステップ203,205,207を通過し、ステップ209で、χ1が基準値ThQ以下かを調べ、音源Cのみが発音していなければ、χ1<ThQとなり、 Passes through the steps 203, 205 in, at step 209, checks whether .chi.1 reference value THQ below, unless only the sound source C is not pronounced, .chi.1 <THQ next,
制御信号SCiが生成される(図15の210)。 Control signal SCi is generated (210 in FIG. 15). ステップ209でχ1がThQ以下でなければχ2,χ3についても同様にThQ以下であるかが順次調べられ、T Unless steps 209 χ1 is ThQ less chi-square, similarly do is examined sequentially is ThQ less also χ3, T
hQ以下であれば音源Aのみ、又は音源Bのみが発音していないと推定され、それぞれ制御信号SAi又はSB If hQ less sound source A only, or only the sound source B is estimated not to be sound, control signals SAi or SB
iが抑圧される(図15の211〜214)。 i is suppressed (211-214 in FIG. 15).

【0054】ステップ213でχ3がThQ以下でないと判定されると、音源A,B,Cは全て発音していると判定され、何れの制御信号も生成されない(図15の2 [0054] Step 213 in χ3 is determined not to be less THQ, sound source A, B, C is determined that all are pronounced, even not generated any control signal (2 in Fig. 15
15)。 15). この場合基準値ThPは2n/3〜3n/4程度基準値ThQはn/2〜2n/3程度、つまり例えばThPを2n/3程度にすると、ThQはn/2程度にする。 In this case the reference value ThP is 2n / 3~3n / 4 about the reference value THQ is n / 2~2n / 3 or so, the words example ThP to about 2n / 3, THQ is approximately n / 2.

【0055】なお、以上の例では、ゾーンをZ1〜Z6 [0055] In the above example, the zone Z1~Z6
の6つに分けたが、図16に示すように、中心点Cp から各マイクロホン間の中点を通る点線により3つのゾーンZ1〜Z3に分けても同様に音源状態を判定できる。 Of it was divided into six, as shown in FIG. 16, can be determined similarly sound state be divided into three zones Z1~Z3 by dotted lines passing through the middle point between the microphone from the center point Cp.
この場合は、例えば、音源Aのみが発音している場合は、マイクロホンM2のチャネルの帯域数χ2が最も大きくなるので、そのマイクロホンM2の司るゾーンZ2 In this case, for example, when only the sound source A is pronounced, since the number of bands χ2 channel microphone M2 is maximized, zone charge of the microphone M2 Z2
に音源があると判定される。 It is determined that there is a sound source. また、音源Bのみが発音している場合はχ3が最も大きくなり、ゾーンZ3に音源があると判定される。 Further, if only the sound source B is pronounced it is determined χ3 is greatest, there is a sound source zone Z3. また、χ1が予め設定した値Th In addition, the value Th that χ1 has been set in advance
Q以下である場合には、マイクロホンM1とM2およびM3とそれぞれ2分したうちのゾーンZ1にある音源は発音していないと判定する。 If Q is less than or equal, it is determined that the sound source is in the zone Z1 of a 2 min each microphone M1 and M2 and M3 not pronounced. 以上の処理により、ゾーンを3分割しても、6分割のときと同様に音源の状態を判定できる。 By the above processing, even divided into three zones, can determine the state of the sound source as in the case of the six-division.

【0056】また、基準値ThR,ThP,ThQは、 [0056] In addition, the reference value ThR, ThP, ThQ is,
全てのマイクロホンM1〜M3で同一値を用いた場合で説明したが、マイクロホン毎に適宜変更してもよい。 Has been described in the case of using the same value for all microphones M1 to M3, it may be changed for each microphone. また、以上の説明では、音源が3個でマイクロホンが3個の場合についてであったが、マイクロホンの個数は音源の個数と同数以上であれば、同様に音源ゾーンを検出することができる。 In the above description, the sound source but is was the case the microphone is three by three, the number of microphones as long as the number of sound sources and the same number or more, it is possible to detect the same sound source zone.

【0057】例えば、音源が4個の場合には、4個のマイクロホンにより、個々のチャネルのマイクロホンが1 [0057] For example, when the sound source is four, due four microphones, microphone individual channels 1
個の音源を司るように、図16の分割方法と同様に4個のゾーンに空間を分割する。 As it governs the number of sound sources, to divide the space into dividing method as well as four zones of Figure 16. このときの音源状態判定は、図15のステップ201〜208と同様な処理により、4個全部の音源が無音か、いずれか1個が発音しているかを判定する。 Source state determination at this time is checked by the same process as steps 201 to 208 in FIG. 15, all four of the sound source or silence, or one or is pronounced. それらいずれでもないとき、図15 When neither them, as shown in FIG. 15
のステップ209〜214と同様な処理により、4個の内の1個が無音かを判定し、1個の無音もないとき図1 By the same process as step 209-214 of, one of the four, it is determined whether silence, Figure 1 when no one silence
5のステップ215と同じ処理により全部の音源が発音していると判定する。 It determines that all of the sound source is pronounced by the same process as in step 215 of 5. また、4個の内の3個の音源が発音しているとき(1個が無音のとき)は、そのままとしても良いが、その3個の内のより無音に近い1個を選別するには、次のようにより細かく制御する。 Further, when (if one is silent) the three sound sources of the four is pronounced, it may be as it is, in selecting one closer to the silence of its three in , finer control as follows. すなわち、 That is,
基準値をThQからThS(ThP>ThS>ThQ) ThS the reference value from ThQ (ThP> ThS> ThQ)
に換え、図15の各ステップ210,212,214の各々の次段に図15のステップ209〜214と同様な処理部分を設けて、3個の内から1個の無音に近い音源を判定する。 In exchange, provided the same process parts as steps 209 to 214 of the respective next stage in Figure 15 of each step 210, 212, 214 in FIG. 15, determines one sound source close to the silence from among three .

【0058】このように、音源の数が多くなるほど、図15のステップ209〜214の処理内容を繰り返すことにより、無音又は無音に近い音源を2以上判定することができる。 [0058] Thus, as the number of sound sources increases, by repeating the processing contents of steps 209 to 214 in FIG. 15, it is possible to determine the sound source close to silence or silence more. ただし、判定基準値ThSは処理の繰り返しが増えるほど、ThPに近付ける。 However, the determination reference value ThS is more repetitions of the process is increased, close to ThP. 以上の処理動作手順マイクロホンが4個、音源が4個の場合について図1 Four or more processing operation procedure microphone, FIG. 1 for the case the sound source is four
7に示すようになる。 As it is shown in 7. まずマイクロホンM1〜M4より第1〜第4チャネル信号S1〜S4を取込み(S0 First to fourth channel signal S1~S4 uptake than microphone M1 to M4 (S0
1)、これらチャネル信号S1〜S4のレベルP(S 1), the level of these channel signals S1 to S4 P (S
1)〜P(S4)をそれぞれ検出し(S02)、これらレベルP(S1)〜P(S4)の何れもが基準値ThR 1) to P a (S4) respectively detected (S02), the reference value is any of these levels P (S1) ~P (S4) ThR
以下であるかを調べ(S03)、基準値以下であれば制御信号SABCDiを生成して合成信号SA,SB,S Examined by whether or less (S03), and generates a control signal SABCDi equal to or less than the reference value synthesis signal SA, SB, S
C(S1)の出力を抑圧する(S04)。 Suppressing the output of the C (S1) (S04). ステップS0 Step S0
3で何れかが基準値ThR以下でなければ、各チャネル信号S1〜S4をn帯域に分割すると共にその各帯域のレベルP(S1fi),P(S2fi),P(S3f If either is less than the reference value ThR 3, the level P of each band with divide each channel signal S1~S4 the n bands (S1fi), P (S2fi), P (S3f
i),P(S4fi)(i=1,…,n)を求める(S i), P (S4fi) (i = 1, ..., n) seek (S
05)。 05). 各チャネル間で同一帯域fi Same band fi between channels のレベル中の最大のチャネルfiM(Mは1,2,3,4の何れか)を各帯域について決定し(S06)、全帯域(n個)中でfi1,fi2,fi3,fi4の各合計値χ1,χ The maximum channel FIM (M either 1, 2, 3, 4) in the levels determined for each band (S06), fi1 in all bands (n pieces), fi2, fi3, each sum of fi4 value χ1, χ
2,χ3,χ4を求める(S07)。 2, χ3, seek χ4 (S07). χ1,χ2,χ χ1, χ2, χ
3,χ4中の最大のものχ Mを求め(S08)、χ Mが基準値ThP1(例えばn/3)以上であるかを調べ(S09)、ThP1以上であればチャネルMと対応して選出した音源信号、音源Aの信号であれば分離されたチャネルM以外の分離されたチャネルの分離音響信号を抑圧する制御信号SBCDiを生成する(S010)。 3, obtains the largest of chi M in χ4 (S08), χ M is checked whether the reference value THP1 (e.g. n / 3) or more (S09), in correspondence with channel M if THP1 or more elected sound source signal to generate a control signal SBCDi for suppressing the separation acoustic signals separated channels other than the channel M, which is separated when the signal of the sound source a (S010).
ステップS08から直ちにステップS010へ移ってもよい。 May be immediately proceeds to step S010 from step S08.

【0059】ステップS09で基準値以上でなければχ [0059] χ to be equal to or greater than the reference value in step S09
Mが基準値ThQ以下のチャネルMがあるかを調べる(S011)。 M is checked whether there is a following channel M reference value ThQ (S011). ThQ以下のものがなければ、全ての音源が発音しているとみなして、何れの制御信号も発生しない(S012)。 Without ThQ the following, it is regarded as all the sound source is sound, does not occur any control signal (S012). ステップS011でχ MがThQ以下のチャネルMがあれば、これと対応するチャネルMとして分離された音源信号を抑圧する制御信号SMi If chi M at step S011 is the following channel M THQ, control signal SMi for suppressing a sound source signal separated as a channel M corresponding thereto を生成する(S013)。 To generate a (S013).

【0060】制御信号SMiで抑圧された以外の分離された音源信号中の無音又は無音に近いものを抑圧するには、Sを+1し(S014)(Sは予め0に初期化しておく)、SがM−1(Mは音源の数)と一致したかを調べ(S015)、一致していなければ、ThQを+ΔQ [0060] To suppress close to silence or silence in the separated sound source signals other than those suppressed in the control signal SMi is the S +1 Mr (S014) (S is kept initialized beforehand 0) S it is checked whether consistent with the M-1 (M is the number of sound source) (S015), if they do not match, the ThQ + ΔQ
だけ大としてステップS011に戻る(S016)。 Only large as the flow returns to step S011 (S016). S
がM−1になるまでThQをThPを越えない範囲でΔ Δ in the range but not exceeding ThP the ThQ until M-1
Qづつ増加させステップS011を実行する。 Q at a time is increased to perform the step S011. ステップS015でM−1=Sであれば、その時のThQ以下の各χ Mの各チャネルMと対応する分離された音源信号を抑圧する各制御信号SMiを生成する(S013)。 If M-1 = S, in step S015, it generates each control signal SMi for suppressing the separated sound source signal corresponding to each channel M of ThQ following each chi M at that time (S013). 必要に応じてステップS015でM−1=Sになる前にステップS013に移ってもよい。 It may move to step S013 before the M-1 = S at step S015 as needed.

【0061】ステップS07でχ1〜χ4を計算した後、これらでThP2(例えば2n/3)以上のものがあるかを調べ、あればステップS010に移り、なければステップS011に移るようにしてもよい(S01 [0061] After calculating the χ1~χ4 at step S07, checks whether these in there is thp2 (e.g. 2n / 3) or more of, the flow proceeds to step S010 if, it is also possible to move to step S011 if not (S01
7)。 7). 上述では音源分離の精度を上げるため、マイクロホンM1〜M3のチャネル信号S1〜S3の帯域間レベル差を利用して信号抑圧部90に対する制御信号を生成したが、帯域間時間差を利用して制御信号を生成することもできる。 To increase the accuracy of sound source separation in the above description, to produce a control signal for the signal suppression unit 90 by using the inter-band level difference channel signals S1~S3 microphones M1 to M3, the control signal utilizing interband time difference it is also possible to generate a.

【0062】この例を図18に、図11と対応する部分に同一符号を付けて示す。 [0062] This example is shown in Figure 18, it shows parts corresponding to those in FIG. 11. この実施例では帯域分割部4 Band division portion 4 in this embodiment
1で得られた各帯域f1〜fnの信号S1(f1)〜S Signal S1 of each band f1~fn obtained in 1 (f1) to S
1(fn)から到達時間差信号An(S1f1)〜An 1 (fn) from the arrival time difference signal An (S1f1) ~An
(S1fn)が帯域別時間差検出部101で検出され、 (S1fn) is detected by the band-by-band time difference detector 101,
同様に帯域分割部42,43でそれぞれ得られた各帯域の信号S2(f1)〜S2(fn)、S3(f1)〜S Similarly band dividing section 42, 43 each band signals obtained respectively S2 (f1) ~S2 (fn), S3 (f1) ~S
3(fn)からそれぞれ到達時間差信号An(S2f 3 (fn), respectively the arrival time difference signal An from (S2f
1)〜An(S2fn),An(S3f1)〜An(S 1) ~An (S2fn), An (S3f1) ~An (S
3fn)が帯域別時間差検出部102,103で検出される。 3Fn) is detected by the band-by-band time difference detector 102, 103.

【0063】これらの到達時間差信号を得る処理は、例えば、フーリエ変換により各帯域の信号の位相(あるいは群遅延)を算出し、同一の帯域fiの信号S1(f [0063] processing to obtain these arrival time difference signal, for example, to calculate the phase (or group delay) of each band of the signal by the Fourier transform, the signal of the same band fi S1 (f
i),S2(fi),S3(fi)(i=1,2,…, i), S2 (fi), S3 (fi) (i = 1,2, ...,
n)の位相を相互に比較することで、同一音源信号の到達時間差と対応した信号を得ることができる。 By comparing the phase of the n) to each other, it is possible to obtain a signal corresponding to the arrival time difference of the same source signal. この場合も帯域分割部40での分割は、1つの帯域には1つの音源信号成分しか存在しないとみなせる程度に小さく行う。 Divided in this case the band division unit 40 also performs small enough to be regarded as the one band there is only one source signal component.

【0064】この到達時間差の表現方法は、例えば、マイクロホンM1〜M3のいずれかを基準にしてその基準マイクロホンに対する到達時間差を0に設定しておけば、他のマイクロホンに対する到達時間差はその基準マイクロホンに対して速く到達したか遅く到達したかで判定できるので、正又は負の極性を付した数値で表すことができる。 [0064] representation of the arrival time difference, for example, if the arrival time difference with respect to the reference microphone with respect to the one of the microphone M1~M3 is set to 0, the time difference reached for the other microphone to the reference microphone it can be determined in either reached quickly has been reached late for, can be represented by a numerical value denoted by the positive or negative polarity. この場合、基準マイクロホンを例えばM1とすると、到達時間差信号An(S1f1)〜An(S1 In this case, if the reference microphone for example M1, the arrival time difference signal An (S1f1) ~An (S1
fn)は全て0となる。 fn) are all 0.

【0065】音源状態判定部110では、コンピュータ処理により音声を発していない音源を判定する。 [0065] In the sound source status determination unit 110 determines a sound source that does not emit sound by computer processing. まず、 First of all,
帯域別時間差検出部100により得られる到達時間差信号An(S1f1)〜An(S1fn),An(S2f Arrival time difference signal obtained by the band-by-band time difference detector 100 An (S1f1) ~An (S1fn), An (S2f
1)〜An(S2fn),An(S3f1)〜An(S 1) ~An (S2fn), An (S3f1) ~An (S
3fn)を、同一の帯域の信号について相互に比較する。 The 3fn), are compared with each other for the same band signal. これにより各帯域f1〜fn毎に、最も信号が速く到達するチャネルが決定できる。 Thus each band f1 to fn, most signal channel to reach fast can be determined.

【0066】そこで、各チャネルについて信号が最も速く到達すると判定された帯域の合計数を算出して、それをチャネル間で比較する。 [0066] Therefore, by calculating the total number of bands it is determined that the signal arrives fastest for each channel and compares it between channels. この結果、この合計帯域数の値が大きいチャネルのマイクロホンほど、音源に近いとみなすことができる。 As a result, as the microphone channel value of the total number of bands is large, it can be regarded as close to the sound source. そして、あるチャネルについて、 Then, for a certain channel,
当該合計帯域数が予め設定した基準値ThPを越えたとき、当該のチャネルのマイクロホンが司るゾーンに音源があると判定する。 When the total number of bands exceeds the reference value ThP set in advance, determines that there is a sound source in a zone where the microphone of the channels responsible.

【0067】また、この音源状態判定部110には、全帯域レベル検出部60で検出された各チャネルのレベルP(S1)〜P(S3)も入力され、あるチャネルのレベルが予め設定した基準値ThR以下の場合には、そのチャネルのマイクロホンが司るゾーンには、音源がないと判定する。 [0067] Further, the tone generator state determining unit 110, level P of each channel detected by the full-band level detecting unit 60 (S1) ~P (S3) is also inputted, the reference level of a channel has been set in advance if: value ThR is the zone which controls the microphone of the channel, it is determined that the sound source is not. いま図12に示したように音源A,Bに対し、マイクロホンM1〜M3を配置したとする。 Source A as shown in now to FIG 12, with respect to B, and to place the microphone M1 to M3. またマイクロホンM1のチャネルに対する前記した合計帯域数をχ1、マイクロホンM2,M3の各チャネルに対する合計帯域数をそれぞれχ2,χ3とする。 Also the total number of bands that the relative channel microphone M1 .chi.1, microphones M2, M3 total number of bands, respectively for each channel of the chi-square, the Kai3.

【0068】この場合も図13に示した処理手順と同様にすればよい。 [0068] may be the same as the processing procedure shown in FIG. 13 also in this case. 即ち、まず、全帯域レベル検出部60の検出信号P(S1)〜P(S3)のすべてが基準値Th That is, first, all the reference value Th of the detection signal P of the whole band level detector 60 (S1) ~P (S3)
Rよりも小さいとき(101)、音源A,Bは発音していないと見なし、制御信号SABiを生成して(10 It is smaller than R (101), the sound source A, B are regarded as not sound, and generates a control signal SABi (10
2)、両音源信号SA,SBを抑圧する。 2), both the source signal SA, to suppress the SB. このとき、出力信号SA′,SB′は無音信号となる。 At this time, the output signal SA ', SB' is a silence signal.

【0069】音源Aのみが発音しているときは、その音源信号のすべての帯域の周波数成分がマイクロホンM2 [0069] When only the sound source A is pronounced, all frequency components of the band microphone of the sound source signal M2
へ一番速く到達するので、このマイクロホンM2のチャネルの合計帯域数χ2が最も多くなる。 Since arriving fastest to the total number of bands χ2 channels of the microphone M2 is the most. また、音源Bのみが発音しているときは、その音源信号のすべての帯域の周波数成分がマイクロホンM3へ一番速く到達するので、このマイクロホンM3のチャネルの合計帯域数χ3 Further, when only the sound source B is pronounced, since all of the band of the frequency components of the sound source signal arrives fastest to the microphone M3, the total number of bands of channels of the microphone M3 Kai3
が最も多くなる。 There become the most.

【0070】さらに、音源A,Bが共に発音している場合には、音源信号が最も速く到達する帯域数がマイクロホンM2とM3で拮抗する。 [0070] Further, when the sound source A, B are both pronounced is the number of bands the sound source signal arrives fastest antagonized by the microphone M2 and M3. したがって、前記した基準値ThPにより、音源信号があるマイクロホンへ最も速く到達する合計帯域数が、当該設定値ThPを越えた場合、当該マイクロホンが司るゾーンに音源が存在し、その音源が発音していると判定する。 Therefore, the reference value ThP mentioned above, the total number of bands for the fastest reach the microphone there is a sound source signal, when it exceeds the set value ThP, the sound source is present in the zone to which the microphone is in charge, the sound source and sound It determines that there.

【0071】上記の例では、音源Aのみが発音しているときは、χ2のみが基準値ThPを越えて(図3の10 [0071] In the above example, when only the sound source A is pronounced, beyond only χ2 reference value ThP (10 in FIG. 3
3)、音響を発生している音源が存在するのはマイクロホンM2が司るゾーンZ3であると検出されるので、制御信号SBiが生成され(104)、音響信号SBが抑制され、信号SAのみが出力される。 3), since the there is a sound source that generates the acoustic is detected as the zone Z3 that governs the microphone M2, the control signal SBi is generated (104), an acoustic signal SB is suppressed, only the signal SA is output. また、音源Bのみが発音しているときは、χ3のみが基準値ThPを越え(105)、音を発している音源が存在するのは、マイクロホンM3が司るゾーンZ4であると検出されるので、制御信号SAiが生成され(106)信号SAが抑制されて、信号SBのみが出力される。 Further, when only the sound source B is pronounced, beyond only χ3 reference value ThP (105), are there sound source emits a sound, since it is detected as a zone Z4 of the microphone M3 is responsible , the control signal SAi is generated (106) signal SA is suppressed, only the signal SB is output.

【0072】この例ではThPは例えばn/3程度に設定され、音源A,Bが共に発音していて、χ2,χ3ともに基準値ThPを越えることがある。 [0072] In the example ThP is set to, for example, about n / 3, the sound source A, and B are not both pronounced, chi-square, it may exceed χ3 both reference value ThP. この場合は図1 In this case, Fig. 1
3の処理手順に示すように一方の音源、この例ではAを優先させ、音源Aへ分離信号のみを出力させることもできる。 3 of the procedure one of the sound source as shown in, in this example give preference to A, it is also possible to output only the separated signal to the sound source A. また、χ2,χ3が共に基準値ThPに達していない場合は、レベルP(S1)〜P(S3)が基準値T Further, chi-square, if χ3 is not both reached the reference value ThP, levels P (S1) ~P (S3) the reference value T
hRを越えている限り、両音源A,Bともに発音していると判断し、制御信号SAi,SBi,SABiは出力せず(図3の107)音声抑圧部90では音声信号S As long as exceeds the hR, both sound source A, B are both determined to be sound, the control signal SAi, SBi, SABi does not output (107 of FIG. 3) voice in the voice suppression unit 90 signals S
A,SBに対する抑圧は行われない。 A, oppression of SB is not performed.

【0073】図12に示した状態に対して図14に示すように音源CをゾーンZ6に加えた場合、図示しないが音源分離部80からは、音源Aに対応する信号SA、音源Bに対応する信号SBの他に、音源Cに対応する信号SCが出力する。 [0073] If added to the zone Z6 sound source C as shown in FIG. 14 with respect to the state shown in FIG. 12, from the not shown source separation unit 80, the signal corresponding to the sound source A SA, corresponding to the sound source B other signal SB to the signal SC corresponding to the sound source C is output. これと対応して音源状態判定部110 Sound source status determination unit 110 Correspondingly
から、信号SAを抑圧する制御信号SAi、信号SBを抑圧する制御信号SBiの他に、信号SCを抑圧する制御信号SCiが出力し、また、信号SAとSBを抑圧する制御信号SABiの他に、信号SBとSCを抑圧する制御信号SBCi、信号SCとSAを抑圧する制御信号SCAi、信号SA,SB,SCの全部を抑圧する制御信号SABCiが出力する。 From the control signals SAi for suppressing the signal SA, the other control signals SBi for suppressing the signal SB, the control signal SCi for suppressing the signal SC is output, In addition to the control signal SABi for suppressing signals SA and SB , control signal SBCi for suppressing signals SB and SC, the control signal SCAi for suppressing the signal SC and SA, signal SA, SB, the control signal SABCi for suppressing all the SC output. そして、この音源状態判定部110は先に述べた図15に示したと同様の処理を行う。 Then, the same processing as the sound source status determination unit 110 shown in FIG. 15 described previously.

【0074】まず、レベルP(S1)〜P(S3)の全部が基準値ThRを越えていない場合は、いずれの音源A〜Cも発音していないものと判断して、音源状態判定部110からはSABCiが出力して、信号SA,S [0074] First, the level P (S1) if all to P (S3) does not exceed the reference value ThR, it is judged that not even sound either sound A through C, the sound source status determination unit 110 and output SABCi from the signals SA, S
B,SCのいずれもが抑圧される。 B, none of the SC is suppressed. 次に、音源A,B, Then, the sound source A, B,
Cがそれぞれ単独で発音している場合には、前記した音源が2個の場合と同様に、その音源に最も近いマイクロホンのチャネルの到達時間が最も速くなるので、そのチャネルの帯域数χ1,χ2,χ3のいずれかが基準値T If the C is sound alone respectively, as in the case wherein the sound source is two, since the arrival time of the channel closest microphone to the sound source is fastest, the number of bands χ1 for the channel, chi-square , one of the χ3 the reference value T
hPを越える。 More than hP. そして、音源Cのみが発音している場合は、制御信号SABiが出力して信号SA,SBが抑圧される。 Then, when only the sound source C is sound, the signal SA and outputs the control signal SABi, SB is suppressed. また、音源Aのみが発音している場合は、制御信号SBCiが出力して信号SB,SCが抑圧される。 Further, if only the sound source A is pronounced, the signal SB by outputting the control signal SBCI, SC is suppressed.
さらに、音源Bのみが鳴っている場合は、制御信号SA Further, when only the sound source B is ringing, the control signal SA
Ciが出力して信号SA,SCが抑圧される(図15の203〜208)。 Ci is output to the signal SA, SC is suppressed (203-208 in FIG. 15).

【0075】次に、3つの音源A〜Cのうちのいずれか2つが発音している場合は、発音していない音源に対応するゾーンにあるマイクロホンの到達時間の最も速い帯域数が、他のマイクロホンのものに比べて小さくなる。 Next, three If any two of the sound source A~C although pronounced, the microphone in the zone corresponding to the sound source which is not pronounced fastest band number of arrival time, other smaller than that of the microphone.
例えば、音源Cのみが鳴っていない場合には、マイクロホンM1への到達時間が最も速い帯域数χ1が、他の2 For example, when only the sound source C is not sounding, the number of bands χ1 fastest arrival time to the microphone M1 is, other 2
個のマイクロホンM2,M3の帯域数χ2,χ3に比べて小さくなる。 Number of microphones M2, M3 band number χ2 of smaller than that in the Kai3.

【0076】よって、予めある基準値ThQ(<Th [0076] Thus, in advance a reference value ThQ (<Th
P)を設定し、χ1がその基準値ThQ以下になる場合は、マイクロホンM1とマイクロホンM3で空間を2分割したゾーンZ5,Z6の内、マイクロホンM1に近いゾーンZ6では、音源は信号を発していないと判定し、 Set P), if χ1 is below the reference value THQ, among zone Z5, Z6 was divided into two spaces by the microphone M1 and the microphone M3, in zone Z6 close to the microphone M1, the sound source is not emit a signal it is determined that there is no,
さらに、マイクロホンM1とM2で空間を2分割したゾーンZ1,Z2のうちマイクロホンM1に近いゾーンZ Furthermore, the zone Z close to the microphone M1 of the zones Z1, Z2 were divided into two spaces by a microphone M1 M2
1では音源は信号を発していないと判定する。 In 1 sound source determines that no emit signals.

【0077】すなわち、ゾーンZ1,Z6にある音源は信号を発していないと判定するのである。 [0077] In other words, the sound source in the zone Z1, Z6 is to determined not to emit a signal. これらのゾーンにある音源は音源Cであることから、音源Cが信号を発していないと判定される。 Since the sound source in these zones is a sound source C, it is determined that the sound source C is not emitting a signal. つまり、音源A,Bのみが信号を発していると判定され、制御信号SCiが生成されて信号SCが抑圧される(図15の209〜21 In other words, only the sound sources A, B are determined to emit a signal, the control signal SCi signal SC is generated are suppressed (Fig. 15 209-21
0)。 0). 音源Aのみ、音源Bのみがそれぞれ信号を発していないゾーンも、同様に判定される(図15の211〜 Source A but also the zone in which only the sound source B is not emit signals respectively, are determined in the same manner (211 to in FIG. 15
214)。 214).

【0078】また、χ1,χ2,χ3がともに基準値T [0078] In addition, χ1, χ2, χ3 are both reference value T
hQ以下でないと判定されると、音源A,B,Cはその全てが信号を発していると判定される(図15の21 If it is determined that hQ not less, sound source A, B, C is determined to all of which is emitting a signal (21 in FIG. 15
5)。 5). なお、以上の例では、ゾーンをZ1〜Z6の6つに分けたが、図16に示したように、3つに分けても同様に音源状態を判定できる。 In the above example, although divided zones six Z1 to Z6, as shown in FIG. 16, can be determined similarly sound state be divided into three. この場合は、例えば、音源Aのみが発音している場合は、マイクロホンM2のチャネルの帯域数χ2が最も大きくなるので、そのマイクロホンM2の司るゾーンZ2に音源があると判定される。 In this case, for example, when only the sound source A is pronounced, since the number of bands χ2 channel microphone M2 is maximized, it is determined that there is a sound source in a zone Z2 which governs thereof microphone M2.
また、音源Bのみが発音している場合はχ3が最も大きくなり同様にゾーンZ3に音源があると判定される。 Further, if only the sound source B is pronounced is determined that there is the largest becomes the sound source to the zone Z3 similarly is Kai3. また、χ1が予め設定した値ThQ以下である場合には、 Also, if χ1 is equal to or less than the value ThQ set in advance,
マイクロホンM1とM3で空間を2分したうちのゾーンZ1にある音源は発音していないと判定し、同じくマイクロホンM1とM2で空間を分割したうちのゾーンZ1 Sound sources in the zone Z1 of a 2-minute space by the microphone M1 and M3 is determined that no sound, similarly zone of divided spaces by the microphone M1 and M2 Z1
にある音源は信号を発していないと判定する。 Sound source which is in it is determined that does not emit a signal. 以上の処理により、ゾーンを3分割しても、6分割したときと同様に音源の状態を判定できる。 By the above processing, even divided into three zones, can determine the state of the sound source as well as when 6 divided.

【0079】以上の場合の基準値ThP,ThQの設定は、先の帯域レベルを利用する場合と同様に行えばよい。 [0079] more reference values ​​when ThP, setting ThQ may be performed in the same manner as when using the previous band level. また、基準値ThR,ThP,ThQは、全てのマイクロホンM1〜M3で同一値を用いた場合で説明したが、マイクロホン毎に適宜変更してもよい。 The reference value ThR, ThP, THQ has been described in the case of using the same value for all microphones M1 to M3, it may be changed for each microphone. また、以上の説明では、音源が3個でマイクロホンが3個の場合についてであったが、マイクロホンの個数は音源の個数と同数以上であれば、同様に音源ゾーンを検出することができる。 In the above description, the sound source but is was the case the microphone is three by three, the number of microphones as long as the number of sound sources and the same number or more, it is possible to detect the same sound source zone. その処理手順は先に述べた帯域レベルを利用する場合と同様である。 Its procedure is the same as when using the band level previously mentioned. 従って、例えば音源が4個の場合に4個の内の3個の音源が発音しているとき(1個が無音のとき)は、そのままとしても良いが、その3個の内のより無音に近い1個も選別するには、基準値をThQ Thus, for example, when the sound source is the three sound sources of the four in the case of four are sound (if one is silent) may be as it is, the more silent of its three in selecting the one closer, THQ the reference value
からThS(ThP>ThS>ThQ)に換え、図15 Instead of the ThS (ThP> ThS> ThQ) from, 15
の210,212,214の各々の次段に図15の20 20 of the next stage 15 of each of the 210, 212, 214
9〜214と同様な処理部分を設けて、3個の内から1 9-214 and provided the same processing section, 1 from among the three
個の無音の音源を判定することも同様である。 It is also similar to determine the number of silence of the sound source.

【0080】図17に示した処理において、そのレベルの代りに時間差を用いれば、図18に示した到達時間差を利用した不要信号の抑圧に、図17に示した処理手順も適用できる。 [0080] In the process shown in FIG. 17, by using the time difference instead of the level, the suppression of the undesired signal using an arrival time difference shown in FIG. 18 can be applied processing procedure shown in FIG. 17. 上述においては各マイクロホンの出力チャネル信号をまず帯域分割したが、帯域別レベルを利用する場合はまず各チャネルのパワースペクトルを求めた後、帯域分割してもよい。 Although in the above were first band division output channel signals of the microphones, after the case of using the per-band levels that first determined the power spectrum of each channel may be divided into bands. その例を図19に図1、図1 Figure 1 The example in Figure 19, Figure 1
1と対応する部分と同一符号を付けて示し、これらと異なる部分のみを説明する。 1 and indicated with the corresponding parts the same reference numerals, will be described only these different portions. この例ではマイクロホン1, Microphone 1 In this example,
2よりの各チャネル信号は、パワースペクトル分解部3 Each channel signal than 2, the power spectrum decomposition unit 3
00により、例えば高速フーリエ変換によりパワースペクトルに変換され、その後、各チャネルごとに帯分割部4で各帯域に分割され、各帯域ではほぼ1つの音源信号のみが主として含まれるようにして帯域別レベルを得る。 By 00, for example, is converted to the power spectrum by Fast Fourier transform, then by the band dividing unit 4 for each channel is divided into each band, the band-by-band level as only approximately one source signal is mainly contained in each band obtained. この場合、音源信号選択部602へ供給する各帯域別レベルは、その原スペクトルの位相成分も供給し、音源信号合成部7で音源信号が再生できるようにする。 In this case, the band-by-band level supplied to the sound source signal selecting unit 602, the phase components of the original spectrum is also supplied sound signal in the sound source signal synthesizer 7 to be able to play.

【0081】また各帯域別レベルは帯域別チャネル間レベル差検出部5と音源状態判定部70とへ供給され、これらの部分で図1、図11で説明したように処理されるその他の動作は図1又は図11の場合と同一である。 [0081] Also, each band-by-band level is supplied to the band-by-band channel level difference detector 5 and the sound source status determination unit 70. FIG. 1 in these parts, and other operations that may be processed as described in FIG. 11 the same as is the case of FIG. 1 or FIG. 11. 図2を参照して説明した実施例において、チャネル間時間差を用いずに、各帯域分割信号ごとに、対応帯域別チャネル間時間差のみを用いて、何れの音源から到来したかを判定してもよい。 In reference to the embodiment described with FIG. 2, without using the time difference between the channels, for each band division signal, using only difference between corresponding per-band channel time, it is determined whether coming from any source good. また図5を参照して説明した実施例において、チャネル間レベル差を用いずに、各帯域分割信号ごとに、対応帯域別チャネル間レベル差のみを用いて、何れの音源から到来したかを判定してもよい。 In the embodiment described with reference to FIG. 5, the determination without using the level difference between the channels, for each band division signal, using only level difference between corresponding per-band channel, or coming from any source it may be. 図5 Figure 5
を参照した実施例におけるチャネル間レベル差の検出は、対数レベルに変換する前のレベルを用いてもよい。 Detection of interchannel level differences in the referenced examples may be used levels before conversion into logarithmic levels.
図1中の帯域分割部4、図11、図18中の各帯域分割部40、図20中の帯域分割部233、図21中の帯域分割部241における各周波数帯域の分割は必ずしも同一とする必要はない。 Band dividing section 4 in FIG. 1, FIG. 11, the band dividing section 40 in FIG. 18, band dividing section 233 in FIG. 20, the division of each frequency band in the band division section 241 in FIG. 21 is always the same You need not be. 要求される精度に応じて、これらの分割数を互いに異ならせてもよい。 Depending on the required accuracy may be different these division number to each other. 図20中の帯域分割部233はその後の処理のために、その入力信号のパワースペクトルを先ず求め、その後、複数の周波数帯域に分割してもよい。 For the band division section 233 in FIG. 20 for further processing, first, obtains the power spectrum of the input signal, it may then be divided into a plurality of frequency bands.

【0082】以下に図6〜9に示したこの発明を適用した実験例を示す。 [0082] shows an experimental example of the present invention has been applied to that shown in Figures 6-9 below. 図20に示す3種類の2音源信号の組み合わせにこの発明を適用し、その際に帯域分割部4で与える周波数分解能を変化させ、分離信号を物理的、及び主観的に評価した。 The invention is applied to the combination of three 2 excitation signal shown in FIG. 20, this time to change the frequency resolution provide by the band dividing unit 4, the physical separation signals, and was subjectively evaluated. 分離処理前の混合信号は、チャネル間時間差及びレベル差のみを計算機上で与えて加算することにより作成した。 Mixed signal before separation treatment was prepared by adding giving only the time difference and the level difference between channels on a computer. 与えたチャネル間時間差、レベル差はそれぞれ、0.47ms、2dBである。 Between the given channel time differences, respectively level difference, 0.47Ms, a 2 dB.

【0083】帯域分割部4の周波数分解能は、約5H [0083] frequency resolution of the band division portion 4, about 5H
z,10Hz,20Hz,40Hz,80Hzの5種類とした。 z, and 10Hz, 20Hz, 40Hz, and five types of 80Hz. これらの分解能で分離した信号と、原信号(O A signal separated by these resolutions, the original signal (O
S)の計6種類の信号について評価した。 It was evaluated for a total of six types of signals S). なお、信号帯域は約5kHzである。 The signal bandwidth is about 5 kHz. 定量的評価を次のように行った。 Quantitative evaluation was carried out as follows. 混合された信号の分離が完全に行われた場合、原信号と分離信号が等しくなる。 If separation of the mixed signal is completely performed, the original signal and the separation signal is equal. すなわち、相関係数が1となる。 That is, the correlation coefficient becomes 1. そこで、分離度を計る物理量として、各音について原信号と処理後の信号との相関係数を算出した。 Therefore, as the physical quantity to measure the degree of separation was calculated correlation coefficient between the signal after processing the original signal for each sound.

【0084】結果を、図22に破線で示す。 [0084] The results, shown in broken lines in FIG. 22. 音声は、いずれの組み合わせについても、周波数分解能が80Hz Audio, for any combination, frequency resolution is 80Hz
になると相関値がかなり低くなるが、それ以外の分解能の場合は顕著な差が見られなかった。 Although the correlation value becomes considerably low as becomes, otherwise the resolution was not observed significant differences. 鳥の鳴き声については今回用いた周波数分解能の間に顕著な差は見られなかった。 Significant difference between the frequency resolution for the cry of using this bird was observed. 主観評価を次のように行った。 The subjective evaluation was carried out as follows.

【0085】被験者は、正常な聴力を持つ20代から3 [0085] The subjects, from the 20s with normal hearing 3
0代の日本人5人とした。 0 generation was five Japanese. 各音源について、5種類の周波数分解能の分離音と原音をランダムにヘッドホンでダイオティックに提示し、音質について5段階で評価させた。 For each sound source, the separated sound and original sound of the five types of frequency resolution presented to the diode tick with headphones at random, were evaluated in five steps for the sound quality. 一つの音の提示時間は約4秒間であった。 Presentation time of one of the sound was about 4 seconds. 結果を、 The result,
図22に実線で示す。 Figure 22 shows a solid line. 分離音S1については周波数分解能10Hzの場合が一番評価が高い。 Most Rated cases frequency resolution 10Hz for separated sound S1. また、全ての条件に対する評価の間に有意差(α<0.05)が存在した。 Moreover, significant differences between the evaluation for all the conditions (alpha <0.05) were present. 分離音S2〜4、6については周波数分解能20H Frequency resolution 20H for separated sound S2~4,6
zの評価が最も高いが、20Hzと10Hzとの間には有意差はなかった。 z has the highest rating, but there was no significant difference between the 20Hz and 10 Hz. また、20Hzの音と5Hz,40 In addition, 20Hz sound and 5Hz, 40
Hz,80Hzの間にはそれぞれ有意差が存在した。 Hz, significant differences respectively between 80Hz was present. これらの結果から、音声については分離する組み合わせの種類によらず、最適な周波数分解能が存在することが分かった。 These results, regardless of the type of combination to separate for voice, it was found that the optimum frequency resolution exists. この実験の場合は20Hzもしくは10Hz程度が最適な値である。 For this experiment the optimal value of about 20Hz or 10 Hz. 分離音S5(鳥の鳴き声)については40Hzの場合が最も評価が高いが有意差は40H Separated sound S5 Highest Rated but significant difference when the 40Hz for (birdsong) is 40H
zと5Hz,20Hzと5Hzの間にしか存在しなかった。 z and 5Hz, did not exist only between 20Hz and 5Hz. なお、いずれの場合についても、分離処理後の音と原音の間には有意差が存在した。 Note that in either case, significant difference between the sound after separation and original sound was present.

【0086】図21、図23にこの発明の効果を示す。 [0086] Figure 21, Figure 23 shows the effect of the present invention.
図21は、分離処理前の男声と女声の混合音声のスペクトル201とこの発明による分離処理後の男声S1、女声S2の各スペクトル202,203を表す。 Figure 21 is a male S1 of after separation by spectrum 201 Toko invention of mixed sound of male and female pre-separation process, representing each spectrum 202, 203 of the female S2. 図23 Figure 23
は、分離処理前の男声S1、女声S2の各原音声の各波形をA,Bに、混合音声波形をCに、分離処理後の男声S1、女声S2の各波形をD,Eにそれぞれ示す。 Respectively show the separation process before the male S1, each waveform of each original speech of female S2 A, to B, and mixed sound waveform and C, male S1 after separation, each waveform of the female S2 D, the E . 図2 Figure 2
1からは、不要な成分が抑圧されていることが分かる。 From 1, it can be seen that unnecessary components have been suppressed.
さらに、図23からは、分離処理後の音声が原音声と同程度の品質で復元されていることが分かる。 Furthermore, from FIG. 23, it can be seen that voice after separation process is restored with quality comparable to the original speech.

【0087】帯域分割の分解能は音声の場合、10〜2 [0087] If the resolution of the band division of voice, 10-2
0Hz程度が好ましく、5Hz以下、50Hz以上は好ましくない。 Is preferably about 0 Hz, 5 Hz or less, 50 Hz or higher is not preferred. 帯域分割の手法はフーリエ変換に限らず、 Approach of the band division is not limited to the Fourier transform,
帯域フィルタにより分割してもよい。 It may be divided by the band filter. 次に図11に示したレベル差を利用して音源状態を判定して信号抑圧部9 Then to determine the source state by utilizing the level difference shown in FIG. 11 the signal suppression unit 9
0で信号抑圧を行う場合の実験例を示す。 0 shows the experimental example in the case of performing the signal suppression at. 2個のマイクロホンを用い、2つの音源A,Bをダミーヘッドから距離1.5m、角度差90度(2つのマイクロホンの中点に対し右45度、左45度)の位置に置き、同一の音圧レベルで、残響時間0.2s(500Hz)の可変残響室内で収音した。 Using two microphones placed two sound sources A, B distance 1.5m from the dummy head, angular difference of 90 degrees (right 45 degrees to the midpoint of the two microphones, left 45 degrees) to the position of the same sound pressure level, picked up by the variable reverberation room reverberation time 0.2 s (500 Hz). 用いた混合音と分離音の組み合せは図22中のS1〜S4である。 Mixed sound using a combination of separated sound is S1~S4 in FIG.

【0088】分離音声S1〜S4について、無音と判定されたフレームの個数と、原音の無音フレームの個数の比率を算した。 [0088] For separating speech S1 to S4, were calculated and the number of frames is determined to silence, the ratio of the number of silence frames of the original sound. その結果は次の通り90%以上正しく検出された。 The results were detected correctly as follows more than 90%. 男(S1) 女(S2) 女声1(S3) 女声2(S4) 検出率 99% 93% 92% 95% 図6〜9に示した基本方法と図11に示した改良方法とのそれぞれで分離した音をランダムにヘッドホンでダイオティックに提示し、雑音の交じり具合の少なさと不連続感の少なさについて評価させた。 Man (S1) Female (S2) female 1 (S3) female 2 (S4) separated by each of the improved method shown in the basic process and Figure 11 shows the detection rate of 99% 93% 92% 95% Figure 6-9 was the sound presented to the diode tick with headphones at random, were evaluated for lack of small and sense of discontinuity of the noise of intermingle condition. 用いた分離音は前記S1〜S4であり、被験者は正常な聴力を持つ20代から30代の日本人5名である。 The separation sound using is said S1~S4, the subject is a five Japanese in their 30s from 20s with normal hearing. 一つの音の提示時間は約4秒間、各音の試行回数は3回である。 Presentation time of one sound is about 4 seconds, the number of trials of each sound is 3 times. その結果、雑音の交じり具合が少ないと評価した率は改良方法が91. As a result, the rate of evaluation with less noise intermingle condition is improved process is 91.
7%、基本方法は8.3%で、改良方法が少ないと判断した回答が格段と多かった。 7%, the basic method by 8.3%, answer it is determined that there is little improvement methods were many and far. 一方不連続感が少ないについては改良方法は20.0%、基本方法が80.0%で基本方法の方が少ないと判断する回答が多かったが、改良方法との間に有意な差は見られなかった。 Meanwhile 20.0% improvement method for discontinuous little sense, but the basic method were many answers to determine the direction of the basic method is less at 80.0%, observed significant difference between the improved methods It is did not.

【0089】次に分離性能を相対評価を行うため、以下の5種類の音の分離度の比較を主観評価により行った。 [0089] Since the next separation performance performing relative evaluation was performed by the subjective evaluation of the comparison of the degree of separation of the following five types of sound. (1)原音 (2)基本法(計算機):チャネル間時間差(0.47 (1) original sound (2) Basic Law (computer): inter-channel time difference (0.47
ms)、レベル差(2dB)を与えて計算機上で加算した混合信号を、基本方法で分離した音。 ms), the level difference a mixed signal obtained by adding on a computer giving (2 dB), and separated by the basic methods sound. (3)改良法(実環境):先の無音区間検出率の実験に用いた条件で収音した混合音を改良方法で分離した音。 (3) improved methods (real environment): sound separated preceding silence interval detection rate mixed sound picked up by the conditions used in the experiment in the improved method. (4)基本法(実環境):先の無音区間検出率の実験に用いた条件で収音した混合音を基本方法で分離した音。 (4) Basic Law (real environment): Sound separating the previously mixed sound picked up by the conditions used for the silent section detection rate experiments with the basic method. (5)混合音:先の無音区間検出率の実験に用いた条件で収音した混合音。 (5) mixed sound: previous mixed sound picked up by the conditions used for the silent section detection rate experiments.

【0090】図20中の最初の2つの混合音に対し、 [0090] The first two of the mixed sound in FIG. 20 against,
“原音”上記(1)〜(4)の方法で処理した音、“混合音”の計20種類をランダムにヘッドホンでダイオティックに提示し、分離度について7段階で評価させた。 "Original sound" (1) to (4) sound treated by the method of the total of 20 kinds of "mixed sound" presented diode tick headphones randomly were evaluated in seven stages for separation.
つまり「最も分離されている」を7点、「最も分離されていない」を1点とした。 That the "are most separated" 7 points, and 1 point for "not most separation". 被験者、音の提示時間及び試行回数は、前記雑音の交じり具合の少なさの評価の場合と同一である。 Subject, presentation time and number of trials of the sound is the same as the case of the evaluation of the lack of condition intermingle of the noise.

【0091】この結果を図24中で、全音源(S0)をAに、男声(S1)をBに、女声(S2)をCに、女声1(S3)をDに、女声2(S4)をEにそれぞれ示す。 [0091] The results in Figure 24, the total sound source (S0) to A, male voice and (S1) to B, female and (S2) and C, female 1 (S3) to the D, female 2 (S4) They are shown respectively in E. 全音源について分析した結果(S0)と、音源の種類毎に分析した結果(S1)〜(S4)とは、ほぼ同じ傾向を示した。 The results were analyzed for all sound sources (S0), and the result of the analysis for each type of source (S1) ~ (S4), showed almost the same tendency. S0〜S4全ての場合について、 S0~S4 for the case of all,
“(1)原音”、“(2)基本法(計算機)”、 "(1) the original sound", "(2) Basic Law (computer)",
“(3)改良法(実環境)”、“(4)基本法(実環境)”、“(5)混合音”の順に分離精度が高い。 "(3) improved methods (real environment)", "(4) Basic Law (real environment)", in descending order in the separation accuracy of the "(5) mixed sound". つまり実環境では改良方法の方が基本方法より優れている。 That is more of an improved method in the real environment is better than the basic method.

【0092】 [0092]

【発明の効果】以上述べたようにこの発明によれば複数のマイクロホンからの各チャネル信号を、主な成分が1 According As described above, according to the present invention to the present invention each channel signals from a plurality of microphones, the main component is 1
つの音源信号の成分のみからなる程度に複数の帯域に分割し、これら各同一帯域について、レベル、到達時間を検出し、これらから、各帯域ごとに何れの音源信号かを判定分離することにより、各音源信号を正しく分離することができ、しかも実時間での処理が可能である。 One of the divided into a plurality of bands to the extent that only consists of components of the sound source signals, for each of these same bands, level, detects the arrival time, from these, by determining separation either of the sound source signals for each band, It can be separated each sound source signals correct and it can be processed in real time.

【0093】特に発音していない音源を検出し、その成分を抑圧することにより、部屋内のような回り込みや、 [0093] to detect the sound source that is not particularly pronounced, by suppressing its components, the sneak and like in the room,
残響がある場所でも、正確に分離することができる。 Even in places where there is reverberation, it is possible to accurately separate.

【図面の簡単な説明】 BRIEF DESCRIPTION OF THE DRAWINGS

【図1】この発明の音源分離装置の実施例の機能構成を示すブロック図。 1 is a block diagram showing a functional configuration example of the sound source separation apparatus of the present invention.

【図2】この発明の音源分離方法の実施例の処理手順を示す流れ図。 Figure 2 is a flow chart of a processing procedure example of the sound source separation method of the present invention.

【図3】図2中のチャネル間時間差Δτ 1 ,Δτ 2を求める処理手順の例を示す流れ図。 [3] between channel time difference in Figure 2 .DELTA..tau 1, flow diagram illustrating an example of a processing procedure for obtaining the .DELTA..tau 2.

【図4】A,Bはそれぞれ二つの音源信号のスペクトルの例を示す図である。 [4] A, respectively B is a diagram showing an example of the spectrum of the two sound signals.

【図5】この発明の音源分離方法で、チャネル間レベル差を利用して音源分離を行う実施例の処理手順を示す流れ図。 [5] In the sound source separation method of the present invention, a flow chart showing a processing procedure of the embodiment carries out sound source separation by using a level difference between the channels.

【図6】この発明音源分離方法で、チャネル間レベル差と、チャネル間到達時間差を利用する実施例の処理手順の一部を示す流れ図。 Figure 6 is a flow diagram illustrating this invention a sound source separation method, a level difference between channels, some of the examples of the procedure that utilizes time difference of arrival between the channels.

【図7】図6中のステップS08の続きを示す流れ図。 Figure 7 is a flow diagram illustrating the sequence of steps S08 in FIG.

【図8】図6中のステップS09の続きを示す流れ図。 Figure 8 is a flow diagram illustrating the sequence of steps S09 in FIG.

【図9】図6中のステップS10、図7、図8中のステップS20,S30の続きを示す流れ図。 [9] Step S10 in FIG. 6, FIG. 7, a flow diagram illustrating the sequence of steps S20, S30 in FIG.

【図10】周波数帯域が異なる音源信号を分離する実施例の機能構成を示すブロック図。 10 is a block diagram showing the functional configuration of the embodiment frequency band to separate the different sound source signals.

【図11】レベル差を利用して不要音源信号を抑圧する構成を付加したこの発明の音源分離装置の実施例の機能構成を示すブロック図。 11 is a block diagram showing a functional configuration example of the sound source separation apparatus of this invention utilizing the level difference adding structure to suppress the unwanted sound source signal.

【図12】3つのマイクロホンとその受けもつゾーンと、2つの音源の配置例を示す図。 [12] three microphones and a zone having received them, shows an example of an arrangement of two sound sources.

【図13】発音している音源が1つの場合の音源ゾーンの検出と、抑圧制御信号の生成処理手順の例を示す流れ図。 Figure 13 is a flow chart of a sound to which sound source of the sound source zone when one detecting an example of processing for generating of the suppression control signal.

【図14】3つのマイクロホンと、その受けもつゾーンと、3つの音源の配置例を示す図。 Shows 14] and three microphones, and zones having received them, the arrangement of the three sound sources.

【図15】音源が3つの場合の発音音源のゾーン検出と、抑圧制御信号の生成処理手順の例を示す流れ図。 Figure 15 is a flow diagram illustrating the zone detection pronunciation sound when the sound source is three, examples of processing for generating of the suppression control signal.

【図16】3つのマイクロホンによりゾーンを3つに分割した例と、音源の配置例を示す図。 The example is divided into three zones by [16] three microphones, illustrates an example of arrangement of the sound source.

【図17】この発明の音源分離装置において、発音していない合成音源信号を抑圧する制御信号を生成するための処理手順の例を示す流れ図。 Figure 17 is a flow diagram illustrating an example of the sound source separation apparatus according to the present invention, the procedure for generating a control signal for suppressing the synthesis sound signal with no sound.

【図18】到達時間差を利用して不要音源信号を抑圧する構成を付加したこの発明の音源分離装置の実施例の機能構成を示すブロック図。 Figure 18 is a block diagram showing a functional configuration example of the sound source separation apparatus of this was added a structure for suppressing the unwanted sound source signal by using the arrival time difference invention.

【図19】この発明音源分離装置で、パワースペクトルを求めた後、帯域分割を行う場合の実施例の機能構成を示すブロック図。 [19] In the present invention a sound source separation apparatus, after obtaining the power spectrum, block diagram showing a functional configuration example of the case of performing the band division.

【図20】この発明の実験に用いた音源の種類を示す図。 FIG. 20 shows a type of a sound source used in the experiment of the present invention.

【図21】図6〜図9に示した実施例の方法による処理前と、処理後の音声スペクトルを示す図。 FIG. 21 shows a pretreatment according to the method of the embodiment shown in FIGS. 6-9, the speech spectrum after treatment.

【図22】図6〜図9に示した実施例の方法を用いた主観評価実験の結果を示す図。 Figure 22 shows the results of subjective evaluation experiment using the method of the embodiment shown in FIGS. 6-9.

【図23】図6〜図9に示した実施例の方法により処理した処理後の音声波形と、その原音声波形を示す図。 [Figure 23] and speech waveform after processing treated by the method of the embodiment shown in FIGS. 6 to 9, shows the original speech waveform.

【図24】図6〜図9に示した音源分離方法と図11に示した音源分離装置とについての実験結果を示す図。 Shows the results of experiments on the sound source separation apparatus shown in the sound source separation method and 11 shown in FIG. 24] 6 to 9.

───────────────────────────────────────────────────── フロントページの続き (51)Int.Cl. 7識別記号 FI G10L 21/02 G10L 9/00 H H04S 7/00 (72)発明者 西野 豊 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (56)参考文献 特開 平7−168586(JP,A) 特開 平5−344011(JP,A) 米国特許5610991(US,A) (58)調査した分野(Int.Cl. 7 ,DB名) H04R 3/00 320 G01S 5/18 G10L 11/00 G10L 15/20 G10L 19/00 G10L 21/02 H04S 7/00 ────────────────────────────────────────────────── ─── of the front page continued (51) Int.Cl. 7 identification mark FI G10L 21/02 G10L 9/00 H H04S 7/00 (72) inventor Yutaka Nishino Tokyo Nishi-Shinjuku, Shinjuku-ku, Third Street No. 19 No. 2 Japan telegraph and telephone within Co., Ltd. (56) reference Patent flat 7-168586 (JP, a) JP flat 5-344011 (JP, a) United States Patent 5610991 (US, a) (58) investigated the field (Int .Cl. 7, DB name) H04R 3/00 320 G01S 5/18 G10L 11/00 G10L 15/20 G10L 19/00 G10L 21/02 H04S 7/00

Claims (52)

    (57)【特許請求の範囲】 (57) [the claims]
  1. 【請求項1】 互いに離して設けられた複数のマイクロホンを用いて、複数の音源から少なくとも1つの音源を分離する音源分離方法であって、 上記各マイクロホンの各出力チャネル信号を、複数の周波数帯域に分割する帯域分割過程と、 上記帯域分割過程で分割された各出力チャネル信号の各同一帯域ごとに、上記複数のマイクロホンの位置に起因して変化する、マイクロホンに到達する音響信号のパラメータの値の差を、帯域別チャネル間パラメータ値差として検出する帯域別チャネル間パラメータ値差検出過程と、 上記各帯域の帯域別チャネル間パラメータ値差にもとづき、その帯域の上記帯域分割された各出力チャネル信号の何れがいずれの音源から入力された信号であるかを判定する音源信号判定過程と、 上記音源信号判定過程 [Claim 1] using a plurality of microphones arranged apart from each other, a sound source separation method for separating at least one sound source from a plurality of sound sources, each output channel signals of the respective microphones, a plurality of frequency bands a band dividing step of dividing the, for each same band of each output channel signals divided by the band division process, changes due to the position of the plurality of microphones, the value of the parameter of the acoustic signals reaching the microphone difference and a band-specific channel between the parameter value difference detection step of detecting as between the per-band channel parameter value differences, based on the band-by-band channel between the parameter value difference of each band, each output channel that is above the band division of the band of a sound source signal determination process determines which of the signals is a signal input from any source, the source signal determination process 判定にもとづき、上記帯域分割された各出力チャネル信号から、同一音源から入力された信号を少なくとも1つ選択する音源信号選択過程と、 上記音源信号選択過程で同一音源からの信号として選択された複数の帯域信号を音源信号として合成する音源合成過程とを有することを特徴とする音源分離方法。 Based on the determination, from the output channel signal the band division, a sound source signal selecting step of selecting at least one of a signal input from the same source, multiple selected as a signal from the same sound source in the sound source signal selection process sound source separation method characterized by having a sound synthesis process for synthesizing the band signal as a sound source signal.
  2. 【請求項2】 請求項1記載の方法において、 上記帯域分割過程は各出力チャネル信号の各分割された帯域信号は、主として1つの音源の音響信号の成分よりなる程度に、小さく分割することを特徴とする音源分離方法。 2. A method according to claim 1, wherein, to the extent the band division process each divided band signal of each output channel signal, consisting of components of the acoustic signals of primarily one source, to divide smaller sound source separation method according to claim.
  3. 【請求項3】 請求項1又は2記載の方法において、 上記帯域別チャネル間パラメータ値差検出過程における上記パラメータ値は音源からの音響信号が上記各マイクロホンに到達するまでの時間であり、上記帯域別チャネル間パラメータ値差は各マイクロホンに到達するまでの時間のマイクロホン間の差である帯域別チャネル間時間差であることを特徴とする音源分離方法。 3. A method according to claim 1 or 2, wherein said parameter values ​​in the respective band channel between the parameter value difference detection process is the time until the sound signal from a sound source reaches the respective microphone, said band sound source separation method, wherein the another channel between the parameter value difference is the difference between the per-band channel time difference is the time between the microphones to reach each microphone.
  4. 【請求項4】 請求項3記載の方法において、 上記音響信号が各マイクロホンに到達するまでの時間のマイクロホン間の差をチャネル間時間差として各マイクロホンの出力チャネル信号から検出するチャネル時間差検出過程を有し、 上記音源信号判定過程は、上記各帯域別チャネル間時間差について、上記各チャネル間時間差を照合して、その帯域の上記分割された各出力チャネル信号がいずれの音源から入力された信号であるかを判定することを特徴とする音源分離方法。 4. A method according to claim 3, wherein, have a channel time difference detection step of detecting from the output channel signals of the microphones as inter-channel time difference the difference between the time of the microphones to the acoustic signal reaches each microphone and, said sound source signal determination process, for each band-by-band channel time difference, by matching the time differences between the respective channels, each output channel signal above the division of the band is a signal input from any source sound source separation method characterized by determining whether.
  5. 【請求項5】 請求項4記載の方法において、 上記チャネル時間差検出過程は各出力チャネル信号間の相互相関を求め、相互相関の各ピークとなるその出力チャネル信号間の各時間差として上記各チャネル間時間差を求めることを特徴とする音源分離方法。 5. A method according to claim 4, wherein said channel time difference detection process obtains a correlation between the output channel signals, between the as the time difference between the output channel signals as a respective peak of the cross-correlation channel sound source separation method characterized by determining the time difference.
  6. 【請求項6】 請求項5記載の方法において、 上記帯域別チャネル間時間差は、上記各チャネル間時間差中の、上記分割された各出力チャネルの同一帯域の成分の位相差と対応する時間と最も近いものを求めて、その帯域別チャネル間時間差とすることを特徴とする音源分離方法。 6. The method of claim 5, wherein the time difference between the per-band channel is in the between the channel time difference, most the time corresponding to the phase difference between the components of the same band of each output channel that is the divided seeking close, the sound source separation method, characterized by its inter-band-specific channel time differences.
  7. 【請求項7】 請求項1又は2記載の方法において、 上記帯域別チャネル間パラメータ値差検出過程における上記パラメータ値は音源からの音響信号が上記各マイクロホンに到達した時の信号レベルであり、上記帯域別チャネル間パラメータ値差は各分割された出力チャネル信号の対応帯域間のレベル差である帯域別チャネル間レベル差であることを特徴とする音源分離方法。 7. The method of claim 1 or 2, wherein said parameter values ​​in the respective band channel between the parameter value difference detection process is a signal level when the sound signal from a sound source reaches the respective microphone, said sound source separation method, wherein the per-band channel between the parameter value difference is a per-band channel level difference is the level difference between corresponding bands of the divided output channel signals.
  8. 【請求項8】 請求項7記載の方法において、 上記各マイクロホンの出力チャネル信号間のレベル差を、チャネル間レベル差として検出するチャネル間レベル差検出過程と、 上記チャネル間レベル差と、対応する帯域別チャネル間レベル差の全てと比較する比較過程と、 その比較過程で分割帯域の所定数以上が同様の関係にあれば、上記チャネル間レベル差にもとづき、対応する出力チャネル信号の全帯域について同一の音源から入力された信号であると判定し、上記比較過程で所定値以上が同様の関係になければ、上記帯域別にいずれの音源から入力された信号であるかを判定する上記音源信号判定過程を実行することを特徴とする音源分離方法。 8. The method of claim 7, the level difference between the output channel signals of each microphone, and a level difference detection process between channels for detecting a level difference between channels, and between the channel level differences, the corresponding a comparing step of comparing with all the per-band channel level difference, if more than a predetermined number of similar relationships divided bands in the comparison process, based on the level difference between the channels, for all the bands of the corresponding output channel signal determines that the signal inputted from the same source, unless the predetermined value or more same relationship in Comparative process, the source signal determination determines whether the signal input from the band apart any sound source sound source separation method characterized by performing a process.
  9. 【請求項9】 請求項1又は2記載の方法において、 上記パラメータ値は音源からの音響信号が上記マイクロホンに到達するまでの時間と、その音響信号が到達した時の信号レベルであり、上記帯域別チャネル間パラメータ値差として帯域別チャネル間時間差と、帯域別チャネル間レベル差が求められ、 各音源からの音響信号が上記各マイクロホンに到達するまでの時間のマイクロホン間の差を、各マイクロホンの出力チャネル信号から、チャネル時間差として検出するチャネル間時間差検出過程と、 上記チャネル間時間差を基準にして上記分割された各出力チャネル信号を、低域、中域、高域の3つの周波数領域に分け領域分割過程とを有し、 上記音源信号判定過程は、 上記分割された低域の周波数帯域については、上記帯域別チャネル 9. The method of claim 1 or 2, wherein the parameter value is the time an acoustic signal from a sound source to reach the microphone, a signal level of when the acoustic signal arrives, the band and between the band-by-band channel time differences as a separate inter-channel parameter value differences, the band-by-band channel level difference is determined, the acoustic signal from each sound source to the difference between the time of the microphone to reach each microphone, each microphone from the output channel signal, and time difference detection process between the channels to detect a channel time differences, each output channel signal the divided based on the time difference between the channels, divided into low, mid, three frequency region of the high frequency and a region division step, the sound source signal determination process, the divided for the low frequency band is the band-by-band channel 時間差を利用して対応する帯域の分割された各出力チャネル信号の何れがいずれの音源からの入力信号であるか判定する過程と、 上記分割された中域の周波数帯域については、上記帯域別チャネル間レベル差と、上記帯域別チャネル間時間差を利用して、対応する帯域の分割された各出力チャネル信号の何れがいずれの音源からの入力信号であるか判定する過程と、 上記分割された高域の周波数帯域については、上記帯域別チャネル間レベル差を利用して、対応する帯域の分割された各出力チャネル信号の何れかがいずれの音源からの入力信号であるか判定する過程とからなることを特徴とする音源分離方法。 And determining process either is whether the input signal from any source of each divided output channel signals of the band corresponding utilizing a time difference, for the frequency band of the divided middle band, the band-by-band channel and between the level difference, by using the time difference between the per-band channel, and determines the course any Do is an input signal from any source of the corresponding band split each output channel signals of the high is the divided the frequency band of the band, by using a level difference between the per-band channel, and a corresponding determining step whether any of the band divided each output channel signals of the input signals from either source sound source separation method, characterized in that.
  10. 【請求項10】 請求項1〜9の何れかに記載の方法において、 上記帯域別チャネル間パラメータ値差検出過程において、その互いに差をとるべき、もとのチャネル信号の周波数帯域が異なる場合は、その周波数帯域が互いに重ならない周波数帯域は、上記帯域別チャネル間パラメータ値差検出過程を実行せず、上記音源信号判定過程ではその信号がある帯域を予め知られている広い帯域の音源からの入力信号と判定することを特徴とする音源分離方法。 10. A method according to any one of claims 1 to 9, in the parameter value difference detection process between the per-band channel, to take its mutually different, if the frequency band of the original channel signal is different from , the frequency band whose frequency bands do not overlap each other, without executing the parameter value difference detection process between the per-band channel, from a broad band of the sound source that is in the source signal determination process is known in advance the band where that signal sound source separation method characterized by determining an input signal.
  11. 【請求項11】 互いに離して設けられた複数のマイクロホンを用いて、複数の音源から少なくとも1つの音源を分離する音源分離方法であって、 上記各マイクロホンの各出力チャネル信号のパワースペクトルを求めるスペクトル分解過程と、 上記各チャネルごとのパワースペクトルを、主としてほぼ1つの音源の成分が含まれるように複数の周波数帯域に分割する帯域分割過程と、 上記各同一帯域ごとに、各チャネル間で分割されたパワースペクトル差を、帯域別チャネル間レベル差として検出する帯域別チャネル間レベル差検出過程と、 上記各帯域の帯域別チャネル間レベル差にもとづき、その帯域の信号が上記出力チャネル信号の何れであるかを判定する音源信号判定過程と、 上記音源信号判定過程の判定にもとづき、上記分割され 11. Using the plurality of microphones arranged apart from each other, a sound source separation method for separating at least one sound source from a plurality of sound sources, spectral obtaining the power spectrum of each output channel signal of each microphone and the decomposition process, the power spectrum of each said respective channel, a band dividing step of dividing into a plurality of frequency bands to contain components primarily approximately one sound source, for each of the respective same band is divided among the channels and the power spectrum difference, and the band-by-band channel level difference detection step of detecting a level difference between the per-band channel, based on the inter-band-by-band channel level difference of each band, the signal of the band is in any of the output channel signal a sound source signal determination process determines whether, based on the determination of the source signal determination process is the division パワースペクトルから、同一音源からの信号を少なくとも1つ選択する音源信号選択過程と、 上記音源信号選択過程で同一音源からのものとして選択されたスペクトルを音源信号として合成する音源合成過程とを有することを特徴とする音源分離方法。 From the power spectrum, it has a source signal selection process to select at least one signal from the same sound source, a sound source synthesis process of synthesizing the selected spectral as being from the same source in the source signal selection process as a sound source signal sound source separation method according to claim.
  12. 【請求項12】 請求項11記載の方法において、 上記各マイクロホンの出力チャネル信号間のレベル差をチャネル間レベル差として検出するチャネル間レベル差検出過程と、 上記チャネル間レベル差と、対応する上記帯域別チャネル間レベル差の全てとを比較する比較過程と、 その比較過程で分割帯域の所定数以上が同様の関係であれば、上記チャネル間レベル差にもとづき、対応する出力チャネル信号の全帯域について同一音源から入力された信号であると判定し、上記比較過程で所定値以上が同様の関係になければ、上記音源信号判定過程を実行することを特徴とする音源分離方法。 12. A method according to claim 11, wherein the channel level difference detection step of detecting a level difference between the output channel signals of the microphones as the level difference between the channels, the level difference between the channels, corresponding to the aforementioned a comparing step of comparing with all the per-band channel level difference, if a predetermined number or more similar relationship divided band in the comparison process, based on the level difference between the channels, the total bandwidth of the corresponding output channel signal About determines that the signal input from the same source, unless more than a predetermined value in the same relationship in the comparison step, the sound source separation method characterized by performing the source signal determination process.
  13. 【請求項13】 請求項1乃至12の何れかの方法において、 上記各マイクロホンの出力チャネル信号を、各帯域が主として1つの音源信号成分になる程度に、複数の周波数帯域に分割する第2帯域分割過程と、 上記第2帯域分割過程で分割された各出力チャネル信号の帯域別レベルをそれぞれ検出する帯域別レベル検出過程と、 その帯域別レベル検出過程で検出された各帯域別レベルを同一帯域についてチャネル間で比較した結果にもとづき発音をしていない音源を検出する音源状態判定過程と、 その音源状態判定過程で得た発音をしていない音源の検出信号により、上記音源合成過程で合成された音源信号のうち、上記発音していない音源と対応する合成信号を抑圧する信号抑圧過程とを有することを特徴とする音源分離方法。 13. The method of any of claims 1 to 12, the output channel signals of the respective microphones, to the extent that each band is primarily one source signal component, a second band which is divided into a plurality of frequency bands splitting process and, above the per-band level detecting step of detecting respective per-band level of the second band dividing each output channel signal divided in the process, the same band of each band-by-band level detected at that respective band level detection process for a sound source state determination process of detecting a sound source which is not a sound based on a result of comparison between the channels, the detection signal of the sound source which is not a sound obtained by the sound source state determination process, is synthesized by the sound synthesis process among the sound source signal, sound source separation method characterized by having a signal suppression process for suppressing a combined signal corresponding to the sound source that is not the sound.
  14. 【請求項14】 請求項13の方法において、 上記音源状態判定過程は、上記各帯域別レベルのチャネル間での比較で、最も大きいチャネルを帯域ごとに決定する過程と、 各チャネルごとに最もレベルが大きい帯域の数を求める過程と、 上記最もレベルが大きい帯域の数が第1基準値を越えるか否か判定する第1判定過程と、 その第1判定過程で第1基準値を越えると判定すると、 The method of the claim 13, said sound source state determination process, the comparison between the channel of each respective band levels, and determining the largest channel for each band, the most level for each channel determination and process of obtaining a greater number of bands, the the most level is high band first determination step number determines whether more than a first reference value, exceeds the first reference value in the first determination step Then,
    その越えた最もレベルが大きい帯域の数と対応するチャネルのマイクロホン位置から、発音している1個の音源を推定する過程と、 その推定された音源以外の音源を発音していないものとして検出する過程とを有することを特徴とする音源分離方法。 From the microphone position of the channels corresponding to the number of its most level is high bandwidth exceeds the steps of estimating one sound source is sound, is detected as not being tone generator other than the estimated sound source sound source separation method characterized by having the steps.
  15. 【請求項15】 請求項1〜12の何れかに記載の方法において、 上記各マイクロホンの各出力チャネル信号のパワースペクトルを求めるスペクトル分解過程と、 上記各チャネルごとのパワースペクトルを、主としてほぼ1つの音源の成分が含まれるように周波数帯域を分割して帯域別レベルをそれぞれ検出する帯域別レベル検出過程と、 これら各帯域別レベルを同一帯域について比較し、最大レベルのチャネルを各帯域ごとに決定する過程と、 各チャネルごとの最大レベルの帯域の数を求める過程と、 その帯域の数が第1基準値を越えたか否かを判定する第1判定過程と、 その第1判定過程で第1基準値を越える数と判定すると、その越えたチャネルのマイクロホンが受けもつ、ゾーンから発音している1個の音源を推定する過程と、 15. The method according to any one of claims 1 to 12, the spectral decomposition process of obtaining the power spectrum of each output channel signals of the respective microphones, a power spectrum for each said respective channels, primarily approximately one a band-by-band level detecting step of detecting a band-by-band level respectively by dividing a frequency band to contain components of the sound source, each of these bands by level compared for the same band, determines the maximum level of the channel for each band the method comprising the steps of determining the number of bands up to the level of each channel, a first determination step determines whether the number of the band exceeds a first reference value, the first in the first determination step If it is determined that the number exceeds the reference value, the step of estimating with receiving the microphone of the past channel, one sound source is sound from the zone, の推定された音源以外の音源は発音していないと判定する過程と、 上記音源合成過程で合成された音源信号のうち、上記発音していないと判定された音源と対応する信号を、抑圧する信号抑圧過程とを有することを特徴とする音源分離方法。 The estimated sound source other than the sound source and the process determines that no sound, among the sound source signal synthesized by the sound source synthesis process, a signal corresponding to the sound source is determined not to be the sounding suppresses sound source separation method characterized by having a signal suppression process.
  16. 【請求項16】 請求項14又は15の方法において、 上記第1判定過程で、第1基準値を越えるものがないと判定されると、上記最もレベルが大きい帯域の数が、上記第1基準値よりも小さい第2基準値以下か否かを判定する第2判定過程と、 その第2判定過程で、第2基準値より小さいと判定されると、その小さいと判定された最もレベルが大きい帯域の数と対応するチャネルのマイクロホン位置から、発音していない1個の音源として検出する過程とを有することを特徴とする音源分離方法。 16. The method of claim 14 or 15, in the first determination step, when it is determined that there is no one exceeds the first reference value, the number of bands the highest level is high, the first reference a second determination step determines whether or not the following second reference value smaller than the value at its second determination process, if it is judged to be smaller than the second reference value, the most level is high is determined that the small sound source separation method of the number of bands from the microphone position of the corresponding channel, characterized by having a process of detecting a single sound source which is not pronounced.
  17. 【請求項17】 請求項1乃至12の何れかの方法において、 上記各マイクロホンの出力チャネル信号を、各帯域が主として1つの音源信号成分になる程度に、複数の周波数帯域に分割する第2帯域分割過程と、 上記第2帯域分離過程で分割された各出力チャネル信号のそのマイクロホンへの到達時間差を同一帯域ごとに検出する帯域別時間差検出過程と、 この帯域別時間差検出過程で検出された各帯域別到達時間差を、同一帯域についてチャネル間で比較した結果にもとづき発音をしていない音源を検出する音源状態判定過程と、 その音源状態判定過程で得た発音をしていない音源の検出信号により、上記音源合成過程で合成された音源信号のうち、上記発音していない音源と対応する合成信号を抑圧する信号抑圧過程とを有することを 17. The method of any of claims 1 to 12, the output channel signals of the respective microphones, to the extent that each band is primarily one source signal component, a second band which is divided into a plurality of frequency bands a dividing process, the a band-by-band time difference detection process of the arrival time difference of the microphones of the second band separation process each output channel signal divided by the detecting for each same band, each detected by the band-by-band time difference detection process per-band arrival time difference, for the same band and the sound source state determination process of detecting a sound source which is not a sound based on a result of comparison between the channels, the detection signal of the sound source which is not a sound obtained by the sound source state determination process among the sound source signal synthesized by the sound source synthesis process, to have a signal suppression process for suppressing a combined signal corresponding to the sound source that is not the sounding 徴とする音源分離方法。 Sound source separation method and butterflies.
  18. 【請求項18】 請求項3の方法において、 上記帯域別チャネル間時間差を、同一帯域についてチャネル間で比較した結果にもとづき発音をしていない音源を検出する音源状態判定過程と、 その音源状態判定過程で得た発音をしていない音源を検出信号により、上記音源合成過程で合成された音源信号のうち、上記発音していない音源と対応する信号を抑圧する信号抑圧過程とを有することを特徴とする音源分離方法。 18. The method of claim 3, the time difference between the per-band channel, a source state determination process of detecting a sound source which is not a sound based on a result of comparison between the channels for the same band, determining the source state the detection signal source that is not a sound obtained by the process of the sound source signal synthesized by the sound source synthesis process, characterized in that it has a signal suppression step of suppressing the signal corresponding to the sound source that is not the sounding sound source separation method to be.
  19. 【請求項19】 請求項17又は18の方法において、 上記音源状態判定過程は、上記各帯域別到達時間差比較で最も速く音源信号が到達したチャネルを帯域ごとに決定する過程と、 各チャネルごとに最も速く到達した帯域の数が第1基準値を越えるか否かを判定する第1判定過程と、 その第1判定過程が第1基準値を越えると判定すると、 19. The method of claim 17 or 18, said sound source state determination process is a process of determining a channel fastest sound source signal reaches the comparison each band by arrival time difference for each band, for each channel fastest number of the reached band and the first determination process determines whether more than a first reference value, if the first determination process determines that exceeds the first reference value,
    その越えた最も速く到達した帯域数と対応するチャネルのマイクロホン位置から発音している1個の音源を推定する過程と、 その推定された音源以外の音源を発音していないものとして検出する過程とを有することを特徴とする音源分離方法。 A step of estimating one sound source with sound from a microphone position of the corresponding channel has a band number of fastest reach beyond them, the process of detecting as not pronounce the sound source other than the estimated sound source sound source separation method characterized by having a.
  20. 【請求項20】 請求項19の方法において、 上記第1判定過程で、第基準値を越えるものがないと判定されると、上記最も速く到達する帯域の数が、上記第1基準値よりも小さい第2基準値より小さいか否かを判定する第2判定過程と、 その第2判定過程で、第2基準値より小さいと判定されると、その小さいと判定された最も速い到達時間の帯域数と対応するチャネルのマイクロホン位置から、発音していない1個の音源として検出する過程とを有することを特徴とする音源分離方法。 In the method of 20. The method of claim 19, in the first determination step, when it is determined that there is no one exceeds the first reference value, the number of bands to reach the fastest is than the first reference value a second discriminating step whether even smaller less than the second reference value is determined, in that the second determination process, if it is judged to be smaller than the second reference value, the fastest arrival time is determined as the small sound source separation method of the number of bands from the microphone position of the corresponding channel, characterized by having a process of detecting a single sound source which is not pronounced.
  21. 【請求項21】 請求項16又は20の方法において、 音源が4個以上の場合で、上記第判定過程で、第基準値より小さいと判定されると、上記第2基準値を上記第1基準値を越えない範囲内で、順次大きくして、上記第2判定過程と同じ判定を、(M−2)回以内、Mは音源の数、繰返す過程を有することを特徴とする音源分離方法。 21. The method of claim 16 or 20, when the sound source is 4 or more, in the second determination process, if it is judged to be smaller than the second reference value, said first and said second reference value within a range not exceeding the first reference value, and sequentially increased, the same determination as the second determination step, (M-2) within times, M is the sound source separation, characterized in that it comprises several sound sources, the process of repeating Method.
  22. 【請求項22】 請求項13〜21の何れかに記載の方法において、 各出力チャネル信号の全周波数成分のレベルをそれぞれ検出する全帯域レベル検出過程と、 その全帯域レベル検出過程で検出した各チャネルの全周波数成分レベルの何れもが第3基準値以下であるかを判定し、何れかが第3基準値以下でないと判定すると上記音源状態判定過程に移る第3判定過程とを有することを特徴とする音源分離方法。 22. A method according to any one of claims 13 to 21, the whole band level detecting step of detecting the level of all frequency components of each output channel signals respectively, each detected by the full-band level detecting step If none of the all frequency components level of the channel is determined or less than the third reference value, determines that either is not less third reference value that a third determination process moves to the sound source state determination process sound source separation method according to claim.
  23. 【請求項23】 請求項22の方法において、 上記第3判定過程が第3基準値以下であると判定されると、上記音源合成過程で合成された各音源信号のすべてを抑圧する過程を有することを特徴とする音源分離方法。 23. The method of claim 22, when the third determination process is determined to be equal to or less than the third reference value, comprising the step of suppressing all of each sound source signal synthesized by the sound synthesis process sound source separation method, characterized in that.
  24. 【請求項24】 請求項13〜23の何れかの方法において、 上記帯域分割過程と上記第2帯域分割過程は同一過程として行われることを特徴とする音源分離方法。 24. A method of any of claims 13 to 23, the band division process and the second band dividing process a sound source separation method, characterized in that is carried out as the same process.
  25. 【請求項25】 互いに離して設けられた複数のマイクロホンを用いて、複数の音源から少なくとも1つの音源を分離する音源分離装置であって、 上記各マイクロホンの各出力チャネル信号を、主として1つの音源の音響信号の成分のみが含まれる程度に複数の周波数帯域に分割すると共に、これら分割された各出力チャネル信号の各同一帯域ごとに、上記複数のマイクロホンの位置に起因して変化する、マイクロホンに到達する音響信号のパラメータの値の差を、帯域別チャネル間パラメータ値差として検出する帯域別チャネル間パラメータ値差検出手段と、 上記各帯域の帯域別チャネル間パラメータ値差にもとづき、その帯域の上記帯域分割された各出力チャネル信号の何れがいずれの音源から入力された信号であるかを判定する音源信 25. Using the plurality of microphones arranged apart from each other, a sound source separation apparatus for separating at least one sound source from a plurality of sound sources, each output channel signals of the respective microphones, one mainly sound source thereby divided into a plurality of frequency bands to the extent that contains only the component of the acoustic signal, each same band of each divided output channel signals, changes due to the position of the plurality of microphones, the microphone the difference between the values ​​of the parameters of the arriving acoustic signals, a band-specific channel between the parameter value difference detecting means for detecting as between the per-band channel parameter value differences, based on the band-by-band channel between the parameter value difference of each band, the band sound signal determines whether the signal either is input from any source of each output channel signal the band division 判定手段と、 上記音源信号判定過程の判定にもとづき、上記帯域分割された各出力チャネル信号から、同一音源から入力された信号を少なくとも1つ選択する音源信号選択手段と、 上記音源信号選択過程で同一音源からの信号として選択された、複数の帯域信号を音源信号として合成する音源合成手段とを具備することを特徴とする音源分離装置。 And determining means, based on the determination of the source signal determination process, from each output channel signal the band division, a sound source signal selecting means for selecting at least one of a signal input from the same source, with the source signal selection process was selected as the signal from the same sound source, the sound source separation apparatus characterized by comprising a sound source synthesizing means for synthesizing a plurality of band signals as a sound source signal.
  26. 【請求項26】 請求項25の装置において、 上記帯域別チャネル間パラメータ値差検出手段における上記パラメータ値は音源からの音響信号が上記各マイクロホンに到達するまでの時間であり、上記帯域別チャネル間パラメータ値差は各マイクロホンに到達するまでの時間のマイクロホン間の差である帯域別チャネル間時間差であることを特徴とする音源分離装置。 The apparatus of claim 26 according to claim 25, said parameter values ​​in the respective band channel between the parameter value difference detecting means is a time until the sound signal from a sound source reaches the respective microphone, between the per-band channel parameter value difference is the sound source separation apparatus, characterized in that the difference between the per-band channel time difference is the time between the microphones to reach each microphone.
  27. 【請求項27】 請求項25の装置において、 上記音響信号が各マイクロホンに到達するまでの時間のマイクロホン間の差をチャネル間時間差として各マイクロホンの出力チャネル信号から検出するチャネル時間差検出手段を有し、 上記音源信号判定手段は、上記各帯域別チャネル間時間差について、上記各チャネル間時間差を照合して、その帯域の上記分割された各出力チャネル信号がいずれの音源から入力された信号であるかを判定する手段であることを特徴とする音源分離装置。 The apparatus of claim 27 claim 25, comprising a channel time difference detecting means for detecting from the output channel signals of the microphones as the time difference between the channels the difference between the time of the microphones to the acoustic signal reaches each microphone or said excitation signal determination means, for the time difference between the respective band-by-band channels, by matching the time differences between the respective channels, each output channel signal above the division of the band is a signal input from any source sound source separation apparatus, characterized in that the means for determining.
  28. 【請求項28】 請求項25の装置において、 上記帯域別チャネル間パラメータ値差検出手段における上記パラメータ値は音源からの音響信号が上記各マイクロホンに到達した時の信号レベルであり、上記帯域別チャネル間パラメータ値差は各分割された出力チャネル信号の対応帯域間のレベル差である帯域別チャネル間レベル差であることを特徴とする音源分離装置。 The apparatus of claim 28 according to claim 25, said parameter values ​​in the respective band channel between the parameter value difference detecting means is a signal level when the sound signal from a sound source reaches the respective microphone, said band-by-band channel during parameter value difference is the sound source separation apparatus, characterized in that the inter-band-by-band channel level difference which is a level difference between corresponding bands of the divided output channel signals.
  29. 【請求項29】 請求項28の装置において、 上記各マイクロホンの出力チャネル信号間のレベル差を、チャネル間レベル差として検出するチャネル間レベル差検出手段と、 上記チャネル間レベル差と、対応する帯域別チャネル間レベル差の全てと比較する比較手段と、その比較手段で分割帯域の所定数以上が同様の関係にあれば、上記チャネル間レベル差にもとづき、対応する出力チャネル信号の全帯域について同一の音源から入力された信号であると判定し、上記比較手段で所定値以上が同様の関係になければ、上記帯域別にいずれの音源から入力された信号であるかを判定する上記音源信号判定手段を実行する手段を含むことを特徴とする音源分離装置。 The apparatus of claim 29 according to claim 28, the level difference between the output channel signals of the respective microphones, and inter-channel level difference detection means for detecting a level difference between the channels, the level difference between the channels, the corresponding band comparing means for comparing with all other inter-channel level differences, if more than a predetermined number of similar relationships divided bands by the comparison means, based on the level difference between the channels, the same for all bands of the corresponding output channel signal of determining that the input signal from the sound source, unless more than a predetermined value in the same relationship with the comparing means, the source signal determination means for determining whether the signal input from the band apart any sound source sound source separation apparatus which comprises means for performing.
  30. 【請求項30】 請求項25の装置において、 上記パラメータ値は音源からの音響信号が上記マイクロホンに到達するまでの時間と、その音響信号が到達した時の信号レベルであり、上記帯域別チャネル間パラメータ値差として帯域別チャネル間時間差と、帯域別チャネル間レベル差が求められ、 各音源からの音響信号が上記各マイクロホンに到達するまでの時間のマイクロホン間の差と、各マイクロホンの出力チャネル信号から、チャネル時間差として検出するチャネル間時間差検出手段と、 上記チャネル間時間差を基準にして、上記分割された各出力チャネル信号を、低域、中域、高域の3つの周波数領域に分ける領域分割手段とを有し、 上記音源信号判定手段は、 上記分割された低域の周波数帯域については、上記帯域別チャネル間 The apparatus of 30. The method of claim 25, said parameter values ​​time until an acoustic signal from a sound source reaches the microphone, a signal level of when the acoustic signal arrives, between the per-band channel and between the band-by-band channel time difference as the parameter value difference, the band-by-band channel level difference is determined, and the difference between the time of the microphone to the sound signal from the sound sources reaches each microphone, output channel signals of the microphones from the time difference detector between the channels to detect a channel time difference, based on the time difference between the channels, each output channel signal the divided, low, mid, area division divided into three frequency regions of high-frequency and means, the sound source signal determination means, for the low frequency band that is the split between the per-band channel 間差を利用して対応する帯域の分割された各出力チャネル信号の何れがいずれの音源からの入力信号であるか判定する手段と、 上記分割された中域の周波数帯域については、上記帯域別チャネル間レベル差と、上記帯域別チャネル間時間差を利用して、対応する帯域の分割された各出力チャネル信号の何れがいずれの音源からの入力信号であるか判定する手段と、 上記分割された高域の周波数帯域については、上記帯域別チャネル間レベル差を利用して、対応する帯域の分割された各出力チャネル信号の何れかがいずれの音源からの入力信号であるか判定する手段とからなることを特徴とする音源分離装置。 By utilizing differences among any and judges means whether the input signal from any source of each divided output channel signals of the corresponding band, the frequency band of the divided middle band, the band-by-band a level difference between the channels by using the time difference between the per-band channel, means for determining whether any of the corresponding band split each output channel signals of the input signals from either source was the split the frequency band of the high band, by utilizing the level difference between the per-band channel, and a corresponding determining means either a band split each output channel signals of the input signals from either source sound source separation apparatus characterized by comprising.
  31. 【請求項31】 請求項25乃至30の何れかの装置において、 上記帯域分割された各出力チャネル信号の帯域別レベルをそれぞれ検出する帯域別レベル検出手段と、 その帯域別レベル検出手段が検出された各帯域別レベルを同一帯域についてチャネル間で比較した結果にもとづき発音をしていない音源を検出する音源状態判定手段と、 その音源状態判定手段で得た発音をしていない音源の検出信号により、上記音源合成手段で合成された音源信号のうち、上記発音していない音源と対応する信号を抑圧する信号抑圧手段とを有することを特徴とする音源分離装置。 In any of the apparatus 31. Claim 25 to 30, and the band-by-band level detecting means for detecting the band divided per-band level of each output channel signals, respectively, the band-by-band level detecting means is detected a sound source state determining means for detecting a sound source which is not a sound based on a result of comparison between the channels for the same band of each band-by-band level, the source of the detection signal that is not a sound obtained by the sound source state determining means among the sound source signal synthesized by the sound source synthesizing means, the sound source separation apparatus characterized by having a signal suppressing means for suppressing the signal corresponding to the sound source that is not the sound.
  32. 【請求項32】 請求項31の装置において、 上記音源状態判定手段は、上記各帯域別レベルのチャネル間での比較で、最も大きいチャネルを帯域ごとに決定する手段と、 各チャネルごとに最もレベルが大きい帯域の数を求める手段と、 上記最もレベルが大きい帯域の数が第1基準値を越えるか否か判定する第1判定手段と、 その第1判定手段で第1基準値を越えると判定すると、 32. A device according to claim 31, said sound source state determination means, the comparison between the channel of each respective band levels, means for determining the largest channel for each band, the most level for each channel determination means for determining the number of large bandwidth, and determining whether the first judgment means the number of bands the highest level is high exceeds a first reference value, exceeds the first reference value in the first determination means Then,
    その越えた最もレベルが大きい帯域の数と対応するチャネルのマイクロホン位置から、発音している1個の音源を推定する手段と、 その推定された音源以外の音源を発音していないものとして検出する手段とを有することを特徴とする音源分離装置。 From the microphone position of the channels corresponding to the number of its most level is high bandwidth beyond, means for estimating one sound source is sound, it is detected as not being tone generator other than the estimated sound source sound source separation apparatus characterized by having means.
  33. 【請求項33】 請求項32の装置において、 上記第1判定手段で、第1基準値を越えるものがないと判定されると、上記最もレベルが大きい帯域の数が、上記第1基準値よりも小さい第2基準値以下か否かを判定する第2判定手段と、 その第2判定手段で、第2基準値より小さいと判定されると、その小さいと判定された最もレベルが大きい帯域の数と対応するチャネルのマイクロホン位置から、発音していない1個の音源として検出する手段とを有することを特徴とする音源分離装置。 The apparatus of claim 33 according to claim 32, in the first determining means, when it is determined that there is no one exceeds the first reference value, the number of bands the highest level is large, than the first reference value a second judging means for determining whether the following is also small second reference value, in the second determining means, if it is judged to be smaller than the second reference value, the most level is high band it is determined that the small from the microphone position of the corresponding channel with the number, the sound source separation apparatus, characterized in that it comprises a means for detecting as a single sound source which is not pronounced.
  34. 【請求項34】 請求項25乃至30の何れかの装置において、 上記帯域分割された各出力チャネル信号のそのマイクロホンへの到達時間差を同一帯域ごと検出する帯域別時間差検出手段と、 この帯域別時間差検出手段で検出された各帯域別到達時間差を、同一帯域についてチャネル間で比較した結果にもとづき発音をしていない音源を検出する音源状態判定手段と、 その音源状態判定手段で得た発音をしていない音源を検出信号により、上記音源合成手段で合成された音源信号のうち、上記発音していない音源と対応する信号を抑圧する信号抑圧手段とを有することを特徴とする音源分離装置。 In any of the apparatus 34. The method of claim 25 or 30, the band split and the band-by-band time difference detecting means for detecting each of the same band arrival time difference to the microphone of the respective output channel signals, the band-by-band time difference each band-by-band arrival time difference detected by the detection means, a sound source state determining means for detecting a sound source which is not a sound based on a result of comparison for the same band between channels, and a sound obtained by the sound source state determining means by the non excitation detection signal among the sound source signal synthesized by the sound source synthesizing means, the sound source separation apparatus characterized by having a signal suppressing means for suppressing the signal corresponding to the sound source that is not the sound.
  35. 【請求項35】 請求項34の装置において、 上記音源状態判定手段は、上記各帯域別到達時間差比較で最も速く音源信号が到達したチャネルを帯域ごとに決定する手段と、 各チャネルごとに最も速く到達した帯域の数が第1基準値を越えるか否かを判定する第1判定手段と、 その第1判定手段が第基準値を越えると判定すると、 The apparatus of claim 35 according to claim 34, said sound source state determination means includes means for determining a channel fastest sound source signal arrives at each band by the arrival time difference comparison for each band, the fastest for each channel a first judging means for judging whether the number of bands that have reached exceeds a first reference value, when the first determination means determines that exceeds the first reference value,
    その越えた最も速く到達した帯域数と対応するチャネルのマイクロホン位置から発音している1個の音源を推定する手段と、 その推定された音源以外の音源を発音していないものとして検出する手段とを有することを特徴とする音源分離装置。 Means for estimating one sound source with sound from a microphone position of the corresponding channel has a band number of fastest reach beyond its means for detecting as not pronounce the sound source other than the estimated sound source sound source separation apparatus characterized by having a.
  36. 【請求項36】 請求項35の装置において、 上記第1判定手段で、第1基準値を越えるものがないと判定されると、上記最も速く到達する帯域の数が、上記第1基準値よりも小さい第2基準値以下か否かを判定する第2判定手段と、 その第2判定手段で、第2基準値より小さいと判定されると、その小さいと判定された最も速い到達時間の帯域数と対応するチャネルのマイクロホン位置から、発音していない1個の音源として検出する手段とを有することを特徴とする音源分離装置。 The apparatus of claim 36 according to claim 35, in the first determining means, when it is determined that there is no one exceeds the first reference value, the number of bands to reach the fastest is than the first reference value a second judging means for determining whether the following is also small second reference value, in the second determining means, if it is judged to be smaller than the second reference value, the most rapid arrival time zone it is determined as the small from the microphone position of the corresponding channel with the number, the sound source separation apparatus, characterized in that it comprises a means for detecting as a single sound source which is not pronounced.
  37. 【請求項37】 請求項31〜36の何れかに記載の装置において、 各出力チャネル信号の全周波数成分のレベルをそれぞれ検出する全帯域レベル検出手段と、 その全帯域レベル検出手段で検出した各チャネルの全周波数成分レベルの何れもが第3基準値以下であるかを判定し、何れかが第1基準値以下でないと判定すると、上記音源状態判定手段に移る第3判定手段とを有することを特徴とする音源分離装置。 Device according to any one of claims 37] according to claim 31 to 36, the whole band level detection means for detecting the level of all frequency components of each output channel signals respectively, each detected by the full-band level detecting means If none of the all frequency components level of the channel is determined or less than the third reference value, or is determined not to be less than the first reference value, that a third judging means moves to the sound source state judging means sound source separation apparatus according to claim.
  38. 【請求項38】 互いに離して設けられた複数のマイクロホンを用いて、複数の音源から少なくとも1つの音源を分離する下記過程を有する音源分離方法のプログラムを記録した記録媒体であって、 上記各マイクロホンの各出力チャネル信号を、主に1つの音源の音響信号の成分のみを含む程度に複数の周波数帯域に分割すると共にこれら分割された各出力チャネル信号の各同一帯域ごとに、上記複数のマイクロホンの位置に起因して変化する、マイクロホンに到達する音響信号のパラメータの値の差を、帯域別チャネル間パラメータ値差として検出する帯域別チャネル間パラメータ値差検出過程と、 上記各帯域の帯域別チャネル間パラメータ値差にもとづき、その帯域の上記帯域分割された各出力チャネル信号の何れがいずれの音源から入 38. Using the plurality of microphones arranged apart from each other, a recording medium recording a program of sound source separation method comprising the following step of separating at least one sound source from a plurality of sound sources, each microphone of each output channel signal, mainly for each same band of each divided output channel signals as well as divided into a plurality of frequency bands to the extent that include only components of the acoustic signal of one sound source, of the plurality of microphones changes due to the position, the difference between the values ​​of the parameters of the acoustic signals reaching the microphone, and the band-by-band channel between the parameter value difference detection step of detecting as between the per-band channel parameter value differences, per-band channels of each band based between parameter value difference, either the input from any source of each output channel signal the band division of the band された信号であるかを判定する音源信号判定過程と、 上記音源信号判定過程の判定にもとづき、上記帯域分割された各出力チャネル信号から、同一音源から入力された信号を少なくとも1つ選択する音源信号選択過程と、 上記音源信号選択過程で同一音源からの信号として選択された複数の帯域信号を音源信号として合成する音源合成過程とを有するコンピュータにより読出し可能な記録媒体。 Signal and the sound source signal determination process determines whether the that is, the sound source based on the determination of the source signal determination process, from each output channel signal the band division, to select at least one signal input from the same source a signal selection process readable recording medium by a computer having a sound source synthesis process of synthesizing the plurality of band signals that are selected as the signal from the same sound source in the sound source signal selection process as a sound source signal.
  39. 【請求項39】 請求項38の記録媒体において、 上記帯域別チャネル間パラメータ値差検出過程における上記パラメータ値は音源からの音響信号が上記各マイクロホンに到達するまでの時間であり、上記帯域別チャネル間パラメータ値差は各マイクロホンに到達するまでの時間のマイクロホン間の差である帯域別チャネル間時間差であって、 上記プログラムは上記音響信号が各マイクロホンに到達するまでの時間のマイクロホン間の差をチャネル間時間差として各マイクロホンの出力チャネル信号から検出するチャネル時間差検出過程を有し、 上記音源信号判定過程は、上記各帯域別チャネル間時間差について、上記各チャネル間時間差を照合して、その帯域の上記分割された各出力チャネル信号がいずれの音源から入力された信号である 39. A recording medium according to claim 38, said parameter values ​​in the respective band channel between the parameter value difference detection process is the time until the sound signal from a sound source reaches the respective microphone, said band-by-band channel during parameter value difference is a difference between the per-band channel time difference is the time between the microphones to reach each microphone, the program the difference between the time of the microphones to the acoustic signal reaches each microphone has a channel time difference detection step of detecting from the output channel signals of the microphones as inter-channel time differences, the source signal determination process, the time difference between the respective band-by-band channels, by matching the time differences between the respective channel, of the band is at each output channel signal the divided is inputted from any of the source signal かを判定することを特徴とする記録媒体。 Recording medium and judging whether.
  40. 【請求項40】 請求項39の記録媒体において、 上記チャネル時間差検出過程は各出力チャネル信号間の相互相関を求め、相互相関の各ピークとなる、その出力チャネル信号間の各時間差上記各チャネル間時間差 A recording medium 40. 39. The channel time difference detection process obtains a correlation between the output channel signals, and each peak of the cross-correlation, each channel each time difference between the output channel signals time difference and between
    して求めることを特徴とする記録媒体。 Recording medium, characterized in that to determined.
  41. 【請求項41】 請求項40の記録媒体において、 上記帯域別チャネル間時間差は、上記各チャネル間時間差中の、上記分割された各出力チャネルの同一帯域の成分の位相差と対応する時間と最も近いものを求めて、その帯域別チャネル間時間差とすることを特徴とする記録媒体。 A recording medium 41. Claim 40, the time difference between the per-band channel is in the between the channel time difference, most the time corresponding to the phase difference between the components of the same band of each output channel that is the divided seeking close, the recording medium, characterized by its inter-band-specific channel time differences.
  42. 【請求項42】 請求項38の記録媒体において、 上記帯域別チャネル間パラメータ値差検出過程における上記パラメータ値は音源からの音響信号が上記各マイクロホンに到達した時の信号レベルであり、上記帯域別チャネル間パラメータ値差は各分割された出力チャネル信号の対応帯域間のレベル差である帯域別チャネル間レベル差であって、 上記プログラムは上記各マイクロホンの出力チャネル信号間のレベル差を、チャネル間レベル差として検出するチャネル間レベル差検出過程と、 上記チャネル間レベル差と、対応する帯域別チャネル間レベル差の全てと比較する比較過程と、その比較過程で分割帯域の所定数以上が同様の関係にあれば、上記チャネル間レベル差にもとづき、対応する出力チャネル信号の全帯域について同一の音源 11. 42. A recording medium according to claim 38, said parameter values ​​in the respective band channel between the parameter value difference detection process is a signal level when the sound signal from a sound source reaches the respective microphone, said band by parameter value difference between channels is an inter-band-by-band channel level difference which is a level difference between corresponding bands of the divided output channel signals, the program the level difference between the output channel signals of the respective microphones, inter-channel a level difference detecting step between the channels to detect a level difference, the level difference between the channels, a comparison step of comparing with all the level difference between corresponding per-band channel, or a predetermined number of divided bands in the comparison process similar if the relationship, based on the level difference between the channels, the corresponding output channel signal the total bandwidth for the same sound source から入力された信号であると判定し、上記比較過程で所定値以上が同様の関係になければ、上記帯域別にいずれの音源から入力された信号であるかを判定する、上記音源信号判定過程と実行する過程とを有することを特徴とする記録媒体。 Determines that the signal input from, unless the relationship than the predetermined value is the same in the comparison step determines whether the signal input from the band apart any sound source, and the source signal determination process recording medium characterized by having a process of executing.
  43. 【請求項43】 請求項38の記録媒体において、 上記プログラムは上記パラメータ値は音源からの音響信号が上記マイクロホンに到達するまでの時間と、その音響信号が到達した時の信号レベルであり、上記帯域別チャネル間パラメータ値差として帯域別チャネル間時間差と、帯域別チャネル間レベル差が求められ、 各音源からの音響信号が上記各マイクロホンに到達するまでの時間のマイクロホン間の差を、各マイクロホンの出力チャネル信号から、チャネル時間差として検出するチャネル間時間差検出過程と、 上記チャネル間時間差を基準にして、上記分割された各出力チャネル信号を、低域、中域、高域の3つの周波数領域に分ける領域分割過程とを有し、 上記音源信号判定過程は、 上記分割された低域の周波数帯域については、 11. 43. A recording medium according to claim 38, said program is a signal level when the sound signal is obtained by time and reaches its acoustic signal to reach the microphone from the parameter values ​​sound source, the and between the band-by-band channel time difference as the parameter value difference between respective band channel, per-band channel level difference is determined, the acoustic signal from each sound source to the difference between the time of the microphone to reach each microphone, the microphone from the output channel signals, and time difference detection process between the channels to detect a channel time difference, based on the time difference between the channels, each output channel signal the divided, low, mid, three frequency region of the high frequency and a region division step of dividing the, the source signal determination process, the low frequency band that is the split, 記帯域別チャネル間時間差を利用して対応する帯域の分割された各出力チャネル信号の何れがいずれの音源からの入力信号であるか判定する過程と、 上記分割された中域の周波数帯域については、上記帯域別チャネル間レベル差と、上記帯域別チャネル間時間差を利用して、対応する帯域の分割された各出力チャネル信号の何れがいずれの音源からの入力信号であるか判定する過程と、 上記分割された高域の周波数帯域については、上記帯域別チャネル間レベル差を利用して、対応する帯域の分割された各出力チャネル信号の何れがいずれの音源からの入力信号であるか判定する過程とからなることを特徴とする記録媒体。 Serial and determines the course any band dividing and individual output channel signal of a corresponding utilizing a time difference between the per-band channel is an input signal from any source, for the frequency band of the divided middle band is , a level difference between the band-by-band channels, by utilizing the time difference between the per-band channel, and determines the course either of the corresponding band split each output channel signals of the input signals from either source, above for the frequency band of the divided high frequency band, using the level difference between the per-band channel, determines one is whether the input signal from any source of the corresponding band split each output channel signals of the recording medium characterized by comprising a process.
  44. 【請求項44】 請求項38乃至43の何れかの記録媒体において、 上記プログラムは上記帯域分割された各出力チャネル信号の帯域別レベルをそれぞれ検出する帯域別レベル検出過程と、 その帯域別レベル検出過程が検出された各帯域別レベルを同一帯域についてチャネル間で比較した結果にもとづき発音をしていない音源を検出する音源状態判定過程と、 その音源状態判定過程で得た発音をしていない音源の検出信号により、上記音源合成過程で合成された音源信号のうち、上記発音していない音源と対応する信号を抑圧する信号抑圧過程とを有することを特徴とする記録媒体。 In any of the recording medium 44. Claim 38 or 43, the program and the per-band level detecting step of detecting a per-band level of each output channel signal the band division, respectively, the band-by-band level detecting a sound source state determination process of detecting a sound source process is not a sound based on a result of comparison between the channels for the same band of each band-by-band level detected, the sound source which is not a sound obtained by the sound source state determination process of the detection signal, of the sound source signal synthesized by the sound source synthesis process, the recording medium; and a signal suppression step of suppressing the signal corresponding to the sound source that is not the sound.
  45. 【請求項45】 請求項44の記録媒体において、 上記音源状態判定過程は、上記各帯域別レベルのチャネル間での比較で、最も大きいチャネルを帯域ごとに決定する過程と、 各チャネルごとに最もレベルが大きい帯域の数を求める過程と、 上記最もレベルが大きい帯域の数が第1基準値を越えるか否か判定する第1判定過程と、 その第1判定過程で第1基準値を越えると判定すると、 11. 45. A recording medium according to claim 44, said sound source state determination process, the comparison between the channel of each respective band levels, and determining the largest channel for each band, the most for each channel a process of obtaining the number of levels is large bandwidth, the number of the highest level is high bandwidth and first determination process determines whether more than a first reference value, exceeds the first reference value in the first determination step If it is determined,
    その越えた最もレベルが大きい帯域の数と対応するチャネルのマイクロホン位置から、発音している1個の音源を推定する過程と、 その推定された音源以外の音源を発音していないものとして検出する過程とを有することを特徴とする記録媒体。 From the microphone position of the channels corresponding to the number of its most level is high bandwidth exceeds the steps of estimating one sound source is sound, is detected as not being tone generator other than the estimated sound source recording medium characterized by having the steps.
  46. 【請求項46】 請求項45の記録媒体において、 上記プログラムは上記第1判定過程で、第1基準値を越えるものがないと判定されると、上記最もレベルが大きい帯域の数が、上記第1基準値よりも小さい第2基準値以下か否かを判定する第3判定過程と、 その第2判定過程で、第2基準値より小さいと判定されると、その小さいと判定された最もレベルが大きい帯域の数と対応するチャネルのマイクロホン位置から、発音していない1個の音源として検出する過程とを有することを特徴とする記録媒体。 A recording medium 46. 45. The program is in the first determination step, when it is determined that there is no one exceeds the first reference value, the number of the highest level is high band, said first a third determination step determines whether the second reference value smaller or less than the first reference value, in the second determination process, if it is judged to be smaller than the second reference value, the most level it is determined that the small recording medium characterized by having from microphone position of the corresponding channel to the number of bands is large, the step of detecting as a single sound source which is not pronounced.
  47. 【請求項47】 請求項38乃至43の何れかの記録媒体において、 上記プログラムは上記帯域分割された各出力チャネル信号のそのマイクロホンへの到達時間差を同一帯域ごと検出する帯域別時間差検出過程と、 この帯域別時間差検出過程で検出された各帯域別到達時間差を、同一帯域についてチャネル間で比較した結果にもとづき、発音をしていない音源を検出する音源状態判定過程と、 その音源状態判定過程で得た発音をしていない音源を検出した検出信号により、上記音源合成過程で合成された音源信号のうち、上記発音していない音源と対応する信号を抑圧する信号抑圧過程とを有することを特徴とする記録媒体。 In any of the recording medium 47. Claim 38 or 43, the program and the per-band time difference detection step of detecting each of the same band arrival time difference to the microphone for each output channel signal the band division, each band-by-band arrival time difference detected by the band-by-band time difference detection process, for the same band based on a result of comparison between the channels, and the sound source state determination process of detecting a sound source which is not a sound, in that the sound source state determination process the detection signal which detected the sound source is not a sound obtained, among the sound source signal synthesized by the sound source synthesis process, characterized in that it has a signal suppression step of suppressing the signal corresponding to the sound source that is not the sounding recording medium according to.
  48. 【請求項48】 請求項47の記録媒体において、 上記音源状態判定過程は、上記各帯域別到達時間差比較で、最も速く音源信号が到達したチャネルを帯域ごとに決定する過程と、 各チャネルごとに最も速く到達した帯域の数が第1基準値を越えるか否かを判定する第1判定過程と、 その第1判定過程が第2基準値を越えると判定すると、 In 48. The recording medium of claim 47, said sound source state determination process, in each band-specific arrival time difference comparison, and determining a fastest channel sound source signal reaches for each band, for each channel fastest number of the reached band and the first determination process determines whether more than a first reference value, if the first determination process determines that exceeds the second reference value,
    その越えた最も速く到達した帯域数と対応するチャネルのマイクロホン位置から発音している1個の音源を推定する過程と、 その推定された音源以外の音源を発音していないものとして検出する過程とを有することを特徴とする記録媒体。 A step of estimating one sound source with sound from a microphone position of the corresponding channel has a band number of fastest reach beyond them, the process of detecting as not pronounce the sound source other than the estimated sound source recording medium characterized by having a.
  49. 【請求項49】 請求項48の記録媒体において、 上記プログラムは上記第1判定過程で、第1基準値を越えるものがないと判定されると、上記最も速く到達する帯域の数が、上記第1基準値よりも小さい第2基準値より小さいか否かを判定する第2判定過程と、 その第3判定過程で、第2基準値より小さいと判定されると、その小さいと判定された最も速い到達時間の帯域数と対応するチャネルのマイクロホン位置から、発音していない1個の音源として検出する過程とを有することを特徴とする記録媒体。 A recording medium 49. 48. The program is in the first determination step, when it is determined that there is no one exceeds the first reference value, the number of bands to reach the fastest, the first a second determination step determines smaller or not than a second reference value smaller than the first reference value, in the third determination process, if it is judged to be smaller than the second reference value, the most is determined that the small fast from the band number and corresponding microphone position of the channel of the arrival time, a recording medium; and a step of detecting as a single sound source which is not pronounced.
  50. 【請求項50】 請求項46又は49の記録媒体において、 音源が4個以上の場合で、上記プログラムは上記第2判定過程で、第2基準値より小さいと判定されると、上記第2基準値を上記第1基準値を越えない範囲内で、順次大きくして、上記第2判定過程と同じ判定を(M−2) A recording medium 50. A claim 46 or 49, when the sound source is 4 or more, the program is in the second determination process, if it is judged to be smaller than the second reference value, the second reference a value within a range not exceeding the first reference value, and sequentially increased, the same determination as the second determination process (M-2)
    以内、Mは音源の数、繰返す過程を有することを特徴とする記録媒体。 Within, M is a recording medium characterized in that it comprises several sound sources, the process repeated.
  51. 【請求項51】 請求項44〜50の何れかに記載の記録媒体において、 上記プログラムは各出力チャネル信号の全周波数成分のレベルをそれぞれ検出する全帯域レベル検出過程と、 その全帯域レベル検出過程で検出した各チャネルの全周波数成分レベルの何れもが第3基準値以下であるかを判定し、何れかが第3基準値以下でないと判定すると、上記音源状態判定過程に移る第3判定過程とを有することを特徴とする記録媒体。 51. A recording medium according to any one of claims 44 to 50, the program and the whole band level detecting step of detecting the level of all frequency components of each output channel signals, respectively, the entire band level detection process If in none of the all frequency components levels of each channel detected by determining whether or less the third reference value, it determines that either is not less third reference value, a third determination process moves to the sound source state determination process recording medium characterized by having and.
  52. 【請求項52】 請求項47〜50の何れかに記載の記録媒体において、上記プログラムは上記チャネル時間差検出過程は上記帯域時間差検出過程を兼ねていることを特徴とする記録媒体。 In the recording medium according to any one of claims 52] according to claim 47 to 50, the program is the channel time difference detection process is a recording medium, characterized in that also serves as the band time difference detection process.
JP25231297A 1996-09-18 1997-09-17 Sound source separation method, apparatus and a recording medium Expired - Lifetime JP3355598B2 (en)

Priority Applications (7)

Application Number Priority Date Filing Date Title
JP24672696 1996-09-18
JP7669597 1997-03-13
JP8-246726 1997-03-13
JP9-76695 1997-03-13
JP9-76672 1997-03-13
JP7667297 1997-03-13
JP25231297A JP3355598B2 (en) 1996-09-18 1997-09-17 Sound source separation method, apparatus and a recording medium

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP25231297A JP3355598B2 (en) 1996-09-18 1997-09-17 Sound source separation method, apparatus and a recording medium

Publications (2)

Publication Number Publication Date
JPH10313497A JPH10313497A (en) 1998-11-24
JP3355598B2 true JP3355598B2 (en) 2002-12-09

Family

ID=27465964

Family Applications (1)

Application Number Title Priority Date Filing Date
JP25231297A Expired - Lifetime JP3355598B2 (en) 1996-09-18 1997-09-17 Sound source separation method, apparatus and a recording medium

Country Status (1)

Country Link
JP (1) JP3355598B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007052373A (en) * 2005-08-19 2007-03-01 Nippon Telegr & Teleph Corp <Ntt> Acoustic transmission apparatus

Families Citing this family (38)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3195920B2 (en) 1999-06-11 2001-08-06 科学技術振興事業団 Sound source identification and separation apparatus and method thereof
JP4815661B2 (en) * 2000-08-24 2011-11-16 ソニー株式会社 Signal processing apparatus and signal processing method
JP4616529B2 (en) * 2001-09-03 2011-01-19 クラリオン株式会社 Blind signal separation processing device
JP3950930B2 (en) 2002-05-10 2007-08-01 財団法人北九州産業学術推進機構 Method for recovering target speech based on split spectra using the position information of the sound source
JP4521549B2 (en) * 2003-04-25 2010-08-11 財団法人くまもとテクノ産業財団 A method for separating a plurality of sound sources in the vertical and horizontal directions, and a system therefor
JP4873913B2 (en) 2004-12-17 2012-02-08 学校法人早稲田大学 Sound source separation system, sound source separation method, and acoustic signal acquisition apparatus
JP2006195061A (en) * 2005-01-12 2006-07-27 Dainippon Printing Co Ltd Information embedding device for acoustic signal, information extracting device from acoustic signal and acoustic signal reproducing device
JP4770194B2 (en) * 2005-02-18 2011-09-14 大日本印刷株式会社 Information embedding apparatus and method for acoustic signal
WO2006131959A1 (en) * 2005-06-06 2006-12-14 Saga University Signal separating apparatus
US7472041B2 (en) 2005-08-26 2008-12-30 Step Communications Corporation Method and apparatus for accommodating device and/or signal mismatch in a sensor array
US7415372B2 (en) 2005-08-26 2008-08-19 Step Communications Corporation Method and apparatus for improving noise discrimination in multiple sensor pairs
US7619563B2 (en) 2005-08-26 2009-11-17 Step Communications Corporation Beam former using phase difference enhancement
JP4616736B2 (en) * 2005-09-09 2011-01-19 日本電信電話株式会社 Sound collection and playback device
JP2007096384A (en) * 2005-09-27 2007-04-12 Yamaha Corp Noise elimination apparatus and noise elimination program
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8345890B2 (en) * 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
JP4912036B2 (en) 2006-05-26 2012-04-04 富士通株式会社 Directional sound collecting device, directional sound collecting method, and computer program
JP4246755B2 (en) 2006-05-30 2009-04-02 株式会社エヌ・ティ・ティ・ドコモ Received signal frequency band detector
JP4495704B2 (en) * 2006-08-29 2010-07-07 日本電信電話株式会社 Sound image localization emphasizing reproduction method, apparatus thereof, program thereof, and storage medium thereof
WO2008056649A1 (en) 2006-11-09 2008-05-15 Panasonic Corporation Sound source position detector
JP4891801B2 (en) * 2007-02-20 2012-03-07 日本電信電話株式会社 Multi-signal enhancement apparatus, method, program, and recording medium thereof
EP2172929B1 (en) * 2007-06-27 2018-08-01 NEC Corporation Transmission unit, signal analysis control system, and methods thereof
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
JP5111088B2 (en) 2007-12-14 2012-12-26 三洋電機株式会社 Imaging apparatus and image reproduction apparatus
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
JP5063489B2 (en) * 2008-06-04 2012-10-31 三洋電機株式会社 Judgment device, electronic apparatus including the same, and judgment method
JP4986248B2 (en) 2009-12-11 2012-07-25 学校法人早稲田大学 Sound source separation apparatus, method and program
JP5696828B2 (en) * 2010-01-12 2015-04-08 ヤマハ株式会社 Signal processing device
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
JP5693201B2 (en) * 2010-12-16 2015-04-01 中部電力株式会社 Method and apparatus for reproducing propagation sound from specified area
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
KR20150072959A (en) * 2013-12-20 2015-06-30 삼성전자주식회사 Method and apparatus for processing sound signal
DE112015003945T5 (en) 2014-08-28 2017-05-11 Knowles Electronics, Llc Multi-source noise reduction

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2007052373A (en) * 2005-08-19 2007-03-01 Nippon Telegr & Teleph Corp <Ntt> Acoustic transmission apparatus
JP4576305B2 (en) * 2005-08-19 2010-11-04 日本電信電話株式会社 Sound transmission device

Also Published As

Publication number Publication date
JPH10313497A (en) 1998-11-24

Similar Documents

Publication Publication Date Title
Schroeder Vocoders: Analysis and synthesis of speech
Marolt A connectionist approach to automatic transcription of polyphonic piano music
Klapuri Multiple fundamental frequency estimation based on harmonicity and spectral smoothness
Williamson et al. Complex ratio masking for monaural speech separation
Griesinger The psychoacoustics of apparent source width, spaciousness and envelopment in performance spaces
CN101682809B (en) Sound discrimination method and apparatus
US8238562B2 (en) Diffuse sound shaping for BCC schemes and the like
Arons A review of the cocktail party effect
Serra A system for sound analysis/transformation/synthesis based on a deterministic plus stochastic decomposition
Vincent Musical source separation using time-frequency source priors
JP2763322B2 (en) Voice processing method
Tolonen et al. A computationally efficient multipitch analysis model
US9264834B2 (en) System for modifying an acoustic space with audio source content
Brown Computer identification of musical instruments using pattern recognition with cepstral coefficients as features
Weintraub A theory and computational model of auditory monaural sound separation
US9372251B2 (en) System for spatial extraction of audio signals
JP3670562B2 (en) Stereo audio signal processing method and apparatus and a recording medium recording a stereo sound signal processing program
US9591410B2 (en) Hearing assistance apparatus
Stecker et al. An effect of temporal asymmetry on loudness
EP2210427B1 (en) Apparatus, method and computer program for extracting an ambient signal
Culling et al. Effects of reverberation on perceptual segregation of competing voices
US20030229490A1 (en) Methods and devices for selectively generating time-scaled sound signals
Lyon A computational model of binaural localization and separation
US20070083365A1 (en) Neural network classifier for separating audio sources from a monophonic audio signal
JP6178456B2 (en) System and method for automatically generating haptic events from digital audio signals

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20081004

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20091004

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20101004

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20111004

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20121004

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20131004

Year of fee payment: 11

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term