JP3435686B2 - And collection device - Google Patents

And collection device

Info

Publication number
JP3435686B2
JP3435686B2 JP4972598A JP4972598A JP3435686B2 JP 3435686 B2 JP3435686 B2 JP 3435686B2 JP 4972598 A JP4972598 A JP 4972598A JP 4972598 A JP4972598 A JP 4972598A JP 3435686 B2 JP3435686 B2 JP 3435686B2
Authority
JP
Japan
Prior art keywords
target signal
frequency component
level
amplitude spectrum
sound source
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP4972598A
Other languages
Japanese (ja)
Other versions
JPH11249693A (en
Inventor
弘行 松井
智大 高野
Original Assignee
日本電信電話株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 日本電信電話株式会社 filed Critical 日本電信電話株式会社
Priority to JP4972598A priority Critical patent/JP3435686B2/en
Publication of JPH11249693A publication Critical patent/JPH11249693A/en
Application granted granted Critical
Publication of JP3435686B2 publication Critical patent/JP3435686B2/en
Anticipated expiration legal-status Critical
Application status is Expired - Fee Related legal-status Critical

Links

Abstract

PROBLEM TO BE SOLVED: To separate/detect only the level of an ambient noise or only a target signal level even when the target signal sound collected by an air guide microphone is mixed with the ambient noise. SOLUTION: Signals almost containing an ambient noise collected by microphones 1, 2 positioned adjacent to the sound source of a target signal and positioned apart from the second source of the target signal are converted respectively to spectra by spectrum conversion parts 3, 4, and the frequency component excepting the target signal, or the predominant frequency component of the target signal is separated/detected respectively from a level difference of an amplitude spectrum at every frequency component, and the noise level or the target signal level are separated/detected respectively from respective spectrum intensity.

Description

【発明の詳細な説明】 【0001】 【発明の属する技術分野】この発明は、周囲騒音が混在した音源信号に対して、周囲騒音のみのレベル、または目的とする音源のみのレベルを検出する収音装置に関するものである。 BACKGROUND OF THE INVENTION [0001] [Technical Field of the Invention The present invention is, with respect to excitation signal ambient noise are mixed, yield for detecting the level of only the sound source to the level of only ambient noise or purpose, the present invention relates to a sound system. 【0002】 【従来の技術】一般に音声会議装置や録音装置での収音装置においては、目的とする信号と周囲騒音とが同時に入力され、目的とする信号レベルと周囲騒音のレベルを分離して検出することは困難であった。 [0002] In the sound collection device of the Prior Art In general, voice conference apparatus and recording apparatus is input and the signal and ambient noise of interest at the same time, separates the level of the signal level and ambient noise of interest it has been difficult to detect. 従来、一部の音声会議装置や拡声電話機の中に、音声の周期性と騒音の非周期性を利用し、零交叉数等から音声の発声又は非発声区間を検出し、騒音の抑圧等を行っているものがある。 Conventionally, in a portion of the voice conference apparatus and loudspeaker telephone, using periodic and non-periodic noise speech, detects the voice utterance or non-speech section from the zero crossing number, etc., the suppression like noise there are things that are done. しかし、これらは、目的とする信号は音声、周囲騒音は非音声である必要があるため、共に周期性のある音声等の信号の場合は誤検出し、性能を著しく劣化させるという問題があった。 However, these are signals of interest speech, it is necessary ambient noise is non-speech, the detected erroneous if signal such as speech that are both periodicity, there is a problem that significantly degrade the performance . 即ち、目的とする信号や周囲騒音の音源が、周期性等での相違がないと、各々の信号レベルを分離検出することができないため、適用範囲を限定して利用せざるを得ないという問題があった。 That is, the sound source signal and the ambient noise and desired, without the difference in periodicity, etc., it is not possible to separate and detect the respective signal level, a problem that use forced to limit the scope was there. 【0003】 【発明が解決しようとする課題】この発明の目的は、目的信号と周囲騒音が周期性等の相違がない音源であっても、各々の信号レベルを分離して検出可能な収音装置を提供することにある。 [Problems that the Invention is to Solve] An object may be a sound source is not different from such periodicity target signal and the ambient noise, detectable sound collection to separate each of the signal levels of the present invention to provide an apparatus. 【0004】 【課題を解決するための手段】請求項1記載の発明は、 [0004] Means for Solving the Problems The invention according to claim 1,
目的信号の音源に近い位置に設置された第1マイクロホンと、前記位置より目的信号の音源から離れた位置に設置された第2マイクロホンの各々の出力信号が第1、第2スペクトル変換手段により、振幅スペクトルに変換され、各周波数成分ごとにこれら振幅スペクトル間のレベル差がレベル差算出手段で計算され、各周波数成分ごとのこのレベル差と、予め設定されたしきい値とが音源周波数成分選択手段で比較され、目的信号が支配的な周波数成分か否かの判定がなされ、前記スペクトル変換手段の出力振幅スペクトルから、前記目的信号が支配的と判定されなかった周波数成分が騒音振幅スペクトル推定手段により抽出され、つまり目的信号以外の騒音の振幅スペクトルが抽出される。 A first microphone disposed at a position close to the sound source of the target signal, respective output signal of the second microphone disposed at a position away from the sound source of the target signal from the position by the first, second orthogonal transform means, is converted into an amplitude spectrum, the level difference between these amplitude spectrum for each frequency component is calculated by the level difference calculation means, the level difference and a preset threshold and sound source frequency component selected for each frequency component are compared by a means, a determination is made whether the target signal is dominant frequency components, wherein the output amplitude spectrum of the spectral transform means, a frequency component which the target signal is not determined dominant noise amplitude spectrum estimation means extracted by, that amplitude spectrum of the noise other than the target signal is extracted. 請求項2の発明では請求項1の発明で抽出された騒音の振幅スペクトルから騒音の出力レベルが騒音レベル推定手段により推定される。 In the present invention of claim 2 output level of the noise from the amplitude spectrum of the noise extracted by the first aspect of the invention it is estimated by the noise level estimator. 【0005】請求項3記載の発明は、請求項1の発明と、音源周波数成分選択手段により、目的信号が支配的な周波数成分か否かを判定する構成までは同一である。 [0005] According to a third aspect, the invention of claim 1, the sound source frequency component selecting means, until judges constituting whether the target signal is dominant frequency component is the same.
請求項3の発明では前記スペクトル変換手段から出力される振幅スペクトルから、目的信号が支配的と判定された周波数成分が音源レベル推定手段により抽出され、その振幅スペクトルから目的信号の振幅スペクトルあるいは出力がレベル推定される。 From the amplitude spectrum output from said spectrum transformation unit in the invention of claim 3, the frequency component object signal is determined to be dominant is extracted by the sound source level estimation means, the amplitude spectrum or the output of the target signal from the amplitude spectrum It is level estimation. 作用 請求項1乃至請求項3記載の各発明においては、目的信号の音源に近い位置と、前記位置より目的信号の音源から離れた位置に設置されたマイクロホンの振幅スペクトルのレベル差によって目的信号が支配的な周波数成分か否かの判定が行われる。 In each invention of the working claims 1 to 3, wherein the target signal and the position close to the sound source of the target signal, the level difference of the amplitude spectrum of the microphone installed in a position away from the sound source of the target signal from the position a determination is made as to whether the dominant frequency component. この発明の装置構成では、目的信号について、その音源は一方のマイクロホンより他方のマイクロホンに近く、かつ騒音源は両マイクロホンから可成り離れている状況を想定しているため、2つのマイクロホンの間で安定したレベル差が生じる。 The device configuration of the present invention, the target signal, because the sound source that close to the other microphone than one microphone, and the noise source is assumed to conditions that allowed become away from both microphones, between two microphones stable level difference is generated. 一方、周囲騒音については、その音源とマイクロホンの間の距離は、目的信号の音源とマイクロホンの間の距離に比べて長くなると考えてよく、このため、目的信号によって生じるレベル差は、騒音によって生じるレベル差よりも常に大きくなると考えられる。 On the other hand, the ambient noise, the distance between the sound source and the microphone may be considered to be longer than the distance between the sound source and the microphone target signal, Therefore, the level difference caused by the target signal, caused by noise always considered to be larger than the level difference. 【0006】この発明では、上記のように2つのマイクロホンに生じるレベル差が目的信号と騒音とで異なる点に着目して、目的信号が支配的と判定されなかった周波数成分と目的信号が支配的と判定された周波数成分とを分離して、その振幅スペクトルより騒音の振幅スペクトルあるいは目的とする音源の出力レベルを推定する。 [0006] In this invention, the level difference produced two microphones as described above focused on different points between the target signal and the noise, the frequency component and the target signal is dominant is not determined target signal is dominant and and separates the determined frequency components, estimates the output level of the sound source to the amplitude spectrum or the purpose of the noise from the amplitude spectrum. このように、この発明では音源の周期性等の相違を利用していないため、これらの制約がない目的信号、周囲騒音にも適用できる。 Thus, in the present invention because it does not utilize the difference in periodicity, etc. of the sound source, the target signal does not have these limitations can be applied to ambient noise. 【0007】 【発明の実施の形態】 実施例1図1は請求項2の発明の実施例の機能構成を示し、図5 [0007] Example 1 1 [EMBODIMENTS shows a functional structure of an embodiment of the invention of claim 2, 5
に請求項2の発明の実施例の処理手順を示す。 Illustrating the procedure of embodiment of the invention of claim 2 in. マイクロホン1は目的信号の音源に近い位置に在り、マイクロホン2はマイクロホン1より前記目的信号の音源より遠い位置に設けられ、マイクロホン1と2には遠方の騒音などの雑音がほぼ等振幅で到達する。 Microphone 1 is at the position close to the sound source of the target signal, the microphone 2 is provided at a position farther from the sound source of the target signal from the microphone 1, the microphone 1 and 2 noise such distant noise arrives at equal amplitude substantially . 【0008】マイクロホン1,2に騒音が重畳した目的信号が各々取り込まれ、それらをディジタル信号として読み込む(S02)。 [0008] captured target signal noise is superimposed on the microphone 1 and 2 respectively, reads them as digital signal (S02). 読み込まれたマイクロホン1,2 Loaded microphone 1, 2
の信号を以下では、L,Rとする。 In the signal below, L, and R. スペクトル変換部3,4では、取り込んだ信号L,RをスペクトルL(ω The orthogonal transform unit 3,4, accepted signal L, spectrum R L (omega
h )、R(ω h )(h=1,2,…,n)に変換する(S03)。 h), R (ω h) (h = 1,2, ..., is converted to n) (S03). この変換は、例えば離散的フーリエ変換によって実行される。 This conversion is executed, for example, by a discrete Fourier transform. 【0009】レベル差算出部5では、L(ω h )、R [0009] In the level difference calculating section 5, L (ω h), R
(ω h )の各周波数成分について、以下の式で与えられるレベル差ΔLR(ω h )を計算する(S04)。 (Omega h) for each frequency component of, calculating a given level difference ΔLR (ω h) by the following equation (S04). ΔLR(ω h )=20log10(|L(ω h )|/| ΔLR (ω h) = 20log10 ( | L (ω h) | / |
R(ω h )|) 上式中の|L(ω h )|、|R(ω h )|は、各々L, R (ω h) |) above formula of | L (ω h) |, | R (ω h) | is, each L,
R信号の振幅スペクトル成分を表わす。 Representative of the amplitude spectral component of the R signal. 【0010】音源周波数成分選択部6では、各周波数成分についてΔLR(ω h )と予め設定されたしきい値T [0010] In the sound source frequency component selector 6, a threshold is preset and ΔLR (ω h) for each frequency component T
h(ω h )との大小関係より、目的信号が支配的な周波数成分の選択を行う。 than the magnitude relation between h (ω h), make a selection target signal is dominant frequency component. 目的信号が支配的な周波数成分か否かの判定条件は例えば以下の式によって決定される(S05)。 Judgment condition whether the target signal is dominant frequency component is determined by the following equation for example (S05). ΔLR(ω h )>Th(ω h ) → 目的信号が支配的ΔLR(ω h )≦Th(ω h ) → 目的信号が支配的でないつまり、マイクロホン1,2の各出力L,Rは目的信号に対してはそのスペクトル中に有意な差をもつものが表われるが、騒音については、そのスペクトルの大部分はほぼ等しく、ΔLR(ω h )は小さい値となる。 ΔLR (ω h)> Th ( ω h) → target signal dominates ΔLR (ω h) ≦ Th ( ω h) → That target signal is not dominant, the output L of the microphone 1, 2, R is the target signal Although appearing what is having significant differences in the spectrum with respect to, for noise, most of the spectrum is approximately equal, ΔLR (ω h) becomes a small value. 【0011】騒音レベル推定部7では、L(ω h )(h [0011] In the noise level estimation unit 7, L (ω h) ( h
=1,2,…,n)より目的信号が支配的でない周波数成分L(ω m )(m=k,l,…)を抽出する(S0 = 1,2, ..., the frequency component object signal from n) is not dominant L (ω m) (m = k, l, ...) is extracted (S0
6)。 6). このL(ω m )(m=k,l,…)より騒音の全帯域にわたる出力レベルLvNを推定する(S07)。 The L (ω m) (m = k, l, ...) from the estimated output level LvN over the full bandwidth of the noise (S07).
この推定の方法としては例えば以下の式が考えられる。 As a method for this estimation is considered the following equation, for example. LvN=20log10(Σ|L(ω m )|) あるいは、以下の式のように全帯域で平均化することによって求めることもできる。 LvN = 20log10 (Σ | L ( ω m) |) or may be determined by averaging over the entire band, as shown in the following equation. 【0012】LvN=20log10((n/q)×Σ [0012] LvN = 20log10 ((n / q) × Σ
|L(ω m )|) ここで、qは目的信号が支配的でないと判定された周波数成分の個数、和Σは目的信号が支配的でない周波数ω | L (ω m) |) where the frequency q is not the number of frequency components is determined that the target signal is not dominant, the sum Σ a target signal is dominant omega
m (m=k,l,…)に対応するものについてとる。 m (m = k, l, ...) for those corresponding to take. なお、(S07)に示した騒音レベルの推定例では全帯域における値として算出されるが、この値は、複数のサブ帯域に分けて求めることにより、各サブ帯域ごとの出力レベルに応じた値として求めることができる。 Although is calculated as a value in the entire band with an estimated example of the noise level as shown in (S07), this value is by obtaining divided into a plurality of sub-bands, a value corresponding to the output level of each sub-band it can be obtained as. また、 Also,
(S06)の出力が形成する振幅スペクトル包絡より、 Than the amplitude spectral envelope output forms of (S06),
騒音の振幅スペクトルを推定することも可能である。 It is also possible to estimate the amplitude spectrum of the noise. 【0013】このように、この実施例では目的とする信号と周囲騒音との識別に周期性の相違等を利用していないので、この制約によらず広く種々の音源(目的信号、 [0013] Thus, since this embodiment does not utilize such identification periodicity of differences between the signal and an object and the ambient noise, a wide variety of source (target signal regardless of the restriction,
周囲騒音)に適用できる。 It can be applied to the ambient noise). また、騒音と目的信号が重畳している状態でも、それぞれのレベル検出を行なえる特徴がある。 Further, even when the noise and the target signal is superimposed, it is characterized perform the respective level detection. 図2は、この発明を音声会議等に適用した例で、図1と対応する部分は同一符号を付けてある(以下同様)。 Figure 2 is an example of applying the invention to a voice conference or the like, portions corresponding to FIG. 1 are given the same reference numerals (the same applies hereinafter). 周囲騒音レベルに応じて通話レベルや、エコーキャンセラーの学習更新を制御することができる。 Call level and according to the ambient noise level, it is possible to control the learning update the echo canceller. すなわち、騒音レベル推定部7で推定した騒音レベルを拡声通話制御部8に入力して、騒音レベルが大きい場合は、 That is, by inputting the noise level estimated by the noise level estimator unit 7 in speaker-phone call control section 8, if the noise level is high,
スピーカ9から放声される音響レベルを大として騒音の影響を小とし、また、マイクロホン1で集音される目的信号レベルを大として相手側で聞きとり易いようにする。 Small city the influence of noise sound level as a large being Hokoe from the speaker 9, also to ease and hear the other side of the desired signal level to be collected by the microphone 1 as a large. あるいは、スピーカ9からの音響信号は、マイクロホン1にとっては騒音であり、この騒音レベルが小さい時はスピーカ9とマイクロホン1との結合も小であるから、エコーキャンセラーの反響路の推定処理を行わない。 Alternatively, the acoustic signal from the speaker 9, a noise for the microphone 1, because this time the noise level is low is small also coupled between the speaker 9 and the microphone 1 does not perform estimation processing of the echo path of the echo canceller . また騒音レベル推定部7で推定した騒音振幅スペクトルを用いて、スピーカ9とマイクロホン1間の反響路特性の推定に利用することもできる。 And using the noise amplitude spectrum estimated by the noise level estimator unit 7, it can be used for estimating the echo path characteristic between the speaker 9 and the microphone 1. 【0014】これらの場合においてこの発明では周囲騒音が例えば周期性のある音源(音声など)であっても騒音として分離し検出できるので、このような周囲騒音に影響を受けないで音声会議装置の通話レベルやエコーキャンセラーの調整ができ、通話性能の優れた拡声通話を実現できる。 [0014] These are in the present invention in the case can be detected separated as noise even sound source with ambient noise e.g. periodicity (such as voice), the voice conference device is not affected by such ambient noise It can be adjusted call level and the echo canceller can be realized an excellent hands-free communication of call performance. 騒音振幅スペクトルや騒音出力レベルの推定を行う推定手段7はスペクトル変換部3の出力ではなく、スペクトル変換部4の出力に対し行ってもよい。 Estimation means 7 for estimating the noise amplitude spectrum and noise output level is not the output of the spectral conversion unit 3, it may be performed to the output of the spectral conversion unit 4. 実施例2図3は請求項3の発明の実施例を示す。 Example 2 Figure 3 shows an embodiment of the invention of claim 3. 音源周波数成分選択部6よりの出力として目的信号が支配的な周波数情報を得ること、騒音レベル推定部7の代わりに音源レベル推定部12を設けたこと、の2点を除けば、図1と同じ動作である。 The target signal to obtain a dominant frequency information as the output of from the sound source frequency component selector 6, by providing the sound level estimation unit 12 instead of the noise level estimating unit 7, except for two points, and FIG. 1 it is the same behavior. 以下で、図7に示す請求項3の発明の実施例の流れ図を用いて音源レベル推定部12における処理について説明する。 Hereinafter, a description will be given of a process in the sound source level estimating section 12 with reference to the flowchart of embodiments of the invention of claim 3 shown in FIG. 【0015】音源レベル推定部12では、L(ω h [0015] In the sound level estimation unit 12, L (ω h)
(h=1,2,…,n)より目的信号が支配的な周波数成分L(ω m )(m=i,j,…)を抽出する(S0 (H = 1,2, ..., n ) target signal from the dominant frequency component L (ω m) (m = i, j, ...) to extract the (S0
6)。 6). このL(ω m )(m=i,j,…)より目的信号の全帯域にわたる出力レベルLvSを推定する(S0 The L (ω m) (m = i, j, ...) estimates the output level LvS over the entire band of the target signal from the (S0
7)。 7). この推定の方法としては例えば以下の式が考えられる。 As a method for this estimation is considered the following equation, for example. 【0016】 LvS=20log10(Σ|L(ω m )|) ここで、和Σは目的信号が支配的な周波数ω m (m= [0016] LvS = 20log10 (Σ | L ( ω m) |) Here, the sum Σ is the target signal is dominant frequency ω m (m =
i,j,…)に対応するものについてとる。 i, j, for which corresponds to ...) take. なお、(S In addition, (S
07)に示した目的信号の出力レベルの推定例では全帯域における値として算出されるが、この値は、複数のサブ帯域に分けて求めることにより、各サブ帯域ごとの出力レベルに応じた値として求めることができる。 Although the example of estimating the output level of the object signal shown in 07) is calculated as a value in the entire band, this value is by obtaining divided into a plurality of sub-bands, in accordance with the output level of each sub-band value it can be obtained as. また、 Also,
(S06)の出力が形成する振幅スペクトル包絡より、 Than the amplitude spectral envelope output forms of (S06),
目的信号の振幅スペクトルを推定することも可能である。 It is also possible to estimate the amplitude spectrum of the target signal. 【0017】このように、この発明では目的とする信号と周囲騒音との識別に周期性の相違等を利用していないので、この制約によらず広く種々の音源(目的信号、周囲騒音)に適用できる。 [0017] Thus, since no use of such identification periodicity of differences between the signal and an object and the ambient noise in the present invention, a wide variety of source (target signal, ambient noise) regardless of the constraints It can be applied. また、騒音と目的信号が重畳している状態でも、それぞれのレベル検出を行なえる特徴がある。 Further, even when the noise and the target signal is superimposed, it is characterized perform the respective level detection. 図4は、この発明を録音装置に適用した例で、 Figure 4 is an example of applying the invention to a recording device,
この例では音源レベル推定部10で検出した目的信号のレベルのみに応じて周囲騒音の有無や、周囲騒音のレベルにかかわらず、マイクロホン1の出力である目的信号のゲイン調整をゲイン調整部13で行って、録音部14 And the presence or absence of ambient noise in this example in accordance with only the level of the target signal detected by the sound source level estimation unit 10, regardless of the level of ambient noise, the gain adjustment of the target signal which is an output of the microphone 1 by the gain adjustment section 13 carried out, the recording unit 14
へ供給することが可能である。 It is possible to supply to. このため、この装置では、周囲騒音にかかわらず、目的の音源のレベルのみに応じたAGC(自動ゲインコントロール)動作が可能で、目的音源が明瞭に収音できる。 Therefore, in this apparatus, regardless of the ambient noise, can AGC (Automatic Gain Control) operation corresponding only to the level of the target sound source, the target sound source can be clearly picked-up sound. 【0018】 【発明の効果】以上説明したように、請求項1及び2記載の発明によれば、目的信号の音源に近い位置に設置された第1マイクロホンと、前記位置より目的信号の音源から離れた位置に設置された第2マイクロホンとの各出力中の各同一周波数成分ごとの振幅スペクトルについて、レベル差を計算し、しきい値とを比較することにより、目的信号が支配的な周波数成分か否かを判定して目的信号が支配的と判定されなかった周波数成分を抽出し、その振幅スペクトルから目的信号以外の騒音の振幅スペクトルあるいは騒音の出力レベルを推定しているため、騒音、目的音源の種類によらず騒音の出力レベルを正しく検出することができる。 [0018] As has been described in the foregoing, according to the invention of claim 1 and 2 wherein, a first microphone disposed at a position close to the sound source of the target signal, from the sound source of the target signal from the position the amplitude spectrum for each identical frequency components in the output of the second microphone installed at a remote location, to calculate the level difference, by comparing the threshold value, dominant frequency component target signal whether the extracts determined frequency component is not determined target signal is dominant, since the estimates of the output level of the amplitude spectrum or the noise of the noise other than the target signal from the amplitude spectrum, noise, object output level of the noise regardless of the type of the sound source can be detected correctly. 【0019】この収音装置を利用すれば、例えば音声会議装置やテレビ会議装置と組み合わせて周囲騒音に応じて通話レベルを制御したり、エコーキャンセラーの学習更新のオン/オフ等を制御することができるので、通話性能に優れた会議装置を提供できるメリットがある。 [0019] By using this sound pickup device, for example to control the call level according to ambient noise in combination with conference telephone or television conference apparatus, it is possible to control the learning update of the on / off of the echo canceller, etc. since it is advantageous to offer an excellent conference device the call performance. 請求項3記載の発明によれば、目的信号の音源に近い位置に設置された第1マイクロホンと、前記位置より目的信号の音源から離れた位置に設置された第2マイクロホンとの各出力の各周波数成分ごとの振幅スペクトルについてレベル差を検出し、この各周波数成分ごとのレベル差と、しきい値とを比較して、目的信号が支配的な周波数成分か否かを判定して、マイクロホンから出力される出力信号より目的信号が支配的と判定された周波数成分を抽出し、その振幅スペクトルから目的信号の振幅スペクトルあるいは出力レベルを推定するため、騒音、目的音源の種類によらず目的とする音源の出力レベルを検出することができる。 According to the third aspect of the present invention, each of the outputs of the second microphones disposed a first microphone disposed at a position close to the sound source of the target signal, at a position away from the sound source of the target signal from the position detecting a level difference for the amplitude spectrum for each frequency component, and the level difference of each the respective frequency components is compared with a threshold value, it is determined whether the target signal is dominant frequency components from the microphone extracting a frequency component object signal from the output signal is determined dominant output, for estimating the amplitude spectrum or the output level of the target signal from the amplitude spectrum, the noise, and an object regardless of the type of the target sound source it is possible to detect the output level of the sound source. 【0020】この収音装置を利用すれば、例えば録音装置において周囲騒音の有無にかかわらず目的とする音源のレベルのみに応じてAGCをかけられるので、目的音源を明瞭に収音できるメリットがある。 [0020] By using this sound pickup device, for example because it is subjected to AGC in accordance with only the level of the target sound source or without ambient noise at recording device, there is a merit that can be clearly picked up a target sound source . なお、以上の説明で使用したマイクロホンは、無指向性マイクロホンに限定されるものではなく、例えば、マイクロホン1は、 Incidentally, a microphone used in the above description is not intended to be limited to non-directional microphones, for example, a microphone 1,
目的信号の音源の方向に指向性を有するマイクロホンを使用し、マイクロホン2は、目的信号の音源と反対の方向に指向性を有するマイクロホンを使用してもよい。 Using the microphone has directivity in the direction of the desired signal source, the microphone 2 may use a microphone having directivity in the direction opposite to the sound source of the target signal. 【0021】この発明は、音声会議装置、録音装置以外に、騒音抑圧装置や、音声認識装置の入力装置として使用し、目的音源のレベルと周囲騒音のレベルを検出し、 [0021] The present invention, audio conference device, in addition to recording device, use and noise suppression apparatus, as an input device for voice recognition device detects the level of the level and the surrounding noise target sound source,
騒音抑圧や音声認識における耐騒音性の改善等にも利用できる。 It can also be used to 耐騒 sound of the improvement in noise suppression and voice recognition.

【図面の簡単な説明】 【図1】請求項2の発明の実施例の機能的構成を示すブロック図。 Block diagram illustrating a functional configuration example of the BRIEF DESCRIPTION OF THE DRAWINGS [Figure 1] of the second aspect of the present invention. 【図2】図1に示した実施例を拡声通話制御部に利用した例を示すブロック図。 2 is a block diagram illustrating an example of using the speaker-phone call control section the embodiment shown in FIG. 【図3】請求項3の発明の実施例の機能的構成を示すブロック図。 3 is a block diagram showing a functional configuration of an embodiment of the invention of claim 3. 【図4】図3に示した実施例を録音装置に利用した例を示すブロック図。 4 is a block diagram showing an example of using the recording apparatus embodiment shown in FIG. 【図5】図1に示した実施例の動作を示す流れ図。 Figure 5 is a flow diagram illustrating the operation of the embodiment shown in FIG. 【図6】図2に示した適用例の動作を示す流れ図。 Figure 6 is a flow diagram illustrating the operation of the application example shown in FIG. 【図7】図3に示した実施例の動作を示す流れ図。 Flow diagram illustrating operation of the embodiment shown in FIG. 7 Fig. 【図8】図4に示した適用例の動作を示す流れ図。 Figure 8 is a flow diagram illustrating the operation of the application example shown in FIG.

フロントページの続き (56)参考文献 特開 平9−212196(JP,A) 特開 昭59−68800(JP,A) 特開 昭56−46300(JP,A) 特開 平4−16900(JP,A) 特開 平4−184400(JP,A) 特開 平11−259090(JP,A) 特開 平11−305792(JP,A) 特許2863214(JP,B2) 特許3355598(JP,B2) 高野,青木,岡本,松井,発声音声の 音場分布差を利用した騒音抑圧処理,電 子情報通信学会1998年総合大会講演論文 集 情報・システム1,日本,1998年 3月27日,D−14−16,Page 227 高野,青木,岡本,中台,松井,音声 の音場分布差を利用した騒音抑圧処理の 音声認識への適用について,電子情報通 信学会1998年基礎・境界ソサイエティ大 会講演論文集,日本,1998年 9月29 日,SA−6−1,Page 241 青木,青木,チャネル間情報を利用し た2 Of the front page Continued (56) Reference Patent flat 9-212196 (JP, A) JP Akira 59-68800 (JP, A) JP Akira 56-46300 (JP, A) JP flat 4-16900 (JP , A) Patent Rights 4-184400 (JP, A) Patent Rights 11-259090 (JP, A) Patent Rights 11-305792 (JP, A) Patent 2863214 (JP, B2) No. 3355598 (JP, B2) Takano, Aoki, Okamoto, Matsui, noise suppression processing using the sound field distribution difference of speaking voice, electronic, information and communication Engineers 1998 General Conference papers information system 1, Japan, March 27, 1998, D- 14-16, Page 227 Takano, Aoki, Okamoto, China and Taiwan, Matsui, the application of the speech recognition of the noise suppression process using the sound field distribution difference of voice, 1998, electronic information and communication Society of Engineering Sciences Society University Board Proceedings, Japan, September 29, 1998, SA-6-1, Page 241 Aoki, Aoki, using the inter-channel information 2 源分離手法の実環境における検 討,日本音響学会平成9年春季研究発表 会講演論文集I,日本,1997年 3月17 日,2−3−5,Pages 513−514 (58)調査した分野(Int.Cl. 7 ,DB名) G10L 21/00 - 21/02 Source test in the real environment of separation techniques 討, Acoustical Society of Japan 1997 Spring Research Workshop Proceedings I, Japan, March 17, 1997, 2-3-5, Pages 513-514 (58) field of investigation (Int.Cl. 7, DB name) G10L 21/00 - 21/02

Claims (1)

  1. (57)【特許請求の範囲】 【請求項1】 目的信号の音源に近い位置に設置された第1マイクロホンと、 前記位置より前記目的信号の音源から離れた位置に設置された第2マイクロホンと、 前記第1、第2マイクロホンの各々の出力信号を振幅スペクトルに変換する第1、第2スペクトル変換手段と、 前記第1、第2スペクトル変換手段から出力される各周波数成分ごとの振幅スペクトルについて、これらレベル差をそれぞれ計算するレベル差算出手段と、 前記レベル差算出手段により出力される各周波数成分ごとのレベル差と、予め設定されたしきい値とを比較し、 (57) a first microphone disposed at a position close to the sound source of the Claims 1 purpose signal, a second microphone disposed at a position away from the sound source of the target signal from the position the first, first converting each of the output signal of the second microphone in the amplitude spectrum, the second spectrum conversion means, for the first, the amplitude spectrum for each frequency component output from the second orthogonal transform means compares the level difference calculation means for calculating these level differences, respectively, and the level difference of each frequency component output by the level difference calculation means, and a preset threshold value,
    目的信号が支配的な周波数成分か否かを判定する音源周波数成分選択手段と、 前記スペクトル変換手段から出力される出力信号の振幅スペクトルから、前記音源周波数成分選択手段により目的信号が支配的と判定されなかった周波数成分を抽出し、その振幅スペクトルから目的信号以外の騒音の振幅スペクトルを推定するスペクトル推定手段とを有することを特徴とする収音装置。 Determination target signal and a sound source frequency component selecting means for determining whether the dominant frequency component, the amplitude spectrum of the output signal outputted from said spectrum transformation unit, a target signal by the sound source frequency component selecting means is dominant and It is to extract the frequency components not sound collection apparatus characterized by a spectral estimation means for estimating the amplitude spectrum of the noise other than the target signal from the amplitude spectrum. 【請求項2】 上記スペクトル推定手段で推定された騒音の振幅スペクトルから騒音レベルを推定する手段を有することを特徴とする請求項1記載の収音装置。 2. A collection device according to claim 1, characterized in that it comprises means for estimating a noise level from the amplitude spectrum of noise estimated by said spectrum estimation means. 【請求項3】 目的信号の音源に近い位置に設置された第1マイクロホンと、 前記位置より前記目的信号の音源から離れた位置に設置された第2マイクロホンと、 前記第1、第2マイクロホンの各々の出力信号を振幅スペクトルに変換する第1、第2スペクトル変換手段と、 前記第1、第2スペクトル変換手段から出力される各周波数成分ごとの振幅スペクトルについて、レベル差をそれぞれ計算するレベル差算出手段と、 前記レベル差算出手段により出力される各周波数成分ごとのレベル差と、予め設定されたしきい値とを比較し、 3. A first microphone disposed at a position close to the desired signal source, and a second microphone disposed at a position away from the sound source of the target signal from the position, the first, the second microphone first and second orthogonal transform means, said first, the amplitude spectrum for each frequency component output from the second orthogonal transform means, level difference calculating a level difference respectively converting each of the output signals to the amplitude spectrum a calculation unit, a level difference of each frequency component output by the level difference calculation means, and a preset threshold value comparison,
    目的信号が支配的な周波数成分か否かを判定する音源周波数成分選択手段と、 前記スペクトル変換手段から出力される出力信号の振幅スペクトルから、前記音源周波数成分選択手段により目的信号が支配的と判定された周波数成分を抽出し、その振幅スペクトルから目的信号の振幅スペクトルあるいは出力レベルを推定する音源レベル推定手段とを有することを特徴とする収音装置。 Determination target signal and a sound source frequency component selecting means for determining whether the dominant frequency component, the amplitude spectrum of the output signal outputted from said spectrum transformation unit, a target signal by the sound source frequency component selecting means is dominant and by extracting the frequency component, the sound pickup apparatus characterized by having a sound level estimation means for estimating the amplitude spectrum or the output level of the target signal from the amplitude spectrum.
JP4972598A 1998-03-02 1998-03-02 And collection device Expired - Fee Related JP3435686B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP4972598A JP3435686B2 (en) 1998-03-02 1998-03-02 And collection device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP4972598A JP3435686B2 (en) 1998-03-02 1998-03-02 And collection device

Publications (2)

Publication Number Publication Date
JPH11249693A JPH11249693A (en) 1999-09-17
JP3435686B2 true JP3435686B2 (en) 2003-08-11

Family

ID=12839173

Family Applications (1)

Application Number Title Priority Date Filing Date
JP4972598A Expired - Fee Related JP3435686B2 (en) 1998-03-02 1998-03-02 And collection device

Country Status (1)

Country Link
JP (1) JP3435686B2 (en)

Families Citing this family (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8345890B2 (en) * 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US9185487B2 (en) 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8934641B2 (en) 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
FR2945696B1 (en) * 2009-05-14 2012-02-24 Parrot Method for selecting a microphone among two or more microphones, for a speech processing system such as a "hands-free" telephone device operating in a noise environment.
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8798290B1 (en) 2010-04-21 2014-08-05 Audience, Inc. Systems and methods for adaptive signal equalization
JP5857403B2 (en) * 2010-12-17 2016-02-10 富士通株式会社 Voice processing apparatus and voice processing program
US9037458B2 (en) * 2011-02-23 2015-05-19 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for spatially selective audio augmentation
US9640194B1 (en) 2012-10-04 2017-05-02 Knowles Electronics, Llc Noise suppression for speech processing based on machine-learning mask estimation
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
DE112015003945T5 (en) 2014-08-28 2017-05-11 Knowles Electronics, Llc Multi-source noise reduction
JP2019503107A (en) * 2015-11-18 2019-01-31 ホアウェイ・テクノロジーズ・カンパニー・リミテッド Acoustic signal processing apparatus and method for improving acoustic signals

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
青木,青木,チャネル間情報を利用した2音源分離手法の実環境における検討,日本音響学会平成9年春季研究発表会講演論文集I,日本,1997年 3月17日,2−3−5,Pages 513−514
高野,青木,岡本,中台,松井,音声の音場分布差を利用した騒音抑圧処理の音声認識への適用について,電子情報通信学会1998年基礎・境界ソサイエティ大会講演論文集,日本,1998年 9月29日,SA−6−1,Page 241
高野,青木,岡本,松井,発声音声の音場分布差を利用した騒音抑圧処理,電子情報通信学会1998年総合大会講演論文集 情報・システム1,日本,1998年 3月27日,D−14−16,Page 227

Also Published As

Publication number Publication date
JPH11249693A (en) 1999-09-17

Similar Documents

Publication Publication Date Title
Hänsler et al. Acoustic echo and noise control: a practical approach
Benesty et al. Speech enhancement
Hoshuyama et al. A robust adaptive beamformer for microphone arrays with a blocking matrix using constrained adaptive filters
Araki et al. The fundamental limitation of frequency domain blind source separation for convolutive mixtures of speech
DE69831288T2 (en) Sound processing adapted to ambient noise
US8194872B2 (en) Multi-channel adaptive speech signal processing system with noise reduction
US9185487B2 (en) System and method for providing noise suppression utilizing null processing noise subtraction
EP2277323B1 (en) Speech enhancement using multiple microphones on multiple devices
US9438985B2 (en) System and method of detecting a user's voice activity using an accelerometer
US8107642B2 (en) Spatial noise suppression for a microphone array
US6549629B2 (en) DVE system with normalized selection
US7346175B2 (en) System and apparatus for speech communication and speech recognition
EP1732352B1 (en) Detection and suppression of wind noise in microphone signals
CN1122963C (en) Method and apparatus for measuring signal level and delay at multiple sensors
CN101933088B (en) Apparatus for computing filter coefficients and echo suppression method
CN101682809B (en) Sound discrimination method and apparatus
JP4955228B2 (en) Multi-channel echo cancellation using round robin regularization
Meyer et al. Multi-channel speech enhancement in a car environment using Wiener filtering and spectral subtraction
EP2183853B1 (en) Robust two microphone noise suppression system
US7340068B2 (en) Device and method for detecting wind noise
EP2146519B1 (en) Beamforming pre-processing for speaker localization
US9622003B2 (en) Speaker localization
US7577262B2 (en) Microphone device and audio player
JP5313496B2 (en) Adaptive beamformer, sidelobe canceller, hands-free communication device
US8068619B2 (en) Method and apparatus for noise suppression in a small array microphone system

Legal Events

Date Code Title Description
FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090606

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090606

Year of fee payment: 6

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100606

Year of fee payment: 7

FPAY Renewal fee payment (prs date is renewal date of database)

Year of fee payment: 7

Free format text: PAYMENT UNTIL: 20100606

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110606

Year of fee payment: 8

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120606

Year of fee payment: 9

FPAY Renewal fee payment (prs date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130606

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees