WO2010058804A1 - ノイズゲート、収音装置及びノイズ除去方法 - Google Patents

ノイズゲート、収音装置及びノイズ除去方法 Download PDF

Info

Publication number
WO2010058804A1
WO2010058804A1 PCT/JP2009/069588 JP2009069588W WO2010058804A1 WO 2010058804 A1 WO2010058804 A1 WO 2010058804A1 JP 2009069588 W JP2009069588 W JP 2009069588W WO 2010058804 A1 WO2010058804 A1 WO 2010058804A1
Authority
WO
WIPO (PCT)
Prior art keywords
noise
audio signal
signal
spectrum
frequency spectrum
Prior art date
Application number
PCT/JP2009/069588
Other languages
English (en)
French (fr)
Inventor
良 田中
直人 栗山
Original Assignee
ヤマハ株式会社
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by ヤマハ株式会社 filed Critical ヤマハ株式会社
Priority to US13/130,532 priority Critical patent/US9036830B2/en
Priority to KR1020117011535A priority patent/KR101254876B1/ko
Priority to EP09827585.2A priority patent/EP2352148B1/en
Priority to CN2009801462950A priority patent/CN102216984B/zh
Publication of WO2010058804A1 publication Critical patent/WO2010058804A1/ja

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L15/00Speech recognition
    • G10L15/20Speech recognition techniques specially adapted for robustness in adverse environments, e.g. in noise, of stress induced speech
    • HELECTRICITY
    • H03ELECTRONIC CIRCUITRY
    • H03GCONTROL OF AMPLIFICATION
    • H03G3/00Gain control in amplifiers or frequency changers
    • H03G3/20Automatic control
    • H03G3/30Automatic control in amplifiers having semiconductor devices
    • H03G3/34Muting amplifier when no signal is present or when only weak signals are present, or caused by the presence of noise signals, e.g. squelch systems
    • H03G3/345Muting during a short period of time when noise pulses are detected, i.e. blanking
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L21/0232Processing in the frequency domain
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/27Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the analysis technique

Definitions

  • the present invention relates to a noise gate, a sound collection device, and a noise removal method for removing noise contained in an audio signal.
  • a noise gate is provided as means for removing noise (see, for example, Patent Document 1).
  • the threshold value of the noise gate is changed according to the amplification degree of the head amplifier that amplifies the audio signal, and the audio signal less than the threshold value is removed.
  • the present invention provides a noise gate, a sound collection device, and a noise removal method that can easily remove stationary noise without deteriorating an audio signal.
  • the noise gate of the present invention estimates the noise spectrum of stationary noise (hereinafter referred to as stationary noise) included in the audio signal based on the frequency spectrum of the input audio signal.
  • the noise gate calculates a signal level ratio between the frequency spectrum of the input audio signal and the estimated noise spectrum.
  • the noise gate outputs the frequency spectrum of the audio signal in which the signal level in the frequency band in which the calculated signal level ratio is less than a predetermined threshold is lowered.
  • the noise gate outputs the frequency spectrum of the voice signal including the speaker's uttered voice and reduces the signal level of the frequency spectrum of the voice signal composed of stationary noise, so that the speaker's uttered voice is not degraded.
  • an audio signal from which only stationary noise is removed can be output.
  • the threshold value may be set to be larger by a value corresponding to the estimation error of the estimation means than a value at which the signal level ratio is 1. This is because the noise gate calculates the signal level ratio to be compared with the threshold value using the estimated stationary noise, so that an estimation error of the stationary noise is taken into consideration.
  • the sound collection device of the present invention includes the above-described noise gate.
  • the sound collection device converts a sound signal generated by collecting sound into a frequency spectrum that is a frequency domain signal, and outputs the frequency spectrum to a noise gate.
  • the sound collection device also inversely converts the frequency spectrum of the audio signal output from the noise gate into an audio signal that is a time domain signal.
  • the sound collection device can remove stationary noise from the collected sound signal by using the above-described noise gate. For this reason, the sound collection device can emit sound without deteriorating the voice of the collected speaker.
  • a step of inputting a frequency spectrum of an audio signal a step of estimating a noise spectrum based on the frequency spectrum of the audio signal input at the input, the frequency spectrum of the audio signal, A step of calculating a signal level ratio between the noise spectrum estimated in the estimation step and a frequency of the audio signal obtained by reducing a gain in a frequency band in which the signal level ratio calculated in the calculation step is less than a predetermined threshold And a step of outputting a spectrum.
  • the threshold value is set to be larger than the value at which the signal level ratio is 1 by a value corresponding to the estimation error of the estimation unit used in the estimation process.
  • the noise gate of the present invention can output a voice signal from which only stationary noise is removed without degrading the voice of the speaker.
  • FIG. 1 It is a block diagram which shows the function and structure of a sound collection device. It is a figure which shows an example of a gain table.
  • (A) to (C) are diagrams showing examples of stationary noise, an audio signal, and an audio signal after noise removal. It is a figure which shows the other example of a gain table.
  • FIG. 1 is a block diagram showing the function and configuration of the sound collection device.
  • FIG. 2 is a diagram illustrating an example of the gain table.
  • the sound collection device 1 includes a noise gate 12 (see FIG. 1).
  • the sound collection device 1 converts the collected sound signal NE′T into a frequency spectrum NE′N.
  • the sound collection device 1 removes the stationary noise N′N included in the audio signal NE′N by the noise gate 12.
  • the stationary noise N′N is estimated by the noise gate 12 based on the frequency spectrum NE′N.
  • the sound collection device 1 outputs a sound signal CO′T generated by inversely transforming the frequency spectrum CO′N after removing the stationary noise N′N with respect to the time axis.
  • a time-domain signal indicates a terminal symbol by 'T
  • a frequency-domain signal indicates a terminal symbol by' N.
  • the sound collection device 1 includes a microphone MIC, an FFT processing unit 11, a noise gate 12, and an IFFT processing unit 13.
  • the microphone MIC picks up surrounding sounds and generates an audio signal.
  • the microphone MIC outputs the generated audio signal NE′T to the FFT processing unit 11.
  • the FFT processing unit 11 is a fast Fourier transform circuit, converts an audio signal NE′T, which is a time domain signal, into an audio signal NE′N, which is a frequency domain signal, and performs an estimation unit 121 and a noise of the noise gate 12.
  • the audio signal NE′N is output to the removing unit 122.
  • the noise gate 12 includes an estimation unit 121 and a noise removal unit 122.
  • the estimation unit 121 performs a process of estimating the stationary noise N′N included in the audio signal NE′N input from the FFT processing unit 11.
  • the estimation unit 121 sequentially acquires and temporarily stores a frequency spectrum (hereinafter referred to as a speech spectrum) S (NE′N) at a certain sample timing of the speech signal NE′N.
  • a speech spectrum hereinafter referred to as a speech spectrum
  • the estimation unit 121 uses the frequency spectrum at a certain sample timing of the stationary noise N′N (hereinafter referred to as a noise spectrum) S (N 'N) is estimated.
  • the estimation unit 121 outputs the estimated noise spectrum S (N′N) to the noise removal unit 122.
  • the noise spectrum S (N′N (T)) can be expressed by the following formula 1.
  • the noise removal unit 122 removes the stationary noise N′N from the audio signal NE′N input from the FFT processing unit 11 and outputs the audio signal CO′N after the noise removal to the IFFT processing unit 13. Specifically, the noise removal unit 122 calculates a signal level ratio between the speech spectrum S (NE′N) and the noise spectrum S (N′N) input from the estimation unit 121. When the calculated signal level ratio is less than the threshold value, the noise removal unit 122 lowers the gain of the voice spectrum S (NE′N) in the frequency band where the signal level ratio is less than the threshold value, and outputs the result.
  • the noise removing unit 122 includes a gain table TBL shown in FIG.
  • the gain table TBL determines the gain of the voice spectrum S (NE′N) according to the calculated signal level ratio.
  • the gain table TBL sets the gain to 1 when the signal level ratio is greater than or equal to the threshold, and sets the gain to 0 when the signal level ratio is less than the threshold.
  • the frequency spectrum S (CO′N) at a certain sample timing of the audio signal CO′N after noise removal can be expressed by the following Expression 2.
  • the noise removing unit 122 outputs the speech spectrum S (NE′N) as it is without changing the signal level at a frequency where the signal level ratio is equal to or higher than the threshold. Also, the noise removal unit 122 regards the audio spectrum S (NE′N) as the noise spectrum S (N′N) and outputs the signal level as 0 in the frequency band where the signal level ratio is less than the threshold.
  • the noise removal unit 122 may consider the estimation error of the stationary noise N′N and set the threshold value to a value slightly larger than the value (1.0) at which the signal level ratio is 1. In this way, the noise removing unit 122 removes the stationary noise N′N even when the signal level of the stationary noise N′N is estimated to be lower than the actual level due to the estimation error of the stationary noise N′N. Can do.
  • the IFFT processing unit 13 is an inverse fast Fourier transform circuit, which converts the audio signal CO′N, which is a frequency domain signal, into an audio signal CO′T, which is a time domain signal, and outputs it.
  • the sound collection device 1 can leave the voice signal in the frequency band where the voice of the speaker is present without being attenuated, it can emit the voice of the speaker without deteriorating. .
  • FIGS. 3A to 3C are diagrams illustrating examples of stationary noise, an audio signal, and an audio signal after noise removal.
  • 3A shows the signal level of stationary noise
  • FIG. 3B shows the signal level of an audio signal containing stationary noise
  • FIG. 3C shows the signal level of the audio signal after noise removal. Indicates.
  • the sound collection device 1 estimates a stationary noise N′N as shown in FIG. 3A and generates an audio signal NE′N as shown in FIG.
  • the sound collection device 1 simply subtracts the noise N′N from the audio signal NE′N, as shown by a broken line in FIG.
  • the sound collecting apparatus 1 may have a stationary noise N′N remaining in the audio signal NE′N due to an estimation error of the stationary noise N′N. In this case, since the sound collection device 1 has a significant signal level variation in a frequency band in which the speaker's speech is not present, musical noise is generated.
  • the sound collection device 1 leaves a frequency band in which the speaker's uttered voice exists, as shown by a solid line in FIG. Since the signal level (gain) of the voice signal in the frequency band in which the voice signal is present is lowered, sound can be emitted without deteriorating the quality of the voice of the speaker. Further, since the sound collection device 1 determines the output value CO′N according to the signal level ratio between the audio signal NE′N and the stationary noise N′N, the signal level is in a frequency band where there is no speaker's speech. Variation is less likely to occur, and the generation of musical noise can be prevented. Furthermore, since the sound collection device 1 obtains the signal level ratio between the voice signal NE′N and the stationary noise N′N, it is possible to detect a frequency band in which only noise exists even if the speaker's voice is small. .
  • the sound collection device 1 maintains the signal level of the voice signal in the frequency band where the speaker's uttered voice exists and the signal level of the voice signal in the frequency band where the uttered voice of the speaker does not exist. (Gain) was output as 0. However, the sound collection device 1 maintains the signal level of the audio signal in the frequency band in which the speaker's uttered voice exists, and sets the signal level (gain) of the audio signal in the frequency band in which the speaker's uttered voice does not exist to 0. It may be lowered to a larger value.
  • FIG. 4 is a diagram illustrating another example of the gain table. In this case, for example, as shown in FIG.
  • the sound collection device 1 sets the gain of the audio signal in the frequency band where the speaker's uttered voice does not exist to 0.5 and sets the gain in the frequency band where the speaker's uttered voice does not exist.
  • the signal level of the audio signal is multiplied by 0.5 and output.

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)

Abstract

 話者の発話音声を劣化させずに、定常ノイズだけを除去した音声信号を出力することができるノイズゲートを提供することにある。  収音装置1は、FFT処理部11、ノイズゲート12、及びIFFT処理部13を備える。収音装置1は、収音した音声信号NE’TをFFT処理部11にて周波数スペクトルNE’Nに変換する。ノイズゲート12は音声信号の周波数スペクトルNE’Nに基づいて定常ノイズのノイズスペクトルN’Nを推定する。ノイズゲート12は、音声信号の周波数スペクトルNE’NとノイズスペクトルN’Nとの信号レベル比が閾値未満の場合は音声信号の信号レベル(ゲイン)を低減して出力する。収音装置1は、定常ノイズN’Nを除去した後の周波数スペクトルCO’NをIFFT処理部13にて逆変換して生成した音声信号CO’Tを出力する。

Description

ノイズゲート、収音装置及びノイズ除去方法
 この発明は、音声信号に含まれるノイズを除去するノイズゲート、収音装置及びノイズ除去方法に関する。
 従来、収音装置では、ノイズを除去する手段としてノイズゲートを設けている(例えば、特許文献1参照)。
 例えば、特許文献1に記載のノイズゲート装置では、音声信号の増幅を行うヘッドアンプの増幅度に応じて、ノイズゲートの閾値を変更し、閾値未満の音声信号を除去している。
日本国特開2006-50067号公報
 しかしながら、特許文献1に記載のノイズゲート装置では、閾値未満の音声信号を除去するため、話者の発話音声が閾値未満の音声信号に含まれている場合、信号レベルが閾値未満の発話音声が除去されてしまうといった問題が生じる。
 そこで、この発明は、音声信号を劣化させずに、定常的なノイズを簡単に除去することができるノイズゲート、収音装置及びノイズ除去方法を提供する。
 この発明のノイズゲートは、入力された音声信号の周波数スペクトルに基づいて、該音声信号に含まれる定常的なノイズ(以下、定常ノイズと称す。)のノイズスペクトルを推定する。ノイズゲートは、入力された音声信号の周波数スペクトルと、推定したノイズスペクトルと、の信号レベル比を算出する。ノイズゲートは、算出した信号レベル比が所定の閾値未満の周波数帯域の信号レベルを下げた前記音声信号の周波数スペクトルを出力する。
 これにより、ノイズゲートは、話者の発話音声を含む音声信号の周波数スペクトルを出力して、定常ノイズからなる音声信号の周波数スペクトルの信号レベルを低減するため、話者の発話音声を劣化させずに、定常ノイズだけを除去した音声信号を出力することができる。
 更に、閾値は、信号レベル比が1となる値より推定手段の推定誤差に対応する値だけ大きく設定してもよい。ノイズゲートは、閾値と比較する信号レベル比を、推定した定常ノイズを用いて算出しているため、定常ノイズの推定誤差を考慮するためである。
 これにより、ノイズゲートは、定常ノイズの信号レベルが実際より小さい値に推定された場合であっても、定常ノイズを除去することができる。
 加えて、この発明の収音装置は、上述のノイズゲートを備える。収音装置は、音声を収音して生成した音声信号を周波数領域の信号である周波数スペクトルに変換して、ノイズゲートに出力する。また、収音装置は、ノイズゲートから出力された音声信号の周波数スペクトルを時間領域の信号である音声信号に逆変換する。
 これにより、収音装置は、上述のノイズゲートを用いることで、収音した音声信号から定常ノイズを除去することができる。このため、収音装置は、収音した話者の発話音声を劣化せずに、放音することができる。
 本発明によれば、音声信号の周波数スペクトルを入力する工程と、前記入力にて入力された音声信号の周波数スペクトルに基づいて、ノイズスペクトルを推定する工程と、前記音声信号の周波数スペクトルと、前記推定工程にて推定されたノイズスペクトルと、の信号レベル比を算出する工程と、前記算出工程にて算出された信号レベル比が所定の閾値未満の周波数帯域のゲインを下げた前記音声信号の周波数スペクトルを出力する工程と、を備えたノイズ除去方法を提供する。
 また、前記閾値は、前記信号レベル比が1となる値より前記推定工程で使用される推定部の推定誤差に対応する値だけ大きく設定される。
 この発明のノイズゲートは、話者の発話音声を劣化させずに、定常ノイズだけを除去した音声信号を出力することができる。
収音装置の機能、構成を示すブロック図である。 ゲインテーブルの一例を示す図である。 (A)~(C)は、定常ノイズ、音声信号、及びノイズ除去後の音声信号の一例を示す図である。 ゲインテーブルの他の例を示す図である。
 この発明に係る収音装置1について、図1,図2を参照して説明する。図1は、収音装置の機能、構成を示すブロック図である。図2は、ゲインテーブルの一例を示す図である。収音装置1は、ノイズゲート12(図1参照)を備える。収音装置1は、収音した音声信号NE’Tを周波数スペクトルNE’Nに変換する。収音装置1は、ノイズゲート12にて音声信号NE’Nに含まれる定常ノイズN’Nを除去する。この際、定常ノイズN’Nは、ノイズゲート12により周波数スペクトルNE’Nに基づいて推定される。収音装置1は、定常ノイズN’Nを除去した後の周波数スペクトルCO’Nを時間軸に逆変換して生成した音声信号CO’Tを出力する。なお、以下の説明では、時間領域の信号は末端の記号を’Tで示し、周波数領域の信号は、末端の記号を’Nで示す。
 まず、収音装置1の機能、構成について、図1,2を参照して説明する。図1に示すように、収音装置1は、マイクMIC、FFT処理部11、ノイズゲート12、及びIFFT処理部13を備える。
 マイクMICは、周囲の音声を収音して音声信号を生成する。マイクMICは、生成した音声信号NE’TをFFT処理部11へ出力する。
 FFT処理部11は、高速フーリエ変換回路であり、時間領域の信号である音声信号NE’Tを周波数領域の信号である音声信号NE’Nに変換して、ノイズゲート12の推定部121及びノイズ除去部122へ音声信号NE’Nを出力する。
 ノイズゲート12は、推定部121及びノイズ除去部122を備える。
 推定部121は、FFT処理部11から入力された音声信号NE’Nに含まれる定常ノイズN’Nを推定する処理を行う。推定部121は、音声信号NE’Nの或るサンプルタイミングにおける周波数スペクトル(以下、音声スペクトルと称す。)S(NE’N)を順次取得するとともに、一時記憶する。推定部121は、この取得及び記憶した複数回の音声スペクトルS(NE’N)に基づいて、定常ノイズN’Nの或るサンプルタイミングにおける周波数スペクトル(以下、ノイズスペクトルと称す。)S(N’N)を推定する。そして、推定部121は、推定したノイズスペクトルS(N’N)をノイズ除去部122へ出力する。
 例えば、或るサンプリングタイミングTでのノイズスペクトルをS(N’N(T))とし、同サンプリングタイミングTでの音声スペクトルをS(NE’N(T))として、直前のサンプリングタイミングT-1でのノイズスペクトルをS(N’N(T-1))とする。また、α,βは、忘却定数であり、例えば、α=0.9、β=0.1となる。ノイズスペクトルS(N’N(T))は、次の式1で表すことができる。
 S(N’N(T))=αS(N’N(T-1))+βS(NE’N(T))・・・式1
 このように、音声スペクトルに基づいてノイズスペクトルS(N’N(T))を推定することで、暗騒音等の定常ノイズを推定することができる。なお、推定部121は、マイクMICが収音した音声信号のレベルが低い状態(無音状態)の場合のみ、ノイズスペクトルの推定処理を行うものとする。
 ノイズ除去部122は、FFT処理部11から入力された音声信号NE’Nから定常ノイズN’Nを除去して、ノイズ除去後の音声信号CO’NをIFFT処理部13へ出力する。具体的には、ノイズ除去部122は、音声スペクトルS(NE’N)と、推定部121から入力されたノイズスペクトルS(N’N)との信号レベル比を算出する。ノイズ除去部122は、算出した信号レベル比が閾値未満の場合、信号レベル比が閾値未満の周波数帯域における、音声スペクトルS(NE’N)のゲインを下げて出力する。
 例えば、ノイズ除去部122は、図2に示すゲインテーブルTBLを備える。ゲインテーブルTBLは、算出した信号レベル比に応じて、音声スペクトルS(NE’N)のゲインを定める。ゲインテーブルTBLは、信号レベル比が閾値以上の場合、ゲインを1とし、信号レベル比が閾値未満の場合、ゲインを0にする。この場合、ノイズ除去後の音声信号CO’Nの或るサンプルタイミングにおける周波数スペクトルS(CO’N)は、次の式2で表すことができる。
 S(CO’N)=(TBL(S(NE’N)/S(N’N)))・S(NE’N)・・・式2
 この結果、ノイズ除去部122は、信号レベル比が閾値以上の周波数では、音声スペクトルS(NE’N)を、信号レベルを変更せずにそのまま出力する。また、ノイズ除去部122は、信号レベル比が閾値未満の周波数帯域では、音声スペクトルS(NE’N)をノイズスペクトルS(N’N)とみなしてその信号レベルを0として出力する。
 また、ノイズ除去部122は、定常ノイズN’Nの推定誤差を考慮して、閾値を信号レベル比が1となる値(1.0)より僅かに大きい値としてもよい。このようにすると、ノイズ除去部122は、定常ノイズN’Nの推定誤差によって定常ノイズN’Nの信号レベルが実際より小さく推定された場合であっても、定常ノイズN’Nを除去することができる。
 IFFT処理部13は、逆高速フーリエ変換回路であり、周波数領域の信号である音声信号CO’Nを時間領域の信号である音声信号CO’Tに変換して出力する。
 以上より、収音装置1は、話者の発話音声が存在する周波数帯域の音声信号を減衰させずにそのまま残すことができるため、話者の発話音声を劣化せずに放音することができる。
 ノイズゲート12の出力値であるノイズ除去後の音声信号CO’Nについて、図3(A)から図3(C)を参照し説明する。図3(A)から図3(C)は、定常ノイズ、音声信号、及びノイズ除去後の音声信号の一例を示す図である。図3(A)は、定常ノイズの信号レベルを示し、図3(B)は、定常ノイズを含む音声信号の信号レベルを示し、図3(C)は、ノイズ除去後の音声信号の信号レベルを示す。
 収音装置1は、図3(A)に示すような定常ノイズN’Nを推定し、図3(B)に示すような音声信号NE’Nを生成したとする。音声信号NE’Nから定常ノイズN’Nを除去するために、収音装置1は、単に、音声信号NE’NからノイズN’Nを差し引くと、図3(C)の破線のように、話者の発話音声が存在する周波数帯域においても音声信号NE’Nの信号レベルを減衰させてしまい、音質が劣化した音声を放音してしまう。また、収音装置1は、定常ノイズN’Nの推定誤差により、音声信号NE’Nに定常ノイズN’Nが残る場合が存在する。この場合、収音装置1は、話者の発話音声が存在しない周波数帯域において信号レベルのばらつきが顕著に生じるため、ミュージカルノイズが発生してしまう。
 一方、本実施形態では、収音装置1は、図3(C)の実線のように、話者の発話音声が存在する周波数帯域を残し、話者の発話音声が存在しない周波数帯域(ノイズのみが存在する周波数帯域)の音声信号の信号レベル(ゲイン)を下げるため、話者の発話音声の音質を劣化させずに、放音することができる。また、収音装置1は、音声信号NE’Nと定常ノイズN’Nとの信号レベル比に応じて出力値CO’Nを決定するため、話者の発話音声が存在しない周波数帯域において信号レベルのばらつきが生じにくく、ミュージカルノイズの発生を防ぐことができる。更に、収音装置1は、音声信号NE’Nと定常ノイズN’Nとの信号レベル比を求めるため、話者の発話音声が小さくてもノイズのみが存在する周波数帯域を検出することができる。
 なお、上述の実施形態では、収音装置1は、話者の発話音声が存在する周波数帯域の音声信号の信号レベルを維持し、話者の発話音声が存在しない周波数帯域の音声信号の信号レベル(ゲイン)を0として出力した。しかし、収音装置1は、話者の発話音声が存在する周波数帯域の音声信号の信号レベルを維持するとともに、話者の発話音声が存在しない周波数帯域の音声信号の信号レベル(ゲイン)を0よりも大きい値まで下げてもよい。図4は、ゲインテーブルの他の例を示す図である。この場合、例えば、図4に示すように、収音装置1は、話者の発話音声が存在しない周波数帯域の音声信号のゲインを0.5として、話者の発話音声が存在しない周波数帯域の音声信号の信号レベルを0.5倍して出力する。これにより、収音装置1は、話者の発話音声が存在する周波数帯域に含まれる定常ノイズが目立たないため、話者の音声を自然に放音することができる。
本発明を詳細にまた特定の実施態様を参照して説明してきたが、本発明の精神、範囲または意図の範囲を逸脱することなく様々な変更や修正を加えることができることは当業者にとって明らかである。
 本発明は、2008年11月21日出願の日本特許出願(特願2008-298332)に基づくものであり、その内容はここに参照として取り込まれる。
 話者の発話音声を劣化させずに、定常ノイズだけを除去した音声信号を出力するノイズゲートを提供することができる。
 1…収音装置
 11…FFT処理部
 12…ノイズゲート
 121…推定部
 122…ノイズ除去部
 13…IFFT処理部
 MIC…マイク

Claims (5)

  1.  音声信号の周波数スペクトルが入力される入力手段と、
     前記入力手段に入力された音声信号の周波数スペクトルに基づいて、ノイズスペクトルを推定する推定手段と、
     前記音声信号の周波数スペクトルと、前記推定手段が推定したノイズスペクトルと、の信号レベル比を算出して、該信号レベル比が所定の閾値未満の周波数帯域の信号レベルを下げた前記音声信号の周波数スペクトルを出力する出力手段と、を備えたノイズゲート。
  2.  前記閾値は、前記信号レベル比が1となる値より前記推定手段の推定誤差に対応する値だけ大きく設定される請求項1に記載のノイズゲート。
  3.  請求項1または請求項2のいずれかに記載のノイズゲートと、
     周囲の音声を収音して音声信号を生成する収音手段と、
     前記収音手段が生成した音声信号を周波数領域の信号である周波数スペクトルに変換する変換手段と、
     前記変換手段によって変換された周波数スペクトルを、前記ノイズゲートの入力手段に入力し、
     前記ノイズゲートの出力手段が出力した音声信号の周波数スペクトルを時間領域の信号である音声信号に逆変換する逆変換手段と、を備えた収音装置。
  4.  音声信号の周波数スペクトルを入力する工程と、
     前記入力にて入力された音声信号の周波数スペクトルに基づいて、ノイズスペクトルを推定する工程と、
     前記音声信号の周波数スペクトルと、前記推定工程にて推定されノイズスペクトルと、の信号レベル比を算出する工程と、
     前記算出工程にて算出された信号レベル比が所定の閾値未満の周波数帯域の信号レベルを下げた前記音声信号の周波数スペクトルを出力する工程と、を備えたノイズ除去方法。
  5.  前記閾値は、前記信号レベル比が1となる値より前記推定工程で使用される推定部の推定誤差に対応する値だけ大きく設定される請求項4に記載のノイズ除去方法。
PCT/JP2009/069588 2008-11-21 2009-11-18 ノイズゲート、収音装置及びノイズ除去方法 WO2010058804A1 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
US13/130,532 US9036830B2 (en) 2008-11-21 2009-11-18 Noise gate, sound collection device, and noise removing method
KR1020117011535A KR101254876B1 (ko) 2008-11-21 2009-11-18 노이즈 게이트, 수음 장치 및 노이즈 제거 방법
EP09827585.2A EP2352148B1 (en) 2008-11-21 2009-11-18 Noise gate, sound collection device, and noise removal method
CN2009801462950A CN102216984B (zh) 2008-11-21 2009-11-18 噪声门、声音采集装置及噪声消除方法

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2008298332A JP2010122617A (ja) 2008-11-21 2008-11-21 ノイズゲート、及び収音装置
JP2008-298332 2008-11-21

Publications (1)

Publication Number Publication Date
WO2010058804A1 true WO2010058804A1 (ja) 2010-05-27

Family

ID=42198243

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2009/069588 WO2010058804A1 (ja) 2008-11-21 2009-11-18 ノイズゲート、収音装置及びノイズ除去方法

Country Status (6)

Country Link
US (1) US9036830B2 (ja)
EP (1) EP2352148B1 (ja)
JP (1) JP2010122617A (ja)
KR (1) KR101254876B1 (ja)
CN (1) CN102216984B (ja)
WO (1) WO2010058804A1 (ja)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102393986A (zh) * 2011-08-11 2012-03-28 重庆市科学技术研究院 基于音频判别的盗伐检测方法、装置及系统
US20140010273A1 (en) * 2010-12-20 2014-01-09 France Telecom Impulse noise measurement by spectral detection
US9117456B2 (en) * 2010-11-25 2015-08-25 Fujitsu Limited Noise suppression apparatus, method, and a storage medium storing a noise suppression program

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102868956B (zh) * 2012-09-24 2015-02-11 深圳市纳芯威科技有限公司 噪声门电路以及音频功放设备
CN106105262B (zh) * 2014-02-18 2019-08-16 杜比国际公司 用于对频率相关衰减级进行调谐的设备和方法
WO2018148095A1 (en) * 2017-02-13 2018-08-16 Knowles Electronics, Llc Soft-talk audio capture for mobile devices
US10368173B1 (en) 2017-03-24 2019-07-30 Advanced Bionics Ag Systems and methods for minimizing an effect of system noise generated by a cochlear implant system
US10595134B1 (en) 2017-03-24 2020-03-17 Advanced Bionics Ag Systems and methods for detecting and reacting to system noise generated by a cochlear implant system
KR102466134B1 (ko) * 2018-06-26 2022-11-10 엘지디스플레이 주식회사 표시 장치
CN112447166A (zh) * 2019-08-16 2021-03-05 阿里巴巴集团控股有限公司 一种针对目标频谱矩阵的处理方法及装置
US11557307B2 (en) * 2019-10-20 2023-01-17 Listen AS User voice control system
CN113938805B (zh) * 2020-07-14 2024-04-23 广州汽车集团股份有限公司 一种低音音质的量化方法及装置
JP2023106686A (ja) 2022-01-21 2023-08-02 ヤマハ株式会社 音声処理装置および音声処理方法
JP2023137650A (ja) 2022-03-18 2023-09-29 ヤマハ株式会社 音信号処理方法及び音信号処理装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204196A (ja) * 1995-12-12 1997-08-05 Nokia Mobile Phones Ltd 雑音抑圧器及び移動局並びに雑音抑圧方法
JP2002517021A (ja) * 1998-05-27 2002-06-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 線形たたみ込みおよび因果的フィルタリングを用いたスペクトルサブトラクションによる信号雑音低減
JP2006050067A (ja) 2004-08-02 2006-02-16 Sony Corp ノイズ低減回路、電子機器、ノイズ低減方法
JP2008298332A (ja) 2007-05-30 2008-12-11 Aisin Seiki Co Ltd 冷蔵庫

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR940009391B1 (ko) * 1985-07-01 1994-10-07 모토로라 인코포레이티드 잡음 억제 시스템
US4811404A (en) 1987-10-01 1989-03-07 Motorola, Inc. Noise suppression system
US6717991B1 (en) 1998-05-27 2004-04-06 Telefonaktiebolaget Lm Ericsson (Publ) System and method for dual microphone signal noise reduction using spectral subtraction
US6549586B2 (en) 1999-04-12 2003-04-15 Telefonaktiebolaget L M Ericsson System and method for dual microphone signal noise reduction using spectral subtraction
US6459914B1 (en) 1998-05-27 2002-10-01 Telefonaktiebolaget Lm Ericsson (Publ) Signal noise reduction by spectral subtraction using spectrum dependent exponential gain function averaging
US6959274B1 (en) 1999-09-22 2005-10-25 Mindspeed Technologies, Inc. Fixed rate speech compression system and method
US6604070B1 (en) 1999-09-22 2003-08-05 Conexant Systems, Inc. System of encoding and decoding speech signals
US6574593B1 (en) 1999-09-22 2003-06-03 Conexant Systems, Inc. Codebook tables for encoding and decoding
US6782360B1 (en) 1999-09-22 2004-08-24 Mindspeed Technologies, Inc. Gain quantization for a CELP speech coder
US6581032B1 (en) 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
AU7486200A (en) 1999-09-22 2001-04-24 Conexant Systems, Inc. Multimode speech encoder
EP1290819A2 (en) * 2000-05-10 2003-03-12 ADC Broadband Access Systems, Inc. System and process for return channel spectrum manager
US7742746B2 (en) * 2007-04-30 2010-06-22 Qualcomm Incorporated Automatic volume and dynamic range adjustment for mobile audio devices

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH09204196A (ja) * 1995-12-12 1997-08-05 Nokia Mobile Phones Ltd 雑音抑圧器及び移動局並びに雑音抑圧方法
JP2002517021A (ja) * 1998-05-27 2002-06-11 テレフオンアクチーボラゲット エル エム エリクソン(パブル) 線形たたみ込みおよび因果的フィルタリングを用いたスペクトルサブトラクションによる信号雑音低減
JP2006050067A (ja) 2004-08-02 2006-02-16 Sony Corp ノイズ低減回路、電子機器、ノイズ低減方法
JP2008298332A (ja) 2007-05-30 2008-12-11 Aisin Seiki Co Ltd 冷蔵庫

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP2352148A4

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9117456B2 (en) * 2010-11-25 2015-08-25 Fujitsu Limited Noise suppression apparatus, method, and a storage medium storing a noise suppression program
US20140010273A1 (en) * 2010-12-20 2014-01-09 France Telecom Impulse noise measurement by spectral detection
CN102393986A (zh) * 2011-08-11 2012-03-28 重庆市科学技术研究院 基于音频判别的盗伐检测方法、装置及系统

Also Published As

Publication number Publication date
EP2352148B1 (en) 2013-10-16
EP2352148A1 (en) 2011-08-03
US20110268288A1 (en) 2011-11-03
KR101254876B1 (ko) 2013-04-15
EP2352148A4 (en) 2012-08-22
JP2010122617A (ja) 2010-06-03
KR20110082176A (ko) 2011-07-18
CN102216984A (zh) 2011-10-12
US9036830B2 (en) 2015-05-19
CN102216984B (zh) 2013-03-27

Similar Documents

Publication Publication Date Title
WO2010058804A1 (ja) ノイズゲート、収音装置及びノイズ除去方法
JP4916394B2 (ja) エコー抑圧装置、エコー抑圧方法及びコンピュータプログラム
JP5528538B2 (ja) 雑音抑圧装置
JP5573517B2 (ja) 雑音除去装置および雑音除去方法
JP5177012B2 (ja) 雑音抑制装置、雑音抑制方法及びコンピュータプログラム
US8391471B2 (en) Echo suppressing apparatus, echo suppressing system, echo suppressing method and recording medium
JP6668995B2 (ja) 雑音抑圧装置、雑音抑圧方法及び雑音抑圧用コンピュータプログラム
KR101690252B1 (ko) 신호 처리 방법 및 장치
JP6135106B2 (ja) 音声強調装置、音声強調方法及び音声強調用コンピュータプログラム
US20140244245A1 (en) Method for soundproofing an audio signal by an algorithm with a variable spectral gain and a dynamically modulatable hardness
US7917359B2 (en) Noise suppressor for removing irregular noise
JPWO2014168021A1 (ja) 信号処理装置、信号処理方法および信号処理プログラム
JP5982900B2 (ja) 雑音抑制装置、マイクロホンアレイ装置、雑音抑制方法、及びプログラム
JP5466581B2 (ja) 反響消去方法、反響消去装置及び反響消去プログラム
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
JP2005037650A (ja) 雑音低減装置
JP2014044281A (ja) 雑音低減装置および雑音低減方法
JP5327735B2 (ja) 信号再生装置
JP6369192B2 (ja) エコー抑圧装置、エコー抑圧プログラム、エコー抑圧方法及び通信端末
JP2023130254A (ja) 音声処理装置および音声処理方法
JP2009065424A (ja) インパルス識別装置及びインパルス識別方法
JP2009049885A (ja) ノイズキャンセル装置及びノイズキャンセル方法
JP2013130815A (ja) 雑音抑圧装置
JP2001216000A (ja) 雑音抑制方法、音声信号処理方法、および信号処理回路
JP2015195510A (ja) エコー抑圧装置、エコー抑圧プログラム、及びエコー抑圧方法

Legal Events

Date Code Title Description
WWE Wipo information: entry into national phase

Ref document number: 200980146295.0

Country of ref document: CN

121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 09827585

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 20117011535

Country of ref document: KR

Kind code of ref document: A

WWE Wipo information: entry into national phase

Ref document number: 2009827585

Country of ref document: EP

NENP Non-entry into the national phase

Ref country code: DE

WWE Wipo information: entry into national phase

Ref document number: 13130532

Country of ref document: US