JP2003517761A - Method and apparatus for suppressing acoustic background noise in a communication system - Google Patents

Method and apparatus for suppressing acoustic background noise in a communication system

Info

Publication number
JP2003517761A
JP2003517761A JP2001542485A JP2001542485A JP2003517761A JP 2003517761 A JP2003517761 A JP 2003517761A JP 2001542485 A JP2001542485 A JP 2001542485A JP 2001542485 A JP2001542485 A JP 2001542485A JP 2003517761 A JP2003517761 A JP 2003517761A
Authority
JP
Japan
Prior art keywords
noise
gain
signal
channel
snr
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2001542485A
Other languages
Japanese (ja)
Inventor
ブイ. ラマバドラン、テンカシ
ピー. アシュレー、ジェームズ
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of JP2003517761A publication Critical patent/JP2003517761A/en
Pending legal-status Critical Current

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04BTRANSMISSION
    • H04B7/00Radio transmission systems, i.e. using radiation field
    • H04B7/005Control of transmission; Equalising
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form

Landscapes

  • Engineering & Computer Science (AREA)
  • Signal Processing (AREA)
  • Multimedia (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Compression, Expansion, Code Conversion, And Decoders (AREA)
  • Noise Elimination (AREA)
  • Cable Transmission Systems, Equalization Of Radio And Reduction Of Echo (AREA)
  • Transceivers (AREA)

Abstract

(57)【要約】 通信システムにおける音響バックグラウンドノイズを抑制するための方法と装置。動作信号対雑音比(SNR)レベルは、SNRレベル推定器(295)によって、チャネルエネルギ(293)とバックグラウンドノイズエネルギ(294)値から信頼度良く評価される。最小利得係数と利得勾配は、動作SNRレベルに応じて適合される(290)。これら適合された値とチャネルSNRとを用いて、チャネル利得が選択される(233)。チャネルSNRがある閾値より小さい場合、そのチャネルは完全にノイズライクであり、また選択された利得係数は最小であり、そのチャネルの減衰は最大になる。チャネルSNRがかなり大きい場合、選択されたチャネル利得は、0dBである。チャネルSNRが中間の値である場合、選択された利得係数は、最小値と0dBとの間である。 (57) Abstract: A method and apparatus for suppressing acoustic background noise in a communication system. The operating signal to noise ratio (SNR) level is reliably evaluated by the SNR level estimator (295) from the channel energy (293) and background noise energy (294) values. The minimum gain factor and gain slope are adapted 290 according to the operating SNR level. Using these adapted values and the channel SNR, a channel gain is selected (233). If the channel SNR is below a certain threshold, the channel is completely noise-like, the gain factor selected is minimal, and the attenuation of the channel is maximal. If the channel SNR is quite large, the selected channel gain is 0 dB. If the channel SNR is an intermediate value, the gain factor selected is between the minimum and 0 dB.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】 発明の分野 本発明は、一般的に、ノイズ抑制に関し、特に、通信システムにおけるノイズ
抑制に関する。
FIELD OF THE INVENTION The present invention relates generally to noise suppression, and more particularly to noise suppression in communication systems.

【0002】 発明の背景 通信システムにおけるノイズ抑制技術は、良く知られている。ノイズ抑制技術
の目標は、ユーザに提供される符号化音声信号の全体的な品質が改善されるよう
に、音声符号化中のバックグラウンドノイズの量を低減することである。音声符
号化を行う通信システムには、これに制限されないが、音声メールシステム、携
帯無線システム、幹線通信システム、航空機通信システム等が含まれる。
BACKGROUND OF THE INVENTION Noise suppression techniques in communication systems are well known. The goal of noise suppression techniques is to reduce the amount of background noise during speech coding so that the overall quality of the coded speech signal provided to the user is improved. Communication systems that perform voice coding include, but are not limited to, voice mail systems, portable radio systems, trunk line communication systems, aircraft communication systems, and the like.

【0003】 ノイズ抑制技術の1つとして、携帯無線システムに組み込まれるスペクトル減
法がある。この技術では、音声入力は、然るべきスペクトル分割器によって、個
々のスペクトル帯(チャネル)に分割され、そして、個々のスペクトルチャネル
は、各チャネルのノイズエネルギ含有量に基づき減衰される。スペクトル減法の
手法は、バックグラウンドノイズパワーのスペクトル密度の推定量を利用して、
各チャネルにおける音声の信号対雑音比(チャネルSNR)を生成し、次に、こ
れを用いて、個々のチャネル各々に対する利得係数を算出する。次に、利得係数
を入力として用いて、個々のスペクトルチャネル各々に対するチャネル利得を修
正する。次に、チャネルを再合成して、ノイズ抑制された出力波形を生成する。
ビルマー(Vilmur)による米国特許第4,811,404号及びアシュリ
ー(Ashley)による米国特許第5,659,622号(双方共本出願の譲
受人に譲渡されており又双方共本明細書中に引用参照する)には各々、通信シス
テムにおける音響バックグラウンドノイズを抑制するための方法と装置が開示さ
れている。アナログ携帯無線電話システムにおいて実施されるスペクトル減法手
法の一例をビルマーによる米国特許第4,811,404号に見ることができる
As one of the noise suppression techniques, there is a spectrum subtraction method incorporated in a mobile radio system. In this technique, the voice input is divided into individual spectral bands (channels) by means of appropriate spectral dividers, and the individual spectral channels are attenuated based on the noise energy content of each channel. The spectral subtraction method uses an estimator of the background noise power spectral density,
The signal-to-noise ratio (channel SNR) of the voice in each channel is generated and then used to calculate the gain factor for each individual channel. The gain factor is then used as an input to modify the channel gain for each individual spectral channel. The channels are then recombined to produce a noise suppressed output waveform.
US Pat. No. 4,811,404 to Vilmur and US Pat. No. 5,659,622 to Ashley (both assigned to the assignee of the present application and both hereby). Each of which is incorporated herein by reference) discloses a method and apparatus for suppressing acoustic background noise in a communication system. An example of a spectral subtraction technique implemented in an analog mobile radio telephone system can be found in U.S. Pat. No. 4,811,404 by Burmer.

【0004】 米国特許第4,811,404号で代表される従来技術においては、あらゆる
チャネルに適用される最小利得(すなわち最大減衰)係数が一定値に固定される
。完全にノイズライクである(低SNR値)と考えられるチャネルには、この最
小利得係数が割当てられ、最大限に減衰される。他方、完全に音声ライクである
(高SNR値)と考えられるチャネルには、利得係数1.0(0dB)が割当て
られ、全く減衰されない。ある程度音声ライクである(中SNR値)チャネルに
は、最小値と1.0との間の利得係数が割当てられる。最小利得係数の選択は、
次の互いに対立する2つの要求事項に基づく。すなわち、1)最小利得係数は、
バックグラウンドノイズが充分に減衰され、これによってノイズを抑制した音声
が更に聞き易くなる程に充分小さくなければならない。また、2)最小利得係数
は、意図しないが回避不能な弱い音声音の如何なる抑制によっても、音声の明瞭
性を大幅に劣化させない程に充分大きくなければならない。通常の最小利得係数
値に対する選択値は、0.2239(−13dB)である。
In the prior art represented by US Pat. No. 4,811,404, the minimum gain (ie maximum attenuation) coefficient applied to every channel is fixed to a constant value. Channels that are considered completely noise-like (low SNR values) are assigned this minimum gain factor and are maximally attenuated. On the other hand, a channel considered to be completely voice-like (high SNR value) is assigned a gain coefficient of 1.0 (0 dB) and is not attenuated at all. Channels that are somewhat voice-like (medium SNR values) are assigned gain factors between a minimum value and 1.0. The choice of minimum gain factor is
It is based on the following two conflicting requirements: That is, 1) the minimum gain coefficient is
The background noise should be sufficiently attenuated so that the noise-suppressed speech is more audible. Also, 2) the minimum gain factor must be large enough so that any suppression of unintentional but unavoidable weak speech sounds does not significantly degrade the speech intelligibility. The selected value for the normal minimum gain coefficient value is 0.2239 (-13 dB).

【0005】 固定最小利得係数値による上述の手法は、バックグラウンドノイズパワーに対
する全音声信号パワー比すなわちSNRがある程度大きい場合、例えば、15d
B以上の場合、ある程度良く機能する。しかしながら、近年、無線電話の用途が
広まりつつあり、音響的により過酷な環境におけるノイズ抑制器の性能に対する
要求がこれまでになく大きくなりつつある。例えば、車両内でのハンドフリーの
用途ばかりでなく、飛行場や鉄道の駅等の場所も、急速に無線電話の通常の動作
環境になりつつある。この影響は、正常な予想信号対雑音比(SNR)が悪くな
り、また、従来技術によるノイズ抑制技術は、これらのより過酷な動作環境に対
応するようになっていないことである。 従って、これらのより過酷な環境においてより高い品質を提供する、通信シス
テム用のより堅牢なノイズ抑制システムに対するニーズが存在する。
The above-described method using the fixed minimum gain coefficient value is effective when the ratio of the total audio signal power to the background noise power, that is, the SNR is relatively large, for example, 15d
When it is B or more, it functions to some extent. However, in recent years, the use of wireless telephones has become widespread, and the demand for the performance of the noise suppressor in acoustically harsh environments is ever increasing. For example, not only hands-free use in vehicles, but also places such as airfields and railway stations are rapidly becoming the normal operating environment for wireless telephones. The effect is that the normal expected signal-to-noise ratio (SNR) is poor and prior art noise suppression techniques are not adapted to these more severe operating environments. Therefore, there is a need for a more robust noise suppression system for communication systems that provides higher quality in these more harsh environments.

【0006】 発明の概要 本発明は、通信システムにおける音響バックグラウンドノイズを抑制するため
の方法を提供する。本方法は、信号対雑音比推定値を生成するために入力信号の
信号成分とノイズ成分を推定する段階と、少なくとも前記信号対雑音比推定値に
基づき最大ノイズ減衰係数を決定する段階と、少なくとも前記最大ノイズ減衰係
数に基づき利得関数を生成する段階と、前記通信システムに用いるためのノイズ
抑制された信号を生成するために、前記利得関数を前記入力信号に適用する段階
と、を含むことを特徴とする。
SUMMARY OF THE INVENTION The present invention provides a method for suppressing acoustic background noise in a communication system. The method comprises estimating a signal component and a noise component of the input signal to produce a signal to noise ratio estimate, and determining at least a maximum noise attenuation coefficient based on the signal to noise ratio estimate. Generating a gain function based on the maximum noise attenuation coefficient, and applying the gain function to the input signal to generate a noise suppressed signal for use in the communication system. Characterize.

【0007】 好適な実施形態の説明 通信システムにおいて実装されたノイズ抑制システムは、低信号対雑音比(S
NR)条件の間、改善された品質レベルを提供し、これによって、ノイズ抑制が
有用なSNRの範囲を拡大する。図2に示すように、ノイズ抑制システム109
は、特に、最小利得係数値を動作SNRレベルに基づき適合する適合ブロック2
90を組み込んでいる。SNRレベルが低下するにつれて、最小利得係数値は増
加する。このことは、バックグラウンドノイズ減衰を低減する効果があるが、低
SNRの状態では検出が困難な弱い音声音は抑制されず、これによって、より高
い明瞭性及び全体的な品質の改善ができる。適合ブロック290への入力として
機能する動作SNRレベル292は、SNRレベル推定器295によって、チャ
ネルエネルギ293及びバックグラウンドノイズエネルギ294の値から高い信
頼性で評価される。
Description of the Preferred Embodiments A noise suppression system implemented in a communication system has a low signal-to-noise ratio (S
NR) conditions provide improved quality levels, thereby extending the range of SNRs where noise suppression is useful. As shown in FIG. 2, the noise suppression system 109
Specifically adapts the minimum gain factor value based on the operating SNR level to the adaptive block 2
It incorporates 90. The minimum gain factor value increases as the SNR level decreases. This has the effect of reducing background noise attenuation, but does not suppress weak voice sounds that are difficult to detect in low SNR conditions, which allows higher clarity and improved overall quality. The operating SNR level 292, which serves as an input to the adaptation block 290, is reliably estimated by the SNR level estimator 295 from the values of the channel energy 293 and the background noise energy 294.

【0008】 チャネル利得計算器233は、各チャネルに適用される利得係数をチャネルS
NR基づき算出する。これには、2つのパラメータすなわちMIN_GAIN(
dB)とGAIN_SLOPE(dB/dB)が用いられる。図3において、チ
ャネル利得計算器233の動作は、次のように説明し得る。チャネルSNR(d
B)がある閾値(CH_SNR_THLD)より小さい場合、すなわち、チャネ
ルが完全にノイズライクである場合、選択された利得係数は、最小すなわちMI
N_GAINであり、チャネルの減衰は最大になる。他方、チャネルSNRがか
なり大きい場合、すなわち、チャネルがほぼ音声ライクである場合、選択された
チャネル利得は、0dB(すなわち、線形目盛で1.0)であり、このチャネル
は、全く減衰を受けない。チャネルSNRが中間の値である場合、すなわち、チ
ャネルが部分的に音声である場合、選択された利得係数は、MIN_GAINと
0dBとの間になる。チャネル利得計算(単位dB)は、次の式によって、表さ
れる。
The channel gain calculator 233 calculates the gain coefficient applied to each channel as the channel S.
Calculate based on NR. It has two parameters: MIN_GAIN (
dB) and GAIN_SLOPE (dB / dB) are used. In FIG. 3, the operation of the channel gain calculator 233 can be described as follows. Channel SNR (d
If B) is less than some threshold (CH_SNR_THLD), ie the channel is completely noise-like, then the selected gain factor is the minimum or MI.
N_GAIN, the channel attenuation is maximum. On the other hand, if the channel SNR is fairly large, ie, the channel is nearly voice-like, then the selected channel gain is 0 dB (ie 1.0 on the linear scale) and this channel is not attenuated at all. . If the channel SNR is an intermediate value, that is, the channel is partially voice, then the selected gain factor will be between MIN_GAIN and 0 dB. The channel gain calculation (in dB) is represented by the following equation.

【0009】[0009]

【数1】 [Equation 1]

【数2】 [Equation 2]

【数3】 チャネル利得計算に用いられる上述の様々なパラメータに対する一般的な値は
、MIN_GAIN=−13dB、GAIN_SLOPE=0.39dB、CH
_SNR_THLD=2.25dBである。
[Equation 3] Typical values for the various parameters mentioned above used in the channel gain calculation are MIN_GAIN = -13 dB, GAIN_SLOPE = 0.39 dB, CH
_SNR_THLD = 2.25 dB.

【0010】 チャネル利得係数を算出するための上記手法は、音声信号パワーのバックグラ
ウンドノイズパワーに対する比(SNR)が充分大きい場合、例えば、15dB
以上の場合、充分に機能する。この場合、音声とノイズとの間の区別がより明瞭
である。バックグラウンドノイズは、(MIN_GAINdBによって)強く減
衰され、強い音声音は実際に減衰されず、また、弱い音声音(主にノイズの多い
チャネルは)は、わずかに減衰される。バックグラウンドノイズが抑制され、ま
た、音声の認識における大きな劣化がないために、音声品質が高められる。
The above method for calculating the channel gain coefficient is, for example, 15 dB when the ratio of the voice signal power to the background noise power (SNR) is sufficiently large.
In the above case, it works well. In this case, the distinction between speech and noise is clearer. Background noise is strongly attenuated (by MIN_GAINdB), strong voice sounds are not really attenuated, and weak voice sounds (mainly noisy channels) are attenuated slightly. Background noise is suppressed, and since there is no significant deterioration in speech recognition, speech quality is improved.

【0011】 しかしながら、ノイズ抑制器109が、より低SNRレベルでの実行を要求さ
れた場合、利得係数を算出するための上記手法は、不充分である。低SNRレベ
ルにおいて、音声とノイズとの間の区別は、特に弱い音声音の場合、不明瞭であ
る。その結果、このような音声は減衰され、明瞭性が損なわれることになる。バ
ックグラウンドノイズは、減衰されるが、明瞭性が損なわれることによって、全
体的な音声品質が劣化する。
However, if the noise suppressor 109 is required to run at lower SNR levels, the above method for calculating the gain factor is inadequate. At low SNR levels, the distinction between speech and noise is ambiguous, especially for weak speech sounds. As a result, such speech is attenuated, resulting in loss of clarity. Background noise is attenuated, but the loss of clarity degrades the overall voice quality.

【0012】 低SNRレベルでのノイズ抑制器性能を改善するために、MIN_GAINと
GAIN_SLOPEの値が、弱い音声音ができるだけ減衰されないように、調
整される。例えば、MIN_GAINの値がー13dBからー10dBに増加し
たとする。この場合、バックグラウンドノイズは、あまり減衰されないが、弱い
音声音と、対応する明瞭性の損失も少ない。このことによって、音声品質が全体
的に改善される。しかしながら、変更されたパラメータ値は、SNRレベルが大
きくなった場合に最適ではない。従って、これに対して提案し得る解決策は、動
作SNRレベルを信頼度良く推定し、また、この推定されたSNRレベルに基づ
き、MIN_GAINとGAIN_SLOPEパラメータの値を適合することで
ある。この解決策によって、ノイズ抑制器109は、より広い範囲のSNRレベ
ルに渡って満足できる程度に充分機能する。
In order to improve noise suppressor performance at low SNR levels, the values of MIN_GAIN and GAIN_SLOPE are adjusted so that weak voice sounds are not attenuated as much as possible. For example, assume that the value of MIN_GAIN has increased from -13 dB to -10 dB. In this case, the background noise is less attenuated, but with less voiced sound and corresponding loss of clarity. This improves the overall voice quality. However, the modified parameter values are not optimal when the SNR level increases. Therefore, a possible solution to this is to reliably estimate the operating SNR level and adapt the values of the MIN_GAIN and GAIN_SLOPE parameters based on this estimated SNR level. With this solution, the noise suppressor 109 works satisfactorily over a wider range of SNR levels.

【0013】 上述の通り提案された解決策の具体的な内容を以下に述べる。SNRレベルを
推定するために、音声エネルギとノイズエネルギは、単位dBで個別に推定され
、また、その2つの差が取られる。単位dBでの音声エネルギは、音声化フレー
ムにおけるピークチャネルエネルギ(dB)サンプルのフィルタ処理されたバー
ジョンである。音声化フレームとピークチャネルエネルギのみを用いることを要
求することによって、バックグラウンドノイズの音声エネルギ推定に対する影響
が最小にされる。単位dBによるノイズエネルギは、全チャネルのノイズのみの
フレームにおける総ノイズエネルギサンプルのフィルタ処理されたバージョンで
ある。ノイズエネルギのみならずチャネルエネルギを音声の推定に用いる前に、
チャネルエネルギに対するプリエンファシスフィルタの影響が、予め算出された
係数を用いることによって、波形テーブルから除去される。波形テーブル係数は
、プリエンファシスフィルタにおける逆二乗スペクトルの大きさから算出されて
いる。
The specific contents of the solution proposed as described above will be described below. To estimate the SNR level, the voice energy and noise energy are estimated separately in dB and the difference between the two is taken. The speech energy in dB is a filtered version of the peak channel energy (dB) samples in the voiced frame. By requiring only the voiced frames and peak channel energy to be used, the effect of background noise on the voice energy estimation is minimized. The noise energy in units of dB is a filtered version of the total noise energy sample in the noise-only frame of all channels. Before using the channel energy as well as the noise energy for speech estimation,
The effect of the pre-emphasis filter on the channel energy is removed from the waveform table by using the pre-calculated coefficients. The waveform table coefficient is calculated from the magnitude of the inverse square spectrum in the pre-emphasis filter.

【0014】 この例を説明するために用いられた様々な変数及びパラメータの一覧は、以下
の通りである。 μ1、μ2、δ、ε ― フィルタ係数。 σ、Φ ― 比例定数。 ch_eng(i) ― チャネルエネルギ、すなわちi番目の周波数チャネ
ルにおける平均エネルギを記憶するフロート変数。
A list of various variables and parameters used to describe this example is as follows: μ1, μ2, δ, ε-filter coefficients. σ, Φ-Proportional constant. ch_eng (i) —A float variable that stores the channel energy, ie the average energy in the i th frequency channel.

【0015】 first ― 第1フレームの場合のみ真である静的ブーリアン変数。 frame_count ― フレーム番号を示す静的整数変数。 fupdate_flag ― upate_flagに優先して、バックグ
ラウンドノイズエネルギ推定値を強制的に更新するブーリアン変数。 gain_slope ― gain_slope値を記憶するフロート変数
であって、チャネル利得係数の算出に用いられる。
First-A static boolean variable that is true only in the first frame. frame_count-A static integer variable indicating the frame number. update_flag-a boolean variable that forces the background noise energy estimate to be updated in preference to the update_flag. gain_slope-A float variable that stores the gain_slope value and is used to calculate the channel gain coefficient.

【0016】 i ― 添字として用いられる整数変数。 min_gain ― 最小利得値サンプルのフィルタ処理された値を記憶す
る静的フロート変数であって、チャネル利得係数の算出に用いられる。 min_gain_raw ― SNRレベルの関数として算出される最小利
得値サンプルを記憶するフロート変数。
I—An integer variable used as a subscript. min_gain-A static float variable that stores the filtered value of the minimum gain value sample and is used to calculate the channel gain factor. min_gain_raw-A float variable that stores the minimum gain value sample calculated as a function of SNR level.

【0017】 noise_enrg_dB ― 単位dBでノイズエネルギサンプルを記憶
するフロート変数。 noise_enrg_dB_filt ― 単位dBでノイズエネルギサン
プルのフィルタ処理されたバージョンを記憶する静的フロート変数。
Noise_enrg_dB—A float variable that stores noise energy samples in units of dB. noise_enrg_dB_filt-A static float variable that stores the filtered version of the noise energy sample in units of dB.

【0018】 shape_table(i) ― i番目の波形テーブル項目を記憶するフ
ロート変数。 snr ― 単位dBでSNRレベルの推定値を記憶するフロート変数。 spch_enrg_dB ― 単位dBで音声エネルギサンプルを記憶する
フロート変数。
Shape_table (i) —A float variable that stores the i th waveform table entry. snr-A float variable that stores the estimated SNR level in dB. spch_enrg_dB—A float variable that stores the voice energy sample in dB.

【0019】 spch_enrg_dB_filt ― 単位dBで音声エネルギサンプル
のフィルタ処理されたバージョンを記憶する静的フロート変数。 update_flag ― 現フレームがノイズのみであり、従って、バッ
クグラウンドノイズエネルギ推定値が更新し得ることを示すブーリアン変数。 vm_sum ― 異なるチャネルの合計音声計測値を記憶する整数変数。
Spch_enrg_dB_filt—A static float variable that stores the filtered version of the speech energy sample in dB. update_flag-a boolean variable that indicates that the current frame is noise only and therefore the background noise energy estimate can be updated. vm_sum—An integer variable that stores the total audio measurements for different channels.

【0020】 GAIN_SLOPE_HIGH ― 利得勾配の最大値用パラメータ。 INIT_FRAMES ― ノイズのみのフレームであることが分かってい
る初期フレームの数を示すパラメータ。 INIT_NOISE_ENRG_DB ― 単位dBでの初期ノイズエネル
ギ値用パラメータ。
GAIN_SLOPE_HIGH—Parameter for maximum gain slope. INIT_FRAMES-A parameter that indicates the number of initial frames known to be noise only frames. INIT_NOISE_ENRG_DB-Parameter for initial noise energy value in dB.

【0021】 INIT_SPCH_ENRG_DB ― 単位dBでの初期音声エネルギ値
用パラメータ。 MIN_GAIN_HIGH ― 最小利得の最大値用パラメータ。 MIN_GAIN_LOW ― 最小利得の最小値用パラメータ。 NUM_CHAN ― チャネル数を示すパラメータ。 SNR_THLD ― SNR閾値として機能するパラメータ。この値より大
きいSNRを有するフレームには、最小利得の最小値すなわちMIN_GAIN
_LOWが割当てられる。
INIT_SPCH_ENRG_DB—Parameter for initial voice energy value in dB. MIN_GAIN_HIGH-Parameter for the maximum value of the minimum gain. MIN_GAIN_LOW-A parameter for the minimum value of the minimum gain. NUM_CHAN-A parameter indicating the number of channels. SNR_THLD-A parameter that acts as an SNR threshold. For frames with an SNR greater than this value, the minimum value of the minimum gain, namely MIN_GAIN
_LOW is assigned.

【0022】 VM_SUM_THLD ― 音声測定合計閾値として機能するパラメータ。
これより大きい音声測定合計値を有するフレームは、大幅に音声化されていると
考えられる。
VM_SUM_THLD-A parameter that acts as a voice measurement sum threshold.
Frames with speech measurement sums higher than this are considered to be highly vocalized.

【0023】 フィルタ処理された音声エネルギの推定に関するステップを以下に示す。第1
ステップは、フィルタ処理された音声エネルギ推定値をある適切な値に初期化す
ることである。
The steps involved in estimating the filtered voice energy are: First
The step is to initialize the filtered speech energy estimate to some suitable value.

【0024】[0024]

【数4】 次のステップは、音声測定合計値が予め選択された閾値を超えるか否か判断す
ることによって、現フレームが音声化されているか検出することである。そうで
ある場合、ピークチャネルエネルギを取得し、フィルタ処理された音声エネルギ
推定値の取得にそれをサンプルとして用いる。
[Equation 4] The next step is to detect if the current frame is voiced by determining if the total audio measurement exceeds a preselected threshold. If so, the peak channel energy is taken and used as a sample to obtain the filtered speech energy estimate.

【0025】[0025]

【数5】 [Equation 5]

【数6】 [Equation 6]

【数7】 使用されたフィルタは、単純な漏出性積分器(すなわち一次自己回帰性)であ
り、また、音声エネルギが増加しつつあるか否かに応じて、異なる積分定数が用
いられることに留意されたい。音声エネルギが増加しつつある場合、積分は速い
、そうでない場合、遅い。このことによって、フィルタ処理された推定値は、よ
り円滑になり、また、低SNR状態において更に信頼度が高いピーク音声エネル
ギを確実に追跡する。現フレームが、音声化フレームでない場合、フィルタ処理
された音声エネルギ推定値は、前の値から変化しない。
[Equation 7] Note that the filter used is a simple leaky integrator (ie first order autoregressive) and different integration constants are used depending on whether the voice energy is increasing or not. The integration is fast if the voice energy is increasing, otherwise it is slow. This makes the filtered estimate smoother and ensures tracking of more reliable peak speech energy in low SNR conditions. If the current frame is not a voiced frame, the filtered voice energy estimate is unchanged from its previous value.

【0026】 フィルタ処理されたノイズエネルギの推定に関係するステップを以下に示す。
第1ステップは、フィルタ処理されたノイズエネルギ推定値をある適切な値に初
期化することである。
The steps involved in estimating the filtered noise energy are:
The first step is to initialize the filtered noise energy estimate to some suitable value.

【0027】[0027]

【数8】 次のステップは、update_flagによって、現フレームがノイズのみ
のフレームであるか検出し、フィルタ処理されたノイズエネルギ推定値の取得に
サンプルとして用いられる総ノイズエネルギを取得することである。
[Equation 8] The next step is to detect if the current frame is a noise-only frame by update_flag and obtain the total noise energy used as a sample to obtain the filtered noise energy estimate.

【0028】[0028]

【数9】 [Equation 9]

【数10】 使用されたフィルタは、単純な漏出性積分器(すなわち一次自己回帰性)であ
り、また、積分定数がδであることに留意されたい。現フレームが、ノイズのみ
のフレームでない場合、フィルタ処理されたノイズエネルギ推定値は、前の値か
ら変化しない。
[Equation 10] Note that the filter used is a simple leaky integrator (ie first order autoregressive) and the integration constant is δ. If the current frame is not a noise only frame, the filtered noise energy estimate is unchanged from its previous value.

【0029】 単位dBでの現フレームに対するSNRレベルは、以下の式から得られる。[0029]   The SNR level for the current frame in dB is given by:

【0030】[0030]

【数11】 SNRレベルに応じて、min_gainとgain_slopeパラメータ
は、次のように選択される。まず、最小利得の生の値がSNRレベルから算出さ
れ、MIN_GAIN_LOWとMIN_GAIN_HIGHによって定義され
る限界内に抑えられる。
[Equation 11] Depending on the SNR level, the min_gain and gain_slope parameters are selected as follows. First, the raw value of the minimum gain is calculated from the SNR level and kept within the limits defined by MIN_GAIN_LOW and MIN_GAIN_HIGH.

【0031】[0031]

【数12】 [Equation 12]

【数13】 [Equation 13]

【数14】 次に、生の値は、min_gain値の急激な変化を避けるためにフィルタ処
理される。
[Equation 14] The raw value is then filtered to avoid sudden changes in the min_gain value.

【0032】[0032]

【数15】 [Equation 15]

【数16】 次に、gain_slopeの値は、以下の通り算出される。[Equation 16] Next, the value of gain_slope is calculated as follows.

【0033】[0033]

【数17】 MIN_GAINとGAIN_SLOPEがmin_gainとgain_s
lopeによって、それぞれ置き換えられる(1)、(2)及び(3)を用いて
、SNRレベルに依存するmin_gainとgain_slopeが、異なる
チャネルに対する利得係数の算出に用いられる。
[Equation 17] MIN_GAIN and GAIN_SLOPE are min_gain and gain_s
min_gain and gain_slope depending on the SNR level are used to calculate the gain factor for different channels, using (1), (2) and (3) respectively replaced by the loop.

【図面の簡単な説明】[Brief description of drawings]

【図1】 通信システム用の音声符号器を示す概略ブロック図。FIG. 1 is a schematic block diagram showing a speech coder for a communication system.

【図2】 本発明に基づくノイズ抑制システムを示す概略ブロック図。FIG. 2 is a schematic block diagram showing a noise suppression system according to the present invention.

【図3】 チャネルSNR(dB)とチャネル利得係数(dB)との間の関
係を示す概略図。
FIG. 3 is a schematic diagram showing the relationship between channel SNR (dB) and channel gain coefficient (dB).

───────────────────────────────────────────────────── フロントページの続き (81)指定国 EP(AT,BE,CH,CY, DE,DK,ES,FI,FR,GB,GR,IE,I T,LU,MC,NL,PT,SE,TR),BR,J P,KR (72)発明者 アシュレー、ジェームズ ピー. アメリカ合衆国 60565 イリノイ州 ネ イパービル アラビアン アベニュー 1816 Fターム(参考) 5K046 AA05 BB01 DD02 DD13 DD25 5K052 DD02 EE12 EE13 FF05 FF34─────────────────────────────────────────────────── ─── Continued front page    (81) Designated countries EP (AT, BE, CH, CY, DE, DK, ES, FI, FR, GB, GR, IE, I T, LU, MC, NL, PT, SE, TR), BR, J P, KR (72) Inventor Ashley, James P.             United States 60565 Ne, Illinois             Iperville Arabian Avenue             1816 F-term (reference) 5K046 AA05 BB01 DD02 DD13 DD25                 5K052 DD02 EE12 EE13 FF05 FF34

Claims (10)

【特許請求の範囲】[Claims] 【請求項1】 通信システムにおける音響バックグラウンドノイズを抑制す
るための方法であって、 信号対雑音比推定値を生成するために入力信号の信号成分とノイズ成分を推定
する段階と、 少なくとも前記信号対雑音比推定値に基づき最大ノイズ減衰係数を決定する段
階と、 少なくとも前記最大ノイズ減衰係数に基づき利得関数を生成する段階と、 前記通信システムに用いるためのノイズ抑制された信号を生成するために、前
記利得関数を前記入力信号に適用する段階と、を含むことを特徴とする方法。
1. A method for suppressing acoustic background noise in a communication system, the method comprising: estimating a signal component and a noise component of an input signal to produce a signal to noise ratio estimate; and at least the signal. Determining a maximum noise attenuation coefficient based on the noise-to-noise ratio estimate, generating a gain function based at least on the maximum noise attenuation coefficient, and generating a noise-suppressed signal for use in the communication system. Applying the gain function to the input signal.
【請求項2】 請求項1に記載の方法であって、前記信号成分は、音声成分
であることを特徴とする方法。
2. The method according to claim 1, wherein the signal component is a voice component.
【請求項3】 請求項1に記載の方法であって、前記最大ノイズ減衰係数は
、最小利得であることを特徴とする方法。
3. The method according to claim 1, wherein the maximum noise attenuation coefficient is a minimum gain.
【請求項4】 請求項1に記載の方法であって、前記利得関数は、少なくと
も1つのチャネル用の利得であることを特徴とする方法。
4. The method of claim 1, wherein the gain function is a gain for at least one channel.
【請求項5】 請求項1に記載の方法であって、前記入力信号の前記信号成
分は、フィルタ処理されたピークチャネルエネルギに基づき推定されることを特
徴とする方法。
5. The method of claim 1, wherein the signal component of the input signal is estimated based on filtered peak channel energy.
【請求項6】 請求項5に記載の方法であって、前記フィルタ処理されたピ
ークチャネルエネルギは、前記入力信号が強い信号含有量を示す期間中に更新さ
れることを特徴とする方法。
6. The method of claim 5, wherein the filtered peak channel energy is updated during a period when the input signal exhibits a strong signal content.
【請求項7】 請求項5に記載の方法であって、前記フィルタ処理されたピ
ークチャネルエネルギは、プリエンファシス利得に対して補正された最大チャネ
ルエネルギから構成されていることを特徴とする方法。
7. The method of claim 5, wherein the filtered peak channel energy comprises a maximum channel energy corrected for pre-emphasis gain.
【請求項8】 請求項7に記載の方法であって、前記最大チャネルエネルギ
は、波形テーブルを用いて、プリエンファシス利得に対して補正されていること
を特徴とする方法。
8. The method of claim 7, wherein the maximum channel energy is corrected for pre-emphasis gain using a waveform table.
【請求項9】 通信システムにおける音響バックグラウンドノイズを抑制す
るための装置であって、 信号対雑音比推定値を生成するために、入力信号の信号成分とノイズ成分を推
定するための信号対雑音レベル推定器と、 少なくとも前記信号対雑音比推定値に基づき最大ノイズ減衰係数と利得勾配を
決定するための適合ブロックと、 前記通信システムに用いるためのノイズ抑制された信号を生成するために、前
記入力信号に適用される利得関数を算出するための利得計算器と、を含むことを
特徴とする装置。
9. An apparatus for suppressing acoustic background noise in a communication system, the signal-to-noise for estimating a signal component and a noise component of an input signal to generate a signal-to-noise ratio estimation value. A level estimator, an adaptive block for determining a maximum noise attenuation coefficient and a gain slope based at least on the signal to noise ratio estimate, and for generating a noise suppressed signal for use in the communication system, A gain calculator for calculating a gain function applied to the input signal.
【請求項10】 請求項9に記載の装置であって、前記信号対雑音レベル推
定器は、チャネルエネルギ値とバックグラウンドノイズエネルギ値を用いて、前
記入力信号の信号及びノイズ成分を推定することを特徴とする装置。
10. The apparatus of claim 9, wherein the signal-to-noise level estimator estimates a signal and noise component of the input signal using a channel energy value and a background noise energy value. A device characterized by.
JP2001542485A 1999-12-03 2000-11-30 Method and apparatus for suppressing acoustic background noise in a communication system Pending JP2003517761A (en)

Applications Claiming Priority (5)

Application Number Priority Date Filing Date Title
US16895599P 1999-12-03 1999-12-03
US60/168,955 1999-12-03
US72393900A 2000-11-28 2000-11-28
US09/723,939 2000-11-28
PCT/US2000/032610 WO2001041334A1 (en) 1999-12-03 2000-11-30 Method and apparatus for suppressing acoustic background noise in a communication system

Publications (1)

Publication Number Publication Date
JP2003517761A true JP2003517761A (en) 2003-05-27

Family

ID=26864619

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001542485A Pending JP2003517761A (en) 1999-12-03 2000-11-30 Method and apparatus for suppressing acoustic background noise in a communication system

Country Status (5)

Country Link
EP (1) EP1238479A4 (en)
JP (1) JP2003517761A (en)
KR (1) KR20020056957A (en)
BR (1) BR0016127A (en)
WO (1) WO2001041334A1 (en)

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5744338A (en) * 1980-08-29 1982-03-12 Victor Co Of Japan Ltd Noise reduction device
US4628529A (en) * 1985-07-01 1986-12-09 Motorola, Inc. Noise suppression system
US4630305A (en) * 1985-07-01 1986-12-16 Motorola, Inc. Automatic gain selector for a noise suppression system
FI92535C (en) * 1992-02-14 1994-11-25 Nokia Mobile Phones Ltd Noise reduction system for speech signals
US5432859A (en) * 1993-02-23 1995-07-11 Novatel Communications Ltd. Noise-reduction system
US5544250A (en) * 1994-07-18 1996-08-06 Motorola Noise suppression system and method therefor
US5706395A (en) * 1995-04-19 1998-01-06 Texas Instruments Incorporated Adaptive weiner filtering using a dynamic suppression factor
US5659622A (en) * 1995-11-13 1997-08-19 Motorola, Inc. Method and apparatus for suppressing noise in a communication system
US6104993A (en) * 1997-02-26 2000-08-15 Motorola, Inc. Apparatus and method for rate determination in a communication system
US6088668A (en) * 1998-06-22 2000-07-11 D.S.P.C. Technologies Ltd. Noise suppressor having weighted gain smoothing

Also Published As

Publication number Publication date
EP1238479A4 (en) 2005-07-27
BR0016127A (en) 2002-08-06
EP1238479A1 (en) 2002-09-11
KR20020056957A (en) 2002-07-10
WO2001041334A1 (en) 2001-06-07

Similar Documents

Publication Publication Date Title
US7873114B2 (en) Method and apparatus for quickly detecting a presence of abrupt noise and updating a noise estimate
US5544250A (en) Noise suppression system and method therefor
US6023674A (en) Non-parametric voice activity detection
EP0790599B1 (en) A noise suppressor and method for suppressing background noise in noisy speech, and a mobile station
US8010355B2 (en) Low complexity noise reduction method
KR100851716B1 (en) Noise suppression based on bark band weiner filtering and modified doblinger noise estimate
US8521530B1 (en) System and method for enhancing a monaural audio signal
US8326617B2 (en) Speech enhancement with minimum gating
EP2008379B1 (en) Adjustable noise suppression system
US5708754A (en) Method for real-time reduction of voice telecommunications noise not measurable at its source
KR100546468B1 (en) Noise suppression system and method
Yang Frequency domain noise suppression approaches in mobile telephone systems
EP2244254B1 (en) Ambient noise compensation system robust to high excitation noise
US20070232257A1 (en) Noise suppressor
KR20070085729A (en) Noise reduction and comfort noise gain control using bark band weiner filter and linear attenuation
JP2002541753A (en) Signal Noise Reduction by Time Domain Spectral Subtraction Using Fixed Filter
WO2001073758A1 (en) Spectrally interdependent gain adjustment techniques
JPWO2002080148A1 (en) Noise suppression device
JP3961290B2 (en) Noise suppressor
CN111554315A (en) Single-channel voice enhancement method and device, storage medium and terminal
EP1279163A1 (en) Speech presence measurement detection techniques
US5666429A (en) Energy estimator and method therefor
US20060184361A1 (en) Method and apparatus for reducing an interference noise signal fraction in a microphone signal
US6507623B1 (en) Signal noise reduction by time-domain spectral subtraction
JP2001159899A (en) Noise suppressor