JP2003140700A - Method and device for noise removal - Google Patents

Method and device for noise removal

Info

Publication number
JP2003140700A
JP2003140700A JP2001339156A JP2001339156A JP2003140700A JP 2003140700 A JP2003140700 A JP 2003140700A JP 2001339156 A JP2001339156 A JP 2001339156A JP 2001339156 A JP2001339156 A JP 2001339156A JP 2003140700 A JP2003140700 A JP 2003140700A
Authority
JP
Japan
Prior art keywords
noise
signal
frequency domain
unit
domain signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2001339156A
Other languages
Japanese (ja)
Other versions
JP3858668B2 (en
Inventor
Akihiko Sugiyama
昭彦 杉山
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001339156A priority Critical patent/JP3858668B2/en
Publication of JP2003140700A publication Critical patent/JP2003140700A/en
Application granted granted Critical
Publication of JP3858668B2 publication Critical patent/JP3858668B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Noise Elimination (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a device and method for noise removal which can obtain a stressed voice of superior quality. SOLUTION: The device has an injected noise calculation part 55 which calculates noise to be injected from a deteriorated voice power spectrum and an estimated noise power spectrum, two adders 56 and 57 which add the obtained noise to the deteriorated voice power spectrum and estimated noise power spectrum, and a noise suppression coefficient generation part 8 which determines a suppression coefficient according to the noise-added deteriorated voice power spectrum and estimated noise power spectrum. Further, the device has a windowing processing part 22 which performs windowing processing for a signal sample extracted from two adjacent frames of a reverse Fourier transform output.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、ノイズ除去方法及
び装置に関し、より詳しくは、所望の音声信号に重畳さ
れているノイズを除去するノイズ除去方法及び装置に関
する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a noise removing method and device, and more particularly, to a noise removing method and device for removing noise superimposed on a desired audio signal.

【0002】[0002]

【従来の技術】ノイズ除去装置(ノイズ・サプレッサ)
は、所望の音声信号に重畳されている雑音(ノイズ)を
除去するものであり、時間領域から周波数領域に変換し
た入力信号を用いてノイズ成分のパワースペクトルを推
定し、この推定パワースペクトルを入力信号から差し引
くことにより、所望の音声信号に混在するノイズを抑圧
するように動作する。ノイズ成分のパワースペクトル
を、音声の無音区間を検出して更新することにより、非
定常なノイズの抑圧にも適用することができる。ノイズ
除去装置としては、例えば、「1984年12月、アイ
・イー・イー・イー・トランザクションズ・オン・アク
ースティクス・スピーチ・アンド・シグナル・プロセシ
ング、第32巻、第6号(IEEE TRANSACTIONS ON ACOUS
TICS, SPEECH, AND SIGNAL PROCESSING, VOL.32, NO.6,
PP.1109-1121, DEC, 1984)、1109〜1121ペー
ジ」(文献1)に記載されている方式がある。これは、最
小平均2乗誤差短時間スペクトル振幅法として知られて
いる。図48に、文献1に記載されたノイズ除去装置の
構成を示す。
2. Description of the Related Art Noise elimination device (noise suppressor)
Is to remove noise superimposed on a desired speech signal. The power spectrum of the noise component is estimated using the input signal transformed from the time domain to the frequency domain, and this estimated power spectrum is input. By subtracting from the signal, it operates so as to suppress the noise mixed in the desired audio signal. The power spectrum of the noise component can be applied to suppression of non-stationary noise by detecting and updating the silent section of the voice. As a noise eliminator, for example, “December 1984, I E E E Transactions on Aqueous Speech and Signal Processing, Volume 32, No. 6 (IEEE TRANSACTIONS ON ACOUS
TICS, SPEECH, AND SIGNAL PROCESSING, VOL.32, NO.6,
PP.1109-1121, DEC, 1984), pages 1109 to 1121 ”(reference 1). This is known as the minimum mean square error short time spectral amplitude method. FIG. 48 shows the configuration of the noise eliminator described in Document 1.

【0003】入力端子11には、劣化音声信号(所望音
声信号とノイズの混在する信号)が、時間領域サンプル
値系列として供給される。劣化音声信号サンプルは、フ
レーム分割部1に供給され、K/2サンプル毎のフレー
ムに分割される。ここに、Kは2以上の偶数とする。フ
レームに分割された劣化音声信号サンプルは、窓がけ処
理部2に供給され、窓関数w(t)との乗算が行なわれ
る。第nフレームの入力信号yn(t)(t=0,
1,....,K/2−1)に対するw(t)で窓がけされ
た信号yn(t)バーは、式(1)で与えられる。
A deteriorated voice signal (a signal in which a desired voice signal and noise are mixed) is supplied to the input terminal 11 as a time domain sample value sequence. The deteriorated audio signal sample is supplied to the frame division unit 1 and divided into K / 2 sample frames. Here, K is an even number of 2 or more. The deteriorated audio signal sample divided into frames is supplied to the windowing processing unit 2 and is multiplied by the window function w (t). The input signal y n (t) (t = 0,
The signal y n (t) bar windowed by w (t) for 1, ...., K / 2−1) is given by equation (1).

【0004】[0004]

【数1】 [Equation 1]

【0005】また、連続する2フレームの一部を重ね合
わせ(オーバラップ)して窓がけすることも広く行なわ
れている。オーバラップ長としてフレーム長の50%を
仮定すれば、t=0,1,....,K/2−1に対して、
式(2)で得られるyn(t)バー(t=0,1,....,
K/2−1)が、窓がけ処理部2の出力となる。
It is also widely practiced to overlap a part of two consecutive frames to form a window. Assuming 50% of the frame length as the overlap length, for t = 0, 1, ..., K / 2-1,
Y n (t) bar (t = 0, 1, ...,
K / 2-1) is the output of the windowing processing unit 2.

【0006】[0006]

【数2】 [Equation 2]

【0007】実数信号に対しては、左右対称窓関数が用
いられる。また、窓関数は、後述する抑圧係数を1に設
定したときの入力信号と出力信号が計算誤差を除いて一
致するように設計される。これは、w(t)+w(t+
K/2)=1となることを意味する。以後、連続する2
フレームの50%をオーバラップして窓がけする場合を
例として説明を続ける。窓関数w(t)としては、例え
ば式(3)に示すハニング窓を用いることができる。
A symmetric window function is used for real signals. Further, the window function is designed so that the input signal and the output signal when the suppression coefficient, which will be described later, is set to 1 match each other except for a calculation error. This is w (t) + w (t +
It means that K / 2) = 1. After that, 2 consecutive times
The description will be continued by taking as an example the case of opening windows by overlapping 50% of the frames. As the window function w (t), for example, the Hanning window shown in Expression (3) can be used.

【0008】[0008]

【数3】 [Equation 3]

【0009】窓がけされた出力yn(t)バーは、フーリ
エ変換部3に供給され、周波数領域の劣化音声スペクト
ル(周波数領域信号)Yn(k)に変換される。劣化音声
スペクトルYn(k)は位相と振幅に分離され、劣化音声
位相スペクトルのargYn(k)は逆フーリエ変換部9
に、劣化音声振幅スペクトル|Yn(k)|は音声検出部
4、多重乗算部16及び多重乗算部17に供給される。
The windowed output y n (t) bar is supplied to the Fourier transform unit 3 and transformed into a degraded speech spectrum (frequency domain signal) Y n (k) in the frequency domain. The deteriorated speech spectrum Y n (k) is separated into a phase and an amplitude, and the argY n (k) of the deteriorated speech phase spectrum is inverse Fourier transform unit 9.
Then, the deteriorated voice amplitude spectrum | Y n (k) | is supplied to the voice detection unit 4, the multiple multiplication unit 16 and the multiple multiplication unit 17.

【0010】音声検出部4は、劣化音声振幅スペクトル
|Yn(k)|に基づいて音声の有無を検出し、その結果
によって定められる音声検出フラグを推定雑音計算部5
1に伝達する。多重乗算部17は、供給された劣化音声
振幅スペクトル|Yn(k)|を周波数別に2乗し、劣化
音声パワースペクトルとして推定雑音計算部51と周波
数別SNR(信号対雑音比)計算部6に伝達する。推定
雑音計算部51は、音声検出フラグ、劣化音声パワース
ペクトル、及びカウンタ13から供給されるカウント値
を用いて、上記劣化音声振幅スペクトルに含まれる雑音
(第2の雑音)のパワースペクトルを推定し、推定雑音
パワースペクトルとして周波数別SNR計算部6に伝達
する。周波数別SNR計算部6は、入力された劣化音声
パワースペクトルと推定雑音パワースペクトルを用いて
周波数別に除算し、後天的SNR(a posteriori SNR)
として推定先天的SNR計算部7と雑音抑圧係数生成部
8に供給する。後天的SNRは雑音を含む強調前音声と
雑音の比の推定値である。
The voice detection unit 4 detects the presence or absence of voice based on the deteriorated voice amplitude spectrum | Y n (k) |, and the voice detection flag determined by the result is used as the estimated noise calculation unit 5
Propagate to 1. The multiple multiplication unit 17 squares the supplied deteriorated speech amplitude spectrum | Y n (k) | by frequency, and the estimated noise calculation unit 51 and frequency-dependent SNR (signal-to-noise ratio) calculation unit 6 as a deteriorated speech power spectrum. Communicate to. The estimated noise calculation unit 51 estimates the power spectrum of noise (second noise) included in the deteriorated voice amplitude spectrum, using the voice detection flag, the deteriorated voice power spectrum, and the count value supplied from the counter 13. , Is transmitted to the frequency-dependent SNR calculation unit 6 as an estimated noise power spectrum. The frequency-based SNR calculation unit 6 divides by frequency using the input deteriorated speech power spectrum and estimated noise power spectrum, and obtains an acquired SNR (a posteriori SNR).
Is supplied to the estimated a priori SNR calculation unit 7 and the noise suppression coefficient generation unit 8. The acquired SNR is an estimate of the ratio of the pre-emphasized speech including noise and the noise.

【0011】推定先天的SNR計算部7は、入力された
後天的SNR、及び後述する雑音抑圧係数生成部8から
供給された抑圧係数Gn(k)バーを用いて、真の音声対
雑音比を示す先天的SNR(a priori SNR)を推定し、
推定先天的SNRとして雑音抑圧係数生成部8に帰還さ
せる。雑音抑圧係数生成部8は、入力として供給された
後天的SNRと推定先天的SNRを用いて雑音抑圧係数
を生成し、抑圧係数G n(k)バーとして推定先天的SN
R計算部7に帰還すると同時に多重乗算部16に伝達す
る。多重乗算部16は、フーリエ変換部3から供給され
た劣化音声振幅スペクトル|Yn(k)|を、雑音抑圧係
数生成部8から供給された抑圧係数Gn(k)バーで重み
づけすることによって強調音声振幅スペクトル|X
n(k)|バーを求め、逆フーリエ変換部9に伝達する。
|Xn(k)|バーは、式(4)で与えられる。
The estimated a priori SNR calculator 7 receives the input
From the acquired SNR and the noise suppression coefficient generation unit 8 described later
Supplied suppression coefficient GnUse the (k) bar to find the true voice pair
Estimate the a priori SNR indicating the noise ratio,
The estimated a priori SNR is fed back to the noise suppression coefficient generator 8.
Let The noise suppression coefficient generator 8 is supplied as an input
The noise suppression coefficient is calculated using the acquired SNR and the estimated a priori SNR.
And the suppression coefficient G n(k) Estimated innate SN as bar
It returns to the R calculation unit 7 and at the same time is transmitted to the multiple multiplication unit 16.
It The multiple multiplication unit 16 is supplied from the Fourier transform unit 3.
Deteriorated speech amplitude spectrum | Yn(k) | is the noise suppressor
Suppression coefficient G supplied from the number generation unit 8n(k) Weight at bar
Emphasized speech amplitude spectrum | X
n(k) | Obtains the bar and transfers it to the inverse Fourier transform unit 9.
| Xn(k) | bar is given by equation (4).

【0012】[0012]

【数4】 [Equation 4]

【0013】逆フーリエ変換部9は、多重乗算部16か
ら供給された強調音声振幅スペクトル|Xn(k)|バー
とフーリエ変換部3から供給された劣化音声位相スペク
トルargYn(k)を乗算して、強調音声スペクトルX
n(k)バーを求める。すなわち、式(5)を実行する。
[0013] The inverse Fourier transform unit 9, enhanced speech amplitude spectrum supplied from multiplexed multiplier 16 | multiply degraded supplied from the bar and a Fourier transform unit 3 audio phase spectrum argY n (k) | X n (k) And emphasized speech spectrum X
Find n (k) bars. That is, the equation (5) is executed.

【0014】[0014]

【数5】 [Equation 5]

【0015】そして、得られた強調音声スペクトルX
n(k)バーに逆フーリエ変換を施し、1フレームがKサ
ンプルから構成される時間領域サンプル値系列(時間領
域信号)xn(t)バー(t=0,1,....,K−1)と
して、フレーム合成部10に伝達する。フレーム合成部
10は、xn(t)バーの隣接する2フレームからK/2
サンプルずつを取り出して重ね合わせ、(6)式によっ
て強調音声xn(t)ハット(t=0,1,....,K/2
−1)を得る。得られた強調音声xn(t)ハットが、フ
レーム合成部10の出力として、出力端子12に伝達さ
れる。
Then, the obtained emphasized speech spectrum X
An inverse Fourier transform is applied to the n (k) bar, and a time domain sample value sequence (time domain signal) x n (t) bar (t = 0, 1, ..., K) in which one frame is composed of K samples -1) is transmitted to the frame synthesis unit 10. The frame composition unit 10 calculates K / 2 from two adjacent frames of the x n (t) bar.
Samples are taken out and superposed, and the emphasized speech x n (t) hat (t = 0, 1, ...
-1) is obtained. The obtained emphasized speech x n (t) hat is transmitted to the output terminal 12 as the output of the frame synthesis unit 10.

【0016】[0016]

【数6】 [Equation 6]

【0017】次に、図48に示したノイズ除去装置の各
部の構成及び動作について、さらに説明する。音声検出
部の実現方法について、文献1は詳細に開示していな
い。しかし、音声検出部の実現例としては、「2000
年3月、日本音響学会講演論文集、321〜322ペー
ジ」(文献2)が知られているので、以降、文献2に示
されたものを従来の方法として説明する。図49は、図
48における音声検出部4の構成を示すブロック図であ
る。音声検出部4は、閾値記憶部401、比較部40
2、乗算器404、対数計算部405、パワー計算部4
06、重みつき加算部407、重み記憶部408、論理
否定回路409を有する。
Next, the configuration and operation of each part of the noise eliminator shown in FIG. 48 will be further described. Document 1 does not disclose in detail how to realize the voice detection unit. However, as an implementation example of the voice detection unit, "2000
Since March 2013, a collection of lectures by the Acoustical Society of Japan, pp. 321 to 322 "(Reference 2), the method shown in Reference 2 will be described as a conventional method. FIG. 49 is a block diagram showing the configuration of the voice detection unit 4 in FIG. The voice detection unit 4 includes a threshold storage unit 401 and a comparison unit 40.
2, multiplier 404, logarithmic calculation unit 405, power calculation unit 4
06, a weighted addition unit 407, a weight storage unit 408, and a logical NOT circuit 409.

【0018】図48におけるフーリエ変換部3から供給
された劣化音声振幅スペクトルは、パワー計算部406
に供給される。パワー計算部406は、劣化音声振幅ス
ペクトルのパワー|Yn(k)|2 のk=0からK−1に
対する総和を計算して、対数計算部405に伝達する。
対数計算部405は、入力された劣化音声スペクトルパ
ワー|Yn(k)|2 の対数を求め、乗算器404に伝達
する。乗算器404は、供給された対数値を定数倍(例
えば10倍)して劣化音声パワーQn を求め、比較部4
02及び重みつき加算部407に供給する。すなわち、
第nフレームの劣化音声パワーQn は、式(7)で与え
られる。
The deteriorated voice amplitude spectrum supplied from the Fourier transform unit 3 in FIG.
Is supplied to. The power calculation unit 406 calculates the sum of the power | Y n (k) | 2 of the degraded speech amplitude spectrum for k = 0 to K−1, and transmits the sum to the logarithmic calculation unit 405.
The logarithmic calculation unit 405 obtains the logarithm of the input deteriorated speech spectral power | Y n (k) | 2 and transmits it to the multiplier 404. The multiplier 404 multiplies the supplied logarithmic value by a constant (for example, 10 times) to obtain the deteriorated voice power Q n , and the comparison unit 4
02 and the weighted addition unit 407. That is,
The deteriorated voice power Q n of the nth frame is given by the equation (7).

【0019】[0019]

【数7】 [Equation 7]

【0020】なお、文献2に開示された音声検出部は、
時間領域サンプルであるyn(t)バーを用いて、式
(8)に従ってQnを求めている。
The voice detection unit disclosed in Document 2 is
Using the y n (t) bar which is a time domain sample, Q n is calculated according to the equation (8).

【0021】[0021]

【数8】 [Equation 8]

【0022】しかし、例えば、「1985年、ディジタ
ル信号処理の理論、コロナ社、75〜76ページ」(文
献3)にあるように、式(8)と式(7)が等価である
ことは、パーセバル(Parseval)の等式として知られて
いる。
However, for example, as shown in "1985, Theory of Digital Signal Processing, Corona Publishing Co., Ltd., pp. 75-76" (Reference 3), equations (8) and (7) are equivalent to each other. Known as the Parseval equation.

【0023】比較部402には、閾値記憶部401か
ら、閾値THn が供給されている。比較部402は、乗
算器404の出力Qn と閾値THn を比較し、THn
n のときは有音を表す“1”を、THn ≦Qn のとき
は無音を表す“0”を出力する。比較部402の出力
は、音声検出部4の出力である音声検出フラグとして外
部に供給されると同時に、否定演算回路409に供給さ
れる。否定演算回路409の出力は、重みつき加算部制
御信号905として重みつき加算部407に供給され
る。重みつき加算部407には、また、閾値記憶部40
1から閾値(THn-1)902と、重み記憶部408か
ら重み903が供給される。
The threshold value TH n is supplied from the threshold value storage unit 401 to the comparison unit 402. The comparing unit 402 compares the output Q n of the multiplier 404 with the threshold value TH n , and TH n >
When Q n , "1" indicating a voice is output, and when TH n ≤Q n , "0" indicating a silence is output. The output of the comparison unit 402 is supplied to the outside as a voice detection flag which is the output of the voice detection unit 4, and at the same time, is supplied to the negative operation circuit 409. The output of the negative operation circuit 409 is supplied to the weighted addition unit 407 as the weighted addition unit control signal 905. The weighted addition unit 407 also includes a threshold storage unit 40.
The threshold value (TH n-1 ) 902 is supplied from 1 and the weight 903 is supplied from the weight storage unit 408.

【0024】重みつき加算部407は、閾値記憶部40
1から供給される閾値(THn-1 )902を、重みつき
加算部制御信号905に基づいて選択的に更新する。更
新閾値THn は、閾値(THn-1 )902と劣化音声パ
ワー(Qn )901を、重み記憶部408から供給され
る重み903を用いて重みつき加算することによって求
められる。更新閾値THn の計算は、論理否定回路40
9の出力である重みつき加算部制御信号905が“1”
に等しいときだけ行なわれる。すなわち、無音のときだ
け、閾値THn-1 がTHn に更新される。更新によって
得られた更新閾値THn は、更新閾値904として閾値
記憶部401に帰還される。
The weighted addition unit 407 includes a threshold storage unit 40.
The threshold value (TH n-1 ) 902 supplied from 1 is selectively updated based on the weighted addition unit control signal 905. The update threshold TH n is obtained by weighted addition of the threshold (TH n−1 ) 902 and the deteriorated voice power (Q n ) 901 using the weight 903 supplied from the weight storage unit 408. The logical NOT circuit 40 calculates the update threshold TH n.
The weighted addition unit control signal 905 which is the output of 9 is "1"
Is performed only when That is, the threshold value TH n-1 is updated to TH n only when there is no sound. The update threshold TH n obtained by the update is fed back to the threshold storage unit 401 as the update threshold 904.

【0025】図50は、図49に示した音声検出部4に
含まれるパワー計算部406の構成を示すブロック図で
ある。パワー計算部406は、分離部4061、K個の
乗算器40620 〜4062K-1 、加算器4063を有
する。多重化された状態で図48におけるフーリエ変換
部3から供給された劣化音声振幅スペクトル|Yn(k)
|は、分離部4061において周波数別のKサンプルに
分離され、それぞれ乗算器40620 〜4062K-1
供給される。乗算器40620 〜4062K-1は、それ
ぞれ入力された信号を2乗し、加算器4063に伝達す
る。加算器4063は、入力された信号の総和を求めて
出力する。
FIG. 50 is a block diagram showing the configuration of power calculation section 406 included in voice detection section 4 shown in FIG. The power calculation unit 406 includes a separation unit 4061, K multipliers 4062 0 to 4062 K−1 , and an adder 4063. The deteriorated speech amplitude spectrum | Y n (k) supplied from the Fourier transform unit 3 in FIG. 48 in the multiplexed state.
| Is separated into frequency-of K samples in the separation unit 4061 are supplied to the multipliers 4062 0 ~4062 K-1. The multipliers 4062 0 to 4062 K-1 square the respective input signals and transmit the squared signals to the adder 4063. The adder 4063 calculates and outputs the total sum of the input signals.

【0026】図51は、図49に示した音声検出部4に
含まれる重みつき加算部407の構成を示すブロック図
である。重みつき加算部407は、乗算器4071,4
073、定数乗算器4075、加算器4072,407
4を有する。図49における乗算器404から劣化音声
パワー(Qn )901が、図49における閾値記憶部4
01から閾値(THn-1 )902が、図49における重
み記憶部408から重み903が、図49における論理
否定回路409から重みつき加算部制御信号905が、
それぞれ入力として供給される。
FIG. 51 is a block diagram showing the structure of the weighted addition unit 407 included in the voice detection unit 4 shown in FIG. The weighted addition unit 407 includes multipliers 4071, 4
073, constant multiplier 4075, adders 4072 and 407
Have 4. 49. The deteriorated voice power (Q n ) 901 from the multiplier 404 in FIG.
01 to the threshold value (TH n-1 ) 902, the weight storage unit 408 in FIG. 49 to the weight 903, the logical NOT circuit 409 in FIG. 49 to the weighted addition unit control signal 905,
Each is supplied as an input.

【0027】値βを有する重み903は、定数乗算器4
075と乗算器4073に伝達される。定数乗算器40
75は入力信号を−1倍して得られた−βを、加算器4
074の一方の入力として供給する。加算器4074の
他方の入力としては1が供給されており、加算器407
4の出力は両者の和である1−βとなる。1−βは乗算
器4071の一方の入力として供給されて、他方の入力
である劣化音声パワー(Qn )901と乗算され、積で
ある(1−β)Qn が加算器4072に伝達される。
The weight 903 having the value β is the constant multiplier 4
075 and the multiplier 4073. Constant multiplier 40
75 is -β obtained by multiplying the input signal by -1 to adder 4
074 as one input. 1 is supplied to the other input of the adder 4074, and the adder 407
The output of 4 is the sum of the two, 1-β. 1-β is supplied as one input of the multiplier 4071 and is multiplied by the deteriorated voice power (Q n ) 901 which is the other input, and the product (1-β) Q n is transmitted to the adder 4072. It

【0028】一方、乗算器4073では、重み903と
して供給されたβと閾値(THn-1)902が乗算さ
れ、積であるβTHn-1 が加算器4072に伝達され
る。加算器4072は、βTHn-1 と(1−β)Qn
和を、更新閾値(THn )904として出力する。更新
閾値THn の計算は、重みつき加算部制御信号905が
“1”に等しいときだけ行なわれる。すなわち、重みつ
き加算部407の機能は、無音のときに、閾値THn -1
を更新してTHn を求めることであり、式(9)によっ
て表すことができる。
On the other hand, the multiplier 4073, supplied β and the threshold value (TH n-1) 902 is multiplied as the weight 903, βTH n-1 which is a product is transmitted to the adder 4072. The adder 4072 outputs the sum of βTH n−1 and (1−β) Q n as the update threshold (TH n ) 904. The update threshold value TH n is calculated only when the weighted adder control signal 905 is equal to “1”. That is, the function of the weighted addition unit 407 is that the threshold value TH n −1 is used when there is no sound.
Is calculated to obtain TH n , which can be expressed by equation (9).

【0029】[0029]

【数9】 [Equation 9]

【0030】図48における多重乗算部17について説
明する。図52は、多重乗算部17の構成を示すブロッ
ク図である。多重乗算部17は、K個の乗算器1701
0 〜1701K-1 、分離部1702,1703、多重化
部1704を有する。多重化された状態で図48におけ
るフーリエ変換部3から供給された劣化音声振幅スペク
トルは、分離部1702及び1703において周波数別
のKサンプルに分離され、それぞれ乗算器17010
1701K-1 に供給される。乗算器17010〜170
K-1 は、それぞれ入力された信号を2乗し、多重化部
1704に伝達する。多重化部1704は、入力された
信号を多重化し、劣化音声パワースペクトルとして出力
する。
The multiplying unit 17 in FIG. 48 will be described. FIG. 52 is a block diagram showing the configuration of the multiple multiplication unit 17. The multiplex multiplication unit 17 includes K multipliers 1701.
It has 0 to 1701 K-1 , demultiplexing units 1702 and 1703, and a multiplexing unit 1704. The deteriorated voice amplitude spectrum supplied from the Fourier transform unit 3 in FIG. 48 in the multiplexed state is separated into K samples for each frequency in the separation units 1702 and 1703, and each of them is multiplied by 1701 0 to 1701.
Supplied to 1701 K-1 . Multipliers 1701 0 to 170
1 K-1 squares the respective input signals and transmits them to multiplexing section 1704. Multiplexing section 1704 multiplexes the input signal and outputs it as a degraded voice power spectrum.

【0031】図48における推定雑音計算部51につい
て説明する。図53は、推定雑音計算部51の構成を示
すブロック図である。推定雑音計算部51は、分離部5
02、多重化部503、K個の周波数別推定雑音計算部
5140 〜514K-1 を有する。図48における音声検
出部4から供給された音声検出フラグと図48における
カウンタ13から供給されたカウント値は、周波数別推
定雑音計算部5140〜514K-1 に伝達される。図4
8における多重乗算部17から供給された劣化音声パワ
ースペクトルは、分離部502に伝達される。
The estimated noise calculation unit 51 in FIG. 48 will be described. FIG. 53 is a block diagram showing the configuration of the estimated noise calculation unit 51. The estimated noise calculation unit 51 includes the separation unit 5
02, a multiplexing unit 503, and K frequency - dependent estimated noise calculation units 514 0 to 514 K−1 . The voice detection flag supplied from the voice detection unit 4 in FIG. 48 and the count value supplied from the counter 13 in FIG. 48 are transmitted to the frequency - dependent estimated noise calculation units 514 0 to 514 K-1 . Figure 4
The deteriorated voice power spectrum supplied from the multiplex multiplier 17 in 8 is transmitted to the separator 502.

【0032】分離部502は、多重化された状態で供給
された劣化音声パワースペクトルをK個の周波数に対応
した成分に分離して、それぞれ周波数別推定雑音計算部
5140 〜514K-1 に伝達する。周波数別推定雑音計
算部5140 〜514K-1 は、分離部502から供給さ
れた劣化音声パワースペクトルを用いて雑音パワースペ
クトルを計算し、多重化部503に伝達する。雑音パワ
ースペクトルの計算は、カウント値と音声検出フラグの
値によって制御され、予め定めた条件が満足されるとき
だけ実行される。多重化部503は、供給されたK個の
雑音パワースペクトル値を多重化して、推定雑音パワー
スペクトルとして出力する。
The separating unit 502 separates the deteriorated speech power spectrum supplied in the multiplexed state into components corresponding to K frequencies, and the estimated noise calculating units 514 0 to 514 K-1 for each frequency. introduce. The frequency - dependent estimated noise calculation units 514 0 to 514 K-1 calculate a noise power spectrum using the deteriorated speech power spectrum supplied from the separation unit 502, and transmit the noise power spectrum to the multiplexing unit 503. The calculation of the noise power spectrum is controlled by the count value and the value of the voice detection flag, and is executed only when a predetermined condition is satisfied. The multiplexing unit 503 multiplexes the supplied K noise power spectrum values and outputs them as an estimated noise power spectrum.

【0033】図54は、図53に示した推定雑音計算部
51に含まれる周波数別推定雑音計算部514の構成を
示すブロック図である。文献2で開示された雑音推定
は、無音区間において雑音推定値を更新するものであ
り、雑音推定値として巡回型フィルタによる平均化を施
した推定雑音の瞬時値を用いている。一方、「1998
年5月、アイ・イー・イー・イー・トランザクションズ
・オン・スピーチ・アンド・オーディオ・プロセシン
グ、第6巻、第3号(IEEE TRANS-ACTIONS ON SPEECHAN
D AUDIO PROCESSING, VOL.6, NO.3, PP.287-292, MAY,
1998 )、287〜292ページ」(文献4)に開示さ
れた雑音推定では、推定雑音の瞬時値を平均化して用い
ると記述されている。これは、巡回型の代わりにトラン
スバーサル型フィルタ(シフトレジスタを用いた構成)
を用いた平均化の実現を示唆している。どちらの実現も
機能は等しいので、ここでは文献4に開示された方法に
ついて説明する。
FIG. 54 is a block diagram showing the configuration of the frequency-dependent estimated noise calculation unit 514 included in the estimated noise calculation unit 51 shown in FIG. The noise estimation disclosed in Reference 2 updates the noise estimation value in a silent section, and uses the instantaneous value of the estimated noise averaged by the recursive filter as the noise estimation value. On the other hand, "1998
May, IEE Transactions on Speech and Audio Processing, Volume 6, Issue 3 (IEEE TRANS-ACTIONS ON SPEECHAN
D AUDIO PROCESSING, VOL.6, NO.3, PP.287-292, MAY,
1998), pp. 287-292 ”(Reference 4), it is described that the instantaneous values of the estimated noise are averaged and used. This is a transversal type filter (configuration using shift register) instead of the cyclic type.
It suggests the realization of averaging using. Since the functions are the same in both implementations, the method disclosed in Document 4 will be described here.

【0034】周波数別推定雑音計算部514は、更新判
定部521、レジスタ長記憶部5941、スイッチ50
44、シフトレジスタ5045、加算器5046、最小
値選択部5047、除算部5048、カウンタ5049
を有する。スイッチ5044には、図53における分離
部502から、周波数別劣化音声パワースペクトルが供
給されている。スイッチ5044が回路を閉じたとき
に、周波数別劣化音声パワースペクトルは、シフトレジ
スタ5045に伝達される。シフトレジスタ5045
は、更新判定部521から供給される制御信号に応じ
て、内部レジスタの記憶値を隣接レジスタにシフトす
る。シフトレジスタ長は、後述するレジスタ長記憶部5
941に記憶されている値に等しい。シフトレジスタ5
045の全レジスタ出力は、加算器5046に供給され
る。加算器5046は、供給された全レジスタ出力を加
算して、加算結果を除算部5048に伝達する。
The frequency-dependent estimated noise calculation unit 514 includes an update determination unit 521, a register length storage unit 5941, and a switch 50.
44, shift register 5045, adder 5046, minimum value selection unit 5047, division unit 5048, counter 5049
Have. The switch 5044 is supplied with the degraded voice power spectrum for each frequency from the separating unit 502 in FIG. When the switch 5044 closes the circuit, the frequency-dependent deteriorated voice power spectrum is transmitted to the shift register 5045. Shift register 5045
Shifts the storage value of the internal register to the adjacent register according to the control signal supplied from the update determination unit 521. The shift register length is the register length storage unit 5 described later.
Equal to the value stored in 941. Shift register 5
All 045 register outputs are provided to adder 5046. The adder 5046 adds all the supplied register outputs and transmits the addition result to the division unit 5048.

【0035】一方、更新判定部521には、カウント値
と音声検出フラグが供給されている。更新判定部521
は、カウント値が予め設定された値に到達するまでは常
に“1”を、到達した後は音声検出フラグが“0”であ
る(無音の)ときに“1”を、それ以外のときに“0”
を出力し、制御信号としてカウンタ5049、スイッチ
5044、及びシフトレジスタ5045に伝達する。ス
イッチ5044は、更新判定部521から供給された制
御信号が“1”のときに回路を閉じ、“0”のときに開
く。カウンタ5049は、更新判定部521から供給さ
れた制御信号が“1”のときにカウント値を増加し、
“0”のときには変更しない。シフトレジスタ5045
は、更新判定部521から供給された信号が“1”のと
きにスイッチ5044から供給される信号サンプルを1
サンプル取り込むと同時に、内部レジスタの記憶値を隣
接レジスタにシフトする。
On the other hand, the update determination unit 521 is supplied with the count value and the voice detection flag. Update determination unit 521
Is always "1" until the count value reaches a preset value, and when it reaches "1" when the voice detection flag is "0" (silence), otherwise. "0"
Is output and transmitted as a control signal to the counter 5049, the switch 5044, and the shift register 5045. The switch 5044 closes the circuit when the control signal supplied from the update determination unit 521 is “1”, and opens when the control signal is “0”. The counter 5049 increments the count value when the control signal supplied from the update determination unit 521 is “1”,
When it is "0", it is not changed. Shift register 5045
Is a signal sample supplied from the switch 5044 when the signal supplied from the update determination unit 521 is “1”.
Simultaneously with the sampling, the value stored in the internal register is shifted to the adjacent register.

【0036】最小値選択部5047には、カウンタ50
49の出力とレジスタ長記憶部5941の出力が供給さ
れている。最小値選択部5047は、供給されたカウン
ト値とレジスタ長のうち、小さい方を選択して、除算部
5048に伝達する。除算部5048は、加算器504
6から供給された周波数別劣化音声パワースペクトルの
加算値をカウント値又はレジスタ長の小さい方の値で除
算し、商を周波数別推定雑音パワースペクトルλn(k)
として出力する。Bn(k)(n=0,1,....,N−
1)をシフトレジスタ5045に保存されている劣化音
声パワースペクトルのサンプル値とすると、λn(k)は
式(10)で与えられる。
The minimum value selector 5047 has a counter 50.
The output of 49 and the output of the register length storage unit 5941 are supplied. The minimum value selection unit 5047 selects the smaller one of the supplied count value and the register length and transmits it to the division unit 5048. The division unit 5048 uses the adder 504.
The added value of the frequency-dependent deteriorated speech power spectrum supplied from 6 is divided by the count value or the smaller value of the register length, and the quotient is the frequency-dependent estimated noise power spectrum λ n (k)
Output as. B n (k) (n = 0, 1, ..., N−
Letting 1) be the sample value of the degraded voice power spectrum stored in the shift register 5045, λ n (k) is given by equation (10).

【0037】[0037]

【数10】 [Equation 10]

【0038】ただし、Nはカウント値とレジスタ長のう
ち、小さい方の値である。カウント値はゼロから始まっ
て単調に増加するので、最初はカウント値で除算が行な
われ、後にはレジスタ長で除算が行なわれる。一方、実
際に値が記憶されているレジスタの数は、カウント値が
レジスタ長より小さいときはカウント値に等しく、カウ
ント値がレジスタ長より大きくなると、レジスタ長と等
しくなる。したがって、加算器5046から供給された
周波数別劣化音声パワースペクトルの加算値を、実際に
値が記憶されているレジスタの数で除算することにな
る。カウント値がレジスタ長より大きいときは、シフト
レジスタ5045に格納された値の平均値を求めること
になる。この演算結果が周波数別推定雑音パワースペク
トルとなる。
However, N is the smaller value of the count value and the register length. Since the count value starts from zero and monotonically increases, division is first performed by the count value and later division is performed by the register length. On the other hand, the number of registers in which values are actually stored is equal to the count value when the count value is smaller than the register length, and is equal to the register length when the count value is larger than the register length. Therefore, the added value of the frequency-dependent deteriorated voice power spectrum supplied from the adder 5046 is divided by the number of registers in which the values are actually stored. When the count value is larger than the register length, the average value of the values stored in the shift register 5045 is calculated. The result of this calculation is the estimated noise power spectrum for each frequency.

【0039】図55は、図54に示した周波数別推定雑
音計算部514に含まれる更新判定部521の構成を示
すブロック図である。更新判定部521は、論理否定回
路5202、比較部5203、閾値記憶部5204、論
理和計算部5211を有する。図48におけるカウンタ
13から供給されるカウント値は、比較部5203に伝
達される。閾値記憶部5204の出力である閾値も、比
較部5203に伝達される。比較部5203は、供給さ
れたカウント値と閾値を比較し、カウント値が閾値より
小さいときに“1”を、カウント値が閾値より大きいと
きに“0”を、論理和計算部5211に伝達する。
FIG. 55 is a block diagram showing the configuration of the update determination unit 521 included in the frequency-dependent estimated noise calculation unit 514 shown in FIG. The update determination unit 521 includes a logical NOT circuit 5202, a comparison unit 5203, a threshold value storage unit 5204, and a logical sum calculation unit 5211. The count value supplied from the counter 13 in FIG. 48 is transmitted to the comparison unit 5203. The threshold value output from the threshold value storage unit 5204 is also transmitted to the comparison unit 5203. The comparison unit 5203 compares the supplied count value with the threshold value, and transmits “1” to the logical sum calculation unit 5211 when the count value is smaller than the threshold value and “0” when the count value is larger than the threshold value. .

【0040】一方、供給された音声検出フラグは論理否
定回路5202に伝達される。論理否定回路5202
は、入力された信号の論理否定値を求め、論理和計算部
5211に伝達する。すなわち、音声検出フラグが
“1”である有音部では“0”を、音声検出フラグが
“0”である無音部では“1”を、論理和計算部521
1に伝達することになる。その結果、論理和計算部52
11の出力は、音声検出フラグが“0”である無音部の
とき、又はカウント値が閾値より小さいときに“1”と
なって、図54におけるスイッチ5044を閉じ、カウ
ンタ5049をカウントアップさせる。
On the other hand, the supplied voice detection flag is transmitted to the logical NOT circuit 5202. Logical NOT circuit 5202
Calculates the logical negation value of the input signal and transmits it to the logical sum calculation unit 5211. That is, the voice-over portion whose voice detection flag is "1" is "0", and the voice-over portion whose voice detection flag is "0" is "1".
It will be transmitted to 1. As a result, the logical sum calculation unit 52
The output of 11 is "1" when the voice detection flag is a silent part where the voice detection flag is "0" or when the count value is smaller than the threshold value, and the switch 5044 in FIG. 54 is closed and the counter 5049 is counted up.

【0041】図48における周波数別SNR計算部6に
ついて説明する。図56は、周波数別SNR計算部6の
構成を示すブロック図である。周波数別SNR計算部6
は、K個の除算部6010 〜601K-1 、分離部60
2,603、多重化部604を有する。図48における
多重乗算部17から供給される劣化音声パワースペクト
ルは、分離部602に伝達される。図48における推定
雑音計算部51から供給される推定雑音パワースペクト
ルは、分離部603に伝達される。劣化音声パワースペ
クトルは分離部602において、推定雑音パワースペク
トルは分離部603において、それぞれ周波数成分に対
応したKサンプルに分離され、それぞれ除算部6010
〜601K-1 に供給される。除算部6010 〜601
K-1 では、式(11)に従って、供給された劣化音声パ
ワースペクトル|Yn(k)|2 を推定雑音パワースペク
トルλn(k)で除算して周波数別SNRγn(k)を求
め、多重化部604に伝達する。多重化部604は、伝
達されたK個の周波数別SNRγ n(k)を多重化して、
後天的SNRとして出力する。
In the frequency-dependent SNR calculation unit 6 in FIG.
explain about. FIG. 56 shows the SNR calculation unit 6 for each frequency.
It is a block diagram which shows a structure. Frequency SNR calculation unit 6
Is K division units 6010 ~ 601K-1 , Separation unit 60
2, 603, and a multiplexing unit 604. In FIG. 48
Deteriorated voice power spectrum supplied from multiplex multiplier 17
Are transmitted to the separating unit 602. Estimation in FIG. 48
Estimated noise power spectrum supplied from the noise calculator 51
Are transmitted to the separating unit 603. Degraded voice power spec
In the demultiplexing unit 602, Kuttle calculates the estimated noise power spectrum.
In the separation unit 603, the tor is paired with each frequency component.
The corresponding K samples are separated, and each division unit 6010 
~ 601K-1 Is supplied to. Division unit 6010 ~ 601
K-1 Then, according to equation (11),
War spectrum | Yn(k) |2Estimated noise power spectrum
Tol λnDivide by (k) and divide by frequency SNRγnFind (k)
Therefore, it is transmitted to the multiplexing unit 604. The multiplexing unit 604 transmits
Reached K SNRγ for each frequency n(k) is multiplexed,
Output as an acquired SNR.

【0042】[0042]

【数11】 [Equation 11]

【0043】図48における推定先天的SNR計算部7
について説明する。図57は、推定先天的SNR計算部
7の構成を示すブロック図である。推定先天的SNR計
算部7は、多重値域限定処理部701、後天的SNR記
憶部702、抑圧係数記憶部703、多重乗算部70
4,705、重み記憶部706、多重重みつき加算部7
07、加算器708を有する。図48における周波数別
SNR計算部6から供給される後天的SNRγn(k)
(k=0,1,....,K−1)は、加算器708の一方
の端子と、後天的SNR記憶部702に伝達される。後
天的SNR記憶部702は、第nフレームにおける後天
的SNRγn(k)を記憶すると共に、第n−1フレーム
における後天的SNRγn-1(k)を多重乗算部705に
伝達する。
The estimated a priori SNR calculator 7 in FIG.
Will be described. FIG. 57 is a block diagram showing the configuration of the estimated a priori SNR calculation unit 7. The estimated a priori SNR calculation unit 7 includes a multiple range limiting processing unit 701, an a posteriori SNR storage unit 702, a suppression coefficient storage unit 703, a multiple multiplication unit 70.
4, 705, weight storage unit 706, multiple weighted addition unit 7
07 and an adder 708. Acquired SNR γ n (k) supplied from the frequency-dependent SNR calculation unit 6 in FIG.
(K = 0, 1, ..., K−1) is transmitted to one terminal of the adder 708 and the acquired SNR storage unit 702. The acquired SNR storage unit 702 stores the acquired SNR γ n (k) in the n-th frame and transfers the acquired SNR γ n-1 (k) in the ( n-1 ) th frame to the multiplex multiplication unit 705.

【0044】図48における雑音抑圧係数生成部8から
供給される抑圧係数Gn(k)バー(k=0,1,....,
K−1)は、抑圧係数記憶部703に伝達される。抑圧
係数記憶部703は、第nフレームにおける抑圧係数G
n(k)バーを記憶すると共に、第n−1フレームにおけ
る抑圧係数Gn-1(k)バーを多重乗算部704に伝達す
る。多重乗算部704は、供給されたGn-1(k)バーを
2乗してG2 n-1(k)バーを求め、多重乗算部705に
伝達する。多重乗算部705は、G2 n-1(k)バーとγ
n-1(k)をk=0,1,....,K−1に対して乗算して
2 n-1(k)バーγn-1(k)を求め、その結果を多重重
みつき加算部707に過去の推定SNR922として伝
達する。多重乗算部704及び705の構成は、既に図
52を用いて説明した多重乗算部17に等しいので、詳
細な説明は省略する。
The suppression coefficient G n (k) bar (k = 0, 1, ..., And, supplied from the noise suppression coefficient generator 8 in FIG.
K-1) is transmitted to the suppression coefficient storage unit 703. The suppression coefficient storage unit 703 stores the suppression coefficient G in the nth frame.
The n (k) bar is stored and the suppression coefficient G n-1 (k) bar in the ( n-1 ) th frame is transmitted to the multiplex multiplication unit 704. The multiple multiplication unit 704 squares the supplied G n-1 (k) bar to obtain a G 2 n-1 (k) bar, and transmits it to the multiple multiplication unit 705. The multiple multiplication unit 705 calculates the G 2 n-1 (k) bar and γ.
n−1 (k) is multiplied by k = 0, 1, ..., K−1 to obtain G 2 n−1 (k) bar γ n−1 (k), and the result is multiplied. The past estimated SNR 922 is transmitted to the weighted addition unit 707. The configurations of the multiplex multipliers 704 and 705 are the same as those of the multiplex multiplier 17 already described with reference to FIG. 52, and thus detailed description thereof will be omitted.

【0045】加算器708の他方の端子には−1が供給
されており、加算結果γn(k)−1が多重値域限定処理
部701に伝達される。多重値域限定処理部701は、
加算器708から供給された加算結果γn(k)−1に値
域限定演算子P[・]による演算を施し、その結果であ
るP[γn(k)−1]を多重重みつき加算部707に瞬
時推定SNR921として伝達する。ただし、P[x]
は式(12)で定められる。
-1 is supplied to the other terminal of the adder 708, and the addition result γ n (k) -1 is transmitted to the multiple range limiting processing unit 701. The multiple range limitation processing unit 701
The addition result γ n (k) -1 supplied from the adder 708 is calculated by the range limiting operator P [•], and the result P [γ n (k) -1] is added to the multi-weighted addition unit. It is transmitted to 707 as the instantaneous estimated SNR 921. However, P [x]
Is defined by equation (12).

【0046】[0046]

【数12】 [Equation 12]

【0047】多重重みつき加算部707には、また、重
み記憶部706から重み923が供給されている。多重
重みつき加算部707は、これらの供給された瞬時推定
SNR921、過去の推定SNR922、重み923を
用いて推定先天的SNR924を求める。重み923を
αとし、ξn(k)ハットを推定先天的SNRとすると、
ξn(k)ハットは、式(13)によって計算される。こ
こに、右辺第1項の初期値(n=0)を、γ-1(k)G
2 -1(k)バー=1とする。
A weight 923 is supplied from the weight storage unit 706 to the multiple weighted addition unit 707. The multiple weighted addition unit 707 obtains an estimated a priori SNR 924 by using the supplied instantaneous estimated SNR 921, past estimated SNR 922, and weight 923. If the weight 923 is α and the ξ n (k) hat is the estimated a priori SNR,
ξ n (k) hat is calculated by the equation (13). Here, the initial value (n = 0) of the first term on the right side is set to γ −1 (k) G
2 −1 (k) bar = 1.

【0048】[0048]

【数13】 [Equation 13]

【0049】図58は、図57に示した推定先天的SN
R計算部7に含まれる多重値域限定処理部701の構成
を示すブロック図である。多重値域限定処理部701
は、定数記憶部7011、K個の最大値選択部7012
0 〜7012K-1 、分離部7013、多重化部7014
を有する。分離部7013には、図57における加算器
708から、γn(k)−1が供給される。分離部701
3は、供給されたγn(k)−1をK個の周波数別成分に
分離し、それぞれ最大値選択部70120 〜7012
K-1 の一方の入力に供給する。最大値選択部70120
〜7012K-1の他方の入力には、定数記憶部7011
からゼロが供給されている。最大値選択部70120
7012K-1 は、γn(k)−1をゼロと比較し、大きい
方の値を多重化部7014へ伝達する。この最大値選択
演算は、式(12)を実行することに相当する。多重化
部7014は、これらの値を多重化して出力する。
FIG. 58 shows the estimated innate SN shown in FIG.
6 is a block diagram showing a configuration of a multiple range limiting processing unit 701 included in the R calculation unit 7. FIG. Multiple range limitation processing unit 701
Is a constant storage unit 7011 and K maximum value selection units 7012.
0 to 7012 K-1 , demultiplexing unit 7013, multiplexing unit 7014
Have. Γ n (k) −1 is supplied to the separating unit 7013 from the adder 708 in FIG. 57. Separation unit 701
3 separates the supplied γ n (k) -1 into K frequency components, and the maximum value selection units 7012 0 to 7012 respectively.
Supply to one input of K-1 . Maximum value selection unit 7012 0
~ 7012 K-1 has the other input to the constant storage unit 7011.
Is being supplied by zero. Maximum value selection unit 7012 0 ~
7012 K-1 compares γ n (k) -1 with zero and transfers the larger value to multiplexing section 7014. This maximum value selection operation is equivalent to executing Expression (12). The multiplexing unit 7014 multiplexes these values and outputs them.

【0050】図59は、図57に示した推定先天的SN
R計算部7に含まれる多重重みつき加算部707の構成
を示すブロック図である。多重重みつき加算部707
は、K個の重みつき加算部70710 〜7071K-1
分離部7072,7074、多重化部7075を有す
る。
FIG. 59 shows the estimated innate SN shown in FIG.
6 is a block diagram showing the configuration of a multiple weighted addition unit 707 included in the R calculation unit 7. FIG. Multi-weighted addition unit 707
Are K weighted addition units 7071 0 to 7071 K-1 ,
It has demultiplexing units 7072 and 7074 and a multiplexing unit 7075.

【0051】分離部7072には、図57における多重
値域限定処理部701から、P[γ n(k)−1]が瞬時
推定SNR921として供給される。分離部7072
は、P[γn(k)−1]をK個の周波数別成分に分離
し、周波数別瞬時推定SNR9210 〜921K-1 とし
て、それぞれ重みつき加算部70710 〜7071K-1
に伝達する。分離部7074には、図57における多重
乗算部705から、G2 n-1(k)バーγn-1(k)が過去
の推定SNR922として供給される。分離部7074
は、G2 n-1(k)バーγn-1(k)をK個の周波数別成分
に分離し、過去の周波数別推定SNR9220 〜922
K-1 として、それぞれ重みつき加算部70710 〜70
71K-1 に伝達する。一方、重みつき加算部70710
〜7071K- 1 には、重み923も供給される。重みつ
き加算部70710 〜7071K-1 は、式(13)によ
って表される重みつき加算を実行し、周波数別推定先天
的SNR9240 〜924K-1 を多重化部7075に伝
達する。多重化部7075は、周波数別推定先天的SN
R9240 〜924K-1 を多重化し、推定先天的SNR
924として出力する。重みつき加算部70710 〜7
071K-1 の構成と動作は、既に図51を用いて説明し
た重みつき加算部407と等しいので、詳細な説明は省
略する。但し、重みつき加算の計算は常に行なわれる。
The demultiplexing unit 7072 is provided with the multiplexing shown in FIG.
From the range limiting processing unit 701, P [γ n(k) -1] is instantaneous
Supplied as an estimated SNR 921. Separation unit 7072
Is P [γn(k) -1] is separated into K frequency components
Frequency-dependent instantaneous estimation SNR 9210 ~ 921K-1 age
Respectively, the weighted addition unit 70710 ~ 7071K-1 
Communicate to. The demultiplexing unit 7074 includes the multiplex shown in FIG.
From the multiplication unit 705, G2 n-1(K) bar γn-1(k) is the past
Of the estimated SNR 922. Separation unit 7074
Is G2 n-1(K) bar γn-1(k) is K frequency components
And separate past estimated SNR922 by frequency0 ~ 922
K-1 Respectively, the weighted addition unit 70710 ~ 70
71K-1 Communicate to. On the other hand, the weighted addition unit 70710 
~ 7071K- 1 Is also provided with a weight 923. Weight
Adder 70710 ~ 7071K-1 According to equation (13)
The weighted addition represented by
SNR9240 ~ 924K-1 Is transmitted to the multiplexing unit 7075.
Reach The multiplexing unit 7075 uses the frequency-specific estimated innate SN.
R9240 ~ 924K-1 The estimated innate SNR
Output as 924. Weighted addition unit 70710 ~ 7
071K-1 The configuration and operation of are already explained using FIG.
Since it is equal to the weighted addition unit 407, detailed description will be omitted.
I will omit it. However, the weighted addition calculation is always performed.

【0052】図48における雑音抑圧係数生成部8につ
いて説明する。図60は、雑音抑圧係数生成部8の構成
を示すブロック図である。雑音抑圧係数生成部8は、K
個の抑圧係数検索部8010 〜801K-1 、分離部80
2,803、多重化部804を有する。分離部802に
は、図48における周波数別SNR計算部6から後天的
SNRが供給される。分離部802は、供給された後天
的SNRをK個の周波数別成分に分離し、それぞれ抑圧
係数検索部8010 〜801K-1 に伝達する。分離部8
03には、図48における推定先天的SNR計算部7か
ら推定先天的SNRが供給される。分離部803は、供
給された推定先天的SNRをK個の周波数別成分に分離
し、それぞれ抑圧係数検索部8010 〜801K-1 に伝
達する。抑圧係数検索部8010 〜801K-1 は、供給
された後天的SNRと推定先天的SNRに対応した抑圧
係数を検索し、検索結果を多重化部804に伝達する。
多重化部804は、供給された抑圧係数を多重化して出
力する。
The noise suppression coefficient generator 8 in FIG. 48 will be described. FIG. 60 is a block diagram showing the configuration of the noise suppression coefficient generator 8. The noise suppression coefficient generation unit 8 uses K
Individual suppression coefficient search units 801 0 to 801 K-1 , separation unit 80
2, 803 and a multiplexing unit 804. The separation unit 802 is supplied with the acquired SNR from the frequency-based SNR calculation unit 6 in FIG. The separation unit 802 separates the supplied acquired SNR into K frequency components, and transfers the K frequency components to the suppression coefficient search units 801 0 to 801 K-1 . Separation part 8
03 is supplied with the estimated a priori SNR from the estimated a priori SNR calculator 7 in FIG. Separation unit 803, the supplied estimated apriori SNR is separated into K frequency-component, and transmits the respective spectral gain search unit 801 0 ~801 K-1. The suppression coefficient search units 801 0 to 801 K-1 search for suppression coefficients corresponding to the supplied acquired SNR and estimated a priori SNR, and transmit the search results to the multiplexing unit 804.
The multiplexing unit 804 multiplexes the supplied suppression coefficient and outputs it.

【0053】図61は、図60に示した雑音抑圧係数生
成部8に含まれる抑圧係数検索部8010 〜801K-1
の構成を示すブロック図である。抑圧係数検索部801
は、抑圧係数テーブル8011、アドレス変換部801
2,8013を有する。アドレス変換部8012には、
図60における分離部802から、周波数別後天的SN
Rが供給される。アドレス変換部8012は、供給され
た周波数別後天的SNRを対応したアドレスに変換し、
抑圧係数テーブル8011に伝達する。アドレス変換部
8013には、図60における分離部803から、周波
数別推定先天的SNRが供給される。アドレス変換部8
013は、供給された周波数別推定先天的SNRを対応
したアドレスに変換し、抑圧係数テーブル8011に伝
達する。抑圧係数テーブル8011は、アドレス変換部
8012とアドレス変換部8013から供給されたアド
レスに対応した領域に格納されている抑圧係数を、周波
数別抑圧係数として出力する。ここでは、特定の統計モ
デルに従う背景雑音を仮定して導出した抑制係数が用い
られている。
FIG. 61 is a block diagram of the suppression coefficient search units 801 0 to 801 K-1 included in the noise suppression coefficient generation unit 8 shown in FIG.
3 is a block diagram showing the configuration of FIG. Suppression coefficient search unit 801
Is a suppression coefficient table 8011 and address conversion unit 801.
2,8013. The address conversion unit 8012 has
From the separation unit 802 in FIG.
R is supplied. The address conversion unit 8012 converts the supplied frequency-dependent acquired SNR into a corresponding address,
This is transmitted to the suppression coefficient table 8011. The address conversion unit 8013 is supplied with the estimated a priori SNR for each frequency from the separation unit 803 in FIG. Address conversion unit 8
013 converts the supplied inferred innate SNR for each frequency into a corresponding address, and transfers it to the suppression coefficient table 8011. The suppression coefficient table 8011 outputs the suppression coefficient stored in the area corresponding to the address supplied from the address conversion unit 8012 and the address conversion unit 8013 as the suppression coefficient for each frequency. Here, the suppression coefficient derived by assuming the background noise according to a specific statistical model is used.

【0054】[0054]

【発明が解決しようとする課題】このように、従来のノ
イズ除去装置及び方法では、特定の統計モデルに従う背
景雑音を仮定して導出した抑圧係数を用いて雑音抑圧を
行なっていたため、その統計モデルに従わない雑音を効
果的に除去することができなかった。このため、十分高
い強調音声の品質を達成できなかった。また、従来のノ
イズ除去装置及び方法では、逆フーリエ変換して得られ
た時間領域信号の隣接する2フレームから取り出した信
号サンプルを重ね合わせ加算することによって、強調音
声を得ていた。一方、フーリエ変換前に時間領域信号に
かける窓関数は、雑音抑圧処理を行なわないときに、入
力が出力において再現されるように設計されていた。こ
のため、重ね合わせ加算の対象となった信号サンプル
が、隣接するフレームにおいて異なった抑圧係数値で抑
圧されると、フレーム境界において信号サンプルに不連
続性を生じ、出力信号に発生する雑音によって音質が劣
化してしまっていた。
As described above, in the conventional noise removing apparatus and method, the noise suppression is performed by using the suppression coefficient derived assuming the background noise according to the specific statistical model. The noise that did not comply could not be effectively removed. For this reason, a sufficiently high quality of the emphasized voice cannot be achieved. Further, in the conventional noise removing apparatus and method, the emphasized speech is obtained by superposing and adding the signal samples extracted from two adjacent frames of the time domain signal obtained by the inverse Fourier transform. On the other hand, the window function applied to the time domain signal before the Fourier transform has been designed so that the input is reproduced at the output when the noise suppression processing is not performed. Therefore, if the signal samples that are subject to superposition addition are suppressed with different suppression coefficient values in adjacent frames, discontinuity occurs in the signal samples at frame boundaries, and noise generated in the output signal causes sound quality. Had deteriorated.

【0055】以上のように従来のノイズ除去装置及び方
法には、優れた音質の強調音声を得ることができないと
いう問題があった。本発明はこのような課題を解決する
ためになされたものであり、その目的は、優れた音質の
強調音声を得ることができるノイズ除去装置及び方法を
提供することにある。
As described above, the conventional noise removing apparatus and method have a problem that it is not possible to obtain an emphasized voice having excellent sound quality. The present invention has been made to solve such a problem, and an object of the present invention is to provide a noise removing apparatus and method capable of obtaining an emphasized voice with excellent sound quality.

【0056】[0056]

【課題を解決するための手段】このような目的を達成す
るために、本発明のノイズ除去方法は、入力信号に基づ
いて擬似的な雑音を生成し、この擬似的な雑音を注入し
て得られた抑圧係数を用いることを特徴とする。抑圧係
数を定めるときに上述した擬似的な雑音を注入すること
により、特定の統計モデルに従う背景雑音を仮定して導
出した抑圧係数を、入力信号に応じて補正することがで
きる。
In order to achieve such an object, the noise removing method of the present invention generates pseudo noise based on an input signal and obtains it by injecting this pseudo noise. It is characterized by using the suppressed suppression coefficient. By injecting the above-mentioned pseudo noise when determining the suppression coefficient, the suppression coefficient derived assuming the background noise according to the specific statistical model can be corrected according to the input signal.

【0057】より具体的には、本発明のノイズ除去方法
は、入力信号を周波数領域信号に変換し、この周波数領
域信号に基づいて擬似的な第1の雑音を計算し、この第
1の雑音を周波数領域信号に付加し、第1の雑音を付加
した周波数領域信号を用いて信号対雑音比を求め、この
信号対雑音比に基づいて抑圧係数を定め、この抑圧係数
を用いて周波数領域信号を重みづけし、この重みづけし
た周波数領域信号を時間領域信号に変換することによっ
て、入力信号からノイズを除去した出力信号を得ること
を特徴とする。
More specifically, the noise removal method of the present invention transforms an input signal into a frequency domain signal, calculates pseudo first noise based on the frequency domain signal, and calculates the first noise. Is added to the frequency domain signal, the signal-to-noise ratio is obtained using the frequency-domain signal to which the first noise is added, the suppression coefficient is determined based on this signal-to-noise ratio, and the frequency-domain signal is calculated using this suppression coefficient. Is weighted, and the weighted frequency domain signal is converted into a time domain signal to obtain an output signal from which noise is removed from the input signal.

【0058】このノイズ除去方法において、周波数領域
信号に対する第1の雑音の付加を、入力信号の性質に応
じて選択的に行なってもよい。これにより、例えば抑圧
係数の導出に用いられた統計モデルに従わない雑音を含
む信号が入力された場合だけ第1の雑音を付加し、抑圧
係数の補正を選択的に行うことができる。ここで、入力
信号の性質として、信号の定常性を用いてもよい。言う
なれば、信号の性質、例えば平均パワーやスペクトル形
状等が、時間と共にどの程度変化するかを基準として、
第1の雑音の付加を行ってもよい。信号の定常性として
は、入力信号の振幅がゼロとなるゼロ交叉の数を用いて
もよいし、このゼロ交差の数と相関を示す前記周波数領
域信号の高域電力を用いてもよい。
In this noise removing method, the first noise may be added to the frequency domain signal selectively depending on the nature of the input signal. Thereby, for example, the first noise can be added only when a signal including noise that does not follow the statistical model used for deriving the suppression coefficient is input, and the suppression coefficient can be selectively corrected. Here, the stationarity of the signal may be used as the property of the input signal. In other words, based on how much the characteristics of the signal, such as average power and spectral shape, change with time,
The first noise may be added. As the stationarity of the signal, the number of zero crossings at which the amplitude of the input signal becomes zero may be used, or the high frequency power of the frequency domain signal showing the correlation with the number of zero crossings may be used.

【0059】また、入力信号を変換した周波数領域信号
に基づいて周波数領域信号に含まれる第2の雑音を推定
し、この第2の雑音と周波数領域信号とを用いて第1の
雑音のパワーを定めるようにしてもよい。また、入力信
号を変換した周波数領域信号に基づいて周波数領域信号
に含まれる第2の雑音を推定し、この第2の雑音と周波
数領域信号とを用いて第1の雑音を計算し、この第1の
雑音と周波数領域信号との和、及び第1の雑音と第2の
雑音との和を用いて信号対雑音比を求めるようにしても
よい。ここで、入力信号を変換した周波数領域信号を重
みづけし、この重みづけした周波数領域信号に基づいて
第2の雑音を推定するようにしてもよい。
Further, the second noise included in the frequency domain signal is estimated based on the frequency domain signal obtained by converting the input signal, and the power of the first noise is calculated using the second noise and the frequency domain signal. You may decide. Also, the second noise included in the frequency domain signal is estimated based on the frequency domain signal obtained by converting the input signal, the first noise is calculated using the second noise and the frequency domain signal, and the first noise is calculated. The signal-to-noise ratio may be obtained using the sum of the first noise and the frequency domain signal and the sum of the first noise and the second noise. Here, the frequency domain signal obtained by converting the input signal may be weighted, and the second noise may be estimated based on the weighted frequency domain signal.

【0060】また、本発明のノイズ除去方法は、入力信
号を周波数領域信号に変換し、この周波数領域信号を用
いて信号対雑音比を求め、この信号対雑音比を周波数領
域信号に基づいて補正し、この補正した信号対雑音比に
基づいて抑圧係数を定め、この抑圧係数を用いて周波数
領域信号を重みづけし、この重みづけした周波数領域信
号を時間領域信号に変換することによって、入力信号か
らノイズを除去した出力信号を得ることを特徴とする。
Further, the noise removing method of the present invention converts an input signal into a frequency domain signal, obtains a signal to noise ratio using this frequency domain signal, and corrects this signal to noise ratio based on the frequency domain signal. Then, the suppression coefficient is determined based on the corrected signal-to-noise ratio, the frequency domain signal is weighted using this suppression coefficient, and the weighted frequency domain signal is converted into the time domain signal to obtain the input signal. It is characterized in that an output signal from which noise is removed is obtained.

【0061】このノイズ除去方法において、信号対雑音
比の補正を、入力信号の性質に応じて選択的に行なって
もよい。これにより、例えば抑圧係数の導出に用いられ
た統計モデルに従わない雑音を含む信号が入力された場
合だけ信号対雑音比を補正し、抑圧係数の補正を選択的
に行うことができる。ここで、入力信号の性質として、
信号の定常性を用いてもよい。言うなれば、信号の性
質、例えば平均パワーやスペクトル形状等が、時間と共
にどの程度変化するかを基準として、信号対雑音比の補
正を行ってもよい。信号の定常性としては、入力信号の
振幅がゼロとなるゼロ交叉の数を用いてもよいし、この
ゼロ交差の数と相関を示す前記周波数領域信号の高域電
力を用いてもよい。
In this noise elimination method, the signal-to-noise ratio may be corrected selectively depending on the nature of the input signal. As a result, the signal-to-noise ratio can be corrected and the suppression coefficient can be selectively corrected only when a signal including noise that does not follow the statistical model used for deriving the suppression coefficient is input. Here, as the nature of the input signal,
Signal stationarity may be used. In other words, the signal-to-noise ratio may be corrected based on how much the characteristics of the signal, such as the average power and the spectral shape, change with time. As the stationarity of the signal, the number of zero crossings at which the amplitude of the input signal becomes zero may be used, or the high frequency power of the frequency domain signal showing the correlation with the number of zero crossings may be used.

【0062】また、入力信号を変換した周波数領域信号
に基づいて周波数領域信号に含まれる雑音を推定し、こ
の雑音と周波数領域信号とを用いて信号対雑音比の補正
量を定めるようにしてもよい。また、入力信号を変換し
た周波数領域信号に基づいて周波数領域信号に含まれる
雑音を推定し、この雑音及び信号対雑音比を用いて加算
信号を求め、この加算信号と周波数領域信号との和、及
び加算信号と雑音との和を用いて信号対雑音比を再計算
することによって信号対雑音比の補正を行なうようにし
てもよい。ここで、入力信号を変換した周波数領域信号
を重みづけし、この重みづけした周波数領域信号に基づ
いて雑音を推定するようにしてもよい。
Further, the noise contained in the frequency domain signal is estimated based on the frequency domain signal obtained by converting the input signal, and the correction amount of the signal-to-noise ratio is determined using this noise and the frequency domain signal. Good. Further, the noise included in the frequency domain signal is estimated based on the frequency domain signal obtained by converting the input signal, the addition signal is obtained using this noise and the signal-to-noise ratio, and the sum of the addition signal and the frequency domain signal, Alternatively, the signal-to-noise ratio may be corrected by recalculating the signal-to-noise ratio using the sum of the added signal and noise. Here, the frequency domain signal obtained by converting the input signal may be weighted, and the noise may be estimated based on the weighted frequency domain signal.

【0063】また、上述したノイズ除去方法において、
周波数領域信号に基づいて抑圧係数を補正し、この補正
した抑圧係数を用いて周波数領域信号を重みづけするよ
うにしてもよい。これにより、信号対雑音比が低いとき
に抑圧不足により発生する残留雑音や、信号対雑音比が
高いときに過度の抑圧で発生する音声の歪みによる音質
劣化を防ぐことができる。また、上述したノイズ除去方
法において、周波数領域信号を変換した時間領域信号に
窓がけ処理を施してもよい。
Further, in the above-mentioned noise removing method,
The suppression coefficient may be corrected based on the frequency domain signal, and the frequency domain signal may be weighted using the corrected suppression coefficient. As a result, it is possible to prevent residual noise that occurs due to insufficient suppression when the signal-to-noise ratio is low, and to prevent sound quality deterioration due to audio distortion that occurs due to excessive suppression when the signal-to-noise ratio is high. In the noise removal method described above, windowing processing may be performed on the time domain signal obtained by converting the frequency domain signal.

【0064】また、本発明のノイズ除去方法は、入力信
号を周波数領域信号に変換し、この周波数領域信号に基
づいて周波数領域信号に含まれる第2の雑音を推定し、
その一方で周波数領域信号に基づいて擬似的な第1の雑
音を計算し、この第1の雑音を第2の雑音に付加した雑
音に対応した値を周波数領域信号から差し引いて周波数
領域の強調音声を求め、この強調音声を時間領域信号に
変換することによって、入力信号からノイズを除去した
出力信号を得ることを特徴とする。
Further, the noise removing method of the present invention transforms the input signal into a frequency domain signal, estimates the second noise contained in the frequency domain signal based on this frequency domain signal,
On the other hand, a pseudo first noise is calculated based on the frequency domain signal, and a value corresponding to the noise obtained by adding the first noise to the second noise is subtracted from the frequency domain signal to emphasize the frequency domain speech. Is obtained, and the emphasized speech is converted into a time domain signal to obtain an output signal in which noise is removed from the input signal.

【0065】このノイズ除去方法において、第2の雑音
に対する第1の雑音の付加を、入力信号の性質に応じて
選択的に行なってもよい。これにより、例えば抑圧係数
の導出に用いられた統計モデルに従わない雑音を含む信
号が入力された場合だけ第1の雑音を付加し、強調音声
の補正を選択的に行うことができる。ここで、入力信号
の性質として、信号の定常性を用いてもよい。言うなれ
ば、信号の性質、例えば平均パワーやスペクトル形状等
が、時間と共にどの程度変化するかを基準として、第1
の雑音の付加を行ってもよい。信号の定常性としては、
入力信号の振幅がゼロとなるゼロ交叉の数を用いてもよ
いし、このゼロ交差の数と相関を示す前記周波数領域信
号の高域電力を用いてもよい。
In this noise removing method, the first noise may be added to the second noise selectively according to the property of the input signal. Thereby, for example, the first noise can be added only when a signal including noise that does not follow the statistical model used for deriving the suppression coefficient is input, and the enhanced voice can be selectively corrected. Here, the stationarity of the signal may be used as the property of the input signal. In other words, based on how much the characteristics of the signal, such as the average power and the spectral shape, change with time, the first
Noise may be added. The stationarity of the signal is
The number of zero crossings at which the amplitude of the input signal is zero may be used, or the high frequency power of the frequency domain signal that correlates with the number of zero crossings may be used.

【0066】また、第1の雑音のパワーを、周波数領域
信号と第2の雑音とを用いて定めるようにしてもよい。
また、入力信号を変換した周波数領域信号を重みづけ
し、この重みづけした周波数領域信号に基づいて第2の
雑音を推定するようにしてもよい。ここで、入力信号を
変換した周波数領域信号を用いて信号対雑音比を求め、
この信号対雑音比を用いて重みを求め、この重みを用い
て周波数領域信号を重みづけするようにしてもよい。こ
れにより、周波数領域信号に含まれる音声成分の影響を
小さくし、第2の雑音の推定より高精度に行うことがで
きる。例えば、入力信号を変換した周波数領域信号を用
いて信号対雑音比を求め、この信号対雑音比を非線形処
理関数によって処理して重みを求め、この重みを用いて
周波数領域信号を重みづけするようにしてもよい。ま
た、上述したノイズ除去方法において、周波数領域の強
調音声を変換した時間領域信号に窓がけ処理を施しても
よい。
The power of the first noise may be determined using the frequency domain signal and the second noise.
Further, the frequency domain signal obtained by converting the input signal may be weighted, and the second noise may be estimated based on the weighted frequency domain signal. Here, the signal-to-noise ratio is obtained using the frequency domain signal obtained by converting the input signal,
Weights may be obtained by using the signal-to-noise ratio, and the frequency domain signals may be weighted by using the weights. As a result, the influence of the voice component included in the frequency domain signal can be reduced and the estimation of the second noise can be performed with higher accuracy. For example, the signal-to-noise ratio is obtained by using the frequency-domain signal obtained by converting the input signal, the signal-to-noise ratio is processed by the non-linear processing function to obtain the weight, and the frequency-domain signal is weighted by using the weight. You may In the noise removal method described above, windowing processing may be performed on the time domain signal obtained by converting the emphasized speech in the frequency domain.

【0067】また、本発明のノイズ除去方法は、周波数
領域の強調音声を変換した時間領域信号に窓がけ処理を
施すことを特徴とする。周波数領域の強調音声を変換し
た時間領域信号の隣接する2フレームを重ね合わせ加算
する場合に、重ね合わせ加算の対象となった信号サンプ
ルが各フレームにおいて異なった抑圧係数値で抑圧され
たとしても、各フレームを窓がけ処理してフレーム境界
における信号サンプルの振幅を小さくすることによっ
て、フレーム境界における信号サンプルの連続性を改善
することができる。
Further, the noise removing method of the present invention is characterized in that windowing processing is applied to the time domain signal obtained by converting the emphasized speech in the frequency domain. When two adjacent frames of the time domain signal obtained by converting the emphasized speech in the frequency domain are superposed and added, even if the signal sample to be superposed and added is suppressed by different suppression coefficient values in each frame, The continuity of the signal samples at the frame boundaries can be improved by windowing each frame to reduce the amplitude of the signal samples at the frame boundaries.

【0068】より具体的には、本発明のノイズ除去方法
は、入力信号を周波数領域信号に変換し、この周波数領
域信号を用いて信号対雑音比を求め、この信号対雑音比
に基づいて抑圧係数を定め、この抑圧係数を用いて周波
数領域信号を重みづけし、この重みづけした周波数領域
信号を時間領域信号に変換し、この時間領域信号に窓が
け処理を施すことを特徴とすことによって、入力信号か
らノイズを除去した出力信号を得ることを特徴とする。
More specifically, the noise removal method of the present invention converts an input signal into a frequency domain signal, obtains a signal to noise ratio using this frequency domain signal, and suppresses the signal based on this signal to noise ratio. By defining a coefficient, weighting the frequency domain signal using this suppression coefficient, converting the weighted frequency domain signal into a time domain signal, and applying a windowing process to this time domain signal. , The output signal is obtained by removing noise from the input signal.

【0069】また、本発明のノイズ除去方法は、入力信
号を周波数領域信号に変換し、この周波数領域信号に基
づいて周波数領域信号に含まれる第2の雑音を推定し、
この第2の雑音に対応した値を周波数領域信号から差し
引いて周波数領域の強調音声を求め、この強調音声を時
間領域信号に変換し、この時間領域信号に窓がけ処理を
施すことによって入力信号からノイズを除去した出力信
号を得ることを特徴とする。
Further, the noise removing method of the present invention transforms the input signal into a frequency domain signal, estimates the second noise contained in the frequency domain signal based on this frequency domain signal,
A value corresponding to the second noise is subtracted from the frequency domain signal to obtain an emphasized voice in the frequency domain, the emphasized voice is converted into a time domain signal, and the time domain signal is subjected to windowing processing to obtain the emphasized voice from the input signal. It is characterized in that an output signal from which noise is removed is obtained.

【0070】また、本発明のノイズ除去装置は、入力信
号に窓がけ処理を施して出力する第1の窓がけ処理部
と、この第1の窓がけ処理部により窓がけ処理された入
力信号を周波数領域信号に変換し,振幅成分と位相成分
に分離して出力する変換部と、周波数領域信号の振幅成
分に基づいて周波数領域信号に含まれる第2の雑音を推
定して出力する推定雑音計算部と、第2の雑音と周波数
領域信号の振幅成分を用いて擬似的な第1の雑音を計算
して出力する注入雑音計算部と、第1の雑音と周波数領
域信号の振幅成分を加算して出力する第1の加算器と、
第1の雑音と第2の雑音を加算して出力する第2の加算
器と、第1の加算器の出力信号と第2の加算器の出力信
号とを受けて第1の信号対雑音比を求めて出力する第1
の信号対雑音比計算部と、第1の信号対雑音比に基づい
て抑圧係数を定めて出力する抑圧係数生成部と、抑圧係
数を用いて周波数領域信号の振幅成分を重みづけして出
力する第1の乗算部と、この第1の乗算部により重みづ
けされた周波数領域信号の振幅成分と周波数領域信号の
位相成分を時間領域信号に変換して出力する逆変換部
と、時間領域信号に窓がけ処理を施して出力する第2の
窓がけ処理部とを少なくとも具備することを特徴とす
る。
Further, the noise removing apparatus of the present invention includes a first windowing processing section which performs windowing processing on an input signal and outputs the windowed signal, and an input signal which is windowed by the first windowing processing section. A conversion unit that converts to a frequency domain signal and separates and outputs an amplitude component and a phase component, and an estimated noise calculation that estimates and outputs the second noise included in the frequency domain signal based on the amplitude component of the frequency domain signal. Section, an injection noise calculation section for calculating and outputting pseudo first noise using the second noise and the amplitude component of the frequency domain signal, and adding the amplitude components of the first noise and the frequency domain signal. A first adder for outputting
A second adder for adding and outputting the first noise and the second noise, and a first signal-to-noise ratio for receiving the output signal of the first adder and the output signal of the second adder To output and output
Signal-to-noise ratio calculation unit, a suppression coefficient generation unit that determines and outputs a suppression coefficient based on the first signal-to-noise ratio, and outputs by weighting the amplitude component of the frequency domain signal using the suppression coefficient. A first multiplication unit; an inverse transformation unit that transforms the amplitude component of the frequency domain signal and the phase component of the frequency domain signal weighted by the first multiplication unit into a time domain signal and outputs the time domain signal; At least a second windowing processing unit that performs windowing processing and outputs is provided.

【0071】ここで、注入雑音計算部は、入力信号が入
力され,入力信号の振幅がゼロとなるゼロ交叉の数を計
算し,その計算結果に応じた制御信号を出力するゼロ交
叉計算部と、このゼロ交叉計算部から入力された制御信
号によって第1の雑音を選択的にゼロに設定するスイッ
チとを含む構成としてもよい。また、注入雑音計算部
は、変換部から入力された周波数領域信号の振幅成分の
高域電力を計算し,その計算結果に応じた制御信号を出
力する高域電力計算部と、この高域電力計算部から入力
された制御信号によって第1の雑音を選択的にゼロに設
定するスイッチとを含む構成としてもよい。
Here, the injection noise calculator calculates the number of zero crossings at which the input signal is input and the amplitude of the input signal is zero, and outputs a control signal according to the calculation result. , And a switch for selectively setting the first noise to zero by the control signal input from the zero crossing calculation unit. The injection noise calculation unit calculates the high frequency power of the amplitude component of the frequency domain signal input from the conversion unit, and outputs the control signal according to the calculation result, and the high frequency power calculation unit. A switch for selectively setting the first noise to zero according to a control signal input from the calculator may be included.

【0072】また、上述したノイズ除去装置は、周波数
領域信号の振幅成分を重みづけし,得られた重みつき振
幅成分を推定雑音計算部に出力し,推定雑音計算部に重
みつき振幅成分に基づいて第2の雑音を推定させる重み
つき劣化音声計算部を更に具備するものであってもよ
い。ここで、重みつき劣化音声計算部は、周波数領域信
号の振幅成分を用いて第2の信号対雑音比を計算して出
力する第2の信号対雑音比計算部と、この第2の信号対
雑音比計算部から入力された第2の信号対雑音比を非線
形関数によって処理して重みを求め出力する非線形処理
部と、この非線形処理部から入力された重みを用いて周
波数領域信号の振幅成分を重みづけし,推定雑音計算部
に出力する第2の乗算部とを含む構成としてもよい。
Further, the above-mentioned noise removing apparatus weights the amplitude component of the frequency domain signal, outputs the obtained weighted amplitude component to the estimated noise calculation unit, and the estimated noise calculation unit is based on the weighted amplitude component. It may further include a weighted deteriorated speech calculation unit that estimates the second noise. Here, the weighted deteriorated speech calculation unit calculates a second signal-to-noise ratio using the amplitude component of the frequency domain signal and outputs the second signal-to-noise ratio calculation unit, and the second signal-to-noise ratio calculation unit. A non-linear processing unit that processes the second signal-to-noise ratio input from the noise ratio calculation unit by a non-linear function to obtain and output weights, and an amplitude component of the frequency domain signal using the weights input from the non-linear processing unit. May be weighted and output to the estimated noise calculation section and a second multiplication section may be included.

【0073】また、上述したノイズ除去装置は、抑圧係
数生成部から入力された抑圧係数を,周波数領域信号に
基づいて補正して第1の乗算部に出力し,第1の乗算部
に補正した抑圧係数を用いて周波数領域信号の振幅成分
を重みづけさせる抑圧係数補正部を更に具備するもので
あってもよい。
Further, the above-described noise removing apparatus corrects the suppression coefficient input from the suppression coefficient generating section based on the frequency domain signal, outputs the correction coefficient to the first multiplying section, and corrects it to the first multiplying section. A suppression coefficient correction unit that weights the amplitude component of the frequency domain signal using the suppression coefficient may be further included.

【0074】また、本発明のノイズ除去装置は、入力信
号に窓がけ処理を施して出力する第1の窓がけ処理部
と、この第1の窓がけ処理部により窓がけ処理された入
力信号を周波数領域信号に変換し,振幅成分と位相成分
に分離して出力する変換部と、周波数領域信号の振幅成
分を用いて第1の信号対雑音比を求めて出力する第1の
信号対雑音比計算部と、周波数領域信号の振幅成分に基
づいて周波数領域信号に含まれる雑音を推定して出力す
る推定雑音計算部と、雑音と周波数領域信号の振幅成分
を用いて第1の信号対雑音比を補正し,補正信号対雑音
比として出力する信号対雑音比補正部と、補正信号対雑
音比に基づいて抑圧係数を定めて出力する抑圧係数生成
部と、抑圧係数を用いて周波数領域信号の振幅成分を重
みづけして出力する第1の乗算部と、この第1の乗算部
により重みづけされた周波数領域信号の振幅成分と周波
数領域信号の位相成分を時間領域信号に変換して出力す
る逆変換部と、時間領域信号に窓がけ処理を施す第2の
窓がけ処理部とを少なくとも具備することを特徴とす
る。
The noise removing apparatus of the present invention further includes a first windowing processing section for performing windowing processing on the input signal and outputting the input signal, and an input signal subjected to the windowing processing by the first windowing processing section. A conversion unit that converts the signal into a frequency domain signal and outputs the signal after separating it into an amplitude component and a phase component, and a first signal-to-noise ratio that calculates and outputs a first signal-to-noise ratio using the amplitude component of the frequency domain signal. A calculation unit, an estimation noise calculation unit that estimates and outputs noise included in the frequency domain signal based on the amplitude component of the frequency domain signal, and a first signal-to-noise ratio using the noise and the amplitude component of the frequency domain signal. A signal-to-noise ratio correction unit that corrects and outputs a corrected signal-to-noise ratio, a suppression coefficient generation unit that determines and outputs a suppression coefficient based on the corrected signal-to-noise ratio, and a frequency-domain signal Output weighted amplitude components 1 multiplication unit, an inverse transformation unit that transforms the amplitude component of the frequency domain signal and the phase component of the frequency domain signal weighted by the first multiplication unit into a time domain signal and outputs the time domain signal, and a window for the time domain signal It is characterized by comprising at least a second window cliff processing unit for carrying out cliff processing.

【0075】ここで、信号対雑音比補正部は、入力信号
が入力され,入力信号の振幅がゼロとなるゼロ交叉の数
を計算し,その計算結果に応じた制御信号を出力する判
定部と、この判定部から入力された制御信号によって補
正信号対雑音比を選択的に補正前の第1の信号対雑音比
と同じ値に設定するスイッチとを含む構成としてもよ
い。また、信号対雑音比補正部は、変換部から入力され
た周波数領域信号の振幅成分の高域電力を計算し,その
計算結果に応じた制御信号を出力する判定部と、この判
定部から入力された制御信号によって補正信号対雑音比
を選択的に補正前の第1の信号対雑音比と同じ値に設定
するスイッチとを含む構成としてもよい。
Here, the signal-to-noise ratio correction unit calculates the number of zero crossings at which the input signal is input and the amplitude of the input signal becomes zero, and outputs a control signal according to the calculation result. A switch for selectively setting the correction signal-to-noise ratio to the same value as the pre-correction first signal-to-noise ratio by the control signal input from the determination unit may be included. Further, the signal-to-noise ratio correction unit calculates the high frequency power of the amplitude component of the frequency domain signal input from the conversion unit and outputs a control signal according to the calculation result, and a determination unit input from this determination unit. A switch for selectively setting the correction signal-to-noise ratio to the same value as the first signal-to-noise ratio before correction by the generated control signal may be included.

【0076】また、上述したノイズ除去装置は、周波数
領域信号の振幅成分を重みづけし,得られた重みつき振
幅成分を推定雑音計算部に出力し,推定雑音計算部に重
みつき振幅成分に基づいて雑音を推定させる重みつき劣
化音声計算部を更に具備するものであってもよい。ここ
で、重みつき劣化音声計算部は、周波数領域信号の振幅
成分を用いて第2の信号対雑音比を計算して出力する第
2の信号対雑音比計算部と、この第2の信号対雑音比計
算部から入力された第2の信号対雑音比を非線形関数に
よって処理して重みを求め出力する非線形処理部と、こ
の非線形処理部から入力された重みを用いて周波数領域
信号の振幅成分を重みづけし,推定雑音計算部に出力す
る第2の乗算部とを含む構成としてもよい。
Further, the above-mentioned noise removing apparatus weights the amplitude component of the frequency domain signal, outputs the obtained weighted amplitude component to the estimated noise calculation unit, and the estimated noise calculation unit based on the weighted amplitude component. It may further include a weighted deteriorated speech calculation unit for estimating noise. Here, the weighted deteriorated speech calculation unit calculates a second signal-to-noise ratio using the amplitude component of the frequency domain signal and outputs the second signal-to-noise ratio calculation unit, and the second signal-to-noise ratio calculation unit. A non-linear processing unit that processes the second signal-to-noise ratio input from the noise ratio calculation unit by a non-linear function to obtain and output weights, and an amplitude component of the frequency domain signal using the weights input from the non-linear processing unit. May be weighted and output to the estimated noise calculation section and a second multiplication section may be included.

【0077】また、上述したノイズ除去装置は、抑圧係
数生成部から入力された抑圧係数を,周波数領域信号に
基づいて補正して第1の乗算部に出力し、第1の乗算部
に補正した抑圧係数を用いて周波数領域信号の振幅成分
を重みづけさせる抑圧係数補正部を更に具備するもので
あってもよい。
Further, the above-mentioned noise removing apparatus corrects the suppression coefficient input from the suppression coefficient generating section based on the frequency domain signal, outputs it to the first multiplying section, and corrects it to the first multiplying section. A suppression coefficient correction unit that weights the amplitude component of the frequency domain signal using the suppression coefficient may be further included.

【0078】[0078]

【発明の実施の形態】以下、図面を参照して、本発明の
実施の形態について詳細に説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described in detail below with reference to the drawings.

【0079】(第1の実施の形態)図1は、本発明のノ
イズ除去装置の第1の実施の形態の全体構成を示すブロ
ック図である。このノイズ除去装置と、図48に示した
従来のノイズ除去装置とは、窓がけ処理部22、注入雑
音計算部55、加算器56,57を除いて同一である。
この同一部分については同一符号を付している。以下、
上述の相違点を中心に詳細に説明する。
(First Embodiment) FIG. 1 is a block diagram showing the overall configuration of a first embodiment of a noise eliminator of the present invention. This noise removing device and the conventional noise removing device shown in FIG. 48 are the same except for the windowing processing unit 22, injection noise calculation unit 55, and adders 56 and 57.
The same parts are designated by the same reference numerals. Less than,
The difference will be mainly described in detail.

【0080】窓がけ処理部22は、逆フーリエ変換部9
から供給された時間領域サンプル値系列xn(t)バーに
窓関数h(t)を乗算し、積であるh(t)xn(t)バ
ーをフレーム合成部10に伝達する。フレーム合成部1
0は、h(t)xn(t)バーの隣接する2フレームから
K/2サンプルずつを取り出して重ね合わせ、式(1
4)によって、強調音声xn(t)ハット(t=0,
1,....,K/2−1)を得る。得られた強調音声x
n(t)ハットが、フレーム合成部10の出力として、出
力端子12に伝達される。
The windowing processing section 22 includes an inverse Fourier transform section 9
The time domain sample value series x n (t) bar supplied from the above is multiplied by the window function h (t), and the product h (t) x n (t) bar is transmitted to the frame synthesis unit 10. Frame synthesizer 1
For 0, K / 2 samples are taken out from two adjacent frames of the h (t) × n (t) bar and overlapped, and the expression (1
4), the emphasized speech x n (t) hat (t = 0,
, ..., K / 2-1). Obtained emphasized voice x
The n (t) hat is transmitted to the output terminal 12 as the output of the frame synthesis unit 10.

【0081】[0081]

【数14】 [Equation 14]

【0082】オーバラップが、50%ではなく、Mサン
プルで、フレーム長がLサンプル(M<L)の場合は、
式(15)によって、強調音声xn(t)ハットを得る。
これに合わせて、フレーム分割部も修正する。
If the overlap is not 50% but M samples and the frame length is L samples (M <L),
The emphasized speech x n (t) hat is obtained by the equation (15).
In accordance with this, the frame division unit is also modified.

【0083】[0083]

【数15】 [Equation 15]

【0084】すでに述べたように、実数信号に対して
は、左右対称窓関数が用いられる。また、窓関数は、抑
圧係数を1に設定したときの入力信号と出力信号が計算
誤差を除いて一致するように設計される。これらの条件
を満たすいかなる窓関数であっても、w(t)、h
(t)として使用することができる。その一例として、
ハニング窓を開平した関数(ルートハニング窓)を挙げ
ることができる。他にもこれらの条件を満たす窓関数は
存在するが、詳細は省略する。隣接する2フレームを構
成するxn-1(t)バーとxn(t)バーが各フレームにお
いて異なった抑圧係数値で抑圧されたとしても、x
n-1(t)バーとxn(t)バーのそれぞれに上述した窓関
数h(t)を乗算してフレーム境界におけるxn-1(t)
バーとxn(t)バーの振幅を小さくすることによって、
フレーム境界における連続性を改善し、雑音の発生を低
減することができる。よって、雑音による音質劣化を抑
制し、優れた音質の強調音声を得ることができる。
As described above, the symmetric window function is used for real signals. Further, the window function is designed so that the input signal and the output signal when the suppression coefficient is set to 1 match each other except for a calculation error. For any window function that satisfies these conditions, w (t), h
It can be used as (t). As an example,
A function (root Hanning window) obtained by square rooting the Hanning window can be mentioned. There are other window functions that satisfy these conditions, but the details are omitted. Even if the x n-1 (t) bar and the x n (t) bar that form two adjacent frames are suppressed with different suppression coefficient values in each frame, x x
Each of the n-1 (t) bar and the x n (t) bar is multiplied by the window function h (t) described above to obtain x n-1 (t) at the frame boundary.
By reducing the amplitude of the bar and x n (t) bar,
It is possible to improve continuity at frame boundaries and reduce noise generation. Therefore, it is possible to suppress the sound quality deterioration due to noise and obtain an emphasized sound with excellent sound quality.

【0085】注入雑音計算部55は、それぞれ多重乗算
部17及び推定雑音計算部51から供給された劣化音声
パワースペクトル及び推定雑音パワースペクトルを用い
て、注入すべき擬似的な雑音(第1の雑音)を計算し、
加算器56及び57に伝達する。加算器56は、推定雑
音計算部51から供給された推定雑音パワースペクトル
に注入雑音計算部55で得られた注入雑音を加算し、そ
の和を周波数別SNR計算部6に伝達する。加算器57
は、多重乗算部17から供給された劣化音声パワースペ
クトルに注入雑音計算部55で得られた注入雑音を加算
し、その和を周波数別SNR計算部6に伝達する。
The injection noise calculation unit 55 uses the deteriorated voice power spectrum and the estimated noise power spectrum supplied from the multiplex multiplication unit 17 and the estimated noise calculation unit 51, respectively, to generate pseudo noise (first noise). ),
It transmits to the adders 56 and 57. The adder 56 adds the injection noise obtained by the injection noise calculation unit 55 to the estimated noise power spectrum supplied from the estimation noise calculation unit 51, and transmits the sum to the frequency-specific SNR calculation unit 6. Adder 57
Adds the injection noise obtained by the injection noise calculation unit 55 to the degraded speech power spectrum supplied from the multiplex multiplication unit 17, and transmits the sum to the frequency-dependent SNR calculation unit 6.

【0086】図2は、注入雑音計算部55の構成を示す
ブロック図である。注入雑音計算部55は、SNR計算
部551、しきい値計算部552、注入レベル計算部5
53を有する。図1における多重乗算部17から供給さ
れた劣化音声パワースペクトルは、SNR計算部551
に伝達される。図1における推定雑音計算部51から供
給された推定雑音パワースペクトルは、SNR計算部5
51及びしきい値計算部552に伝達される。SNR計
算部551で得られたSNRとしきい値計算部552で
得られたしきい値は、注入レベル計算部553に供給さ
れる。注入レベル計算部553では、供給されたSNR
としきい値に応じて、注入すべき雑音レベルを計算し、
そのレベルに対応した信号を注入雑音として出力する。
FIG. 2 is a block diagram showing the configuration of the injection noise calculator 55. The injection noise calculator 55 includes an SNR calculator 551, a threshold calculator 552, and an injection level calculator 5.
With 53. The deteriorated voice power spectrum supplied from the multiplex multiplication unit 17 in FIG. 1 is the SNR calculation unit 551.
Be transmitted to. The estimated noise power spectrum supplied from the estimated noise calculation unit 51 in FIG.
51 and the threshold value calculation unit 552. The SNR obtained by the SNR calculator 551 and the threshold obtained by the threshold calculator 552 are supplied to the injection level calculator 553. The injection level calculation unit 553 supplies the supplied SNR.
And calculate the noise level to be injected according to the threshold,
The signal corresponding to that level is output as injection noise.

【0087】注入すべき雑音をWn(k)とすれば、W
n(k)はSNRが大きいほど小さい値をとるように設定
される。このようなSNRとWn(k)の関係として、S
NRが第1のしきい値TH1 よりも大きいときに第1の
値W1 をとり、SNRが第2のしきい値TH2 (<TH
1 )よりも小さいときに第2の値W2 (>W1 )をと
り、SNRが第1のしきい値TH1 と第2のしきい値T
2 の中間の値をとるときには、SNRに対応してW
n(k)が小さくなるような関数を考えることができる。
最も簡単な例は、図3に示すように、SNRが第1のし
きい値TH1 と第2のしきい値TH2 の中間の値をとる
ときには、第1の値W1 から第2の値W2 まで、直線的
に変化する関数である。
If the noise to be injected is W n (k), then W
n (k) is set to take a smaller value as the SNR increases. As a relation between such SNR and W n (k), S
When NR is larger than the first threshold TH 1 , it takes the first value W 1 , and SNR is the second threshold TH 2 (<TH
When it is smaller than 1 ), the second value W 2 (> W 1 ) is taken and the SNR is the first threshold TH 1 and the second threshold T.
When taking an intermediate value of H 2 , W corresponding to SNR
It is possible to consider a function such that n (k) becomes small.
The simplest example is, as shown in FIG. 3, when the SNR takes an intermediate value between the first threshold value TH 1 and the second threshold value TH 2 , the first value W 1 It is a function that changes linearly up to the value W 2 .

【0088】第1と第2のしきい値TH1 ,TH2 は独
立に決定することができるが、第2のしきい値TH2
第1のしきい値TH1 の定数倍に設定し、計算の簡略化
をはかることもできる。同様に、独立に決定することが
できるWn(k)の第1と第2の値W1 ,W2 も第2の値
2 を第1の値W1 の定数倍に設定することができる。
また、Wn(k)の第1と第2の値W1 ,W2 は、推定雑
音のレベルに対応して決定することができる。推定雑音
レベルが高い時はWn(k)の第1と第2の値W 1 ,W2
を小さくし、低い時は大きくする。このようにWn(k)
の第1と第2の値W1 ,W2 を設定することで、同じS
NRの値に対して、推定雑音レベルが高い時ほど容易に
小さなWn(k)が設定できる。この場合、注入レベル計
算部553に推定雑音パワースペクトルを供給する構成
とすることは、言うまでもない。
First and second threshold values TH1, TH2Is German
Can be determined as the second threshold TH2To
First threshold TH1Set to a constant multiple of to simplify the calculation
You can also measure. Similarly, independent decisions can be made
W that cannThe first and second values W of (k)1, W2Is also the second value
W2Is the first value W1It can be set to a constant multiple of.
Also, WnThe first and second values W of (k)1, W2Is an estimated miscellaneous
It can be determined according to the sound level. Estimated noise
W when the level is highnThe first and second values W of (k) 1, W2
Decrease, increase when low. Like this Wn(k)
The first and second values W of1, W2To set the same S
Easier when the estimated noise level is higher than the NR value
Small Wn(k) can be set. In this case, the injection level meter
Configuration for supplying the estimated noise power spectrum to the calculation unit 553
Needless to say,

【0089】さらに、しきい値TH1 ,TH2 も、推定
雑音のレベルに対応して決定することができる。推定雑
音レベルが高い時はしきい値TH1 ,TH2 を小さく
し、低い時は大きくする。このようにしきい値TH1
TH2 を設定することで、同じSNRの値に対して、推
定雑音レベルが高い時ほど容易に小さなWn(k)が設定
できる。推定雑音レベルが高い時ほどWn(k)を小さく
する理由は、推定雑音レベルが高い時には、従来の抑圧
係数がほぼ適切であり、雑音注入による抑圧係数の補正
量が小さいからである。この結果、本来の抑圧量が小さ
く、残留する雑音が知覚されやすいときに、中程度の振
幅を有した成分を相対的に大きく抑圧することができ、
主観音質の改善を達成することができる。
Further, the thresholds TH 1 and TH 2 can also be determined corresponding to the estimated noise level. The thresholds TH 1 and TH 2 are reduced when the estimated noise level is high, and increased when the estimated noise level is low. Thus, the threshold value TH 1 ,
By setting TH 2 , a smaller W n (k) can be easily set for the same SNR value when the estimated noise level is higher. The reason why W n (k) is made smaller as the estimated noise level is higher is that the conventional suppression coefficient is almost appropriate and the amount of correction of the suppression coefficient by noise injection is smaller when the estimated noise level is higher. As a result, when the original amount of suppression is small and the residual noise is likely to be perceived, it is possible to suppress the component having a medium amplitude relatively greatly.
An improvement in subjective sound quality can be achieved.

【0090】これまでの説明では、注入すべき雑音をW
n(k)としており、各周波数成分に対して異なった雑音
を注入する例について説明した。実際、注入雑音計算部
55に供給される劣化音声パワースペクトル及び推定雑
音パワースペクトルは、全周波数成分に対応した値が多
重化されている。従って、SNR計算部551で得られ
たSNRとしきい値計算部552で得られたしきい値の
数は、周波数成分の数に対応している。しかし、これら
のSNRとしきい値を、すべての周波数成分に対して共
通に設定しても良い。
In the above description, the noise to be injected is W
n (k), and an example of injecting different noises into each frequency component has been described. Actually, in the deteriorated voice power spectrum and the estimated noise power spectrum supplied to the injection noise calculation unit 55, values corresponding to all frequency components are multiplexed. Therefore, the SNR obtained by the SNR calculation unit 551 and the number of threshold values obtained by the threshold value calculation unit 552 correspond to the number of frequency components. However, these SNR and threshold value may be set in common for all frequency components.

【0091】一例として、劣化音声パワースペクトル及
び推定雑音パワースペクトルを、全周波数成分に対して
加算して総和をとり、それらの比を共通SNRとし、ま
た、推定雑音パワースペクトルの平均値を用いてしきい
値を求めることができる。その際には、SNR計算部5
51及びしきい値計算部552では、各周波数成分に対
応した値を分離してから個々の値を用いてSNRとしき
い値を計算する代わりに、前記総和と平均値を用いて、
全周波数成分に対して共通のSNRとしきい値を計算す
ることになる。これらの値が、周波数別SNR計算部6
に伝達される。
As an example, the deteriorated speech power spectrum and the estimated noise power spectrum are added to all frequency components and summed, the ratio thereof is set as a common SNR, and the average value of the estimated noise power spectrum is used. The threshold can be calculated. In that case, the SNR calculation unit 5
51 and the threshold calculation unit 552, instead of separating the values corresponding to the respective frequency components and then calculating the SNR and the threshold using the individual values, the sum and average values are used,
A common SNR and threshold will be calculated for all frequency components. These values are the frequency-dependent SNR calculation unit 6
Be transmitted to.

【0092】周波数別SNR計算部6では、式(11)
の代わりに、式(16)によって、周波数別SNRγ
n(k)を計算する。
In the frequency-dependent SNR calculation unit 6, equation (11)
Instead of
Calculate n (k).

【0093】[0093]

【数16】 [Equation 16]

【0094】式(16)を参照すると、SNR>0の領
域では、|Yn(k)|2 >λn(k)なので、雑音注入時
のSNRγn(k)は本来の値よりも小さくなるように修
正される。一方、文献1を参照すると、SNRに対する
抑圧係数の特性は、図4に示すように、SNRに対応し
て漸増した後、あるSNRの値において急増し、再び漸
増から飽和をたどる。このため、雑音注入によってγ
n(k)の値が小さくなると、上記抑圧係数値が急変する
近傍のSNRに対して、相対的に抑圧係数減少効果が大
きくなる。従って、そのようなSNRに対応した周波数
成分、具体的には中程度の振幅を有した成分が、相対的
に大きく抑圧されることになる。このため、音声よりは
振幅が小さいが無視できない程度の背景雑音の一部がよ
り強く抑圧され、強調音声において雑音として知覚され
にくくなる。よって、実際の背景雑音に対して、十分高
い品質の強調音声を得ることができる。
Referring to the equation (16), since | Y n (k) | 2 > λ n (k) in the region of SNR> 0, the SNR γ n (k) at the time of noise injection is smaller than the original value. Will be modified to On the other hand, referring to Reference 1, the characteristic of the suppression coefficient with respect to the SNR gradually increases corresponding to the SNR, then rapidly increases at a certain SNR value, and then gradually increases and reaches saturation again, as shown in FIG. Therefore, noise injection causes γ
As the value of n (k) becomes smaller, the effect of reducing the suppression coefficient becomes larger relative to the SNR in the vicinity where the suppression coefficient value suddenly changes. Therefore, a frequency component corresponding to such an SNR, specifically, a component having a medium amplitude is relatively suppressed. For this reason, a part of the background noise, which has a smaller amplitude than the voice but cannot be ignored, is more strongly suppressed, and is less likely to be perceived as noise in the emphasized voice. Therefore, it is possible to obtain emphasized speech of sufficiently high quality with respect to actual background noise.

【0095】(第2の実施の形態)図5は、本発明のノ
イズ除去装置の第2の実施の形態の全体構成を示すブロ
ック図である。このノイズ除去装置は、図1に示したノ
イズ除去装置が具備する注入雑音計算部55、加算器5
6,57の代わりに、SNR補正部65を具備するもの
である。以下、これらの相違点を中心に詳細に説明す
る。
(Second Embodiment) FIG. 5 is a block diagram showing the overall configuration of a second embodiment of the noise removing apparatus of the present invention. This noise removing device includes an injection noise calculating unit 55 and an adder 5 included in the noise removing device shown in FIG.
Instead of 6, 57, an SNR correction unit 65 is provided. Hereinafter, these differences will be mainly described in detail.

【0096】SNR補正部65には、多重乗算部17、
推定雑音計算部51、及び周波数別SNR計算部6か
ら、それぞれ劣化音声パワースペクトル、推定雑音パワ
ースペクトル、及び後天的SNRが供給されている。S
NR補正部65からは、補正後天的SNRが推定先天的
SNR計算部7及び雑音抑圧係数生成部8に供給され
る。すなわち、図1に示したノイズ除去装置では、雑音
を注入した劣化音声パワースペクトルと雑音を注入した
推定雑音パワースペクトルを用いて、後天的SNRを計
算していたのに対して、図5に示したノイズ除去装置で
は、劣化音声パワースペクトルと推定雑音パワースペク
トルを用いて計算した注入雑音を用いて、計算した後天
的SNRを補正する。
The SNR correction unit 65 includes a multiple multiplication unit 17,
The deteriorated speech power spectrum, the estimated noise power spectrum, and the acquired SNR are supplied from the estimated noise calculation unit 51 and the frequency-based SNR calculation unit 6, respectively. S
The corrected a priori SNR is supplied from the NR corrector 65 to the estimated a priori SNR calculator 7 and the noise suppression coefficient generator 8. That is, in the noise eliminator shown in FIG. 1, the acquired SNR is calculated using the deteriorated speech power spectrum into which noise is injected and the estimated noise power spectrum into which noise is injected, whereas in FIG. In the noise removing device, the calculated acquired SNR is corrected using the injection noise calculated using the deteriorated speech power spectrum and the estimated noise power spectrum.

【0097】図5におけるSNR補正部65について、
さらに説明する。図6は、SNR補正部65の一構成例
を示すブロック図である。SNR補正部65は、K個の
補正SNR計算部6540 〜654K-1 、分離部65
1、652、653、多重化部655を有する。分離部
651には、図5における周波数別SNR計算部6から
後天的SNRが供給される。分離部651は、供給され
た後天的SNRをK個の周波数別成分に分離し、それぞ
れ補正SNR計算部6540 〜654K-1 に伝達する。
分離部652には、図5における多重乗算部17から劣
化音声パワースペクトルが供給される。分離部652
は、供給された劣化音声パワースペクトルをK個の周波
数別成分に分離し、それぞれ補正SNR計算部6540
〜654K-1 に伝達する。分離部653には、図5にお
ける推定雑音計算部51から推定雑音パワースペクトル
が供給される。分離部653は、供給された推定雑音パ
ワースペクトルをK個の周波数別成分に分離し、それぞ
れ補正SNR計算部6540 〜654K-1 に伝達する。
補正SNR計算部6540 〜654K-1 は、供給された
劣化音声パワースペクトルと推定雑音パワースペクトル
に対応した補正を後天的SNRに加え、補正後天的SN
Rを多重化部655に伝達する。多重化部655は、供
給された補正後天的SNRを多重化して出力する。
Regarding the SNR correction unit 65 in FIG.
Further description will be made. FIG. 6 is a block diagram showing a configuration example of the SNR correction unit 65. The SNR correction unit 65 includes K correction SNR calculation units 654 0 to 654 K−1 and a separation unit 65.
1, 652, 653 and a multiplexing unit 655. The acquired SNR is supplied from the frequency-based SNR calculation unit 6 in FIG. 5 to the separation unit 651. The separation unit 651 separates the acquired acquired SNR into K frequency components, and transmits the K frequency components to the corrected SNR calculation units 654 0 to 654 K−1 .
The demultiplexing unit 652 is supplied with the degraded voice power spectrum from the multiplex multiplication unit 17 in FIG. Separation unit 652
Separates the supplied degraded speech power spectrum into K frequency components, and corrects the SNR calculation unit 654 0.
~ 654 K-1 . The estimated noise power spectrum is supplied from the estimated noise calculation unit 51 in FIG. 5 to the separation unit 653. The separation unit 653 separates the supplied estimated noise power spectrum into K frequency components, and transfers them to the corrected SNR calculation units 654 0 to 654 K-1 .
The corrected SNR calculation units 654 0 to 654 K-1 add the corrections corresponding to the supplied deteriorated speech power spectrum and estimated noise power spectrum to the acquired SNR and add the corrected acquired SN.
The R is transmitted to the multiplexing unit 655. The multiplexing unit 655 multiplexes and outputs the corrected post-correction SNR.

【0098】図7は、図6に示したSNR補正部65に
含まれる補正SNR計算部6540〜654K-1 の構成
を示すブロック図である。補正SNR計算部654は、
しきい値計算部6541、注入雑音計算部6542、加
算器6543,6544、除算部6545を有する。
FIG. 7 is a block diagram showing the configuration of the corrected SNR calculation units 654 0 to 654 K-1 included in the SNR correction unit 65 shown in FIG. The corrected SNR calculation unit 654
It has a threshold value calculation unit 6541, an injection noise calculation unit 6542, adders 6543 and 6544, and a division unit 6545.

【0099】しきい値計算部6541には、図6におけ
る分離部653から推定雑音パワースペクトルが供給さ
れており、図2におけるしきい値計算部552と同様の
動作によってしきい値を計算し、注入雑音計算部654
2に伝達する。注入雑音計算部6542には、図6にお
ける分離部651から後天的SNRも供給されており、
図2における注入レベル計算部553と同様の動作によ
って注入すべき擬似的な雑音(第1の雑音,加算信号)
を計算し、加算器6543及び6544に伝達する。加
算器6543には、図6における分離部653から推定
雑音パワースペクトルも供給されており、注入雑音計算
部6542から供給された雑音との加算結果を除算部6
545に伝達する。加算器6544には、図6における
分離部652から劣化音声パワースペクトルも供給され
ており、注入雑音計算部6542から供給された雑音と
の加算結果を除算部6545に伝達する。除算部654
5は、加算器6543の出力と加算器6544の出力か
ら求めた商を、補正後天的SNRとして出力する。
The estimated noise power spectrum is supplied from the separation unit 653 in FIG. 6 to the threshold value calculation unit 6541, and the threshold value is calculated by the same operation as the threshold value calculation unit 552 in FIG. Injection noise calculator 654
Communicate to 2. The injection noise calculation unit 6542 is also supplied with the acquired SNR from the separation unit 651 in FIG.
Pseudo noise (first noise, addition signal) to be injected by the same operation as the injection level calculation unit 553 in FIG.
Is calculated and transmitted to the adders 6543 and 6544. The estimated noise power spectrum is also supplied from the separation unit 653 in FIG. 6 to the adder 6543, and the addition result with the noise supplied from the injection noise calculation unit 6542 is divided by the division unit 6
To 545. The adder 6544 is also supplied with the degraded voice power spectrum from the separation unit 652 in FIG. 6, and transfers the addition result with the noise supplied from the injection noise calculation unit 6542 to the division unit 6545. Division unit 654
5 outputs the quotient obtained from the output of the adder 6543 and the output of the adder 6544 as the corrected SNR.

【0100】図8は、SNR補正部65の他の構成例を
示すブロック図である。この構成例では、SNRとしき
い値を、すべての周波数成分に対して共通に設定してい
る。このため、図6に示した構成例と比較すると、新た
に平均値計算部661,663、注入雑音計算部662
を有し、また補正SNR計算部6540 〜654K-1
置き換える形で補正SNR計算部6640 〜664K-1
を有している。
FIG. 8 is a block diagram showing another configuration example of the SNR correction unit 65. In this configuration example, the SNR and the threshold value are commonly set for all frequency components. Therefore, in comparison with the configuration example shown in FIG. 6, new average value calculation units 661 and 663 and injection noise calculation unit 662 are newly added.
Correcting SNR calculator 664 to have, also in the form of replacing a correction SNR calculator 654 0 ~654 K-1 0 ~664 K-1
have.

【0101】平均値計算部661は、分離部651から
供給された後天的SNRγn(k)のkに関する平均を求
め、注入雑音計算部662へ伝達する。従って、注入雑
音計算部662へ伝達される値は、一つとなる。一方、
平均値計算部663は、分離部653から供給された推
定雑音パワースペクトルλn(k)のkに関する平均を求
め、しきい値計算部6541へ伝達する。しきい値計算
部6541は、すでに説明した動作によってしきい値を
求め、注入雑音計算部662へ伝達する。注入雑音計算
部662は、図7における注入雑音計算部6542と同
じ手順で注入すべき擬似的な雑音(第1の雑音,加算信
号)を計算し、補正SNR計算部664 0 〜664K-1
へ伝達する。図6に示した構成例と異なり、補正SNR
計算部6640 〜664K-1 へ伝達される注入雑音は、
すべて同じ値である。
The average value calculation unit 661 is provided by the separation unit 651.
Acquired SNRγnFind the average of (k) for k
Therefore, it is transmitted to the injection noise calculation unit 662. Therefore, injection miscellaneous
The value transmitted to the sound calculation unit 662 becomes one. on the other hand,
The average value calculation unit 663 uses the estimation value supplied from the separation unit 653.
Constant noise power spectrum λnFind the average of (k) for k
Therefore, it is transmitted to the threshold calculation unit 6541. Threshold calculation
Part 6541 sets the threshold value by the operation already described.
Obtained and transmitted to the injection noise calculation unit 662. Injection noise calculation
The unit 662 is the same as the injection noise calculation unit 6542 in FIG.
Pseudo noise to be injected in the same procedure (first noise, summing signal
No.) and the corrected SNR calculation unit 664 0 ~ 664K-1 
Communicate to. Unlike the configuration example shown in FIG. 6, the corrected SNR
Calculation unit 6640 ~ 664K-1 The injection noise transmitted to
All have the same value.

【0102】図9は、図8に示したSNR補正部66に
含まれる補正SNR計算部6640〜664K-1 の構成
を示すブロック図である。補正SNR計算部664は、
注入雑音計算部662から供給された注入雑音を、推定
雑音パワースペクトル及び劣化音声パワースペクトルに
加算し、両者の商を求めてから、補正後天的SNRとし
て出力する。より具体的には、次のとおりである。すな
わち、注入雑音計算部662で計算された注入雑音は、
加算器6543及び6544に伝達される。加算器65
43には、図8における分離部653から推定雑音パワ
ースペクトルも供給されており、注入雑音計算部662
から供給された雑音との加算結果を除算部6545に伝
達する。加算器6544には、図8における分離部65
2から劣化音声パワースペクトルも供給されており、注
入雑音計算部6542から供給された雑音との加算結果
を除算部6545に伝達する。除算部6545は、加算
器6543の出力と加算器6544の出力から求めた商
を、補正後天的SNRとして出力する。
FIG. 9 is a block diagram showing the configuration of the corrected SNR calculation units 664 0 to 664 K-1 included in the SNR correction unit 66 shown in FIG. The corrected SNR calculation unit 664 is
The injection noise supplied from the injection noise calculation unit 662 is added to the estimated noise power spectrum and the deteriorated speech power spectrum, the quotient of the two is calculated, and the corrected noise SNR is output as the corrected SNR. More specifically, it is as follows. That is, the injection noise calculated by the injection noise calculation unit 662 is
It is transmitted to adders 6543 and 6544. Adder 65
The estimated noise power spectrum is also supplied to the 43 from the separating unit 653 in FIG.
The addition result with the noise supplied from is transmitted to the division unit 6545. The adder 6544 includes a separating unit 65 in FIG.
The degraded voice power spectrum is also supplied from No. 2, and the addition result with the noise supplied from the injection noise calculation unit 6542 is transmitted to the division unit 6545. The division unit 6545 outputs the quotient obtained from the output of the adder 6543 and the output of the adder 6544 as the corrected SNR.

【0103】図8,図9に示した構成例では、補正SN
R計算部6640 〜664K-1 に対して注入雑音計算部
662としきい値計算部6541を共通化することによ
って、補正SNR計算部6640 〜664K-1 のすべて
に注入雑音計算部としきい値計算部を設ける必要がなく
なるので、構成を簡素化することができる。
In the configuration example shown in FIGS. 8 and 9, the correction SN is
By sharing the injection noise calculation unit 662 and a threshold calculating unit 6541 for R calculation unit 664 0 ~664 K-1, and injected noise calculation unit to all the correction SNR calculator 664 0 ~664 K-1 Since it is not necessary to provide the threshold value calculation unit, the configuration can be simplified.

【0104】以上のようにしてSNR補正部65,66
で後天的SNRを補正し、その結果得られた補正後後天
的SNRを用いて抑圧係数を定めることによって、図1
に示したノイズ除去装置と同様に、実際の背景雑音に対
して十分高い品質の強調音声を得ることができる。
As described above, the SNR correction units 65 and 66
1 is used to correct the acquired SNR, and the suppression coefficient is determined using the corrected acquired acquired SNR.
Similar to the noise eliminator shown in, it is possible to obtain emphasized speech of sufficiently high quality against actual background noise.

【0105】(第3の実施の形態)図10は、本発明の
ノイズ除去装置の第3の実施の形態の全体構成を示すブ
ロック図である。このノイズ除去装置は、図1に示した
ノイズ除去装置において、注入雑音計算部55を注入雑
音計算部58で置換した構成になっている。以下、この
相違点を中心に詳細に説明する。図10に示すノイズ除
去装置では、入力信号の性質に応じて、選択的に雑音注
入を適用する。このため、入力信号の性質を評価するた
めに、フレーム分割部1の出力である時間領域の劣化音
声信号が、注入雑音計算部58に供給されている。
(Third Embodiment) FIG. 10 is a block diagram showing the overall configuration of a third embodiment of the noise eliminator of the present invention. This noise removing device has a configuration in which the injection noise calculating unit 55 is replaced with an injection noise calculating unit 58 in the noise removing device shown in FIG. Hereinafter, this difference will be mainly described in detail. The noise eliminator shown in FIG. 10 selectively applies noise injection according to the nature of the input signal. Therefore, in order to evaluate the characteristics of the input signal, the time-domain degraded speech signal output from the frame division unit 1 is supplied to the injection noise calculation unit 58.

【0106】図11は、図10における注入雑音計算部
58の構成を示すブロック図である。図2に示した注入
雑音計算部55とは、ゼロ交叉計算部581とスイッチ
582をさらに具備する点が異なっている。フレーム分
割部1の出力である時間領域の劣化音声信号は、ゼロ交
叉計算部581に供給されている。ゼロ交叉計算部58
1には、SNR計算部551からSNRが、しきい値計
算部552からしきい値が、それぞれ供給されている。
ゼロ交叉計算部581では、供給された劣化音声信号の
振幅がゼロとなるゼロ交叉を計数する。同時に、SNR
としきい値から、SNRが前記第2のしきい値TH2
り小さいか否かを評価する。SNRが前記第2のしきい
値TH2 より小さいときだけ、前記ゼロ交叉の数を過去
の数フレームに渡って平均化する。すなわち、劣化音声
が無音と判定したときだけ、平均値を求める。このよう
にして得られた平均値を第3のしきい値と比較し、平均
値の方が大きいときに“1”を、それ以外の場合は
“0”を、制御信号としてスイッチ582に伝達する。
第3のしきい値は、予め定めておくこともできるし、動
作途中で変更することもできる。
FIG. 11 is a block diagram showing the structure of the injection noise calculation unit 58 in FIG. The injection noise calculation unit 55 shown in FIG. 2 is different in that a zero crossing calculation unit 581 and a switch 582 are further provided. The time domain deteriorated speech signal output from the frame division unit 1 is supplied to the zero crossing calculation unit 581. Zero crossing calculator 58
1, the SNR is supplied from the SNR calculation unit 551 and the threshold value is supplied from the threshold value calculation unit 552.
The zero crossing calculator 581 counts zero crossings at which the amplitude of the supplied deteriorated voice signal becomes zero. At the same time, SNR
Then, it is evaluated whether or not the SNR is smaller than the second threshold value TH 2 from the threshold value. Only when the SNR is less than the second threshold TH 2 , the number of zero crossings is averaged over the past several frames. That is, the average value is obtained only when it is determined that the deteriorated voice is silent. The average value thus obtained is compared with the third threshold value, and when the average value is larger, "1" is transmitted, and otherwise "0" is transmitted to the switch 582 as a control signal. To do.
The third threshold value can be set in advance or can be changed during the operation.

【0107】スイッチ582には、注入レベル計算部5
53からは注入雑音が、0と共に供給されている。スイ
ッチ582は、ゼロ交叉計算部581から制御信号とし
て“1”が供給されたときは注入レベル計算部553か
ら供給された注入雑音を、“0”が供給されたときは0
を選択し、注入雑音として出力する。従って、ゼロ交叉
の数の平均値が第3のしきい値より大きい場合のみに、
注入レベル計算部553からの注入雑音が、図10にお
ける加算器56,57に供給されることになる。ゼロ交
叉の数は、非定常な信号ほど多くなることが知られてい
るので、非定常性が一定以上の信号に対してだけ、雑音
注入を実行し、抑圧係数の補正を行うことができる。
The switch 582 has an injection level calculation unit 5
Injection noise is supplied together with 0 from 53. The switch 582 supplies the injection noise supplied from the injection level calculation unit 553 when “1” is supplied as the control signal from the zero crossing calculation unit 581 and 0 when “0” is supplied.
Is selected and output as injection noise. Therefore, only if the average number of zero crossings is greater than the third threshold,
The injection noise from the injection level calculator 553 is supplied to the adders 56 and 57 in FIG. It is known that the number of zero crossings increases in a non-stationary signal. Therefore, it is possible to perform noise injection and correct the suppression coefficient only for a signal whose non-stationarity is a certain value or more.

【0108】(第4の実施の形態)図12は、本発明の
ノイズ除去装置の第4の実施の形態の全体構成を示すブ
ロック図である。このノイズ除去装置は、図10に示し
たノイズ除去装置において、注入雑音計算部58を注入
雑音計算部59で置換した構成になっている。以下、こ
の相違点を中心に詳細に説明する。
(Fourth Embodiment) FIG. 12 is a block diagram showing the overall structure of a fourth embodiment of the noise eliminator of the present invention. This noise removing device has a configuration in which the injection noise calculating unit 58 in the noise removing device shown in FIG. 10 is replaced with an injection noise calculating unit 59. Hereinafter, this difference will be mainly described in detail.

【0109】図12に示すノイズ除去装置では、入力信
号の性質に応じて選択的に雑音注入を適用する点で、図
10に示したノイズ除去装置と同じである。しかし、フ
レーム分割部1の出力である時間領域の劣化音声信号
が、注入雑音計算部59に供給されていない。その理由
は、図10に示したノイズ除去装置とは異なり、入力信
号の性質を評価するために、時間領域の劣化音声信号を
用いないためである。その代わりに、劣化音声パワース
ペクトルを用いる。図10に示したノイズ除去装置で
は、フレーム当たりのゼロ交叉の数を用いて信号の非定
常性を評価していたが、ゼロ交叉の数と高周波領域(高
域)におけるパワースペクトルには相関があることが知
られているので、ゼロ交叉の数に代えて劣化音声パワー
スペクトルを用いることができる。
The noise eliminator shown in FIG. 12 is the same as the noise eliminator shown in FIG. 10 in that noise injection is selectively applied according to the characteristics of the input signal. However, the degraded speech signal in the time domain, which is the output of the frame division unit 1, is not supplied to the injection noise calculation unit 59. The reason is that, unlike the noise removing apparatus shown in FIG. 10, the deteriorated speech signal in the time domain is not used in order to evaluate the property of the input signal. Instead, the degraded speech power spectrum is used. In the noise eliminator shown in FIG. 10, the non-stationarity of the signal is evaluated using the number of zero crossings per frame, but the number of zero crossings and the power spectrum in the high frequency region (high range) have no correlation. As is known, the degraded speech power spectrum can be used instead of the number of zero crossings.

【0110】図13は、図12における注入雑音計算部
59の構成を示すブロック図である。図11に示した注
入雑音計算部58との違いは、ゼロ交叉計算部581が
高域電力計算部591に置換されていることである。高
域電力計算部591には、SNR計算部551と共に、
劣化音声パワースペクトルが供給されている。高域電力
計算部591は、劣化音声パワースペクトル|Yn(k)
2 のうち、kが基準値kTHよりも大きいものの総和を
とる。基準値kTHは、総和をとることによって、上述し
た劣化音声信号のゼロ交叉の数に対応する高域電力が得
られるように、劣化音声信号その他の条件に応じて設定
される。この結果、前記ゼロ交叉の数に対応する高域電
力が得られるので、この高域電力を第4のしきい値と比
較した結果を用いて、図11に示した注入雑音計算部5
8と同様にスイッチ582を制御することができる。す
なわち、高域電力の値によって、注入レベル計算部55
3から供給された注入雑音と0を選択し、注入雑音とし
て出力する。
FIG. 13 is a block diagram showing the structure of the injection noise calculator 59 shown in FIG. The difference from the injection noise calculation unit 58 shown in FIG. 11 is that the zero crossing calculation unit 581 is replaced with a high frequency power calculation unit 591. The high frequency power calculation unit 591, together with the SNR calculation unit 551,
Degraded voice power spectrum is provided. The high frequency power calculation unit 591 uses the deteriorated voice power spectrum | Y n (k)
Of 2 |, those for which k is greater than the reference value k TH are summed. The reference value k TH is set according to the deteriorated sound signal and other conditions so that the high frequency power corresponding to the number of zero crossings of the deteriorated sound signal described above can be obtained by taking the sum. As a result, a high frequency power corresponding to the number of zero crossings is obtained, and therefore the injection noise calculation unit 5 shown in FIG.
The switch 582 can be controlled in the same manner as 8 above. That is, the injection level calculation unit 55 is determined by the value of the high frequency power.
The injection noise supplied from 3 and 0 are selected and output as injection noise.

【0111】なお、劣化音声パワースペクトル|Y
n(k)|2 のうち、kが基準値kTHよりも大きいものを
重みづけして総和をとり、高域電力を求めるようにして
もよい。また、第4のしきい値は、予め定めておくこと
もできるし、動作途中で変更することもできる。
Note that the degraded voice power spectrum | Y
Of n (k) | 2, the one in which k is larger than the reference value k TH may be weighted and summed to obtain the high frequency power. Further, the fourth threshold value can be set in advance or can be changed during the operation.

【0112】(第5の実施の形態)図14は、本発明の
ノイズ除去装置の第5の実施の形態の全体構成を示すブ
ロック図である。このノイズ除去装置は、図5に示した
ノイズ除去装置において、SNR補正部65をSNR補
正部67で置換した構成になっている。以下、この相違
点を中心に詳細に説明する。図14に示すノイズ除去装
置では、図10に示したノイズ除去装置と同様に、入力
信号の性質に応じて、選択的に雑音注入を適用する。こ
のため、入力信号の性質を評価するために、フレーム分
割部1の出力である時間領域の劣化音声信号が、SNR
補正部67に供給されている。
(Fifth Embodiment) FIG. 14 is a block diagram showing the overall configuration of a fifth embodiment of the noise removing apparatus of the present invention. This noise removing device has a configuration in which the SNR correcting unit 65 is replaced with an SNR correcting unit 67 in the noise removing device shown in FIG. Hereinafter, this difference will be mainly described in detail. The noise eliminator shown in FIG. 14 selectively applies noise injection according to the nature of the input signal, as in the noise eliminator shown in FIG. Therefore, in order to evaluate the property of the input signal, the degraded speech signal in the time domain, which is the output of the frame division unit 1, is
It is supplied to the correction unit 67.

【0113】図15は、図14におけるSNR補正部6
7の構成例を示すブロック図である。図8に示したSN
R補正部65の構成例とは、注入雑音計算部662が注
入雑音計算部672に置換されている点において異な
る。注入雑音計算部662とは異なり、注入雑音計算部
672には、入力信号の性質を評価するために、フレー
ム分割部1の出力である時間領域の劣化音声信号が供給
されている。
FIG. 15 shows the SNR correction unit 6 in FIG.
7 is a block diagram showing a configuration example of 7. SN shown in FIG.
The difference from the configuration example of the R correction unit 65 is that the injection noise calculation unit 662 is replaced with the injection noise calculation unit 672. Unlike the injection noise calculation unit 662, the injection noise calculation unit 672 is supplied with the time domain deteriorated speech signal output from the frame division unit 1 in order to evaluate the property of the input signal.

【0114】図16は、注入雑音計算部672の構成例
を示すブロック図である。注入雑音計算部672は、注
入レベル計算部6721、スイッチ6722、判定部6
723を有する。注入レベル計算部6721と判定部6
723には、図15における平均値計算部661から後
天的SNRが、また図15におけるしきい値計算部65
41からしきい値が、供給されている。判定部6723
にはさらに、劣化音声信号が供給されている。注入レベ
ル計算部6721は、図2における注入レベル計算部5
53と同様の動作により、注入レベルを求め、スイッチ
6722に伝達する。判定部6723は、前記劣化音声
信号、前記後天的SNR、前記しきい値を受け、入力信
号の性質に応じた、スイッチ6722の制御信号を発生
する。
FIG. 16 is a block diagram showing a configuration example of the injection noise calculation unit 672. The injection noise calculation unit 672 includes an injection level calculation unit 6721, a switch 6722, and a determination unit 6.
723. Injection level calculation unit 6721 and determination unit 6
In 723, the acquired SNR from the average value calculation unit 661 in FIG. 15 and the threshold value calculation unit 65 in FIG.
The threshold value is supplied from 41. Judgment unit 6723
Is further supplied with a degraded audio signal. The injection level calculation unit 6721 is the injection level calculation unit 5 in FIG.
By the same operation as 53, the injection level is obtained and transmitted to the switch 6722. The determination unit 6723 receives the deteriorated voice signal, the acquired SNR, and the threshold value, and generates a control signal for the switch 6722 according to the property of the input signal.

【0115】ここで、判定部6723は、さらに、無音
区間検出部67231、ゼロ交叉計算部67232、比
較部67233から構成される。無音区間検出部672
31は、前記後天的SNRと前記しきい値を受け、SN
Rが前記第2のしきい値TH 2 より小さいときに“1”
を、それ以外の場合は“0”を、ゼロ交叉計算部672
32に伝達する。すなわち、劣化音声が無音と判定され
ると“1”を、それ以外の場合は“0”をゼロ交叉計算
部67232に伝達することになる。ゼロ交叉計算部6
7232は、供給された劣化音声信号の振幅がゼロとな
るゼロ交叉を計数し、無音区間検出部67231から
“1”を受けたときだけ、前記ゼロ交叉の数を過去の数
フレームに渡って平均化する。このようにして得られた
平均値は、比較部67233に伝達される。比較部67
233は、供給された前記ゼロ交叉の平均値を前記第3
のしきい値と比較し、平均値の方が大きいときに“1”
を、それ以外の場合は“0”を、制御信号としてスイッ
チ6722に伝達する。
Here, the determination unit 6723 further determines that there is no sound.
Section detection unit 67231, zero crossing calculation unit 67232, ratio
It is composed of a comparison unit 67233. Silent section detection unit 672
31 receives the acquired SNR and the threshold, and
R is the second threshold TH 2"1" when smaller
Otherwise, "0" otherwise, the zero crossing calculation unit 672
32. That is, the degraded voice is determined to be silent.
Then, "1" is calculated, otherwise "0" is calculated as zero crossing
It will be transmitted to the part 67232. Zero crossing calculator 6
7232, the amplitude of the supplied degraded audio signal is zero.
Counting zero crossings from the silent interval detection unit 67231
Only when "1" is received, the number of zero crossings is the past number.
Average over frames. Thus obtained
The average value is transmitted to the comparison unit 67233. Comparison unit 67
233, the average value of the zero crossings supplied is the third value.
"1" when the average value is larger than the threshold value of
, Otherwise switch to “0” as the control signal.
C 6722.

【0116】スイッチ6722は、判定部6723の比
較部67233から“1”が供給されたときは注入レベ
ル計算部6721から供給された注入雑音を、“0”が
供給されたときは0を選択し、注入雑音として出力す
る。すなわち、スイッチ6722の動作は図11におけ
るスイッチ582の動作に等しく、非定常性が一定以上
の信号に対してだけ、雑音注入を実行し、抑圧係数の補
正を行うことができる。
The switch 6722 selects the injection noise supplied from the injection level calculation unit 6721 when "1" is supplied from the comparison unit 67233 of the determination unit 6723, and selects 0 when "0" is supplied. , Output as injection noise. That is, the operation of the switch 6722 is the same as the operation of the switch 582 in FIG. 11, and the noise injection can be executed and the suppression coefficient can be corrected only for the signal whose non-stationarity is constant or more.

【0117】(第6の実施の形態)図17は、本発明の
ノイズ除去装置の第6の実施の形態の全体構成を示すブ
ロック図である。このノイズ除去装置は、図14に示し
たノイズ除去装置において、SNR補正部67をSNR
補正部68で置換した構成になっている。以下、この相
違点を中心に詳細に説明する。
(Sixth Embodiment) FIG. 17 is a block diagram showing the overall structure of a sixth embodiment of the noise eliminator of the present invention. This noise removing apparatus is the same as the noise removing apparatus shown in FIG.
The configuration is replaced by the correction unit 68. Hereinafter, this difference will be mainly described in detail.

【0118】図17に示すノイズ除去装置では、入力信
号の性質に応じて、選択的に雑音注入を適用する。その
際、図14に示したノイズ除去装置とは異なり、時間領
域の劣化音声信号の代わりに劣化音声パワースペクトル
を用いて、入力信号の性質を評価する。すなわち、フレ
ーム当たりのゼロ交叉数で信号の非定常性を評価してい
た第5の実施の形態と異なり、高周波領域(高域)にお
ける劣化音声パワースペクトルを用いて信号の非定常性
を評価する。このため、フレーム分割部1の出力である
時間領域の劣化音声信号が、SNR補正部68に供給さ
れていない。図18は、図17におけるSNR補正部6
8の構成例を示すブロック図である。図15に示したS
NR補正部67との違いは、注入雑音計算部672が注
入雑音計算部682に置換されていることである。
In the noise eliminator shown in FIG. 17, noise injection is selectively applied according to the property of the input signal. At that time, unlike the noise eliminator shown in FIG. 14, the quality of the input signal is evaluated by using the degraded voice power spectrum instead of the degraded voice signal in the time domain. That is, unlike the fifth embodiment in which the non-stationarity of a signal is evaluated by the number of zero crossings per frame, the non-stationarity of a signal is evaluated using a deteriorated voice power spectrum in a high frequency region (high range). . For this reason, the time domain degraded audio signal output from the frame division unit 1 is not supplied to the SNR correction unit 68. FIG. 18 shows the SNR correction unit 6 in FIG.
8 is a block diagram showing a configuration example of No. 8. S shown in FIG.
The difference from the NR correction unit 67 is that the injection noise calculation unit 672 is replaced with the injection noise calculation unit 682.

【0119】図19は、注入雑音計算部682の構成例
を示すブロック図である。図16に示した注入雑音計算
部672との違いは、ゼロ交叉計算部67232が高域
電力計算部68232に置換されていることである。高
域電力計算部68232には、無音区間計算部6723
1の出力信号と共に、劣化音声パワースペクトルが供給
されている。高域電力計算部68232は、図13にお
ける高域電力計算部591と同様の動作によって、劣化
音声パワースペクトル|Yn(k)|2 のうち、kが基準
値kTHよりも大きいものの総和をとって、高域電力を求
める。この高域電力は、比較部67233に伝達され
る。比較部67233は、この高域電力を前記第4のし
きい値と比較した結果を用いて、スイッチ6722の制
御信号を発生する。すなわち、高域電力の値によって、
注入レベル計算部6721から供給された注入雑音と0
を選択し、注入雑音として出力する。
FIG. 19 is a block diagram showing a configuration example of the injection noise calculation unit 682. The difference from the injection noise calculation unit 672 shown in FIG. 16 is that the zero crossing calculation unit 67232 is replaced with a high frequency power calculation unit 68232. The high frequency power calculator 68232 includes a silent section calculator 6723.
A degraded audio power spectrum is provided along with the 1 output signal. The high frequency power calculation unit 68232 performs the same operation as the high frequency power calculation unit 591 in FIG. 13 to calculate the sum of the deteriorated voice power spectrum | Y n (k) | 2 whose k is larger than the reference value k TH. And obtain the high frequency power. This high frequency power is transmitted to the comparison unit 67233. The comparing unit 67233 generates a control signal for the switch 6722 using the result of comparing the high frequency power with the fourth threshold value. That is, depending on the value of high frequency power,
The injection noise supplied from the injection level calculator 6721 and 0
Is selected and output as injection noise.

【0120】(第7の実施の形態)図20は、本発明の
ノイズ除去装置の第7の実施の形態の全体構成を示すブ
ロック図である。このノイズ除去装置と図1に示したノ
イズ除去装置とは、推定雑音計算部5、重みつき劣化音
声計算部14及び抑圧係数補正部15を除いて同一であ
る。図20に示すノイズ除去装置の構成は、窓がけ処理
部22及び注入雑音計算部58を除けば、「2000年
4月、電子情報通信学会技術研究報告、DSP、53〜
60ページ」(文献5)に開示されたものに等しい。文
献5に開示された方法は、文献1に開示された従来の方
法とは異なり、重みつき劣化音声スペクトルを用いて、
雑音のパワースペクトルを推定することによって、正確
な推定雑音を得ることができる。以下、これらの相違点
を中心に詳細に説明する。
(Seventh Embodiment) FIG. 20 is a block diagram showing the overall configuration of a seventh embodiment of the noise eliminator of the present invention. The noise removing apparatus and the noise removing apparatus shown in FIG. 1 are the same except for the estimated noise calculation unit 5, the weighted deteriorated speech calculation unit 14, and the suppression coefficient correction unit 15. The configuration of the noise eliminator shown in FIG. 20 is, except for the windowing processor 22 and the injection noise calculator 58, “April 2000, IEICE Technical Research Report, DSP, 53-”.
Page 60 ”(reference 5). Unlike the conventional method disclosed in Literature 1, the method disclosed in Literature 5 uses a weighted degraded speech spectrum to
By estimating the power spectrum of noise, an accurate estimated noise can be obtained. Hereinafter, these differences will be mainly described in detail.

【0121】まず、図20における重みつき劣化音声計
算部14について説明する。図21は、重みつき劣化音
声計算部14の構成を示すブロック図である。重みつき
劣化音声計算部14は、推定雑音記憶部1401、周波
数別SNR計算部1402、多重非線形処理部140
5、及び多重乗算部1404を有する。推定雑音記憶部
1401は、図20における推定雑音計算部5から供給
される推定雑音パワースペクトルを記憶し、1フレーム
前に記憶された推定雑音パワースペクトルを周波数別S
NR計算部1402へ出力する。周波数別SNR計算部
1402は、推定雑音記憶部1401から供給される推
定雑音パワースペクトルと、図20における多重乗算部
17から供給される劣化音声パワースペクトルを用い
て、SNRを各周波数毎に求め、多重非線形処理部14
05に出力する。多重非線形処理部1405は、周波数
別SNR計算部1402から供給されるSNRを用いて
重み係数ベクトルを計算し、重み係数ベクトルを多重乗
算部1404に出力する。多重乗算部1404は、図2
0における多重乗算部17から供給される劣化音声パワ
ースペクトルと、多重非線形処理部1405から供給さ
れる重み係数ベクトルの積を周波数毎に計算し、重みつ
き劣化音声パワースペクトルを図20における推定雑音
計算部5に出力する。
First, the weighted deteriorated speech calculation unit 14 in FIG. 20 will be described. FIG. 21 is a block diagram showing the configuration of the weighted deteriorated speech calculation unit 14. The weighted deteriorated speech calculation unit 14 includes an estimated noise storage unit 1401, a frequency-based SNR calculation unit 1402, and a multiple nonlinear processing unit 140.
5, and multiplex multiplication section 1404. The estimated noise storage unit 1401 stores the estimated noise power spectrum supplied from the estimated noise calculation unit 5 in FIG. 20, and calculates the estimated noise power spectrum stored one frame before by S for each frequency.
Output to the NR calculation unit 1402. The frequency-based SNR calculation unit 1402 obtains an SNR for each frequency using the estimated noise power spectrum supplied from the estimated noise storage unit 1401 and the deteriorated voice power spectrum supplied from the multiplex multiplication unit 17 in FIG. Multiple Nonlinear Processing Unit 14
Output to 05. The multiplex nonlinear processing unit 1405 calculates a weighting coefficient vector using the SNR supplied from the frequency-based SNR calculating unit 1402, and outputs the weighting coefficient vector to the multiplex multiplication unit 1404. The multiplying unit 1404 is shown in FIG.
20 calculates the product of the deteriorated voice power spectrum supplied from the multiplex multiplication unit 17 and the weighting coefficient vector supplied from the multiplex nonlinear processing unit 1405 for each frequency, and calculates the weighted deteriorated voice power spectrum in FIG. Output to the unit 5.

【0122】周波数別SNR計算部1402の構成は、
既に図56を用いて説明した周波数別SNR計算部6に
等しいので、詳細な説明は省略する。また、多重乗算部
1404の構成は、既に図52を用いて説明した多重乗
算部17に等しいので、詳細な説明は省略する。よって
次に、図21における多重非線形処理部1405の構成
と動作について詳しく説明する。
The configuration of the frequency-dependent SNR calculation section 1402 is as follows.
Since it is the same as the frequency-based SNR calculation unit 6 already described with reference to FIG. 56, detailed description thereof will be omitted. Further, since the configuration of the multiplex multiplication unit 1404 is the same as that of the multiplex multiplication unit 17 already described with reference to FIG. 52, detailed description thereof will be omitted. Therefore, next, the configuration and operation of the multiple nonlinear processing unit 1405 in FIG. 21 will be described in detail.

【0123】図22は、重みつき劣化音声計算部14に
含まれる多重非線形処理部1405の構成を示すブロッ
ク図である。多重非線形処理部1405は、分離部14
95、K個の非線形処理部14850 〜1485K-1
及び多重化部1475を有する。分離部1495は、図
21における周波数別SNR計算部1402から供給さ
れるSNRを周波数別のSNRに分離し、非線形処理部
14850 〜1485K- 1 に出力する。非線形処理部1
4850 〜1485K-1 は、それぞれ入力値に応じた実
数値を出力する非線形関数を有する。図23に、非線形
関数の例を示す。f1 を入力値としたとき、図23に示
される非線形関数の出力値f2 は、式(17)で与えら
れる。
FIG. 22 shows the weighted deteriorated speech calculation unit 14.
A block diagram showing the configuration of the included multiple nonlinear processing unit 1405.
It is a diagram. The multiple nonlinear processing unit 1405 includes a separating unit 14
95, K non-linear processing units 14850 ~ 1485K-1 ,
And a multiplexing unit 1475. Separation unit 1495
21 is supplied from the frequency-dependent SNR calculation unit 1402.
The non-linear processing unit
14850 ~ 1485K- 1 Output to. Non-linear processing unit 1
4850 ~ 1485K-1 Are the actual values corresponding to the input values.
It has a non-linear function that outputs a numerical value. In FIG. 23, the nonlinear
Here is an example of a function: f1 When the input value is
Output value f of the nonlinear function2 Is given by equation (17)
Be done.

【0124】[0124]

【数17】 [Equation 17]

【0125】非線形処理部14850 〜1485K-1
は、分離部1495から供給される周波数別SNRを、
上述した非線形関数によって処理して重み係数を求め、
多重化部1475に出力する。すなわち、非線形処理部
14850 〜1485K-1 は、SNRに応じた1から0
までの重み係数を出力する。SNRが小さい時は1を、
大きい時は0を出力する。多重化部1475は、非線形
処理部14850 〜1485K-1 から出力された重み係
数を多重化し、その結果得られた重み係数ベクトルを図
21における多重乗算部1404に出力する。
Non-linear processing section 1485 0 to 1485 K-1
Is the frequency-dependent SNR supplied from the separation unit 1495,
Calculate the weighting coefficient by processing with the above-mentioned nonlinear function,
Output to the multiplexing unit 1475. That is, the non-linear processing units 1485 0 to 1485 K−1 have 1 to 0 depending on the SNR.
The weighting factors up to are output. If the SNR is small, set 1
When it is larger, 0 is output. The multiplexing unit 1475 multiplexes the weighting factors output from the non-linear processing units 1485 0 to 1485 K-1, and outputs the resulting weighting factor vector to the multiplexing multiplication unit 1404 in FIG.

【0126】このように、図21における多重乗算部1
404で劣化音声パワースペクトルと乗算される重み係
数は、SNRに応じた値になっており、SNRが大きい
程、すなわち劣化音声に含まれる音声成分が大きい程、
重み係数の値は小さくなる。推定雑音の更新には一般に
劣化音声パワースペクトルが用いられるが、推定雑音の
更新に用いる劣化音声パワースペクトルに対して、SN
Rに応じた重みづけを行うことで、劣化音声パワースペ
クトルに含まれる音声成分の影響を小さくすることがで
き、より精度の高い雑音推定を行うことができる。な
お、重み係数の計算に非線形関数を用いた例を示した
が、非線形関数以外にも線形関数や高次多項式など、他
の形で表されるSNRの関数を用いることも可能であ
る。
As described above, the multiple multiplication unit 1 in FIG.
The weighting coefficient to be multiplied by the deteriorated speech power spectrum in 404 has a value according to the SNR. The larger the SNR, that is, the larger the speech component included in the deteriorated speech,
The value of the weighting factor becomes smaller. Although the deteriorated speech power spectrum is generally used for updating the estimated noise, SN is used for the deteriorated speech power spectrum used for updating the estimated noise.
By weighting according to R, it is possible to reduce the influence of the voice component included in the deteriorated voice power spectrum, and it is possible to perform noise estimation with higher accuracy. Although an example in which a non-linear function is used for the calculation of the weighting coefficient is shown, it is also possible to use a SNR function represented in another form such as a linear function or a high-order polynomial in addition to the non-linear function.

【0127】次に、図20における推定雑音計算部5に
ついて説明する。図24は、推定雑音計算部5の構成を
示すブロック図である。この推定雑音計算部5と図53
に示した推定雑音計算部51とは、分離部505が存在
することと、周波数別推定雑音計算部5140 〜514
K-1 が周波数別推定雑音計算部5040 〜504K-1
置換されていることを除いて同一である。以下、これら
の相違点を中心に詳細に説明する。
Next, the estimated noise calculator 5 in FIG. 20 will be described. FIG. 24 is a block diagram showing the configuration of the estimated noise calculation unit 5. This estimated noise calculation unit 5 and FIG.
The estimated noise calculator 51 shown, and the separation unit 505 is present, the frequency domain estimated noise calculator 514 0-514
It is identical except that K-1 has been replaced with a frequency domain estimated noise calculator 504 0 ~504 K-1. Hereinafter, these differences will be mainly described in detail.

【0128】分離部505は、図20における重みつき
劣化音声計算部14から供給される重みつき劣化音声パ
ワースペクトルを、周波数別の重みつき劣化音声パワー
スペクトルに分離し、それぞれ周波数別推定雑音計算部
5040 〜504K-1 に出力する。周波数別推定雑音計
算部5040 〜504K-1 は、分離部502から供給さ
れる周波数別劣化音声パワースペクトル、分離部505
から供給される周波数別重みつき劣化音声パワースペク
トル、図20における音声検出部4から供給される音声
検出フラグ、及び図20におけるカウンタ13から供給
されるカウント値から周波数別推定雑音パワースペクト
ルを計算し、多重化部503へ出力する。多重化部50
3は、周波数別推定雑音計算部5040 〜504K-1
ら供給される周波数別推定雑音パワースペクトルを多重
化し、その結果得られた推定雑音パワースペクトルを図
20における加算器56と注入雑音計算部58と重みつ
き劣化音声計算部14へ出力する。周波数別推定雑音計
算部5040 〜504K-1の構成と動作の詳細な説明
は、図25〜図27を参照しながら行う。
The separating section 505 separates the weighted deteriorated speech power spectrum supplied from the weighted deteriorated speech calculation section 14 in FIG. 20 into frequency-dependent weighted deteriorated speech power spectrums, and each frequency-dependent estimated noise calculation section. Output to 504 0 to 504 K-1 . The frequency - dependent estimated noise calculation units 504 0 to 504 K−1 are the frequency - dependent deteriorated speech power spectrum supplied from the separation unit 502, and the separation unit 505.
20 to calculate the frequency-dependent estimated noise power spectrum from the frequency-dependent weighted deteriorated voice power spectrum, the voice detection flag supplied from the voice detection unit 4 in FIG. 20, and the count value supplied from the counter 13 in FIG. , To the multiplexing unit 503. Multiplexer 50
3 multiplexes the frequency - dependent estimated noise power spectrum supplied from the frequency - dependent estimated noise calculation units 504 0 to 504 K-1, and the estimated noise power spectrum obtained as a result is added to the adder 56 and injection noise calculation in FIG. The data is output to the unit 58 and the weighted deteriorated speech calculation unit 14. A detailed description of the configuration and operation of the frequency - dependent estimated noise calculation units 504 0 to 504 K-1 will be given with reference to FIGS. 25 to 27.

【0129】図25は、図24に示した推定雑音計算部
5に含まれる周波数別推定雑音計算部5040 〜504
K-1 の第1の構成例を示すブロック図である。図54に
示した周波数別推定雑音計算部514との相違点は、周
波数別推定雑音計算部504 0 〜504K-1 が推定雑音
記憶部5942を有すること、更新判定部521が更新
判定部520に置換されていること、及びスイッチ50
44への入力が周波数別劣化音声パワースペクトルから
周波数別重みつき劣化音声パワースペクトルに置換され
ていることである。周波数別推定雑音計算部5040
504K-1 は、推定雑音の計算に劣化音声パワースペク
トルではなく重みつき劣化音声パワースペクトルを用い
ており、また、推定雑音の更新判定に、推定雑音と劣化
音声パワースペクトルを用いているため、これらの相違
点が発生する。推定雑音記憶部5942は、除算部50
48から供給される周波数別推定雑音パワースペクトル
を記憶し、1フレーム前に記憶された周波数別推定雑音
パワースペクトルを更新判定部520に出力する。更新
判定部520の構成と動作の詳細な説明は、図26を参
照しながら行う。
FIG. 25 shows the estimated noise calculation section shown in FIG.
Frequency-dependent estimated noise calculation unit 504 included in No. 50 ~ 504
K-1 3 is a block diagram showing a first configuration example of FIG. In Figure 54
The difference from the frequency-dependent estimated noise calculation unit 514 shown is that
Estimated noise calculation unit 504 by wave number 0 ~ 504K-1 Is the estimated noise
The storage unit 5942 is included, and the update determination unit 521 updates
The determination unit 520 is replaced, and the switch 50
The input to 44 is from the degraded speech power spectrum by frequency
Replaced by weighted degraded speech power spectrum by frequency
It is that. Frequency-dependent estimated noise calculation unit 5040 ~
504K-1 Degrades the speech power spectrum in the estimated noise calculation.
Using weighted degraded speech power spectrum instead of toll
In addition, the estimated noise and deterioration are
These differences are due to the use of the voice power spectrum.
Dots occur. The estimated noise storage unit 5942 has a division unit 50.
Estimated noise power spectrum by frequency supplied from 48
And the estimated noise for each frequency stored one frame before
The power spectrum is output to the update determination unit 520. update
See FIG. 26 for a detailed description of the configuration and operation of the determination unit 520.
Do it while shining.

【0130】図26は、図25に示した周波数別推定雑
音計算部5040 〜504K-1 に含まれる更新判定部5
20の構成を示すブロック図である。図55に示した更
新判定部521との相違点は、論理和計算部5211が
論理和計算部5201に置換されていることと、更新判
定部520が比較部5205、閾値記憶部5206及び
閾値計算部5207を有することである。以下、これら
の相違点を中心に詳細な動作を説明する。閾値計算部5
207は、図25における推定雑音記憶部5942から
供給される周波数別推定雑音パワースペクトルに応じた
値を計算し、閾値として閾値記憶部5206に出力す
る。最も簡単な閾値の計算方法は、周波数別推定雑音パ
ワースペクトルの定数倍である。その他に、高次多項式
や非線形関数を用いて閾値を計算することも可能であ
る。
FIG. 26 is a diagram showing an update determining unit 5 included in the frequency - dependent estimated noise calculating units 504 0 to 504 K-1 shown in FIG.
It is a block diagram which shows the structure of 20. 55 is different from the update determination unit 521 shown in FIG. 55 in that the logical sum calculation unit 5211 is replaced with the logical sum calculation unit 5201, and the update determination unit 520 includes a comparison unit 5205, a threshold value storage unit 5206, and a threshold value calculation unit. That is to have a part 5207. Hereinafter, detailed operations will be described focusing on these differences. Threshold calculator 5
207 calculates a value according to the frequency-dependent estimated noise power spectrum supplied from the estimated noise storage unit 5942 in FIG. 25, and outputs it to the threshold storage unit 5206 as a threshold value. The simplest threshold calculation method is a constant multiple of the estimated noise power spectrum for each frequency. Besides, it is also possible to calculate the threshold value using a high-order polynomial or a non-linear function.

【0131】閾値記憶部5206は、閾値計算部520
7から出力された閾値を記憶し、1フレーム前に記憶さ
れた閾値を比較部5205へ出力する。比較部5205
は、閾値記憶部5206から供給される閾値と図24に
おける分離部502から供給される周波数別劣化音声パ
ワースペクトルを比較し、周波数別劣化音声パワースペ
クトルが閾値よりも小さければ“1”を、大きければ
“0”を論理和計算部5201に出力する。すなわち、
推定雑音パワースペクトルの大きさをもとに、劣化音声
信号が雑音であるか否かを判別している。論理和計算部
5201は、比較部5203の出力値、論理否定回路5
202の出力値、及び比較部5205の出力値の論理和
を計算し、計算結果を図25におけるスイッチ504
4、シフトレジスタ5045及びカウンタ5049に出
力する。
The threshold storage unit 5206 has a threshold calculation unit 520.
The threshold value output from No. 7 is stored, and the threshold value stored one frame before is output to the comparison unit 5205. Comparison unit 5205
Compares the threshold supplied from the threshold storage unit 5206 with the frequency-dependent deteriorated voice power spectrum supplied from the separation unit 502 in FIG. 24. If the frequency-dependent deteriorated voice power spectrum is smaller than the threshold, increase “1”. For example, “0” is output to the logical sum calculation unit 5201. That is,
Based on the size of the estimated noise power spectrum, it is determined whether the deteriorated speech signal is noise. The logical sum calculation unit 5201 outputs the output value of the comparison unit 5203 and the logical negation circuit 5
The logical sum of the output value of 202 and the output value of the comparison unit 5205 is calculated, and the calculation result is the switch 504 in FIG.
4, output to the shift register 5045 and the counter 5049.

【0132】従って、初期状態や無音区間だけでなく、
有音区間でも劣化音声パワーが小さい場合には、更新判
定部520は“1”を出力する。すなわち、推定雑音の
更新が行われる。閾値の計算は各周波数毎に行われるた
め、各周波数毎に推定雑音の更新を行うことができる。
Therefore, in addition to the initial state and the silent section,
If the deteriorated voice power is small even in the voiced section, the update determination unit 520 outputs “1”. That is, the estimated noise is updated. Since the threshold value is calculated for each frequency, the estimated noise can be updated for each frequency.

【0133】図25において、CNTをカウンタ504
9のカウント値、Nをシフトレジスタ5045のレジス
タ長とする。そして、Bn(k)(n=0,1,....,N
−1)をシフトレジスタ5045に蓄積されている周波
数別重みつき劣化音声パワースペクトルとする。このと
き、除算部5048から出力される周波数別推定雑音パ
ワースペクトルλn(k)は、式(18)で与えられる。
In FIG. 25, the CNT counter 504
The count value of 9 and N are the register length of the shift register 5045. Then, B n (k) (n = 0, 1, ..., N
-1) is the weighted deteriorated speech power spectrum for each frequency stored in the shift register 5045. At this time, the frequency-dependent estimated noise power spectrum λ n (k) output from the division unit 5048 is given by Expression (18).

【0134】[0134]

【数18】 [Equation 18]

【0135】すなわち、λn(k)はシフトレジスタ50
45に蓄積されている周波数別重みつき劣化音声パワー
スペクトルの平均値となる。平均値の計算は、重みつき
加算部(巡回型フィルタ)を用いて行うことも可能であ
る。次に、図27を参照しながら、λn(k)の計算に重
みつき加算部を用いる構成例について説明する。
That is, λ n (k) is the shift register 50
The average value of the weighted deteriorated speech power spectrum for each frequency stored in 45. The average value may be calculated using a weighted addition unit (cyclic filter). Next, with reference to FIG. 27, a configuration example in which a weighted addition unit is used for calculating λ n (k) will be described.

【0136】図27は、図24に示した推定雑音計算部
5に含まれる周波数別推定雑音計算部5040 〜504
K-1 の第2の構成例を示すブロック図である。図25に
示した周波数別推定雑音計算部504におけるシフトレ
ジスタ5045、加算器5046、最小値選択部504
7、除算部5048、カウンタ5049、レジスタ長記
憶部5941、最小値選択部5047の代わりに、周波
数別推定雑音計算部507は、重みつき加算部507
1、重み記憶部5072を有する。
FIG. 27 shows the frequency-dependent estimated noise calculators 504 0 to 504 included in the estimated noise calculator 5 shown in FIG.
It is a block diagram showing the 2nd example of composition of K-1 . The shift register 5045, the adder 5046, the minimum value selection unit 504 in the frequency-dependent estimated noise calculation unit 504 shown in FIG.
7, the division unit 5048, the counter 5049, the register length storage unit 5941, and the minimum value selection unit 5047 are replaced by the frequency-dependent estimated noise calculation unit 507, and the weighted addition unit 507.
1 has a weight storage unit 5072.

【0137】重みつき加算部5071は、推定雑音記憶
部5942から供給される1フレーム前の周波数別推定
雑音パワースペクトル、スイッチ5044から供給され
る周波数別重みつき劣化音声パワースペクトル及び重み
記憶部5072から出力される重みを用いて、周波数別
推定雑音を計算し、図24における多重化部503へ出
力する。すなわち、重み記憶部5072が記憶する重み
をδ、周波数別重みつき劣化音声パワースペクトルを|
n(k)|2 バーとしたとき、重みつき加算部5071
から出力される周波数別推定雑音パワースペクトルλ
n(k)は、式(19)で与えられる。
The weighted addition unit 5071 outputs the estimated noise power spectrum for each frequency before one frame supplied from the estimated noise storage unit 5942, the weighted deteriorated speech power spectrum for each frequency supplied from the switch 5044, and the weight storage unit 5072. The estimated noise for each frequency is calculated using the output weight, and is output to the multiplexing unit 503 in FIG. That is, δ is the weight stored in the weight storage unit 5072, and |
Y n (k) | 2 bar, weighted addition unit 5071
Estimated noise power spectrum for each frequency output from λ
n (k) is given by Expression (19).

【0138】[0138]

【数19】 [Formula 19]

【0139】重みつき加算部5071の構成は、既に図
51を用いて説明した重みつき加算部407に等しいの
で、詳細な説明は省略する。但し、重みつき加算の計算
は常に行なわれる。
The structure of the weighted addition unit 5071 is the same as that of the weighted addition unit 407 already described with reference to FIG. 51, and therefore detailed description thereof will be omitted. However, the weighted addition calculation is always performed.

【0140】次に、図20における抑圧係数補正部15
について説明する。図28は、図20における抑圧係数
補正部15の構成を示すブロック図である。SNRが低
いときに抑圧不足により発生する残留雑音や、SNRが
高いときに過度の抑圧で発生する音声の歪みによる音質
劣化を防ぐために、抑圧係数補正部15は、SNRに応
じた抑圧係数の補正を行なう。補正の例として、SNR
が低いときには抑圧係数に修正値を加えて残留雑音を抑
圧し、SNRが高いときには抑圧係数に下限値を設定し
て音声の歪みを防止することができる。抑圧係数補正部
15は、K個の周波数別抑圧係数補正部15010 〜1
501K-1 、分離部1502,1503及び多重化部1
504を有する。
Next, the suppression coefficient correction unit 15 in FIG.
Will be described. FIG. 28 is a block diagram showing the configuration of the suppression coefficient correction unit 15 in FIG. In order to prevent the residual noise generated due to insufficient suppression when the SNR is low and the sound quality deterioration due to the distortion of the voice that occurs due to the excessive suppression when the SNR is high, the suppression coefficient correction unit 15 corrects the suppression coefficient according to the SNR. Do. As an example of correction, SNR
When is low, a correction value is added to the suppression coefficient to suppress residual noise, and when the SNR is high, a lower limit value can be set to the suppression coefficient to prevent voice distortion. The suppression coefficient correction unit 15 includes K frequency-based suppression coefficient correction units 1501 0 to 1501.
501 K-1 , demultiplexing units 1502 and 1503, and multiplexing unit 1
504.

【0141】分離部1502は、図20における推定先
天的SNR計算部7から供給される推定先天的SNRを
周波数別成分に分離し、それぞれ周波数別抑圧係数補正
部15010 〜1501K-1 に出力する。分離部150
3は、図20における抑圧係数生成部8から供給される
抑圧係数を周波数別成分に分離し、それぞれ周波数別抑
圧係数補正部15010 〜1501K-1 に出力する。周
波数別抑圧係数補正部15010 〜1501K-1 は、分
離部1502から供給される周波数別推定先天的SNR
と、分離部1503から供給される周波数別抑圧係数か
ら、周波数別補正抑圧係数を計算し、多重化部1504
へ出力する。多重化部1504は、周波数別抑圧係数補
正部15010 〜1501K-1 から供給される周波数別
補正抑圧係数を多重化し、補正抑圧係数として図20に
おける多重乗算部16と推定先天的SNR計算部7へ出
力する。
The separation unit 1502 separates the estimated a priori SNR supplied from the estimated a priori SNR calculation unit 7 in FIG. 20 into frequency components, and outputs them to the frequency suppression coefficient correction units 1501 0 to 1501 K-1 . To do. Separation part 150
3 separates the suppression coefficient supplied from the suppression coefficient generation unit 8 in FIG. 20 into frequency components, and outputs them to the frequency suppression coefficient correction units 1501 0 to 1501 K-1 . The frequency - dependent suppression coefficient correction units 1501 0 to 1501 K-1 are frequency - dependent estimated a priori SNRs supplied from the separation unit 1502.
And the correction suppression coefficient for each frequency is calculated from the suppression coefficient for each frequency supplied from the separating section 1503, and the multiplexing section 1504
Output to. The multiplexing unit 1504 multiplexes the frequency-specific correction suppression coefficients supplied from the frequency-specific suppression coefficient correction units 1501 0 to 1501 K-1 and, as the correction suppression coefficient, the multiplex multiplication unit 16 and the estimated a priori SNR calculation unit. Output to 7.

【0142】図29は、図28に示した抑圧係数補正部
15に含まれる周波数別抑圧係数補正部15010 〜1
501K-1 の構成を示すブロック図である。周波数別抑
圧係数補正部1501は、最大値選択部1591、抑圧
係数下限値記憶部1592、閾値記憶部1593、比較
部1594、スイッチ1595、修正値記憶部1596
及び乗算器1597を有する。比較部1594は、閾値
記憶部1593から供給される閾値と、図28における
分離部1502から供給される周波数別推定先天的SN
Rを比較し、周波数別推定先天的SNRが閾値よりも大
きければ“0”を、小さければ“1”をスイッチ159
5に供給する。
FIG. 29 shows frequency-dependent suppression coefficient correction units 1501 0 to 1501 included in the suppression coefficient correction unit 15 shown in FIG.
It is a block diagram which shows the structure of 501 K-1 . The frequency-dependent suppression coefficient correction unit 1501 includes a maximum value selection unit 1591, a suppression coefficient lower limit value storage unit 1592, a threshold value storage unit 1593, a comparison unit 1594, a switch 1595, and a correction value storage unit 1596.
And a multiplier 1597. The comparison unit 1594 compares the threshold value supplied from the threshold value storage unit 1593 with the frequency-based estimated a priori SN supplied from the separation unit 1502 in FIG.
R is compared, and if the inferred innate SNR for each frequency is larger than the threshold value, “0” is set.
Supply to 5.

【0143】スイッチ1595は、図28における分離
部1503から供給される周波数別抑圧係数を、比較部
1594の出力値が“1”のとき乗算器1597に出力
し、比較部1594の出力値が“0”のとき、最大値選
択部1591に直接供給する。乗算器1579は、スイ
ッチ1595の出力値と修正値記憶部1596の出力値
との積を計算し、計算結果を最大値選択部1591に供
給する。抑圧係数値を小さくするため、修正値は1より
小さい値が普通であるが、目的によってはこの限りでは
ない。このように、周波数別推定先天的SNRが閾値よ
りも小さいときに、抑圧係数の補正を行なう。SNRが
小さい場合に抑圧係数の補正を行なうことで、音声成分
を過剰に抑圧することなく、残留雑音量を減らすことが
できる。
The switch 1595 outputs the suppression coefficient for each frequency supplied from the separation unit 1503 in FIG. 28 to the multiplier 1597 when the output value of the comparison unit 1594 is "1", and the output value of the comparison unit 1594 is " When it is 0 ”, it is directly supplied to the maximum value selection unit 1591. The multiplier 1579 calculates the product of the output value of the switch 1595 and the output value of the correction value storage unit 1596, and supplies the calculation result to the maximum value selection unit 1591. The correction value is usually smaller than 1 in order to reduce the suppression coefficient value, but it is not limited to this depending on the purpose. In this way, the suppression coefficient is corrected when the estimated a priori SNR for each frequency is smaller than the threshold value. By correcting the suppression coefficient when the SNR is small, it is possible to reduce the residual noise amount without excessively suppressing the voice component.

【0144】抑圧係数下限値記憶部1592は、記憶し
ている抑圧係数の下限値を、最大値選択部1591に供
給する。最大値選択部1591は、スイッチ1595又
は乗算器1597から供給される信号と、抑圧係数下限
値記憶部1592から供給される抑圧係数下限値を比較
し、大きい方の値を周波数別補正抑圧係数として、図2
8における多重化部1504に出力する。これにより、
抑圧係数は抑圧係数下限値記憶部1592が記憶する下
限値よりも必ず大きい値になる。従って、過度の抑圧に
より発生する音声の歪みを防ぐことができる。なお、図
1、図5、図10、図12、図14、図17に示したノ
イズ除去装置では、抑圧係数が多重乗算部16と推定先
天的SNR計算部7へ供給されていたが、図20に示し
たノイズ除去装置では、抑圧係数に代わって補正抑圧係
数が供給されている。
The suppression coefficient lower limit storage unit 1592 supplies the stored lower limit value of the suppression coefficient to the maximum value selection unit 1591. The maximum value selection unit 1591 compares the signal supplied from the switch 1595 or the multiplier 1597 with the suppression coefficient lower limit value supplied from the suppression coefficient lower limit value storage unit 1592, and sets the larger value as the frequency-dependent correction suppression coefficient. , Fig. 2
8 to the multiplexing unit 1504. This allows
The suppression coefficient always has a value larger than the lower limit value stored in the suppression coefficient lower limit storage unit 1592. Therefore, it is possible to prevent the distortion of the voice generated by the excessive suppression. In the noise removal apparatus shown in FIGS. 1, 5, 10, 12, 14, and 17, the suppression coefficient is supplied to the multiplex multiplication unit 16 and the estimated a priori SNR calculation unit 7. In the noise eliminator shown in FIG. 20, the corrected suppression coefficient is supplied instead of the suppression coefficient.

【0145】次に、図20における雑音抑圧係数生成部
8について説明する。図60を用いて説明したように、
抑圧係数は、供給された推定先天的SNRと後天的SN
Rから検索で求めることができるが、演算で求めること
もできる。以下、文献1に記載されている計算式をもと
に、抑圧係数の計算方法と共に、雑音抑圧係数生成部8
の他の構成例について説明する。図30は、図20にお
ける雑音抑圧係数生成部8の他の構成例を示すブロック
図である。雑音抑圧係数生成部81は、MMSE ST
SAゲイン関数値計算部811、一般化尤度比計算部8
12、音声存在確率記憶部813、及び抑圧係数計算部
814を有する。
Next, the noise suppression coefficient generator 8 in FIG. 20 will be described. As described using FIG. 60,
The suppression coefficient is the estimated innate SNR and acquired SN provided.
The value can be obtained by searching from R, but can also be obtained by calculation. Hereinafter, based on the calculation formula described in Document 1, together with the calculation method of the suppression coefficient, the noise suppression coefficient generation unit 8
Another configuration example will be described. FIG. 30 is a block diagram showing another configuration example of the noise suppression coefficient generation unit 8 in FIG. The noise suppression coefficient generation unit 81 uses the MMSE ST
SA gain function value calculation unit 811, generalized likelihood ratio calculation unit 8
12, a voice existence probability storage unit 813, and a suppression coefficient calculation unit 814.

【0146】フレーム番号をn、周波数番号をkとし、
γn(k)を図20における周波数別SNR計算部6から
供給される周波数別後天的SNR、ξn(k)ハットを図
20における推定先天的SNR計算部7から供給される
周波数別推定先天的SNRとする。また、ηn(k)=ξ
n(k)ハット/q、vn(k)=(ηn(k)γn(k))/
(1+ηn(k))とする。MMSE STSAゲイン関
数値計算部811は、図20における周波数別SNR計
算部6から供給される後天的SNRγn(k)、図20に
おける推定先天的SNR計算部7から供給される推定先
天的SNRξn(k)ハット及び音声存在確率記憶部81
3から供給される音声存在確率qをもとに、各周波数毎
にMMSESTSAゲイン関数値を計算し、抑圧係数計
算部814に出力する。各周波数毎のMMSE STS
Aゲイン関数値Gn(k)は、式(20)で与えられる。
Let the frame number be n and the frequency number be k,
γ n (k) is the frequency-dependent a posteriori SNR supplied from the frequency-based SNR calculating unit 6 in FIG. 20, and ξ n (k) hat is the frequency-based estimated a priori supplied from the estimated a priori SNR calculating unit 7 in FIG. Target SNR. Also, η n (k) = ξ
n (k) hat / q, v n (k) = (η n (k) γ n (k)) /
Let (1 + η n (k)). The MMSE STSA gain function value calculation unit 811 receives the acquired SNR γ n (k) supplied from the frequency-based SNR calculation unit 6 in FIG. 20, and the estimated a priori SNR ξ n supplied from the estimated a priori SNR calculation unit 7 in FIG. (k) Hat and voice existence probability storage unit 81
The MMMESTSA gain function value is calculated for each frequency based on the voice existence probability q supplied from No. 3, and is output to the suppression coefficient calculation unit 814. MMSE STS for each frequency
The A gain function value G n (k) is given by the equation (20).

【0147】[0147]

【数20】 [Equation 20]

【0148】ここに、I0(z)は0次変形ベッセル関
数、I1(z)は1次変形ベッセル関数である。変形ベッ
セル関数については、「1985年、数学辞典、岩波書
店、374.Gページ」(文献6)に記載されている。
一般化尤度比計算部812は、図20における周波数別
SNR計算部6から供給される後天的SNRγn(k)、
図20における推定先天的SNR計算部7から供給され
る推定先天的SNRξn(k)ハット及び音声存在確率記
憶部813から供給される音声存在確率qをもとに、周
波数毎に一般化尤度比を計算し、抑圧係数計算部814
に出力する。周波数毎の一般化尤度比Λn(k)は、式
(21)で与えられる。
Here, I 0 (z) is the 0th-order modified Bessel function, and I 1 (z) is the 1st-order modified Bessel function. The modified Bessel function is described in "1985, Mathematics Dictionary, Iwanami Shoten, 374.G page" (Reference 6).
The generalized likelihood ratio calculation unit 812 receives the acquired SNR γ n (k) supplied from the frequency-based SNR calculation unit 6 in FIG.
Based on the estimated a priori SNR ξ n (k) hat supplied from the estimated a priori SNR calculation unit 7 and the voice existence probability q supplied from the voice existence probability storage unit 813 in FIG. 20, the generalized likelihood for each frequency. The ratio is calculated, and the suppression coefficient calculation unit 814
Output to. The generalized likelihood ratio Λ n (k) for each frequency is given by equation (21).

【0149】[0149]

【数21】 [Equation 21]

【0150】抑圧係数計算部814は、MMSE ST
SAゲイン関数値計算部811から供給されるMMSE
STSAゲイン関数値Gn(k)と一般化尤度比計算部
812から供給される一般化尤度比Λn(k)から周波数
毎に抑圧係数を計算し、図20における抑圧係数補正部
15へ出力する。周波数毎の抑圧係数Gn(k)バーは、
式(22)で与えられる。
The suppression coefficient calculation unit 814 uses the MMSE ST
MMSE supplied from the SA gain function value calculation unit 811
A suppression coefficient is calculated for each frequency from the STSA gain function value G n (k) and the generalized likelihood ratio Λ n (k) supplied from the generalized likelihood ratio calculation unit 812, and the suppression coefficient correction unit 15 in FIG. Output to. The suppression coefficient G n (k) bar for each frequency is
It is given by equation (22).

【0151】[0151]

【数22】 [Equation 22]

【0152】周波数別にSNRを計算する代わりに、複
数の周波数から構成される帯域に共通なSNRを求め
て、これを用いることも可能である。よって次に、図2
0における周波数別SNR計算部6の他の構成例とし
て、帯域毎にSNRを計算する例について説明する。図
31は、周波数別SNR計算部6の他の構成例を示すブ
ロック図である。図56に示した周波数別SNR計算部
6との相違点は、帯域別SNR計算部61が帯域別パワ
ー計算部611,612を有することである。帯域別パ
ワー計算部611は、分離部602から供給される周波
数別劣化音声パワースペクトルをもとに帯域別のパワー
を計算し、除算部6010 〜601K-1 へ出力する。ま
た、帯域別パワー計算部612は、分離部603から供
給される周波数別推定雑音パワースペクトルをもとに帯
域別のパワーを計算し、除算部6010 〜601K-1
出力する。
Instead of calculating the SNR for each frequency, it is also possible to obtain the SNR common to the band composed of a plurality of frequencies and use it. Therefore, next, in FIG.
As another configuration example of the frequency-based SNR calculation unit 6 for 0, an example of calculating the SNR for each band will be described. FIG. 31 is a block diagram showing another configuration example of the frequency-based SNR calculation unit 6. The difference from the frequency-based SNR calculation unit 6 shown in FIG. 56 is that the band-based SNR calculation unit 61 includes band-based power calculation units 611 and 612. The band-specific power calculation unit 611 calculates the band-specific power based on the frequency-specific deteriorated voice power spectrum supplied from the separation unit 602, and outputs the calculated power to the division units 601 0 to 601 K-1 . Further, the band-specific power calculation unit 612 calculates the band-specific power based on the frequency-specific estimated noise power spectrum supplied from the separation unit 603, and outputs the calculated power to the division units 601 0 to 601 K-1 .

【0153】図32は、帯域別SNR計算部61に含ま
れる帯域別パワー計算部611の構成を示すブロック図
である。ここでは、帯域幅LをもつM個の帯域に等分割
する例を説明する。ここに、LとMは、K=LMの関係
を満たす自然数であるとする。帯域別SNR計算部61
は、M個の加算器61100〜6110M-1を有する。図
31における分離部602から供給される周波数別劣化
音声パワースペクトル9100 〜910K-1 (9100
〜910ML-1)は、各周波数に対応した加算器6110
0 〜6110M-1 へそれぞれ伝達される。例えば、帯域
番号0に対応する周波数番号は0からL−1なので、周
波数別劣化音声パワースペクトル910 0 〜910L-1
は加算器61100へ伝達される。また、帯域番号1に
対応する周波数番号はLから2L−1なので、周波数別
劣化音声パワースペクトル910 L 〜9102L-1は加算
器61101へ伝達される。
FIG. 32 is included in the band-based SNR calculation unit 61.
Block diagram showing the configuration of a band-specific power calculation unit 611
Is. Here, it is equally divided into M bands having a bandwidth L.
An example will be described. Where L and M are K = LM
Let it be a natural number that satisfies. Band-wise SNR calculator 61
Is the M adders 61100~ 6110M-1Have. Figure
Degradation by frequency supplied from the separation unit 602 in No. 31
Audio power spectrum 9100 ~ 910K-1 (9100 
~ 910ML-1) Is an adder 6110 corresponding to each frequency
0 ~ 6110M-1 Respectively transmitted to. For example, the band
Frequency numbers corresponding to number 0 are 0 to L-1, so
Deteriorated voice power spectrum 910 by wave number 0~ 910L-1 
Is the adder 61100Transmitted to. Also, for band number 1
Corresponding frequency numbers are from L to 2L-1.
Degraded speech power spectrum 910 L~ 9102L-1Is addition
Bowl 61101Transmitted to.

【0154】加算器61100 〜6110M-1 は、供給
された周波数別劣化音声パワースペクトルの総和をそれ
ぞれ計算し、帯域別劣化音声パワースペクトル9110
〜911ML-1(9110 〜911K-1 )を図31におけ
る除算部6010 〜601K- 1 へ出力する。各加算器の
計算結果は、それぞれの帯域番号に応じた周波数毎に帯
域別劣化音声パワースペクトルとして出力される。例え
ば、加算器61100の計算結果は、帯域別劣化音声パ
ワースペクトル9110 〜911L-1 として出力され
る。また、加算器61101 の計算結果は、帯域別劣化
音声パワースペクトル911L 〜9112L-1として出力
される。帯域別パワー計算部612の構成と動作は帯域
別パワー計算部611と等価であるので、その説明は省
略する。
Adder 61100 ~ 6110M-1 Supply
The sum of the degraded speech power spectrum by frequency
Each is calculated, and the degraded voice power spectrum 911 for each band0 
~ 911ML-1(9110 ~ 911K-1 ) In Figure 31
Division unit 6010 ~ 601K- 1 Output to. Of each adder
The calculation result is calculated for each frequency according to each band number.
It is output as the degraded voice power spectrum for each region. example
For example, adder 61100The calculation result of
War spectrum 9110 ~ 911L-1 Is output as
It Also, the adder 61101 The calculation result of is degraded by band
Audio power spectrum 911L ~ 9112L-1Output as
To be done. The configuration and operation of the power calculation unit 612 for each band is
Since it is equivalent to the separate power calculation unit 611, its description is omitted.
I will omit it.

【0155】なお、ここでは複数の帯域に等分割する例
を示したが、「1980年、聴覚と音声、電子情報通信
学会、115〜118ページ」(文献7)に記載されて
いる臨界帯域に分割する方法、「1983年、マルチレ
ート・ディジタル・シグナル・プロセシング(Multirat
e Digital Signal Processing),1983,Prentice-
Hall Inc.,USA」(文献8)に記載されているオクター
ブ帯域に分割する方法など、他の帯域分割方法を用いる
ことも可能である。
Although an example of equally dividing into a plurality of bands is shown here, the critical band described in “Hearing and Speech, The Institute of Electronics, Information and Communication Engineers, pp. 115 to 118, 1980” (Reference 7) is used. The method of division, "1983, Multirate Digital Signal Processing (Multirat
e Digital Signal Processing), 1983, Prentice-
It is also possible to use another band division method such as the method of dividing into octave bands described in "Hall Inc., USA" (Reference 8).

【0156】(第8の実施の形態)図33は、本発明の
ノイズ除去装置の第8の実施の形態の全体構成を示すブ
ロック図である。図20に示したノイズ除去装置との相
違点は、注入雑音計算部58、加算器56,57が、S
NR補正部67に置換されていることである。図20と
図33の関係は、図1と図5の関係及び図10と図14
の関係に等しく、SNR補正部67については図15及
び14を参照して説明したので、図33に示したノイズ
除去装置に関する詳細な説明は省略する。
(Eighth Embodiment) FIG. 33 is a block diagram showing the overall structure of an eighth embodiment of the noise removing apparatus of the present invention. The difference from the noise removal apparatus shown in FIG. 20 is that the injection noise calculation unit 58 and the adders 56 and 57 are
That is, it is replaced with the NR correction unit 67. The relationship between FIGS. 20 and 33 is the relationship between FIGS. 1 and 5 and the relationship between FIGS.
Since the SNR correction unit 67 has been described with reference to FIGS. 15 and 14, the detailed description of the noise eliminator shown in FIG. 33 will be omitted.

【0157】(第9の実施の形態)図34は、本発明の
ノイズ除去装置の第9の実施の形態の全体構成を示すブ
ロック図である。図20に示したノイズ除去装置との相
違点は、推定雑音計算部5が推定雑音計算部52に置換
されていること、及び重みつき劣化音声計算部14が存
在しないことである。以下、これらの相違点を中心に詳
細に説明する。
(Ninth Embodiment) FIG. 34 is a block diagram showing the entire structure of a ninth embodiment of the noise removing apparatus of the present invention. The difference from the noise removal apparatus shown in FIG. 20 is that the estimated noise calculation unit 5 is replaced by the estimated noise calculation unit 52 and that the weighted deteriorated speech calculation unit 14 does not exist. Hereinafter, these differences will be mainly described in detail.

【0158】図35は、図34における推定雑音計算部
52の構成を示すブロック図である。図24に示した推
定雑音計算部5との相違点は、周波数別推定雑音計算部
5040 〜504K-1 が周波数別推定雑音計算部506
0 〜506K-1 に置換されていることと、推定雑音計算
部52が入力信号に重みつき劣化音声パワースペクトル
を有しないことである。これは、周波数別推定雑音計算
部5040 〜504K- 1 が入力信号に周波数別重みつき
劣化音声パワースペクトルを必要とするのに対して、推
定雑音計算部5060 〜506K-1 は、入力信号に周波
数別重みつき劣化音声パワースペクトルを必要としない
ためである。以下、図36を参照しながら、相違点であ
る周波数別推定雑音計算部5060 〜506K-1 の構成
と動作を詳細に説明する。
FIG. 35 shows the estimated noise calculating section in FIG.
It is a block diagram which shows the structure of 52. The estimation shown in FIG.
The difference from the constant noise calculation unit 5 is that the frequency-dependent estimated noise calculation unit
5040 ~ 504K-1 Is a frequency-dependent estimated noise calculation unit 506
0 ~ 506K-1 And the estimated noise calculation
The part 52 weights the input signal with the deteriorated speech power spectrum
Is not to have. This is the estimated noise calculation for each frequency
Part 5040 ~ 504K- 1 Is weighted by frequency to the input signal
It requires a degraded speech power spectrum, whereas
Constant noise calculation unit 5060 ~ 506K-1 Is the frequency of the input signal
No weighted degraded speech power spectrum is required
This is because. Hereinafter, with reference to FIG.
Frequency-dependent estimated noise calculation unit 5060 ~ 506K-1 Configuration of
And the operation will be described in detail.

【0159】図36は、図35に示した推定雑音計算部
52に含まれる周波数別推定雑音計算部5060 〜50
K-1 の構成を示すブロック図である。図25に示した
周波数別推定雑音計算部504との相違点は、周波数別
推定雑音計算部506が、入力信号に周波数別重みつき
劣化音声パワースペクトルを有していないことと、除算
部5041、非線形処理部5042、及び乗算器504
3を有していることである。以下、これらの相違点を中
心に詳細に説明する。
FIG. 36 shows the frequency-dependent estimated noise calculators 506 0 to 50 0 included in the estimated noise calculator 52 shown in FIG.
It is a block diagram which shows the structure of 6 K-1 . The difference from the frequency-specific estimated noise calculation unit 504 shown in FIG. 25 is that the frequency-specific estimated noise calculation unit 506 does not have a frequency-specific weighted deteriorated speech power spectrum in the input signal, and a division unit 5041, Non-linear processing unit 5042 and multiplier 504
3 is to have. Hereinafter, these differences will be mainly described in detail.

【0160】除算部5041は、図35における分離部
502から供給される周波数別劣化音声パワースペクト
ルを、推定雑音記憶部5942から供給される1フレー
ム前の推定雑音パワースペクトルで除算し、除算結果を
非線形処理部5042に出力する。図22に示した非線
形処理部1485と同一の構成と機能を有する非線形処
理部5042は、除算部5041の出力値に応じた重み
係数を計算し、乗算器5043に出力する。乗算器50
43は、図35における分離部502から供給される周
波数別劣化音声パワースペクトルと非線形処理部504
2から供給される重み係数の積を計算し、スイッチ50
44へ出力する。
The division unit 5041 divides the frequency-dependent deteriorated speech power spectrum supplied from the separation unit 502 in FIG. 35 by the estimated noise power spectrum one frame before supplied from the estimated noise storage unit 5942, and obtains the division result. It is output to the non-linear processing unit 5042. The non-linear processing unit 5042 having the same configuration and function as the non-linear processing unit 1485 shown in FIG. 22 calculates a weighting coefficient according to the output value of the division unit 5041, and outputs it to the multiplier 5043. Multiplier 50
Reference numeral 43 denotes a frequency-dependent deteriorated speech power spectrum supplied from the separation unit 502 in FIG.
Calculate the product of the weighting factors supplied from 2 and switch 50
Output to 44.

【0161】乗算器5043の出力信号は、図25に示
した周波数別推定雑音計算部504における周波数別重
みつき劣化音声パワースペクトルと等価である。すなわ
ち、周波数別重みつき劣化音声パワースペクトルは、周
波数別推定雑音計算部506の内部において計算するこ
とも可能である。従って、図34に示したノイズ除去装
置では、重みつき劣化音声計算部14を省略することが
可能となる。
The output signal of the multiplier 5043 is equivalent to the weighted deteriorated speech power spectrum by frequency in the estimated noise by frequency calculation unit 504 shown in FIG. That is, the weighted deteriorated speech power spectrum for each frequency can be calculated in the estimated noise for each frequency calculation unit 506. Therefore, in the noise eliminator shown in FIG. 34, the weighted deteriorated speech calculation unit 14 can be omitted.

【0162】(第10の実施の形態)図37は、本発明
のノイズ除去装置の第10の実施の形態の全体構成を示
すブロック図である。図34に示したノイズ除去装置と
の相違点は、注入雑音計算部58、加算器56,57
が、SNR補正部67に置換されていることである。図
34と図37の関係は、図1と図5の関係、図10と図
14の関係、及び図20と図33の関係に等しく、SN
R補正部67については図15及び14を参照して説明
したので、図37に示したノイズ除去装置に関する詳細
な説明は省略する。
(Tenth Embodiment) FIG. 37 is a block diagram showing the overall structure of a tenth embodiment of the noise removing apparatus of the present invention. The difference from the noise removing apparatus shown in FIG. 34 is that the injection noise calculating unit 58 and the adders 56 and 57 are provided.
Is replaced by the SNR correction unit 67. The relationship between FIGS. 34 and 37 is equal to the relationship between FIGS. 1 and 5, the relationship between FIGS. 10 and 14, and the relationship between FIGS.
Since the R correction unit 67 has been described with reference to FIGS. 15 and 14, detailed description of the noise removal device shown in FIG. 37 will be omitted.

【0163】(第11の実施の形態)図38は、本発明
のノイズ除去装置の第11の実施の形態の全体構成を示
すブロック図である。図20に示したノイズ除去装置と
は、推定先天的SNR計算部71を除いて同一であるの
で、以下、この相違点を中心に詳細に説明する。図39
は、図38における推定先天的SNR計算部71の構成
を示すブロック図である。図57に示した推定先天的S
NR計算部7は後天的SNR記憶部702、抑圧係数記
憶部703、多重乗算部705,704を有するのに対
し、推定先天的SNR計算部71はこれらの代わりに、
推定雑音記憶部712、強調音声パワースペクトル記憶
部713、周波数別SNR計算部715、多重乗算部7
16を有する。また、推定先天的SNR計算部7は、入
力信号に抑圧係数を有するが、推定先天的SNR計算部
71は、抑圧係数の代わりに強調音声振幅スペクトルと
推定雑音パワースペクトルを入力信号に有する。以下、
推定先天的SNR計算部7と71との間に存在するこれ
らの相違点を中心に、詳細に説明する。
(Eleventh Embodiment) FIG. 38 is a block diagram showing the overall structure of an eleventh embodiment of the noise removing apparatus of the present invention. The noise eliminator shown in FIG. 20 is the same as the noise eliminator except for the estimated a priori SNR calculator 71. Therefore, the difference will be mainly described below. FIG. 39
FIG. 39 is a block diagram showing a configuration of an estimated a priori SNR calculation unit 71 in FIG. 38. Estimated congenital S shown in FIG.
The NR calculation unit 7 has an acquired SNR storage unit 702, a suppression coefficient storage unit 703, and multiplex multiplication units 705 and 704, whereas the estimated a priori SNR calculation unit 71 replaces them.
Estimated noise storage unit 712, emphasized speech power spectrum storage unit 713, frequency-dependent SNR calculation unit 715, multiplex multiplication unit 7
Have 16. Further, the estimated a priori SNR calculator 7 has a suppression coefficient in the input signal, but the estimated a priori SNR calculator 71 has an emphasized speech amplitude spectrum and an estimated noise power spectrum in the input signal instead of the suppression coefficient. Less than,
The difference between the estimated a priori SNR calculators 7 and 71 will be mainly described below.

【0164】多重乗算部716は、図38における多重
乗算部16から供給される強調音声振幅スペクトル|X
n(k)|バー=Gn(k)バー・|Yn(k)|を周波数毎
に2乗して強調音声パワースペクトルを求め、強調音声
パワースペクトル記憶部713に出力する。多重乗算部
716の構成は、既に図52を用いて説明した多重乗算
部17に等しいので、詳細な説明は省略する。強調音声
パワースペクトル記憶部713は、多重乗算部716か
ら供給される強調音声パワースペクトルを記憶し、1フ
レーム前に供給された強調音声パワースペクトルを周波
数別SNR計算部715へ出力する。推定雑音記憶部7
12は、図38における推定雑音計算部5から供給され
る推定雑音パワースペクトルλn(k)を記憶し、1フレ
ーム前に供給された推定音声パワースペクトルを周波数
別SNR計算部715へ出力する。
The multiplex multiplication section 716 receives the emphasized speech amplitude spectrum | X supplied from the multiplex multiplication section 16 in FIG.
n (k) | bar = G n (k) bar · | Y n (k) | is squared for each frequency to obtain the emphasized voice power spectrum, and outputs the emphasized voice power spectrum storage unit 713. The configuration of the multiplex multiplying unit 716 is the same as that of the multiplex multiplying unit 17 already described with reference to FIG. 52, and thus detailed description thereof will be omitted. The emphasized sound power spectrum storage unit 713 stores the emphasized sound power spectrum supplied from the multiplex multiplication unit 716, and outputs the emphasized sound power spectrum supplied one frame before to the frequency-based SNR calculation unit 715. Estimated noise storage unit 7
The storage unit 12 stores the estimated noise power spectrum λ n (k) supplied from the estimated noise calculation unit 5 in FIG. 38, and outputs the estimated speech power spectrum supplied one frame before to the frequency-based SNR calculation unit 715.

【0165】周波数別SNR計算部715は、強調音声
パワースペクトル記憶部713から供給される強調音声
パワースペクトルGn-1 2(k)バー・|Yn-1(k)|2
と、推定雑音記憶部712から供給される推定雑音パワ
ースペクトルλn-1(k)のSNRを各周波数毎に計算
し、多重重みつき加算部707へ出力する。周波数別S
NR計算部715の構成は、既に図56を用いて説明し
た周波数別SNR計算部6に等しいので、詳細な説明は
省略する。周波数別SNR計算部715の出力であるG
n-1 2(k)バー・|Yn-1(k)| 2 /λn-1(k)は、式
(11)の関係から、図57における多重乗算部705
の出力であるγn-1(k)Gn-1 2(k)バーと等価であ
る。従って、図20に示したノイズ除去装置に含まれる
推定先天的SNR計算部7を推定先天的SNR計算部7
1で置換することが可能となる。
The frequency-based SNR calculation unit 715
Enhanced speech supplied from the power spectrum storage unit 713
Power spectrum Gn-1 2(K) bar ・ | Yn-1(k) |2 
And the estimated noise power supplied from the estimated noise storage unit 712.
ー spectrum λn-1Calculate SNR of (k) for each frequency
And outputs it to the multiple weighted addition unit 707. Frequency S
The configuration of the NR calculation unit 715 has already been described using FIG.
Since it is the same as the frequency-based SNR calculator 6, a detailed description will be given.
Omit it. G which is the output of the frequency-dependent SNR calculation unit 715
n-1 2(K) bar ・ | Yn-1(k) | 2 / Λn-1(k) is the formula
From the relationship of (11), the multiple multiplication unit 705 in FIG.
Is the output of γn-1(k) Gn-1 2(K) is equivalent to bar
It Therefore, it is included in the noise eliminator shown in FIG.
The estimated a priori SNR calculator 7 is replaced by the estimated a priori SNR calculator 7
It becomes possible to replace with 1.

【0166】(第12の実施の形態)図40は、本発明
のノイズ除去装置の第12の実施の形態の全体構成を示
すブロック図である。図38に示したノイズ除去装置と
の相違点は、注入雑音計算部58、加算器56,57
が、SNR補正部67に置換されていることである。図
38と図40の関係は、図1と図5の関係、図10と図
14の関係、図20と図33の関係、及び図34と図3
7の関係に等しく、SNR補正部67については図15
及び14を参照して説明したので、図40に示したノイ
ズ除去装置に関する詳細な説明は省略する。
(Twelfth Embodiment) FIG. 40 is a block diagram showing the overall structure of a twelfth embodiment of the noise removing apparatus of the present invention. The difference from the noise removal apparatus shown in FIG. 38 is that the injection noise calculation unit 58 and the adders 56 and 57 are provided.
Is replaced by the SNR correction unit 67. The relationship between FIGS. 38 and 40 is the relationship between FIGS. 1 and 5, the relationship between FIGS. 10 and 14, the relationship between FIGS. 20 and 33, and the relationship between FIGS.
7 and the SNR correction unit 67 is shown in FIG.
Since the description has been made with reference to FIGS. 14 and 14, the detailed description of the noise eliminator shown in FIG.

【0167】(第13の実施の形態)図41は、本発明
のノイズ除去装置の第13の実施の形態の全体構成を示
すブロック図である。図20に示したノイズ除去装置と
の相違点は、推定雑音計算部5が推定雑音部52に、推
定先天的SNR計算部7が推定先天的SNR計算部71
に、それぞれ置換されていることと、重みつき劣化音声
計算部14が存在しないことである。推定雑音部52の
構成と動作は、図35及び図36を参照して説明したの
と同様である。また、推定先天的SNR計算部71の構
成と動作は、図39を参照して説明したのと同様であ
る。従って、図41に示したノイズ除去装置は、図20
に示したノイズ除去装置と等価な機能を実現する。
(Thirteenth Embodiment) FIG. 41 is a block diagram showing the overall structure of a thirteenth embodiment of the noise removing apparatus of the present invention. The difference from the noise removal apparatus shown in FIG. 20 is that the estimated noise calculation unit 5 is an estimated noise unit 52 and the estimated a priori SNR calculation unit 7 is an estimated a priori SNR calculation unit 71.
Are replaced, and the weighted deteriorated speech calculation unit 14 does not exist. The configuration and operation of the estimated noise unit 52 are the same as those described with reference to FIGS. 35 and 36. Further, the configuration and operation of the estimated a priori SNR calculation unit 71 are the same as those described with reference to FIG. Therefore, the noise removing apparatus shown in FIG.
A function equivalent to that of the noise eliminator shown in is realized.

【0168】(第14の実施の形態)図42は、本発明
のノイズ除去装置の第14の実施の形態の全体構成を示
すブロック図である。図41に示したノイズ除去装置と
の相違点は、注入雑音計算部58、加算器56,57
が、SNR補正部67に置換されていることである。図
41と図42の関係は、図1と図5の関係、図10と図
14の関係、図20と図33の関係、図34と図37の
関係、及び図38と図40の関係に等しく、SNR補正
部67については図15及び14を参照して説明したの
で、図42に示したノイズ除去装置に関する詳細な説明
は省略する。
(Fourteenth Embodiment) FIG. 42 is a block diagram showing the overall structure of a fourteenth embodiment of the noise eliminator of the present invention. The difference from the noise removal apparatus shown in FIG. 41 is that the injection noise calculation unit 58 and the adders 56 and 57 are
Is replaced by the SNR correction unit 67. The relationship between FIGS. 41 and 42 is the relationship between FIGS. 1 and 5, the relationship between FIGS. 10 and 14, the relationship between FIGS. 20 and 33, the relationship between FIGS. 34 and 37, and the relationship between FIGS. 38 and 40. Similarly, since the SNR correction unit 67 has been described with reference to FIGS. 15 and 14, a detailed description of the noise eliminator shown in FIG. 42 will be omitted.

【0169】(第15の実施の形態)図43は、本発明
のノイズ除去装置の第15の実施の形態の全体構成を示
すブロック図である。図20に示したノイズ除去装置と
の相違点は、推定雑音計算部5が推定雑音計算部53で
置換されていることと、音声検出部4が存在しないこと
である。すなわち、雑音の推定に音声検出部を必要とし
ない構成になっている。以下、これらの相違点を中心に
詳細に説明する。図44は、図43における推定雑音計
算部53の構成を示すブロック図である。図24に示し
た推定雑音計算部5との相違点は、周波数別推定雑音計
算部5040 〜504K-1 が周波数別推定雑音計算部5
080 〜508K-1 に置換されていることと、推定雑音
計算部53が入力信号に音声検出フラグを有していない
ことである。図45を参照しながら、周波数別推定雑音
計算部5080 〜508K- 1 の構成と動作を詳細に説明
する。
(Fifteenth Embodiment) FIG. 43 shows the present invention.
15 shows an overall configuration of a fifteenth embodiment of the noise eliminator
It is a block diagram. With the noise eliminator shown in FIG.
The difference is that the estimated noise calculation unit 5
It has been replaced and that the voice detector 4 does not exist
Is. That is, a voice detector is required for noise estimation.
It is not configured. Below, focusing on these differences
The details will be described. FIG. 44 shows the estimated noise meter in FIG.
It is a block diagram showing a configuration of a calculation unit 53. Shown in Figure 24
The difference from the estimated noise calculator 5 is that
Arithmetic part 5040 ~ 504K-1 Is the estimated noise calculation section 5 for each frequency
080 ~ 508K-1 Replaced with the estimated noise
The calculator 53 does not have a voice detection flag in the input signal
That is. Estimation noise by frequency with reference to FIG.
Calculation unit 5080 ~ 508K- 1 Explains the configuration and operation of
To do.

【0170】図45は、図44に示した推定雑音計算部
53に含まれる周波数別推定雑音計算部5080 〜50
K-1 の構成を示すブロック図である。図25に示した
周波数別推定雑音計算部504との相違点は、更新判定
部520が更新判定部522に置換されていることと、
5080 〜508K-1 が入力信号に音声検出フラグを有
していないことである。図46は、図45に示した周波
数別推定雑音計算部508に含まれる更新判定部522
の構成を示すブロック図である。図26に示した更新判
定部520との相違点は、論理和計算部5201が論理
和計算部5221に置換されていること、更新判定部5
22が論理否定回路5202を有していないこと、入力
信号に音声検出フラグを有していないことである。すな
わち、更新判定部522は、推定雑音の更新に音声検出
フラグを用いていない。この点が、図26に示した更新
判定部520と異なる。
FIG. 45 shows the frequency-dependent estimated noise calculators 508 0 to 50 included in the estimated noise calculator 53 shown in FIG.
It is a block diagram which shows the structure of 8K-1 . The difference from the frequency-dependent estimated noise calculation unit 504 shown in FIG. 25 is that the update determination unit 520 is replaced with the update determination unit 522.
That is, 508 0 to 508 K-1 do not have a voice detection flag in the input signal. FIG. 46 shows an update determination unit 522 included in the frequency-dependent estimated noise calculation unit 508 shown in FIG.
3 is a block diagram showing the configuration of FIG. The difference from the update determination unit 520 shown in FIG. 26 is that the logical sum calculation unit 5201 is replaced by the logical sum calculation unit 5221.
22 does not have the logical negation circuit 5202, and does not have a voice detection flag in the input signal. That is, the update determination unit 522 does not use the voice detection flag for updating the estimated noise. This point is different from the update determination unit 520 shown in FIG.

【0171】論理和計算部5221は、比較部5205
の出力値と比較部5203の出力値の論理和を計算し、
計算結果を図45におけるスイッチ5044、シフトレ
ジスタ5045及びカウンタ5049に出力する。すな
わち、更新判定部522は、カウント値が予め設定され
た値に到達するまでは常に“1”を出力し、到達した後
は、劣化音声パワーが閾値よりも小さいときに“1”を
出力する。図26を用いて説明した通り、比較部520
5は劣化音声信号が雑音であるか否かの判定を行なって
いる。すなわち、比較部5205は各周波数毎に音声検
出を行なっていると言える。従って、音声検出フラグを
入力信号に有しない更新判定部や推定雑音計算部を実現
することが可能となる。
The logical sum calculation unit 5221 includes a comparison unit 5205.
And the output value of the comparison unit 5203 is calculated, and
The calculation result is output to the switch 5044, the shift register 5045, and the counter 5049 in FIG. That is, the update determination unit 522 always outputs "1" until the count value reaches the preset value, and after reaching the count value, outputs "1" when the deteriorated voice power is smaller than the threshold value. . As described using FIG. 26, the comparison unit 520
5 determines whether or not the deteriorated voice signal is noise. That is, it can be said that the comparison unit 5205 performs voice detection for each frequency. Therefore, it is possible to realize the update determination unit and the estimated noise calculation unit that do not have the voice detection flag in the input signal.

【0172】(第16の実施の形態)図47は、本発明
のノイズ除去装置の第16の実施の形態の全体構成を示
すブロック図である。図43に示したノイズ除去装置と
の相違点は、注入雑音計算部58、加算器56,57
が、SNR補正部67に置換されていることである。図
43と図47の関係は、図1と図5の関係、図10と図
14の関係、図20と図33の関係、図34と図37の
関係、図38と図40の関係、及び図41と図42の関
係に等しく、SNR補正部67については図15及び1
4を参照して説明したので、図47に示したノイズ除去
装置に関する詳細な説明は省略する。
(Sixteenth Embodiment) FIG. 47 is a block diagram showing the overall structure of a sixteenth embodiment of the noise removing apparatus of the present invention. The difference from the noise removing apparatus shown in FIG. 43 is that the injection noise calculating section 58 and the adders 56 and 57 are
Is replaced by the SNR correction unit 67. The relationship between FIGS. 43 and 47 is the relationship between FIGS. 1 and 5, the relationship between FIGS. 10 and 14, the relationship between FIGS. 20 and 33, the relationship between FIGS. 34 and 37, the relationship between FIGS. The relationship is the same as that of FIG. 41 and FIG.
Since it has been described with reference to FIG. 4, the detailed description of the noise elimination device shown in FIG. 47 will be omitted.

【0173】図20、図33、図34、図37、図3
8、図40〜図43、図47に関しても、図10と図1
2及び図14と図17の関係に相当するような、劣化音
声信号の代わりに劣化音声パワースペクトルを用いた選
択的な雑音注入が可能であるが、構成は明らかなので、
詳細は省略する。
20, FIG. 33, FIG. 34, FIG. 37, FIG.
8, FIG. 40 to FIG. 43, and FIG. 47, FIG. 10 and FIG.
2 and selective noise injection using the degraded voice power spectrum instead of the degraded voice signal as in the relationship between FIG. 14 and FIG. 17 is possible, but the configuration is clear,
Details are omitted.

【0174】これまで説明したすべての実施の形態で
は、ノイズ除去の方式として、最小平均2乗誤差短時間
スペクトル振幅法を仮定してきたが、その他の方法にも
適用することができる。このような方法の例として、
「1979年12月、プロシーディングス・オブ・ザ・
アイ・イー・イー・イー、第67巻、第12号(PROCEE
DINGS OF THE IEEE, VOL.67, NO.12, PP.1586-1604, DE
C, 1979 )、1586〜1604ページ」(文献9)に
開示されているウィーナーフィルタ法や「1979年4
月、アイ・イー・イー・イー・トランザクションズ・オ
ン・アクースティクス・スピーチ・アンド・シグナル・
プロセシング、第27巻、第2号(IEEE TRANSACTIONS
ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.2
7, NO.2, PP.113-120, APR, 1979)、113〜120ペ
ージ」(文献10)に開示されているスペクトル減算法
などがあるが、これらの詳細な構成例については、説明
を省略する。
In all the embodiments described so far, the minimum mean square error short-time spectrum amplitude method has been assumed as the noise removal method, but it can be applied to other methods. As an example of such a method,
"December 1979, Proceedings of the
I E E E Vol. 67, No. 12 (PROCEE
DINGS OF THE IEEE, VOL.67, NO.12, PP.1586-1604, DE
C, 1979), pp. 1586-1604 "(Reference 9) and the Wiener filter method and" 1979 4
Mon, I E E Transactions On Auctions Speech And Signal
Processing, Volume 27, Issue 2 (IEEE TRANSACTIONS
ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VOL.2
7, NO.2, PP.113-120, APR, 1979), pages 113 to 120 ”(Reference 10), and the like, but a detailed configuration example of these will be described. Omit it.

【0175】文献10に開示されているスペクトル減算
法の概略動作に関しては、例えば、図43及び図47を
参照することができる。図43及び図47において、多
重乗算部16を多重減算部に、雑音抑圧係数生成部8を
雑音抑圧量計算部に、抑圧係数補正部15を抑圧量補正
部に置き換えれば、スペクトル減算法による動作を実現
することができる。多重減算部において、補正された雑
音抑圧量を劣化音声振幅スペクトルから減算し、得られ
た結果を逆フーリエ変換することによって、強調音声を
得ることができる。ここでは、SNRを計算してから、
SNRに基づいて雑音抑圧量を計算する例について説明
したが、推定雑音計算部53で得られた推定雑音を、直
接劣化音声振幅スペクトルから減算することもできる。
Regarding the schematic operation of the spectral subtraction method disclosed in Document 10, for example, FIGS. 43 and 47 can be referred to. 43 and 47, if the multiplex multiplication unit 16 is replaced with a multiple subtraction unit, the noise suppression coefficient generation unit 8 is replaced with a noise suppression amount calculation unit, and the suppression coefficient correction unit 15 is replaced with a suppression amount correction unit, the operation by the spectrum subtraction method is performed. Can be realized. In the multiple subtraction unit, the corrected noise suppression amount is subtracted from the deteriorated voice amplitude spectrum, and the obtained result is subjected to the inverse Fourier transform to obtain the emphasized voice. Here, after calculating the SNR,
Although the example of calculating the noise suppression amount based on the SNR has been described, the estimated noise obtained by the estimated noise calculation unit 53 can be directly subtracted from the deteriorated speech amplitude spectrum.

【0176】[0176]

【発明の効果】以上説明したように、本発明では、入力
信号に基づいて擬似的な雑音を生成し、この擬似的な雑
音を注入して得られた抑圧係数を用いる。抑圧係数を定
めるときに上述した擬似的な雑音を注入することによ
り、特定の統計モデルに従う背景雑音を仮定して導出し
た抑圧係数を入力信号に応じて補正し、その統計モデル
に従わない雑音を効果的に除去することができる。従っ
て、あらゆる背景雑音に対して十分高い品質の強調音声
を得ることができる。
As described above, in the present invention, pseudo noise is generated based on an input signal, and the suppression coefficient obtained by injecting this pseudo noise is used. By injecting the above-mentioned pseudo noise when determining the suppression coefficient, the suppression coefficient derived assuming the background noise according to a specific statistical model is corrected according to the input signal, and noise that does not follow the statistical model is corrected. It can be effectively removed. Therefore, it is possible to obtain the emphasized speech of sufficiently high quality for all background noises.

【0177】また、本発明では、周波数領域の強調音声
を変換した時間領域信号に窓がけ処理を施す。周波数領
域の強調音声を変換した時間領域信号の隣接する2フレ
ームを重ね合わせ加算する場合に、重ね合わせ加算の対
象となった信号サンプルが各フレームにおいて異なった
抑圧係数値で抑圧されたとしても、各フレームを窓がけ
処理してフレーム境界における信号サンプルの振幅を小
さくすることによって、フレーム境界における信号サン
プルの連続性を改善することができる。これにより、雑
音の発生を防止し、雑音による音質の劣化を低減するこ
とができる。
Further, according to the present invention, windowing processing is applied to the time domain signal obtained by converting the emphasized speech in the frequency domain. When two adjacent frames of the time domain signal obtained by converting the emphasized speech in the frequency domain are superposed and added, even if the signal sample to be superposed and added is suppressed by different suppression coefficient values in each frame, The continuity of the signal samples at the frame boundaries can be improved by windowing each frame to reduce the amplitude of the signal samples at the frame boundaries. Thereby, it is possible to prevent the generation of noise and reduce the deterioration of the sound quality due to the noise.

【図面の簡単な説明】[Brief description of drawings]

【図1】 本発明のノイズ除去装置の第1の実施の形態
の全体構成を示すブロック図である。
FIG. 1 is a block diagram showing an overall configuration of a first embodiment of a noise removing device of the present invention.

【図2】 図1に示したノイズ除去装置に含まれる注入
雑音計算部の第1の構成を示すブロック図である。
FIG. 2 is a block diagram showing a first configuration of an injection noise calculation unit included in the noise removal device shown in FIG.

【図3】 SNRと注入雑音の関係の一例を示す図であ
る。
FIG. 3 is a diagram showing an example of a relationship between SNR and injection noise.

【図4】 SNRに対する抑圧係数の特性の一例を示す
図である。
FIG. 4 is a diagram showing an example of characteristics of suppression coefficients with respect to SNR.

【図5】 本発明のノイズ除去装置の第2の実施の形態
の全体構成を示すブロック図である。
FIG. 5 is a block diagram showing an overall configuration of a second embodiment of a noise removing device of the present invention.

【図6】 図5に示したノイズ除去装置に含まれるSN
R補正部の第1の構成を示すブロック図である。
6 is an SN included in the noise removing device shown in FIG.
It is a block diagram which shows the 1st structure of an R correction part.

【図7】 図6に示したSNR補正部に含まれる補正S
NR計算部の構成を示すブロック図である。
7 is a correction S included in the SNR correction unit shown in FIG.
It is a block diagram which shows the structure of an NR calculation part.

【図8】 SNR補正部の第2の構成を示すブロック図
である。
FIG. 8 is a block diagram showing a second configuration of an SNR correction unit.

【図9】 図8に示したSNR補正部に含まれる補正S
NR計算部の構成を示すブロック図である。
9 is a correction S included in the SNR correction unit shown in FIG.
It is a block diagram which shows the structure of an NR calculation part.

【図10】 本発明のノイズ除去装置の第3の実施の形
態の全体構成を示すブロック図である。
FIG. 10 is a block diagram showing an overall configuration of a third embodiment of a noise removing device of the present invention.

【図11】 注入雑音計算部の第2の構成を示すブロッ
ク図である。
FIG. 11 is a block diagram showing a second configuration of the injection noise calculation unit.

【図12】 本発明のノイズ除去装置の第4の実施の形
態の全体構成を示すブロック図である。
FIG. 12 is a block diagram showing an overall configuration of a fourth embodiment of a noise removing device of the invention.

【図13】 注入雑音計算部の第3の構成を示すブロッ
ク図である。
FIG. 13 is a block diagram showing a third configuration of the injection noise calculation unit.

【図14】 本発明のノイズ除去装置の第5の実施の形
態の全体構成を示すブロック図である。
FIG. 14 is a block diagram showing an overall configuration of a fifth embodiment of a noise removing device of the invention.

【図15】 SNR補正部の第3の構成を示すブロック
図である。
FIG. 15 is a block diagram showing a third configuration of the SNR correction unit.

【図16】 注入雑音計算部の第4の構成を示すブロッ
ク図である。
FIG. 16 is a block diagram showing a fourth configuration of the injection noise calculation unit.

【図17】 本発明のノイズ除去装置の第6の実施の形
態の全体構成を示すブロック図である。
FIG. 17 is a block diagram showing an overall configuration of a sixth embodiment of a noise removing device of the present invention.

【図18】 SNR補正部の第4の構成を示すブロック
図である。
FIG. 18 is a block diagram showing a fourth configuration of the SNR correction unit.

【図19】 注入雑音計算部の第5の構成を示すブロッ
ク図である。
FIG. 19 is a block diagram showing a fifth configuration of the injection noise calculation unit.

【図20】 本発明のノイズ除去装置の第7の実施の形
態の全体構成を示すブロック図である。
FIG. 20 is a block diagram showing the overall configuration of a seventh embodiment of a noise removal device of the present invention.

【図21】 図20に示したノイズ除去装置に含まれる
重みつき劣化音声計算部の構成を示すブロック図であ
る。
21 is a block diagram showing a configuration of a weighted deteriorated speech calculation unit included in the noise removal apparatus shown in FIG.

【図22】 図21に示した重みつき劣化音声計算部に
含まれる多重非線形処理部の構成を示すブロック図であ
る。
22 is a block diagram showing a configuration of a multiplex nonlinear processor included in the weighted deteriorated speech calculator shown in FIG. 21.

【図23】 非線形処理部における非線形関数の一例を
示す図である。
FIG. 23 is a diagram showing an example of a non-linear function in a non-linear processing unit.

【図24】 図20に示したノイズ除去装置に含まれる
推定雑音計算部の第1の構成を示すブロック図である。
FIG. 24 is a block diagram showing a first configuration of an estimated noise calculator included in the noise eliminator shown in FIG.

【図25】 図24に示した推定雑音計算部に含まれる
周波数別推定雑音計算部の第1の構成を示すブロック図
である。
25 is a block diagram showing a first configuration of a frequency-specific estimated noise calculation unit included in the estimated noise calculation unit shown in FIG. 24.

【図26】 図25に示した周波数別推定雑音計算部に
含まれる更新判定部の構成を示すブロック図である。
26 is a block diagram showing a configuration of an update determination unit included in the frequency-dependent estimated noise calculation unit shown in FIG. 25.

【図27】 周波数別推定雑音計算部の第2の構成を示
すブロック図である。
FIG. 27 is a block diagram showing a second configuration of the frequency-dependent estimated noise calculation unit.

【図28】 図20に示したノイズ除去装置に含まれる
抑圧係数補正部の構成を示すブロック図である。
28 is a block diagram showing a configuration of a suppression coefficient correction unit included in the noise removal device shown in FIG.

【図29】 図28に示した抑圧係数補正部に含まれる
周波数別抑圧係数補正部の構成を示すブロック図であ
る。
29 is a block diagram showing the configuration of a frequency-specific suppression coefficient correction unit included in the suppression coefficient correction unit shown in FIG. 28.

【図30】 雑音抑圧係数生成部の第2の構成を示すブ
ロック図である。
FIG. 30 is a block diagram showing a second configuration of the noise suppression coefficient generation unit.

【図31】 周波数別SNR計算部の第2の構成を示す
ブロック図である。
FIG. 31 is a block diagram showing a second configuration of a frequency-specific SNR calculation unit.

【図32】 図31に示した周波数別SNR計算部に含
まれる帯域別パワー計算部の構成を示すブロック図であ
る。
32 is a block diagram illustrating a configuration of a band-specific power calculation unit included in the frequency-based SNR calculation unit illustrated in FIG. 31.

【図33】 本発明のノイズ除去装置の第8の実施の形
態の全体構成を示すブロック図である。
FIG. 33 is a block diagram showing the overall configuration of an eighth embodiment of a noise removal device of the present invention.

【図34】 本発明のノイズ除去装置の第9の実施の形
態の全体構成を示すブロック図である。
FIG. 34 is a block diagram showing an overall configuration of a ninth embodiment of a noise removal device of the present invention.

【図35】 推定雑音計算部の第2の構成を示すブロッ
ク図である。
FIG. 35 is a block diagram showing a second configuration of the estimated noise calculation unit.

【図36】 図35に示した推定雑音計算部に含まれる
周波数別推定雑音計算部の構成を示すブロック図であ
る。
36 is a block diagram showing a configuration of a frequency-specific estimated noise calculation unit included in the estimated noise calculation unit shown in FIG. 35.

【図37】 本発明のノイズ除去装置の第10の実施の
形態の全体構成を示すブロック図である。
FIG. 37 is a block diagram showing the overall structure of a tenth embodiment of a noise eliminator of the present invention.

【図38】 本発明のノイズ除去装置の第11の実施の
形態の全体構成を示すブロック図である。
FIG. 38 is a block diagram showing the overall configuration of an eleventh embodiment of a noise removal device of the present invention.

【図39】 図38に示したノイズ除去装置に含まれる
推定先天的SNR計算部の構成を示すブロック図であ
る。
39 is a block diagram showing a configuration of an estimated a priori SNR calculation unit included in the noise eliminator shown in FIG.

【図40】 本発明のノイズ除去装置の第12の実施の
形態の全体構成を示すブロック図である。
FIG. 40 is a block diagram showing an overall configuration of a twelfth embodiment of a noise removal device of the present invention.

【図41】 本発明のノイズ除去装置の第13の実施の
形態の全体構成を示すブロック図である。
FIG. 41 is a block diagram showing the overall configuration of a thirteenth embodiment of a noise removal device of the present invention.

【図42】 本発明のノイズ除去装置の第14の実施の
形態の全体構成を示すブロック図である。
FIG. 42 is a block diagram showing the overall configuration of a fourteenth embodiment of a noise removal device of the present invention.

【図43】 本発明のノイズ除去装置の第15の実施の
形態の全体構成を示すブロック図である。
FIG. 43 is a block diagram showing the overall configuration of a fifteenth embodiment of a noise removal device of the present invention.

【図44】 推定雑音計算部の第3の構成を示すブロッ
ク図である。
FIG. 44 is a block diagram showing a third configuration of the estimated noise calculation unit.

【図45】 図44に示した推定雑音計算部に含まれる
周波数別推定雑音計算部の構成を示すブロック図であ
る。
45 is a block diagram showing a configuration of a frequency-specific estimated noise calculation unit included in the estimated noise calculation unit shown in FIG. 44.

【図46】 図45に示した周波数別推定雑音計算部含
まれる更新判定部の構成を示すブロック図である。
FIG. 46 is a block diagram showing the configuration of an update determination unit included in the frequency-dependent estimated noise calculation unit shown in FIG. 45.

【図47】 本発明のノイズ除去装置の第16の実施の
形態の全体構成を示すブロック図である。
FIG. 47 is a block diagram showing the overall configuration of a sixteenth embodiment of a noise removal device of the present invention.

【図48】 従来のノイズ除去装置の全体構成を示すブ
ロック図である。
FIG. 48 is a block diagram showing an overall configuration of a conventional noise removal device.

【図49】 従来のノイズ除去装置に含まれる音声検出
部の構成を示すブロック図である。
FIG. 49 is a block diagram showing a configuration of a voice detection unit included in a conventional noise removal device.

【図50】 図49に示した音声検出部に含まれるパワ
ー計算部の構成を示すブロック図である。
50 is a block diagram showing a configuration of a power calculation unit included in the voice detection unit shown in FIG. 49.

【図51】 図49に示した音声検出部に含まれる重み
つき加算部の構成を示すブロック図である。
51 is a block diagram showing a configuration of a weighted addition unit included in the voice detection unit shown in FIG. 49.

【図52】 従来のノイズ除去装置に含まれる多重乗算
部の構成を示すブロック図である。
FIG. 52 is a block diagram showing a configuration of a multiple multiplication unit included in a conventional noise removal device.

【図53】 従来のノイズ除去装置に含まれる推定雑音
計算部の構成を示すブロック図である。
FIG. 53 is a block diagram showing a configuration of an estimated noise calculation unit included in a conventional noise removal device.

【図54】 図53に示した推定雑音計算部に含まれる
周波数別推定雑音計算部の構成を示すブロック図であ
る。
54 is a block diagram showing a configuration of a frequency-specific estimated noise calculation unit included in the estimated noise calculation unit shown in FIG. 53.

【図55】 図54に示した周波数別推定雑音計算部に
含まれるの更新判定部の構成を示すブロック図である。
FIG. 55 is a block diagram showing a configuration of an update determination unit included in the frequency-dependent estimated noise calculation unit shown in FIG. 54.

【図56】 従来のノイズ除去装置に含まれる周波数別
SNR計算部の構成を示すブロック図である。
FIG. 56 is a block diagram showing a configuration of a frequency-specific SNR calculation unit included in a conventional noise removal device.

【図57】 従来のノイズ除去装置に含まれる推定先天
的SNR計算部の構成を示すブロック図である。
FIG. 57 is a block diagram showing a configuration of an estimated a priori SNR calculation unit included in a conventional noise removal device.

【図58】 図57に示した推定先天的SNR計算部に
含まれる多重値域限定処理部の構成を示すブロック図で
ある。
58 is a block diagram showing a configuration of a multiple range limitation processing unit included in the estimated a priori SNR calculation unit shown in FIG. 57.

【図59】 図57に示した推定先天的SNR計算部に
含まれる多重重みつき加算部の構成を示すブロック図で
ある。
59 is a block diagram showing a configuration of a multiple weighted addition unit included in the estimated a priori SNR calculation unit shown in FIG. 57.

【図60】 従来のノイズ除去装置に含まれる雑音抑圧
係数生成部の構成を示すブロック図である。
FIG. 60 is a block diagram showing a configuration of a noise suppression coefficient generation unit included in a conventional noise removal device.

【図61】 図60に示した雑音抑圧係数生成部に含ま
れる抑圧係数検索部の構成を示すブロック図である。
61 is a block diagram showing a configuration of a suppression coefficient search unit included in the noise suppression coefficient generation unit shown in FIG. 60.

【符号の説明】[Explanation of symbols]

1…フレーム分割部、2,22…窓がけ処理部、3…フ
ーリエ変換部、4…音声検出部、5,51,52,53
…推定雑音計算部、6,61,715,1402…周波
数別SNR計算部、7,71…推定先天的SNR計算
部、8,81…雑音抑圧係数生成部、9…逆フーリエ変
換部、10…フレーム合成部、11…入力端子、12…
出力端子、13,5049…カウンタ、14…重みつき
劣化音声計算部、15…抑圧係数補正部、16,17,
704,705,716,1404…多重乗算部、5
5,58,59,662,672,682,6542…
注入雑音計算部、56,57,708,4063,40
72,4074,5046,61100 〜6110
M-1 ,6543,6544…加算器、65,66,6
7,68…SNR補正部、401,1593,520
4,5206…閾値記憶部、402,1594,520
3,5205,67233…比較部、404,4075
…定数乗算器、405…対数計算部、406…パワー計
算部、407,5071,70710 〜7071K-1
重みつき加算部、408,706,5072…重み記憶
部、409,5202…論理否定回路、502,50
5,602,603,802,803,1495,15
02,1503,1702,1703,4061,50
3,604,655,804,1475,1504,1
704,6115,7014,7075…多重化部、5
040 〜504K-1 ,5060 〜506 K-1 ,507,
5080 〜508K-1 ,5140 〜514K-1 …周波数
別推定雑音計算部、520,521,522…更新判定
部、551…SNR計算部、552,6541…しきい
値計算部、553,6721…注入レベル計算部、58
1,67232…ゼロ交叉計算部、582,1595,
5044,6722…スイッチ、591,68232…
高域電力計算部、6010 〜601K-1 ,5041,5
048,6545…除算部、611,612…周波数別
パワー計算部、651,652,653,6111,7
013,7072,7074…分離部、6540 〜65
K-1 ,6640 〜664K-1 …補正SNR計算部、6
61,663…平均値計算部、701…多重値域限定処
理部、702…後天的SNR記憶部、703…抑圧係数
記憶部、707…多重重みつき加算部、712,140
1,5942…推定雑音記憶部、713…強調音声パワ
ースペクトル記憶部、8010〜801K-1 …抑圧係数
検索部、811…MMSE STSAゲイン関数値計算
部、812…一般化尤度比計算部、813…音声存在確
率記憶部、814…抑圧係数計算部、901…劣化音声
パワー、902…閾値、903,923…重み、904
…更新閾値、905…重みつき加算部制御信号、910
0 〜910K-1 ,9100 〜910ML-1…周波数別劣化
音声パワースペクトル、9110 〜911 K-1 ,911
0 〜911ML-1…帯域別劣化音声パワースペクトル、9
21…瞬時推定SNR、9210 〜921K-1 …周波数
別瞬時推定SNR、922…過去の推定SNR、922
0 〜922K-1 …過去の周波数別推定SNR、924…
推定先天的SNR、9240 〜924K-1 …周波数別推
定先天的SNR、1405…多重非線形処理部、148
0 〜1485K-1 ,5042…非線形処理部、150
0 〜1501K-1 …周波数別抑圧係数補正部、159
1,70120 〜7012K-1 …最大値選択部、159
2…抑圧係数下限値記憶部、1596…修正量記憶部、
1597,17010 〜1701K-1 ,40620 〜4
062K-1 ,4071,4073,5043…乗算器、
5045…シフトレジスタ、5047…最小値選択部、
5201,5211,5221…論理和計算部、520
7…閾値計算部、5941…レジスタ長記憶部、672
3,6823…判定部、7011…定数記憶部、801
1…抑圧係数テーブル、8012,8013…アドレス
変換部、67231…無音区間検出部。
1 ... Frame division unit, 2, 22 ... Windowing processing unit, 3 ... Frame
Fourier transforming unit, 4 ... Voice detecting unit, 5, 51, 52, 53
... Estimated noise calculator, 6, 61, 715, 1402 ... Frequency
SNR calculator by number, 7, 71 ... Estimated innate SNR calculation
, 8, 81 ... Noise suppression coefficient generator, 9 ... Inverse Fourier transform
Conversion unit, 10 ... Frame synthesizing unit, 11 ... Input terminal, 12 ...
Output terminal, 13, 5049 ... Counter, 14 ... Weighted
Degraded speech calculation unit, 15 ... Suppression coefficient correction unit, 16, 17,
704, 705, 716, 1404 ... Multiplexing unit, 5
5, 58, 59, 662, 672, 682, 6542 ...
Injection noise calculator, 56, 57, 708, 4063, 40
72,4074,5046,61100 ~ 6110
M-1 , 6543, 6544 ... Adder, 65, 66, 6
7, 68 ... SNR correction unit, 401, 1593, 520
4, 5206 ... Threshold storage unit, 402, 1594, 520
3, 5205, 67233 ... Comparison section, 404, 4075
... Constant multiplier, 405 ... Logarithmic calculator, 406 ... Power meter
Arithmetic unit, 407, 5071, 70710 ~ 7071K-1 …
Weighted addition unit, 408, 706, 5072 ... Weight storage
Section, 409, 5202 ... Logical NOT circuit, 502, 50
5,602,603,802,803,1495,15
02,1503,1702,1703,4061,50
3,604,655,804,1475,1504,1
704, 6115, 7014, 7075 ... Multiplexing unit, 5
040 ~ 504K-1 , 5060 ~ 506 K-1 , 507,
5080 ~ 508K-1 , 5140 ~ 514K-1 …frequency
Another estimated noise calculation unit, 520, 521, 522 ... Update determination
Section, 551 ... SNR calculation section, 552, 6541 ... Threshold
Value calculator, 553, 6721 ... Injection level calculator, 58
1,67232 ... Zero crossing calculation unit, 582, 1595,
5044, 6722 ... Switch, 591, 68232 ...
High frequency power calculator, 6010 ~ 601K-1 , 5041, 5
048, 6545 ... Division unit, 611, 612 ... By frequency
Power calculator, 651, 652, 653, 6111, 7
013, 7072, 7074 ... Separation part, 6540 ~ 65
FourK-1 , 6640 ~ 664K-1 ... corrected SNR calculation unit, 6
61, 663 ... Average value calculation unit, 701 ... Multiple range limiting process
Science section, 702 ... Acquired SNR storage section, 703 ... Suppression coefficient
Storage unit, 707 ... Multiple weighted addition unit, 712, 140
1, 5942 ... Estimated noise storage unit, 713 ... Enhanced speech power
-Spectrum storage unit, 8010~ 801K-1 … Suppression coefficient
Search unit, 811 ... MMSE STSA gain function value calculation
Part, 812 ... Generalized likelihood ratio calculation part, 813 ...
Rate storage unit, 814 ... Suppression coefficient calculation unit, 901 ... Degraded voice
Power, 902 ... Threshold value, 903, 923 ... Weight, 904
... update threshold value, 905 ... weighted addition unit control signal, 910
0 ~ 910K-1 , 9100 ~ 910ML-1… Deterioration by frequency
Voice power spectrum, 9110 ~ 911 K-1 , 911
0 ~ 911ML-1... Deteriorated voice power spectrum by band, 9
21 ... Instantaneous estimated SNR, 9210 ~ 921K-1 …frequency
Another instantaneous estimated SNR, 922 ... Past estimated SNR, 922
0 ~ 922K-1 ... Estimated SNR by frequency in the past, 924 ...
Estimated innate SNR, 9240 ~ 924K-1 … Inference by frequency
Constant a priori SNR, 1405 ... Multiple nonlinear processing unit, 148
50 ~ 1485K-1 , 5042 ... Non-linear processing unit, 150
10 ~ 1501K-1 ... Suppression coefficient correction unit for each frequency, 159
1,70120 ~ 7012K-1 ... Maximum value selection section, 159
2 ... Suppression coefficient lower limit storage unit, 1596 ... Correction amount storage unit,
1597, 17010 ~ 1701K-1 , 40620 ~ 4
062K-1 , 4071, 4073, 5043 ... Multipliers,
5045 ... Shift register, 5047 ... Minimum value selection unit,
5201, 5211, 5221 ... Logical sum calculator 520
7 ... Threshold value calculation unit, 5941 ... Register length storage unit, 672
3, 6823 ... Judgment unit, 7011 ... Constant storage unit, 801
1 ... Suppression coefficient table, 8012, 8013 ... Address
Conversion unit, 67231 ... Silent section detection unit.

Claims (42)

【特許請求の範囲】[Claims] 【請求項1】 入力信号を周波数領域信号に変換し、こ
の周波数領域信号を用いて信号対雑音比を求め、この信
号対雑音比に基づいて抑圧係数を定め、この抑圧係数を
用いて前記周波数領域信号を重みづけし、この重みづけ
した周波数領域信号を時間領域信号に変換することによ
って前記入力信号からノイズを除去した出力信号を得る
ノイズ除去方法において、 前記入力信号を変換した前記周波数領域信号に基づいて
擬似的な第1の雑音を計算し、この第1の雑音を前記周
波数領域信号に付加してから信号対雑音比を求めること
を特徴とするノイズ除去方法。
1. An input signal is converted into a frequency domain signal, a signal to noise ratio is obtained using this frequency domain signal, a suppression coefficient is determined based on this signal to noise ratio, and the frequency is calculated using this suppression coefficient. In a noise removal method for obtaining an output signal from which noise is removed from the input signal by weighting a domain signal and converting the weighted frequency domain signal into a time domain signal, the frequency domain signal obtained by converting the input signal A method for removing noise, characterized in that the pseudo first noise is calculated based on the above, and the signal-to-noise ratio is obtained after adding the first noise to the frequency domain signal.
【請求項2】 請求項1に記載のノイズ除去方法におい
て、 前記第1の雑音の付加を、前記入力信号の性質に応じて
選択的に行なうことを特徴とするノイズ除去方法。
2. The noise removing method according to claim 1, wherein the addition of the first noise is selectively performed according to the property of the input signal.
【請求項3】 請求項2に記載のノイズ除去方法におい
て、 前記入力信号の性質として、信号の定常性を用いること
を特徴とするノイズ除去方法。
3. The noise removing method according to claim 2, wherein the continuity of the signal is used as the property of the input signal.
【請求項4】 請求項3に記載のノイズ除去方法におい
て、 前記信号の定常性として、前記入力信号の振幅がゼロと
なるゼロ交叉の数を用いることを特徴とするノイズ除去
方法。
4. The noise removing method according to claim 3, wherein a number of zero crossings at which the amplitude of the input signal becomes zero is used as the stationarity of the signal.
【請求項5】 請求項3に記載のノイズ除去方法におい
て、 前記信号の定常性として、前記入力信号を変換した前記
周波数領域信号の高域電力を用いることを特徴とするノ
イズ除去方法。
5. The noise removing method according to claim 3, wherein the high frequency power of the frequency domain signal obtained by converting the input signal is used as the stationarity of the signal.
【請求項6】 請求項1〜5のいずれかに記載のノイズ
除去方法において、 前記入力信号を変換した前記周波数領域信号に基づいて
前記周波数領域信号に含まれる第2の雑音を推定し、こ
の第2の雑音と前記周波数領域信号とを用いて前記第1
の雑音のパワーを定めることを特徴とするノイズ除去方
法。
6. The noise removing method according to claim 1, wherein second noise included in the frequency domain signal is estimated based on the frequency domain signal obtained by converting the input signal, and the second noise is estimated. Using the second noise and the frequency domain signal,
Noise removal method characterized by determining the power of the noise of the.
【請求項7】 請求項1〜5のいずれかに記載のノイズ
除去方法において、 前記入力信号を変換した前記周波数領域信号に基づいて
前記周波数領域信号に含まれる第2の雑音を推定し、こ
の第2の雑音と前記周波数領域信号とを用いて第1の雑
音を計算し、この第1の雑音と前記周波数領域信号との
和、及び前記第1の雑音と前記第2の雑音との和を用い
て信号対雑音比を求めることを特徴とするノイズ除去方
法。
7. The noise removing method according to claim 1, wherein second noise included in the frequency domain signal is estimated based on the frequency domain signal obtained by converting the input signal, and the second noise is estimated. A first noise is calculated using the second noise and the frequency domain signal, and the sum of the first noise and the frequency domain signal and the sum of the first noise and the second noise are calculated. A noise removal method characterized by obtaining a signal-to-noise ratio using.
【請求項8】 請求項6又は7に記載のノイズ除去方法
において、 前記入力信号を変換した前記周波数領域信号を重みづけ
し、この重みづけした周波数領域信号に基づいて第2の
雑音を推定することを特徴とするノイズ除去方法。
8. The noise removing method according to claim 6, wherein the frequency domain signal obtained by converting the input signal is weighted, and the second noise is estimated based on the weighted frequency domain signal. A noise removal method characterized by the above.
【請求項9】 入力信号を周波数領域信号に変換し、こ
の周波数領域信号を用いて信号対雑音比を求め、この信
号対雑音比に基づいて抑圧係数を定め、この抑圧係数を
用いて前記周波数領域信号を重みづけし、この重みづけ
した周波数領域信号を時間領域信号に変換することによ
って前記入力信号からノイズを除去した出力信号を得る
ノイズ除去方法において、 前記入力信号を変換した前記周波数領域信号に基づいて
前記信号対雑音比の補正を行い、この補正した信号対雑
音比に基づいて抑圧係数を定めることを特徴とするノイ
ズ除去方法。
9. An input signal is converted into a frequency domain signal, a signal to noise ratio is obtained using this frequency domain signal, a suppression coefficient is determined based on this signal to noise ratio, and the frequency is calculated using this suppression coefficient. In a noise removal method for obtaining an output signal from which noise is removed from the input signal by weighting a domain signal and converting the weighted frequency domain signal into a time domain signal, the frequency domain signal obtained by converting the input signal A noise removal method characterized in that the signal-to-noise ratio is corrected based on the above, and the suppression coefficient is determined based on the corrected signal-to-noise ratio.
【請求項10】 請求項9に記載のノイズ除去方法にお
いて、 前記信号対雑音比の補正を、前記入力信号の性質に応じ
て選択的に行なうことを特徴とするノイズ除去方法。
10. The noise removing method according to claim 9, wherein the correction of the signal-to-noise ratio is selectively performed according to the property of the input signal.
【請求項11】 請求項10に記載のノイズ除去方法に
おいて、 前記入力信号の性質として、信号の定常性を用いること
を特徴とするノイズ除去方法。
11. The noise removing method according to claim 10, wherein signal steadiness is used as the property of the input signal.
【請求項12】 請求項11に記載のノイズ除去方法に
おいて、 前記信号の定常性として、前記入力信号の振幅がゼロと
なるゼロ交叉の数を用いることを特徴とするノイズ除去
方法。
12. The noise removing method according to claim 11, wherein the continuity of the signal is a number of zero crossings at which the amplitude of the input signal becomes zero.
【請求項13】 請求項11に記載のノイズ除去方法に
おいて、 前記信号の定常性として、前記入力信号を変換した前記
周波数領域信号の高域電力を用いることを特徴とするノ
イズ除去方法。
13. The noise removing method according to claim 11, wherein high frequency power of the frequency domain signal obtained by converting the input signal is used as stationarity of the signal.
【請求項14】 請求項9〜13のいずれかに記載のノ
イズ除去方法において、 前記入力信号を変換した前記周波数領域信号に基づいて
前記周波数領域信号に含まれる雑音を推定し、この雑音
と前記周波数領域信号とを用いて前記信号対雑音比の補
正量を定めることを特徴とするノイズ除去方法。
14. The noise removing method according to claim 9, wherein noise included in the frequency domain signal is estimated based on the frequency domain signal obtained by converting the input signal, and the noise and the noise are estimated. A method of removing noise, wherein a correction amount of the signal-to-noise ratio is determined using a frequency domain signal.
【請求項15】 請求項9〜13のいずれかに記載のノ
イズ除去方法において、 前記入力信号を変換した前記周波数領域信号に基づいて
前記周波数領域信号に含まれる雑音を推定し、この雑音
及び前記信号対雑音比を用いて加算信号を求め、この加
算信号と前記周波数領域信号との和、及び前記加算信号
と前記雑音との和を用いて信号対雑音比を再計算するこ
とによって前記信号対雑音比の補正を行なうことを特徴
とするノイズ除去方法。
15. The noise removing method according to claim 9, wherein noise included in the frequency domain signal is estimated based on the frequency domain signal obtained by converting the input signal, and the noise and the noise are included. A signal-to-noise ratio is used to obtain an addition signal, and the signal-to-noise ratio is recalculated using the sum of the addition signal and the frequency domain signal and the sum of the addition signal and the noise. A noise removing method characterized by correcting a noise ratio.
【請求項16】 請求項14又は15に記載のノイズ除
去方法において、 前記入力信号を変換した前記周波数領域信号を重みづけ
し、この重みづけした周波数領域信号に基づいて雑音を
推定することを特徴とするノイズ除去方法。
16. The noise removing method according to claim 14, wherein the frequency domain signal obtained by converting the input signal is weighted, and noise is estimated based on the weighted frequency domain signal. Noise removal method.
【請求項17】 請求項1〜16のいずれかに記載のノ
イズ除去方法において、 前記周波数領域信号に基づいて前記抑圧係数を補正し、
この補正した抑圧係数を用いて前記周波数領域信号を重
みづけすることを特徴とするノイズ除去方法。
17. The noise removing method according to claim 1, wherein the suppression coefficient is corrected based on the frequency domain signal,
A method of removing noise, characterized in that the frequency domain signal is weighted using the corrected suppression coefficient.
【請求項18】 請求項1〜17のいずれかに記載のノ
イズ除去方法において、 前記周波数領域信号を変換した前記時間領域信号に窓が
け処理を施すことを特徴とするノイズ除去方法。
18. The noise removing method according to claim 1, wherein the time domain signal obtained by converting the frequency domain signal is subjected to windowing processing.
【請求項19】 入力信号を周波数領域信号に変換し、
この周波数領域信号に基づいて前記周波数領域信号に含
まれる第2の雑音を推定し、この第2の雑音に対応した
値を前記周波数領域信号から差し引いて周波数領域の強
調音声を求め、この強調音声を時間領域信号に変換する
ことによって前記入力信号からノイズを除去した出力信
号を得るノイズ除去方法において、 前記入力信号を変換した前記周波数領域信号に基づいて
擬似的な第1の雑音を計算し、この第1の雑音を前記第
2の雑音に付加した雑音に対応した値を前記周波数領域
信号から差し引いて周波数領域の強調音声を求めること
を特徴とするノイズ除去方法。
19. Converting an input signal into a frequency domain signal,
The second noise included in the frequency domain signal is estimated based on the frequency domain signal, a value corresponding to the second noise is subtracted from the frequency domain signal to obtain a frequency domain enhanced voice, and the enhanced voice is obtained. A noise removal method for obtaining an output signal from which noise has been removed from the input signal by converting the input signal into a time domain signal, wherein a pseudo first noise is calculated based on the frequency domain signal obtained by converting the input signal, A noise removing method, characterized in that a value corresponding to the noise obtained by adding the first noise to the second noise is subtracted from the frequency domain signal to obtain a emphasized voice in the frequency domain.
【請求項20】 請求項19に記載のノイズ除去方法に
おいて、 前記第1の雑音の付加を、前記入力信号の性質に応じて
選択的に行なうことを特徴とするノイズ除去方法。
20. The noise removing method according to claim 19, wherein the addition of the first noise is selectively performed according to the property of the input signal.
【請求項21】 請求項20に記載のノイズ除去方法に
おいて、 前記入力信号の性質として、信号の定常性を用いること
を特徴とするノイズ除去方法。
21. The noise removing method according to claim 20, wherein the stationarity of the signal is used as the property of the input signal.
【請求項22】 請求項21に記載のノイズ除去方法に
おいて、 前記信号の定常性として、前記入力信号の振幅がゼロと
なるゼロ交叉の数を用いることを特徴とするノイズ除去
方法。
22. The noise removing method according to claim 21, wherein the stationarity of the signal is a number of zero crossings at which the amplitude of the input signal becomes zero.
【請求項23】 請求項21に記載のノイズ除去方法に
おいて、 前記信号の定常性として、前記入力信号を変換した前記
周波数領域信号の高域電力を用いることを特徴とするノ
イズ除去方法。
23. The noise removing method according to claim 21, wherein the high frequency power of the frequency domain signal obtained by converting the input signal is used as the stationarity of the signal.
【請求項24】 請求項19〜23のいずれかに記載の
ノイズ除去方法において、 前記第1の雑音のパワーを、前記周波数領域信号と前記
第2の雑音とを用いて定めることを特徴とするノイズ除
去方法。
24. The noise removing method according to claim 19, wherein the power of the first noise is determined by using the frequency domain signal and the second noise. Noise removal method.
【請求項25】 請求項19〜23のいずれかに記載の
ノイズ除去方法において、 前記入力信号を変換した前記周波数領域信号を重みづけ
し、この重みづけした周波数領域信号に基づいて第2の
雑音を推定することを特徴とするノイズ除去方法。
25. The noise removing method according to claim 19, wherein the frequency domain signal obtained by transforming the input signal is weighted, and the second noise is based on the weighted frequency domain signal. A noise removal method characterized by estimating.
【請求項26】 請求項25に記載のノイズ除去方法に
おいて、 前記入力信号を変換した前記周波数領域信号を用いて信
号対雑音比を求め、この信号対雑音比を用いて重みを求
め、この重みを用いて前記周波数領域信号を重みづけす
ることを特徴とするノイズ除去方法。
26. The noise removing method according to claim 25, wherein a signal-to-noise ratio is obtained by using the frequency domain signal obtained by converting the input signal, a weight is obtained by using the signal-to-noise ratio, and the weight is obtained. A method for removing noise, wherein the frequency domain signal is weighted using
【請求項27】 請求項25に記載のノイズ除去方法に
おいて、 前記入力信号を変換した前記周波数領域信号を用いて信
号対雑音比を求め、この信号対雑音比を非線形処理関数
によって処理して重みを求め、この重みを用いて前記周
波数領域信号を重みづけすることを特徴とするノイズ除
去方法。
27. The noise removing method according to claim 25, wherein a signal-to-noise ratio is obtained by using the frequency domain signal obtained by converting the input signal, and the signal-to-noise ratio is processed by a non-linear processing function to weight the signal. Is obtained, and the frequency domain signal is weighted using this weight.
【請求項28】 請求項19〜27のいずれかに記載の
ノイズ除去方法において、 前記周波数領域の強調音声を変換した前記時間領域信号
に窓がけ処理を施すことを特徴とするノイズ除去方法。
28. The noise removing method according to claim 19, wherein windowing processing is performed on the time domain signal obtained by converting the emphasized speech in the frequency domain.
【請求項29】 入力信号を周波数領域信号に変換し、
この周波数領域信号を用いて信号対雑音比を求め、この
信号対雑音比に基づいて抑圧係数を定め、この抑圧係数
を用いて前記周波数領域信号を重みづけし、この重みづ
けした周波数領域信号を時間領域信号に変換することに
よって前記入力信号からノイズを除去した出力信号を得
るノイズ除去方法において、 前記周波数領域信号を変換した前記時間領域信号に窓が
け処理を施すことを特徴とするノイズ除去方法。
29. Converting an input signal into a frequency domain signal,
A signal-to-noise ratio is obtained using this frequency-domain signal, a suppression coefficient is determined based on this signal-to-noise ratio, the frequency-domain signal is weighted using this suppression coefficient, and this weighted frequency-domain signal is A noise removal method for obtaining an output signal from which noise has been removed from the input signal by converting into a time domain signal, wherein the time domain signal obtained by converting the frequency domain signal is subjected to windowing processing. .
【請求項30】 入力信号を周波数領域信号に変換し、
この周波数領域信号に基づいて前記周波数領域信号に含
まれる第2の雑音を推定し、この第2の雑音に対応した
値を前記周波数領域信号から差し引いて周波数領域の強
調音声を求め、この強調音声を時間領域信号に変換する
ことによって前記入力信号からノイズを除去した出力信
号を得るノイズ除去方法において、 前記周波数領域の強調音声を変換した前記時間領域信号
に窓がけ処理を施すことを特徴とするノイズ除去方法。
30. Converting an input signal into a frequency domain signal,
The second noise included in the frequency domain signal is estimated based on the frequency domain signal, a value corresponding to the second noise is subtracted from the frequency domain signal to obtain a frequency domain enhanced voice, and the enhanced voice is obtained. To a time-domain signal to obtain an output signal from which noise has been removed from the input signal, wherein the time-domain signal obtained by converting the emphasized speech in the frequency domain is subjected to windowing processing. Noise removal method.
【請求項31】 入力信号に窓がけ処理を施して出力す
る第1の窓がけ処理部と、 この第1の窓がけ処理部により窓がけ処理された入力信
号を周波数領域信号に変換し、振幅成分と位相成分に分
離して出力する変換部と、 前記周波数領域信号の振幅成分に基づいて前記周波数領
域信号に含まれる第2の雑音を推定して出力する推定雑
音計算部と、 前記第2の雑音と前記周波数領域信号の振幅成分を用い
て擬似的な第1の雑音を計算して出力する注入雑音計算
部と、 前記第1の雑音と前記周波数領域信号の振幅成分を加算
して出力する第1の加算器と、 前記第1の雑音と前記第2の雑音を加算して出力する第
2の加算器と、 前記第1の加算器の出力信号と前記第2の加算器の出力
信号とを受けて第1の信号対雑音比を求めて出力する第
1の信号対雑音比計算部と、 前記第1の信号対雑音比に基づいて抑圧係数を定めて出
力する抑圧係数生成部と、 前記抑圧係数を用いて前記周波数領域信号の振幅成分を
重みづけして出力する第1の乗算部と、 この第1の乗算部により重みづけされた周波数領域信号
の振幅成分と前記周波数領域信号の位相成分を時間領域
信号に変換して出力する逆変換部と、 前記時間領域信号に窓がけ処理を施して出力する第2の
窓がけ処理部とを少なくとも具備することを特徴とする
ノイズ除去装置。
31. A first windowing processing section for applying windowing processing to an input signal and outputting the input signal, and an input signal windowed by the first windowing processing section is converted into a frequency domain signal, and an amplitude is obtained. A converter that separates and outputs a component and a phase component; an estimated noise calculator that estimates and outputs the second noise included in the frequency domain signal based on the amplitude component of the frequency domain signal; Noise and the amplitude component of the frequency domain signal to calculate and output a pseudo first noise, and an injection noise calculation unit that adds the amplitude components of the first noise and the frequency domain signal and outputs the result. A first adder, a second adder that adds and outputs the first noise and the second noise, an output signal of the first adder, and an output of the second adder A first signal that receives a signal and obtains and outputs a first signal-to-noise ratio A signal-to-noise ratio calculation unit, a suppression coefficient generation unit that determines and outputs a suppression coefficient based on the first signal-to-noise ratio, and weights the amplitude component of the frequency domain signal using the suppression coefficient. A first multiplying unit for outputting; an inverse transforming unit for transforming and outputting the amplitude component of the frequency domain signal and the phase component of the frequency domain signal weighted by the first multiplying unit into a time domain signal; A noise removing device comprising at least a second windowing processing unit that performs windowing processing on a time domain signal and outputs the windowed signal.
【請求項32】 請求項31に記載のノイズ除去装置に
おいて、 前記注入雑音計算部は、 前記入力信号が入力され、前記入力信号の振幅がゼロと
なるゼロ交叉の数を計算し、その計算結果に応じた制御
信号を出力するゼロ交叉計算部と、 このゼロ交叉計算部から入力された前記制御信号によっ
て前記第1の雑音を選択的にゼロに設定するスイッチと
を含むことを特徴とするノイズ除去装置。
32. The noise removing device according to claim 31, wherein the injection noise calculation unit calculates the number of zero crossings at which the input signal is input and the amplitude of the input signal is zero, and the calculation result is obtained. A zero crossing calculation section for outputting a control signal according to the above, and a switch for selectively setting the first noise to zero according to the control signal input from the zero crossing calculation section. Removal device.
【請求項33】 請求項31に記載のノイズ除去装置に
おいて、 前記注入雑音計算部は、 前記変換部から入力された前記周波数領域信号の振幅成
分の高域電力を計算し、その計算結果に応じた制御信号
を出力する高域電力計算部と、 この高域電力計算部から入力された前記制御信号によっ
て前記第1の雑音を選択的にゼロに設定するスイッチと
を含むことを特徴とするノイズ除去装置。
33. The noise eliminator according to claim 31, wherein the injection noise calculation unit calculates the high frequency power of the amplitude component of the frequency domain signal input from the conversion unit, and according to the calculation result. And a switch for selectively setting the first noise to zero according to the control signal input from the high band power calculation unit. Removal device.
【請求項34】 請求項31〜33のいずれかに記載の
ノイズ除去装置において、 前記周波数領域信号の振幅成分を重みづけし、得られた
重みつき振幅成分を前記推定雑音計算部に出力し、前記
推定雑音計算部に前記重みつき振幅成分に基づいて前記
第2の雑音を推定させる重みつき劣化音声計算部を更に
具備することを特徴とするノイズ除去装置。
34. The noise removing device according to claim 31, wherein the amplitude component of the frequency domain signal is weighted, and the obtained weighted amplitude component is output to the estimated noise calculation unit, The noise removing apparatus further comprising a weighted deteriorated speech calculation unit that causes the estimated noise calculation unit to estimate the second noise based on the weighted amplitude component.
【請求項35】 請求項34に記載のノイズ除去装置に
おいて、 前記重みつき劣化音声計算部は、 前記周波数領域信号の振幅成分を用いて第2の信号対雑
音比を計算して出力する第2の信号対雑音比計算部と、 この第2の信号対雑音比計算部から入力された前記第2
の信号対雑音比を非線形関数によって処理して重みを求
め出力する非線形処理部と、 この非線形処理部から入力された前記重みを用いて前記
周波数領域信号の振幅成分を重みづけし、前記推定雑音
計算部に出力する第2の乗算部とを含むことを特徴とす
るノイズ除去装置。
35. The noise removing apparatus according to claim 34, wherein the weighted deteriorated speech calculation unit calculates and outputs a second signal-to-noise ratio using an amplitude component of the frequency domain signal. And a second signal-to-noise ratio calculation section that is input from the second signal-to-noise ratio calculation section.
A non-linear processing unit that processes the signal-to-noise ratio of the signal by a non-linear function to obtain a weight and outputs the weight, and an amplitude component of the frequency domain signal is weighted using the weight input from the non-linear processing unit, and the estimated noise A noise removing device, comprising: a second multiplying unit that outputs the calculating unit.
【請求項36】 請求項31〜35のいずれかに記載の
ノイズ除去装置において、 前記抑圧係数生成部から入力された前記抑圧係数を、前
記周波数領域信号に基づいて補正して前記第1の乗算部
に出力し、前記第1の乗算部に補正した抑圧係数を用い
て前記周波数領域信号の振幅成分を重みづけさせる抑圧
係数補正部を更に具備することを特徴とするノイズ除去
装置。
36. The noise removing device according to claim 31, wherein the suppression coefficient input from the suppression coefficient generation unit is corrected based on the frequency domain signal, and the first multiplication is performed. The noise removal apparatus further comprising a suppression coefficient correction unit that outputs the amplitude component of the frequency domain signal using the suppression coefficient corrected by the first multiplication unit.
【請求項37】 入力信号に窓がけ処理を施して出力す
る第1の窓がけ処理部と、 この第1の窓がけ処理部により窓がけ処理された入力信
号を周波数領域信号に変換し、振幅成分と位相成分に分
離して出力する変換部と、 前記周波数領域信号の振幅成分を用いて第1の信号対雑
音比を求めて出力する第1の信号対雑音比計算部と、 前記周波数領域信号の振幅成分に基づいて前記周波数領
域信号に含まれる雑音を推定して出力する推定雑音計算
部と、 前記雑音と前記周波数領域信号の振幅成分を用いて前記
第1の信号対雑音比を補正し、補正信号対雑音比として
出力する信号対雑音比補正部と、 前記補正信号対雑音比に基づいて抑圧係数を定めて出力
する抑圧係数生成部と、 前記抑圧係数を用いて前記周波数領域信号の振幅成分を
重みづけして出力する第1の乗算部と、 この第1の乗算部により重みづけされた周波数領域信号
の振幅成分と前記周波数領域信号の位相成分を時間領域
信号に変換して出力する逆変換部と、 前記時間領域信号に窓がけ処理を施す第2の窓がけ処理
部とを少なくとも具備することを特徴とするノイズ除去
装置。
37. A first windowing processing section for subjecting an input signal to windowing processing and outputting the same, and an input signal subjected to windowing processing by the first windowing processing section is converted into a frequency domain signal to obtain an amplitude. A converter for separating and outputting a component and a phase component; a first signal-to-noise ratio calculator for calculating and outputting a first signal-to-noise ratio using the amplitude component of the frequency-domain signal; An estimated noise calculator that estimates and outputs noise included in the frequency domain signal based on the amplitude component of the signal, and corrects the first signal-to-noise ratio using the noise and the amplitude component of the frequency domain signal. Then, a signal-to-noise ratio correction unit that outputs as a correction signal-to-noise ratio, a suppression coefficient generation unit that determines and outputs a suppression coefficient based on the corrected signal-to-noise ratio, and the frequency-domain signal using the suppression coefficient. Weight the amplitude components of A first multiplication unit that outputs the frequency domain signal and an inverse transformation unit that converts the amplitude component of the frequency domain signal weighted by the first multiplication unit and the phase component of the frequency domain signal into a time domain signal and outputs the time domain signal. A noise removing device comprising at least a second windowing processing unit that performs windowing processing on the time domain signal.
【請求項38】 請求項37に記載のノイズ除去装置に
おいて、 前記信号対雑音比補正部は、 前記入力信号が入力され、前記入力信号の振幅がゼロと
なるゼロ交叉の数を計算し、その計算結果に応じた制御
信号を出力する判定部と、 この判定部から入力された前記制御信号によって前記補
正信号対雑音比を選択的に補正前の前記第1の信号対雑
音比と同じ値に設定するスイッチとを含むことを特徴と
するノイズ除去装置。
38. The noise removing device according to claim 37, wherein the signal-to-noise ratio correction unit calculates the number of zero crossings at which the input signal is input and the amplitude of the input signal is zero. A determination unit that outputs a control signal according to a calculation result, and the correction signal-to-noise ratio is selectively set to the same value as the first signal-to-noise ratio before correction by the control signal input from the determination unit. A noise removing device comprising a setting switch.
【請求項39】 請求項37に記載のノイズ除去装置に
おいて、 前記信号対雑音比補正部は、 前記変換部から入力された前記周波数領域信号の振幅成
分の高域電力を計算し、その計算結果に応じた制御信号
を出力する判定部と、 この判定部から入力された前記制御信号によって前記補
正信号対雑音比を選択的に補正前の前記第1の信号対雑
音比と同じ値に設定するスイッチとを含むことを特徴と
するノイズ除去装置。
39. The noise eliminator according to claim 37, wherein the signal-to-noise ratio correction unit calculates the high frequency power of the amplitude component of the frequency domain signal input from the conversion unit, and the calculation result thereof. And a control unit that outputs a control signal according to the control signal, and the control signal input from the determination unit selectively sets the correction signal-to-noise ratio to the same value as the first signal-to-noise ratio before correction. A noise eliminator including a switch.
【請求項40】 請求項37〜39のいずれかに記載の
ノイズ除去装置において、 前記周波数領域信号の振幅成分を重みづけし、得られた
重みつき振幅成分を前記推定雑音計算部に出力し、前記
推定雑音計算部に前記重みつき振幅成分に基づいて前記
雑音を推定させる重みつき劣化音声計算部を更に具備す
ることを特徴とするノイズ除去装置。
40. The noise eliminator according to claim 37, wherein the amplitude component of the frequency domain signal is weighted, and the obtained weighted amplitude component is output to the estimated noise calculator. The noise removing apparatus further comprising a weighted deteriorated speech calculation unit that causes the estimated noise calculation unit to estimate the noise based on the weighted amplitude component.
【請求項41】 請求項40に記載のノイズ除去装置に
おいて、 前記重みつき劣化音声計算部は、 前記周波数領域信号の振幅成分を用いて第2の信号対雑
音比を計算して出力する第2の信号対雑音比計算部と、 この第2の信号対雑音比計算部から入力された前記第2
の信号対雑音比を非線形関数によって処理して重みを求
め出力する非線形処理部と、 この非線形処理部から入力された前記重みを用いて前記
周波数領域信号の振幅成分を重みづけし、前記推定雑音
計算部に出力する第2の乗算部とを含むことを特徴とす
るノイズ除去装置。
41. The noise removal apparatus according to claim 40, wherein the weighted deteriorated speech calculation unit calculates and outputs a second signal-to-noise ratio using an amplitude component of the frequency domain signal. And a second signal-to-noise ratio calculation section that is input from the second signal-to-noise ratio calculation section.
A non-linear processing unit that processes the signal-to-noise ratio of the signal by a non-linear function to obtain a weight and outputs the weight, and an amplitude component of the frequency domain signal is weighted using the weight input from the non-linear processing unit, and the estimated noise A noise removing device, comprising: a second multiplying unit that outputs the calculating unit.
【請求項42】 請求項37〜41のいずれかに記載の
ノイズ除去装置において、 前記抑圧係数生成部から入力された前記抑圧係数を、前
記周波数領域信号に基づいて補正して前記第1の乗算部
に出力し、前記第1の乗算部に補正した抑圧係数を用い
て前記周波数領域信号の振幅成分を重みづけさせる抑圧
係数補正部を更に具備することを特徴とするノイズ除去
装置。
42. The noise removing device according to claim 37, wherein the suppression coefficient input from the suppression coefficient generation unit is corrected based on the frequency domain signal, and the first multiplication is performed. The noise removal apparatus further comprising a suppression coefficient correction unit that outputs the amplitude component of the frequency domain signal using the suppression coefficient corrected by the first multiplication unit.
JP2001339156A 2001-11-05 2001-11-05 Noise removal method and apparatus Expired - Lifetime JP3858668B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001339156A JP3858668B2 (en) 2001-11-05 2001-11-05 Noise removal method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001339156A JP3858668B2 (en) 2001-11-05 2001-11-05 Noise removal method and apparatus

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2005177567A Division JP4395772B2 (en) 2005-06-17 2005-06-17 Noise removal method and apparatus

Publications (2)

Publication Number Publication Date
JP2003140700A true JP2003140700A (en) 2003-05-16
JP3858668B2 JP3858668B2 (en) 2006-12-20

Family

ID=19153548

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001339156A Expired - Lifetime JP3858668B2 (en) 2001-11-05 2001-11-05 Noise removal method and apparatus

Country Status (1)

Country Link
JP (1) JP3858668B2 (en)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2007029536A1 (en) * 2005-09-02 2007-03-15 Nec Corporation Method and device for noise suppression, and computer program
WO2007058121A1 (en) * 2005-11-15 2007-05-24 Nec Corporation Reverberation suppressing method, device, and reverberation suppressing program
WO2007123051A1 (en) * 2006-04-20 2007-11-01 Nec Corporation Adaptive array controlling device, method, program, and adaptive array processing device, method, program
WO2007123048A1 (en) * 2006-04-20 2007-11-01 Nec Corporation Adaptive array control device, method, and program, and its applied adaptive array processing device, method, and program
WO2007123047A1 (en) * 2006-04-20 2007-11-01 Nec Corporation Adaptive array control device, method, and program, and its applied adaptive array processing device, method, and program
WO2007123052A1 (en) * 2006-04-20 2007-11-01 Nec Corporation Adaptive array control device, method, program, adaptive array processing device, method, program
WO2009038013A1 (en) * 2007-09-21 2009-03-26 Nec Corporation Noise removal system, noise removal method, and noise removal program
JP2010532879A (en) * 2007-07-06 2010-10-14 オーディエンス,インコーポレイテッド Adaptive intelligent noise suppression system and method
WO2012098579A1 (en) * 2011-01-19 2012-07-26 三菱電機株式会社 Noise suppression device
JP2013525843A (en) * 2010-04-19 2013-06-20 オーディエンス,インコーポレイテッド Method for optimizing both noise reduction and speech quality in a system with single or multiple microphones
WO2014017371A1 (en) * 2012-07-25 2014-01-30 株式会社ニコン Signal processing device, imaging device, and program
WO2016009654A1 (en) * 2014-07-16 2016-01-21 日本電気株式会社 Noise suppression system and recording medium on which noise suppression method and program are stored

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4395772B2 (en) * 2005-06-17 2010-01-13 日本電気株式会社 Noise removal method and apparatus
JP2008309955A (en) * 2007-06-13 2008-12-25 Toshiba Corp Noise suppresser
WO2009131066A1 (en) * 2008-04-21 2009-10-29 日本電気株式会社 System, device, method, and program for signal analysis control and signal control

Cited By (28)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5092748B2 (en) * 2005-09-02 2012-12-05 日本電気株式会社 Noise suppression method and apparatus, and computer program
US8233636B2 (en) 2005-09-02 2012-07-31 Nec Corporation Method, apparatus, and computer program for suppressing noise
US8489394B2 (en) 2005-09-02 2013-07-16 Nec Corporation Method, apparatus, and computer program for suppressing noise
JPWO2007029536A1 (en) * 2005-09-02 2009-03-19 日本電気株式会社 Noise suppression method and apparatus, and computer program
WO2007029536A1 (en) * 2005-09-02 2007-03-15 Nec Corporation Method and device for noise suppression, and computer program
US8477963B2 (en) 2005-09-02 2013-07-02 Nec Corporation Method, apparatus, and computer program for suppressing noise
CN101300623B (en) * 2005-09-02 2011-07-27 日本电气株式会社 Method and device for noise suppression, and computer program
US8073147B2 (en) 2005-11-15 2011-12-06 Nec Corporation Dereverberation method, apparatus, and program for dereverberation
WO2007058121A1 (en) * 2005-11-15 2007-05-24 Nec Corporation Reverberation suppressing method, device, and reverberation suppressing program
JP4973873B2 (en) * 2005-11-15 2012-07-11 日本電気株式会社 Reverberation suppression method, apparatus, and reverberation suppression program
US8106827B2 (en) 2006-04-20 2012-01-31 Nec Corporation Adaptive array control device, method and program, and adaptive array processing device, method and program
US8014230B2 (en) 2006-04-20 2011-09-06 Nec Corporation Adaptive array control device, method and program, and adaptive array processing device, method and program using the same
US8174935B2 (en) 2006-04-20 2012-05-08 Nec Corporation Adaptive array control device, method and program, and adaptive array processing device, method and program using the same
WO2007123052A1 (en) * 2006-04-20 2007-11-01 Nec Corporation Adaptive array control device, method, program, adaptive array processing device, method, program
WO2007123047A1 (en) * 2006-04-20 2007-11-01 Nec Corporation Adaptive array control device, method, and program, and its applied adaptive array processing device, method, and program
WO2007123048A1 (en) * 2006-04-20 2007-11-01 Nec Corporation Adaptive array control device, method, and program, and its applied adaptive array processing device, method, and program
WO2007123051A1 (en) * 2006-04-20 2007-11-01 Nec Corporation Adaptive array controlling device, method, program, and adaptive array processing device, method, program
JP2010532879A (en) * 2007-07-06 2010-10-14 オーディエンス,インコーポレイテッド Adaptive intelligent noise suppression system and method
WO2009038013A1 (en) * 2007-09-21 2009-03-26 Nec Corporation Noise removal system, noise removal method, and noise removal program
JP5344251B2 (en) * 2007-09-21 2013-11-20 日本電気株式会社 Noise removal system, noise removal method, and noise removal program
JP2013525843A (en) * 2010-04-19 2013-06-20 オーディエンス,インコーポレイテッド Method for optimizing both noise reduction and speech quality in a system with single or multiple microphones
US9502048B2 (en) 2010-04-19 2016-11-22 Knowles Electronics, Llc Adaptively reducing noise to limit speech distortion
WO2012098579A1 (en) * 2011-01-19 2012-07-26 三菱電機株式会社 Noise suppression device
JP5265056B2 (en) * 2011-01-19 2013-08-14 三菱電機株式会社 Noise suppressor
US8724828B2 (en) 2011-01-19 2014-05-13 Mitsubishi Electric Corporation Noise suppression device
WO2014017371A1 (en) * 2012-07-25 2014-01-30 株式会社ニコン Signal processing device, imaging device, and program
WO2016009654A1 (en) * 2014-07-16 2016-01-21 日本電気株式会社 Noise suppression system and recording medium on which noise suppression method and program are stored
US10748551B2 (en) 2014-07-16 2020-08-18 Nec Corporation Noise suppression system, noise suppression method, and recording medium storing program

Also Published As

Publication number Publication date
JP3858668B2 (en) 2006-12-20

Similar Documents

Publication Publication Date Title
JP4282227B2 (en) Noise removal method and apparatus
KR100927897B1 (en) Noise suppression method and apparatus, and computer program
KR101052445B1 (en) Method and apparatus for suppressing noise, and computer program
JP4670483B2 (en) Method and apparatus for noise suppression
RU2127454C1 (en) Method for noise suppression
JP5435204B2 (en) Noise suppression method, apparatus, and program
JP2001134287A (en) Noise suppressing device
JP2003140700A (en) Method and device for noise removal
JP2007006525A (en) Method and apparatus for removing noise
JP2008216721A (en) Noise suppression method, device, and program
JP4395772B2 (en) Noise removal method and apparatus
JP5413575B2 (en) Noise suppression method, apparatus, and program
JP2003131689A (en) Noise removing method and device
JP4968355B2 (en) Method and apparatus for noise suppression

Legal Events

Date Code Title Description
A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050315

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050419

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050617

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20050726

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20050926

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20051101

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20051201

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051228

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20051201

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060130

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20060328

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060331

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20060829

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20060911

R150 Certificate of patent or registration of utility model

Ref document number: 3858668

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090929

Year of fee payment: 3

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100929

Year of fee payment: 4

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110929

Year of fee payment: 5

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120929

Year of fee payment: 6

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130929

Year of fee payment: 7

EXPY Cancellation because of completion of term