JP2003131689A - Noise removing method and device - Google Patents

Noise removing method and device

Info

Publication number
JP2003131689A
JP2003131689A JP2001327839A JP2001327839A JP2003131689A JP 2003131689 A JP2003131689 A JP 2003131689A JP 2001327839 A JP2001327839 A JP 2001327839A JP 2001327839 A JP2001327839 A JP 2001327839A JP 2003131689 A JP2003131689 A JP 2003131689A
Authority
JP
Japan
Prior art keywords
unit
noise
signal
frequency
frequency domain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP2001327839A
Other languages
Japanese (ja)
Inventor
Akihiko Sugiyama
昭彦 杉山
Masanori Kato
正徳 加藤
Masahiro Serizawa
芹沢  昌宏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP2001327839A priority Critical patent/JP2003131689A/en
Publication of JP2003131689A publication Critical patent/JP2003131689A/en
Withdrawn legal-status Critical Current

Links

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Abstract

PROBLEM TO BE SOLVED: To provide a method and device for removing noise capable of obtaining dynamic voices excellent in subjective sound quality without generating noise in output signals. SOLUTION: This device has a curtain processing section 22 for subjecting the signal samples taken out of adjacent two frames of reverse Fourie transform outputs to curtain processing.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【発明の属する技術分野】本発明は、ノイズ除去方法及
び装置に関し、特に、音声信号に重畳されているノイズ
を除去するためのノイズ除去方法及び装置に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a noise removing method and apparatus, and more particularly to a noise removing method and apparatus for removing noise superimposed on an audio signal.

【0002】[0002]

【従来の技術】従来、音声信号に重畳されている雑音
(ノイズ)を消去する技術として、ノイズ・サプレッサ
がある。ノイズ・サプレッサは、cos変換やフーリエ
変換などによって周波数領域に変換した入力信号を用い
てノイズ成分のパワースペクトルを推定し、推定したパ
ワースペクトルを入力信号から差し引くことにより、音
声信号に混在するノイズを抑圧するように動作する。
2. Description of the Related Art Conventionally, there is a noise suppressor as a technique for eliminating noise superimposed on a voice signal. The noise suppressor estimates the power spectrum of the noise component by using the input signal transformed into the frequency domain by cos transform or Fourier transform, and subtracts the estimated power spectrum from the input signal to eliminate noise mixed in the voice signal. Operates to suppress.

【0003】ノイズ成分のパワースペクトルを、音声の
無音区間を検出して更新することにより、非定常なノイ
ズの抑圧にも適用することができる。
The power spectrum of the noise component can be applied to suppression of non-stationary noise by detecting and updating the silent section of the voice.

【0004】ノイズ・サプレッサについては、例えば、
「1984年12月、アイ・イー・イー・イー・トランザクシ
ョンズ・オン・アクースティクス・スピーチ・アンド・
シグナル・プロセシング、第32巻、第6号(IEEE TRANSAC
TIONS ON ACOUSTICS,SPEECH,AND SIGNAL PROCESSING,VO
L.32,NO.6 PP.1109-1121,DEC,1984)、1109〜1121ペー
ジ」(以下、「文献1」と称する。)に記載されている方
式がある。
Regarding the noise suppressor, for example,
"December 1984, IEE Transactions on Auctions Speech and
Signal Processing, Volume 32, Issue 6 (IEEE TRANSAC
TIONS ON ACOUSTICS, SPEECH, AND SIGNAL PROCESSING, VO
L.32, NO.6 PP.1109-1121, DEC, 1984), pages 1109 to 1121 "(hereinafter referred to as" Reference 1 ").

【0005】文献1に記載されている方式は、最小平均
2乗誤差短時間スペクトル振幅法として知られている。
The method described in Document 1 is known as the minimum mean square error short-time spectrum amplitude method.

【0006】図25は、文献1等に記載されているノイ
ズ・サプレッサの模式的な構成を示すブロック図であ
る。
FIG. 25 is a block diagram showing a schematic configuration of the noise suppressor described in Document 1 and the like.

【0007】入力端子11には、音声信号とノイズの混
在する信号である劣化音声信号が、サンプル値系列とし
て供給される。劣化音声信号は、フレーム分割部1に供
給され、K/2サンプル毎のフレームに分割される。こ
こで、Kは偶数とする。
A degraded audio signal, which is a signal in which an audio signal and noise are mixed, is supplied to the input terminal 11 as a sample value series. The deteriorated audio signal is supplied to the frame division unit 1 and divided into K / 2 sample frames. Here, K is an even number.

【0008】フレームに分割された劣化音声信号は、窓
がけ処理部2に供給され、窓関数w(t)との乗算が行
われる。第nフレームの入力信号yn(t)(t=0,
1,…,K/2−1)に対するw(t)で窓がけされた信
号yn(t)バーは、数式1で与えられる。
The deteriorated audio signal divided into frames is supplied to the windowing processing section 2 and is multiplied by the window function w (t). Input signal y n (t) (t = 0,
The signal y n (t) bar windowed with w (t) for 1, ..., K / 2−1) is given by Eq.

【0009】[0009]

【数1】 また、連続する2フレームの一部を重ね合わせ(オーバ
ラップ)して窓がけすることも広く行われている。オー
バラップ長としてフレーム長の50%を仮定すれば、 t=0,1,…,K/2−1 に対して、数式2で得られるyn(t)バー(t=0,
1,…,K−1)が、窓がけ処理部2の出力となる。
[Equation 1] It is also widely practiced to overlap a part of two consecutive frames and to open a window. Assuming that the overlap length is 50% of the frame length, y n (t) bar (t = 0, t = 0,
, ..., K-1) are output from the windowing processing unit 2.

【0010】[0010]

【数2】 実数信号に対しては、左右対称窓関数が用いられる。ま
た、窓関数は、抑圧係数を1に設定したときの入力信号
と出力信号が計算誤差を除いて一致するように設計され
る。これは、 w(t)+w(t+K/2)=1 となることを意味する。
[Equation 2] A symmetric window function is used for real signals. Further, the window function is designed so that the input signal and the output signal when the suppression coefficient is set to 1 match each other except for a calculation error. This means that w (t) + w (t + K / 2) = 1.

【0011】以後、連続する2フレームの50%をオー
バラップして窓がけする場合を例として説明を続ける。
Hereinafter, the description will be continued by taking as an example the case where a window is formed by overlapping 50% of two consecutive frames.

【0012】w(t)としては、例えば数式3に示すハ
ニング窓を用いることができる。
As w (t), for example, the Hanning window shown in Expression 3 can be used.

【0013】[0013]

【数3】 窓がけされた出力yn(t)バーは、フーリエ変換部3
に供給され、劣化音声スペクトルYn(k)に変換され
る。劣化音声スペクトルYn(k)は位相と振幅に分離
され、劣化音声位相スペクトルのargYn(k)は逆
フーリエ変換部9に、劣化音声振幅スペクトル|Y
n(k)|は音声検出部4、多重乗算部16及び多重乗
算部17にそれぞれ供給される。
[Equation 3] The windowed output y n (t) bar is the Fourier transform unit 3
And converted into a degraded speech spectrum Y n (k). The deteriorated speech spectrum Y n (k) is separated into a phase and an amplitude, and the deteriorated speech phase spectrum argY n (k) is supplied to the inverse Fourier transform unit 9 and the deteriorated speech amplitude spectrum | Y.
n (k) | is supplied to the voice detection unit 4, the multiple multiplication unit 16, and the multiple multiplication unit 17, respectively.

【0014】音声検出部4は、劣化音声振幅スペクトル
|Yn(k)|に基づいて音声の有無を検出し、その結
果によって定められる音声検出フラグを、推定雑音計算
部51に伝達する。
The voice detection unit 4 detects the presence or absence of voice based on the deteriorated voice amplitude spectrum | Y n (k) |, and transmits the voice detection flag determined by the result to the estimated noise calculation unit 51.

【0015】多重乗算部17は、供給された劣化音声振
幅スペクトル|Yn(k)|を用いて劣化音声パワース
ペクトルを計算し、推定雑音計算部51と周波数別信号
対雑音比(以下、「SNR」と略す。)計算部6とに伝
達する。
The multiplying unit 17 calculates a deteriorated voice power spectrum using the supplied deteriorated voice amplitude spectrum | Y n (k) |, and estimates the noise calculation unit 51 and the frequency-based signal-to-noise ratio (hereinafter, " It is abbreviated as “SNR”).

【0016】推定雑音計算部51は、音声検出フラグ、
劣化音声パワースペクトル、及びカウンタ13から供給
されるカウント値を用いて雑音のパワースペクトルを推
定し、推定雑音パワースペクトルとして周波数別SNR
計算部6に伝達する。
The estimated noise calculation section 51 uses a voice detection flag,
The noise power spectrum is estimated using the degraded voice power spectrum and the count value supplied from the counter 13, and the SNR for each frequency is used as the estimated noise power spectrum.
It is transmitted to the calculation unit 6.

【0017】周波数別SNR計算部6は、入力された劣
化音声パワースペクトルと推定雑音パワースペクトルと
を用いて周波数別にSNRを計算し、後天的SNRとし
て推定先天的SNR計算部7と雑音抑圧係数生成部8と
に供給する。
The frequency-based SNR calculation unit 6 calculates the SNR for each frequency using the input deteriorated speech power spectrum and estimated noise power spectrum, and estimates the a priori SNR calculation unit 7 and noise suppression coefficient as an acquired SNR. Supply to the part 8.

【0018】推定先天的SNR計算部7は、入力された
後天的SNR及び雑音抑圧係数生成部8から供給された
抑圧係数を用いて先天的SNRを推定し、推定先天的S
NRとして、雑音抑圧係数生成部8に帰還する。
The estimated a priori SNR calculator 7 estimates the a priori SNR using the input a posteriori SNR and the suppression coefficient supplied from the noise suppression coefficient generator 8 to estimate the a priori SNR.
It is fed back to the noise suppression coefficient generation unit 8 as NR.

【0019】雑音抑圧係数生成部8は、入力として供給
された後天的SNRと推定先天的SNRとを用いて雑音
抑圧係数を生成し、抑圧係数として推定先天的SNR計
算部7に帰還すると同時に多重乗算部16に伝達する。
The noise suppression coefficient generation unit 8 generates a noise suppression coefficient using the acquired SNR and the estimated a priori SNR supplied as inputs, and returns the noise suppression coefficient to the estimated a priori SNR calculation unit 7 as a suppression coefficient and simultaneously multiplexes it. The result is transmitted to the multiplication unit 16.

【0020】多重乗算部16は、フーリエ変換部3から
供給された劣化音声振幅スペクトル|Yn(k)|を、
雑音抑圧係数生成部8から供給された抑圧係数G
n(k)バーで重み付けすることによって強調音声振幅
スペクトル|Xn(k)|バーを求め、逆フーリエ変換
部9に伝達する。|Xn(k)|バーは、数式4で与え
られる。
The multiple multiplication section 16 uses the deteriorated speech amplitude spectrum | Y n (k) |
Suppression coefficient G supplied from the noise suppression coefficient generation unit 8
The weighted n (k) bar is used to obtain the emphasized speech amplitude spectrum | X n (k) | bar, which is transmitted to the inverse Fourier transform unit 9. The | X n (k) | bar is given by Equation 4.

【0021】[0021]

【数4】 逆フーリエ変換部9は、多重乗算部16から供給された
強調音声振幅スペクトル|Xn(k)|バーとフーリエ
変換部3から供給された劣化音声位相スペクトルarg
|Yn(k)|とを乗算して、強調音声Xn(k)バーを
求める。すなわち、数式5に示す演算を行う。
[Equation 4] The inverse Fourier transform unit 9 receives the emphasized voice amplitude spectrum | X n (k) | bar supplied from the multiplex multiplication unit 16 and the deteriorated voice phase spectrum arg supplied from the Fourier transform unit 3.
| Y n (k) | is multiplied to obtain the emphasized speech X n (k) bar. That is, the calculation shown in Formula 5 is performed.

【0022】[0022]

【数5】 得られた強調音声Xn(k)バーに逆フーリエ変換を施
し、1フレームがKサンプルから構成される時間領域サ
ンプル値系列Xn(t)バー(t=0,1,…,K−1)
としてフレーム合成部10に伝達する。
[Equation 5] An inverse Fourier transform is applied to the obtained emphasized speech X n (k) bar, and a time domain sample value series X n (t) bar (t = 0, 1, ..., K−1) in which one frame is composed of K samples. )
Is transmitted to the frame synthesis unit 10.

【0023】フレーム合成部10 は、Xn(t)バーの
隣接する2フレームからK/2サンプルずつを取り出し
て重ね合わせ、数式6によって強調音声Xn(t)ハッ
トを得る。得られた強調音声Xn(t)ハット(t=
0,1,…,K−1)が、フレーム合成部10の出力と
して出力端子12に伝達される。
The frame synthesizing unit 10 extracts K / 2 samples from two adjacent frames of the X n (t) bar and superimposes them, and obtains the emphasized speech X n (t) hat by the formula (6). Obtained emphasized speech X n (t) hat (t =
0, 1, ..., K−1) is transmitted to the output terminal 12 as the output of the frame synthesizing unit 10.

【0024】[0024]

【数6】 音声検出部の実現方法について、文献1は詳細に記載さ
れていない。しかし、音声検出部の実現例としては、
「2000年3月、日本音響学会講演論文集、321〜322ペー
ジ」(以下、「文献2」と称する。)が知られているの
で、以降、文献2に示されたものを従来の方法として説
明する。
[Equation 6] Document 1 does not describe the implementation method of the voice detection unit in detail. However, as an implementation example of the voice detection unit,
Since "March 2000, Acoustical Society of Japan, Proceedings, pages 321-322" (hereinafter referred to as "reference 2") is known, the method shown in reference 2 will be used as the conventional method. explain.

【0025】図26は、図25の音声検出部4の構成を
示すブロック図である。音声検出部4は、閾値記憶部4
01、比較部402、乗算器404、対数計算部40
5、パワー計算部406、重みつき加算部407、重み
記憶部408、論理否定回路409を有する。
FIG. 26 is a block diagram showing the structure of the voice detection unit 4 of FIG. The voice detection unit 4 includes a threshold storage unit 4
01, comparator 402, multiplier 404, logarithm calculator 40
5, a power calculation unit 406, a weighted addition unit 407, a weight storage unit 408, and a logical NOT circuit 409.

【0026】図25のフーリエ変換部3から供給された
劣化音声振幅スペクトルは、パワー計算部406に供給
される。パワー計算部406は、劣化音声振幅スペクト
ルのパワー|Yn(k)|2のk=0〜K−1に対する総
和を計算して、対数計算部405に伝達する。
The deteriorated voice amplitude spectrum supplied from the Fourier transform unit 3 in FIG. 25 is supplied to the power calculation unit 406. The power calculation unit 406 calculates the sum of the power | Y n (k) | 2 of the deteriorated speech amplitude spectrum for k = 0 to K−1, and transmits the sum to the logarithmic calculation unit 405.

【0027】対数計算部405は、入力された劣化音声
スペクトルパワーの対数を求め、乗算器404に伝達す
る。
The logarithmic calculation unit 405 obtains the logarithm of the input deteriorated speech spectrum power and transmits it to the multiplier 404.

【0028】乗算器404は、供給された対数値を定数
倍して劣化音声パワーQn(901)を求め、比較部4
02及び重みつき加算部407に供給する。すなわち、
第nフレームの劣化音声パワーQnは、数式7で与えら
れる。
The multiplier 404 multiplies the supplied logarithmic value by a constant to obtain the deteriorated voice power Q n (901), and the comparison unit 4
02 and the weighted addition unit 407. That is,
The deteriorated voice power Q n of the nth frame is given by Expression 7.

【0029】[0029]

【数7】 なお、文献2に記載された音声検出部は、時間領域サン
プルであるyn(t)バーを用いて、数式8に従ってQn
を求めている。
[Equation 7] Incidentally, speech detection unit described in the Reference 2, with y n (t) bar is time-domain samples, Q n according to equation 8
Are seeking.

【0030】[0030]

【数8】 しかし、例えば、「1985年、ディジタル信号処理の理
論、コロナ社、75〜76ページ」(以下、「文献3」と称
する。)にあるように、数式8と数式7とが等価である
ことは、パーセバル(Parseval)の等式として知られてい
る。
[Equation 8] However, as shown in, for example, "Theory of Digital Signal Processing, 1985, Corona Publishing Co., Ltd., pp. 75-76" (hereinafter referred to as "reference 3"), the equation 8 and the equation 7 are not equivalent to each other. , Known as Parseval's equation.

【0031】比較部402には、閾値記憶部401か
ら、閾値THnが供給されている。比較部402は、乗
算器404の出力と閾値THnとを比較し、THn>Qn
のときは有音を表す“1”を、THn≦Qnのときは無音
を表す"0"を、音声検出フラグとして出力する。
The threshold value TH n is supplied from the threshold value storage unit 401 to the comparison unit 402. The comparison unit 402 compares the output of the multiplier 404 with the threshold value TH n, and TH n > Q n
When it is, "1" indicating a voice is output, and when TH n ≤Q n , "0" indicating a silence is output as a voice detection flag.

【0032】比較部402の出力は、音声検出部4の出
力である音声検出フラグとして外部に供給されると同時
に、否定演算回路409に供給される。否定演算回路4
09の出力は、重みつき加算部制御信号905として重
みつき加算部407に供給される。
The output of the comparison section 402 is supplied to the outside as a voice detection flag which is the output of the voice detection section 4, and at the same time, is supplied to the negative operation circuit 409. Negative operation circuit 4
The output of 09 is supplied to the weighted addition unit 407 as the weighted addition unit control signal 905.

【0033】重みつき加算部407には、また、閾値記
憶部401から閾値と、重み記憶部408から重み90
3とが供給される。重みつき加算部407は、閾値記憶
部401から供給される閾値902を、重みつき加算部
制御信号905に基づいて選択的に更新し、更新閾値9
04として閾値記憶部401に帰還する。
The weighted addition unit 407 also has a threshold value from the threshold value storage unit 401 and a weight value 90 from the weight value storage unit 408.
3 and 3 are supplied. The weighted addition unit 407 selectively updates the threshold value 902 supplied from the threshold value storage unit 401 based on the weighted addition unit control signal 905, and the updated threshold value 9
It returns to 04 as the threshold value storage part 401.

【0034】更新閾値THnは、閾値THn-1と劣化音声
パワー901を、重み記憶部408から供給される重み
903を用いて重みつき加算することによって求める。
更新閾値THnの計算は、論理否定回路409の出力で
ある重みつき加算部制御信号905が“1”に等しいと
きだけ行われる。すなわち、無音のときだけ、閾値TH
nが更新される。更新によって得られた更新閾値904
は、閾値記憶部401に帰還される。
The update threshold TH n is obtained by weighted addition of the threshold TH n-1 and the deteriorated voice power 901 using the weight 903 supplied from the weight storage unit 408.
The update threshold TH n is calculated only when the weighted adder control signal 905 output from the logical NOT circuit 409 is equal to “1”. That is, only when there is no sound, the threshold TH
n is updated. Update threshold 904 obtained by update
Are returned to the threshold storage unit 401.

【0035】図27は、図26のパワー計算部406の
構成を示すブロック図である。パワー計算部406は、
分離部4061、乗算器40620〜4062K-1、加算
器4063を有する。
FIG. 27 is a block diagram showing the structure of the power calculation unit 406 shown in FIG. The power calculator 406
It includes a separating unit 4061, multipliers 4062 0 to 4062 K−1 , and an adder 4063.

【0036】多重化された状態で図25のフーリエ変換
部3から供給された劣化音声振幅スペクトルは、分離部
4061において周波数別のKサンプルに分離され、そ
れぞれ乗算器40620〜4062K-1に供給される。
The deteriorated speech amplitude spectrum supplied from the Fourier transform unit 3 in FIG. 25 in the multiplexed state is separated into K samples for each frequency in the separation unit 4061, and is divided into multipliers 4062 0 to 4062 K-1 . Supplied.

【0037】乗算器40620〜4062K-1は、それぞ
れ入力された信号を2乗し、加算器4063に伝達す
る。加算器4063は、入力された信号の総和を求めて
出力する。
Multipliers 4062 0 to 4062 K-1 square the respective input signals and transmit them to the adder 4063. The adder 4063 calculates and outputs the total sum of the input signals.

【0038】図28は、図26の重みつき加算部407
の構成を示すブロック図である。重みつき加算部407
は、乗算器4071,4073、定数乗算器4075、
加算器4072,4074を有する。
FIG. 28 shows the weighted addition unit 407 of FIG.
3 is a block diagram showing the configuration of FIG. Weighted addition unit 407
Is a multiplier 4071, 4073, a constant multiplier 4075,
It has adders 4072 and 4074.

【0039】重みつき加算部407には、図26の乗算
器404から劣化音声パワー901と、図26の閾値記
憶部401から閾値902と、図26の重み記憶部40
8から重み903と、図26の論理否定回路409から
重みつき加算部制御信号905とが、それぞれ入力とし
て供給される。
In the weighted addition unit 407, the deteriorated voice power 901 from the multiplier 404 in FIG. 26, the threshold value storage unit 401 to the threshold value 902 in FIG. 26, and the weight storage unit 40 in FIG.
8 to the weight 903 and the weighted addition unit control signal 905 from the logical NOT circuit 409 of FIG.

【0040】値βを有する重み903は、定数乗算器4
075と乗算器4073とに伝達される。定数乗算器4
075は入力信号を−1倍して得られた−βを、加算器
4074に伝達する。加算器4074のもう一方の入力
としては1が供給されており、加算器4074の出力は
両者の和である1−βとなる。1−βは乗算器4071
に供給されて、もう一方の入力である劣化音声パワーQ
nと乗算され、積である(1−β)Qnが加算器4072に
伝達される。
The weight 903 having the value β is the constant multiplier 4
075 and the multiplier 4073. Constant multiplier 4
075 transmits -β obtained by multiplying the input signal by -1 to the adder 4074. One is supplied to the other input of the adder 4074, and the output of the adder 4074 is the sum of the two, 1-β. 1-β is a multiplier 4071
To the other input, the degraded voice power Q
It is multiplied by n and the product (1-β) Q n is transmitted to the adder 4072.

【0041】一方、乗算器4073では、重み903と
して供給されたβと閾値902とが乗算され、積である
βTHn-1が加算器4072に伝達される。加算器40
72は、βTHn-1と(1−β)Qnとの和を、更新閾値9
04として出力する。
On the other hand, in the multiplier 4073, β supplied as the weight 903 is multiplied by the threshold value 902, and the product βTH n-1 is transmitted to the adder 4072. Adder 40
72 indicates the sum of βTH n-1 and (1-β) Q n as the update threshold value 9
Output as 04.

【0042】更新閾値THnの計算は、重みつき加算部
制御信号905が“1”に等しいときだけ行われる。す
なわち、重みつき加算部の機能は、無音のときに、閾値
TH n-1を更新してTHnを求めることであり、数式9に
よって表すことができる。
Update threshold THnIs the weighted addition part
It is performed only when the control signal 905 is equal to "1". You
That is, the function of the weighted addition unit is
TH n-1To update THnIs calculated as
Therefore, it can be expressed.

【0043】[0043]

【数9】 ここで、βは重み903の値である。[Equation 9] Here, β is the value of the weight 903.

【0044】図29は、図25の多重化乗算部17の構
成を示すブロック図である。多重化乗算部17は、乗算
器17010〜1701K-1、分離部1702,170
3、多重化部1704を有する。多重化された状態で図
25のフーリエ変換部3から供給された劣化音声振幅ス
ペクトルは、分離部1702,1703において周波数
別のKサンプルに分離され、それぞれ乗算器17010
〜1701K-1に供給される。
FIG. 29 is a block diagram showing the structure of the multiplexing and multiplying unit 17 of FIG. The multiplexing multiplication unit 17 includes multipliers 1701 0 to 1701 K−1 and separation units 1702 and 170.
3 and a multiplexing unit 1704. The deteriorated speech amplitude spectrum supplied from the Fourier transform unit 3 in FIG. 25 in the multiplexed state is separated into K samples for each frequency in the separation units 1702 and 1703, and each is multiplied by a multiplier 1701 0.
~ 1701 K-1 .

【0045】乗算器17010〜1701K-1は、それぞ
れ入力された信号を2乗し、多重化部1704に伝達す
る。多重化部1704は、入力された信号を多重化し、
劣化音声パワースペクトルとして出力する。
Multipliers 1701 0 to 1701 K-1 square the respective input signals and transmit them to multiplexing section 1704. The multiplexing unit 1704 multiplexes the input signals,
Output as degraded voice power spectrum.

【0046】図30は、図25の推定雑音計算部51の
構成を示すブロック図である。推定雑音計算部51は、
分離部502、多重化部503、周波数別推定雑音計算
部5140〜514K-1を有する。
FIG. 30 is a block diagram showing the structure of the estimated noise calculation section 51 of FIG. The estimated noise calculation unit 51
It includes a demultiplexing unit 502, a multiplexing unit 503, and frequency - dependent estimated noise calculation units 514 0 to 514 K-1 .

【0047】図25の音声検出部4から供給された音声
検出フラグと図25のカウンタ13から供給されたカウ
ント値は、周波数別推定雑音計算部5140〜514K-1
に伝達される。
The voice detection flag supplied from the voice detection unit 4 in FIG. 25 and the count value supplied from the counter 13 in FIG. 25 are the estimated noise calculation units by frequency 514 0 to 514 K-1.
Be transmitted to.

【0048】図25の多重乗算部17から供給された劣
化音声パワースペクトルは、分離部502に伝達され
る。分離部502は、多重化された状態で供給された劣
化音声パワースペクトルをK個の周波数に対応した成分
に分離して、周波数別推定雑音計算部5140〜514
K-1に伝達する。
The deteriorated voice power spectrum supplied from the multiplex multiplier 17 of FIG. 25 is transmitted to the separator 502. The demultiplexing unit 502 demultiplexes the deteriorated voice power spectrum supplied in the multiplexed state into components corresponding to K frequencies, and the frequency-dependent estimated noise calculation units 514 0 to 514.
Transmit to K-1 .

【0049】周波数別推定雑音計算部5140〜514
K-1は、分離部502から供給された劣化音声パワース
ペクトルを用いて雑音パワースペクトルを計算し、多重
化部503に伝達する。雑音パワースペクトルの計算
は、カウント値と音声検出フラグの値によって制御さ
れ、予め定めた条件が満足されるときだけ実行される。
Frequency-dependent estimated noise calculators 514 0 to 514
K-1 calculates a noise power spectrum using the deteriorated speech power spectrum supplied from demultiplexing section 502, and transfers it to multiplexing section 503. The calculation of the noise power spectrum is controlled by the count value and the value of the voice detection flag, and is executed only when a predetermined condition is satisfied.

【0050】多重化部503は、供給されたK個の雑音
パワースペクトル値を多重化して、推定雑音パワースペ
クトルとして出力する。
The multiplexing unit 503 multiplexes the supplied K noise power spectrum values and outputs them as an estimated noise power spectrum.

【0051】図31は、図30の周波数別推定雑音計算
部514の構成を示すブロック図である。文献2に記載
された雑音推定は、無音区間において雑音推定値を更新
するものであり、雑音推定値として巡回型フィルタによ
る平均化を施した推定雑音の瞬時値を用いている。
FIG. 31 is a block diagram showing the structure of the frequency-dependent estimated noise calculation unit 514 of FIG. The noise estimation described in Reference 2 updates the noise estimation value in a silent section, and uses the instantaneous value of the estimated noise averaged by the recursive filter as the noise estimation value.

【0052】一方、「1998年5月、アイ・イー・イー・
イー・トランザクションズ・オン・スピーチ・アンド・
オーディオ・プロセシング、第6巻、第3号(IEEE TRANS-
ACTIONS ON SPEECH AND AUDIO PROCESSING,VOL.6,NO.3,
PP.287-292,MAY,1998)、287〜292ページ」(以下、「文
献4」と称する。)に記載された雑音推定では、推定雑
音の瞬時値を平均化して用いると記述されている。
On the other hand, "May 1998, I-E-E-
E Transactions on Speech and
Audio Processing, Volume 6, Issue 3 (IEEE TRANS-
ACTIONS ON SPEECH AND AUDIO PROCESSING, VOL.6, NO.3,
PP.287-292, MAY, 1998), pp. 287-292 "(hereinafter referred to as" Reference 4 "), it is described that the instantaneous values of the estimated noise are averaged and used. .

【0053】これは、巡回型の代わりにトランスバーサ
ル型フィルタ(シフトレジスタを用いた構成)を用いた
平均化の実現を示唆している。どちらの実現も機能は等
しいので、ここでは文献4に記載された方法について説
明する。
This suggests the realization of averaging using a transversal type filter (configuration using shift registers) instead of the cyclic type. Since the functions are the same in both implementations, the method described in Reference 4 will be described here.

【0054】周波数別推定雑音計算部514は、更新判
定部521、レジスタ長記憶部5041、スイッチ50
44、シフトレジスタ5045、加算器5046、最小
値選択部5047、除算部5048、カウンタ5049
を有する。
The frequency-dependent estimated noise calculation unit 514 includes an update determination unit 521, a register length storage unit 5041, and a switch 50.
44, shift register 5045, adder 5046, minimum value selection unit 5047, division unit 5048, counter 5049
Have.

【0055】スイッチ5044には、図30の分離部5
02から、周波数別劣化音声パワースペクトルが供給さ
れている。スイッチ5044を閉じたときに、周波数別
劣化音声パワースペクトルは、シフトレジスタ5045
に伝達される。
The switch 5044 has a separating section 5 shown in FIG.
02, the deteriorated voice power spectrum for each frequency is supplied. When the switch 5044 is closed, the frequency-dependent degraded voice power spectrum is stored in the shift register 5045.
Be transmitted to.

【0056】シフトレジスタ5045は、後述するよう
に、更新判定部521から供給される制御信号に応じ
て、内部レジスタの記憶値を隣接レジスタにシフトす
る。シフトレジスタ長は、後述するレジスタ長記憶部5
941に記憶されている値に等しい。シフトレジスタ5
045の全レジスタ出力は、加算器5046に供給され
る。
As will be described later, the shift register 5045 shifts the storage value of the internal register to the adjacent register according to the control signal supplied from the update determining unit 521. The shift register length is the register length storage unit 5 described later.
Equal to the value stored in 941. Shift register 5
All 045 register outputs are provided to adder 5046.

【0057】加算器5046は、供給された全レジスタ
出力を加算して、加算結果を除算部5048に伝達す
る。
The adder 5046 adds all the supplied register outputs and sends the addition result to the division unit 5048.

【0058】一方、更新判定部521には、カウント値
と音声検出フラグが供給されている。更新判定部521
は、カウント値が予め設定された値に到達するまでは常
に“1”を、到達した後は音声検出フラグが"0"である
(無音の)ときに“1”を、それ以外のときに“0”を
出力し、カウンタ5049、スイッチ5044及びシフ
トレジスタ5045に伝達する。
On the other hand, the update determination section 521 is supplied with the count value and the voice detection flag. Update determination unit 521
Is always "1" until the count value reaches a preset value, "1" when the voice detection flag is "0" (silence) after the count value, and otherwise. “0” is output and transmitted to the counter 5049, the switch 5044, and the shift register 5045.

【0059】スイッチ5044は、更新判定部521か
ら供給された信号が“1”のときに回路を閉じ、“0”
のときに開く。
The switch 5044 closes the circuit when the signal supplied from the update judging section 521 is "1", and is "0".
Open at.

【0060】カウンタ5049は、更新判定部521か
ら供給された信号が“1”のときにカウント値を増加
し、“0”のときには変更しない。
The counter 5049 increments the count value when the signal supplied from the update judging section 521 is "1", and does not change it when it is "0".

【0061】シフトレジスタ5045は、更新判定部か
ら供給された信号が“1”のときにスイッチ5044か
ら供給される信号サンプルを1サンプル取り込むと同時
に、内部レジスタの記憶値を隣接レジスタにシフトす
る。
The shift register 5045 takes in one sample of the signal sample supplied from the switch 5044 when the signal supplied from the update determination section is "1", and at the same time shifts the stored value of the internal register to the adjacent register.

【0062】最小値選択部5047には、カウンタ50
49の出力とレジスタ長記憶部5941の出力とが供給
されている。最小値選択部5047は、供給されたカウ
ント値とレジスタ長とのうち、小さい方を選択して、除
算部5048に伝達する。
The minimum value selector 5047 has a counter 50.
The output of 49 and the output of the register length storage unit 5941 are supplied. The minimum value selection unit 5047 selects the smaller one of the supplied count value and the register length and transmits it to the division unit 5048.

【0063】除算部5048は、加算器5046から供
給された周波数別劣化音声パワースペクトルの加算値を
カウント値とレジスタ長との小さい方の値で除算し、商
を周波数別推定雑音パワースペクトルλn(k)として
出力する。Bn(k)(n=0,1,…,N−1)をシフ
トレジスタ5045に保存されている劣化音声パワース
ペクトルのサンプル値とすると、λn(k)は、数式1
0で示すことができる。
The dividing unit 5048 divides the added value of the frequency-dependent deteriorated speech power spectrum supplied from the adder 5046 by the smaller value of the count value and the register length, and the quotient is the frequency-dependent estimated noise power spectrum λ n. Output as (k). Letting B n (k) (n = 0, 1, ..., N−1) be a sample value of the deteriorated speech power spectrum stored in the shift register 5045, λ n (k) is represented by Formula 1
It can be indicated by 0.

【0064】[0064]

【数10】 ただし、Nはカウント値とレジスタ長とのうち小さい方
の値である。カウント値はゼロから始まって単調に増加
するので、最初はカウント値で除算が行われ、後にはレ
ジスタ長で除算が行われる。レジスタ長で除算が行われ
ることは、シフトレジスタに格納された値の平均値を求
めることになる。
[Equation 10] However, N is the smaller value of the count value and the register length. Since the count value starts from zero and increases monotonically, division is first performed by the count value and later division is performed by the register length. The division by the register length means obtaining the average value of the values stored in the shift register.

【0065】最初は、シフトレジスタ5045に十分多
くの値が記憶されていないために、実際に値が記憶され
ているレジスタの数で除算する。実際に値が記憶されて
いるレジスタの数は、カウント値がレジスタ長より小さ
いときはカウント値に等しく、カウント値がレジスタ長
より大きくなると、レジスタ長と等しくなる。
Initially, since not enough values are stored in the shift register 5045, division is performed by the number of registers in which values are actually stored. The number of registers in which values are actually stored is equal to the count value when the count value is smaller than the register length, and is equal to the register length when the count value is larger than the register length.

【0066】図32は、図31の更新判定部521の構
成を示すブロック図である。更新判定部521は、論理
否定回路5202、比較部5203、閾値記憶部520
4、論理和計算部5211を有する。
FIG. 32 is a block diagram showing the structure of the update determination unit 521 shown in FIG. The update determination unit 521 includes a logical NOT circuit 5202, a comparison unit 5203, and a threshold value storage unit 520.
4. It has a logical sum calculation unit 5211.

【0067】図25のカウンタ13から供給されるカウ
ント値は、比較部5203に伝達される。閾値記憶部5
204の出力である閾値も、比較部5203に伝達され
る。比較部5203は、供給されたカウント値と閾値と
を比較し、カウント値が閾値より小さいときに“1”
を、カウント値が閾値より大きいときに"0"を論理和計
算部5211に伝達する。
The count value supplied from the counter 13 in FIG. 25 is transmitted to the comparison section 5203. Threshold storage unit 5
The threshold value that is the output of 204 is also transmitted to the comparison unit 5203. The comparing unit 5203 compares the supplied count value with the threshold value, and when the count value is smaller than the threshold value, “1”
Is transmitted to the logical sum calculation unit 5211 when the count value is larger than the threshold value.

【0068】一方、供給された音声検出フラグは論理否
定回路5202に伝達される。論理否定回路5202
は、入力された信号の論理否定値を求め、論理和計算部
5211に伝達する。すなわち、音声検出フラグが
“1”である有音部では“0”を、音声検出フラグが
“0”である無音部では“1”を論理和計算部5211
に伝達することになる。
On the other hand, the supplied voice detection flag is transmitted to the logical NOT circuit 5202. Logical NOT circuit 5202
Calculates the logical negation value of the input signal and transmits it to the logical sum calculation unit 5211. That is, the logical sum calculation unit 5211 outputs “0” in the voiced part whose voice detection flag is “1” and “1” in the silent part whose voice detection flag is “0”.
Will be transmitted to.

【0069】その結果、論理和計算部5211の出力
は、音声検出フラグが“0”である無音部のとき、又は
カウント値が閾値より小さいときに“1”となって、図
31のスイッチを閉じ、カウンタ5049をカウントア
ップさせる。
As a result, the output of the logical sum calculation unit 5211 becomes "1" when the voice detection flag is the silent part where the voice detection flag is "0" or when the count value is smaller than the threshold value, and the switch of FIG. Close and count up the counter 5049.

【0070】図33は、図25の周波数別SNR計算部
6の構成を示すブロック図である。周波数別SNR計算
部6は、除算部6010〜601K-1、分離部602,6
03、多重化部604を有する。
FIG. 33 is a block diagram showing the configuration of the frequency-specific SNR calculation unit 6 of FIG. The frequency-based SNR calculation unit 6 includes division units 601 0 to 601 K−1 and separation units 602 and 6.
03, and a multiplexing unit 604.

【0071】図25の多重乗算部17から供給される劣
化音声パワースペクトルは、分離部602に伝達され
る。図25の推定雑音計算部51から供給される推定雑
音パワースペクトルは、分離部603に伝達される。劣
化音声パワースペクトルは分離部602において、推定
雑音パワースペクトルは分離部603において、それぞ
れ周波数成分に対応したKサンプルに分離され、それぞ
れ除算部6010〜601K-1に供給される。
The deteriorated voice power spectrum supplied from the multiplex multiplier 17 of FIG. 25 is transmitted to the separator 602. The estimated noise power spectrum supplied from the estimated noise calculation unit 51 in FIG. 25 is transmitted to the separation unit 603. In noisy speech power spectrum separation unit 602, the estimated noise power spectrum in the separation unit 603 is separated into K samples corresponding to the frequency components, respectively, supplied to each divider 601 0 ~601 K-1.

【0072】除算部6010〜601K-1では、数式11
に従って、供給された劣化音声パワースペクトルを推定
雑音パワースペクトルで除算して周波数別SNR γ
n(k)を求め、多重化部604に伝達する。
In the division units 601 0 to 601 K-1 ,
According to the above, the supplied degraded speech power spectrum is divided by the estimated noise power spectrum to obtain SNR γ for each frequency.
n (k) is obtained and transmitted to the multiplexing unit 604.

【0073】[0073]

【数11】 ここで、λn(k)は推定雑音パワースペクトルであ
る。多重化部604は、伝達されたK個の周波数別SN
Rを多重化して、後天的SNRとして出力する。
[Equation 11] Here, λ n (k) is the estimated noise power spectrum. The multiplexing unit 604 receives the transmitted K SNs for each frequency.
R is multiplexed and output as an acquired SNR.

【0074】図34は、図25の推定先天的SNR計算
部7の構成を示すブロック図である。推定先天的SNR
計算部7は、多重値域限定処理部701、後天的SNR
記憶部702、抑圧係数記憶部703、多重乗算部70
4,705、重み記憶部706、多重重みつき加算部7
07、加算器708を有する。
FIG. 34 is a block diagram showing the configuration of the estimated a priori SNR calculation unit 7 of FIG. Estimated innate SNR
The calculation unit 7 includes a multiple range limitation processing unit 701 and an acquired SNR.
Storage unit 702, suppression coefficient storage unit 703, multiplex multiplication unit 70
4, 705, weight storage unit 706, multiple weighted addition unit 7
07 and an adder 708.

【0075】図25の周波数別SNR計算部6から供給
される後天的SNR γn(k)(k=0,1,…,K−
1)は、後天的SNR記憶部702と加算器708とに
伝達される。
The acquired SNR γ n (k) (k = 0, 1, ..., K−) supplied from the frequency-based SNR calculation unit 6 of FIG.
1) is transmitted to the acquired SNR storage unit 702 and the adder 708.

【0076】後天的SNR記憶部702は、第nフレー
ムにおける後天的SNR γn(k)を記憶すると共に、
第n−1フレームにおける後天的SNR γn-1(k)を
多重乗算部705に伝達する。
The acquired SNR storage unit 702 stores the acquired SNR γ n (k) in the nth frame, and
The acquired SNR γ n-1 (k) in the ( n-1 ) th frame is transmitted to the multiplex multiplication unit 705.

【0077】図25の雑音抑圧係数生成部8から供給さ
れる抑圧係数Gn(k)バー(k=0,1,…,K−1)
は、抑圧係数記憶部703に伝達される。抑圧係数記憶
部703は、第nフレームにおける抑圧係数Gn(k)
バーを記憶すると共に、第n−1フレームにおける抑圧
係数Gn-1(k)バーを多重乗算部704に伝達する。
The suppression coefficient G n (k) bar (k = 0, 1, ..., K-1) supplied from the noise suppression coefficient generator 8 of FIG.
Is transmitted to the suppression coefficient storage unit 703. The suppression coefficient storage unit 703 stores the suppression coefficient G n (k) in the nth frame.
The bar is stored, and the suppression coefficient G n−1 (k) bar in the ( n−1 ) th frame is transmitted to the multiplex multiplication unit 704.

【0078】多重乗算部704は、供給されたG
n-1(k)バーを2乗してG2 n-1(k)バーを求め、多
重乗算部705に伝達する。
The multiplying unit 704 receives the supplied G
The n-1 (k) bar is squared to obtain G 2 n-1 (k) bar, which is transmitted to the multiplex multiplication unit 705.

【0079】多重乗算部705は、G2 n-1(k)バーと
γn-1(k)とをk=0,1,…,K−1に対して乗算し
てG2 n-1(k)バーγn-1(k)を求め、結果を多重重
みつき加算部707に過去の推定SNR922として伝
達する。
The multiplying unit 705 multiplies G 2 n-1 (k) bar and γ n-1 (k) by k = 0, 1, ..., K-1 to obtain G 2 n-1. (K) bar γ n-1 (k) is obtained, and the result is transmitted to the multiple weighted addition unit 707 as the past estimated SNR 922.

【0080】多重乗算部704及び705の構成は、図
29を用いて説明した多重乗算部17と同様である。
The configurations of the multiple multiplication units 704 and 705 are the same as those of the multiple multiplication unit 17 described with reference to FIG.

【0081】加算器708の他方の端子には−1が供給
されており、加算結果γn(k)−1が多重値域限定処
理部701に伝達される。
-1 is supplied to the other terminal of the adder 708, and the addition result γ n (k) -1 is transmitted to the multiple range limiting processing unit 701.

【0082】多重値域限定処理部701は、加算器70
8から供給された加算結果γn(k)−1に値域限定演
算子P[・]による演算を施し、結果であるP[γ
n(k)−1]を多重重みつき加算部707に瞬時推定
SNR921として伝達する。ただし、P[x]は数式
12で定められる。
The multi-value range limiting processing section 701 includes an adder 70.
The addition result γ n (k) -1 supplied from 8 is subjected to calculation by the range limiting operator P [·], and the result P [γ
[n (k) -1] is transmitted to the multiple weighted addition unit 707 as the instantaneous estimated SNR 921. However, P [x] is determined by Expression 12.

【0083】[0083]

【数12】 多重重みつき加算部707には、また、重み記憶部70
6から重み923が供給されている。多重重みつき加算
部707は、これらの供給された瞬時推定SNR92
1、過去の推定SNR922、重み923を用いて推定
先天的SNR924を求める。重み923をαとし、ξ
n(k)ハットを推定先天的SNRとすると、ξn(k)
ハットは、数式13を用いて計算される。
[Equation 12] The multiple weighted addition unit 707 also includes a weight storage unit 70.
The weight 923 is supplied from 6. The multi-weighted adder 707 receives these supplied instantaneous estimated SNRs 92
1, the estimated a priori SNR 924 is obtained using the past estimated SNR 922 and weight 923. The weight 923 is α, and ξ
If n (k) hat is the estimated innate SNR, then ξ n (k)
The hat is calculated using Equation 13.

【0084】[0084]

【数13】 ここで、G2 -1(k)γ-1(k)バー=1とする。[Equation 13] Here, it is assumed that G 2 −1 (k) γ −1 (k) bar = 1.

【0085】図35は、図34の多重値域限定処理部7
01の構成を示すブロック図である。多重値域限定処理
部701は、定数記憶部7011、最大値選択部701
0〜7012K-1、分離部7013、多重化部7014
を有する。
FIG. 35 is a block diagram of the multiple range limitation processing unit 7 of FIG.
It is a block diagram which shows the structure of 01. The multiple value range limitation processing unit 701 includes a constant storage unit 7011 and a maximum value selection unit 701.
2 0 ~7012 K-1, the separation section 7013, multiplexing section 7014
Have.

【0086】分離部7013には、図34の加算器70
8からγn(k)−1が供給される。分離部7013
は、供給されたγn(k)−1をK個の周波数別成分に
分離し、最大値選択部70120〜7012K-1に供給す
る。
The separating section 7013 includes an adder 70 shown in FIG.
8 supplies γ n (k) -1. Separation unit 7013
Separates the supplied γ n (k) -1 into K frequency components and supplies them to the maximum value selection units 7012 0 to 7012 K-1 .

【0087】最大値選択部70120〜7012K-1の他
方の入力には、定数記憶部7011からゼロが供給され
ている。最大値選択部70120〜7012K-1は、γn
(k)−1をゼロと比較し、大きい方の値を多重化部7
014へ伝達する。この最大値選択演算は、数式12を
実行することに相当する。多重化部7014は、これら
の値を多重化して出力する。
Zeros are supplied from the constant storage unit 7011 to the other inputs of the maximum value selection units 7012 0 to 7012 K-1 . Maximum value selector 7012 0 ~7012 K-1 are, gamma n
(K) -1 is compared with zero, and the larger value is multiplexed by the multiplexing unit 7
It is transmitted to 014. This maximum value selection operation is equivalent to executing Expression 12. The multiplexing unit 7014 multiplexes these values and outputs them.

【0088】図36は、図34の多重重みつき加算部7
07の構成を示すブロック図である。多重重みつき加算
部7071は、重みつき加算部70710〜707
K-1、分離部7072,7074、多重化部7075
を有する。
FIG. 36 shows the multiple weighted addition unit 7 of FIG.
It is a block diagram which shows the structure of 07. The multiple weighted addition unit 7071 is configured to add weighted addition units 7071 0 to 707.
1 K-1 , demultiplexing units 7072 and 7074, multiplexing unit 7075
Have.

【0089】分離部7072には、図34の多重値域限
定処理部701から、P[γn(k)−1]が瞬時推定S
NR921として供給される。分離部7072は、P
n(k)−1]をK個の周波数別成分に分離し、周波
数別瞬時推定SNR9210〜921K-1として、重みつ
き加算部70710〜7071K-1に伝達する。
In the demultiplexing unit 7072, P [γ n (k) -1] is instantaneously estimated S from the multiple value range limiting processing unit 701 of FIG.
Supplied as NR921. The separation unit 7072 is P
The [γ n (k) -1] is separated into K frequency-components, as frequency-instantaneous estimation SNR921 0 ~921 K-1, and transmits the weighted adder 7071 0 ~7071 K-1.

【0090】分離部7074には、図34の多重乗算部
705からG2 n-1(k)バーγn-1(k)が過去の推定
SNR922として供給される。分離部7074は、G
2 n-1(k)バーγn-1(k)をK個の周波数別成分に分
離し、過去の周波数別推定SNR9220〜922K-1
して、重みつき加算部70710〜7071K-1に伝達す
る。
The demultiplexing unit 7074 is supplied with the G 2 n-1 (k) bar γ n-1 (k) as the past estimated SNR 922 from the multiplex multiplication unit 705 of FIG. Separation unit 7074 is G
2 n-1 (k) bar gamma n-1 (k) of separating into K frequency-components, as the past frequency domain estimated SNR922 0 ~922 K-1, weighted adder 7071 0 ~7071 K- Propagate to 1 .

【0091】一方、重みつき加算部70710〜707
K-1には、重み923も供給される。重みつき加算部
70710〜7071K-1は、数式13によって表される
重みつき加算を実行し、周波数別推定先天的SNR92
0〜924K-1を多重化部7075に伝達する。
On the other hand, weighted addition units 7071 0 to 707
A weight 923 is also supplied to 1 K-1 . The weighted addition units 7071 0 to 7071 K-1 execute the weighted addition represented by Expression 13 and perform the frequency-specific estimation a priori SNR92.
The 4 0 ~924 K-1 is transmitted to the multiplexing unit 7075.

【0092】多重化部7075は、周波数別推定先天的
SNR9240〜924K-1を多重化し、推定先天的SN
R924として出力する。
The multiplexing unit 7075 multiplexes the estimated a priori SNRs 924 0 to 924 K-1 for each frequency to obtain the estimated a priori SN.
Output as R924.

【0093】なお、重みつき加算部70710〜707
K-1の動作と構成は、図28を用いて説明した重みつ
き加算部407と同様であるが、重みつき加算の計算は
常に行われる。
The weighted addition units 7071 0 to 707 are added.
The operation and configuration of 1 K-1 are the same as those of the weighted addition unit 407 described with reference to FIG. 28, but the weighted addition calculation is always performed.

【0094】図37は、図25の雑音抑圧係数生成部8
の構成を示すブロック図である。雑音抑圧係数生成部8
は、抑圧係数検索部8010〜801K-1、分離部80
2,803、多重化部804を有する。
FIG. 37 shows the noise suppression coefficient generator 8 of FIG.
3 is a block diagram showing the configuration of FIG. Noise suppression coefficient generator 8
Is a suppression coefficient search unit 801 0 to 801 K-1 and a separation unit 80.
2, 803 and a multiplexing unit 804.

【0095】分離部802には、図25の周波数別SN
R計算部6から後天的SNRが供給される。分離部80
2は、供給された後天的SNRをK個の周波数別成分に
分離し、抑圧係数検索部8010〜801K-1に伝達す
る。
The separating unit 802 stores the SN for each frequency in FIG.
The acquired SNR is supplied from the R calculation unit 6. Separation part 80
2 separates the supplied acquired SNR into K frequency components and transmits the K frequency components to the suppression coefficient search units 801 0 to 801 K-1 .

【0096】分離部803には、図25の推定先天的S
NR計算部7から推定先天的SNRが供給される。分離
部803は、供給された推定先天的SNRをK個の周波
数別成分に分離し、抑圧係数検索部8010〜801K-1
に伝達する。
The separating unit 803 stores the estimated a priori S
The estimated a priori SNR is supplied from the NR calculator 7. The separation unit 803 separates the supplied estimated a priori SNR into K frequency components, and the suppression coefficient search units 801 0 to 801 K-1.
Communicate to.

【0097】抑圧係数検索部8010〜801K-1は、供
給された後天的SNRと推定先天的SNRに対応した抑
圧係数とを検索し、検索結果を多重化部804に伝達す
る。
The suppression coefficient search units 801 0 to 801 K-1 search the supplied acquired SNR and the suppression coefficient corresponding to the estimated a priori SNR, and transmit the search result to the multiplexing unit 804.

【0098】多重化部804は、供給された抑圧係数を
多重化して出力する。
The multiplexing unit 804 multiplexes the supplied suppression coefficient and outputs it.

【0099】図38は、図37の抑圧係数検索部801
0〜801K-1の構成を示すブロック図である。抑圧係数
検索部801は、抑圧係数テーブル8011、アドレス
変換部8012,8013を有する。
FIG. 38 is a block diagram of the suppression coefficient search unit 801 of FIG.
It is a block diagram showing a 0 ~801 K-1 configuration. The suppression coefficient search unit 801 includes a suppression coefficient table 8011 and address conversion units 8012 and 8013.

【0100】アドレス変換部8012には、図37の分
離部802から周波数別後天的SNRが供給される。ア
ドレス変換部8012は、供給された周波数別後天的S
NRを対応したアドレスに変換し、抑圧係数テーブル8
011に伝達する。
The address conversion unit 8012 is supplied with the acquired SNR for each frequency from the separation unit 802 of FIG. The address conversion unit 8012 uses the acquired frequency-dependent acquired S
The NR is converted into a corresponding address, and the suppression coefficient table 8
011 is transmitted.

【0101】アドレス変換部8013には、図37の分
離部803から、周波数別推定先天的SNRが供給され
る。アドレス変換部8013は、供給された周波数別推
定先天的SNRを対応したアドレスに変換し、抑圧係数
テーブル8011に伝達する。
The address conversion unit 8013 is supplied with the estimated a priori SNR for each frequency from the separation unit 803 in FIG. The address conversion unit 8013 converts the supplied frequency-specific estimated a priori SNR into a corresponding address, and transfers it to the suppression coefficient table 8011.

【0102】抑圧係数テーブル8011は、アドレス変
換部8012とアドレス変換部8013とから供給され
たアドレスに対応した領域に格納されている抑圧係数
を、周波数別抑圧係数として出力する。
The suppression coefficient table 8011 outputs the suppression coefficient stored in the area corresponding to the address supplied from the address conversion unit 8012 and the address conversion unit 8013 as the suppression coefficient for each frequency.

【0103】[0103]

【発明が解決しようとする課題】しかし、従来の技術
は、逆フーリエ変換して得られた時間領域信号の隣接す
る2フレームから取り出した信号サンプルを重ね合わせ
加算することによって、強調音声を得ていた、一方で、
フーリエ変換前に時間領域信号にかける窓関数は、雑音
抑圧処理を行わないときに、入力が出力において再現さ
れるように設計されていた。
However, the conventional technique obtains emphasized speech by superposing and adding signal samples taken from two adjacent frames of the time domain signal obtained by the inverse Fourier transform. On the other hand,
The window function applied to the time domain signal before the Fourier transform was designed so that the input is reproduced at the output when no noise suppression processing is performed.

【0104】このため、重ね合わせ加算の対象となった
サンプルが、隣接するフレームにおいて異なった抑圧係
数値で抑圧されると、フレーム境界において信号サンプ
ルに不連続性を生じ、出力信号に発生する雑音によっ
て、主観的な音質が劣化するという問題があった。
Therefore, when the samples to be superimposed and added are suppressed with different suppression coefficient values in adjacent frames, discontinuity occurs in the signal samples at the frame boundaries, and noise generated in the output signal is generated. There was a problem that subjective sound quality deteriorates.

【0105】そこで、本発明は、出力信号に雑音を発生
することがなく、主観的な音質に優れた強調音声を得る
ことのできるノイズ除去の方法及び装置を提供すること
を課題とする。
Therefore, it is an object of the present invention to provide a noise removing method and apparatus capable of obtaining an emphasized voice excellent in subjective sound quality without generating noise in an output signal.

【0106】[0106]

【課題を解決するための手段】上記課題を解決するため
に、本発明のノイズ除去方法は、入力信号を周波数領域
信号に変換し、該周波数領域信号に基づいて信号対雑音
比を求め、該信号対雑音比に基づいて抑圧係数を定め、
該抑圧係数に基づいて前記周波数領域信号を重みづけ
し、該重みづけされた周波数領域信号を時間領域信号に
変換することによってノイズを除去した出力信号を得る
際に、前記入力信号に第1の窓がけを施してから周波数
領域信号に変換し、前記時間領域信号に第2の窓がけを
施して前記出力信号を得る。
In order to solve the above problems, a noise removing method of the present invention converts an input signal into a frequency domain signal, obtains a signal-to-noise ratio based on the frequency domain signal, and Determine the suppression coefficient based on the signal-to-noise ratio,
When the noise-removed output signal is obtained by weighting the frequency domain signal based on the suppression coefficient and converting the weighted frequency domain signal into a time domain signal, the first signal is added to the input signal. After windowing, the signal is transformed into a frequency domain signal, and the time domain signal is subjected to a second windowing to obtain the output signal.

【0107】また、本発明のノイズ除去方法は、入力信
号を周波数領域信号に変換し、該周波数領域信号に基づ
いて推定雑音を求め、該推定雑音に対応した値を前記周
波数領域信号から差し引いて周波数領域の強調音声を求
め、該強調音声を時間領域信号に変換することによって
ノイズを除去した出力信号を得る際に、前記入力信号に
第1の窓がけを施してから周波数領域信号に変換し、前
記時間領域信号に第2の窓がけを施して出力信号を得
る。
Further, the noise removing method of the present invention converts an input signal into a frequency domain signal, obtains estimated noise based on the frequency domain signal, and subtracts a value corresponding to the estimated noise from the frequency domain signal. When obtaining the emphasized speech in the frequency domain and obtaining the output signal from which noise is removed by converting the emphasized speech into the time domain signal, the input signal is first windowed and then converted into the frequency domain signal. , A second window is applied to the time domain signal to obtain an output signal.

【0108】さらに、本発明のノイズ除去装置は、入力
信号に窓がけ処理を施す第1の窓がけ処理部と、前記第
1の窓がけ処理部で窓がけ処理が施された入力信号を周
波数領域信号に変換する変換部と、前記変換部で変換さ
れた周波数領域信号の振幅成分に基づいて信号対雑音比
を求める信号対雑音比計算部と、前記信号雑音比計算部
で求められた信号対雑音比に基づいて抑圧係数を生成す
る抑圧係数生成部と、前記抑圧係数生成部で生成された
抑圧係数に基づいて前記周波数領域信号の振幅成分を重
みづけするための乗算部と、前記乗算部で重みづけされ
た周波数領域信号の振幅成分と前記変換部で変換された
周波数領域信号の位相成分を時間領域信号に変換する逆
変換部と、前記逆変換部で変換された時間領域信号に窓
がけ処理を施す第2の窓がけ処理部とを備える。
Further, the noise removing apparatus of the present invention frequency-converts the first windowing processing section for subjecting the input signal to the windowing processing, and the input signal subjected to the windowing processing by the first windowing processing section. A conversion unit for converting into a domain signal, a signal-to-noise ratio calculation unit for obtaining a signal-to-noise ratio based on the amplitude component of the frequency-domain signal converted by the conversion unit, and a signal obtained by the signal-to-noise ratio calculation unit A suppression coefficient generation unit that generates a suppression coefficient based on a noise ratio; a multiplication unit that weights the amplitude component of the frequency domain signal based on the suppression coefficient generated by the suppression coefficient generation unit; An inverse transform unit for transforming the amplitude component of the frequency domain signal weighted by the unit and the phase component of the frequency domain signal transformed by the transform unit into a time domain signal, and a time domain signal transformed by the inverse transform unit. First window processing And a windowing processing unit.

【0109】また、本発明は、隣接する2フレームから
取り出した逆フーリエ変換出力を窓がけ処理してから重
ね合わせ加算することによって、強調音声を得ることを
特徴としている。より具体的には、逆フーリエ変換出力
の隣接する2フレームから取り出した信号サンプルを窓
がけ処理するための窓がけ処理部を備える。
Further, the present invention is characterized in that emphasized speech is obtained by subjecting the inverse Fourier transform outputs extracted from two adjacent frames to windowing processing and then superposing and adding. More specifically, the windowing processing unit is provided for windowing the signal samples extracted from two adjacent frames of the inverse Fourier transform output.

【0110】すなわち、本発明は、隣接する2フレーム
を構成する逆フーリエ変換出力を窓がけ処理してから重
ね合わせ加算することによって、フレーム境界における
信号サンプルの連続性が改善され、雑音を防止するよう
にしている。
That is, the present invention improves the continuity of signal samples at frame boundaries and prevents noise by windowing the inverse Fourier transform outputs that form two adjacent frames and then performing superposition addition. I am trying.

【0111】[0111]

【発明の実施の形態】以下、本発明の実施形態について
図面を用いて説明する。
BEST MODE FOR CARRYING OUT THE INVENTION Embodiments of the present invention will be described below with reference to the drawings.

【0112】(実施形態1)図1は、本発明の実施形態
1のノイズ除去装置の模式的な構成を示すブロック図で
ある。図1に示すノイズ除去装置は、図25に示したノ
イズ除去装置と比較して、窓がけ処理部22を有する点
が相違する。なお、図1において図25に示した部分と
同様の部分には同一符号を付している。以下、この相違
点を中心に動作を説明する。
(Embodiment 1) FIG. 1 is a block diagram showing a schematic configuration of a noise removing apparatus according to Embodiment 1 of the present invention. The noise eliminator shown in FIG. 1 is different from the noise eliminator shown in FIG. 25 in that it has a windowing processing unit 22. In FIG. 1, the same parts as those shown in FIG. 25 are designated by the same reference numerals. The operation will be described below focusing on this difference.

【0113】窓がけ処理部22は、逆フーリエ変換部9
から供給されたXn(t)バーに窓関数h(t)を乗算
し、積であるh(t)Xn(t)バーをフレーム合成部
10に伝達するものである。
The windowing processing section 22 includes an inverse Fourier transform section 9
The window function h (t) is multiplied by the X n (t) bar supplied from the above, and the product h (t) X n (t) bar is transmitted to the frame synthesis unit 10.

【0114】フレーム合成部10は、h(t)X
n(t)バーの隣接する2フレームからK/2サンプル
ずつを取り出して重ね合わせ、数式14によって、強調
音声Xn(t)ハットを得る。
The frame synthesizing unit 10 uses h (t) X
K / 2 samples are taken out from two adjacent frames of the n (t) bar and superposed on each other, and the emphasized speech X n (t) hat is obtained by Expression 14.

【0115】[0115]

【数14】 得られた強調音声Xn(t)ハット(t=0,1,…,K
/2−1)が、フレーム合成部10の出力として、出力
端子12に伝達される。オーバラップが、50%ではな
くMサンプルで、フレーム長がLサンプル(M<L)の
場合は、数式15によって、強調音声Xn(t)ハット
を得る。
[Equation 14] Obtained emphasized speech X n (t) hat (t = 0, 1, ..., K
/ 2-1) is transmitted to the output terminal 12 as the output of the frame synthesizing unit 10. When the overlap is M samples instead of 50% and the frame length is L samples (M <L), Expression 15 obtains the emphasized speech X n (t) hat.

【0116】[0116]

【数15】 これに合わせて、フレーム分割部1も修正する。[Equation 15] In accordance with this, the frame division unit 1 is also modified.

【0117】すでに説明したように、実数信号に対して
は、左右対称窓関数が用いられる。また、窓関数は、抑
圧係数を1に設定したときの入力信号と出力信号とが計
算誤差を除いて一致するように設計される。
As described above, the symmetric window function is used for real signals. Further, the window function is designed so that the input signal and the output signal when the suppression coefficient is set to 1 match each other except for a calculation error.

【0118】これらの条件を満たすいかなる窓関数であ
っても、h(t)として使用することができる。その一
例として、ハニング窓を開平した関数(ルートハニング
窓)をあげることができる。他にもこれらの条件を満た
す窓関数は存在するので、そちらを用いてもよい。
Any window function satisfying these conditions can be used as h (t). As an example, a function (root Hanning window) in which the Hanning window is square rooted can be cited. Since there are other window functions that satisfy these conditions, they may be used.

【0119】(実施形態2)図2は、本発明の実施形態
2のノイズ除去装置の模式的な構成を示すブロック図で
ある。図2と図1とは、推定雑音計算部5、重みつき劣
化音声計算部14及び抑圧係数補正部15を除いて同様
とし、同様の部分には同一符号を付している。
(Embodiment 2) FIG. 2 is a block diagram showing a schematic configuration of a noise removing apparatus according to Embodiment 2 of the present invention. 2 and 1 are the same except for the estimated noise calculation unit 5, the weighted deteriorated speech calculation unit 14, and the suppression coefficient correction unit 15, and the same reference numerals are given to the same portions.

【0120】図2に示す構成は、「2000年4月、電子情
報通信学会技術研究報告、DSP、53〜60ページ」(以下、
「文献5」と称する。)に記載されたものに、窓がけ処
理部22を備えている。
The structure shown in FIG. 2 is "April 2000, IEICE Technical Research Report, DSP, pages 53-60" (hereinafter,
It is referred to as "reference 5". ), The windowing processing unit 22 is provided.

【0121】文献5に記載された方法は、文献1に記載
された方法とは異なり、重みつき劣化音声スペクトルを
用いて、雑音のパワースペクトルを推定することによっ
て、正確な推定雑音を得ることができる。以下、これら
の相違点を中心に動作を説明する。
Unlike the method described in Document 1, the method described in Document 5 can obtain an accurate estimated noise by estimating the power spectrum of noise using the weighted deteriorated speech spectrum. it can. The operation will be described below focusing on these differences.

【0122】図3は、図2の重みつき劣化音声計算部1
4の構成を示すブロック図である。重みつき劣化音声計
算部14は、推定雑音記憶部1401、周波数別SNR
計算部1402、多重非線形処理部1405、及び多重
乗算部1404を有する。
FIG. 3 shows the weighted deteriorated speech calculation unit 1 of FIG.
4 is a block diagram showing the configuration of FIG. The weighted deteriorated speech calculation unit 14 includes an estimated noise storage unit 1401, SNR for each frequency.
The calculation unit 1402, the multiplex nonlinear processing unit 1405, and the multiplex multiplication unit 1404 are included.

【0123】推定雑音記憶部1401は、図2の推定雑
音計算部5から供給される推定雑音パワースペクトルを
記憶し、1フレーム前に記憶された推定雑音パワースペ
クトルを周波数別SNR計算部1402へ出力する。
The estimated noise storage section 1401 stores the estimated noise power spectrum supplied from the estimated noise calculation section 5 of FIG. 2 and outputs the estimated noise power spectrum stored one frame before to the frequency-based SNR calculation section 1402. To do.

【0124】周波数別SNR計算部1402は、推定雑
音記憶部1401から供給される推定雑音パワースペク
トルと図2の多重乗算部17から供給される劣化音声パ
ワースペクトルとを用いてSNRを各周波数毎に求め、
多重非線形処理部1405に出力する。
The frequency-based SNR calculation section 1402 uses the estimated noise power spectrum supplied from the estimated noise storage section 1401 and the degraded speech power spectrum supplied from the multiplex multiplication section 17 of FIG. 2 to calculate the SNR for each frequency. Seeking,
It outputs to the multiplex nonlinear processing unit 1405.

【0125】多重非線形処理部1405は、周波数別S
NR計算部1402から供給されるSNRを用いて重み
係数ベクトルを求め、重み係数ベクトルを多重乗算部1
404に出力する。
The multiple non-linear processing unit 1405 determines S for each frequency.
The weighting coefficient vector is obtained using the SNR supplied from the NR calculating section 1402, and the weighting coefficient vector is multiplied by the multiplying section 1.
Output to 404.

【0126】多重乗算部1404は、図2の多重乗算部
17から供給される劣化音声パワースペクトルと、多重
非線形処理部1405から供給される重み係数ベクトル
との積を周波数毎に計算し、重みつき劣化音声パワース
ペクトルを図2の推定雑音記憶部5に出力する。
The multiplex multiplication unit 1404 calculates, for each frequency, the product of the deteriorated speech power spectrum supplied from the multiplex multiplication unit 17 of FIG. 2 and the weighting coefficient vector supplied from the multiplex nonlinear processing unit 1405, and the weighting is performed. The degraded voice power spectrum is output to the estimated noise storage unit 5 in FIG.

【0127】周波数別SNR計算部1402の構成は、
図33を用いて説明した周波数別SNR計算部6と同様
である。また、多重乗算部1404の構成は、図29を
用いて説明した多重乗算部17と同様である。
The configuration of the frequency-dependent SNR calculation section 1402 is as follows.
This is the same as the frequency-based SNR calculation unit 6 described using FIG. 33. The configuration of the multiplex multiplication unit 1404 is similar to that of the multiplex multiplication unit 17 described with reference to FIG.

【0128】図4は、図3の多重非線形処理部1405
の構成を示すブロック図である。多重非線形処理部14
05は、分離部1495、非線形処理部14850〜1
485K-1、及び多重化部1475を有する。
FIG. 4 is a block diagram of the multiple nonlinear processor 1405 of FIG.
3 is a block diagram showing the configuration of FIG. Multiple Nonlinear Processing Unit 14
Reference numeral 05 denotes a separation unit 1495 and nonlinear processing units 1485 0 to 1 485.
It has 485 K−1 and a multiplexing unit 1475.

【0129】分離部1495は、図3の周波数別SNR
計算部1402から供給されるSNRを周波数別のSN
Rに分離し、非線形処理部14850〜1485K-1に出
力する。
The separating unit 1495 is provided with the SNR for each frequency in FIG.
The SNR supplied from the calculation unit 1402 is set to the SN for each frequency.
It is separated into R and output to the non-linear processing units 1485 0 to 1485 K-1 .

【0130】非線形処理部14850〜1485K-1は、
それぞれ入力値に応じた実数値を出力する非線形関数を
有する。
The non-linear processing units 1485 0 to 1485 K-1 are
Each has a non-linear function that outputs a real value according to an input value.

【0131】図5は、非線形処理部14850〜148
K-1等から出力される非線形関数の例を示す図であ
る。f1を入力値としたとき、図5に示される非線形関
数の出力値f2は、数式16で示される。
FIG. 5 shows the non-linear processing units 1485 0 to 148.
It is a figure which shows the example of the nonlinear function output from 5K-1 . When f 1 is used as an input value, the output value f 2 of the nonlinear function shown in FIG.

【0132】[0132]

【数16】 非線形処理部14850〜1485K-1は、分離部149
5から供給される周波数別SNRを、非線形関数によっ
て処理して重み係数を求め、多重化部1475に出力す
る。すなわち、非線形処理部14850〜1485K-1
SNRに応じた1から0までの重み係数を出力する。S
NRが小さい時は1を、大きい時は0を出力する。
[Equation 16] The non-linear processing units 1485 0 to 1485 K-1 are separated by the separation unit 149.
The frequency-dependent SNR supplied from the signal No. 5 is processed by a non-linear function to obtain a weighting coefficient, which is output to the multiplexing unit 1475. That is, the non-linear processing units 1485 0 to 1485 K-1 output weighting factors from 1 to 0 according to the SNR. S
When NR is small, 1 is output, and when it is large, 0 is output.

【0133】多重化部1475は、非線形処理部148
0〜1485K-1から出力された重み係数を多重化し、
重み係数ベクトルを多重乗算部1404に出力する。
The multiplexing unit 1475 is a nonlinear processing unit 148.
5 0-1485 weighting coefficient outputted from the K-1 multiplexing,
The weighting coefficient vector is output to the multiple multiplication unit 1404.

【0134】図3の多重乗算部1404で劣化音声パワ
ースペクトルと乗算される重み係数は、SNRに応じた
値になっており、SNRが大きい程、すなわち劣化音声
に含まれる音声成分が大きい程、重み係数の値は小さく
なる。
The weighting coefficient to be multiplied by the deteriorated voice power spectrum in the multiplex multiplication unit 1404 in FIG. 3 has a value corresponding to the SNR. The larger the SNR, that is, the larger the voice component included in the deteriorated voice, The value of the weighting factor becomes smaller.

【0135】推定雑音の更新には一般に劣化音声パワー
スペクトルが用いられるが、推定雑音の更新に用いる劣
化音声パワースペクトルに対して、SNRに応じた重み
づけを行うことで、劣化音声パワースペクトルに含まれ
る音声成分の影響を小さくすることができ、より精度の
高い雑音推定を行うことができる。
Generally, the deteriorated speech power spectrum is used for updating the estimated noise, but the deteriorated speech power spectrum used for updating the estimated noise is weighted according to the SNR to be included in the deteriorated speech power spectrum. The influence of the voice component generated can be reduced, and more accurate noise estimation can be performed.

【0136】なお、重み係数の計算に非線形関数を用い
た例を示したが、非線形関数以外にも線形関数や高次多
項式など、他の形で表されるSNRの関数を用いること
も可能である。
Although an example of using a non-linear function for the calculation of the weighting coefficient is shown, it is also possible to use a SNR function represented in another form such as a linear function or a high-order polynomial in addition to the non-linear function. is there.

【0137】図6は、図2の推定雑音計算部5の構成を
示すブロック図である。図2の推定雑音計算部5は、図
25に示した推定雑音計算部51に対して、分離部50
5が存在する点と、周波数別推定雑音計算部5140
514K-1を周波数別推定雑音計算部5040〜504
K-1に置換している点とが相違する。なお、図6におい
て図30に示した部分と同様の部分には同一符号を付し
ている。以下、これらの相違点を中心に動作を説明す
る。
FIG. 6 is a block diagram showing the configuration of the estimated noise calculation section 5 of FIG. The estimated noise calculation unit 5 of FIG. 2 is different from the estimated noise calculation unit 51 shown in FIG.
5 and the estimated noise calculation unit for each frequency 514 0 to 514 0 to
By frequency 514 K-1 estimated noise calculator 504 0-504
The difference is that it is replaced with K-1 . In FIG. 6, the same parts as those shown in FIG. 30 are designated by the same reference numerals. The operation will be described below focusing on these differences.

【0138】分離部505は、図2の重みつき劣化音声
計算部から供給される重みつき劣化音声パワースペクト
ルを、周波数別の重みつき劣化音声パワースペクトルに
分離し、周波数別推定雑音計算部5040〜504K-1
出力する。
The separation unit 505 separates the weighted deteriorated speech power spectrum supplied from the weighted deteriorated speech calculation unit of FIG. 2 into frequency-dependent weighted deteriorated sound power spectra, and the frequency-dependent estimated noise calculation unit 504 0. Output to ~ 504 K-1 .

【0139】周波数別推定雑音計算部5040〜504
K-1は、分離部502から供給される周波数別劣化音声
パワースペクトル、分離部505から供給される周波数
別重みつき劣化音声パワースペクトル、図2の音声検出
部4から供給される音声検出フラグ及び図2のカウンタ
13から供給されるカウント値から周波数別推定雑音パ
ワースペクトルを計算し、多重化部503へ出力する。
Frequency-dependent estimated noise calculators 504 0 to 504
K-1 is the frequency-dependent deteriorated voice power spectrum supplied from the separation unit 502, the frequency-weighted deteriorated voice power spectrum supplied from the separation unit 505, the voice detection flag supplied from the voice detection unit 4 in FIG. The estimated noise power spectrum for each frequency is calculated from the count value supplied from the counter 13 in FIG. 2 and output to the multiplexing unit 503.

【0140】多重化部503は、周波数別推定雑音計算
部5040〜504K-1から供給される周波数別推定雑音
パワースペクトルを多重化し、推定雑音パワースペクト
ルを図2の周波数別SNR計算部6と重みつき劣化音声
計算部14とへ出力する。
The multiplexing unit 503 multiplexes the frequency - dependent estimated noise power spectrum supplied from the frequency - dependent estimated noise calculation units 504 0 to 504 K-1 , and the estimated noise power spectrum is calculated by the frequency-based SNR calculation unit 6 in FIG. To the weighted deteriorated speech calculation unit 14.

【0141】図7は、図6の周波数別推定雑音計算部5
040〜504K-1の構成を示すブロック図である。図6
の周波数別推定雑音計算部5040〜504K-1は、図3
0に示した周波数別推定雑音計算部514に対して、周
波数別推定雑音計算部504 0〜504K-1が推定雑音記
憶部5942を有する点と、更新判定部521が更新判
定部520に置換されている点と、スイッチ5044へ
の入力が周波数別劣化音声パワースペクトルから周波数
別重みつき劣化音声パワースペクトルに置換されている
点とが相違する。なお、図7において図31に示した部
分と同様の部分には同一符号を付している。
FIG. 7 shows the frequency-dependent estimated noise calculator 5 of FIG.
040~ 504K-13 is a block diagram showing the configuration of FIG. Figure 6
Frequency-dependent estimated noise calculation unit 5040~ 504K-1Is shown in FIG.
The frequency-dependent estimated noise calculation unit 514 shown in FIG.
Estimated noise calculation unit 504 by wave number 0~ 504K-1Is estimated noise
In addition, the update determination unit 521 determines that the update determination unit 521 has the storage unit 5942.
To the switch 5044 and the point that the constant part 520 is replaced.
Input the frequency from the degraded voice power spectrum by frequency
It is replaced with another weighted speech power spectrum
The point is different. Note that the section shown in FIG. 31 in FIG.
The same reference numerals are given to the same parts as the minutes.

【0142】ちなみに、図6の周波数別推定雑音計算部
5040〜504K-1は、図9を用いて後述するような構
成としてもよい。
Incidentally, the frequency - dependent estimated noise calculation units 504 0 to 504 K-1 shown in FIG. 6 may be configured as will be described later with reference to FIG.

【0143】周波数別推定雑音計算部5040〜504
K-1は、推定雑音の計算に劣化音声パワースペクトルで
はなく重みつき劣化音声パワースペクトルを用いてお
り、また、推定雑音の更新判定に、推定雑音と劣化音声
パワースペクトルを用いているため、これらの相違点が
発生する。
Frequency-dependent estimated noise calculators 504 0 to 504
K-1 uses the weighted deteriorated speech power spectrum instead of the deteriorated speech power spectrum to calculate the estimated noise, and uses the estimated noise and the deteriorated speech power spectrum to update the estimated noise. Difference occurs.

【0144】推定雑音記憶部5942は、除算部504
8から供給される周波数別推定雑音パワースペクトルを
記憶し、1フレーム前に記憶された周波数別推定雑音パ
ワースペクトルを更新判定部520に出力する。
The estimated noise storage unit 5942 has a division unit 504.
The estimated noise power spectrum for each frequency supplied from 8 is stored, and the estimated noise power spectrum for each frequency stored one frame before is output to the update determination unit 520.

【0145】図8は、図7の更新判定部520の構成を
示すブロック図である。図7の更新判定部520は、図
31に示した更新判定部521に対して、論理和計算部
5211が論理和計算部5201に置換されている点
と、更新判定部520が比較部5205、閾値記憶部5
206及び閾値計算部5207を有する点とが相違す
る。なお、図8において図32に示した部分と同様の部
分には同一符号を付している。以下、これらの相違点を
中心に動作を説明する。
FIG. 8 is a block diagram showing the structure of the update determination unit 520 shown in FIG. The update determination unit 520 of FIG. 7 is different from the update determination unit 521 shown in FIG. 31 in that the logical sum calculation unit 5211 is replaced by the logical sum calculation unit 5201, and the update determination unit 520 has a comparison unit 5205. Threshold storage unit 5
The difference is that 206 and a threshold calculation unit 5207 are included. In FIG. 8, the same parts as those shown in FIG. 32 are designated by the same reference numerals. The operation will be described below focusing on these differences.

【0146】閾値計算部5207は、図7の推定雑音記
憶部5942から供給される周波数別推定雑音パワース
ペクトルに応じた値を計算し、計算結果を閾値として閾
値記憶部5206に出力する。最も簡単には、閾値を周
波数別推定雑音パワースペクトルの定数倍とすることで
ある。その他に、高次多項式や非線形関数を用いて閾値
を計算することも可能である。
The threshold calculation unit 5207 calculates a value according to the frequency-dependent estimated noise power spectrum supplied from the estimated noise storage unit 5942 of FIG. 7, and outputs the calculation result to the threshold storage unit 5206 as a threshold value. The simplest is to set the threshold value to a constant multiple of the frequency-dependent estimated noise power spectrum. Besides, it is also possible to calculate the threshold value using a high-order polynomial or a non-linear function.

【0147】閾値記憶部5206は、閾値計算部520
7から出力された閾値を記憶し、1フレーム前に記憶さ
れた閾値を比較部5205へ出力する。
The threshold storage unit 5206 has a threshold calculation unit 520.
The threshold value output from No. 7 is stored, and the threshold value stored one frame before is output to the comparison unit 5205.

【0148】比較部5205は、閾値記憶部5206か
ら供給される閾値と図6の分離部502から供給される
周波数別劣化音声パワースペクトルとを比較し、周波数
別劣化音声パワースペクトルが閾値よりも小さければ
“1”を、大きければ“0”を論理和計算部5201に
出力する。すなわち、推定雑音パワースペクトルの大き
さをもとに、劣化音声信号が雑音であるか否かを判別し
ている。
The comparing unit 5205 compares the threshold value supplied from the threshold value storage unit 5206 with the frequency-dependent deteriorated voice power spectrum supplied from the separating unit 502 of FIG. 6, and if the frequency-dependent deteriorated voice power spectrum is smaller than the threshold value. If it is larger, “1” is output to the logical sum calculation unit 5201. That is, whether or not the deteriorated voice signal is noise is determined based on the size of the estimated noise power spectrum.

【0149】論理和計算部5201は、比較部5203
の出力値、論理否定回路5202の出力値、及び比較部
5205の出力値の論理和を計算し、計算結果を図7の
スイッチ5044、シフトレジスタ5045及びカウン
タ5049に出力する。
The logical sum calculation unit 5201 includes a comparison unit 5203.
Of the output value of, the output value of the logical NOT circuit 5202, and the output value of the comparison unit 5205 are calculated, and the calculation result is output to the switch 5044, the shift register 5045, and the counter 5049 in FIG. 7.

【0150】このように、初期状態や無音区間だけでな
く、有音区間でも劣化音声パワーが小さい場合には、更
新判定部520は“1”を出力する。すなわち、推定雑
音の更新が行われる。閾値の計算は各周波数毎に行われ
るため、各周波数毎に推定雑音の更新を行うことができ
る。
As described above, when the deteriorated voice power is small not only in the initial state or in the silent section but also in the voiced section, the update determining section 520 outputs "1". That is, the estimated noise is updated. Since the threshold value is calculated for each frequency, the estimated noise can be updated for each frequency.

【0151】図7において、CNTをカウンタ5049
のカウント値、Nをシフトレジスタ5045のレジスタ
長とする。そして、Bn(k)(n=0,1,…,N−
1)をシフトレジスタ5045に蓄積されている周波数
別重みつき劣化音声パワースペクトルとする。このと
き、除算部5048から出力される周波数別推定雑音パ
ワースペクトルλn(k)は、数式17に示すようにな
る。
In FIG. 7, a CNT counter 5049
, And N is the register length of the shift register 5045. Then, B n (k) (n = 0, 1, ..., N−
Let 1) be the frequency-dependent weighted deteriorated speech power spectrum accumulated in the shift register 5045. At this time, the frequency-dependent estimated noise power spectrum λ n (k) output from the division unit 5048 is as shown in Expression 17.

【0152】[0152]

【数17】 すなわち、λn(k)はシフトレジスタ5045に蓄積
されている周波数別重みつき劣化音声パワースペクトル
の平均値となる。平均値の計算は、重みつき加算部(巡
回型フィルタ)を用いて行うことも可能である。
[Equation 17] That is, λ n (k) is an average value of the weighted deteriorated speech power spectrum for each frequency stored in the shift register 5045. The average value may be calculated using a weighted addition unit (cyclic filter).

【0153】図9は、図6の周波数別推定雑音計算部5
040〜504K-1の構成例を示すブロック図である。図
6の周波数別推定雑音計算部5040〜504K-1は、図
7のシフトレジスタ5045、加算器5046、最小値
選択部5047、除算部5048、カウンタ5049、
レジスタ長記憶部5941に代えて、重みつき加算部5
071、重み記憶部5072を有する点が相違する。な
お、図9において図6に示した部分と同様の部分には同
一符号を付している。
FIG. 9 shows the frequency-dependent estimated noise calculation unit 5 of FIG.
04 is a block diagram showing a configuration example of a 0 ~504 K-1. The frequency - dependent estimated noise calculators 504 0 to 504 K-1 in FIG. 6 are the shift register 5045, the adder 5046, the minimum value selector 5047, the divider 5048, the counter 5049, and the shift register 5045 in FIG.
Instead of the register length storage unit 5941, the weighted addition unit 5
071 and a weight storage unit 5072 are different. In FIG. 9, the same parts as those shown in FIG. 6 are designated by the same reference numerals.

【0154】重みつき加算部5071は、推定雑音記憶
部5942から供給される1フレーム前の周波数別推定
雑音パワースペクトル、スイッチ5044から供給され
る周波数別重みつき劣化音声パワースペクトル及び重み
記憶部5072から出力される重みを用いて、周波数別
推定雑音を計算し、多重化部503へ出力する。
The weighted addition unit 5071 outputs the estimated noise power spectrum for each frequency before one frame supplied from the estimated noise storage unit 5942, the weighted deteriorated speech power spectrum for each frequency supplied from the switch 5044, and the weight storage unit 5072. Frequency-based estimation noise is calculated using the output weights and output to the multiplexing unit 503.

【0155】すなわち、重み記憶部5072が記憶する
重みをδ、周波数別重みつき劣化音声パワースペクトル
を|Yn(k)|2バーとしたとき、重みつき加算部50
71から出力される周波数別推定雑音パワースペクトル
λn(k)は、数式18で表せる。
That is, when the weight stored in the weight storage unit 5072 is δ and the frequency-dependent weighted deteriorated speech power spectrum is | Y n (k) | 2 bar, the weighted addition unit 50
The estimated noise power spectrum λ n (k) for each frequency output from 71 can be expressed by Equation 18.

【0156】[0156]

【数18】 重みつき加算部5071の構成は、図28を用いて説明
した重みつき加算部407と同様であるが、重みつき加
算の計算は常に行われる。
[Equation 18] The configuration of the weighted addition unit 5071 is the same as that of the weighted addition unit 407 described with reference to FIG. 28, but the weighted addition calculation is always performed.

【0157】図10は、図2の抑圧係数補正部15の構
成を示すブロック図である。SNRが低いときに抑圧不
足により発生する残留雑音や、SNRが高いときに過度
の抑圧で発生する音声の歪みによる音質劣化を防ぐため
に、抑圧係数補正部15は、SNRに応じて抑圧係数の
補正を行う。
FIG. 10 is a block diagram showing the configuration of the suppression coefficient correction unit 15 of FIG. In order to prevent residual noise generated due to insufficient suppression when the SNR is low and sound quality deterioration due to audio distortion that occurs due to excessive suppression when the SNR is high, the suppression coefficient correction unit 15 corrects the suppression coefficient according to the SNR. I do.

【0158】補正の例として、SNRが低いときには抑
圧係数に修正値を加えて残留雑音を抑圧し、SNRが高
いときには抑圧係数に下限値を設定して音声の歪みを防
止する。抑圧係数補正部15は、周波数別抑圧係数補正
部15010〜1501K-1、分離部1502,1503
及び多重化部1504を有する。
As an example of correction, when the SNR is low, a correction value is added to the suppression coefficient to suppress residual noise, and when the SNR is high, a lower limit value is set to the suppression coefficient to prevent voice distortion. The suppression coefficient correction unit 15 includes frequency-based suppression coefficient correction units 1501 0 to 1501 K−1 and separation units 1502 and 1503.
And a multiplexing unit 1504.

【0159】分離部1502は、図2の推定先天的SN
R計算部7から供給される推定先天的SNRを周波数別
成分に分離し、それぞれ周波数別抑圧係数補正部150
0〜1501K-1に出力する。
Separation unit 1502 uses estimated congenital SN of FIG.
The estimated a priori SNR supplied from the R calculation unit 7 is separated into frequency components, and each frequency suppression coefficient correction unit 150
And outputs it to the 1 0 ~1501 K-1.

【0160】分離部1503は、図2の抑圧係数生成部
8から供給される抑圧係数を周波数別成分に分離し、そ
れぞれ周波数別抑圧係数補正部15010〜1501K-1
に出力する。
The separation unit 1503 separates the suppression coefficient supplied from the suppression coefficient generation unit 8 of FIG. 2 into frequency components, and the frequency suppression coefficient correction units 1501 0 to 1501 K-1 respectively.
Output to.

【0161】周波数別抑圧係数補正部15010〜15
01K-1は、分離部1502から供給される周波数別推
定先天的SNRと、分離部1503から供給される周波
数別抑圧係数とから、周波数別補正抑圧係数を計算して
多重化部1504へ出力する。
Frequency-dependent suppression coefficient correction units 1501 0 to 150
01 K−1 calculates a frequency-specific correction suppression coefficient from the frequency-specific estimated a priori SNR supplied from the separation section 1502 and the frequency-specific suppression coefficient supplied from the separation section 1503, and outputs it to the multiplexing section 1504. To do.

【0162】多重化部1504は、周波数別抑圧係数補
正部15010〜1501K-1から供給される周波数別補
正抑圧係数を多重化し、補正抑圧係数として多重乗算部
16と推定先天的SNR計算部7とへ出力する。
The multiplexing unit 1504 multiplexes the frequency - dependent correction suppression coefficients supplied from the frequency-specific suppression coefficient correction units 1501 0 to 1501 K-1, and multiplexes them as the correction suppression coefficient and the estimated a priori SNR calculation unit. And output to 7.

【0163】図11は、図2の抑圧係数補正部15に含
まれる周波数別抑圧係数補正部15010〜1501K-1
の構成を示すブロック図である。周波数別抑圧係数補正
部1501は、最大値選択部1591、抑圧係数下限値
記憶部1592、閾値記憶部1593、比較部159
4、スイッチ1595、修正値記憶部1596及び乗算
器1597を有する。
FIG. 11 shows frequency - dependent suppression coefficient correction units 1501 0 to 1501 K-1 included in the suppression coefficient correction unit 15 shown in FIG.
3 is a block diagram showing the configuration of FIG. The frequency-dependent suppression coefficient correction unit 1501 includes a maximum value selection unit 1591, a suppression coefficient lower limit storage unit 1592, a threshold storage unit 1593, and a comparison unit 159.
4, a switch 1595, a correction value storage unit 1596, and a multiplier 1597.

【0164】抑圧係数下限値記憶部1592は、記憶し
ている抑圧係数の下限値を、最大値選択部1591に供
給する。
The suppression coefficient lower limit storage unit 1592 supplies the stored lower limit value of the suppression coefficient to the maximum value selection unit 1591.

【0165】最大値選択部1591は、図10の分離部
1503から供給される周波数別抑圧係数と抑圧係数下
限値記憶部1592から供給される抑圧係数下限値とを
比較し、大きい方の値をスイッチ1595に出力する。
すなわち、抑圧係数は抑圧係数下限値記憶部1592が
記憶する下限値以上の大きい値になる。従って、過度の
抑圧により発生する音声の歪みを防ぐことができる。
The maximum value selection unit 1591 compares the suppression coefficient for each frequency supplied from the separation unit 1503 of FIG. 10 with the suppression coefficient lower limit value supplied from the suppression coefficient lower limit value storage unit 1592, and determines the larger value. Output to the switch 1595.
That is, the suppression coefficient has a large value equal to or larger than the lower limit value stored in the suppression coefficient lower limit value storage unit 1592. Therefore, it is possible to prevent the distortion of the voice generated by the excessive suppression.

【0166】比較部1594は、閾値記憶部1593か
ら供給される閾値と、図10の分離部1502から供給
される周波数別推定先天的SNRとを比較し、周波数別
推定先天的SNRが閾値よりも大きければ“0”を、小
さければ“1”をスイッチ1595に供給する。
The comparing unit 1594 compares the threshold value supplied from the threshold value storage unit 1593 with the frequency-specific estimated a priori SNR supplied from the separating unit 1502 in FIG. 10, and the frequency-specific estimated a priori SNR is higher than the threshold value. If it is larger, “0” is supplied to the switch 1595, and if it is smaller, “1” is supplied to the switch 1595.

【0167】スイッチ1595は、最大値選択部159
1から供給される信号を、比較部1594の出力値が
“1”のとき乗算器1597に出力し、比較部1594
の出力値が“0”のとき図10の多重化部1504に出
力する。すなわち、周波数別推定先天的SNRが閾値よ
りも小さいときに、抑圧係数の補正が行われる。こうし
て、音声成分を過剰に抑圧することなく、残留雑音量を
減らすことができる。
The switch 1595 has a maximum value selection section 159.
The signal supplied from 1 is output to the multiplier 1597 when the output value of the comparison unit 1594 is “1”, and the comparison unit 1594
When the output value of is 0, it is output to multiplexing section 1504 in FIG. That is, the suppression coefficient is corrected when the estimated a priori SNR for each frequency is smaller than the threshold value. In this way, the residual noise amount can be reduced without excessively suppressing the voice component.

【0168】乗算器1579は、スイッチ1595の出
力値と修正値記憶部1596の出力値との積を計算し、
計算結果を図10の多重化部1504へ出力する。抑圧
係数値を小さくするため、修正値は1より小さい値が普
通であるが、目的によってはこの限りではない。
The multiplier 1579 calculates the product of the output value of the switch 1595 and the output value of the correction value storage unit 1596,
The calculation result is output to the multiplexing unit 1504 in FIG. The correction value is usually smaller than 1 in order to reduce the suppression coefficient value, but it is not limited to this depending on the purpose.

【0169】なお、本実施形態では、抑圧係数を多重乗
算部16と推定先天的SNR計算部7とへ供給すること
なく、補正抑圧係数を多重乗算部16と推定先天的SN
R計算部7とへ供給している。
In this embodiment, the correction suppression coefficient is not supplied to the multiplex multiplier 16 and the estimated a priori SNR calculator 7, but the corrected suppression coefficient is supplied to the multiplex multiplier 16 and the estimated a priori SN.
It is supplied to the R calculation unit 7.

【0170】図12は、図2の雑音抑圧係数生成部8の
変形例である雑音抑圧係数生成部81の構成を示すブロ
ック図である。雑音抑圧係数生成部81は、ゲイン関数
値計算部811、一般化尤度比計算部812、音声存在
確率記憶部813及び抑圧係数計算部814を有する。
FIG. 12 is a block diagram showing the configuration of a noise suppression coefficient generator 81 which is a modification of the noise suppression coefficient generator 8 of FIG. The noise suppression coefficient generation unit 81 includes a gain function value calculation unit 811, a generalized likelihood ratio calculation unit 812, a voice existence probability storage unit 813, and a suppression coefficient calculation unit 814.

【0171】図12に示す雑音抑圧係数生成部81は、
供給された推定先天的SNRと後天的SNRとから抑圧
係数を演算で求める点が、検索で求める図2の雑音抑圧
係数生成部8と異なる。以下、文献1に記載されている
計算式をもとに、抑圧係数の計算方法を説明する。
The noise suppression coefficient generator 81 shown in FIG.
The difference from the noise suppression coefficient generation unit 8 of FIG. 2 that is obtained by search is that the suppression coefficient is calculated from the supplied estimated innate SNR and acquired SNR. Hereinafter, the calculation method of the suppression coefficient will be described based on the calculation formula described in Document 1.

【0172】フレーム番号をn、周波数番号をkとし、
γn(k)を図2の周波数別SNR計算部6から供給さ
れる周波数別後天的SNR、ξn(k)ハットを図2の
推定先天的SNR計算部7から供給される周波数別推定
先天的SNRとする。また、 ηn(k)=ξn(k)ハット/q vn(k)=(ηn(k)γn(k))/(1+η
n(k)) とする。
The frame number is n and the frequency number is k,
γ n (k) is the frequency-dependent a posteriori SNR supplied from the frequency-based SNR calculating unit 6 in FIG. 2, and ξ n (k) hat is the frequency-based estimation a priori supplied from the estimated a priori SNR calculating unit 7 in FIG. Target SNR. Moreover, η n (k) = ξ n (k) hat / q v n (k) = (η n (k) γ n (k)) / (1 + η
n (k)).

【0173】ゲイン関数値計算部811は、図2の周波
数別SNR計算部6から供給される後天的SNRγ
n(k)、図2の推定先天的SNR計算部7から供給さ
れる推定先天的SNRξn(k)ハット及び音声存在確
率記憶部813から供給される音声存在確率qとをもと
に、各周波数毎に例えば文献1に記載されているような
MMSE STSAゲイン関数値を計算し、抑圧係数計
算部814に出力する。
The gain function value calculation unit 811 receives the acquired SNR γ supplied from the frequency-based SNR calculation unit 6 of FIG.
n (k), the estimated a priori SNR ξ n (k) hat supplied from the estimated a priori SNR calculation unit 7 and the voice existence probability q supplied from the voice existence probability storage unit 813. For example, the MMSE STSA gain function value as described in Reference 1 is calculated for each frequency and output to the suppression coefficient calculation unit 814.

【0174】各周波数毎のMMSE STSAゲイン関
数値Gn(k)は、数式19で表せる。
The MMSE STSA gain function value G n (k) for each frequency can be expressed by Equation 19.

【0175】[0175]

【数19】 ここで、I0(z)は0次変形ベッセル関数、I1(z)
は1次変形ベッセル関数である。変形ベッセル関数につ
いては、「1985年、数学辞典、岩波書店、374.Gペー
ジ」(文献6)に記載されている。
[Formula 19] Where I 0 (z) is the 0th-order modified Bessel function, and I 1 (z)
Is a first-order modified Bessel function. The modified Bessel function is described in "1985, Mathematical Dictionary, Iwanami Shoten, page 374.G" (Reference 6).

【0176】一般化尤度比計算部812は、図2の周波
数別SNR計算部6から供給される後天的SNRγ
n(k)、図2の推定先天的SNR計算部7から供給さ
れる推定先天的SNRΛn(k)ハット及び音声存在確
率記憶部813から供給される音声存在確率qをもと
に、周波数毎に一般化尤度比を計算し、抑圧係数計算部
814に出力する。
The generalized likelihood ratio calculation unit 812 receives the acquired SNR γ supplied from the frequency-based SNR calculation unit 6 of FIG.
n (k), the estimated a priori SNR Λ n (k) hat supplied from the estimated a priori SNR calculation unit 7 in FIG. 2 and the voice existence probability q supplied from the voice existence probability storage unit 813. Then, the generalized likelihood ratio is calculated and output to the suppression coefficient calculation unit 814.

【0177】周波数毎の一般化尤度比Λn(k)は、数
式20で表せる。
The generalized likelihood ratio Λ n (k) for each frequency can be expressed by Equation 20.

【0178】[0178]

【数20】 抑圧係数計算部814は、ゲイン関数値計算部811か
ら供給されるMMSESTSAゲイン関数値Gn(k)
と一般化尤度比計算部812から供給される一般化尤度
比Λn(k)とから周波数毎に抑圧係数を計算し、図2
の抑圧係数補正部15へ出力する。
[Equation 20] The suppression coefficient calculation unit 814 supplies the MMSESTSA gain function value G n (k) supplied from the gain function value calculation unit 811.
2 and the generalized likelihood ratio Λ n (k) supplied from the generalized likelihood ratio calculation unit 812, the suppression coefficient is calculated for each frequency, and FIG.
To the suppression coefficient correction unit 15.

【0179】周波数毎の抑圧係数Gn(k)バーは、数
式21で表せる。
The suppression coefficient G n (k) bar for each frequency can be expressed by Equation 21.

【0180】[0180]

【数21】 周波数別にSNRを計算する代わりに、複数の周波数か
ら構成される帯域に共通なSNRを求めて、これを用い
ることも可能である。
[Equation 21] Instead of calculating the SNR for each frequency, it is also possible to obtain an SNR common to a band composed of a plurality of frequencies and use this.

【0181】図13は、図2の周波数別SNR計算部6
の変形例である周波数別SNR計算部61の構成例を示
すブロック図である。図13の周波数別SNR計算部6
1は、図2に示した周波数別SNR計算部6に対して、
帯域別SNR計算部61が帯域別パワー計算部611,
612を有する点が相違する。なお、図13において図
33に示した部分と同様の部分には同一符号を付してい
る。
FIG. 13 is a frequency-specific SNR calculation unit 6 of FIG.
9 is a block diagram showing a configuration example of a frequency-based SNR calculation unit 61 that is a modification example of FIG. Frequency-dependent SNR calculator 6 in FIG.
1 corresponds to the frequency-based SNR calculation unit 6 shown in FIG.
The band-based SNR calculation unit 61 is a band-based power calculation unit 611.
612 is different. In FIG. 13, the same parts as those shown in FIG. 33 are designated by the same reference numerals.

【0182】帯域別パワー計算部611は、分離部60
2から供給される周波数別劣化音声パワースペクトルを
もとに帯域別のパワーを計算し、除算部6010〜60
K-1へ出力する。
The power calculation section 611 for each band is composed of the separation section 60.
Frequency noisy speech power spectrum supplied from 2 to calculate the per-band power on the basis of the division unit 601 0-60
Output to 1 K-1 .

【0183】帯域別パワー計算部612は、分離部60
3から供給される周波数別推定雑音パワースペクトルを
もとに帯域別のパワーを計算し、除算部6010〜60
K-1へ出力する。
The power calculation section 612 for each band is divided by the separation section 60.
The power for each band is calculated based on the estimated noise power spectrum for each frequency supplied from No. 3, and the division units 601 0 to 60 0
Output to 1 K-1 .

【0184】図14は、図13の帯域別パワー計算部6
11の構成を示すブロック図である。ここでは、帯域幅
Lを有するM個の帯域に等分割する例を説明する。ここ
で、LとMは、K=LMの関係を満たす自然数であると
する。
FIG. 14 is a band-specific power calculation unit 6 of FIG.
It is a block diagram which shows the structure of 11. Here, an example of equally dividing into M bands having a bandwidth L will be described. Here, it is assumed that L and M are natural numbers that satisfy the relationship of K = LM.

【0185】帯域別SNR計算部61は、加算器611
0〜6110M-1を有する。図13の分離部602から
供給される周波数別劣化音声パワースペクトル9100
〜910K-1(9100〜910ML-1)は、各周波数に対応
した加算器61100〜6110M-1へそれぞれ伝達され
る。
The band-by-band SNR calculation unit 61 uses the adder 611.
With a 0 0 ~6110 M-1. Frequency-dependent degraded voice power spectrum 910 0 supplied from the separation unit 602 of FIG.
.About.910 K-1 (910 0 to 910 ML-1 ) are transmitted to the adders 6110 0 to 6110 M-1 corresponding to the respective frequencies.

【0186】例えば、帯域番号0に対応する周波数番号
は0からL−1なので、周波数別劣化音声パワースペク
トル9100〜910L-1は加算器61100へ伝達され
る。また、帯域番号1に対応する周波数番号はLから2
L−1なので、周波数別劣化音声パワースペクトル91
L〜9102L-1は加算器61101へ伝達される。
[0186] For example, since L-1 frequency number from 0 corresponding to the band number 0, frequency noisy speech power spectrum 910 0 ~910 L-1 are transmitted to adder 6110 0. The frequency numbers corresponding to band number 1 are from L to 2
Since it is L-1, the degraded voice power spectrum 91 for each frequency
0 L to 910 2L-1 is transmitted to the adder 6110 1 .

【0187】加算器61100〜6110M-1は、供給さ
れた周波数別劣化音声パワースペクトルの総和をそれぞ
れ計算し、帯域別劣化音声パワースペクトル9110
911ML-1(9110〜911K-1)を図13の除算部6
010〜601K-1へ出力する。各加算器61100〜6
110M-1の計算結果は、それぞれの帯域番号に応じた
周波数毎に帯域別劣化音声パワースペクトルとして出力
される。
The adders 6110 0 to 6110 M-1 respectively calculate the sums of the supplied frequency - dependent degraded voice power spectra, and the band-specific degraded voice power spectra 911 0 to 910.
911 ML-1 (911 0 to 911 K-1 ) is divided by the division unit 6 in FIG.
Output to 01 0 to 601 K-1 . Each adder 6110 0 to 6
The calculation result of 110 M-1 is output as a band-specific deteriorated speech power spectrum for each frequency corresponding to each band number.

【0188】例えば、加算器61100の計算結果は、
帯域別劣化音声パワースペクトル9110〜911L-1
して出力される。また、加算器61101の計算結果
は、帯域別劣化音声パワースペクトル911L〜911
2L-1として出力される。構成と動作は帯域別パワー計算
部611と同様である。
For example, the calculation result of the adder 6110 0 is
The deteriorated voice power spectrum for each band is output as 911 0 to 911 L-1 . The calculation result of the adder 6110 1, the bandwidth noisy speech power spectrum 911 L ~911
It is output as 2L-1 . The configuration and operation are similar to those of the band-specific power calculation unit 611.

【0189】なお、ここでは複数の帯域に等分割する例
を示したが、「1980年、聴覚と音声、電子情報通信学
会、115〜118ページ」(文献7)に記載されている臨界帯
域に分割する方法、「1983年、マルチレート・ディジタ
ル・シグナル・プロセシング(Multirate Digital Si
gnal Processing),1983,Prentice-Hall Inc.,USA」(以
下、「文献8」と称する。)に記載されているオクター
ブ帯域に分割する方法など、他の帯域分割方法を用いる
ことも可能である。
Although an example of equally dividing into a plurality of bands has been shown here, the critical band described in "Hearing and Speech, The Institute of Electronics, Information and Communication Engineers, Pages 115 to 118, 1980" (Reference 7) is used. Dividing method, 1983, Multirate Digital Signal Processing
gnal Processing), 1983, Prentice-Hall Inc., USA "(hereinafter referred to as" Reference 8 "), and other band division methods can also be used. .

【0190】(実施形態3)図15は、本発明の実施形
態3のノイズ除去装置の模式的な構成を示すブロック図
である。図15に示すノイズ除去装置は、図2に対し
て、推定雑音計算部5が推定雑音計算部52に置換され
ている点と、重みつき劣化音声計算部14が存在しない
点とが相違する。なお、図15において、図2に示した
部分と同様の部分には同一符号を付している。以下、こ
れらの相違点を中心に動作を説明する。
(Embodiment 3) FIG. 15 is a block diagram showing a schematic configuration of a noise removing device according to Embodiment 3 of the present invention. The noise removal apparatus shown in FIG. 15 differs from FIG. 2 in that the estimated noise calculation unit 5 is replaced by the estimated noise calculation unit 52 and that the weighted deteriorated speech calculation unit 14 does not exist. In FIG. 15, the same parts as those shown in FIG. 2 are designated by the same reference numerals. The operation will be described below focusing on these differences.

【0191】図16は、図15の推定雑音計算部52の
構成を示すブロック図である。図15の推定雑音計算部
52は、図2の推定雑音計算部5に対して、周波数別推
定雑音計算部5040〜504K-1が周波数別推定雑音計
算部5060〜506K-1に置換されている点と、推定雑
音計算部52が入力信号に重みつき劣化音声パワースペ
クトルを有しない点とが相違する。なお、図16におい
て、図6に示した部分と同様の部分には同一符号を付し
ている。
FIG. 16 is a block diagram showing the structure of the estimated noise calculation section 52 shown in FIG. In the estimated noise calculation unit 52 of FIG. 15, in contrast to the estimated noise calculation unit 5 of FIG. 2, the frequency - dependent estimated noise calculation units 504 0 to 504 K-1 are changed to frequency - dependent estimated noise calculation units 506 0 to 506 K-1 . The difference lies in that the estimated noise calculation unit 52 does not have a weighted deteriorated speech power spectrum in the input signal. 16, the same parts as those shown in FIG. 6 are designated by the same reference numerals.

【0192】劣化音声パワースペクトルを有しないの
は、周波数別推定雑音計算部5040〜504K-1が入力
信号に周波数別重みつき劣化音声パワースペクトルを必
要とするのに対して、推定雑音計算部5060〜506
K-1は、入力信号に周波数別重みつき劣化音声パワース
ペクトルを必要としないためである。
Since the frequency - dependent estimated noise calculation units 504 0 to 504 K-1 require the frequency - dependent weighted deteriorated speech power spectrum for the input signal, the estimated noise calculation does not have the deteriorated speech power spectrum. Parts 506 0 to 506
This is because K-1 does not require a weighted degraded speech power spectrum for each input signal.

【0193】図17は、図16の周波数別推定雑音計算
部5060〜506K-1の構成を示すブロック図である。
図16の周波数別推定雑音計算部5060〜506
K-1は、図6の周波数別推定雑音計算部5040〜504
K-1に対して、周波数別推定雑音計算部506が入力信
号に周波数別重みつき劣化音声パワースペクトルを有し
ていない点と、除算部5041、非線形処理部5042
及び乗算器5043を有している点とが相違する。な
お、図17において、図7に示した部分と同様の部分に
は同一符号を付している。以下、これらの相違点を中心
に動作を説明する。
FIG. 17 is a block diagram showing the structure of the frequency - dependent estimated noise calculation units 506 0 to 506 K-1 shown in FIG.
Frequency-dependent estimated noise calculation units 506 0 to 506 in FIG.
K-1 is the frequency-dependent estimated noise calculation unit 504 0 to 504 in FIG.
For K-1 , the frequency-dependent estimated noise calculation unit 506 does not have a frequency-dependent weighted deteriorated speech power spectrum in the input signal, the division unit 5041, and the non-linear processing unit 5042.
And a multiplier 5043 is provided. 17, the same parts as those shown in FIG. 7 are designated by the same reference numerals. The operation will be described below focusing on these differences.

【0194】除算部5041は、図16の分離部502
から供給される周波数別劣化音声パワースペクトルを、
推定雑音記憶部5942から供給される1フレーム前の
推定雑音パワースペクトルで除算し、除算結果を非線形
処理部5042に出力する。図4に示した非線形処理部
1485と同様の構成及び機能を有する非線形処理部5
042は、除算部5041の出力値に応じた重み係数を
計算し、乗算器5043に出力する。
The division unit 5041 is the separation unit 502 of FIG.
Deteriorated voice power spectrum for each frequency supplied from
It divides by the estimated noise power spectrum one frame before supplied from the estimated noise storage unit 5942, and outputs the division result to the non-linear processing unit 5042. A non-linear processing unit 5 having the same configuration and function as the non-linear processing unit 1485 shown in FIG.
042 calculates a weighting coefficient according to the output value of the division unit 5041, and outputs it to the multiplier 5043.

【0195】乗算器5043は、図15の分離部502
から供給される周波数別劣化音声パワースペクトルと非
線形処理部5042から供給される重み係数の積を計算
し、スイッチ5044へ出力する。乗算器5043の出
力信号は、図5の周波数別推定雑音計算部504におけ
る周波数別重みつき劣化音声パワースペクトルと同様で
ある。すなわち、周波数別重みつき劣化音声パワースペ
クトルは、周波数別推定雑音計算部506の内部におい
て計算することも可能である。したがって、重みつき劣
化音声計算部14を省略することが可能となる。
The multiplier 5043 is the separation unit 502 of FIG.
Calculates the product of the frequency-dependent deteriorated speech power spectrum supplied from the product and the weighting coefficient supplied from the non-linear processing unit 5042, and outputs the product to the switch 5044. The output signal of the multiplier 5043 is the same as the weighted deteriorated speech power spectrum by frequency in the estimated noise by frequency calculation unit 504 in FIG. That is, the weighted deteriorated speech power spectrum for each frequency can be calculated in the estimated noise for each frequency calculation unit 506. Therefore, the weighted deteriorated speech calculation unit 14 can be omitted.

【0196】(実施形態4)図18は、本発明の実施形
態4のノイズ除去装置の模式的な構成を示すブロック図
である。図18に示すノイズ除去装置は、図2に示した
ノイズ除去装置に対して、推定先天的SNR計算部71
を備えている点が相違する。なお、図18において、図
2に示した部分と同様の部分には同一符号を付してい
る。以下、この相違点を中心に動作を説明する。
(Embodiment 4) FIG. 18 is a block diagram showing a schematic configuration of a noise removing device according to Embodiment 4 of the present invention. The noise removing apparatus shown in FIG. 18 is different from the noise removing apparatus shown in FIG. 2 in the estimated a priori SNR calculation unit 71.
The difference is that it has. 18, the same parts as those shown in FIG. 2 are designated by the same reference numerals. The operation will be described below focusing on this difference.

【0197】図19は、図18の推定先天的SNR計算
部71の構成を示すブロック図である。図18の推定先
天的SNR計算部71は、図34の推定先天的SNR計
算部7の後天的SNR記憶部702、抑圧係数記憶部7
03、多重乗算部705,704に代えて、推定雑音記
憶部712、強調音声パワースペクトル記憶部713、
周波数別SNR計算部715、多重乗算部716を有す
る。なお、図19において、図34に示した部分と同様
の部分には同一符号を付している。
FIG. 19 is a block diagram showing the configuration of the estimated a priori SNR calculation unit 71 of FIG. The estimated a priori SNR calculation unit 71 of FIG. 18 includes the acquired a priori SNR storage unit 702 and the suppression coefficient storage unit 7 of the estimated a priori SNR calculation unit 7 of FIG.
03, instead of the multiple multiplication units 705 and 704, an estimated noise storage unit 712, an emphasized speech power spectrum storage unit 713,
It has a frequency-specific SNR calculation unit 715 and a multiple multiplication unit 716. In FIG. 19, the same parts as those shown in FIG. 34 are designated by the same reference numerals.

【0198】ここで、推定先天的SNR計算部71は、
抑圧係数に代えて、強調音声振幅スペクトルと推定雑音
パワースペクトルを入力信号としている。
Here, the estimated a priori SNR calculation unit 71 is
Instead of the suppression coefficient, the emphasized speech amplitude spectrum and the estimated noise power spectrum are used as input signals.

【0199】多重乗算部716は、図18の多重乗算部
16から供給される強調音声振幅スペクトルを周波数毎
に2乗して強調音声パワースペクトルを求め、強調音声
パワースペクトル記憶部713に出力する。多重乗算部
716の構成は、図29を用いて説明した多重乗算部1
7と同様である。
The multiplying unit 716 squares the emphasized voice amplitude spectrum supplied from the multiplex multiplier 16 of FIG. 18 for each frequency to obtain an emphasized voice power spectrum, and outputs it to the emphasized voice power spectrum storage unit 713. The configuration of the multiple multiplication unit 716 is the multiple multiplication unit 1 described with reference to FIG.
Similar to 7.

【0200】強調音声パワースペクトル記憶部713
は、多重乗算部716から供給される強調音声パワース
ペクトルを記憶し、1フレーム前に供給された強調音声
パワースペクトルを周波数別SNR計算部715へ出力
する。周波数別SNR計算部715の構成は、図33を
用いて説明した周波数別SNR計算部6と同様である。
Enhanced voice power spectrum storage unit 713
Stores the emphasized voice power spectrum supplied from the multiplex multiplication unit 716, and outputs the emphasized voice power spectrum supplied one frame before to the frequency-based SNR calculation unit 715. The configuration of the frequency-based SNR calculation unit 715 is the same as that of the frequency-based SNR calculation unit 6 described with reference to FIG.

【0201】推定雑音記憶部712は、図18の推定雑
音計算部5から供給される推定雑音パワースペクトルを
記憶し、1フレーム前に供給された推定音声パワースペ
クトルを周波数別SNR計算部715へ出力する。
The estimated noise storage unit 712 stores the estimated noise power spectrum supplied from the estimated noise calculation unit 5 of FIG. 18, and outputs the estimated speech power spectrum supplied one frame before to the frequency-based SNR calculation unit 715. To do.

【0202】周波数別SNR計算部715は、強調音声
パワースペクトル記憶部713から供給される強調音声
パワースペクトルと、推定雑音記憶部712から供給さ
れる推定雑音パワースペクトルのSNRを各周波数毎に
計算し、多重重みつき加算部707へ出力する。
The frequency-based SNR calculation unit 715 calculates the SNR of the emphasized speech power spectrum supplied from the emphasized speech power spectrum storage unit 713 and the estimated noise power spectrum supplied from the estimated noise storage unit 712 for each frequency. , To the multiple weighted addition unit 707.

【0203】周波数別SNR計算部715の出力信号と
図34の多重乗算部705の出力信号は同様のものであ
る。したがって、本実施形態では、推定先天的SNR計
算部7を推定先天的SNR計算部17に置換することが
可能となる。
The output signal of the frequency-specific SNR calculation unit 715 and the output signal of the multiplex multiplication unit 705 of FIG. 34 are the same. Therefore, in the present embodiment, it is possible to replace the estimated a priori SNR calculator 7 with the estimated a priori SNR calculator 17.

【0204】(実施形態5)図20は、本発明の実施形
態5のノイズ除去装置の模式的な構成を示すブロック図
である。図20に示すノイズ除去装置は、図2に示した
ノイズ除去装置に対して、推定雑音計算部5が推定雑音
部52に、推定先天的SNR計算部7が推定先天的SN
R計算部71に、それぞれ置換されている点と、重みつ
き劣化音声計算部14が存在しない点とが相違する。
(Fifth Embodiment) FIG. 20 is a block diagram showing a schematic configuration of a noise removing apparatus according to a fifth embodiment of the present invention. The noise removing apparatus shown in FIG. 20 is different from the noise removing apparatus shown in FIG. 2 in that the estimated noise calculation unit 5 is the estimated noise unit 52 and the estimated a priori SNR calculation unit 7 is the estimated a priori SN.
The difference is that the R calculation unit 71 is replaced and the weighted deteriorated speech calculation unit 14 does not exist.

【0205】推定雑音部52の構成と動作は、実施形態
3で説明した推定雑音部と同様である。また、推定先天
的SNR計算部71は、実施形態4で説明した推定先天
的SNR計算部と同様である。
The structure and operation of the estimated noise unit 52 are the same as those of the estimated noise unit described in the third embodiment. The estimated a priori SNR calculation unit 71 is the same as the estimated a priori SNR calculation unit described in the fourth embodiment.

【0206】(実施形態6)図21は、本発明の実施形
態6のノイズ除去装置の模式的な構成を示すブロック図
である。図21のノイズ除去装置は、図2に示したノイ
ズ除去装置に対して、推定雑音計算部5が推定雑音計算
部53で置換されている点と、音声検出部4が存在しな
い点とが相違する。すなわち、図21のノイズ除去装置
は、雑音の推定に音声検出部を必要としない。以下、こ
れらの相違点を中心に動作を説明する。
(Sixth Embodiment) FIG. 21 is a block diagram showing a schematic configuration of a noise removing device according to a sixth embodiment of the present invention. The noise removal apparatus of FIG. 21 differs from the noise removal apparatus shown in FIG. 2 in that the estimated noise calculation unit 5 is replaced by the estimated noise calculation unit 53 and that the voice detection unit 4 does not exist. To do. That is, the noise removal device of FIG. 21 does not need a voice detection unit for noise estimation. The operation will be described below focusing on these differences.

【0207】図22は、図21の推定雑音計算部53の
構成を示すブロック図である。図21の推定雑音計算部
53は、図6に示した推定雑音計算部5に対して、周波
数別推定雑音計算部5040〜504K-1が周波数別推定
雑音計算部5080〜508K -1に置換されている点と、
推定雑音計算部53が入力信号に音声検出フラグを有し
ていない点とが相違する。
FIG. 22 is a block diagram showing the structure of the estimated noise calculation unit 53 shown in FIG. Estimated noise calculation unit 53 of FIG. 21, with respect to estimated noise calculator 5 shown in FIG. 6, the frequency domain estimated noise calculator 504 0 ~504 K-1 frequency domain estimated noise calculator 508 0 ~508 K - The point replaced by 1 , and
The difference is that the estimated noise calculation unit 53 does not have a voice detection flag in the input signal.

【0208】図23は、図22の周波数別推定雑音計算
部5080〜508K-1の構成を示すブロック図である。
図22の周波数別推定雑音計算部5080〜508
K-1は、図7に示した周波数別推定雑音計算部504に
対して、更新判定部520が更新判定部522に置換さ
れている点と、周波数別推定雑音計算部5080〜50
K-1が入力に音声検出フラグを有していない点とが相
違する。
FIG. 23 is a block diagram showing the configuration of the frequency - dependent estimated noise calculation units 508 0 to 508 K-1 shown in FIG.
Frequency-dependent estimated noise calculation units 508 0 to 508 in FIG.
K-1 is that the update determining unit 520 is replaced by the update determining unit 522 in the frequency-specific estimated noise calculating unit 504 shown in FIG. 7, and the frequency-specific estimated noise calculating units 508 0 to 50 0.
The difference is that 8 K-1 does not have a voice detection flag at the input.

【0209】図24は、図23の更新判定部522の構
成を示すブロック図である。図23の更新判定部522
は、図8に示した更新判定部520に対して、論理和計
算部5201が論理和計算部5221に置換されている
点と、更新判定部522が論理否定回路5202を有し
ていない点と、入力信号に音声検出フラグを有していな
い点とが相違する。すなわち、更新判定部522は、推
定雑音の更新に音声検出フラグを用いていない。この点
が、図8の更新判定部520と異なる。
FIG. 24 is a block diagram showing the structure of the update determination unit 522 of FIG. The update determination unit 522 of FIG.
8 is that the logical sum calculation unit 5201 is replaced by the logical sum calculation unit 5221 with respect to the update determination unit 520 shown in FIG. 8 and that the update determination unit 522 does not have the logical negation circuit 5202. The difference is that the input signal does not have a voice detection flag. That is, the update determination unit 522 does not use the voice detection flag for updating the estimated noise. This point is different from the update determination unit 520 of FIG.

【0210】論理和計算部5221は、比較部5205
の出力値と比較部5203の出力値の論理和を計算し、
計算結果を図23のスイッチ5044、シフトレジスタ
5045及びカウンタ5049に出力する。すなわち、
更新判定部522は、カウント値が予め設定された値に
到達するまでは常に“1”を出力し、到達した後は、劣
化音声パワーが閾値よりも小さいときに“1”を出力す
る。
The logical sum calculation unit 5221 has a comparison unit 5205.
And the output value of the comparison unit 5203 is calculated, and
The calculation result is output to the switch 5044, the shift register 5045, and the counter 5049 in FIG. That is,
The update determination unit 522 always outputs “1” until the count value reaches a preset value, and after reaching the count value, outputs “1” when the deteriorated voice power is smaller than the threshold value.

【0211】図8で説明した通り、比較部5205は劣
化音声信号が雑音であるか否かの判定を行っている。す
なわち、比較部5205は各周波数毎に音声検出を行っ
ているといえる。したがって、音声検出フラグを入力に
有しない更新判定部を実現することが可能となる。
As described with reference to FIG. 8, the comparison unit 5205 determines whether or not the deteriorated voice signal is noise. That is, it can be said that the comparison unit 5205 performs voice detection for each frequency. Therefore, it is possible to realize an update determination unit that does not have a voice detection flag as an input.

【0212】以上、本発明の各実施形態では、ノイズ除
去の方式として、最小平均2乗誤差短時間スペクトル振
幅法を用いる場合を例に説明したが、その他の方法にも
適用することができる。
As described above, in each of the embodiments of the present invention, the case of using the minimum mean square error short-time spectrum amplitude method has been described as an example of the noise removal method, but it can be applied to other methods.

【0213】例えば「1979年12月、プロシーディングス
・オブ・ザ・アイ・イー・イー・イー、第67巻、第12号
(PROCEEDINGS OF THE IEEE,VOL.67,NO.12,PP.1586-160
4,DEC,1979)、1586〜1604ページ」(文献9)に記載され
ているウィーナーフィルタ法や、「1979年4月、アイ・
イー・イー・イー・トランザクションズ・オン・アクー
スティクス・スピーチ・アンド・シグナル・プロセシン
グ、第27巻、第2号(IEEETRANSACTIONS ON ACOUSTICS,SP
EECH,AND SIGNAL PROCESSING,VOL.27,NO.2,PP.113-120,
APR,1979)、113〜120ページ」(以下、「文献10」と称
する。)に記載されているスペクトル減算法などであ
る。
[0213] For example, "December 1979, Proceedings of the IEE, Vol. 67, No. 12"
(PROCEEDINGS OF THE IEEE, VOL.67, NO.12, PP.1586-160
4, DEC, 1979), pp. 1586-1604 "(Reference 9), and the Wiener filter method described in" April 1979, Eye.
EEE Transactions on Acoustics Speech and Signal Processing, Volume 27, Issue 2 (IEEE TRANSACTIONS ON ACOUSTICS, SP
EECH, AND SIGNAL PROCESSING, VOL.27, NO.2, PP.113-120,
APR, 1979), pp. 113-120 "(hereinafter referred to as" Reference 10 ").

【0214】図21は文献10に記載されているスペク
トル減算法の概略動作の説明図である。図21におい
て、多重乗算部16を多重減算部に、雑音抑圧係数生成
部8を雑音抑圧量計算部に、抑圧係数補正部15を抑圧
量補正部に置き換えれば、スペクトル減算法による動作
を実現することができる。
FIG. 21 is an explanatory diagram of a schematic operation of the spectrum subtraction method described in Document 10. In FIG. 21, if the multiplex multiplication unit 16 is replaced with a multiple subtraction unit, the noise suppression coefficient generation unit 8 is replaced with a noise suppression amount calculation unit, and the suppression coefficient correction unit 15 is replaced with a suppression amount correction unit, the operation by the spectrum subtraction method is realized. be able to.

【0215】多重減算部において、補正された雑音抑圧
量を劣化音声振幅スペクトルから減算し、得られた結果
を逆フーリエ変換することによって、強調音声を得るこ
とができる。ここでは、SNRを計算してから、SNR
に基づいて雑音抑圧量を計算する例について説明した
が、推定雑音計算部53で得られた推定雑音を、直接劣
化音声振幅スペクトルから減算することもできる。
In the multiple subtraction section, the emphasized voice can be obtained by subtracting the corrected noise suppression amount from the deteriorated voice amplitude spectrum and performing the inverse Fourier transform on the obtained result. Here, after calculating the SNR, the SNR
Although the example in which the noise suppression amount is calculated based on the above is described, the estimated noise obtained by the estimated noise calculation unit 53 can be directly subtracted from the deteriorated speech amplitude spectrum.

【0216】[0216]

【発明の効果】以上説明したように、本発明は、隣接す
る2フレームを構成する逆フーリエ変換出力を窓がけ処
理してから重ね合わせ加算するので、フレーム境界にお
ける信号サンプルの連続性が改善され、雑音を防止する
ことができる。
As described above, the present invention improves the continuity of signal samples at frame boundaries because the inverse Fourier transform outputs that form two adjacent frames are windowed and then superimposed and added. , Noise can be prevented.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の実施形態1のノイズ除去装置の模式的
な構成を示すブロック図である。
FIG. 1 is a block diagram showing a schematic configuration of a noise removal device according to a first exemplary embodiment of the present invention.

【図2】本発明の実施形態2のノイズ除去装置の模式的
な構成を示すブロック図である。
FIG. 2 is a block diagram showing a schematic configuration of a noise removal device according to a second exemplary embodiment of the present invention.

【図3】図2の重みつき劣化音声計算部14の構成を示
すブロック図である。
3 is a block diagram showing a configuration of a weighted deteriorated speech calculation unit 14 of FIG.

【図4】図3の多重非線形処理部1405の構成を示す
ブロック図である。
4 is a block diagram showing a configuration of a multiplex nonlinear processing unit 1405 of FIG.

【図5】非線形処理部14850〜1485K-1等から出
力される非線形関数の例を示す図である。
FIG. 5 is a diagram showing an example of a non-linear function output from non-linear processing units 1485 0 to 1485 K-1 .

【図6】図2の推定雑音計算部5の構成を示すブロック
図である。
FIG. 6 is a block diagram showing a configuration of an estimated noise calculation unit 5 in FIG.

【図7】図6の周波数別推定雑音計算部5040〜50
K-1の構成を示すブロック図である。
[7] the frequency domain estimated noise calculator 504 in FIG. 6 0-50
It is a block diagram which shows the structure of 4K-1 .

【図8】図7の更新判定部520の構成を示すブロック
図である。
8 is a block diagram showing a configuration of an update determination unit 520 of FIG.

【図9】図6の周波数別推定雑音計算部5040〜50
K-1の構成例を示すブロック図である。
[9] the frequency domain estimated noise calculator 504 in FIG. 6 0-50
It is a block diagram which shows the structural example of 4K-1 .

【図10】図2の抑圧係数補正部15の構成を示すブロ
ック図である。
10 is a block diagram showing a configuration of a suppression coefficient correction unit 15 of FIG.

【図11】図2の抑圧係数補正部15に含まれる周波数
別抑圧係数補正部15010〜1501K-1の構成を示す
ブロック図である。
11 is a block diagram showing the configuration of frequency-specific suppression coefficient correction units 1501 0 to 1501 K-1 included in the suppression coefficient correction unit 15 of FIG.

【図12】図2の雑音抑圧係数生成部8の変形例である
雑音抑圧係数生成部81の構成を示すブロック図であ
る。
12 is a block diagram showing a configuration of a noise suppression coefficient generation unit 81 which is a modified example of the noise suppression coefficient generation unit 8 in FIG.

【図13】図2の周波数別SNR計算部6の変形例であ
る周波数別SNR計算部61の構成例を示すブロック図
である。
13 is a block diagram showing a configuration example of a frequency-based SNR calculation unit 61 which is a modified example of the frequency-based SNR calculation unit 6 of FIG.

【図14】図13の帯域別パワー計算部611の構成を
示すブロック図である。
FIG. 14 is a block diagram showing a configuration of a band-specific power calculation unit 611 of FIG.

【図15】本発明の実施形態3のノイズ除去装置の模式
的な構成を示すブロック図である。
FIG. 15 is a block diagram showing a schematic configuration of a noise removal device according to a third exemplary embodiment of the present invention.

【図16】図15の推定雑音計算部52の構成を示すブ
ロック図である。
16 is a block diagram showing a configuration of an estimated noise calculation unit 52 in FIG.

【図17】図16の周波数別推定雑音計算部5060
506K-1の構成を示すブロック図である。
17 is a diagram illustrating frequency-dependent estimated noise calculators 506 0 to 506 0 in FIG.
It is a block diagram which shows the structure of 506 K-1 .

【図18】本発明の実施形態4のノイズ除去装置の模式
的な構成を示すブロック図である。
FIG. 18 is a block diagram showing a schematic configuration of a noise removal device according to a fourth exemplary embodiment of the present invention.

【図19】図18の推定先天的SNR計算部71の構成
を示すブロック図である。
19 is a block diagram showing a configuration of an estimated a priori SNR calculation unit 71 in FIG.

【図20】本発明の実施形態5のノイズ除去装置の模式
的な構成を示すブロック図である。
FIG. 20 is a block diagram showing a schematic configuration of a noise removing device according to a fifth embodiment of the present invention.

【図21】本発明の実施形態6のノイズ除去装置の模式
的な構成を示すブロック図である。
FIG. 21 is a block diagram showing a schematic configuration of a noise removing device according to a sixth embodiment of the present invention.

【図22】図21の推定雑音計算部53の構成を示すブ
ロック図である。
22 is a block diagram showing a configuration of an estimated noise calculation unit 53 in FIG.

【図23】図22の周波数別推定雑音計算部5080
508K-1の構成を示すブロック図である。
FIG. 23 is a diagram illustrating frequency-dependent estimated noise calculation units 508 0 to 508 0 shown in FIG.
It is a block diagram which shows the structure of 508 K-1 .

【図24】図23の更新判定部522の構成を示すブロ
ック図である。
24 is a block diagram showing a configuration of an update determination unit 522 of FIG.

【図25】従来の技術のノイズ・サプレッサの模式的な
構成を示すブロック図である。
FIG. 25 is a block diagram showing a schematic configuration of a conventional noise suppressor.

【図26】図25の音声検出部4の構成を示すブロック
図である。
FIG. 26 is a block diagram showing a configuration of a voice detection unit 4 in FIG.

【図27】図26のパワー計算部406の構成を示すブ
ロック図である。
27 is a block diagram showing a configuration of a power calculation unit 406 in FIG.

【図28】図26の重みつき加算部407の構成を示す
ブロック図である。
28 is a block diagram showing a configuration of a weighted addition unit 407 of FIG.

【図29】図25の多重化乗算部17の構成を示すブロ
ック図である。
FIG. 29 is a block diagram showing the structure of the multiplexing multiplication unit 17 of FIG. 25.

【図30】図25の推定雑音計算部51の構成を示すブ
ロック図である。
30 is a block diagram showing a configuration of an estimated noise calculation unit 51 of FIG. 25.

【図31】図30の周波数別推定雑音計算部514の構
成を示すブロック図である。
31 is a block diagram showing a configuration of a frequency-dependent estimated noise calculation unit 514 of FIG. 30. FIG.

【図32】図31の更新判定部521の構成を示すブロ
ック図である。
32 is a block diagram showing a configuration of an update determination unit 521 in FIG.

【図33】図25の周波数別SNR計算部6の構成を示
すブロック図である。
FIG. 33 is a block diagram showing a configuration of a frequency-specific SNR calculation unit 6 of FIG. 25.

【図34】図25の推定先天的SNR計算部7の構成を
示すブロック図である。
34 is a block diagram showing a configuration of an estimated a priori SNR calculation unit 7 in FIG. 25.

【図35】図34の多重値域限定処理部701の構成を
示すブロック図である。
35 is a block diagram showing a configuration of a multiple value range limitation processing unit 701 of FIG. 34.

【図36】図34の多重重みつき加算部707の構成を
示すブロック図である。
36 is a block diagram showing a configuration of a multiple weighted addition unit 707 of FIG. 34.

【図37】図25の雑音抑圧係数生成部8の構成を示す
ブロック図である。
FIG. 37 is a block diagram showing the configuration of the noise suppression coefficient generation unit 8 in FIG. 25.

【図38】図37の抑圧係数検索部8010〜801K-1
の構成を示すブロック図である。
FIG. 38 is a suppression coefficient search unit 801 0 to 801 K-1 shown in FIG. 37.
3 is a block diagram showing the configuration of FIG.

【符号の説明】[Explanation of symbols]

1 フレーム分割部 2,22 窓がけ処理部 3 フーリエ変換部 4 音声検出部 5,51,52,53 推定雑音計算部 6,61,715,1402 周波数別SNR計算部 7,71 推定先天的SNR計算部 8,81 雑音抑圧係数生成部 9 逆フーリエ変換部 10 フレーム合成部 11 入力端子 12 出力端子 13,5049 カウンタ 14 重みつき劣化音声計算部 15 抑圧係数補正部 16,17,704,705,716,1404 多重
乗算部 401,1593,5204,5206 閾値記憶部 402,1594,5203,5205 比較部 404,4075 定数乗算器 405 対数計算部 406 パワー計算部 407,5071,70710〜7071K-1 重みつき
加算部 408,706,5072 重み記憶部 409,5202 論理否定回路 502,505,602,603 分離部 503,604,804,147 多重化部 5040〜504K-1,5060〜506K-1,507,5
080〜508K-1,5140〜514K-1 周波数別推定
雑音計算部 520,521,522 更新判定部 6010〜601K-1,5041,5048 除算部 611,612 周波数別パワー計算部 701 多重値域限定処理部 702 後天的SNR記憶部 703 抑圧係数記憶部 707 多重重みつき加算部 708,4063,4072,4074,5046,6
1100〜6110M-1加算器 712,1401,5942 推定雑音記憶部 713 強調音声パワースペクトル記憶部 8010〜801K-1 抑圧係数検索部 811 ゲイン関数値計算部 812 一般化尤度比計算部 813 音声存在確率記憶部 814 抑圧係数計算部 901 劣化音声パワー 902 閾値 903,923 重み 904 更新閾値 905 重みつき加算部制御信号 9100〜910K-1,9100〜910ML-1 周波数別
劣化音声パワースペクトル 9110〜911K-1,9110〜911ML-1 帯域別劣
化音声パワースペクトル 921 瞬時推定SNR 9210〜921K-1 周波数別瞬時推定SNR 922 過去の推定SNR 9220〜922K-1 過去の周波数別推定SNR 924 推定先天的SNR 9240〜924K-1 周波数別推定先天的SNR 1405 多重非線形処理部 14850〜1485K-1,5042 非線形処理部 15010〜1501K-1 周波数別抑圧係数補正部 1591,70120〜7012K-1 最大値選択部 1592 抑圧係数下限値記憶部 1595,5044 スイッチ 1596 修正量記憶部 1597,17010〜1701K-1,40620〜406
K-1,4071,4073,5043 乗算器 5045 シフトレジスタ 5047 最小値選択部 5201,5211,5221 論理和計算部 5207 閾値計算部 5941 レジスタ長記憶部 7011 定数記憶部 8011 抑圧係数テーブル 8012,8013 アドレス変換部
1 frame division unit 2, 22 windowing processing unit 3 Fourier transform unit 4 voice detection unit 5, 51, 52, 53 estimated noise calculation unit 6, 61, 715, 1402 frequency SNR calculation unit 7, 71 estimated a priori SNR calculation Section 8, 81 noise suppression coefficient generation section 9 inverse Fourier transform section 10 frame synthesis section 11 input terminal 12 output terminal 13, 5049 counter 14 weighted deteriorated speech calculation section 15 suppression coefficient correction section 16, 17, 704, 705, 716 1404 Multiple multiplication units 401, 1593, 5204, 5206 Threshold storage units 402, 1594, 5203, 5205 Comparison units 404, 4075 Constant multiplier 405 Logarithmic calculation unit 406 Power calculation units 407, 5071, 7071 0 to 7071 K-1 Weighted Adders 408, 706, 5072 Weight storages 409, 5202 Logical NOT circuit 502 505,602,603 separation unit 503,604,804,147 multiplexer 504 0 ~504 K-1, 506 0 ~506 K-1, 507,5
08 0 to 508 K-1 , 514 0 to 514 K-1 Frequency - dependent estimated noise calculation unit 520, 521, 522 Update determination unit 601 0 to 601 K-1 , 5041, 5048 Division unit 611, 612 Frequency-specific power calculation unit 701 Multiple range limitation processing section 702 Acquired SNR storage section 703 Suppression coefficient storage section 707 Multiple weighted addition sections 708, 4063, 4072, 4074, 5046, 6
110 0 to 6110 M-1 adder 712, 1401, 5942 Estimated noise storage unit 713 Enhanced speech power spectrum storage unit 801 0 to 801 K-1 suppression coefficient search unit 811 Gain function value calculation unit 812 Generalized likelihood ratio calculation unit 813 voice existence probability storage unit 814 suppression coefficient calculation unit 901 deteriorated voice power 902 threshold 903, 923 weight 904 update threshold 905 weighted addition unit control signals 910 0 to 910 K-1 , 910 0 to 910 ML-1 deteriorated voice by frequency Power spectrums 911 0 to 911 K-1 , 911 0 to 911 ML-1 Band-specific deteriorated speech power spectrum 921 Instantaneous estimation SNR 921 0 to 921 K-1 Instantaneous estimation SNR 922 by frequency Past estimation SNR 922 0 to 922 K- 1 past of the frequency domain estimated SNR 924 estimated apriori SNR 924 0 ~924 K-1 frequency domain estimated inherent SNR 1 05 Multiple nonlinear processor 1485 0 ~1485 K-1, 5042 nonlinear processor 1501 0 ~1501 K-1 frequency-suppression coefficient correction unit 1591,7012 0 ~7012 K-1 maximum value selection unit 1592 suppression coefficient lower-limit value storage unit 1595, 5044 Switch 1596 Correction amount storage unit 1597, 1701 0 to 1701 K-1 , 4062 0 to 406
2 K-1 , 4071, 4073, 5043 Multiplier 5045 Shift register 5047 Minimum value selection unit 5201, 5211, 5221 Logical sum calculation unit 5207 Threshold calculation unit 5941 Register length storage unit 7011 Constant storage unit 8011 Suppression coefficient table 8012, 8013 Address Converter

───────────────────────────────────────────────────── フロントページの続き (72)発明者 芹沢 昌宏 東京都港区芝五丁目7番1号 日本電気株 式会社内 Fターム(参考) 5D015 EE05    ─────────────────────────────────────────────────── ─── Continued front page    (72) Inventor Masahiro Serizawa             5-7 Shiba 5-1, Minato-ku, Tokyo NEC Corporation             Inside the company F-term (reference) 5D015 EE05

Claims (18)

【特許請求の範囲】[Claims] 【請求項1】 入力信号を周波数領域信号に変換し、該
周波数領域信号に基づいて信号対雑音比を求め、該信号
対雑音比に基づいて抑圧係数を定め、該抑圧係数に基づ
いて前記周波数領域信号を重みづけし、該重みづけされ
た周波数領域信号を時間領域信号に変換することによっ
てノイズを除去した出力信号を得る際に、前記入力信号
に第1の窓がけを施してから周波数領域信号に変換し、
前記時間領域信号に第2の窓がけを施して前記出力信号
を得ることを特徴とするノイズ除去方法。
1. An input signal is converted into a frequency domain signal, a signal-to-noise ratio is obtained based on the frequency-domain signal, a suppression coefficient is determined based on the signal-to-noise ratio, and the frequency is calculated based on the suppression coefficient. When obtaining a noise-removed output signal by weighting the domain signal and converting the weighted frequency domain signal into a time domain signal, the frequency domain is applied after the first windowing is applied to the input signal. Convert it to a signal,
A noise removing method, wherein the output signal is obtained by applying a second windowing to the time domain signal.
【請求項2】 前記第1の窓がけを施す際の第1の窓関
数と前記第2の窓がけを施す際の第2の窓関数とが、前
記抑圧係数を1に設定したときの前記入力信号と前記出
力信号が一致するような特性を有することを特徴とする
請求項1記載のノイズ除去方法。
2. The first window function when applying the first windowing and the second window function when applying the second windowing, when the suppression coefficient is set to 1 The noise removing method according to claim 1, wherein the noise removing method has a characteristic that an input signal and the output signal match each other.
【請求項3】 前記第1の窓がけを施す際の第1の窓関
数と前記第2の窓がけを施す際の第2の窓関数とが等し
いことを特徴とする請求項1又は2記載のノイズ除去方
法。
3. The first window function when applying the first windowing and the second window function when applying the second windowing are equal to each other. Noise removal method.
【請求項4】 前記抑圧係数を補正して得られる補正抑
圧係数を用いて前記周波数領域信号を重みづけすること
を特徴とする請求項1、2又は3記載のノイズ除去方
法。
4. The noise removing method according to claim 1, wherein the frequency domain signal is weighted using a corrected suppression coefficient obtained by correcting the suppression coefficient.
【請求項5】 前記信号対雑音比を補正して得られる補
正信号対雑音比に基づいて前記抑圧係数を定めることを
特徴とする請求項1、2又は3記載のノイズ除去方法。
5. The noise removing method according to claim 1, 2 or 3, wherein the suppression coefficient is determined based on a corrected signal-to-noise ratio obtained by correcting the signal-to-noise ratio.
【請求項6】 前記周波数領域信号を重みづけして重み
つき周波数領域信号を求め、該重みつき周波数領域信号
を用いて推定雑音を求め、該推定雑音と前記周波数領域
信号を用いて信号対雑音比を求めることを特徴とする請
求項1、2、3、4又は5記載のノイズ除去方法。
6. A weighted frequency domain signal is obtained by weighting the frequency domain signal, an estimated noise is obtained using the weighted frequency domain signal, and a signal-to-noise is obtained using the estimated noise and the frequency domain signal. The method according to claim 1, 2, 3, 4, or 5, wherein a ratio is obtained.
【請求項7】 入力信号を周波数領域信号に変換し、該
周波数領域信号に基づいて推定雑音を求め、該推定雑音
に対応した値を前記周波数領域信号から差し引いて周波
数領域の強調音声を求め、該強調音声を時間領域信号に
変換することによってノイズを除去した出力信号を得る
際に、前記入力信号に第1の窓がけを施してから周波数
領域信号に変換し、前記時間領域信号に第2の窓がけを
施して出力信号を得ることを特徴とするノイズ除去方
法。
7. An input signal is converted into a frequency domain signal, an estimated noise is obtained based on the frequency domain signal, and a value corresponding to the estimated noise is subtracted from the frequency domain signal to obtain an emphasized voice in the frequency domain, When the noise-removed output signal is obtained by converting the emphasized speech into a time domain signal, the input signal is first windowed and then converted into a frequency domain signal, and the time domain signal is converted into a second domain signal. A method of removing noise, characterized in that an output signal is obtained by applying the windowing of.
【請求項8】 前記周波数領域信号を重みづけして重み
つき周波数領域信号を求め、該重みつき周波数領域信号
を用いて前記推定雑音を求めることを特徴とする請求項
7記載のノイズ除去方法。
8. The noise removing method according to claim 7, wherein the frequency domain signal is weighted to obtain a weighted frequency domain signal, and the estimated noise is obtained using the weighted frequency domain signal.
【請求項9】 前記周波数領域信号を重みづけして重み
つき周波数領域信号を求める際に、信号対雑音比を用い
て重みを求めることを特徴とする請求項6又は8記載の
ノイズ除去方法。
9. The noise removing method according to claim 6, wherein when the weighted frequency domain signal is obtained by weighting the frequency domain signal, the weight is obtained using a signal-to-noise ratio.
【請求項10】 前記周波数領域信号を重みづけして重
みつき周波数領域信号を求める際に、信号対雑音比を用
いて重みを求め、該重みを非線形関数によって処理して
補正重みを求め、該補正重みを用いて前記周波数領域信
号を重みづけすることを特徴とする請求項6又は8記載
のノイズ除去方法。
10. When the frequency domain signal is weighted to obtain a weighted frequency domain signal, a weight is obtained using a signal-to-noise ratio, the weight is processed by a non-linear function, and a correction weight is obtained. 9. The noise removing method according to claim 6, wherein the frequency domain signal is weighted using a correction weight.
【請求項11】 入力信号に窓がけ処理を施す第1の窓
がけ処理部と、 前記第1の窓がけ処理部で窓がけ処理が施された入力信
号を周波数領域信号に変換する変換部と、 前記変換部で変換された周波数領域信号の振幅成分に基
づいて信号対雑音比を求める信号対雑音比計算部と、 前記信号雑音比計算部で求められた信号対雑音比に基づ
いて抑圧係数を生成する抑圧係数生成部と、 前記抑圧係数生成部で生成された抑圧係数に基づいて前
記周波数領域信号の振幅成分を重みづけするための乗算
部と、 前記乗算部で重みづけされた周波数領域信号の振幅成分
と前記変換部で変換された周波数領域信号の位相成分を
時間領域信号に変換する逆変換部と、 前記逆変換部で変換された時間領域信号に窓がけ処理を
施す第2の窓がけ処理部とを備えることを特徴とするノ
イズ除去装置。
11. A first windowing processing unit that performs windowing processing on an input signal, and a conversion unit that converts the input signal that has been windowed by the first windowing processing unit into a frequency domain signal. A signal-to-noise ratio calculation unit that obtains a signal-to-noise ratio based on the amplitude component of the frequency-domain signal that has been converted by the conversion unit; And a multiplication unit for weighting the amplitude component of the frequency domain signal based on the suppression coefficient generated by the suppression coefficient generation unit, and the frequency domain weighted by the multiplication unit. An inverse transform unit that transforms the amplitude component of the signal and the phase component of the frequency domain signal transformed by the transform unit into a time domain signal; and a second windowing process for the time domain signal transformed by the inverse transform unit. Equipped with a window processing unit A noise eliminator characterized by.
【請求項12】 前記第1の窓がけ処理部で窓がけ処理
を施す際の第1の窓関数と前記第2の窓がけ処理部で窓
がけ処理を施す際の第2の窓関数とが、前記抑圧係数を
1に設定したときの入力信号と出力信号とが一致するよ
うな特性を有することを特徴とする請求項11記載のノ
イズ除去装置。
12. A first window function when performing windowing processing in the first windowing processing unit and a second window function when performing windowing processing in the second windowing processing unit 12. The noise removing apparatus according to claim 11, wherein the noise removing device has a characteristic that an input signal and an output signal match when the suppression coefficient is set to 1.
【請求項13】 前記第1の窓がけ処理部で窓がけ処理
を施す際の第1の窓関数と前記第2の窓がけ処理部で窓
がけ処理を施す際の第2の窓関数とが等しいことを特徴
とする請求項11又は12記載のノイズ除去装置。
13. A first window function used when performing windowing processing in the first windowing processing unit and a second window function used when performing windowing processing in the second windowing processing unit The noise removing device according to claim 11 or 12, wherein the noise removing devices are equal to each other.
【請求項14】 前記抑圧係数を補正する抑圧係数補正
部を有し、前記乗算部は前記抑圧係数補正部で補正され
た補正抑圧係数を用いて前記周波数領域信号の振幅成分
を重みづけすることを特徴とする請求項11、12又は
13記載のノイズ除去装置。
14. A suppression coefficient correction unit that corrects the suppression coefficient, wherein the multiplication unit weights the amplitude component of the frequency domain signal using the corrected suppression coefficient corrected by the suppression coefficient correction unit. The noise removing device according to claim 11, 12, or 13.
【請求項15】 前記抑圧係数生成部は、前記信号対雑
音比を補正して補正信号対雑音比を求める補正信号対雑
音比計算部を含むことを特徴とする請求項14記載のノ
イズ除去装置。
15. The noise eliminator according to claim 14, wherein the suppression coefficient generation unit includes a correction signal-to-noise ratio calculation unit that corrects the signal-to-noise ratio to obtain a correction signal-to-noise ratio. .
【請求項16】 前記信号対雑音比計算部は、前記周波
数領域信号の振幅成分を用いて雑音を推定する推定雑音
計算部を含み、当該推定雑音計算部の推定結果に基づい
て前記信号対雑音比を求めることを特徴とする請求項1
1,12,13,14又は15記載のノイズ除去装置。
16. The signal-to-noise ratio calculation unit includes an estimated noise calculation unit that estimates noise by using an amplitude component of the frequency domain signal, and the signal-to-noise ratio is calculated based on an estimation result of the estimated noise calculation unit. The ratio is calculated as claimed in claim 1.
The noise removing device according to 1, 12, 13, 14 or 15.
【請求項17】 前記推定雑音計算部は、前記周波数領
域信号の振幅成分を重みづけして重みつき振幅成分を求
める重みつき劣化音声計算部を含むことを特徴とする請
求項16記載のノイズ除去装置。
17. The noise removal according to claim 16, wherein the estimated noise calculation unit includes a weighted deteriorated speech calculation unit that weights an amplitude component of the frequency domain signal to obtain a weighted amplitude component. apparatus.
【請求項18】 前記重みつき劣化音声計算部は、前記
信号対雑音比を非線形関数によって処理して重み係数を
求める非線形処理部を含むことを特徴とする請求項17
記載のノイズ除去装置。
18. The weighted deteriorated speech calculation unit includes a non-linear processing unit that processes the signal-to-noise ratio by a non-linear function to obtain a weighting coefficient.
The noise removal device described.
JP2001327839A 2001-10-25 2001-10-25 Noise removing method and device Withdrawn JP2003131689A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2001327839A JP2003131689A (en) 2001-10-25 2001-10-25 Noise removing method and device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2001327839A JP2003131689A (en) 2001-10-25 2001-10-25 Noise removing method and device

Publications (1)

Publication Number Publication Date
JP2003131689A true JP2003131689A (en) 2003-05-09

Family

ID=19143999

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2001327839A Withdrawn JP2003131689A (en) 2001-10-25 2001-10-25 Noise removing method and device

Country Status (1)

Country Link
JP (1) JP2003131689A (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005202222A (en) * 2004-01-16 2005-07-28 Toshiba Corp Noise suppressor and voice communication device provided therewith
WO2006046293A1 (en) * 2004-10-28 2006-05-04 Fujitsu Limited Noise suppressor
WO2007029536A1 (en) 2005-09-02 2007-03-15 Nec Corporation Method and device for noise suppression, and computer program
WO2007058121A1 (en) * 2005-11-15 2007-05-24 Nec Corporation Reverberation suppressing method, device, and reverberation suppressing program
CN101091209B (en) * 2005-09-02 2010-06-09 日本电气株式会社 Noise suppressing method and apparatus
US8090119B2 (en) 2007-04-06 2012-01-03 Yamaha Corporation Noise suppressing apparatus and program
JP2015049354A (en) * 2013-08-30 2015-03-16 富士通株式会社 Voice processing device, voice processing method, and computer program for voice processing

Cited By (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4542790B2 (en) * 2004-01-16 2010-09-15 株式会社東芝 Noise suppressor and voice communication apparatus provided with noise suppressor
JP2005202222A (en) * 2004-01-16 2005-07-28 Toshiba Corp Noise suppressor and voice communication device provided therewith
WO2006046293A1 (en) * 2004-10-28 2006-05-04 Fujitsu Limited Noise suppressor
JP5092748B2 (en) * 2005-09-02 2012-12-05 日本電気株式会社 Noise suppression method and apparatus, and computer program
EP2555190A1 (en) 2005-09-02 2013-02-06 NEC Corporation Method, apparatus and computer program for suppressing noise
CN101091209B (en) * 2005-09-02 2010-06-09 日本电气株式会社 Noise suppressing method and apparatus
US9318119B2 (en) 2005-09-02 2016-04-19 Nec Corporation Noise suppression using integrated frequency-domain signals
CN101300623B (en) * 2005-09-02 2011-07-27 日本电气株式会社 Method and device for noise suppression, and computer program
US8489394B2 (en) 2005-09-02 2013-07-16 Nec Corporation Method, apparatus, and computer program for suppressing noise
US8477963B2 (en) 2005-09-02 2013-07-02 Nec Corporation Method, apparatus, and computer program for suppressing noise
JPWO2007029536A1 (en) * 2005-09-02 2009-03-19 日本電気株式会社 Noise suppression method and apparatus, and computer program
US8233636B2 (en) 2005-09-02 2012-07-31 Nec Corporation Method, apparatus, and computer program for suppressing noise
WO2007029536A1 (en) 2005-09-02 2007-03-15 Nec Corporation Method and device for noise suppression, and computer program
JP4973873B2 (en) * 2005-11-15 2012-07-11 日本電気株式会社 Reverberation suppression method, apparatus, and reverberation suppression program
US8073147B2 (en) 2005-11-15 2011-12-06 Nec Corporation Dereverberation method, apparatus, and program for dereverberation
WO2007058121A1 (en) * 2005-11-15 2007-05-24 Nec Corporation Reverberation suppressing method, device, and reverberation suppressing program
US8090119B2 (en) 2007-04-06 2012-01-03 Yamaha Corporation Noise suppressing apparatus and program
JP2015049354A (en) * 2013-08-30 2015-03-16 富士通株式会社 Voice processing device, voice processing method, and computer program for voice processing

Similar Documents

Publication Publication Date Title
JP4282227B2 (en) Noise removal method and apparatus
JP3454206B2 (en) Noise suppression device and noise suppression method
KR101052445B1 (en) Method and apparatus for suppressing noise, and computer program
JP4670483B2 (en) Method and apparatus for noise suppression
KR100927897B1 (en) Noise suppression method and apparatus, and computer program
RU2127454C1 (en) Method for noise suppression
EP1806739B1 (en) Noise suppressor
JP5435204B2 (en) Noise suppression method, apparatus, and program
WO2002080148A1 (en) Noise suppressor
US20010005822A1 (en) Noise suppression apparatus realized by linear prediction analyzing circuit
JP3858668B2 (en) Noise removal method and apparatus
JP2007006525A (en) Method and apparatus for removing noise
WO2012070668A1 (en) Signal processing device, signal processing method, and signal processing program
JP2008216721A (en) Noise suppression method, device, and program
JP4395772B2 (en) Noise removal method and apparatus
JP2003131689A (en) Noise removing method and device
JP5413575B2 (en) Noise suppression method, apparatus, and program
EP1278185A2 (en) Method for improving noise reduction in speech transmission
JP4968355B2 (en) Method and apparatus for noise suppression
JP2022011890A (en) Noise update circuit

Legal Events

Date Code Title Description
RD03 Notification of appointment of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7423

Effective date: 20040423

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20050816

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20051028

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20051227

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20060413

RD01 Notification of change of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7421

Effective date: 20060515

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20060608

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20060515

A911 Transfer to examiner for re-examination before appeal (zenchi)

Free format text: JAPANESE INTERMEDIATE CODE: A911

Effective date: 20060704

A761 Written withdrawal of application

Free format text: JAPANESE INTERMEDIATE CODE: A761

Effective date: 20060810