JP2000105599A - Noise level time variation coefficient calculating method, device thereof, and noise reducing method - Google Patents

Noise level time variation coefficient calculating method, device thereof, and noise reducing method

Info

Publication number
JP2000105599A
JP2000105599A JP10276251A JP27625198A JP2000105599A JP 2000105599 A JP2000105599 A JP 2000105599A JP 10276251 A JP10276251 A JP 10276251A JP 27625198 A JP27625198 A JP 27625198A JP 2000105599 A JP2000105599 A JP 2000105599A
Authority
JP
Japan
Prior art keywords
noise
section
time
signal
input signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP10276251A
Other languages
Japanese (ja)
Other versions
JP3310225B2 (en
Inventor
Nobuyuki Kunieda
枝 伸 行 國
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Panasonic Holdings Corp
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Priority to JP27625198A priority Critical patent/JP3310225B2/en
Publication of JP2000105599A publication Critical patent/JP2000105599A/en
Application granted granted Critical
Publication of JP3310225B2 publication Critical patent/JP3310225B2/en
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

PROBLEM TO BE SOLVED: To effectively operate even against a voice superposed with noise varying the level with the lapse of time. SOLUTION: An :put signal X is cut out into a time section by being multiplied by a correlation function by a cut-out means 2, a calculation means 3 calculates an autocorrelation coefficient from the time section, and an estimation means 4 estimates the noise level of the time section from difference of the maximum value of the autocorrelation coefficient and an autocorrelation coefficient of maximal value having a second size. When the newest cut-out time section is judged to be a noise section by a judging means 6, a calculation means 7 updates the average noise level. A calculation means 5 calculates the ratio of the noise level of the time section to the average noise level, and the ratio of the magnitude of noise varying from the noise section to the newest time section is output as the coefficient of time variation K. By multiplying this by the estimated value of the characteristic quantity of estimated noise, the noise reducing quantity is adjusted.

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は、騒音環境下におい
て発声された音声、あるいは電気的な雑音の加わった音
声に対し、音声に加わっている雑音の大きさが、時間と
ともにどの程度変化したかを示す雑音レベルの時間変動
率を計算する方法、及びその方法を利用して雑音レベル
が時間変化する雑音が重畳した音声信号から音声のみを
取り出す雑音低減方法、雑音低減装置に関するものであ
る。
BACKGROUND OF THE INVENTION The present invention relates to a speech generated in a noisy environment or a speech to which electrical noise is added, and how much the noise added to the speech changes with time. The present invention relates to a method for calculating a time variation rate of a noise level indicating a noise level, a noise reduction method for extracting only voice from a voice signal on which a noise whose noise level changes with time is superimposed, and a noise reduction apparatus.

【0002】[0002]

【従来の技術】雑音低減方式としては、Bollの文献(S.
F.Boll: "Suppression of acoustic noise in speech u
sing spectral subtraction", IEEE Trans. On Acous
t., Speech, and Sig. Proc., vol.ASSP-27, no.2, pp.
113-120,1979.4. )などに示されているスペクトルサブ
トラクション法や古くからあるウィーナーフィルタが代
表的である。この他にもコムフィルタや適応フィルタと
いった様々な雑音低減方式が研究開発されているが、こ
れらの代表的なものは、Limの編集した文献集(J.S.Lim
: "Speech enhancement", Prentice-Hall, Englewood
Cliffs, 1983. )にまとめられている。
2. Description of the Related Art A Boll reference (S.
F.Boll: "Suppression of acoustic noise in speech u
sing spectral subtraction ", IEEE Trans. On Acous
t., Speech, and Sig. Proc., vol.ASSP-27, no.2, pp.
113-120, 1979.4.) And a Wiener filter that has been used for a long time. In addition, various noise reduction methods such as comb filters and adaptive filters have been researched and developed, but the most representative ones are Lim's compiled reference book (JSLim
By "Speech enhancement", Prentice-Hall, Englewood
Cliffs, 1983.).

【0003】雑音低減装置に広く利用されているスペク
トルサブトラクション法やウィーナーフィルタでは、一
般に音声の含まれない時間区間である雑音区間において
雑音特性を推定し、その雑音分だけ入力信号から引き算
することを基本原理として雑音低減を行う(図15、図
16参照)。しかし、音声の含まれる時間区間である音
声区間では、一般に雑音スペクトルの推定値を更新しな
いため、時間変化する雑音には対応しきれないという欠
点がある。この問題を解決する手段の例としては、まず
文献(谷口、津村、福留:“適応的に雑音を推定するス
ペクトルサブトラクション法”、電子情報通信学会技術
研究報告、SP94-116, pp.63-68,1995.3)に記載される
方法がある。この方法では、雑音低減処理する時間区間
が音声区間であるか雑音区間であるかの判定は行わず
に、適応アルゴリズムを用いて音声区間においても雑音
スペクトルの推定と更新を行うように構成されている。
A spectrum subtraction method and a Wiener filter widely used in a noise reduction apparatus generally estimate a noise characteristic in a noise section which is a time section containing no speech, and subtract the noise component from an input signal. Noise reduction is performed as a basic principle (see FIGS. 15 and 16). However, in a voice section which is a time section including voice, since the estimated value of the noise spectrum is not generally updated, there is a drawback that it cannot cope with time-varying noise. Examples of means to solve this problem are described in the literature (Taniguchi, Tsumura, Fukudome: "Spectral subtraction method for adaptively estimating noise", IEICE Technical Report, SP94-116, pp.63-68. , 1995.3). In this method, it is configured not to determine whether the time section to be subjected to the noise reduction processing is a speech section or a noise section, and to estimate and update the noise spectrum in the speech section using an adaptive algorithm. I have.

【0004】しかしながら、この方法での音声区間で雑
音を推定・更新するアルゴリズムは、単語のような短時
間の音声が入力されることを前提としており、音声区間
が長い場合には対応できない。一方、文献(高木、吉
田、渡辺:“2段スペクトルサブトラクション法による
雑音下連続音声認識”、1992年電子情報通信学会春季大
会講演論文集、A-238 、1992. )に記載の方法では、音
声入力用マイクとは別に雑音のみを入力する専用のマイ
クを利用し、音声区間においても雑音スペクトルの推定
・更新が逐次可能となるように構成されている。しか
し、常に2つのマイクを設置する状況を作り出せるとは
限らず、また雑音低減効果を得るためには雑音のみが入
力するマイクの設置法を考慮しなければならないという
問題がある。
However, the algorithm for estimating and updating noise in a voice section in this method is based on the assumption that a short-time voice such as a word is input, and cannot cope with a long voice section. On the other hand, the method described in the literature (Takagi, Yoshida, Watanabe: "Continuous Speech Recognition under Noise by Two-Stage Spectral Subtraction Method", Proceedings of the 1992 IEICE Spring Conference, A-238, 1992.) A dedicated microphone for inputting only noise is used in addition to the input microphone, and the noise spectrum can be estimated and updated sequentially even in the voice section. However, it is not always possible to create a situation in which two microphones are installed, and in order to obtain a noise reduction effect, it is necessary to consider a microphone installation method in which only noise is input.

【0005】[0005]

【発明が解決しようとする課題】雑音低減装置において
は、音声の含まれていない時間区間である雑音区間で雑
音特性を推定し、入力信号から推定した雑音成分を低減
する処理を行う。しかし雑音成分は、雑音区間で求めた
雑音スペクトルの推定値であるため、時間変化する雑音
には追随できなかった。
The noise reduction apparatus performs processing for estimating noise characteristics in a noise section which is a time section containing no voice, and reducing a noise component estimated from an input signal. However, since the noise component is an estimated value of the noise spectrum obtained in the noise section, the noise component cannot follow the time-varying noise.

【0006】本発明は、このような従来の問題を解決す
るものであり、時間とともに雑音の大きさが変化する場
合にも有効な雑音レベル時間変動率計算方法及び装置と
雑音低減方法及び装置を提供することを目的とする。
SUMMARY OF THE INVENTION The present invention solves such a conventional problem. A method and apparatus for calculating a noise level temporal fluctuation rate and a noise reduction method and apparatus which are effective even when the magnitude of noise changes with time. The purpose is to provide.

【0007】[0007]

【課題を解決するための手段】上記の目的を達成するた
めに、本発明は、入力信号を一定時間の時間区間として
逐次切り出し、その時間区間の雑音レベルを自己相関係
数を利用して計算し、雑音特性を推定した時間区間の雑
音レベルの平均値(平均雑音レベル)と比を計算するこ
とによって雑音レベルの時間変動率として表現し、その
雑音レベルの変動率を使って雑音の引き算量を随時調整
するようにしたものである。
SUMMARY OF THE INVENTION In order to achieve the above object, the present invention provides a method of sequentially extracting an input signal as a time interval of a fixed time, and calculating a noise level in the time interval using an autocorrelation coefficient. Then, by calculating the average value (average noise level) and the ratio of the noise level in the time section for which the noise characteristics are estimated, the noise level is expressed as the time variation of the noise level, and the noise subtraction amount is calculated using the noise level variation rate. Is adjusted at any time.

【0008】この場合の雑音レベルの計算方法は、入力
信号から自己相関係数を計算し、その最大値をとるピー
クの自己相関係数と第2の極大値ピークを持つ自己相関
係数の差を計算して、入力信号に加わっている雑音レベ
ルとする。その具体的な原理について説明する。
In this case, the noise level is calculated by calculating the autocorrelation coefficient from the input signal and calculating the difference between the autocorrelation coefficient of the peak having the maximum value and the autocorrelation coefficient having the second maximum value peak. Is calculated as the noise level added to the input signal. The specific principle will be described.

【0009】まず、入力信号をx(i)とすると、自己
相関係数R(j)は次式(1)で表される。
First, assuming that an input signal is x (i), an autocorrelation coefficient R (j) is expressed by the following equation (1).

【数1】 (Equation 1)

【0010】ここで、jは遅延時間を表し、Nは自己相
関係数を求める際に信号の積和計算をする範囲を表す定
数、Mは最大遅延時間(自己相関係数を計算する範囲)
を示す定数である。この自己相関係数は、時間区間とし
て切り出された信号区間の自己相関係数として求められ
るが、無限区間の自己相関係数の性質のうち自己相関係
数の値が時間とともに減衰しない性質を保持するように
計算する。例えば、自己相関係数を計算する時間から
(N+M)の時間後の入力信号までのx(i)の値が使
えるようにしておけばよい。
Here, j represents the delay time, N is a constant representing the range in which the product sum of the signals is calculated when obtaining the autocorrelation coefficient, and M is the maximum delay time (the range in which the autocorrelation coefficient is calculated).
Is a constant. This autocorrelation coefficient is obtained as the autocorrelation coefficient of the signal section cut out as a time section, but retains the property that the value of the autocorrelation coefficient does not decay with time among the properties of the autocorrelation coefficient of the infinite section To calculate. For example, the value of x (i) from the time of calculating the autocorrelation coefficient to the input signal after the time of (N + M) may be used.

【0011】この自己相関係数R(j)は、入力信号が
周期信号の場合、周期Tごとに極大値ピークが現われる
ことは一般的な特徴であり、音声の周期検出にも利用さ
れている(図13参照)。さらに、R(0)は入力信号
の平均パワーを示す値である。また、雑音の重畳してい
ない周期信号であれば、その自己相関係数をRs(0)
とすると、その周期Tにおける自己相関係数には、 Rs(0)=Rs(T) (2) という関係が成立する。この性質は、無限時間で積分す
る自己相関関数の性質であるが、上記に示した時間とと
もに減衰しない自己相関係数であれば、近似式として成
立する。音声信号は完全な周期信号ではないが、局所的
に見ると周期信号として見ることができ、この性質を満
たすものと考えられる。
The autocorrelation coefficient R (j) is a general feature that, when the input signal is a periodic signal, a local maximum peak appears at each cycle T, and is also used for detecting the cycle of speech. (See FIG. 13). Further, R (0) is a value indicating the average power of the input signal. If the signal is a periodic signal on which no noise is superimposed, its autocorrelation coefficient is Rs (0)
Then, a relationship of Rs (0) = Rs (T) (2) is established for the autocorrelation coefficient in the cycle T. This property is the property of the autocorrelation function that integrates in infinite time, but if it is the autocorrelation coefficient that does not attenuate with time shown above, it is established as an approximate expression. The audio signal is not a perfect periodic signal, but can be seen as a periodic signal when viewed locally, and is considered to satisfy this property.

【0012】次に、ランダム雑音の重畳した周期信号の
場合を入力信号を、 x(i)=s(i)+n(i) (3) と表して考える。ここで、s(i)は周期信号であり、
n(i)はランダム雑音成分を表す。このときの、自己
相関係数Rn(j)は、
Next, the case of a periodic signal on which random noise is superimposed will be considered by expressing the input signal as x (i) = s (i) + n (i) (3). Here, s (i) is a periodic signal,
n (i) represents a random noise component. The autocorrelation coefficient Rn (j) at this time is

【数2】 によって求められる(自己相関係数の例は図14に示
す)。ここで、n(i)がランダム信号であれば、s
(i)とn(i)が無相関となることから、
(Equation 2) (An example of the autocorrelation coefficient is shown in FIG. 14). Here, if n (i) is a random signal, s
Since (i) and n (i) are uncorrelated,

【数3】 の期待値が0となる。さらに、(Equation 3) Is expected to be zero. further,

【数4】 の値もj>0であれば、その期待値が0に近づく。従っ
て、j>0を満たす自己相関係数は、
(Equation 4) Is also closer to 0 if j> 0. Therefore, the autocorrelation coefficient satisfying j> 0 is

【数5】 で近似され、雑音が重畳していないときの自己相関係数
に近づくことを意味する。
(Equation 5) , And approaches the autocorrelation coefficient when noise is not superimposed.

【0013】こららの自己相関係数の性質は、文献(高
杉、鈴木、田中:“自己相関関数を利用した音声処理方
式(SPAC)の機能と基本特性”、電子通信学会論文
誌(A)、No.62、no. 、pp.175-182、1979-3.)にお
いて、音低減装置に利用されたり、文献(國枝、島村、
鈴木:“品質劣化音声のためのLPC分析の一改良
法”、電子情報通信学会論文誌(A) 、No.J80-A、No.9、
pp.1564-1566、1997.09 .)において音声の分析に利用
されており、効果が得られている。この性質を利用すれ
ば、Rn(T)が雑音の重畳していない音声信号のRs
(0)に近づくと考えることができることから、音声パ
ワーPSを、 PS=Rs(0)=Rn(T) (8) によって近似できることが分かる。さらに、
The properties of these autocorrelation coefficients are described in the literature (Takasugi, Suzuki, Tanaka: “Functions and basic characteristics of speech processing system (SPAC) using autocorrelation function)”, IEICE Transactions (A) , No. 62, no., Pp. 175-182, 1979-3.), Used in sound reduction devices, and literatures (Kunieda, Shimamura,
Suzuki: "An Improved Method of LPC Analysis for Degraded Voice", IEICE Transactions on Electronics (A), No.J80-A, No.9,
pp. 1564-1566, 1997.09.), which has been used for speech analysis, and has been effective. If this property is used, Rn (T) becomes Rs of the audio signal on which noise is not superimposed.
Since it can be considered to approach (0), it can be seen that the audio power PS can be approximated by PS = Rs (0) = Rn (T) (8) further,

【数6】 と近似できることから、雑音のパワーPNは、 PN=Rn(0)−Rn(T) (10) として近似できることが分かる。この雑音のパワーPN
を雑音レベルとして置き換える。そして、雑音レベルの
時間変動率Kは、自己相関係数から計算した入力信号に
重畳している雑音レベルNLxと、雑音区間における平
均雑音レベルNLnから、 K=NLx/NLn (11) によって計算する。ここで、雑音区間における平均雑音
レベルNLnは、音声のないと判断した時間区間(雑音
区間)において計算した雑音レベルを平均化することに
よって求めたものである。
(Equation 6) It can be seen that the noise power PN can be approximated as PN = Rn (0) -Rn (T) (10) Power PN of this noise
As the noise level. Then, the time variation rate K of the noise level is calculated from the noise level NLx superimposed on the input signal calculated from the autocorrelation coefficient and the average noise level NLn in the noise section as follows: K = NLx / NLn (11) . Here, the average noise level NLn in the noise section is obtained by averaging the noise levels calculated in the time section (noise section) where it is determined that there is no voice.

【0014】雑音低減装置における雑音特性は、一般的
に雑音区間で求めることから、雑音区間から処理する現
在の時間までの雑音レベルの変動率を雑音特性に掛け算
することによって、時間変化した雑音を推定することが
可能となる。このアルゴリズムを雑音低減装置における
雑音低減処理部に組み込むことによって、雑音レベルが
時間変化する雑音の重畳した音声に対しても有効な雑音
低減が実現できる。
Since the noise characteristic of the noise reduction device is generally obtained in a noise interval, the noise characteristic is multiplied by the noise level fluctuation rate from the noise interval to the current time to be processed, so that the time-varying noise is obtained. It can be estimated. By incorporating this algorithm into the noise reduction processing unit of the noise reduction device, effective noise reduction can be realized even for voices in which noise whose noise level changes with time is superimposed.

【0015】[0015]

【発明の実施の形態】本発明の請求項1に記載の発明
は、雑音などを含んだ音声を入力信号とし、入力信号に
窓関数を掛け算することによって時間区間の信号に切り
出し、切り出した時間区間の信号の自己相関係数を計算
し、切り出した時間区間の信号に重畳している雑音の雑
音レベルを自己相関係数から推定し、切り出した時間区
間が音声区間または雑音区間のいずれであるかを判定
し、雑音区間であると判定された時間区間の平均雑音レ
ベルを自己相関係数から計算する処理を有し、切り出し
た時間区間の雑音レベルと雑音区間で計算した平均雑音
レベルの比を計算することによって、最も近い雑音区間
から、切り出した時間区間までの時間に変化した雑音の
大きさを雑音レベルの時間変動率として計算する雑音レ
ベル時間変動率計算方法であり、時間とともに雑音の大
きさが変化する場合にも有効に追随することができる。
DETAILED DESCRIPTION OF THE PREFERRED EMBODIMENTS The invention according to claim 1 of the present invention is characterized in that a speech including noise or the like is used as an input signal, and the input signal is multiplied by a window function to cut it out into a signal of a time section, and the cut-out time is obtained. Calculate the autocorrelation coefficient of the signal of the section, estimate the noise level of the noise superimposed on the signal of the cut time section from the autocorrelation coefficient, and the cut time section is either a voice section or a noise section. Has a process of calculating the average noise level of the time section determined to be a noise section from the autocorrelation coefficient, and the ratio of the noise level of the extracted time section to the average noise level calculated in the noise section. The noise level temporal fluctuation rate calculation method calculates the magnitude of the noise that has changed in the time from the nearest noise section to the cut-out time section as the temporal fluctuation rate of the noise level by calculating , And the can follow effectively even when a change in the magnitude of the noise over time.

【0016】本発明の請求項2に記載の発明は、前記の
切り出した時間区間の信号に重畳している雑音の雑音レ
ベルを自己相関係数から推定する際に、自己相関係数の
遅延時間系列における自己相関係数の最大値と、第2の
大きさを有する極大値の自己相関係数の差を計算して雑
音レベルの推定を行うことを特徴とする請求項1に記載
の雑音レベル時間変動率計算方法であり、時間とともに
雑音の大きさが変化する場合にも有効に追随することが
できる。
According to a second aspect of the present invention, when the noise level of the noise superimposed on the signal in the cut-out time section is estimated from the autocorrelation coefficient, the delay time of the autocorrelation coefficient is reduced. 2. The noise level according to claim 1, wherein the difference between the maximum value of the autocorrelation coefficient in the sequence and the autocorrelation coefficient of the local maximum having the second magnitude is calculated to estimate the noise level. This is a time variation calculation method, and can effectively follow the case where the magnitude of noise changes with time.

【0017】本発明の請求項3に記載の発明は、請求項
1または2において、計算する自己相関係数の積和時間
をN、求める自己相関係数の最大遅延時間をMとしたと
きに、入力信号を時間区間の信号として切り出す窓関数
を時間長(M+N)以上の方形波とする雑音レベル時間
変動率計算方法であり、時間とともに雑音の大きさが変
化する場合にも有効に追随することができる。
According to a third aspect of the present invention, in the first or second aspect, when the product-sum time of the calculated autocorrelation coefficient is N and the maximum delay time of the calculated autocorrelation coefficient is M, Is a method for calculating a noise level temporal fluctuation rate in which a window function for extracting an input signal as a signal in a time section is a square wave having a time length (M + N) or more, and effectively follows even when the magnitude of noise changes with time. be able to.

【0018】本発明の請求項4に記載の発明は、雑音な
どを含んだ音声を入力信号とし、入力信号に窓関数を掛
け算することによって時間区間の信号に切り出す手段
と、切り出した時間区間の信号の自己相関係数を計算す
る手段と、切り出した時間区間の信号に重畳している雑
音の雑音レベルを自己相関係数から推定する手段と、切
り出した時間区間が音声区間または雑音区間のいずれで
あるかを判定する手段と、雑音区間であると判定された
時間区間の平均雑音レベルを自己相関係数から計算する
手段を有し、切り出した時間区間の雑音レベルと雑音区
間で計算した平均雑音レベルの比を計算することによっ
て、最も近い雑音区間から、切り出した時間区間までの
時間に変化した雑音の大きさを雑音レベルの時間変動率
として計算する雑音レベル時間変動率計算装置であり、
時間とともに雑音の大きさが変化する場合にも有効に追
随することができる。
According to a fourth aspect of the present invention, there is provided a means for extracting a speech including a noise or the like as an input signal, and multiplying the input signal by a window function to cut out the signal into a time interval signal; Means for calculating the autocorrelation coefficient of the signal, means for estimating the noise level of noise superimposed on the signal in the cut time section from the autocorrelation coefficient, and means for selecting whether the cut time section is a speech section or a noise section. And means for calculating the average noise level of the time section determined to be a noise section from the autocorrelation coefficient, and the noise level of the cut time section and the average calculated in the noise section. By calculating the ratio of the noise level, the noise is calculated as the temporal fluctuation rate of the noise level, the magnitude of the noise that has changed in the time from the nearest noise section to the cut-out time section. A bell time variation rate computing unit,
Even when the magnitude of the noise changes with time, it can effectively follow.

【0019】本発明の請求項5に記載の発明は、前記の
切り出した時間区間の信号に重畳している雑音の雑音レ
ベルを自己相関係数から推定する手段が、自己相関係数
の遅延時間系列における自己相関係数の最大値と、第2
の大きさを有する極大値の自己相関係数の差を計算して
雑音レベルの推定を行うことを特徴とする請求項4に記
載の雑音レベル時間変動率計算装置であり、時間ととも
に雑音の大きさが変化する場合にも有効に追随すること
ができる。
According to a fifth aspect of the present invention, the means for estimating the noise level of the noise superimposed on the signal in the cut-out time section from the autocorrelation coefficient includes: The maximum value of the autocorrelation coefficient in the series and the second
The noise level temporal fluctuation rate calculation apparatus according to claim 4, wherein a noise level is estimated by calculating a difference between autocorrelation coefficients of local maxima having a magnitude of: Can be effectively followed even when the value changes.

【0020】本発明の請求項6に記載の発明は、請求項
4または5において、計算する自己相関係数の積和時間
をN、求める自己相関係数の最大遅延時間をMとしたと
きに、入力信号を時間区間の信号として切り出す窓関数
を時間長(M+N)以上の方形波とする雑音レベル時間
変動率計算装置であり、時間とともに雑音の大きさが変
化する場合にも有効に追随することができる。
The invention according to claim 6 of the present invention is characterized in that, in claim 4 or 5, when the product-sum time of the calculated autocorrelation coefficient is N and the maximum delay time of the calculated autocorrelation coefficient is M A noise level temporal fluctuation rate calculating device that converts a window function for extracting an input signal as a signal of a time section into a square wave having a time length (M + N) or more, and effectively follows even when the magnitude of noise changes with time. be able to.

【0021】本発明の請求項7に記載の発明は、雑音な
どを含んだ音声を入力信号とし、入力信号に加わった雑
音を低減する方法において、請求項1乃至3のいずれか
に記載の方法で雑音レベルの時間変動率を計算し、求め
た雑音レベルの時間変動率を入力信号から引き算するこ
とにより雑音の引き算量を調節する雑音低減方法であ
り、雑音レベルが時間変化する雑音の重畳した音声に対
しても有効な雑音低減が実現できる。
According to a seventh aspect of the present invention, there is provided a method for reducing a noise added to an input signal by using a speech including noise or the like as an input signal. This is a noise reduction method in which the time variation rate of the noise level is calculated and the obtained time variation rate of the noise level is subtracted from the input signal to adjust the subtraction amount of the noise. Effective noise reduction for voice can be realized.

【0022】本発明の請求項8に記載の発明は、雑音な
どを含んだ音声を入力信号とし、入力信号に窓関数を掛
け算することによって時間区間の信号に切り出し、切り
出した時間区間が音声区間または雑音区間のいずれかで
あるかを判定し、切り出した時間区間の信号を音響パラ
メータへ変換し、雑音区間と判定された時間区間の信号
の音響パラメータから雑音成分の音響パラメータを推定
し、最新の時間に切り出した時間区間の音響パラメータ
と雑音区間で推定した雑音成分の音響パラメータから雑
音成分を低減した音響パラメータを計算する雑音低減方
法であって、請求項1乃至3のいずれかに記載される方
法によって入力信号の雑音レベルの時間変動率を計算
し、推定した雑音成分の音響パラメータに前記雑音レベ
ルの時間変動率を掛け算した結果を雑音成分の音響パラ
メータとして、最新の時間区間の音響パラメータから引
き算して、入力信号の雑音低減処理した音響パラメータ
を得る雑音低減方法であり、雑音レベルが時間変化する
雑音の重畳した音声に対しても有効な雑音低減が実現で
きる。
According to an eighth aspect of the present invention, a speech including noise or the like is used as an input signal, and the input signal is multiplied by a window function to cut it out into a signal of a time section. Or, it is determined whether it is a noise section, the signal of the cut time section is converted into an acoustic parameter, the acoustic parameter of the noise component is estimated from the acoustic parameter of the signal of the time section determined as the noise section, and the latest 4. A noise reduction method for calculating an acoustic parameter in which a noise component is reduced from an acoustic parameter of a time section cut out at a time and an acoustic parameter of a noise component estimated in a noise section, according to any one of claims 1 to 3. The time variation of the noise level of the input signal is calculated by the method described above, and the acoustic parameter of the estimated noise component is multiplied by the time variation of the noise level. This is a noise reduction method in which the calculated result is subtracted from the acoustic parameter in the latest time section as the acoustic parameter of the noise component to obtain an acoustic parameter obtained by performing noise reduction processing on the input signal. Effective noise reduction for voice can be realized.

【0023】本発明の請求項9に記載の発明は、請求項
8に記載の雑音低減方法において、音響パラメータを周
波数スペクトルとする雑音低減方法であり、雑音レベル
が時間変化する雑音の重畳した音声に対しても有効な雑
音低減が実現できる。
According to a ninth aspect of the present invention, in the noise reduction method according to the eighth aspect, there is provided a noise reduction method using an acoustic parameter as a frequency spectrum. , Effective noise reduction can be realized.

【0024】本発明の請求項10に記載の発明は、請求
項8に記載の雑音低減方法において、音響パラメータを
線形予測係数とする雑音低減方法であり、雑音レベルが
時間変化する雑音の重畳した音声に対しても有効な雑音
低減が実現できる。
According to a tenth aspect of the present invention, in the noise reduction method according to the eighth aspect, a noise reduction method using acoustic parameters as linear prediction coefficients, wherein noise whose noise level changes with time is superimposed. Effective noise reduction for voice can be realized.

【0025】本発明の請求項11に記載の発明は、雑音
などを含んだ音声を入力信号とし、入力信号に窓関数を
掛け算することによって時間区間の信号に切り出し、切
り出した時間区間が音声区間または雑音区間のいずれか
であるかを判定し、切り出した時間区間の信号を音響パ
ラメータへ変換し、雑音区間と判定された時間区間の信
号の音響パラメータから雑音成分の音響パラメータを推
定し、最新の時間に切り出された時間区間の音響パラメ
ータから雑音区間で推定した雑音成分の音響パラメータ
を引き算し、雑音成分の音響パラメータを引き算した音
響パラメータを時間信号へ変換し、変換された時間波形
を接続して出力する雑音低減方法であって、請求項1乃
至3に記載される方法によって入力信号の雑音レベルの
時間変動率を計算し、推定した雑音成分の音響パラメー
タに前記雑音レベルの時間変動率を掛け算した結果を雑
音成分の音響パラメータとして、最新の時間区間の音響
パラメータから引き算した後に、引き算した音響パラメ
ータから時間信号へと変換して出力することを特徴とす
る雑音低減方法であり、雑音レベルが時間変化する雑音
の重畳した音声に対しても有効な雑音低減が実現でき
る。
According to an eleventh aspect of the present invention, a speech including noise or the like is used as an input signal, and the input signal is multiplied by a window function to cut out a signal in a time section. Or, it is determined whether it is a noise section, the signal of the cut time section is converted into an acoustic parameter, the acoustic parameter of the noise component is estimated from the acoustic parameter of the signal of the time section determined as the noise section, and the latest Subtracts the acoustic parameter of the noise component estimated in the noise section from the acoustic parameter of the time section extracted at the time of, converts the acoustic parameter obtained by subtracting the acoustic parameter of the noise component into a time signal, and connects the converted time waveform And a method for calculating a time variation rate of a noise level of an input signal by the method according to any one of claims 1 to 3. After subtracting the result of multiplying the estimated noise parameter acoustic parameter by the time variation rate of the noise level as the noise component acoustic parameter from the acoustic parameter of the latest time section, converting the subtracted acoustic parameter into a time signal This is a noise reduction method characterized in that the noise is output in such a manner that the effective noise reduction can be realized even for a voice on which noise whose noise level changes with time is superimposed.

【0026】本発明の請求項12に記載の発明は、請求
項11に記載の雑音低減方法において、音響パラメータ
を周波数スペクトルとする雑音低減方法であり、雑音レ
ベルが時間変化する雑音の重畳した音声に対しても有効
な雑音低減が実現できる。
According to a twelfth aspect of the present invention, in the noise reduction method according to the eleventh aspect, a noise reduction method using an acoustic parameter as a frequency spectrum is provided. , Effective noise reduction can be realized.

【0027】本発明の請求項13に記載の発明は、請求
項11に記載の雑音低減方法において、音響パラメータ
を線形予測係数とする雑音低減方法であり、雑音レベル
が時間変化する雑音の重畳した音声に対しても有効な雑
音低減が実現できる。
According to a thirteenth aspect of the present invention, there is provided the noise reduction method according to the eleventh aspect, wherein the acoustic parameter is a linear prediction coefficient, wherein noise whose time varies with time is superimposed. Effective noise reduction for voice can be realized.

【0028】本発明の請求項14に記載の発明は、雑音
などを含んだ音声を入力信号とし、入力信号に窓関数を
掛け算することによって時間区間の信号に切り出し、切
り出した時間区間が音声区間または雑音区間のいずれか
であるかを判定し、切り出した時間区間の信号を周波数
スペクトルへ変換し、雑音区間と判定された時間区間の
信号の周波数スペクトルから雑音スペクトルを推定し、
切り出した最新の時間区間の周波数スペクトルから雑音
区間で推定した雑音スペクトルを引き算して雑音低減を
実現するためのフィルタの周波数特性を設計し、フィル
タの周波数特性からフィルタ係数を計算してフィルタを
構成し、入力信号を前記フィルタ係数を有するフィルタ
に通すことによって入力信号の雑音低減を実現する雑音
低減方法であって、請求項1乃至3のいずれかに記載さ
れる方法によって入力信号の雑音レベルの時間変動率を
計算し、雑音スペクトルに前記雑音レベルの時間変動率
を掛け算した結果を雑音スペクトルの推定値として、最
新の時間区間の信号の周波数スペクトルから引き算して
フィルタの周波数特性を決定することを特徴とする雑音
低減方法であり、雑音レベルが時間変化する雑音の重畳
した音声に対しても有効な雑音低減が実現できる。
According to a fourteenth aspect of the present invention, a speech including noise or the like is used as an input signal, and the input signal is multiplied by a window function to cut out a signal in a time section. Or it is determined whether it is a noise section, the signal of the cut time section is converted into a frequency spectrum, and the noise spectrum is estimated from the frequency spectrum of the signal of the time section determined as the noise section,
Subtract the noise spectrum estimated in the noise section from the cut-out frequency spectrum of the latest time section to design the frequency characteristics of the filter to realize noise reduction, calculate the filter coefficient from the filter frequency characteristics and configure the filter A noise reduction method for realizing noise reduction of an input signal by passing the input signal through a filter having the filter coefficient, wherein the noise level of the input signal is reduced by the method according to any one of claims 1 to 3. Calculating the time variation rate, determining the frequency characteristic of the filter by subtracting the result of multiplying the noise spectrum by the time variation rate of the noise level as an estimated value of the noise spectrum from the frequency spectrum of the signal in the latest time section. A noise reduction method characterized by the following: Effective noise reduction can be achieved.

【0029】本発明の請求項15に記載の発明は、雑音
などを含んだ音声を入力信号とし、入力信号に加わった
雑音を低減する装置において、雑音低減部と雑音レベル
の時間変動率計算部を有し、入力信号を雑音低減処理部
と、雑音レベルの時間変動率計算部に渡し、雑音レベル
の時間変動率の計算部において請求項4乃至6のいずれ
かに記載の装置で雑音レベルの時間変動率を計算し、求
めた雑音レベルの時間変動率を雑音低減処理部に渡し
て、入力信号から雑音成分を引き算する手段により雑音
の引き算量を調節することを特徴とする雑音低減装置で
あり、雑音レベルが時間変化する雑音の重畳した音声に
対しても有効な雑音低減が実現できる。
According to a fifteenth aspect of the present invention, there is provided an apparatus for reducing a noise added to an input signal by using speech including noise or the like as an input signal. The input signal is passed to a noise reduction processing unit and a noise level time variation rate calculation unit, and the noise level time variation rate calculation unit calculates the noise level with the device according to any one of claims 4 to 6. A noise reduction device which calculates a time variation rate, passes the obtained time variation rate of the noise level to a noise reduction processing unit, and adjusts a noise subtraction amount by means for subtracting a noise component from an input signal. In addition, effective noise reduction can be realized even for a voice on which noise whose noise level changes with time is superimposed.

【0030】本発明の請求項16に記載の発明は、雑音
などを含んだ音声を入力信号とし、入力信号に窓関数を
掛け算することによって時間区間の信号に切り出す手段
と、切り出した時間区間が音声区間または雑音区間のい
ずれかであるかを判定する手段と、切り出した時間区間
の信号を音響パラメータへ変換する手段と、雑音区間と
判定された時間区間の信号の音響パラメータから雑音成
分の音響パラメータを推定する手段と、最新の時間に切
り出した時間区間の音響パラメータと雑音区間で推定し
た雑音成分の音響パラメータから雑音成分を引き算する
手段を備えた雑音低減装置であって、請求項4乃至6の
いずれかに記載される装置によって計算した入力信号の
雑音レベルの時間変動率を、最新の時間に切り出した時
間区間の音響パラメータから雑音区間で推定した音響パ
ラメータを引き算する手段に渡し、推定した雑音成分の
音響パラメータに雑音レベルの時間変動率を掛け算した
結果を雑音成分の音響パラメータとして最新の時間区間
の音響パラメータから引き算して、入力信号の雑音低減
処理した音響パラメータを得ることを特徴とする雑音低
減装置であり、雑音レベルが時間変化する雑音の重畳し
た音声に対しても有効な雑音低減が実現できる。
The invention according to claim 16 of the present invention is characterized in that a voice including noise or the like is used as an input signal, and the input signal is multiplied by a window function to cut out a signal in a time section. Means for determining whether the signal is a voice section or a noise section, means for converting a signal of the cut-out time section into acoustic parameters, and sound of a noise component from the acoustic parameters of the signal of the time section determined as the noise section. A noise reduction apparatus comprising: means for estimating a parameter; and means for subtracting a noise component from an acoustic parameter in a time section cut out at the latest time and an acoustic parameter of a noise component estimated in a noise section, wherein 6. The sound parameter of the time section cut out at the latest time based on the time variation rate of the noise level of the input signal calculated by the apparatus described in any one of 6. From the data to the means for subtracting the acoustic parameter estimated in the noise section, and multiplying the estimated acoustic parameter of the noise component by the time variation rate of the noise level as the acoustic parameter of the noise component from the acoustic parameter of the latest time interval. This is a noise reduction apparatus characterized by obtaining an acoustic parameter obtained by performing a noise reduction process on an input signal by subtraction, and can realize effective noise reduction even for a voice on which noise whose noise level changes with time is superimposed.

【0031】本発明の請求項17に記載の発明は、請求
項16に記載の雑音低減装置において、音響パラメータ
を周波数スペクトルとする雑音低減装置であり、雑音レ
ベルが時間変化する雑音の重畳した音声に対しても有効
な雑音低減が実現できる。
According to a seventeenth aspect of the present invention, there is provided the noise reducing apparatus according to the sixteenth aspect, wherein the noise parameter has a frequency spectrum as an acoustic parameter. , Effective noise reduction can be realized.

【0032】本発明の請求項18に記載の発明は、請求
項16に記載の雑音低減装置において、音響パラメータ
を線形予測係数とする雑音低減装置であり、雑音レベル
が時間変化する雑音の重畳した音声に対しても有効な雑
音低減が実現できる。
[0032] The invention according to claim 18 of the present invention is the noise reduction device according to claim 16, wherein the noise parameter is a linear prediction coefficient as an acoustic parameter. Effective noise reduction for voice can be realized.

【0033】本発明の請求項19に記載の発明は、雑音
などを含んだ音声を入力信号とし、入力信号に窓関数を
掛け算することによって時間区間の信号に切り出す手段
と、切り出した時間区間が音声区間または雑音区間のい
ずれかであるかを判定する手段と、切り出した時間区間
の信号を音響パラメータへ変換する手段と、雑音区間と
判定された時間区間の信号の音響パラメータから雑音成
分の音響パラメータを推定する手段と、最新の時間に切
り出された時間区間の音響パラメータから雑音区間で推
定した雑音成分の音響パラメータを引き算する手段と、
雑音成分の音響パラメータを引き算した音響パラメータ
を時間信号へ変換する手段と、変換された時間波形を接
続して出力する手段とを備えた雑音低減装置であって、
請求項4乃至6に記載される装置によって計算した入力
信号の雑音レベルの時間変動率を、最新の時間に切り出
した時間区間の音響パラメータから雑音区間で推定した
音響パラメータを引き算する手段に渡し、推定した雑音
成分の音響パラメータに雑音レベルの時間変動率を掛け
算した結果を雑音成分の音響パラメータとして最新の時
間区間の音響パラメータから引き算した後に、引き算し
た音響パラメータから時間信号へと変換して出力するこ
とを特徴とする雑音低減装置であり、雑音レベルが時間
変化する雑音の重畳した音声に対しても有効な雑音低減
が実現できる。
[0033] According to a nineteenth aspect of the present invention, there is provided means for taking a speech including noise or the like as an input signal, and multiplying the input signal by a window function to cut out the signal into a time section signal; Means for determining whether the signal is a voice section or a noise section, means for converting a signal of the cut-out time section into acoustic parameters, and sound of a noise component from the acoustic parameters of the signal of the time section determined as the noise section. Means for estimating the parameter, means for subtracting the acoustic parameter of the noise component estimated in the noise section from the acoustic parameter of the time section cut out at the latest time,
A noise reduction device comprising: means for converting an acoustic parameter obtained by subtracting an acoustic parameter of a noise component into a time signal; and means for connecting and outputting the converted time waveform,
Passing the time variation rate of the noise level of the input signal calculated by the apparatus according to claim 4 to means for subtracting the acoustic parameter estimated in the noise section from the acoustic parameter in the time section cut out at the latest time; The result of multiplying the estimated noise component acoustic parameter by the time variation rate of the noise level is subtracted from the acoustic parameter of the latest time section as the noise component acoustic parameter, and then the subtracted acoustic parameter is converted into a time signal and output. The noise reduction device is characterized in that the noise reduction device can perform effective noise reduction even for a voice on which noise whose noise level changes with time is superimposed.

【0034】本発明の請求項20に記載の発明は、請求
項19に記載の雑音低減装置において、音響パラメータ
を周波数スペクトルとする雑音低減装置であり、雑音レ
ベルが時間変化する雑音の重畳した音声に対しても有効
な雑音低減が実現できる。
According to a twentieth aspect of the present invention, there is provided the noise reduction apparatus according to the nineteenth aspect, wherein the noise parameter has a frequency spectrum as an acoustic parameter. , Effective noise reduction can be realized.

【0035】本発明の請求項21に記載の発明は、請求
項19に記載の雑音低減装置において、音響パラメータ
を線形予測係数とする雑音低減装置であり、雑音レベル
が時間変化する雑音の重畳した音声に対しても有効な雑
音低減が実現できる。
According to a twenty-first aspect of the present invention, in the noise reducing apparatus according to the nineteenth aspect, the noise reducing apparatus uses the acoustic parameter as a linear prediction coefficient. Effective noise reduction for voice can be realized.

【0036】本発明の請求項22に記載の発明は、雑音
などを含んだ音声を入力信号とし、入力信号に窓関数を
掛け算することによって時間区間の信号に切り出す手段
と、切り出した時間区間が音声区間または雑音区間のい
ずれかであるかを判定する手段と、切り出した時間区間
の信号を周波数スペクトルへ変換する手段と、雑音区間
と判定された時間区間の信号の周波数スペクトルから雑
音スペクトルを推定する手段と、切り出した最新の時間
区間の周波数スペクトルから雑音区間で推定した雑音ス
ペクトルを引き算して雑音低減を実現するためのフィル
タの周波数特性を設計する手段と、フィルタの周波数特
性からフィルタ係数を計算してフィルタを構成する手段
と、入力信号を前記計算されたフィルタ計数を有するフ
ィルタに通すことによって入力信号の雑音低減を実現す
る雑音低減装置であって、請求項4乃至6のいずれかに
記載される装置によって求めた入力信号の雑音レベルの
時間変動率を、切り出した時間区間の信号の周波数スペ
クトルから推定した雑音スペクトルを引き算してフィル
タを設計する手段に渡し、雑音スペクトルに雑音レベル
の時間変動率を掛け算した結果を雑音スペクトルの推定
値として、最新の時間区間の信号の周波数スペクトルか
ら引き算してフィルタの周波数特性を決定することを特
徴とする雑音低減装置であり、雑音レベルが時間変化す
る雑音の重畳した音声に対しても有効な雑音低減が実現
できる。
According to a twenty-second aspect of the present invention, there is provided a means for extracting a speech including a noise or the like as an input signal and multiplying the input signal by a window function to cut out the signal into a time interval signal; A means for determining whether the signal is a voice section or a noise section, a means for converting a cut-out signal in a time section into a frequency spectrum, and an estimation of a noise spectrum from the frequency spectrum of the signal in the time section determined to be a noise section Means for designing a filter frequency characteristic for realizing noise reduction by subtracting the noise spectrum estimated in the noise section from the cut-out frequency spectrum of the latest time section, and a filter coefficient from the filter frequency characteristic. Means for calculating and configuring a filter, and passing an input signal through a filter having the calculated filter counts Therefore, the present invention is a noise reduction device that realizes noise reduction of an input signal, and calculates a time variation rate of a noise level of an input signal obtained by the device according to any one of claims 4 to 6 to a signal of a signal in a time section cut out. The noise spectrum estimated from the frequency spectrum is subtracted and passed to means for designing a filter, and the result of multiplying the noise spectrum by the time variation rate of the noise level is used as an estimated value of the noise spectrum from the frequency spectrum of the signal in the latest time section. This is a noise reduction device characterized by determining a frequency characteristic of a filter by subtraction, and can realize effective noise reduction even for a voice on which noise whose noise level changes with time is superimposed.

【0037】(実施の形態1)本発明の請求項1乃至6
に記載した雑音レベルの時間変動率を計算するための方
法及び装置の構成例を実施の形態1として図1を参照し
て説明する。雑音などを含んだ音声は、入力信号Xとし
て入力され、時間区間の切り出し手段2により窓関数を
掛け算することによって時間区間の信号として切り出し
た後、切り出した時間区間の信号の自己相関係数を計算
する手段3と、切り出された時間区間が音声区間または
雑音区間のいずれであるかを判定する手段6に渡され
る。
(Embodiment 1) Claims 1 to 6 of the present invention
A configuration example of a method and an apparatus for calculating a time variation rate of a noise level described in (1) will be described as a first embodiment with reference to FIG. The speech including noise and the like is input as an input signal X, and is cut out as a signal in a time section by multiplying a window function by a time section cut-out means 2, and then the autocorrelation coefficient of the cut out signal in the time section is calculated. It is passed to the calculating means 3 and the means 6 for judging whether the extracted time section is a voice section or a noise section.

【0038】自己相関係数を計算する手段3では、自己
相関係数R(j)を、入力信号をx(i)として前記式
(1)によって計算する。ただし、自己相関係数の計算
手段3で計算される自己相関係数R(j)は、入力信号
に窓関数を掛け算することによって切り出した時間区間
で計算するが、その窓関数は時間長(M+N)の方形波
とする。これは、無限長に続くデータのうち、自己相関
係数の計算に必要な時間長の信号だけを切り出して計算
することを意味し、計算する自己相関係数の値が時間と
ともに減衰するような窓関数は使用しない。なお、Nの
値は20乃至40ms、Mの値は15乃至20ms程度
に設定する。
In the means 3 for calculating the autocorrelation coefficient, the autocorrelation coefficient R (j) is calculated by the above equation (1) using the input signal as x (i). However, the autocorrelation coefficient R (j) calculated by the autocorrelation coefficient calculation means 3 is calculated in a time section extracted by multiplying the input signal by a window function, and the window function has a time length ( (M + N) square wave. This means that of the data following the infinite length, only the signal of the time length necessary for calculating the autocorrelation coefficient is cut out and calculated, and the calculated autocorrelation coefficient value attenuates with time. No window function is used. The value of N is set to about 20 to 40 ms, and the value of M is set to about 15 to 20 ms.

【0039】切り出した時間区間の自己相関係数を計算
する手段3で計算された自己相関係数は、雑音レベルの
推定手段4に渡される。その雑音レベルの推定手段4に
おける雑音レベルの計算は前記式(10)によって行
う。雑音レベルの推定手段4で計算された最新の時間区
間の雑音レベルは、雑音レベルの時間変動率を計算する
手段5に渡される。同時に、切り出された時間区間が音
声区間または雑音区間のいずれであるかを判定する手段
6の結果が雑音区間であるならば、最新の時間区間にお
ける雑音レベルを、雑音区間における平均雑音レベルを
計算する手段7に渡し、平均化することによって平均雑
音レベルを更新する。
The autocorrelation coefficient calculated by the means 3 for calculating the autocorrelation coefficient in the extracted time interval is passed to the noise level estimating means 4. The calculation of the noise level in the noise level estimating means 4 is performed by the above equation (10). The noise level in the latest time section calculated by the noise level estimating means 4 is passed to a means 5 for calculating a time variation rate of the noise level. At the same time, if the result of the means 6 for determining whether the cut-out time section is a voice section or a noise section is a noise section, the noise level in the latest time section is calculated and the average noise level in the noise section is calculated. And averages the average noise level by averaging.

【0040】自己相関係数から入力信号に重畳している
雑音レベルを推定する手段4で計算された最新の時間区
間の雑音レベルNLxと、雑音区間における平均雑音レ
ベルを計算する手段7で計算された平均雑音レベルNL
nは、雑音レベルの時間変動率を計算する手段5に渡さ
れ、雑音区間から最新の切り出し時間区間までに変化し
た雑音レベルの時間変動率Kを前記式(11)によって
計算し、出力する。
The noise level NLx in the latest time section calculated by the means 4 for estimating the noise level superimposed on the input signal from the autocorrelation coefficient and the noise level calculated in the means 7 for calculating the average noise level in the noise section. Average noise level NL
n is passed to the means 5 for calculating the time variation rate of the noise level, and calculates and outputs the time variation rate K of the noise level changed from the noise section to the latest cut-out time section by the formula (11).

【0041】(実施の形態2)本発明の請求項7及び1
5に記載した雑音低減方法及び装置の基本的な構成例を
実施の形態2として図2に示す。雑音などが重畳した入
力信号Xは、雑音低減処理部41と雑音レベルの時間変
動率計算部42に渡され、ここで実施の形態1に示した
方法及び装置、または請求項1乃至6のいずれかに記載
された方法又は装置によって雑音レベルの時間変動率K
が計算される。計算された雑音レベルの時間変動率K
は、雑音低減処理部41に渡され、雑音低減処理を行う
際に予測した雑音の音響パラメータに掛け算することに
よって雑音低減量を調節することに使用される。
(Embodiment 2) Claims 7 and 1 of the present invention
FIG. 2 shows a basic configuration example of the noise reduction method and apparatus described in FIG. The input signal X on which noise or the like is superimposed is passed to a noise reduction processing unit 41 and a noise level time variation rate calculation unit 42, and the method and apparatus described in the first embodiment, or any one of claims 1 to 6. The time variation rate K of the noise level by the method or apparatus described in
Is calculated. Time variation rate K of the calculated noise level
Is passed to the noise reduction processing unit 41 and is used to adjust the amount of noise reduction by multiplying the acoustic parameter of the noise predicted when performing the noise reduction processing.

【0042】(実施の形態3)次に、本発明の請求項8
乃至10及び16乃至18に記載した雑音低減方法及び
装置において、雑音の重畳した入力信号Xから雑音低減
した音響パラメータを得るための例を実施の形態3とし
て図3を参照して説明する。雑音などが重畳した音声信
号を入力信号Xとして受け取り、音響パラメータ処理部
400と雑音レベルの時間変動率推定部100にそれぞ
れ渡す。音響パラメータ処理部400では、まず入力信
号Xに窓関数を掛け算することによって最新の時間区間
の切り出しを行い、音響パラメータを計算する。同時
に、切り出した時間区間は、音声区間または雑音区間で
あるかを判定する手段6に渡し、その結果が雑音区間で
あると判定されたならば、音響パラメータを雑音成分の
音響パラメータ推定手段32に渡し、平均化することに
よって雑音成分の音響パラメータを求めて、音響パラメ
ータ引き算手段33に渡す。
(Embodiment 3) Next, claim 8 of the present invention will be described.
Embodiments 3 to 10 and 16 to 18 will be described with reference to FIG. 3 as an embodiment for obtaining noise-reduced acoustic parameters from an input signal X on which noise is superimposed. An audio signal on which noise or the like is superimposed is received as an input signal X, and is passed to an acoustic parameter processing unit 400 and a noise level time variation rate estimation unit 100, respectively. The acoustic parameter processing unit 400 first extracts the latest time section by multiplying the input signal X by a window function, and calculates acoustic parameters. At the same time, the extracted time section is passed to the means 6 for determining whether the section is a voice section or a noise section. If the result is determined to be a noise section, the acoustic parameter is transmitted to the acoustic parameter estimating means 32 for the noise component. The acoustic parameters of the noise components are obtained by passing and averaging, and are passed to the acoustic parameter subtracting means 33.

【0043】一方、雑音レベルの時間変動率推定部10
0では、上記の処理と平行して実施の形態1に示したよ
うな方法及び装置によって、雑音レベルの時間変動率K
を求める。まず、入力信号Xに窓関数を掛けて最新の時
間区間として切り出し、自己相関係数R(j)を計算す
る。そして、雑音レベル推定手段4では、R(0)とR
(T)の差を前記式(10)から雑音レベルNLs とし
て推定し、切り出した時間区間が音声区間または雑音区
間のいずれであるかを判定する手段6の結果が雑音区間
であるならば、この雑音レベルNLs を雑音区間におけ
る平均雑音レベルを求める手段7に渡し、平均化して雑
音平均レベルNLn を求める。雑音レベルの時間変動率
を計算する手段5では、雑音成分の音響パラメータ計算
時の雑音平均レベルNLn と最新の時間区間の雑音レベ
ルNLs との比を前記式(11)によって計算し、雑音
レベル時間変動率Kとして、音響パラメータ引き算手段
13に渡す。音響パラメータ引き算手段13では、最新
の時間区間の音響パラメータと雑音成分の音響パラメー
タと雑音レベル時間変動率Kの値から、音響パラメータ
の引き算を行い、引き算した後の音響パラメータPを出
力する。
On the other hand, the noise level temporal fluctuation rate estimating unit 10
0, the time variation rate K of the noise level is determined by the method and apparatus described in the first embodiment in parallel with the above processing.
Ask for. First, the input signal X is multiplied by a window function and cut out as the latest time section, and the autocorrelation coefficient R (j) is calculated. Then, the noise level estimating means 4 calculates R (0) and R
If the difference of (T) is estimated as the noise level NLs from the above equation (10) and the result of the means 6 for judging whether the extracted time section is a speech section or a noise section is a noise section, The noise level NLs is passed to means 7 for calculating an average noise level in a noise section, and is averaged to obtain an average noise level NLn. The means 5 for calculating the time variation rate of the noise level calculates the ratio between the noise average level NLn at the time of calculating the acoustic parameter of the noise component and the noise level NLs in the latest time section by the above equation (11). The variation rate K is passed to the acoustic parameter subtraction means 13. The acoustic parameter subtraction means 13 subtracts the acoustic parameter from the acoustic parameter of the latest time section, the acoustic parameter of the noise component, and the value of the noise level temporal variation rate K, and outputs the acoustic parameter P after the subtraction.

【0044】(実施の形態4)次に、本発明の請求項1
1乃至13及び19乃至21に記載の雑音低減方法及び
装置において雑音低減した時間信号を得るための例を実
施の形態4として図4を参照して説明する。ここでは、
雑音低減処理に利用する音響パラメータとして周波数ス
ペクトルを利用した方法(請求項12及び20に記載の
方法及び装置)を例に、スペクトルサブトラクション法
と雑音レベルの時間変動率を計算する手段を組み合わせ
た処理として図4によって説明する。
(Embodiment 4) Next, claim 1 of the present invention will be described.
An example for obtaining a noise-reduced time signal in the noise reduction methods and apparatuses described in 1 to 13 and 19 to 21 will be described as a fourth embodiment with reference to FIG. here,
An example of a method using a frequency spectrum as an acoustic parameter used in the noise reduction processing (the method and apparatus according to claims 12 and 20) is a combination of a spectrum subtraction method and a means for calculating a noise level temporal variation rate. FIG.

【0045】雑音などが重畳した音声信号を入力信号X
として受け取り、スペクトルサブトラクション処理部2
00及び雑音レベルの時間変動率推定部100にそれぞ
れ渡す。スペクトルサブトラクション処理部200で
は、まず入力信号Xに窓関数を掛け算することによって
最新の時間区間の切り出しを行い、周波数スペクトルX
(ω)を計算する。同時に、切り出した時間区間は、音
声区間または雑音区間であるかを判定する手段6に渡
し、その結果が雑音区間であると判定されたならば、周
波数スペクトルX(ω)を雑音推定部16に渡し、平均
化することによって雑音スペクトルN(ω)を求めて、
スペクトル引き算手段14に渡す。
An audio signal on which noise or the like is superimposed is input signal X
As the spectrum subtraction processing unit 2
00 and the noise level temporal fluctuation rate estimating unit 100. The spectrum subtraction processing unit 200 first cuts out the latest time section by multiplying the input signal X by a window function.
Calculate (ω). At the same time, the extracted time section is passed to means 6 for determining whether the section is a voice section or a noise section. If the result is determined to be a noise section, the frequency spectrum X (ω) is transmitted to the noise estimating section 16. To obtain the noise spectrum N (ω) by averaging
It is passed to the spectrum subtraction means 14.

【0046】一方、雑音レベルの時間変動率推定部10
0では、上記の処理と平行して入力信号Xに窓関数を掛
けて最新の時間区間として切り出し、自己相関係数R
(j)を計算する。そして、雑音レベル推定手段4で
は、R(0)とR(T)の差を前記式(10)から雑音
レベルNLs として推定し、切り出した時間区間が音声
区間または雑音区間のいずれであるかを判定する手段6
の結果が雑音区間であるならば、この雑音レベルNLs
を雑音区間における平均雑音レベルを求める手段7に渡
し、平均化して雑音平均レベルNLn を求める。
On the other hand, the noise level temporal fluctuation rate estimating unit 10
0, the input signal X is multiplied by a window function in parallel with the above processing to extract the latest time section, and the autocorrelation coefficient R
Calculate (j). Then, the noise level estimating means 4 estimates the difference between R (0) and R (T) as the noise level NLs from the equation (10), and determines whether the extracted time section is a speech section or a noise section. Judgment means 6
Is the noise interval, this noise level NLs
Is passed to means 7 for calculating an average noise level in a noise section, and is averaged to obtain an average noise level NLn.

【0047】雑音レベルの時間変動率を計算する手段5
では、雑音スペクトル計算時の雑音平均レベルNLn と
最新の時間区間の雑音レベルNLs との比を、前記式
(11)によって計算し、雑音レベル時間変動率Kとし
て、スペクトル引き算手段13に渡す。スペクトル引き
算手段13では、最新の時間区間の周波数スペクトルX
(ω)と雑音スペクトルの推定値N(ω)と雑音レベル
時間変動率Kの値から、S(ω)=X(ω)−KN
(ω) (12)によって、周波数ス
ペクトルの引き算を行い、引き算した後の周波数スペク
トルS(ω)を時間信号への変換手段14によって時間
領域信号へ変換する。以上の処理を、繰り返して行い、
得られた時間信号波形を接続することによって出力時間
信号Wを得る。
Means 5 for calculating time variation of noise level
Then, the ratio between the noise average level NLn at the time of noise spectrum calculation and the noise level NLs in the latest time section is calculated by the above equation (11), and is passed to the spectrum subtracting means 13 as the noise level time variation rate K. In the spectrum subtracting means 13, the frequency spectrum X in the latest time section is
From the value of (ω), the estimated value N (ω) of the noise spectrum, and the value of the noise level temporal variation rate K, S (ω) = X (ω) −KN
(Ω) According to (12), the frequency spectrum is subtracted, and the frequency spectrum S (ω) after the subtraction is converted into a time domain signal by the time signal converting means 14. Repeat the above process,
An output time signal W is obtained by connecting the obtained time signal waveforms.

【0048】(実施の形態5)次に、本発明の請求項1
4及び22に記載の雑音低減方法及び装置における雑音
低減処理の例を実施の形態5として、ウィーナーフィル
タと雑音レベル時間変動率を組み合わせた処理例を図5
によって説明する。入力信号Xは、ウィーナーフィルタ
処理部300と雑音レベル時間変動率推定部100に渡
される。ウィーナーフィルタ処理部300では、まず入
力信号Xに窓関数を掛け算して切り出して最新の時間区
間とし、周波数スペクトルへの変換手段12に渡す。同
時に、切り出した時間区間を、時間区間が音声区間また
は雑音区間のいずれであるかを判定する手段6に渡し、
ここで雑音区間であると判断されたら、周波数スペクト
ルへの変換手段12で求めたスペクトルを雑音スペクト
ルと判断し、雑音スペクトル推定部16に渡して雑音ス
ペクトルの平均化を行い、雑音スペクトルN(ω)の推
定値を更新する。計算された雑音スペクトルの推定値N
(ω)は、フィルタの周波数特性設計手段21に渡され
る。
(Embodiment 5) Next, Embodiment 1 of the present invention will be described.
Embodiment 5 is an example of noise reduction processing in the noise reduction method and apparatus described in Embodiments 4 and 22, and FIG. 5 shows an example of processing in which a Wiener filter and a noise level time variation rate are combined.
It will be explained by. The input signal X is passed to the Wiener filter processing unit 300 and the noise level time variation rate estimation unit 100. In the Wiener filter processing unit 300, first, the input signal X is multiplied by a window function and cut out to obtain the latest time section, which is passed to the frequency spectrum conversion means 12. At the same time, the extracted time section is passed to means 6 for determining whether the time section is a voice section or a noise section,
If it is determined that the noise section is a noise section, the spectrum determined by the frequency spectrum converting means 12 is determined as a noise spectrum, passed to the noise spectrum estimating section 16 and averaged, and the noise spectrum N (ω ) Update the estimate. Estimated value N of the calculated noise spectrum
(Ω) is passed to the filter frequency characteristic design means 21.

【0049】一方、雑音レベル変動推定部100では、
入力信号1に方形波を窓関数として掛け算することによ
って時間区間の信号として切り出した後、自己相関係数
の計算手段3によって自己相関係数R(j)を計算す
る。次に、雑音レベル推定手段4においてR(0)とR
(T)の差を前記式(10)によって計算し、雑音レベ
ルNLsとして推定する。切り出した時間区間が音声区
間または雑音区間のいずれであるかを判定する手段11
の結果が、雑音区間であるとされたならば、計算した雑
音レベルNLsを雑音区間における雑音レベルの計算手
段7に渡し、平均化することによって雑音レベルNLn
を求める。最新の時間区間の雑音レベルNLsと、雑音
区間における雑音レベルNLnとの比を前記式(11)
によって計算し、雑音レベル時間変動率Kとする。求め
られた雑音レベルの時間変動率Kをフィルタの周波数特
性設計手段21に渡す。
On the other hand, the noise level fluctuation estimating section 100
After the input signal 1 is cut out as a signal in a time section by multiplying the input signal 1 by a square wave as a window function, the autocorrelation coefficient calculation means 3 calculates the autocorrelation coefficient R (j). Next, R (0) and R
The difference of (T) is calculated by the above equation (10), and is estimated as the noise level NLs. Means 11 for determining whether the extracted time section is a voice section or a noise section
Is determined to be a noise section, the calculated noise level NLs is passed to the noise level calculation means 7 in the noise section, and the noise level NLs is averaged.
Ask for. The ratio between the noise level NLs in the latest time section and the noise level NLn in the noise section is calculated by the above equation (11).
Is calculated as the noise level time variation rate K. The obtained noise level time variation rate K is passed to the filter frequency characteristic design means 21.

【0050】こうして周波数スペクトルへの変換手段1
2で求めた最新の時間区間のスペクトルX(ω)と雑音
スペクトル推定部16で計算した雑音スペクトルN
(ω)と雑音レベル時間変動率推定部100で計算した
雑音レベル時間変動率Kから、フィルタの周波数特性設
計部21において、入力信号から音声信号のみを通過さ
せるためのフィルタ周波数特性を、 H(ω)={X(ω)−KN(ω)}/N(ω) (13) によって計算する。このH(ω)からフィルタ係数を計
算する手段22によって、ウィーナーフィルタのフィル
タ係数を求め、ウィーナーフィルタリング手段23に渡
す。入力信号Xは、ウィーナーフィルタリング手段23
によってフィルタリング処理され、出力時間信号Wを得
る。
Thus, means 1 for converting to a frequency spectrum
2, the spectrum X (ω) of the latest time section and the noise spectrum N calculated by the noise spectrum estimation unit 16
Based on (ω) and the noise level temporal variation rate K calculated by the noise level temporal variation rate estimating section 100, the filter frequency characteristic designing section 21 shows a filter frequency characteristic for passing only an audio signal from an input signal as H ( ω) = {X (ω) −KN (ω)} / N (ω) (13) The filter coefficient of the Wiener filter is obtained by the means 22 for calculating the filter coefficient from H (ω), and is passed to the Wiener filtering means 23. The input signal X is transmitted to the Wiener filtering unit 23.
And an output time signal W is obtained.

【0051】(実施の形態6)本発明の請求項15に記
載した雑音低減装置の具体的な構成例を実施の形態6と
して図6に示す。雑音などが重畳した音声信号1は、マ
イクロホン51から入力され、AD変換器52によって
ディジタル信号Xに変換された後、雑音低減処理部53
に渡される。同時に、ディジタル信号Xは雑音レベルの
時間変動率計算部54に渡され、ここで実施の形態1に
示した方法及び装置、または請求項1乃至6のいずれか
に記載された方法または装置によって雑音レベルの時間
変動率Kが計算される。計算された雑音レベルの時間変
動率Kは、雑音低減処理部53に渡され、雑音低減処理
を行う際に予測した雑音の音響パラメータに掛け算する
ことによって雑音低減量を調節することに使用される。
雑音低減処理部53で処理した信号は、雑音低減信号Y
として出力される。Yは、目的に応じて音響パラメータ
Pや時間波形Wなどとして出力される。
(Embodiment 6) FIG. 6 shows a specific configuration example of a noise reduction device according to a fifteenth embodiment of the present invention as a sixth embodiment. The audio signal 1 on which noise or the like is superimposed is input from a microphone 51 and is converted into a digital signal X by an AD converter 52, and then a noise reduction processing unit 53
Passed to. At the same time, the digital signal X is passed to the noise level time variation calculation unit 54, where the noise and the noise are reduced by the method and apparatus described in the first embodiment or the method or apparatus described in any one of claims 1 to 6. The time variation rate K of the level is calculated. The calculated time variation rate K of the noise level is passed to the noise reduction processing unit 53, and is used to adjust the noise reduction amount by multiplying the acoustic parameter of the noise predicted when performing the noise reduction processing. .
The signal processed by the noise reduction processing unit 53 is the noise reduction signal Y
Is output as Y is output as an acoustic parameter P or a time waveform W according to the purpose.

【0052】次に、雑音レベルの時間変動率計算部54
の具体的な例を図7を参照して説明する。雑音レベルの
時間変動率計算部54では、まずAD変換された信号X
を、入力信号の切り出し部71によって時間区間信号と
して切り出し、自己相関係数の計算部72と音声区間/
雑音区間の判定部74に渡す。自己相関係数の計算部7
2で求められた自己相関係数は、雑音レベルの計算部7
3へ渡され、前記式(10)によって雑音レベルを計算
するために利用される。また、音声区間/雑音区間の判
定部74では、切り出した時間区間が音声区間または雑
音区間のいずれであるかを判断し、雑音区間であれば切
り替えスイッチ75を端子Nにつないで雑音レベルの計
算部73で計算された雑音レベルを平均雑音レベル更新
部76に渡し、音声区間であれば切り替えスイッチ75
を端子Sにつないで雑音レベルを平均雑音レベル更新部
76に渡さないようにする。平均雑音レベル更新部76
では、過去の雑音区間の平均雑音レベル77と平均化し
て平均雑音レベルを更新し、更新した平均雑音レベル7
7を雑音レベルの時間変動率の計算部78に渡す。雑音
レベルの時間変動率の計算部78では、時間区間で計算
された雑音レベルと平均雑音レベルから雑音レベルの時
間変動率Kを求めて雑音低減処理部53に渡す。
Next, the noise level time fluctuation rate calculation unit 54
Will be described with reference to FIG. In the noise level time variation rate calculating section 54, first, the AD converted signal X
Is cut out as a time section signal by an input signal cutout section 71, and an autocorrelation coefficient calculation section 72 and a speech section /
This is passed to the noise section determination unit 74. Autocorrelation coefficient calculator 7
The autocorrelation coefficient obtained in step 2 is calculated by the noise level calculator 7.
3 and used to calculate the noise level according to equation (10). The voice section / noise section determination section 74 determines whether the cut-out time section is a voice section or a noise section, and if the time section is a noise section, connects the switch 75 to the terminal N to calculate the noise level. The noise level calculated by the unit 73 is passed to the average noise level updating unit 76, and if it is a voice section, the changeover switch 75
To the terminal S so that the noise level is not passed to the average noise level updating unit 76. Average noise level updating unit 76
Then, the average noise level is updated by averaging with the average noise level 77 in the past noise section, and the updated average noise level 7 is updated.
7 is passed to the noise level time variation calculation unit 78. The noise level temporal fluctuation rate calculating section 78 obtains the noise level temporal fluctuation rate K from the noise level calculated in the time section and the average noise level, and passes the noise level temporal fluctuation rate K to the noise reduction processing section 53.

【0053】次に、雑音低減処理部53における処理の
一例を図8を参照して説明する。まず、AD変換された
信号Xを入力信号の切り出し部61によって時間区間信
号として切り出す。切り出された時間区間信号は、音響
特性計算部62と音声区間/雑音区間の判定部63に渡
される。音響特性計算部62では、切り出した時間信号
を例えばFFTによって周波数スペクトルなどの音響パ
ラメータに変換し、雑音低減処理演算部66に渡す。同
時に、音声区間/雑音区間の判定部63では、切り出さ
れた時間区間が音声区間または雑音区間のいずれである
かを判断し、時間区間が雑音区間であれば切り替えスイ
ッチ64を端子Nにつないで、音響特性計算部62で計
算された音響パラメータを雑音特性更新部65に渡し、
音声区間であると判断されれば切り替えスイッチ64を
端子Sにつないで音響パラメータを雑音特性更新部65
に渡さないようにする。雑音特性更新部65では、過去
の雑音区間の音響パラメータを平均化して雑音重畳時の
音響パラメータを推定し、その結果を雑音低減処理部6
6に渡す。雑音低減処理部66では、時間区間で計算さ
れた音響パラメータと雑音区間で計算された音響パラメ
ータと、雑音レベルの時間変動率計算部54で計算され
た雑音レベルの時間変動率Kをあわせて、雑音の重畳し
ていない音響パラメータを推定する。雑音の重畳してい
ない音響パラメータは、時間信号への変換部67によっ
て時間区間信号とした後、過去の時間区間信号と接続し
て出力する。
Next, an example of processing in the noise reduction processing section 53 will be described with reference to FIG. First, the AD converted signal X is cut out as a time section signal by the input signal cutout unit 61. The extracted time section signal is passed to the acoustic characteristic calculation section 62 and the speech section / noise section determination section 63. The acoustic characteristic calculation unit 62 converts the cut-out time signal into acoustic parameters such as a frequency spectrum by FFT, for example, and passes the converted signal to the noise reduction processing operation unit 66. At the same time, the voice section / noise section determination section 63 determines whether the cut-out time section is a voice section or a noise section, and if the time section is a noise section, connects the changeover switch 64 to the terminal N. The acoustic parameters calculated by the acoustic characteristic calculation unit 62 are passed to the noise characteristic update unit 65,
If it is determined that the voice section is the voice section, the changeover switch 64 is connected to the terminal S, and the acoustic parameter is updated to the noise characteristic updating section 65.
Do not pass to. The noise characteristic update unit 65 estimates the acoustic parameters at the time of superimposing noise by averaging the acoustic parameters in the past noise section, and uses the result as the noise reduction processing unit 6
Pass to 6. The noise reduction processing unit 66 combines the acoustic parameter calculated in the time section, the acoustic parameter calculated in the noise section, and the time variation rate K of the noise level calculated by the time variation rate calculation unit 54 of the noise level, Estimate acoustic parameters without noise. The acoustic parameter without noise is converted into a time section signal by the time signal conversion unit 67, and then connected to the past time section signal and output.

【0054】(実施の形態7)本発明の請求項16乃至
18に記載した入力信号から音響パラメータを得る雑音
低減装置の具体的な構成例を実施の形態7として図9に
示す。雑音などが重畳した音声信号は、マイクロホン5
1から入力され、AD変換器52によってディジタル信
号Xに変換された後、雑音低減処理部53に渡される。
同時に、ディジタル信号Xは雑音レベルの時間変動率計
算部54に渡され、ここで実施の形態1に示した方法及
び装置、または請求項1乃至6のいずれかに記載された
方法または装置によって雑音レベルの時間変動率Kが計
算される。計算された雑音レベルの時間変動率Kは、雑
音低減処理部53に渡され、雑音低減処理を行う際に予
測した雑音の音響パラメータに掛け算することによって
雑音低減量を調節することに使用される。雑音低減処理
部53で処理した信号のパラメータPは、例えばパラメ
ータの表示部60などに渡して利用する。
(Embodiment 7) FIG. 9 shows a specific configuration example of a noise reduction device for obtaining an acoustic parameter from an input signal according to the sixteenth to eighteenth aspects of the present invention as a seventh embodiment. The audio signal on which noise or the like is superimposed
After being input from 1 and converted into a digital signal X by the AD converter 52, it is passed to the noise reduction processing unit 53.
At the same time, the digital signal X is passed to the noise level time variation calculation unit 54, where the noise and the noise are reduced by the method and apparatus described in the first embodiment or the method or apparatus described in any one of claims 1 to 6. The time variation rate K of the level is calculated. The calculated time variation rate K of the noise level is passed to the noise reduction processing unit 53, and is used to adjust the noise reduction amount by multiplying the acoustic parameter of the noise predicted when performing the noise reduction processing. . The parameter P of the signal processed by the noise reduction processing unit 53 is passed to, for example, the parameter display unit 60 and used.

【0055】本装置における雑音低減処理部53の例を
図10によって説明する。まずAD変換された信号Xを
入力信号の切り出し部61によって時間区間信号として
切り出す。切り出された時間区間信号は、音響特性計算
部62と、音声区間/雑音区間の判定部63に渡され
る。音響特性計算部62では、切り出した時間信号を例
えばFFTによって周波数スペクトルなどの音響パラメ
ータに変換し、雑音低減処理演算部66に渡す。同時
に、音声区間/雑音区間の判定部63では、切り出され
た時間区間が音声区間または雑音区間のいずれであるか
を判断し、時間区間が雑音区間であれば切り替えスイッ
チ64を端子Nにつないで、音響特性計算部62で計算
された音響パラメータを雑音特性更新部65に渡し、音
声区間であると判断されれば切り替えスイッチ64を端
子Sにつないで音響パラメータを雑音特性更新部65に
渡さないようにする。雑音特性更新部65では、過去の
雑音区間の音響パラメータを平均化して雑音重畳時の音
響パラメータを推定し、その結果を雑音低減処理部66
に渡す。雑音低減処理部66では、時間区間で計算され
た音響パラメータと雑音区間で計算された音響パラメー
タに、雑音レベルの時間変動率計算部54で計算された
雑音レベルの時間変動率Kをあわせて、雑音の重畳して
いない音響パラメータPを推定して出力する。
An example of the noise reduction processing section 53 in the present apparatus will be described with reference to FIG. First, the signal X subjected to AD conversion is cut out as a time section signal by the input signal cutout unit 61. The extracted time section signal is passed to the acoustic characteristic calculation section 62 and the speech section / noise section determination section 63. The acoustic characteristic calculation unit 62 converts the cut-out time signal into acoustic parameters such as a frequency spectrum by FFT, for example, and passes the converted signal to the noise reduction processing operation unit 66. At the same time, the voice section / noise section determination section 63 determines whether the cut-out time section is a voice section or a noise section, and if the time section is a noise section, connects the changeover switch 64 to the terminal N. Then, the acoustic parameter calculated by the acoustic characteristic calculation unit 62 is passed to the noise characteristic updating unit 65, and if it is determined that the voice section is selected, the changeover switch 64 is connected to the terminal S and the acoustic parameter is not passed to the noise characteristic updating unit 65. To do. The noise characteristic updating unit 65 estimates the acoustic parameters at the time of superimposing noise by averaging the acoustic parameters in the past noise section, and uses the result as a noise reduction processing unit 66
Pass to. The noise reduction processing unit 66 combines the acoustic parameter calculated in the time section and the acoustic parameter calculated in the noise section with the time variation rate K of the noise level calculated by the time variation rate calculation unit 54 of the noise level, An acoustic parameter P on which noise is not superimposed is estimated and output.

【0056】(実施の形態8)本発明の請求項19乃至
22に記載の入力信号から雑音低減した信号を出力する
雑音低減装置の具体的な構成例を実施の形態8として図
11に示す。雑音などが重畳した音声信号は、マイクロ
ホン51から入力され、AD変換器52によってディジ
タル信号Xに変換された後、雑音低減処理部53に渡さ
れる。同時に、ディジタル信号Xは雑音レベルの時間変
動率計算部54に渡され、ここで実施の形態1に示した
方法及び装置、または請求項1乃至6のいずれかに記載
された方法または装置によって雑音レベルの時間変動率
Kが計算される。計算された雑音レベルの時間変動率K
は、雑音低減処理部53に渡され、雑音低減処理を行う
際に予測した雑音の音響パラメータに掛け算することに
よって雑音低減量を調節することに使用される。雑音低
減処理部53で処理した信号Yは、DA変換器55によ
ってアナログ信号に変換された後、スピーカーから出力
される
(Eighth Embodiment) FIG. 11 shows a specific configuration example of a noise reduction device for outputting a signal obtained by reducing noise from an input signal according to the present invention as an eighth embodiment. The audio signal on which noise or the like is superimposed is input from a microphone 51, converted into a digital signal X by an AD converter 52, and passed to a noise reduction processing unit 53. At the same time, the digital signal X is passed to the noise level time variation calculation unit 54, where the noise and the noise are reduced by the method and apparatus described in the first embodiment or the method or apparatus described in any one of claims 1 to 6. The time variation rate K of the level is calculated. Time variation rate K of the calculated noise level
Is passed to the noise reduction processing unit 53 and is used to adjust the amount of noise reduction by multiplying the acoustic parameter of the noise predicted when performing the noise reduction processing. The signal Y processed by the noise reduction processing unit 53 is output from a speaker after being converted into an analog signal by a DA converter 55.

【0057】本装置における雑音低減処理部53の一例
として、ウィーナーフィルタ処理を利用した方法の例を
図12によって説明する。まずAD変換された信号Xを
入力信号の切り出し部61によって時間区間信号として
切り出す。切り出された時間区間信号は、音響特性計算
部62と、音声区間/雑音区間の判定部63に渡され
る。音響特性計算部62では、切り出した時間信号を例
えばFFTによって周波数スペクトルに変換し、雑音低
減処理演算部66に渡す。同時に、音声区間/雑音区間
の判定部63では、切り出された時間区間が音声区間ま
たは雑音区間のいずれであるかを判断し、時間区間が雑
音区間であれば切り替えスイッチ64を端子Nにつない
で、音響特性計算部62で計算された周波数スペクトル
を雑音特性更新部65に渡し、音声区間であると判断さ
れれば切り替えスイッチ64を端子Sにつないで周波数
スペクトルを雑音特性更新部65に渡さないようにす
る。雑音特性更新部65では、過去の雑音区間の周波数
スペクトルを平均化して雑音重畳時の周波数スペクトル
を推定し、その結果を雑音低減処理部66に渡す。雑音
低減処理部66では、時間区間で計算された周波数スペ
クトルと雑音区間で計算された周波数スペクトルに、雑
音レベルの時間変動率計算部54で計算された雑音レベ
ルの時間変動率Kをあわせて、雑音の重畳していない周
波数スペクトルを推定する。この雑音が重畳していない
状態の周波数スペクトルによってフィルタ特性を決定
し、フィルタリング処理部68によって時間信号Xを雑
音低減した時間信号Wへ変換して出力する。
As an example of the noise reduction processing section 53 in the present apparatus, an example of a method using Wiener filter processing will be described with reference to FIG. First, the signal X subjected to AD conversion is cut out as a time section signal by the input signal cutout unit 61. The extracted time section signal is passed to the acoustic characteristic calculation section 62 and the speech section / noise section determination section 63. The acoustic characteristic calculation unit 62 converts the cut-out time signal into a frequency spectrum by, for example, FFT, and passes the frequency spectrum to the noise reduction processing operation unit 66. At the same time, the voice section / noise section determination section 63 determines whether the cut-out time section is a voice section or a noise section, and if the time section is a noise section, connects the changeover switch 64 to the terminal N. Then, the frequency spectrum calculated by the acoustic characteristic calculating unit 62 is passed to the noise characteristic updating unit 65. If it is determined that the voice section is a voice section, the changeover switch 64 is connected to the terminal S and the frequency spectrum is not passed to the noise characteristic updating unit 65. To do. The noise characteristic updating unit 65 estimates the frequency spectrum at the time of noise superposition by averaging the frequency spectrum of the past noise section, and passes the result to the noise reduction processing unit 66. The noise reduction processing unit 66 combines the frequency spectrum calculated in the time section and the frequency spectrum calculated in the noise section with the time variation rate K of the noise level calculated by the time variation rate calculation unit 54 of the noise level, The frequency spectrum without noise is estimated. The filter characteristic is determined based on the frequency spectrum in which the noise is not superimposed, and the time signal X is converted into a noise-reduced time signal W by the filtering processing unit 68 and output.

【0058】[0058]

【発明の効果】本発明は、上記実施の形態から明らかな
ように、時間とともに雑音の大きさが変化する場合にも
有効な雑音レベルの時間変動率を計算できるとともに、
レベルが変化する雑音が重畳した音声に対しても有効な
雑音低減装置を実現できるものである。これにより、テ
ープレコーダなどの記録媒体に記録された音響的信号に
ついて、雑音の重畳した音声信号の雑音低減を行って聞
き取りやすくしたり、雑音環境下で発声された音声を入
力とした音声認識装置に前処理として加えることによっ
て雑音による認識率劣化を防ぐことが、より効果的に実
現できるようになる。
According to the present invention, as is apparent from the above embodiment, it is possible to calculate an effective time variation rate of a noise level even when the magnitude of noise changes with time.
It is possible to realize a noise reduction device that is effective even for a voice on which noise whose level is changed is superimposed. This makes it possible to reduce the noise of audio signals with noise superimposed on acoustic signals recorded on a recording medium such as a tape recorder to make it easier to hear, and to use a speech recognition device that receives speech uttered in a noisy environment as input. , As a pre-process, it is possible to more effectively prevent the recognition rate from deteriorating due to noise.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明における実施の形態1に記載の自己相関
係数を利用した雑音レベルの時間変動率を計算する方法
及び装置のブロック図
FIG. 1 is a block diagram of a method and an apparatus for calculating a time variation rate of a noise level using an autocorrelation coefficient according to a first embodiment of the present invention.

【図2】本発明における実施の形態2に記載の雑音低減
方法及び装置の基本構成を示すブロック図
FIG. 2 is a block diagram showing a basic configuration of a noise reduction method and device according to a second embodiment of the present invention.

【図3】本発明における実施の形態3に記載の雑音低減
方法及び装置の基本構成を示すブロック図
FIG. 3 is a block diagram showing a basic configuration of a noise reduction method and device according to a third embodiment of the present invention.

【図4】本発明における実施の形態4に記載の雑音低減
方法及び装置の基本構成を示すブロック図
FIG. 4 is a block diagram illustrating a basic configuration of a noise reduction method and apparatus according to a fourth embodiment of the present invention.

【図5】本発明における実施の形態5に記載の雑音低減
方法及び装置の基本構成を示すブロック図
FIG. 5 is a block diagram showing a basic configuration of a noise reduction method and device according to a fifth embodiment of the present invention.

【図6】本発明における実施の形態6に記載の雑音低減
装置の一例を示すブロック図
FIG. 6 is a block diagram illustrating an example of a noise reduction device according to a sixth embodiment of the present invention.

【図7】実施の形態6の雑音低減装置における雑音レベ
ルの時間変動率計算部の構成を示すブロック図
FIG. 7 is a block diagram showing a configuration of a noise level time variation rate calculation unit in the noise reduction apparatus according to the sixth embodiment.

【図8】実施の形態6の雑音低減装置における雑音低減
処理部の構成を示すブロック図
FIG. 8 is a block diagram illustrating a configuration of a noise reduction processing unit in a noise reduction device according to a sixth embodiment.

【図9】本発明における実施形態7に記載の雑音低減装
置の一例を示すブロック図
FIG. 9 is a block diagram illustrating an example of a noise reduction device according to a seventh embodiment of the present invention.

【図10】実施形態7の雑音低減装置における雑音低減
処理部の構成を示すブロック図
FIG. 10 is a block diagram illustrating a configuration of a noise reduction processing unit in a noise reduction device according to a seventh embodiment.

【図11】本発明における実施形態8に記載の雑音低減
装置の一例を表すブロック図
FIG. 11 is a block diagram illustrating an example of a noise reduction device according to an eighth embodiment of the present invention.

【図12】実施形態8の雑音低減装置における雑音低減
処理部の構成を示すブロック図
FIG. 12 is a block diagram illustrating a configuration of a noise reduction processing unit in a noise reduction device according to an eighth embodiment.

【図13】音声信号と自己相関係数の例を示す特性図FIG. 13 is a characteristic diagram showing an example of an audio signal and an autocorrelation coefficient;

【図14】雑音の重畳した音声信号と自己相関係数の例
を示す特性図
FIG. 14 is a characteristic diagram showing an example of a speech signal on which noise is superimposed and an autocorrelation coefficient.

【図15】従来のスペクトルサブトラクション法による
雑音低減方法及びの基本的なブロック図
FIG. 15 is a block diagram of a conventional noise reduction method using a spectral subtraction method.

【図16】従来のウィーナーフィルタ法による雑音低減
方法及び装置の基本的なブロック図
FIG. 16 is a basic block diagram of a conventional noise reduction method and device using a Wiener filter method.

【符号の説明】[Explanation of symbols]

1 入力信号 2、11 時間区間の切り出し手段 3 自己相関係数の計算手段 4 雑音レベルの推定手段 5 雑音レベルの時間変動率の計算手段 6 音声区間/雑音区間の判定手段 7 平均雑音レベルの推定手段 12 時間信号の周波数スペクトルへの変換手段 13 周波数スペクトル領域におけるスペクトルの引き
算手段 14 周波数スペクトルの時間信号への変換手段 15 時間信号の波形接続手段 16 雑音スペクトル推定手段 20 出力信号 21 フィルタの周波数特性設計手段 22 フィルタ係数の計算手段 23 ウィーナーフィルタリング手段 31 音響パラメータの計算手段 32 雑音の音響パラメータ推定手段 33 雑音パラメータの引き算部 41、53 雑音低減処理部 42、54 雑音レベルの時間変動率計算部 51 入力マイクロホン 52 AD変換器 55 DA変換器 56 出力スピーカー 60 パラメータ表示部 61、71 入力信号の切り出し部 62 音響特性計算部 63、74 音声区間/雑音区間の判定部 64、75 切り替えスイッチ 65 雑音特性更新部 66 雑音低減処理演算部 67 時間信号への変換部 68 時間信号の接続部 69 フィルタ特性決定部 70 フィルタリング処理部 72 自己相関係数の計算部 73 雑音レベルの計算部 76 平均雑音レベル更新部 77 平均雑音レベル 78 雑音レベルの時間変動率の計算部 100 雑音レベルの時間変動率の計算部 200 スペクトルサブトラクション処理部 300 ウィーナーフィルタ処理部 400 音響パラメータ処理部 X AD変換された信号 Y 雑音低減処理後の出力信号 K 雑音レベルの時間変動率 P 雑音低減後の音響パラメータ W 雑音低減後の時間波形
Reference Signs List 1 input signal 2, 11 time section extraction means 3 autocorrelation coefficient calculation means 4 noise level estimation means 5 noise level time variation calculation means 6 voice section / noise section determination means 7 average noise level estimation Means 12 Means for converting time signal to frequency spectrum 13 Means for subtracting spectrum in frequency spectrum domain 14 Means for converting frequency spectrum to time signal 15 Time signal waveform connection means 16 Noise spectrum estimating means 20 Output signal 21 Filter frequency characteristics Design means 22 filter coefficient calculation means 23 Wiener filtering means 31 acoustic parameter calculation means 32 noise acoustic parameter estimation means 33 noise parameter subtraction section 41, 53 noise reduction processing section 42, 54 noise level time variation calculation section 51 Input microphone 52 A / D converter 55 D / A converter 56 Output speaker 60 Parameter display section 61, 71 Input signal cutout section 62 Acoustic characteristic calculation section 63, 74 Voice section / noise section determination section 64, 75 Changeover switch 65 Noise characteristic update section 66 Noise reduction processing operation section 67 Time signal conversion section 68 Time signal connection section 69 Filter characteristic determination section 70 Filtering processing section 72 Autocorrelation coefficient calculation section 73 Noise level calculation section 76 Average noise level update section 77 Average noise Level 78 Calculating section for noise level temporal fluctuation rate 100 Calculating section for noise level temporal fluctuation rate 200 Spectrum subtraction processing section 300 Wiener filter processing section 400 Acoustic parameter processing section X AD converted signal Y Output signal after noise reduction processing K Time variation rate of noise level P Miscellaneous Reduction after the acoustic parameters W noise reduction after the time waveform

Claims (22)

【特許請求の範囲】[Claims] 【請求項1】 雑音などを含んだ音声を入力信号とし、
入力信号に窓関数を掛け算することによって時間区間の
信号に切り出し、切り出した時間区間の信号の自己相関
係数を計算し、切り出した時間区間の信号に重畳してい
る雑音の雑音レベルを自己相関係数から推定し、切り出
した時間区間が音声区間または雑音区間のいずれである
かを判定し、雑音区間であると判定された時間区間の平
均雑音レベルを自己相関係数から計算する処理を有し、
切り出した時間区間の雑音レベルと雑音区間で計算した
平均雑音レベルの比を計算することによって、最も近い
雑音区間から、切り出した時間区間までの時間に変化し
た雑音の大きさを雑音レベルの時間変動率として計算す
る雑音レベル時間変動率計算方法。
An audio signal containing noise or the like is used as an input signal.
The input signal is multiplied by a window function to cut it out into a signal in a time section, the autocorrelation coefficient of the signal in the cut out time section is calculated, and the noise level of the noise superimposed on the signal in the cut out time section is calculated by the self phase Estimated from the number of relations, it is determined whether the extracted time interval is a voice interval or a noise interval, and the average noise level of the time interval determined to be a noise interval is calculated from the autocorrelation coefficient. And
By calculating the ratio of the noise level in the extracted time interval to the average noise level calculated in the noise interval, the magnitude of the noise that has changed in the time from the nearest noise interval to the extracted time interval is represented by the time variation of the noise level. Noise level time variation rate calculation method to calculate as a rate.
【請求項2】 前記の切り出した時間区間の信号に重畳
している雑音の雑音レベルを自己相関係数から推定する
際に、自己相関係数の遅延時間系列における自己相関係
数の最大値と、第2の大きさを有する極大値の自己相関
係数の差を計算して雑音レベルの推定を行うことを特徴
とする請求項1に記載の雑音レベル時間変動率計算方
法。
2. A method for estimating a noise level of noise superimposed on a signal in the cut-out time section from an autocorrelation coefficient, comprising: determining a maximum value of an autocorrelation coefficient in a delay time sequence of the autocorrelation coefficient; 2. The method according to claim 1, wherein the noise level is estimated by calculating the difference between the autocorrelation coefficients of the local maximum having the second magnitude.
【請求項3】 請求項1または2において、計算する自
己相関係数の積和時間をN、求める自己相関係数の最大
遅延時間をMとしたときに、入力信号を時間区間の信号
として切り出す窓関数を時間長(M+N)以上の方形波
とする雑音レベル時間変動率計算方法。
3. An input signal is cut out as a signal in a time section according to claim 1 or 2, wherein N is the product-sum time of the calculated autocorrelation coefficient and M is the maximum delay time of the calculated autocorrelation coefficient. A noise level temporal fluctuation rate calculation method in which a window function is a square wave having a time length (M + N) or more.
【請求項4】 雑音などを含んだ音声を入力信号とし、
入力信号に窓関数を掛け算することによって時間区間の
信号に切り出す手段と、切り出した時間区間の信号の自
己相関係数を計算する手段と、切り出した時間区間の信
号に重畳している雑音の雑音レベルを自己相関係数から
推定する手段と、切り出した時間区間が音声区間または
雑音区間のいずれであるかを判定する手段と、雑音区間
であると判定された時間区間の平均雑音レベルを自己相
関係数から計算する手段を有し、切り出した時間区間の
雑音レベルと雑音区間で計算した平均雑音レベルの比を
計算することによって、最も近い雑音区間から、切り出
した時間区間までの時間に変化した雑音の大きさを雑音
レベルの時間変動率として計算する雑音レベル時間変動
率計算装置。
4. A speech including noise or the like is used as an input signal.
Means for cutting out the signal in the time section by multiplying the input signal by a window function, means for calculating the autocorrelation coefficient of the signal in the cut time section, and noise of the noise superimposed on the signal in the cut time section Means for estimating the level from the autocorrelation coefficient, means for determining whether the extracted time section is a speech section or a noise section, and means for calculating the average noise level in the time section determined to be a noise section by the autocorrelation. It has a means to calculate from the relation number, and by calculating the ratio of the noise level of the cut-out time section to the average noise level calculated in the noise section, the time changed from the closest noise section to the cut-out time section A noise level temporal fluctuation rate calculation device that calculates a magnitude of noise as a temporal fluctuation rate of the noise level.
【請求項5】 前記の切り出した時間区間の信号に重畳
している雑音の雑音レベルを自己相関係数から推定する
手段が、自己相関係数の遅延時間系列における自己相関
係数の最大値と、第2の大きさを有する極大値の自己相
関係数の差を計算して雑音レベルの推定を行うことを特
徴とする請求項4に記載の雑音レベル時間変動率計算装
置。
5. A means for estimating a noise level of noise superimposed on a signal in a cut-out time section from an autocorrelation coefficient, comprising: a maximum value of an autocorrelation coefficient in a delay time sequence of the autocorrelation coefficient; 5. The noise level temporal fluctuation rate calculation apparatus according to claim 4, wherein the noise level is estimated by calculating the difference between the autocorrelation coefficients of the local maximum values having the second magnitude.
【請求項6】 請求項4または5において、計算する自
己相関係数の積和時間をN、求める自己相関係数の最大
遅延時間をMとしたときに、入力信号を時間区間の信号
として切り出す窓関数を時間長(M+N)以上の方形波
とする雑音レベル時間変動率計算装置。
6. The input signal is cut out as a signal in a time section according to claim 4 or 5, wherein the product-sum time of the calculated autocorrelation coefficient is N and the maximum delay time of the calculated autocorrelation coefficient is M. A noise level temporal fluctuation rate calculating device that uses a window function as a square wave having a time length (M + N) or more.
【請求項7】 雑音などを含んだ音声を入力信号とし、
入力信号に加わった雑音を低減する方法において、請求
項1乃至3のいずれかに記載の方法で雑音レベルの時間
変動率を計算し、求めた雑音レベルの時間変動率を入力
信号から引き算することにより雑音の引き算量を調節す
る雑音低減方法。
7. An audio signal including noise or the like is used as an input signal.
4. A method for reducing noise added to an input signal, comprising: calculating a time variation rate of a noise level by the method according to claim 1; and subtracting the determined time variation rate of the noise level from the input signal. A noise reduction method that adjusts the amount of noise subtraction by using
【請求項8】 雑音などを含んだ音声を入力信号とし、
入力信号に窓関数を掛け算することによって時間区間の
信号に切り出し、切り出した時間区間が音声区間または
雑音区間のいずれかであるかを判定し、切り出した時間
区間の信号を音響パラメータへ変換し、雑音区間と判定
された時間区間の信号の音響パラメータから雑音成分の
音響パラメータを推定し、最新の時間に切り出した時間
区間の音響パラメータと雑音区間で推定した雑音成分の
音響パラメータから雑音成分を低減した音響パラメータ
を計算する雑音低減方法であって、請求項1乃至3のい
ずれかに記載される方法によって入力信号の雑音レベル
の時間変動率を計算し、推定した雑音成分の音響パラメ
ータに前記雑音レベルの時間変動率を掛け算した結果を
雑音成分の音響パラメータとして、最新の時間区間の音
響パラメータから引き算して、入力信号の雑音低減処理
した音響パラメータを得る雑音低減方法。
8. A speech including noise or the like is used as an input signal.
The input signal is multiplied by a window function to cut out a signal in a time section, it is determined whether the cut-out time section is a voice section or a noise section, and the cut-out time section signal is converted into an acoustic parameter. Estimate the acoustic component of the noise component from the acoustic parameter of the signal in the time interval determined as the noise interval, and reduce the noise component from the acoustic parameter of the time interval cut out at the latest time and the acoustic parameter of the noise component estimated in the noise interval. A noise reduction method for calculating an estimated acoustic parameter, comprising calculating a time variation rate of a noise level of an input signal by the method according to any one of claims 1 to 3, and adding the noise to an estimated acoustic parameter of a noise component. The result of multiplying the time variation of the level as the acoustic parameter of the noise component from the acoustic parameter of the latest time section And it can calculate the noise reduction method for obtaining acoustic parameters noise reduction processing of the input signal.
【請求項9】 請求項8に記載の雑音低減方法におい
て、音響パラメータを周波数スペクトルとする雑音低減
方法。
9. The noise reduction method according to claim 8, wherein the acoustic parameter is a frequency spectrum.
【請求項10】 請求項8に記載の雑音低減方法におい
て、音響パラメータを線形予測係数とする雑音低減方
法。
10. The noise reduction method according to claim 8, wherein the acoustic parameter is a linear prediction coefficient.
【請求項11】 雑音などを含んだ音声を入力信号と
し、入力信号に窓関数を掛け算することによって時間区
間の信号に切り出し、切り出した時間区間が音声区間ま
たは雑音区間のいずれかであるかを判定し、切り出した
時間区間の信号を音響パラメータへ変換し、雑音区間と
判定された時間区間の信号の音響パラメータから雑音成
分の音響パラメータを推定し、最新の時間に切り出され
た時間区間の音響パラメータから雑音区間で推定した雑
音成分の音響パラメータを引き算し、雑音成分の音響パ
ラメータを引き算した音響パラメータを時間信号へ変換
し、変換された時間波形を接続して出力する雑音低減方
法であって、請求項1乃至3に記載される方法によって
入力信号の雑音レベルの時間変動率を計算し、推定した
雑音成分の音響パラメータに前記雑音レベルの時間変動
率を掛け算した結果を雑音成分の音響パラメータとし
て、最新の時間区間の音響パラメータから引き算した後
に、引き算した音響パラメータから時間信号へと変換し
て出力することを特徴とする雑音低減方法。
11. A speech including noise or the like is used as an input signal, and the input signal is multiplied by a window function to cut out a signal in a time section. Whether the cut out time section is a speech section or a noise section is determined. Judgment, the signal of the extracted time interval is converted into an acoustic parameter, the acoustic parameter of the noise component is estimated from the acoustic parameter of the signal of the time interval determined as the noise interval, and the audio of the time interval extracted at the latest time A noise reduction method comprising: subtracting an acoustic parameter of a noise component estimated in a noise section from a parameter, converting an acoustic parameter obtained by subtracting an acoustic parameter of the noise component into a time signal, and connecting and outputting the converted time waveform. The time variation of the noise level of the input signal is calculated by the method according to any one of claims 1 to 3, and the acoustic parameter of the estimated noise component is calculated. Data obtained by multiplying the data by the time variation rate of the noise level as a noise component acoustic parameter, from the acoustic parameter of the latest time section, and then converting the subtracted acoustic parameter into a time signal and outputting the converted signal. Characteristic noise reduction method.
【請求項12】 請求項11に記載の雑音低減方法にお
いて、音響パラメータを周波数スペクトルとする雑音低
減方法。
12. The noise reduction method according to claim 11, wherein the acoustic parameter is a frequency spectrum.
【請求項13】 請求項11に記載の雑音低減方法にお
いて、音響パラメータを線形予測係数とする雑音低減方
法。
13. The noise reduction method according to claim 11, wherein the acoustic parameter is a linear prediction coefficient.
【請求項14】 雑音などを含んだ音声を入力信号と
し、入力信号に窓関数を掛け算することによって時間区
間の信号に切り出し、切り出した時間区間が音声区間ま
たは雑音区間のいずれかであるかを判定し、切り出した
時間区間の信号を周波数スペクトルへ変換し、雑音区間
と判定された時間区間の信号の周波数スペクトルから雑
音スペクトルを推定し、切り出した最新の時間区間の周
波数スペクトルから雑音区間で推定した雑音スペクトル
を引き算して雑音低減を実現するためのフィルタの周波
数特性を設計し、フィルタの周波数特性からフィルタ係
数を計算してフィルタを構成し、入力信号を前記フィル
タ係数を有するフィルタに通すことによって入力信号の
雑音低減を実現する雑音低減方法であって、請求項1乃
至3のいずれかに記載される方法によって入力信号の雑
音レベルの時間変動率を計算し、雑音スペクトルに前記
雑音レベルの時間変動率を掛け算した結果を雑音スペク
トルの推定値として、最新の時間区間の信号の周波数ス
ペクトルから引き算してフィルタの周波数特性を決定す
ることを特徴とする雑音低減方法。
14. An audio signal containing noise or the like is used as an input signal, and the input signal is multiplied by a window function to cut out a signal in a time section. Whether the cut out time section is a voice section or a noise section is determined. Judge, convert the signal of the extracted time section into a frequency spectrum, estimate the noise spectrum from the frequency spectrum of the signal of the time section determined as the noise section, and estimate the noise section from the frequency spectrum of the latest extracted time section Subtracting the obtained noise spectrum to design a frequency characteristic of a filter for realizing noise reduction, calculating a filter coefficient from the filter frequency characteristic to form a filter, and passing an input signal through a filter having the filter coefficient 4. A noise reduction method for realizing noise reduction of an input signal by using the method described in claim 1. The time variation of the noise level of the input signal is calculated by the method described above, and the result of multiplying the noise spectrum by the time variation of the noise level is subtracted from the frequency spectrum of the signal in the latest time section as a noise spectrum estimation value. A frequency characteristic of the filter.
【請求項15】 雑音などを含んだ音声を入力信号と
し、入力信号に加わった雑音を低減する装置において、
雑音低減部と雑音レベルの時間変動率計算部を有し、入
力信号を雑音低減処理部と、雑音レベルの時間変動率計
算部に渡し、雑音レベルの時間変動率の計算部において
請求項4乃至6のいずれかに記載の装置で雑音レベルの
時間変動率を計算し、求めた雑音レベルの時間変動率を
雑音低減処理部に渡して、入力信号から雑音成分を引き
算する手段により雑音の引き算量を調節することを特徴
とする雑音低減装置。
15. An apparatus for reducing a noise added to an input signal by using a voice including noise or the like as an input signal,
And a noise reduction unit and a noise level time variation calculation unit. The input signal is passed to a noise reduction processing unit and a noise level time variation rate calculation unit. 6. The time variation of the noise level is calculated by the apparatus according to any one of the above items 6, and the obtained time variation of the noise level is passed to the noise reduction processing unit, and the amount of noise subtraction is calculated by means for subtracting the noise component from the input signal. A noise reduction device characterized by adjusting the following.
【請求項16】 雑音などを含んだ音声を入力信号と
し、入力信号に窓関数を掛け算することによって時間区
間の信号に切り出す手段と、切り出した時間区間が音声
区間または雑音区間のいずれかであるかを判定する手段
と、切り出した時間区間の信号を音響パラメータへ変換
する手段と、雑音区間と判定された時間区間の信号の音
響パラメータから雑音成分の音響パラメータを推定する
手段と、最新の時間に切り出した時間区間の音響パラメ
ータと雑音区間で推定した雑音成分の音響パラメータか
ら雑音成分を引き算する手段を備えた雑音低減装置であ
って、請求項4乃至6のいずれかに記載される装置によ
って計算した入力信号の雑音レベルの時間変動率を、最
新の時間に切り出した時間区間の音響パラメータから雑
音区間で推定した音響パラメータを引き算する手段に渡
し、推定した雑音成分の音響パラメータに雑音レベルの
時間変動率を掛け算した結果を雑音成分の音響パラメー
タとして最新の時間区間の音響パラメータから引き算し
て、入力信号の雑音低減処理した音響パラメータを得る
ことを特徴とする雑音低減装置。
16. A means for taking a speech including noise or the like as an input signal and multiplying the input signal by a window function to cut out a signal in a time section, and the cut out time section is either a voice section or a noise section. Means for determining whether or not the cut-out signal in the time section is converted into an acoustic parameter; means for estimating the sound parameter of the noise component from the sound parameter of the signal in the time section determined to be the noise section; A noise reduction device comprising means for subtracting a noise component from an acoustic parameter of a time section extracted in the above and an acoustic parameter of a noise component estimated in a noise section. The estimated time variation rate of the noise level of the input signal is estimated in the noise section from the acoustic parameters of the time section cut out at the latest time. The parameter is passed to the means for subtracting the parameter, and the result of multiplying the estimated noise component acoustic parameter by the time variation rate of the noise level is subtracted as the noise component acoustic parameter from the acoustic parameter in the latest time section to reduce the noise of the input signal. A noise reduction device for obtaining processed acoustic parameters.
【請求項17】 請求項16に記載の雑音低減装置にお
いて、音響パラメータを周波数スペクトルとする雑音低
減装置。
17. The noise reduction device according to claim 16, wherein the acoustic parameter is a frequency spectrum.
【請求項18】 請求項16に記載の雑音低減装置にお
いて、音響パラメータを線形予測係数とする雑音低減装
置。
18. The noise reduction device according to claim 16, wherein the acoustic parameter is a linear prediction coefficient.
【請求項19】 雑音などを含んだ音声を入力信号と
し、入力信号に窓関数を掛け算することによって時間区
間の信号に切り出す手段と、切り出した時間区間が音声
区間または雑音区間のいずれかであるかを判定する手段
と、切り出した時間区間の信号を音響パラメータへ変換
する手段と、雑音区間と判定された時間区間の信号の音
響パラメータから雑音成分の音響パラメータを推定する
手段と、最新の時間に切り出された時間区間の音響パラ
メータから雑音区間で推定した雑音成分の音響パラメー
タを引き算する手段と、雑音成分の音響パラメータを引
き算した音響パラメータを時間信号へ変換する手段と、
変換された時間波形を接続して出力する手段とを備えた
雑音低減装置であって、請求項4乃至6に記載される装
置によって計算した入力信号の雑音レベルの時間変動率
を、最新の時間に切り出した時間区間の音響パラメータ
から雑音区間で推定した音響パラメータを引き算する手
段に渡し、推定した雑音成分の音響パラメータに雑音レ
ベルの時間変動率を掛け算した結果を雑音成分の音響パ
ラメータとして最新の時間区間の音響パラメータから引
き算した後に、引き算した音響パラメータから時間信号
へと変換して出力することを特徴とする雑音低減装置。
19. A means for taking a speech including noise or the like as an input signal and multiplying the input signal by a window function to cut out a signal in a time section, and the cut out time section is either a voice section or a noise section. Means for determining whether or not the cut-out signal in the time section is converted into an acoustic parameter; means for estimating the sound parameter of the noise component from the sound parameter of the signal in the time section determined to be the noise section; Means for subtracting the acoustic parameter of the noise component estimated in the noise section from the acoustic parameter of the time section cut out, and means for converting the acoustic parameter obtained by subtracting the acoustic parameter of the noise component into a time signal,
And a means for connecting and outputting the converted time waveform, wherein the time variation rate of the noise level of the input signal calculated by the apparatus according to any one of claims 4 to 6 is calculated based on the latest time. To the means for subtracting the acoustic parameter estimated in the noise section from the acoustic parameter in the time section extracted in the above, and multiplying the estimated acoustic parameter of the noise component by the time variation rate of the noise level as the latest acoustic parameter of the noise component. A noise reduction apparatus characterized in that after subtracting from acoustic parameters in a time section, the subtracted acoustic parameters are converted into a time signal and output.
【請求項20】 請求項19に記載の雑音低減装置にお
いて、音響パラメータを周波数スペクトルとする雑音低
減装置。
20. The noise reduction device according to claim 19, wherein the acoustic parameter is a frequency spectrum.
【請求項21】 請求項19に記載の雑音低減装置にお
いて、音響パラメータを線形予測係数とする雑音低減装
置。
21. The noise reduction device according to claim 19, wherein the acoustic parameter is a linear prediction coefficient.
【請求項22】 雑音などを含んだ音声を入力信号と
し、入力信号に窓関数を掛け算することによって時間区
間の信号に切り出す手段と、切り出した時間区間が音声
区間または雑音区間のいずれかであるかを判定する手段
と、切り出した時間区間の信号を周波数スペクトルへ変
換する手段と、雑音区間と判定された時間区間の信号の
周波数スペクトルから雑音スペクトルを推定する手段
と、切り出した最新の時間区間の周波数スペクトルから
雑音区間で推定した雑音スペクトルを引き算して雑音低
減を実現するためのフィルタの周波数特性を設計する手
段と、フィルタの周波数特性からフィルタ係数を計算し
てフィルタを構成する手段と、入力信号を前記計算され
たフィルタ計数を有するフィルタに通すことによって入
力信号の雑音低減を実現する雑音低減装置であって、請
求項4乃至6のいずれかに記載される装置によって求め
た入力信号の雑音レベルの時間変動率を、切り出した時
間区間の信号の周波数スペクトルから推定した雑音スペ
クトルを引き算してフィルタを設計する手段に渡し、雑
音スペクトルに雑音レベルの時間変動率を掛け算した結
果を雑音スペクトルの推定値として、最新の時間区間の
信号の周波数スペクトルから引き算してフィルタの周波
数特性を決定することを特徴とする雑音低減装置。
22. A means for taking a speech including noise or the like as an input signal and cutting the signal into a signal of a time section by multiplying the input signal by a window function, and wherein the cut time section is either a speech section or a noise section. Means for determining whether or not the cut-out time interval signal is converted into a frequency spectrum; means for estimating a noise spectrum from the frequency spectrum of the signal in the time interval determined to be a noise interval; A means for designing a frequency characteristic of a filter for realizing noise reduction by subtracting a noise spectrum estimated in a noise section from a frequency spectrum of the filter, a means for calculating a filter coefficient from the frequency characteristic of the filter to constitute a filter, Achieving noise reduction of the input signal by passing the input signal through a filter having the calculated filter count A noise reduction device which calculates a time variation rate of a noise level of an input signal obtained by the device according to any one of claims 4 to 6, and estimates a noise spectrum estimated from a frequency spectrum of a signal in a cut-out time section. Subtract to the filter design means and multiply the noise spectrum by the noise level time variation to obtain the noise spectrum estimation value and subtract from the frequency spectrum of the signal in the latest time section to obtain the filter frequency characteristics. A noise reduction device characterized by determining.
JP27625198A 1998-09-29 1998-09-29 Noise level time variation calculation method and apparatus, and noise reduction method and apparatus Expired - Fee Related JP3310225B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP27625198A JP3310225B2 (en) 1998-09-29 1998-09-29 Noise level time variation calculation method and apparatus, and noise reduction method and apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP27625198A JP3310225B2 (en) 1998-09-29 1998-09-29 Noise level time variation calculation method and apparatus, and noise reduction method and apparatus

Publications (2)

Publication Number Publication Date
JP2000105599A true JP2000105599A (en) 2000-04-11
JP3310225B2 JP3310225B2 (en) 2002-08-05

Family

ID=17566826

Family Applications (1)

Application Number Title Priority Date Filing Date
JP27625198A Expired - Fee Related JP3310225B2 (en) 1998-09-29 1998-09-29 Noise level time variation calculation method and apparatus, and noise reduction method and apparatus

Country Status (1)

Country Link
JP (1) JP3310225B2 (en)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132177A (en) * 1998-10-20 2000-05-12 Canon Inc Device and method for processing voice
WO2002019319A1 (en) * 2000-08-31 2002-03-07 Matsushita Electric Industrial Co., Ltd. Speech processing device and speech processing method
KR100400226B1 (en) * 2001-10-15 2003-10-01 삼성전자주식회사 Apparatus and method for computing speech absence probability, apparatus and method for removing noise using the computation appratus and method
KR100413797B1 (en) * 2001-08-23 2003-12-31 삼성전자주식회사 Speech signal compensation method and the apparatus thereof
DE102008039276A1 (en) 2007-09-13 2009-03-19 Fujitsu Ltd., Kawasaki Sound processing apparatus, apparatus and method for controlling the gain and computer program
JP2011191682A (en) * 2010-03-16 2011-09-29 Nec Corp Speech recognition device, speech recognition method and speech recognition program
WO2013164981A1 (en) * 2012-05-01 2013-11-07 Ricoh Company, Ltd. Processing apparatus, processing method, program, computer readable information recording medium and processing system

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2000132177A (en) * 1998-10-20 2000-05-12 Canon Inc Device and method for processing voice
WO2002019319A1 (en) * 2000-08-31 2002-03-07 Matsushita Electric Industrial Co., Ltd. Speech processing device and speech processing method
GB2374265A (en) * 2000-08-31 2002-10-09 Matsushita Electric Ind Co Ltd Speech processing device and speech processing method
GB2374265B (en) * 2000-08-31 2005-01-12 Matsushita Electric Ind Co Ltd Speech processing apparatus and speech processing method
US7286980B2 (en) 2000-08-31 2007-10-23 Matsushita Electric Industrial Co., Ltd. Speech processing apparatus and method for enhancing speech information and suppressing noise in spectral divisions of a speech signal
KR100413797B1 (en) * 2001-08-23 2003-12-31 삼성전자주식회사 Speech signal compensation method and the apparatus thereof
KR100400226B1 (en) * 2001-10-15 2003-10-01 삼성전자주식회사 Apparatus and method for computing speech absence probability, apparatus and method for removing noise using the computation appratus and method
DE102008039276B4 (en) * 2007-09-13 2016-10-06 Fujitsu Limited Sound processing apparatus, apparatus and method for controlling the gain and computer program
DE102008039276A1 (en) 2007-09-13 2009-03-19 Fujitsu Ltd., Kawasaki Sound processing apparatus, apparatus and method for controlling the gain and computer program
CN101388216B (en) * 2007-09-13 2012-06-27 富士通株式会社 Sound processing device, apparatus and method for controlling gain
US8473291B2 (en) 2007-09-13 2013-06-25 Fujitsu Limited Sound processing apparatus, apparatus and method for controlling gain, and computer program
JP2011191682A (en) * 2010-03-16 2011-09-29 Nec Corp Speech recognition device, speech recognition method and speech recognition program
JP2013250548A (en) * 2012-05-01 2013-12-12 Ricoh Co Ltd Processing device, processing method, program, and processing system
CN104364845A (en) * 2012-05-01 2015-02-18 株式会社理光 Processing apparatus, processing method, program, computer readable information recording medium and processing system
EP2845190A1 (en) * 2012-05-01 2015-03-11 Ricoh Company, Ltd. Processing apparatus, processing method, program, computer readable information recording medium and processing system
EP2845190A4 (en) * 2012-05-01 2015-04-29 Ricoh Co Ltd Processing apparatus, processing method, program, computer readable information recording medium and processing system
WO2013164981A1 (en) * 2012-05-01 2013-11-07 Ricoh Company, Ltd. Processing apparatus, processing method, program, computer readable information recording medium and processing system
CN104364845B (en) * 2012-05-01 2017-03-08 株式会社理光 Processing meanss, processing method, program, computer-readable information recording medium and processing system
US9754606B2 (en) 2012-05-01 2017-09-05 Ricoh Company, Ltd. Processing apparatus, processing method, program, computer readable information recording medium and processing system

Also Published As

Publication number Publication date
JP3310225B2 (en) 2002-08-05

Similar Documents

Publication Publication Date Title
EP1806739B1 (en) Noise suppressor
US8010355B2 (en) Low complexity noise reduction method
JP3963850B2 (en) Voice segment detection device
JP4402295B2 (en) Signal noise reduction by spectral subtraction using linear convolution and causal filtering
EP2031583B1 (en) Fast estimation of spectral noise power density for speech signal enhancement
US8731207B2 (en) Apparatus and method for computing control information for an echo suppression filter and apparatus and method for computing a delay value
JP4567655B2 (en) Method and apparatus for suppressing background noise in audio signals, and corresponding apparatus with echo cancellation
US6487257B1 (en) Signal noise reduction by time-domain spectral subtraction using fixed filters
JP6243536B2 (en) Echo cancellation
JP2003534570A (en) How to suppress noise in adaptive beamformers
KR101340520B1 (en) Apparatus and method for removing noise
US20050288923A1 (en) Speech enhancement by noise masking
KR20020005674A (en) System and method for dual microphone signal noise reduction using spectral subtraction
CA2358203A1 (en) Method and apparatus for adaptively suppressing noise
EP1995722B1 (en) Method for processing an acoustic input signal to provide an output signal with reduced noise
JP2000330597A (en) Noise suppressing device
JP3310225B2 (en) Noise level time variation calculation method and apparatus, and noise reduction method and apparatus
US6507623B1 (en) Signal noise reduction by time-domain spectral subtraction
JPH04245300A (en) Noise removing device
JP5466581B2 (en) Echo canceling method, echo canceling apparatus, and echo canceling program
EP1278185A2 (en) Method for improving noise reduction in speech transmission
JP2002175099A (en) Method and device for noise suppression
CN117280414A (en) Noise reduction based on dynamic neural network
JPH03269498A (en) Noise removal system
KR101086624B1 (en) System for removing noise in headset of stfd type

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees