JP2010066478A - Noise suppressing device and noise suppressing method - Google Patents
Noise suppressing device and noise suppressing method Download PDFInfo
- Publication number
- JP2010066478A JP2010066478A JP2008232241A JP2008232241A JP2010066478A JP 2010066478 A JP2010066478 A JP 2010066478A JP 2008232241 A JP2008232241 A JP 2008232241A JP 2008232241 A JP2008232241 A JP 2008232241A JP 2010066478 A JP2010066478 A JP 2010066478A
- Authority
- JP
- Japan
- Prior art keywords
- signal
- noise
- mask function
- estimation signal
- unit
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
Description
本発明は、雑音抑制装置及び雑音抑制方法に関し、より詳細には、雑音を抑制しつつ、高音質を実現できる雑音抑制装置及び雑音抑制方法に関するものである。 The present invention relates to a noise suppression device and a noise suppression method, and more particularly to a noise suppression device and a noise suppression method that can realize high sound quality while suppressing noise.
従来、目的信号であるユーザの音声信号に他の音声信号や環境雑音信号等が混入した混合観測信号から、その音声信号のみを抽出するスペクトラム減算法を用いた音声認識装置が知られている(例えば、特許文献1参照)。このスペクトラム減算法は、雑音が混入した混合観測信号のパワースペクトラムから別途推定した雑音信号のパワースペクトラムを減算することで、目的の音声信号を推定する手法である。この減算処理を行う際に、減算係数と称される係数が雑音信号のパワースペクトラムに乗算され、当該パワースペクトラムの補正が行われている。
ところで、音声信号s(t)、雑音信号n(t)、及び混合観測信号x(t)とすると、一般に下記(4)式が成立する。
x(t)=s(t)+n(t) (4)式
By the way, when the audio signal s (t), the noise signal n (t), and the mixed observation signal x (t) are used, the following equation (4) is generally established.
x (t) = s (t) + n (t) (4) Formula
このとき、別途推定された雑音推定信号をn1(t)とすると、スペクトラム減算法によって得られる音声推定信号は、下記(5)式により表わすことができる。
なお、上記(5)式において、X(f、t)及びN1(f、t)は、x(t)及びn1(t)に対して短時間フーリエ変換を夫々行った信号である。また、βは減算係数であり、angle(Y)は複素数Yの位相角を出力する関数である。 In the above equation (5), X (f, t) and N1 (f, t) are signals obtained by performing short-time Fourier transform on x (t) and n1 (t), respectively. Β is a subtraction coefficient, and angle (Y) is a function that outputs the phase angle of the complex number Y.
したがって、上記(5)式によれば、出力信号である音声推定信号s1(t)における雑音の残留度合いは、減算係数βの値に依存していることが分かる。例えば、減算係数βを増加させ抑圧性能を向上させると、音質が低下し、一方で、減算係数βを低下させ抑圧性能を低下させると、音質が向上する。このように、抑圧性能と音質とには、二律背反(トレードオフ)の関係が生じているため、抑圧性能と音質とを同時に満足させる最適な減算係数βを設定するのは困難となっている。 Therefore, according to the above equation (5), it can be seen that the degree of residual noise in the speech estimation signal s1 (t) that is the output signal depends on the value of the subtraction coefficient β. For example, if the subtraction coefficient β is increased to improve the suppression performance, the sound quality is deteriorated. On the other hand, if the subtraction coefficient β is decreased to suppress the suppression performance, the sound quality is improved. In this way, since there is a tradeoff between suppression performance and sound quality, it is difficult to set an optimal subtraction coefficient β that satisfies both suppression performance and sound quality at the same time.
本発明は、このような問題点を解決するためになされたものであり、雑音を効果的に抑制しつつ、高音質を維持することができる雑音抑制装置及び雑音抑制方法を提供することを主たる目的とする。 The present invention has been made to solve such problems, and mainly provides a noise suppression device and a noise suppression method capable of maintaining high sound quality while effectively suppressing noise. Objective.
上記目的を達成するための本発明の一態様は、音声信号及び雑音信号を含む混合観測信号と、推定された雑音信号である雑音推定信号とに対してフーリエ変換を行うフーリエ変換部と、前記フーリエ変換部により前記フーリエ変換された前記混合観測信号と前記雑音推定信号とに基づいて、減算係数となるマスク関数を算出するマスク関数演算部と、前記マスク関数演算部により算出された前記マスク関数を用いて、前記混合観測信号から前記雑音推定信号を減算することで、音声信号と推定される音声推定信号を算出する減算処理部と、を備える、ことを特徴とする雑音抑制装置である。この一態様によれば、雑音を効果的に抑制しつつ、高音質を維持することができる。 One aspect of the present invention for achieving the above object includes a Fourier transform unit that performs Fourier transform on a mixed observation signal including a speech signal and a noise signal, and a noise estimation signal that is an estimated noise signal, Based on the mixed observation signal Fourier-transformed by the Fourier transform unit and the noise estimation signal, a mask function computing unit that computes a mask function to be a subtraction coefficient, and the mask function computed by the mask function computing unit And a subtraction processing unit that calculates a speech estimation signal that is estimated to be a speech signal by subtracting the noise estimation signal from the mixed observation signal. According to this aspect, it is possible to maintain high sound quality while effectively suppressing noise.
また、この一態様において、前記マスク関数演算部は、前記フーリエ変換された雑音推定信号と混合観測信号との比で表わされる2つの確信度を含む前記マスク関数を算出してもよい。 In this aspect, the mask function calculation unit may calculate the mask function including two certainty factors represented by a ratio between the Fourier-transformed noise estimation signal and the mixed observation signal.
さらに、この一態様において、前記マスク関数演算部は、前記確信度Pf(t)及びPb(f)を、(1)式及び(2)式を用いて夫々算出してもよい。 Furthermore, in this one aspect, the mask function calculation unit may calculate the certainty factors P f (t) and P b (f) using the equations (1) and (2), respectively.
なお、この一態様において、前記マスク関数演算部は、(3)式を用いて前記マスク関数H(f、t)を算出してもよい。 In this aspect, the mask function calculation unit may calculate the mask function H (f, t) using equation (3).
この一態様において、前記減算処理部により算出された前記音声推定信号に対してフーリエ逆変換を行うフーリエ逆変換部を更に備えていてもよい。 In this aspect, the image processing apparatus may further include a Fourier inverse transform unit that performs an inverse Fourier transform on the speech estimation signal calculated by the subtraction processing unit.
他方、上記目的を達成するための本発明の一態様は、音声信号及び雑音信号を含む混合観測信号と、雑音信号であると推定された雑音推定信号とに対してフーリエ変換を行うフーリエ変換工程と、前記フーリエ変換工程で前記フーリエ変換された前記混合観測信号と前記雑音推定信号とに基づいて、減算係数となるマスク関数を算出するマスク関数演算工程と、前記マスク関数演算工程で算出された前記マスク関数を用いて、前記混合観測信号から前記雑音推定信号を減算することで、音声信号と推定される音声推定信号を算出する減算処理工程と、を含む、ことを特徴とする雑音抑制方法であってもよい。 On the other hand, one aspect of the present invention for achieving the above object is a Fourier transform step of performing a Fourier transform on a mixed observation signal including a speech signal and a noise signal and a noise estimation signal estimated to be a noise signal. And a mask function calculation step for calculating a mask function to be a subtraction coefficient based on the mixed observation signal and the noise estimation signal Fourier-transformed in the Fourier transform step, and a mask function calculation step calculated by the mask function calculation step. A subtraction processing step of calculating a speech estimation signal estimated as a speech signal by subtracting the noise estimation signal from the mixed observation signal using the mask function. It may be.
本発明によれば、雑音を効果的に抑制しつつ、高音質を維持することができる。 According to the present invention, it is possible to maintain high sound quality while effectively suppressing noise.
以下、本発明を実施するための最良の形態について、添付図面を参照しながら一実施形態を挙げて説明する。図1は、本発明の一実施形態に係る雑音抑制装置のシステム構成を示すブロック図である。 The best mode for carrying out the present invention will be described below with reference to the accompanying drawings. FIG. 1 is a block diagram showing a system configuration of a noise suppression apparatus according to an embodiment of the present invention.
本実施形態に係る雑音抑制装置10は、混合観測信号入力部1と、第1離散フーリエ変換部2と、位相演算部3と、第1スペクトル演算部4と、雑音推定信号入力部5と、第2離散フーリエ変換部6と、第2スペクトル演算部7と、マスク関数演算部8と、減算処理部9と、離散フーリエ逆変換部11と、音声推定信号出力部12と、を備えている。
The
なお、雑音抑制装置10は、主要なハードウェア構成として、制御処理、演算処理等を行うCPU(Central Processing Unit)と、CPUによって実行される制御プログラム、演算プログラム等が記憶されたROM(Read Only Memory)と、処理データ等を一時的に記憶するRAM(Random Access Memory)と、を有するマイクロコンピュータにより構成されている。また、第1離散フーリエ変換部2、位相演算部3、第1スペクトル演算部4、第2離散フーリエ変換部6、第2スペクトル演算部7、マスク関数演算部8、減算処理部9、および離散フーリエ逆変換部11は、例えば、上記ROMに格納され、上記CPUによって実行されるプログラムにより実現されていてもよい。
The
混合観測信号入力部1の入力端子には、音声信号及び雑音信号を含む混合観測信号x(t)が入力される。ここで、音声信号とは、ユーザ音声等の目的信号であり、雑音信号とは、周囲の音声、環境雑音等のいわゆるノイズである。また、混合観測信号x(t)に対し、線形フィルタリング処理を施し、音声を強調させてもよい。混合観測信号入力部1は、入力された混合観測信号x(t)を第1離散フーリエ変換部2に対して出力する。
A mixed observation signal x (t) including an audio signal and a noise signal is input to the input terminal of the mixed observation
第1離散フーリエ変換部2は、入力された混合観測信号x(t)に対して、周知のフーリエ変換を行い、フーリエ変換された混合観測信号X(f、t)を算出する。そして、第1離散フーリエ変換部2は、フーリエ変換した混合観測信号X(f、t)を、位相演算部3、第1スペクトル演算部4、及びマスク関数演算部8に対して出力する。
The first discrete Fourier
位相演算部3は、第1離散フーリエ変換部2からのフーリエ変換された混合観測信号X(f、t)に基づいて、下記(6)式を用いて、位相angle(X(f、t))を算出する。
angle(X(f、t))=arctan(A/B) (6)式
The
angle (X (f, t)) = arctan (A / B) (6)
ここで、X(f、t)=A+Bi(iは複素数であり、A及びBは任意の実数とする)で表わすことができる。位相演算部3は、算出した位相angle(X(f、t))を減算処理部9に対して出力する。
Here, X (f, t) = A + Bi (i is a complex number, and A and B are arbitrary real numbers). The
第1スペクトル演算部4は、第1離散フーリエ変換部2からのフーリエ変換された混合観測信号X(f、t)のパワースペクトル|X(f、t)|2を算出し、マスク関数演算部8に対して出力する。
The first
雑音推定信号入力部5の入力端子には、推定された雑音信号である雑音推定信号n1(t)が入力される。なお、上記雑音信号の推定には、周知の雑音推定アルゴリズムを用いることができる。雑音推定信号入力部5は、入力された雑音推定信号n1(t)を第2離散フーリエ変換部6に対して出力する。
The noise estimation signal n1 (t), which is an estimated noise signal, is input to the input terminal of the noise estimation
第2離散フーリエ変換部6は、入力された雑音推定信号n1(t)に対して周知のフーリエ変換を行い、フーリエ変換された雑音推定信号N1(f、t)を算出する。そして、第2離散フーリエ変換部6は、フーリエ変換した雑音推定信号N1(f、t)をマスク関数演算部8及び第2スペクトル演算部7に対して出力する。
The second discrete Fourier transform unit 6 performs a well-known Fourier transform on the input noise estimation signal n1 (t), and calculates a Fourier estimated noise estimation signal N1 (f, t). Then, the second discrete Fourier transform unit 6 outputs the noise estimation signal N1 (f, t) obtained by Fourier transform to the mask function computation unit 8 and the second
第2スペクトル演算部7は、第2離散フーリエ変換部6からのフーリエ変換された雑音推定信号N1(f、t)のパワースペクトル|N1(f、t)|2を算出し、マスク関数演算部8に対して出力する。
The second
マスク関数演算部8は、第1スペクトル演算部4からの混合観測信号X(f、t)のパワースペクトル|X(f、t)|2と、第2スペクトル演算部7からの雑音推定信号N1(f、t)のパワースペクトル|N1(f、t)|2と、に基づいて、減算係数βに相当するソフトマスク関数(マスク関数)H(f、t)を算出する。
The mask function calculation unit 8 includes the power spectrum | X (f, t) | 2 of the mixed observation signal X (f, t) from the first
ここで、減算係数βは、雑音を抑制する際の抑圧性能を決定する係数であり、後述の減算処理部9の(7)式が示すように、例えば、減算係数βを増加させると抑圧性能が向上し、一方、減算係数βを低下させると抑圧性能が低下する。
Here, the subtraction coefficient β is a coefficient that determines the suppression performance when suppressing noise. For example, when the subtraction coefficient β is increased, as shown in Equation (7) of the
マスク関数演算部8は、まず、雑音推定信号N1(f、t)のパワースペクトル|N1(f、t)|2と、混合観測信号X(f、t)のパワースペクトル|X(f、t)|2との比で表わされる2つの確信度Pf(t)、Pb(f)を、下記(1)式及び(2)式を用いて、夫々算出する。
次に、マスク関数演算部8は、算出された上記確信度Pf(t)及びPb(f)に基づいて、下記(3)式を用いて、ソフトマスク関数H(f、t)を算出する。
なお、上記(3)式において、Iには、例えば1が設定されている。また、最小減算係数δo及び最大減算係数δmには、後述の抑圧性能及び音質が最良となる最適値が実験的に求められ設定されている。 In the above formula (3), for example, 1 is set as I. For the minimum subtraction coefficient δ o and the maximum subtraction coefficient δ m , optimum values that give the best suppression performance and sound quality described later are experimentally obtained and set.
このように、雑音推定信号N1(f、t)のパワースペクトル|N1(f、t)|2と、混合観測信号X(f、t)のパワースペクトル|X(f、t)|2との比で表わされる2つの確信度Pf(t)、Pb(f)を用いることで、抑圧性能と音質とを同時に満たすソフトマスク関数H(f,t)を、最適かつ自動的に設定することができる。マスク関数演算部8は、算出したソフトマスク関数H(f、t)を減算処理部9に対して出力する。
Thus, the power spectrum of the noise estimation signal N1 (f, t) | N1 (f, t) | 2, the power spectrum of the mixed observation signals X (f, t) | X (f, t) | 2 and the By using the two certainty factors P f (t) and P b (f) expressed by the ratio, the soft mask function H (f, t) that simultaneously satisfies the suppression performance and the sound quality is set optimally and automatically. be able to. The mask function calculation unit 8 outputs the calculated soft mask function H (f, t) to the
減算処理部9は、マスク関数演算部8により算出されたソフトマスク関数H(f、t)を用いて、混合観測信号X(f、t)から雑音推定信号N1(f、t)を減算することで、音声信号と推定される音声推定信号s1(f、t)を算出する。
The
より具体的には、減算処理部9は、位相演算部3からの位相angle(X(f、t))と、フーリエ変換された混合観測信号X(f、t)及び雑音推定信号N1(f、t)と、マスク関数演算部8により算出されたソフトマスク関数H(f、t)と、に基づいて、下記(7)式を用いて、音声推定信号s1(f、t)を算出する。
なお、上記(7)式において、γは後述の如く、抑圧性能及び音質が最適となるような任意の最適値が設定される。 In the above equation (7), γ is set to an arbitrary optimum value that optimizes the suppression performance and sound quality, as will be described later.
減算処理部9は、算出した音声推定信号s1(f、t)を離散フーリエ逆変換部11に対して出力する。
The
離散フーリエ逆変換部11は、入力された音声推定信号s1(f、t)に対してフーリエ逆変換を行い、フーリエ逆変換された音声推定信号s1(t)を算出する。そして、離散フーリエ逆変換部11は、フーリエ逆変換された音声推定信号s1(t)を音声推定信号出力部12に対して出力する。
The discrete Fourier
音声推定信号出力部12は、離散フーリエ逆変換部11から出力された、最終的な出力信号である音声推定信号s1(t)を、出力端子から出力する。
The speech estimation
ところで、従来の雑音抑制装置において、雑音信号と音声信号との間に相関関係がなく、雑音推定信号が雑音信号に完全に一致していると推定できる場合において、例えば、減算係数βに1を設定することができる。この場合、音声推定信号s1(f、t)は、下記(8)式により表現することができる。
しかしながら、雑音信号を正確に推定することは非常に困難であり、実際には誤差に起因して音声推定信号(出力信号)に雑音信号が混入し、若しくは、音声推定信号が削られることとなる。ここで、雑音推定信号を下記(9)式で表現した場合を想定する。
N1(f、t)=0.7×N1(f、t) (9)式
However, it is very difficult to accurately estimate the noise signal. In practice, the noise signal is mixed into the speech estimation signal (output signal) due to the error, or the speech estimation signal is deleted. . Here, it is assumed that the noise estimation signal is expressed by the following equation (9).
N1 (f, t) = 0.7 × N1 (f, t) (9) Formula
この場合、音声推定信号s1(f、t)は、下記(10)式により表現することができる。なお、この音声推定信号s1(f、t)には、実際に、振幅の変調以外に、推定処理による誤差が含有されている。
また、システム動作時に設定される減算係数βに応じて、音声推定信号s1(f、t)に対する抑圧性能(雑音を抑制する性能)及び音質は、例えば、下記表1のように変動することが分かる。
表1に示すように、減算係数βの最適値は、雑音推定信号の精度に依存していることが分かる。また、音声信号は非定常信号であり、雑音推定信号の精度は時々刻々と変化するため、それに伴い、減算係数βの最適値も変化することとなる。 As shown in Table 1, it can be seen that the optimum value of the subtraction coefficient β depends on the accuracy of the noise estimation signal. Also, since the audio signal is a non-stationary signal and the accuracy of the noise estimation signal changes from moment to moment, the optimum value of the subtraction coefficient β also changes accordingly.
そこで、本実施形態に係る雑音抑制装置10は、ソフトマスク関数H(f、t)を用いることにより、後述の如く、抑圧性能を向上させつつ、高音質を維持することができるような減算係数βを最適かつ自動的に設定することができる。
Therefore, the
図2は、本実施形態に係る雑音抑制装置による雑音抑制方法の処理フローの一例を示すフローチャートである。 FIG. 2 is a flowchart illustrating an example of a processing flow of a noise suppression method performed by the noise suppression apparatus according to the present embodiment.
図2に示すように、第1離散フーリエ変換部2は、入力された混合観測信号x(t)に対してフーリエ変換を行い、フーリエ変換された混合観測信号X(f、t)を算出する(フーリエ変換工程)(ステップS100)。
As shown in FIG. 2, the first discrete
また、第2離散フーリエ変換部6は、入力された雑音推定信号n1(t)に対して周知のフーリエ変換を行い、フーリエ変換された雑音推定信号N1(f、t)を算出する(フーリエ変換工程)(ステップS101)。 The second discrete Fourier transform unit 6 performs a well-known Fourier transform on the input noise estimation signal n1 (t), and calculates a Fourier-transformed noise estimation signal N1 (f, t) (Fourier transform). Process) (step S101).
次に、位相演算部3は、第1離散フーリエ変換部2からのフーリエ変換された混合観測信号X(f、t)に基づいて、位相angle(X(f、t))を算出する(ステップS102)。
Next, the
また、第1スペクトル演算部4は、第1離散フーリエ変換部2からのフーリエ変換された混合観測信号X(f、t)のパワースペクトル|X(f、t)|2を算出する(ステップS103)。
The first
さらに、第2スペクトル演算部7は、第2離散フーリエ変換部6からのフーリエ変換された雑音推定信号N1(f、t)のパワースペクトル|N1(f、t)|2を算出する(ステップS104)。
Further, the second
その後、マスク関数演算部8は、確信度Pf(t)及びPb(f)を夫々算出し(ステップS105)、算出された上記確信度Pf(t)及びPb(f)に基づいて、ソフトマスク関数H(f、t)を算出する(マスク関数演算工程)(ステップS106)。 Thereafter, the mask function calculation unit 8 calculates the certainty factors P f (t) and P b (f) (step S105), and based on the calculated certainty factors P f (t) and P b (f). Then, the soft mask function H (f, t) is calculated (mask function calculation step) (step S106).
減算処理部9は、マスク関数演算部8により算出されたソフトマスク関数H(f、t)を用いて、音声推定信号s1(f、t)を算出する(減算処理工程)(ステップS107)。そして、離散フーリエ逆変換部11は、音声推定信号s1(f、t)に対してフーリエ逆変換を行い(ステップS108)、音声推定信号出力部12は、フーリエ逆変換された音声推定信号s1(t)を出力端子から出力する(ステップS109)。
The
図3(a)及び(b)は、本実施形態に係る雑音抑制装置10と従来の雑音抑制装置との比較試験結果の一例を示している。なお、図3(a)は各雑音抑制装置による抑圧性能を示しており、位相angle(横軸)とSNR(S/N比)値(縦軸)との関係を示している。図3(b)は、各雑音抑制装置による音質を示しており、位相angle(横軸)とCD値(縦軸)との関係を示している。
3A and 3B show an example of a comparison test result between the
また、図3(a)及び(b)において、実線(1)は、雑音抑制が行われていない実際に観測される音声データである。実線(2)は、周知のBeamformer法を用いた従来の雑音抑制装置により、雑音抑制を行った際の音声データである。実線(3)は、減算係数β=2に設定した従来の雑音抑制装置により、雑音抑制を行った際の音声データである。実線(4)は、減算係数β=5に設定した従来の雑音抑制装置により、雑音抑制を行った際の音声データである。実線(5)は、本実施形態に係る雑音抑制装置10により、雑音抑制を行った際の音声データである。
In FIGS. 3A and 3B, a solid line (1) is actually observed voice data that is not subjected to noise suppression. A solid line (2) is voice data when noise suppression is performed by a conventional noise suppression apparatus using the well-known Beamformer method. A solid line (3) is voice data when noise suppression is performed by a conventional noise suppression device set to a subtraction coefficient β = 2. A solid line (4) is voice data when noise suppression is performed by a conventional noise suppression device set to a subtraction coefficient β = 5. A solid line (5) is voice data when noise suppression is performed by the
図3(a)に示すように、本実施形態に係る雑音抑制装置10により雑音抑制を行った際のデータ(実線(5))は、従来の雑音抑制装置によるデータ(実線(2)乃至(4))と比較して、全位相領域に渡って、SNR値が高く、良好に雑音抑制が行われている。さらに、図3(b)に示すように、本実施形態に係る雑音抑制装置10により雑音抑制を行った際のデータ(実線(5))は、全位相領域に渡って、CD値が比較的に高く維持されており、高音質に維持されている。すなわち、本実施形態に係る雑音抑制装置10は、従来の雑音抑制装置と比較して、高い抑圧性能を発揮しつつ、高音質を維持することができる。
As shown in FIG. 3A, data (solid line (5)) when noise suppression is performed by the
以上、本実施形態に係る雑音抑制装置10において、マスク関数演算部8は、雑音推定信号N1(f、t)のパワースペクトル|N1(f、t)|2と、混合観測信号X(f、t)のパワースペクトル|X(f、t)|2との比で表わされる確信度Pf(t)、Pb(f)を夫々算出する。そして、マスク関数演算部8は、算出された確信度Pf(t)及びPb(f)に基づいて、ソフトマスク関数H(f、t)を算出する。さらに、減算処理部9は、算出されたソフトマスク関数H(f、t)を用いて、音声推定信号s1(f、t)を算出する。
As described above, in the
これにより、高い抑圧性能を発揮しつつ、高音質を維持することができるような、減算係数βであるソフトマスク関数H(f,t)を最適かつ自動的に設定することができる。すなわち、雑音を効果的に抑制しつつ、高音質を維持することができる。 As a result, the soft mask function H (f, t), which is the subtraction coefficient β, can be optimally and automatically set so as to maintain high sound quality while exhibiting high suppression performance. That is, it is possible to maintain high sound quality while effectively suppressing noise.
なお、本実施形態に係る雑音抑制装置10は、例えば、音声を認識する音声認識システムに適用してもよく、音声信号及び雑音信号を含む混合観測信号から雑音信号を除去する任意のシステムに適用可能である。
Note that the
また、本発明を実施するための最良の形態について一実施形態を用いて説明したが、本発明はこうした一実施形態に何等限定されるものではなく、本発明の要旨を逸脱しない範囲内において、上述した実施形態に種々の変形及び置換を加えることができる。 Moreover, although the best mode for carrying out the present invention has been described using one embodiment, the present invention is not limited to such one embodiment, and within the scope not departing from the gist of the present invention, Various modifications and substitutions can be added to the above-described embodiments.
1 混合観測信号入力部
2 第1離散フーリエ変換部
3 位相演算部
4 第1スペクトル演算部
5 雑音推定信号入力部
6 第2離散フーリエ変換部
7 第2スペクトル演算部
8 マスク関数演算部
9 減算処理部
10 雑音抑制装置
11 離散フーリエ逆変換部
12 音声推定信号出力部
DESCRIPTION OF
Claims (6)
前記フーリエ変換部により前記フーリエ変換された前記混合観測信号と前記雑音推定信号とに基づいて、減算係数となるマスク関数を算出するマスク関数演算部と、
前記マスク関数演算部により算出された前記マスク関数を用いて、前記混合観測信号から前記雑音推定信号を減算することで、音声信号と推定される音声推定信号を算出する減算処理部と、を備える、ことを特徴とする雑音抑制装置。 A Fourier transform unit that performs Fourier transform on a mixed observation signal including a speech signal and a noise signal, and a noise estimation signal that is an estimated noise signal;
A mask function calculation unit that calculates a mask function to be a subtraction coefficient based on the mixed observation signal and the noise estimation signal Fourier-transformed by the Fourier transform unit;
A subtraction processing unit that calculates a speech estimation signal to be estimated as a speech signal by subtracting the noise estimation signal from the mixed observation signal using the mask function calculated by the mask function computation unit. A noise suppression device characterized by that.
前記マスク関数演算部は、前記フーリエ変換された雑音推定信号と混合観測信号との比で表わされる2つの確信度を含む前記マスク関数を算出する、ことを特徴とする雑音抑制装置。 The noise suppression device according to claim 1,
The said mask function calculating part calculates the said mask function containing two reliability represented by ratio of the said noise estimated signal and the mixed observation signal which were Fourier-transformed, The noise suppression apparatus characterized by the above-mentioned.
前記マスク関数演算部は、前記確信度Pf(t)及びPb(f)を、下記(1)式及び(2)式を用いて夫々算出する、ことを特徴とする雑音抑制装置。
X(f、t):フーリエ変換された前記混合観測信号 The noise suppression device according to claim 2,
The said mask function calculating part calculates the said reliability Pf (t) and Pb (f), respectively using the following (1) Formula and (2) Formula, The noise suppression apparatus characterized by the above-mentioned.
前記マスク関数演算部は、下記(3)式を用いて前記マスク関数H(f、t)を算出する、ことを特徴とする雑音抑制装置。
δm:最大減算係数 The noise suppression device according to claim 3,
The mask function computing unit calculates the mask function H (f, t) by using the following equation (3).
前記減算処理部により算出された前記音声推定信号に対してフーリエ逆変換を行うフーリエ逆変換部を更に備える、ことを特徴とする雑音抑制装置。 The noise suppression device according to claim 2,
A noise suppression apparatus, further comprising: a Fourier inverse transform unit that performs an inverse Fourier transform on the speech estimation signal calculated by the subtraction processing unit.
前記フーリエ変換工程で前記フーリエ変換された前記混合観測信号と前記雑音推定信号とに基づいて、減算係数となるマスク関数を算出するマスク関数演算工程と、
前記マスク関数演算工程で算出された前記マスク関数を用いて、前記混合観測信号から前記雑音推定信号を減算することで、音声信号と推定される音声推定信号を算出する減算処理工程と、を含む、ことを特徴とする雑音抑制方法。 A Fourier transform step of performing a Fourier transform on the mixed observation signal including the audio signal and the noise signal, and the noise estimation signal estimated to be a noise signal;
A mask function calculation step of calculating a mask function to be a subtraction coefficient based on the mixed observation signal and the noise estimation signal that are Fourier-transformed in the Fourier transformation step;
A subtraction processing step of calculating a speech estimation signal to be estimated as a speech signal by subtracting the noise estimation signal from the mixed observation signal using the mask function calculated in the mask function computation step. The noise suppression method characterized by the above-mentioned.
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008232241A JP2010066478A (en) | 2008-09-10 | 2008-09-10 | Noise suppressing device and noise suppressing method |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2008232241A JP2010066478A (en) | 2008-09-10 | 2008-09-10 | Noise suppressing device and noise suppressing method |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2010066478A true JP2010066478A (en) | 2010-03-25 |
Family
ID=42192122
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2008232241A Pending JP2010066478A (en) | 2008-09-10 | 2008-09-10 | Noise suppressing device and noise suppressing method |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2010066478A (en) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012014451A1 (en) * | 2010-07-26 | 2012-02-02 | パナソニック株式会社 | Multi-input noise suppresion device, multi-input noise suppression method, program, and integrated circuit |
WO2019017403A1 (en) * | 2017-07-19 | 2019-01-24 | 日本電信電話株式会社 | Mask calculating device, cluster-weight learning device, mask-calculating neural-network learning device, mask calculating method, cluster-weight learning method, and mask-calculating neural-network learning method |
CN111427091A (en) * | 2020-05-06 | 2020-07-17 | 芯元(浙江)科技有限公司 | Seismic exploration signal random noise suppression method by squeezing short-time Fourier transform |
-
2008
- 2008-09-10 JP JP2008232241A patent/JP2010066478A/en active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2012014451A1 (en) * | 2010-07-26 | 2012-02-02 | パナソニック株式会社 | Multi-input noise suppresion device, multi-input noise suppression method, program, and integrated circuit |
US8824700B2 (en) | 2010-07-26 | 2014-09-02 | Panasonic Corporation | Multi-input noise suppression device, multi-input noise suppression method, program thereof, and integrated circuit thereof |
WO2019017403A1 (en) * | 2017-07-19 | 2019-01-24 | 日本電信電話株式会社 | Mask calculating device, cluster-weight learning device, mask-calculating neural-network learning device, mask calculating method, cluster-weight learning method, and mask-calculating neural-network learning method |
CN111427091A (en) * | 2020-05-06 | 2020-07-17 | 芯元(浙江)科技有限公司 | Seismic exploration signal random noise suppression method by squeezing short-time Fourier transform |
CN111427091B (en) * | 2020-05-06 | 2023-05-02 | 芯元(浙江)科技有限公司 | Random noise suppression method for seismic exploration signals by extruding short-time Fourier transform |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8073147B2 (en) | Dereverberation method, apparatus, and program for dereverberation | |
TWI398855B (en) | Multiple microphone voice activity detector | |
JP5183828B2 (en) | Noise suppressor | |
US9613631B2 (en) | Noise suppression system, method and program | |
JP4863713B2 (en) | Noise suppression device, noise suppression method, and computer program | |
WO2005124739A1 (en) | Noise suppression device and noise suppression method | |
EP3276621B1 (en) | Noise suppression device and noise suppressing method | |
EP2600344A1 (en) | Multi-input noise suppresion device, multi-input noise suppression method, program, and integrated circuit | |
JP2008076975A (en) | Sound signal correcting method, sound signal correcting apparatus and computer program | |
JP2009075536A (en) | Steady rate calculation device, noise level estimation device, noise suppressing device, and method, program and recording medium thereof | |
WO2010110071A1 (en) | Signal processing method, apparatus, and program | |
JP4827661B2 (en) | Signal processing method and apparatus | |
EP2579255B1 (en) | Audio signal processing | |
JP2021522550A (en) | Background noise estimation using gap reliability | |
US20020128830A1 (en) | Method and apparatus for suppressing noise components contained in speech signal | |
US9418677B2 (en) | Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program | |
JP2010066478A (en) | Noise suppressing device and noise suppressing method | |
JP2005258158A (en) | Noise removing device | |
JP6182862B2 (en) | Signal processing apparatus, signal processing method, and signal processing program | |
JP2006201622A (en) | Device and method for suppressing band-division type noise | |
JP2010204392A (en) | Noise suppression method, device and program | |
WO2011055834A1 (en) | Signal processing method, information processor, and signal processing program | |
US10388264B2 (en) | Audio signal processing apparatus, audio signal processing method, and audio signal processing program | |
JP2010156742A (en) | Signal processing device and method thereof | |
JP2011100029A (en) | Signal processing method, information processor, and signal processing program |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20100326 |