JP3309895B2 - Noise reduction method - Google Patents

Noise reduction method

Info

Publication number
JP3309895B2
JP3309895B2 JP06854896A JP6854896A JP3309895B2 JP 3309895 B2 JP3309895 B2 JP 3309895B2 JP 06854896 A JP06854896 A JP 06854896A JP 6854896 A JP6854896 A JP 6854896A JP 3309895 B2 JP3309895 B2 JP 3309895B2
Authority
JP
Japan
Prior art keywords
band
noise
signal
power
loss value
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Lifetime
Application number
JP06854896A
Other languages
Japanese (ja)
Other versions
JPH09258792A (en
Inventor
潤子 佐々木
陽一 羽田
昭二 牧野
豊 金田
順治 小島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP06854896A priority Critical patent/JP3309895B2/en
Publication of JPH09258792A publication Critical patent/JPH09258792A/en
Application granted granted Critical
Publication of JP3309895B2 publication Critical patent/JP3309895B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Landscapes

  • Noise Elimination (AREA)
  • Transmitters (AREA)

Description

【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【産業上の利用分野】本発明は、音声会議装置、TV会
議装置等の音声/音響装置等において、目的となる信号
と不要な雑音等の信号が混在する入力信号から、雑音を
低減した信号を出力する雑音低減方法に関するものであ
る。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a voice / audio device such as a voice conference device, a TV conference device, etc., which is a signal obtained by reducing noise from an input signal in which a signal of interest and a signal such as unnecessary noise are mixed. it relates to noise reduction how to output.

【0002】[0002]

【従来の技術】音声会議、TV会議等の拡声通話系で
は、マイクロホンで受音し、相手側に送出される送話信
号に、目的となる音声以外の周囲雑音が混入すると、音
声の明瞭性が損なわれ通話品質が著しく劣化する。この
ため、送話信号に含まれる目的音声以外の周囲雑音を低
減することが強く求められている。
2. Description of the Related Art In a voice communication system such as a voice conference or a TV conference, if ambient noise other than the target voice is mixed in a transmission signal received by a microphone and transmitted to a partner, the clarity of the voice is increased. And the call quality is significantly degraded. For this reason, there is a strong demand for reducing ambient noise other than the target voice included in the transmission signal.

【0003】雑音低減方法とは、目的となる音声信号と
不要な周囲雑音等の信号が混在する入力信号から、雑音
を低減した信号を出力する技術である。
[0003] The noise reduction method is a technique of outputting a noise-reduced signal from an input signal in which a target voice signal and a signal such as unnecessary ambient noise are mixed.

【0004】図6は、収音システムを示すもので、これ
を用いて従来の雑音低減方法および装置を説明する。1
1はマイクロホン、12はこのマイクロホン11から離
れた位置にある発声者、13はこの発声者12の発声し
た目的とする音声信号、14は空調音等の不要な周囲雑
音、15は前記マイクロホン11において受音された雑
音低減装置への入力信号、16は雑音低減装置、17は
前記雑音低減装置16の出力信号を示す。本明細書にお
いては、信号の時間表現は離散時間を表す整数値nを用
いて、例えばX(n) と表わす。
FIG. 6 shows a sound collection system, which will be used to explain a conventional noise reduction method and apparatus. 1
1 is a microphone, 12 is a speaker at a position distant from the microphone 11, 13 is a target audio signal uttered by the speaker 12, 14 is unnecessary ambient noise such as air-conditioning sound, and 15 is the microphone 11 16 shows a received input signal to the noise reduction device, 16 shows a noise reduction device, and 17 shows an output signal of the noise reduction device 16. In this specification, the time expression of a signal is represented by, for example, X (n) using an integer value n representing a discrete time.

【0005】今、音声信号13をS(n) 、周囲雑音14
をN(n) 、雑音低減装置16への入力信号15をX(n)
、雑音低減装置16の出力信号17をY(n) とする
と、雑音低減装置16への入力信号X(n) には、目的と
なる音声信号S(n) 以外に周囲雑音N(n) が混入してい
る。すなわち
[0005] Now, an audio signal 13 is converted to S (n) and ambient noise 14.
Is N (n), and the input signal 15 to the noise reduction device 16 is X (n).
If the output signal 17 of the noise reduction device 16 is Y (n), the input signal X (n) to the noise reduction device 16 includes ambient noise N (n) in addition to the target audio signal S (n). It is mixed. Ie

【0006】[0006]

【数1】 と表わされる。この時、入力信号X(n) 中の周囲雑音N
(n) を低減し、目的となる音声信号S(n) に近い信号を
出力信号Y(n) として取り出す装置を雑音低減装置16
と呼ぶ。
(Equation 1) It is expressed as At this time, the ambient noise N in the input signal X (n)
(n), and extracts a signal close to the target audio signal S (n) as an output signal Y (n).
Call.

【0007】図7は、スペクトラムサブトラクション法
と呼ばれ、音声認識の分野で従来使用されている方法を
示すブロック図で、これを用いて従来の雑音低減方法を
説明する。図7では図6と同一の要素には共通の記号を
用いた。21はA/D変換部、22は周波数帯域分割
部、23は雑音判別部、24は入力信号パワー計算部、
25は入力信号位相計算部、26は雑音パワー計算部、
27は減算部、28は時間領域変換部、29はD/A変
換部を示す。
FIG. 7 is a block diagram showing a method called a spectrum subtraction method, which is conventionally used in the field of speech recognition. The conventional noise reduction method will be described with reference to FIG. In FIG. 7, common symbols are used for the same elements as those in FIG. 21 is an A / D converter, 22 is a frequency band divider, 23 is a noise discriminator, 24 is an input signal power calculator,
25 is an input signal phase calculator, 26 is a noise power calculator,
27 denotes a subtraction unit, 28 denotes a time domain conversion unit, and 29 denotes a D / A conversion unit.

【0008】まず、マイクロホン11により受音され
た、目的信号と不要な雑音等の混入する入力信号15を
A/D変換部21においてデジタル化し、周波数帯域分
割部22と雑音判別部23に転送する。周波数帯域分割
部22では、転送された信号が複数の周波数帯域に分割
される。周波数帯域への分割は、例えば離散的フーリエ
変換等を用いて行う。ここで、帯域分割された信号は一
般に複素数であるが、分割方法によっては実数となる場
合もある。ここでは、一般的に複素数を仮定して議論す
るが、実数の場合も同じ議論が可能である。周波数帯域
に分割されたk番目の周波数帯域の信号を
First, an A / D converter 21 digitizes an input signal 15 mixed with a target signal and unnecessary noise received by a microphone 11 and transfers the digitized signal to a frequency band dividing unit 22 and a noise discriminating unit 23. . In the frequency band dividing unit 22, the transferred signal is divided into a plurality of frequency bands. Division into frequency bands is performed using, for example, a discrete Fourier transform or the like. Here, the band-divided signal is generally a complex number, but may be a real number depending on the division method. Here, discussion is generally made assuming a complex number, but the same discussion can be made for a real number. The signal of the k-th frequency band divided into frequency bands is

【0009】[0009]

【数2】 とすると、Xk(n)は、入力信号パワー計算部24,入力
信号位相計算部25,雑音パワー計算部26に転送され
る。入力信号パワー計算部24では、入力信号のパワー
レベル
(Equation 2) Then, X k (n) is transferred to the input signal power calculator 24, the input signal phase calculator 25, and the noise power calculator 26. The input signal power calculator 24 calculates the power level of the input signal.

【0010】[0010]

【数3】 が入力信号位相計算部25では位相(Equation 3) Is the phase in the input signal phase calculator 25.

【0011】[0011]

【数4】 が計算される。その後PX,k(n)は減算部27に転送さ
れ、Φk(n)は時間領域変換部28に転送される。一方、
雑音判別部23ではA/D変換部21から転送されてき
たX(n) に対して、まずパワーレベル
(Equation 4) Is calculated. Thereafter, P X, k (n) is transferred to the subtraction unit 27, and Φ k (n) is transferred to the time domain transformation unit 28. on the other hand,
The noise discriminating unit 23 first determines the power level of X (n) transferred from the A / D converting unit 21.

【0012】[0012]

【数5】 が計算される。次に例えば予め決められたしきい値Pth
に対し、
(Equation 5) Is calculated. Next, for example, a predetermined threshold value P th
Against

【0013】[0013]

【数6】 の判定が行われ、条件式を満たした場合には、雑音であ
ると判別する。雑音パワー計算部26では、雑音判別部
23において入力信号が雑音であると判定された時の
み、雑音のパワーレベルを
(Equation 6) Is determined, and if the conditional expression is satisfied, it is determined that the noise is present. The noise power calculation unit 26 determines the power level of the noise only when the noise discrimination unit 23 determines that the input signal is noise.

【0014】[0014]

【数7】 として計算し、その時間平均PavN,k(n)を減算部27
に転送する。時間平均は、例えば
(Equation 7) And the time average Pav N, k (n) is subtracted by the subtractor 27.
Transfer to The time average is, for example,

【0015】[0015]

【数8】 と計算される。ここでγm は例えば、(Equation 8) Is calculated. Where γ m is, for example,

【0016】[0016]

【数9】 と表わされるような指数重みづけの係数で(γ<1)、
Aは
(Equation 9) Is an exponentially weighted coefficient expressed as (γ <1),
A is

【0017】[0017]

【数10】 となる正規化のための定数である。減算部27では、入
力信号パワー計算部24および雑音パワー計算部26か
ら転送されてきたPX,k(n),PavN,k(n)を用いて
(Equation 10) Is a constant for normalization. The subtraction unit 27 uses P X, k (n) and Pav N, k (n) transferred from the input signal power calculation unit 24 and the noise power calculation unit 26.

【0018】[0018]

【数11】 を計算する。PY,k(n)は時間領域変換部28に転送さ
れ、入力信号位相計算部25から送られてきたΦk(n)を
用いて、
[Equation 11] Is calculated. P Y, k (n) is transferred to the time domain transforming unit 28 and using Φ k (n) sent from the input signal phase calculating unit 25,

【0019】[0019]

【数12】 に変換され、全帯域信号に合成される。この結果を、D
/A変換部29でアナログ信号にして雑音を低減した出
力信号17のY(n) を出力する。
(Equation 12) And combined into a full-band signal. This result is
The A / A converter 29 outputs Y (n) of the output signal 17 in which noise has been reduced into an analog signal.

【0020】この方法は、目的信号となる音声信号と不
要な雑音等の混入する入力信号15に含まれる目的音の
パワーをPS 、不要音のパワーをPN とした時、
In this method, when the power of the target sound included in the input signal 15 in which the audio signal serving as the target signal and unnecessary noise are mixed is P S and the power of the unnecessary sound is P N ,

【0021】[0021]

【数13】 で定義されるS/N比が25dB程度以上ある場合に
は、効果的に雑音を低減できる。しかし、S/N比が2
0dB程度以下の場合には、雑音は低減されるが、それ
に伴い音声信号の歪みが生じる。これは、このスペクト
ラムサブトラクション法が帯域に分割された信号の段階
で引き算という非線形な処理を施していることに起因す
る。
(Equation 13) When the S / N ratio defined by the above is about 25 dB or more, noise can be effectively reduced. However, the S / N ratio is 2
In the case of about 0 dB or less, the noise is reduced, but the sound signal is distorted accordingly. This is because the spectrum subtraction method performs a non-linear process of subtraction at the stage of a signal divided into bands.

【0022】一方、音声の歪みを少なくするために、計
測された雑音レベルよりも低い値を用いて減算した場
合、例えば雑音パワー計算部26において推定されたP
avN,k(n)に対して
On the other hand, when the subtraction is performed using a value lower than the measured noise level in order to reduce the distortion of the voice, for example, the P estimated by the noise power calculator 26 is used.
for av N, k (n)

【0023】[0023]

【数14】 を行った後PavN,k(n)を減算部27に転送し減算を行
った場合には雑音を低減しきれず、雑音低減装置16の
出力信号17のY(n) の消し残された雑音が時間的に変
化するために聴感上好ましくない音をたてる。すなわ
ち、スペクトラムサブトラクション法では、処理後の出
力信号が減算量によらず、聴感上好ましくなくなってし
まうという問題がある。このため、音声会議装置・TV
会議装置等、受聴を目的とし音質が重要である収音にお
いては、この方法をそのまま適用することはできない。
[Equation 14] Is performed, the Pav N, k (n) is transferred to the subtraction unit 27, and when the subtraction is performed, the noise cannot be completely reduced, and the remaining noise of Y (n) of the output signal 17 of the noise reduction device 16 is not removed. Produces an unpleasant sound due to temporal changes. That is, in the spectrum subtraction method, there is a problem that the output signal after processing becomes undesirably audible regardless of the subtraction amount. For this reason, audio conference devices and TVs
This method cannot be directly applied to sound collection such as a conference apparatus in which sound quality is important for listening.

【0024】[0024]

【発明が解決しようとする課題】周囲雑音が混入した入
力信号の雑音を低減する方法として雑音の振幅分を音声
信号から減算する従来の方法では、減算量が大きいと音
声の歪みが大きくなり、減算量が小さいと引き残された
雑音が時間的に変化するために聴感上好ましくない音を
たてるという問題があった。
As a method for reducing the noise of an input signal mixed with ambient noise, a conventional method of subtracting the amplitude of noise from a speech signal results in a large amount of subtraction resulting in large distortion of speech. If the amount of subtraction is small, there is a problem in that the noise left undesirably sounds due to the temporal change of the remaining noise.

【0025】本発明の目的は、聴感上の音質の劣化が少
ない雑音低減方法を提供することである。
[0025] It is an object of the present invention is to provide a noise reduction how little deterioration of sound quality of audibility.

【0026】[0026]

【課題を解決するための手段】本発明にかかる雑音低減
法は、目的となる音声信号と周囲雑音などの混在した
マイクロホンでの受音信号を複数の帯域に分割し、各々
の帯域別の信号に対し雑音パワーを推定し、推定された
雑音パワーと実際に入力されてきた入力信号パワーとを
比較して、音声信号と雑音信号の比率を推定し、これに
基づいて入力信号に損失を与えることによって、雑音を
抑圧する手法である。
Noise reduction <br/> how according to the present invention, in order to solve the problems] divides the received sound signals in a mixed microphone such as voice signals and ambient noise are the object into a plurality of bands, each Estimate the noise power for the signal of each band, compare the estimated noise power with the input signal power actually input, estimate the ratio of the voice signal and the noise signal, and based on this, This is a technique for suppressing noise by giving a loss to a signal.

【0027】損失値は、音声信号と雑音信号の比率の推
定値に基づいて値を決定した後、帯域間での平均化およ
び過去の損失値との間での平均化を行ったものを用い
る。
As the loss value, a value determined based on the estimated value of the ratio of the voice signal to the noise signal, and after averaging between the bands and averaging with the past loss value is used. .

【0028】また、雑音パワーの推定には、入力信号の
パワーレベル分布のヒストグラムを用いる。音声信号
は、パワーレベルの変動が大きく、分布にばらつきがあ
るが、定常雑音は、パワーレベル値がほぼ一定であるた
め、パワーレベル分布のヒストグラムをとると、雑音平
均レベル位置に強いピークが立つ。本発明では、この性
質を用いて、ヒストグラムのピーク区間を検出し雑音の
パワーを推定する。
The noise power is estimated using a histogram of the power level distribution of the input signal. The power level of an audio signal greatly fluctuates and its distribution varies. However, since the power level value of stationary noise is almost constant, a strong peak appears at the noise average level position when a histogram of the power level distribution is taken. . In the present invention, using this property, the peak section of the histogram is detected and the power of the noise is estimated.

【0029】[0029]

【作用】本発明は、次のような特徴をもつ。まず、帯域
に分割して処理することによって、一部の帯域で損失挿
入の判別誤りが起こっても全体的な影響が小さい。ま
た、減算という非線形処理を用いた従来のスペクトラム
サブトラクション法に対し、損失の挿入という線形が処
理を与えるため、信号に対する歪みが少ない。また、音
声の立ち上り部分や立ち下がり部分等では、音声のパワ
ーが短時間に激しく変動するため、音声信号と雑音信号
の比率も大きく変化し、それに伴い平均前の損失値は激
しく変わる。その結果、この損失値を用いると処理後の
信号に不連続感が生じる。本発明では、損失値を帯域お
よび時間で平均化して与えることで、この不連続感を解
消している。また、特に、雑音の混入寄与率の計算に必
要である雑音パワー推定には、ヒストグラムを用いるこ
とで、音声と雑音の混在する区間でも雑音パワーの推定
が可能である。
The present invention has the following features. First, by dividing the band into bands and processing, even if a loss insertion error occurs in some bands, the overall effect is small. In addition, since the linearity of insertion of loss gives processing to the conventional spectrum subtraction method using non-linear processing called subtraction, distortion to a signal is small. In addition, in the rising portion and the falling portion of the voice, the power of the voice fluctuates drastically in a short time, so that the ratio between the voice signal and the noise signal greatly changes, and accordingly, the loss value before averaging changes sharply. As a result, if this loss value is used, a sense of discontinuity occurs in the processed signal. In the present invention, the discontinuity is eliminated by averaging the loss value with the band and time. Further, in particular, by using a histogram for noise power estimation required for calculating the noise contribution ratio, noise power can be estimated even in a section where speech and noise are mixed.

【0030】[0030]

【実施例】図1は、本発明実施例の構成を示すブロッ
ク図であり、これを用いて、本発明の処理手順を説明す
る。図6,図7と同じものについては共通の記号を用い
た。図1において、31は雑音パワー推定部、32は損
失値計算部、33は損失挿入部を示す。
DETAILED DESCRIPTION FIG. 1 is a block diagram showing the configuration of an embodiment of the present invention, and used to explain the processing procedure of the present invention. 6 and 7, the same symbols are used. In FIG. 1, reference numeral 31 denotes a noise power estimator, 32 denotes a loss value calculator, and 33 denotes a loss inserter.

【0031】その動作について説明する。まず、マイク
ロホン11により受音された、目的信号と不要な雑音等
の混入する入力信号15をA/D変換部21においてデ
ジタル化し、周波数帯域分割部22に転送する。周波数
帯域分割部22では、転送された信号が周波数帯域に分
割される。分割された各帯域信号は、入力信号パワー計
算部24,雑音パワー推定部31,損失挿入部33に転
送される。以降、k番目の帯域信号をXk(n)として、X
k(n)に対する処理の流れを説明する。
The operation will be described. First, an input signal 15 mixed with a target signal and unnecessary noise received by the microphone 11 is digitized in the A / D converter 21 and transferred to the frequency band divider 22. In the frequency band dividing section 22, the transferred signal is divided into frequency bands. Each of the divided band signals is transferred to an input signal power calculation unit 24, a noise power estimation unit 31, and a loss insertion unit 33. Hereafter, let the k-th band signal be X k (n),
The flow of processing for k (n) will be described.

【0032】入力信号パワー計算部24では、転送され
てきた帯域信号Xk(n)のパワーレベル
The input signal power calculator 24 calculates the power level of the transferred band signal X k (n).

【0033】[0033]

【数15】 を計算する。次にパワーレベルPX,k(n)を予め定められ
た時間について平均し、Pavx,k(n)として損失値計算
部32に転送する。時間平均は、例えば
(Equation 15) Is calculated. Next, the power level P X, k (n) is averaged for a predetermined time, and transferred to the loss value calculation unit 32 as Pav x, k (n). The time average is, for example,

【0034】[0034]

【数16】 と計算される。ここでγm は例えば、(Equation 16) Is calculated. Where γ m is, for example,

【0035】[0035]

【数17】 と表わされるような指数重みづけの係数で(γ<1)、
Aは
[Equation 17] Is an exponentially weighted coefficient expressed as (γ <1),
A is

【0036】[0036]

【数18】 となる正規化のための定数である。この平均時間mが短
すぎると音声・雑音の判別の時間的な変動が大きくな
る。また長すぎると、時間的な変動に対する追従性能が
悪くなる。平均時間としては、例えば0.5〜1mse
cをとる。
(Equation 18) Is a constant for normalization. If the average time m is too short, the temporal variation in discrimination between speech and noise increases. On the other hand, if the length is too long, the performance of following a temporal change is deteriorated. As an average time, for example, 0.5 to 1 mse
Take c.

【0037】雑音パワー推定部31では転送されてきた
帯域信号Xk(n)を用いて雑音パワーPavN,k(n)の推定
が行われる。雑音パワー推定部31については、処理の
流れ図を図2に示した。詳しい処理の説明はこの図を用
いて行う。なお、図2中のS21〜S23は各ステップ
を示す。
The noise power estimator 31 estimates the noise power Pav N, k (n) using the transferred band signal X k (n). FIG. 2 shows a flowchart of the processing performed by the noise power estimating unit 31. Detailed description of the processing will be made using this figure. S21 to S23 in FIG. 2 indicate each step.

【0038】まずステップS21において、転送されて
きたXk(n)のパワーレベルPX,k(n)を(12)式の計算
式を用いて計算する。次にパワーレベルPX,k(n)を予め
決められた時間について平均し、Pav´x,k(n)とす
る。Pav´x,k(n)の平均時間m´は、入力信号パワー
計算部24におけるPavx,k(n)の平均時間mに比べ
て、長くすることが望ましいが、平均時間が長すぎると
雑音の変動に追従しなくなる。例えば数msecをと
る。次にステップS22でPav´x,k(n)のレベル分布
のヒストグラムをとる。つまりPav´x,k(n)が属する
パワー区間の数を1加算、すなわち
First, in step S21, the power level P X, k (n) of the transferred X k (n) is calculated using the equation (12). Next, the power levels P X, k (n) are averaged for a predetermined time to obtain Pav ′ x, k (n). Pav' x, the average time m'of k (n) is, Pav x in the input signal power calculation unit 24, as compared to the average time m of k (n), it is desirable to lengthen the average time is too long No longer follows noise fluctuations. For example, it takes several msec. Next, in step S22, a histogram of the level distribution of Pav ' x, k (n) is obtained . That is , the number of power sections to which Pav ' x, k (n) belongs is added by 1, that is,

【0039】[0039]

【数19】 を行う。int(*)は小数点以下を切り捨て整数化す
ることを示す。更にステップS23でヒストグラムh
k(i)のピーク区間が検出され記憶される。すなわち前後
の値に対して
[Equation 19] I do. int (*) indicates that the value after the decimal point is truncated to an integer. Further, in step S23, the histogram h
The peak section of k (i) is detected and stored. That is, for the value before and after

【0040】[0040]

【数20】 となるiを求める。このiの中で最も小さなiを雑音パ
ワーPavN,k(n)とする。この雑音パワーPavN,k(n)
は損失値計算部32に転送される。
(Equation 20) Is obtained. The smallest i among these i is assumed to be noise power Pav N, k (n). This noise power Pav N, k (n)
Is transferred to the loss value calculator 32.

【0041】損失値計算部32では、入力信号パワー計
算部24で計算されたPavx,k(n)および雑音パワー推
定部31で推定された雑音パワーPavN,k(n)を用いて
損失値が計算される。損失値計算部32については、処
理の流れ図を図3に示した。詳しい処理の説明はこの図
を用いて行う。
The loss value calculator 32 uses the Pav x, k (n) calculated by the input signal power calculator 24 and the noise power Pav N, k (n) estimated by the noise power estimator 31 to perform a loss. The value is calculated. FIG. 3 shows a flow chart of the processing for the loss value calculation unit 32. Detailed description of the processing will be made using this figure.

【0042】まず、ステップS31において雑音パワー
PavN,k(n)に予め定められたマージンPthを加えた値
をしきい値PN ',k(n) とする。すなわち
[0042] First, the noise power Pav N, k a value obtained by adding a predetermined margin P th to (n) threshold P N ', and k (n) in step S31. Ie

【0043】[0043]

【数21】 とする。ここで、マージンPthが小さすぎると効果が小
さくなり、大きすぎると不連続感が出る。例えば、マー
ジンPthとしては、5×PavN,k(n)をとる。次に、ス
テップS32においてPavX,k(n)とPav´N,k(n)の
比較を行い、PavX,k(n)がPav´N,k(n)より小さい
場合には損失値を1より小さく、等しいかあるいは大き
い場合には損失値を1に設定する。
(Equation 21) And Here, if the margin P th is too small, the effect will be small, and if it is too large, a sense of discontinuity will appear. For example, 5 × Pav N, k (n) is taken as the margin P th . Next, in step S32, Pav X, k (n) is compared with Pav ′ N, k (n). If Pav X, k (n) is smaller than Pav ′ N, k (n), the loss value is calculated. Is smaller than 1 and the loss value is set to 1 if it is equal to or greater than 1.

【0044】[0044]

【数22】 その後ステップS33において、ステップS32で決定
した損失値Lk(n)に対して、近隣の帯域の損失値、例え
ばLk-2(n),Lk-1(n)……,Lk+2(n)で平均化し、各帯
域間の差を少なくする。また、過去の損失値Lk(n-1),
k(n-2)……を用いて、例えば30msec程度の時間
で損失量を平均化する。この平均化の時間が短いと、損
失値が時間的に変動して不連続感が生じる。平均化によ
って得られた値を新たにLk(n)とし、損失挿入部33に
転送する。
(Equation 22) Then, in step S33, with respect to the loss value L k determined in step S32 (n), the loss values of neighboring bands, L k-2 (n), L k-1 (n) ......, L k + Averaging by 2 (n) to reduce the difference between each band. Also, the past loss values L k (n-1),
Using L k (n−2)..., The amount of loss is averaged in a time of, for example, about 30 msec. If the averaging time is short, the loss value fluctuates with time, causing a sense of discontinuity. The value obtained by the averaging is newly set as L k (n) and transferred to the loss insertion unit 33.

【0045】損失挿入部33では、損失値計算部32に
おいて計算された損失値Lk(n) を用いて損失制御を行
う。すなわち周波数帯域分割部22より転送されてきた
帯域信号Xk(n)に対して、
The loss insertion unit 33 performs loss control using the loss value L k (n) calculated by the loss value calculation unit 32. That is, for the band signal X k (n) transferred from the frequency band division unit 22,

【0046】[0046]

【数23】 を行い雑音を低減した帯域出力Yk(n)を出力する。帯域
出力Yk(n)は時間領域変換部28に転送され、時間領域
に変換される。この結果を、D/A変換部29でアナロ
グ信号にして雑音を低減したY(n) の出力信号17を出
力する。
(Equation 23) And outputs a band output Y k (n) with reduced noise. The band output Y k (n) is transferred to the time domain converter 28, where it is converted to the time domain. The result is converted into an analog signal by the D / A converter 29, and the Y (n) output signal 17 in which noise is reduced is output.

【0047】なお、上記の説明では、図1の各部はハー
ド的に示したが、これらはコンピュータプログラムによ
りソフト的に構成できる。したがって、請求項の記載に
おいては部にかえて手段で表現してある。
In the above description, each section in FIG. 1 is shown as hardware, but these can be configured as software by a computer program. Therefore, in the description of claims, parts are expressed by means instead of parts.

【0048】次に、本発明の雑音低減方法について説明
する。基本的には図1の動作手順と同じであるが、まと
めて示すと図4の流れ図のようになる。この図でS41
〜S47は各ステップを示す。
Next, the noise reduction method of the present invention will be described. Basically, the operation procedure is the same as that of FIG. 1, but when collectively shown, it is as shown in the flowchart of FIG. In this figure, S41
S47 indicate each step.

【0049】音声と雑音の混在した入力信号X(n)が入
力されると、ステップS41の過程において、音声雑音
混在信号を複数の帯域に分割する。分割された複数の周
波数帯域の各帯域信号Xk(n)に対してステップS42の
過程で入力信号の平均パワーレベルPavx,k(n)が計算
される。これと並行してステップS43の過程で前記各
帯域信号Xk(n)の雑音パワーPavN,k(n)の推定が行わ
れる。平均パワーレベルPavx,k(n)と雑音パワーPa
N,k(n)とから帯域信号Xk(n)中に占める各帯域毎の雑
音の比率をステップS44の過程で求める。次いで、ス
テップS45の過程において、この比率に基づいて帯域
毎の損失値を決定する。次に、ステップS46の過程に
おいて分割された複数の周波数帯域の各帯域信号に対し
て各帯域毎に決定された損失値を挿入し、各帯域毎の雑
音を低減した帯域出力信号とする。次いで、ステップS
47の過程において、雑音が低減された帯域出力信号を
時間領域に変換し全帯域信号とし、雑音の低減したアナ
ログ信号を得る。
When an input signal X (n) in which speech and noise are mixed is input, the speech and noise mixed signal is divided into a plurality of bands in the process of step S41. In step S42, an average power level Pav x, k (n) of the input signal is calculated for each band signal X k (n) of the plurality of divided frequency bands. Wherein to the process of step S43 in parallel with this noise power Pav N of each band signals X k (n), the estimation of k (n) is performed. Average power level Pav x, k (n) and noise power Pa
From v N, k (n), the ratio of noise in each band in the band signal X k (n) is determined in the process of step S44. Next, in the process of step S45, a loss value for each band is determined based on the ratio. Next, a loss value determined for each band is inserted into each band signal of the plurality of frequency bands divided in the process of step S46, to obtain a band output signal in which noise for each band is reduced. Then, step S
In the process of 47, the noise-reduced band output signal is converted into the time domain to be a full-band signal, and an analog signal with reduced noise is obtained.

【0050】本発明の有効性を、実際のTV会議システ
ムの状況下で収音された女性音声(16kHzサンプリ
ング)に対して計算機シミュレーションで検証した。騒
音の加わった音声および従来技術で示したスペクトラム
サブトラクションと本発明による騒音低減処理を行った
データのスペクトログラムを図5に示す。スペクトラム
サブトラクションと本発明は両者とも250Hz幅の3
2の帯域信号に分割してから処理を行った。
The effectiveness of the present invention was verified by computer simulation on a female voice (16 kHz sampling) collected under the conditions of an actual TV conference system. FIG. 5 shows a spectrogram of the noise-added voice, the spectrum subtraction shown in the prior art, and the data subjected to the noise reduction processing according to the present invention. The spectrum subtraction and the present invention are both 250 Hz width 3
The processing was performed after the signal was divided into two band signals.

【0051】図5(a)は、騒音の加わった音声で、5
00Hz以下の黒い帯状の部分と全体的に広がったグレ
ーの部分が、主に空調音からなる周囲雑音である。雑音
によって音声がかき消されている様子がわかる。
FIG. 5A shows a voice with noise.
The black band below 00 Hz and the gray part which spreads out as a whole are the ambient noise mainly composed of the air-conditioning sound. It can be seen that the voice is erased by the noise.

【0052】図5(b)は、スペクトラムサブトラクシ
ョンで処理を行ったものである。全体的に雑音が除去さ
れ音声との差が明確に現れている。ただし、消し切って
いない雑音が薄くたて縞になって現われている。この周
波数成分が時間的に変化し、これがキュルキュルとした
耳障りな音の原因となる。また音声部分では、減算のし
過ぎによって振幅の小さな部分が消え劣化が認められ
る。
FIG. 5B shows the result of the processing performed by the spectrum subtraction. The noise is removed as a whole, and the difference from the voice is clearly shown. However, the noise that has not been completely eliminated appears as a thin stripe. This frequency component changes with time, which causes a curly and unpleasant sound. In the audio part, a part having a small amplitude disappears due to excessive subtraction, and deterioration is recognized.

【0053】図5(c)は、本発明により損失制御を行
ったものである。スペクトラムサブトラクションに比べ
て音声と雑音部分の対比がはっきりしていないが、全体
的に雑音部分が薄くなり、音声が強調されているのがわ
かる。原音を大きく変えることなく明瞭度を上げること
により、聞きやすい音が作られている。
FIG. 5C shows the result of loss control according to the present invention. Compared with the spectrum subtraction, the contrast between the voice and the noise part is not clear, but it can be seen that the noise part is thin overall and the voice is emphasized. By increasing the clarity without significantly changing the original sound, a sound that is easy to hear is created.

【0054】S/N比を計算したところ、損失制御の処
理前後でそれぞれ18dB,30dBとなり、損失制御
によって12dBの騒音低減効果があることが確かめら
れた。
When the S / N ratio was calculated, it was 18 dB and 30 dB before and after the loss control processing, respectively, and it was confirmed that the noise control had a 12 dB noise reduction effect.

【0055】[0055]

【発明の効果】本発明は、受聴を目的とした雑音低減方
法および装置であり、次のような特徴を持つ。まず、帯
域に分割して処理することによって、一部の帯域で損失
挿入の判別誤りが起こっても全体的な影響が小さい。ま
た、損失の挿入という線形な処理を与えるため、信号に
対する歪みが少ない。また、損失値を平均化して与える
ことにより、音声の立ち上がり部分や立ち下がり部分
等、音声信号と雑音信号の比率が大きく変化し、それに
伴い損失値が激しく変わる部分でも不連続感が解消され
る。また、雑音パワーの推定にヒストグラムを用いるこ
とで、音声と雑音の混在する区間でも雑音パワーの推定
が使用可能である。
According to the present invention, there is provided a noise reduction method and apparatus for listening, which has the following features. First, by dividing the band into bands and processing, even if a loss insertion error occurs in some bands, the overall effect is small. In addition, since a linear process of inserting a loss is provided, distortion to a signal is small. By averaging the loss values, the ratio between the audio signal and the noise signal greatly changes, such as the rising portion and the falling portion of the voice, and the discontinuity is eliminated even in the portion where the loss value changes drastically with it. . Also, by using a histogram for noise power estimation, noise power estimation can be used even in a section where speech and noise are mixed.

【0056】本発明の方法による受聴を目的とした雑音
低減により、聞き易い目的信号を得ることが可能にな
る。その結果、音声会議・TV会議等の拡声通話系にお
いて、マイクロホンで受音し、相手側に送出される送話
信号に、目的となる音声以外の周囲雑音が混入した場合
でも、本方法による雑音の低減により音声の明瞭性を保
つことが可能になり、通信品質が向上する。
[0056] The noise reduction for the purpose of listening by way of the present invention, it is possible to obtain a likely target signal heard. As a result, in the hands-free communication systems such as audio conferencing · TV conference, and the sound receiving by a microphone, the transmission signal sent to the other party, even if the ambient noise other than the voice to be objective is mixed, in the how Due to the reduction of noise, clarity of voice can be maintained, and communication quality is improved.

【図面の簡単な説明】[Brief description of the drawings]

【図1】本発明実施例の構成を示すブロック図であ
る。
1 is a block diagram showing a configuration of an embodiment of the present invention.

【図2】図1の実施例における雑音パワー推定部による
処理の流れ図である。
FIG. 2 is a flowchart of a process performed by a noise power estimation unit in the embodiment of FIG.

【図3】図1の実施例における損失値計算部による処理
の流れ図である。
FIG. 3 is a flowchart of a process performed by a loss value calculator in the embodiment of FIG. 1;

【図4】本発明にかかる雑音低減方法を示す流れ図であ
る。
Is a flow diagram showing such a noise reduction methods from the present invention; FIG.

【図5】本発明の効果を説明するためのスペクトログラ
ムである。
FIG. 5 is a spectrogram for explaining the effect of the present invention.

【図6】従来の雑音低減装置の原理を説明するための図
である。
FIG. 6 is a diagram for explaining the principle of a conventional noise reduction device.

【図7】従来の雑音低減装置の一例を示すブロック図で
ある。
FIG. 7 is a block diagram illustrating an example of a conventional noise reduction device.

【符号の説明】 11 マイクロホン 15 入力信号 16 雑音低減装置 17 出力信号 21 A/D変換部 22 周波数帯域分割部 28 時間領域変換部 29 D/A変換部 31 雑音パワー推定部 32 損失値計算部 33 損失挿入部[Description of Signs] 11 Microphone 15 Input signal 16 Noise reduction device 17 Output signal 21 A / D conversion unit 22 Frequency band division unit 28 Time domain conversion unit 29 D / A conversion unit 31 Noise power estimation unit 32 Loss value calculation unit 33 Loss insertion part

フロントページの続き (72)発明者 金田 豊 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (72)発明者 小島 順治 東京都新宿区西新宿三丁目19番2号 日 本電信電話株式会社内 (56)参考文献 特開 平3−266899(JP,A) 特開 昭59−67732(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 21/02 Continuing on the front page (72) Inventor Yutaka Kaneda 3-19-2 Nishi-Shinjuku, Shinjuku-ku, Tokyo Nippon Telegraph and Telephone Corporation (72) Inventor Junji Kojima 3-192-2, Nishi-Shinjuku, Shinjuku-ku, Tokyo Date (56) References JP-A-3-266899 (JP, A) JP-A-59-67732 (JP, A) (58) Fields investigated (Int. Cl. 7 , DB name) G10L 21/02

Claims (3)

(57)【特許請求の範囲】(57) [Claims] 【請求項1】 音声雑音混在信号を複数の帯域に分割す
る周波数帯域分割過程と、 前記分割された複数の周波数帯域の各帯域信号に対して
各帯域毎の入力信号パワーを計算する入力信号パワー計
算過程と、 前記分割された複数の周波数帯域の各帯域信号を用いて
前記各周波数帯域毎の雑音パワーの推定を行う雑音パワ
ー推定過程と、 前記各帯域毎の入力信号パワーと前記各帯域毎の雑音パ
ワーとを比較して、前記各帯域信号中に占める前記各帯
域毎の雑音の比率を予測する予測過程と、 この予測した比率に基づいて前記各帯域毎の損失値を決
定する損失値計算過程と、 前記分割された複数の周波数帯域の各帯域信号に対して
前記各帯域毎に決定された前記損失値を挿入し、前記各
帯域毎の雑音を低減した帯域出力信号を出力する損失挿
入過程と、 前記帯域出力信号を時間領域に変換し全帯域信号に合成
する時間領域変換過程と を有することにより目的となる音声信号と不要な雑音信
号の混在する音声雑音混在信号から雑音信号を除去した
信号を出力する雑音低減処理方法であって、 雑音パワー推定過程は、分割された複数の周波数帯域の
各帯域信号毎の入力信号パワーレベル分布のヒストグラ
ムをとり、 前記ヒストグラムのピーク区間を検出しピーク区間の一
番小さい値を雑音のパワーとすることを特徴とする雑音
低減方法。
1. A frequency band dividing step of dividing an audio / noise mixed signal into a plurality of bands, and an input signal power for calculating an input signal power for each band with respect to each band signal of the plurality of divided frequency bands. A calculating process, a noise power estimating process of estimating a noise power of each of the frequency bands by using each band signal of the plurality of divided frequency bands, and an input signal power of each of the bands and each of the bands. A prediction process of comparing the noise power of each band with the noise power of each band, and a loss value for determining a loss value of each band based on the predicted ratio. A calculation step of: inserting the loss value determined for each band into each band signal of the plurality of divided frequency bands, and outputting a band output signal in which noise of each band is reduced. Excessive insertion When the audio signal and the unwanted noise signal to be objective by having a time-domain transform process of synthesizing the entire band signal by converting the band output signal into the time domain
Noise signal is removed from mixed voice noise signal
A noise reduction processing method for outputting a signal, wherein the noise power estimating step includes the steps of:
Histogram of input signal power level distribution for each band signal
And the peak section of the histogram is detected.
Noise characterized by using the smallest value as the noise power
Reduction method.
【請求項2】 損失値計算過程は、推定された前記各帯
域毎の雑音パワー信号に予め決められた値を加算し、こ
れをしきい値として定め、 前記決定された各帯域毎のしきい値と前記各帯域毎の入
力信号パワーの大小を比較し、前記各帯域毎の入力信号
パワーがしきい値より大きい帯域については予め決めら
れた損失値を与え、しきい値より小さい帯域について
は、損失を挿入しないことを特徴とする請求項記載の
雑音低減方法。
2. A loss value calculating step, wherein a predetermined value is added to the estimated noise power signal for each band, and this is set as a threshold value, and the determined threshold value for each band is set. The value is compared with the magnitude of the input signal power for each band, and a predetermined loss value is given for a band where the input signal power for each band is larger than a threshold, and the noise reduction method according to claim 1, wherein a is not inserted loss.
【請求項3】 損失値計算過程は、前記各帯域毎に決定
された前記損失値を、隣接する帯域の損失値と平均して
新たに各帯域毎の損失値を決定し直すことを特徴とする
請求項記載の雑音低減方法。
3. The loss value calculating step is characterized in that the loss value determined for each band is averaged with a loss value of an adjacent band to newly determine a loss value for each band. The noise reduction method according to claim 1, wherein
JP06854896A 1996-03-25 1996-03-25 Noise reduction method Expired - Lifetime JP3309895B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06854896A JP3309895B2 (en) 1996-03-25 1996-03-25 Noise reduction method

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06854896A JP3309895B2 (en) 1996-03-25 1996-03-25 Noise reduction method

Publications (2)

Publication Number Publication Date
JPH09258792A JPH09258792A (en) 1997-10-03
JP3309895B2 true JP3309895B2 (en) 2002-07-29

Family

ID=13376929

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06854896A Expired - Lifetime JP3309895B2 (en) 1996-03-25 1996-03-25 Noise reduction method

Country Status (1)

Country Link
JP (1) JP3309895B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006077934A1 (en) * 2005-01-21 2006-07-27 Matsushita Electric Industrial Co., Ltd. Band division noise suppressor and band division noise suppressing method

Families Citing this family (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001318694A (en) * 2000-05-10 2001-11-16 Toshiba Corp Device and method for signal processing and recording medium
JP4580508B2 (en) * 2000-05-31 2010-11-17 株式会社東芝 Signal processing apparatus and communication apparatus
JP4697984B2 (en) * 2002-08-30 2011-06-08 日本電信電話株式会社 Noise suppression method, noise suppression device, noise suppression program
JP4223441B2 (en) * 2004-06-03 2009-02-12 日本電信電話株式会社 Noise reduction method, apparatus for implementing the method, program, and recording medium therefor
JP4863713B2 (en) 2005-12-29 2012-01-25 富士通株式会社 Noise suppression device, noise suppression method, and computer program
JP4757775B2 (en) * 2006-11-06 2011-08-24 Necエンジニアリング株式会社 Noise suppressor
JP5762478B2 (en) * 2013-07-10 2015-08-12 日本電信電話株式会社 Noise suppression device, noise suppression method, and program thereof
JP6018141B2 (en) * 2014-08-14 2016-11-02 株式会社ピー・ソフトハウス Audio signal processing apparatus, audio signal processing method, and audio signal processing program
JP6067760B2 (en) * 2015-01-28 2017-01-25 日本電信電話株式会社 Parameter determining apparatus, parameter determining method, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2006077934A1 (en) * 2005-01-21 2006-07-27 Matsushita Electric Industrial Co., Ltd. Band division noise suppressor and band division noise suppressing method

Also Published As

Publication number Publication date
JPH09258792A (en) 1997-10-03

Similar Documents

Publication Publication Date Title
JP4219898B2 (en) Speech enhancement device
US7555075B2 (en) Adjustable noise suppression system
CN1971711B (en) System for adaptive enhancement of speech signals
US20070232257A1 (en) Noise suppressor
US5937377A (en) Method and apparatus for utilizing noise reducer to implement voice gain control and equalization
KR100304666B1 (en) Speech enhancement method
JP3459363B2 (en) Noise reduction processing method, device thereof, and program storage medium
JP3309895B2 (en) Noise reduction method
JP2008065090A (en) Noise suppressing apparatus
JP6073456B2 (en) Speech enhancement device
JP3454403B2 (en) Band division type noise reduction method and apparatus
JP2004341339A (en) Noise restriction device
JP4757775B2 (en) Noise suppressor
CN106941006B (en) Method, apparatus and system for separation and bass enhancement of audio signals
JP2010103875A (en) Echo suppression apparatus, echo suppression method, echo suppression program, and recording medium
JPH10171497A (en) Background noise removing device
JP4413205B2 (en) Echo suppression method, apparatus, echo suppression program, recording medium
JPH10161694A (en) Band split type noise reducing method
JP4460256B2 (en) Noise reduction processing method, apparatus for implementing the method, program, and recording medium
EP1286334A2 (en) Method and circuit arrangement for reducing noise during voice communication in communications systems
CN110136734B (en) Method and audio noise suppressor for reducing musical artifacts using nonlinear gain smoothing
CN109841223B (en) Audio signal processing method, intelligent terminal and storage medium
CN112309418A (en) Method and device for inhibiting wind noise
EP1278185A2 (en) Method for improving noise reduction in speech transmission
JP2002140100A (en) Noise suppressing device

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090524

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090524

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100524

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100524

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110524

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120524

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130524

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20140524

Year of fee payment: 12

S531 Written request for registration of change of domicile

Free format text: JAPANESE INTERMEDIATE CODE: R313531

R350 Written notification of registration of transfer

Free format text: JAPANESE INTERMEDIATE CODE: R350

EXPY Cancellation because of completion of term