JPH07152395A - Noise suppression system - Google Patents

Noise suppression system

Info

Publication number
JPH07152395A
JPH07152395A JP29717693A JP29717693A JPH07152395A JP H07152395 A JPH07152395 A JP H07152395A JP 29717693 A JP29717693 A JP 29717693A JP 29717693 A JP29717693 A JP 29717693A JP H07152395 A JPH07152395 A JP H07152395A
Authority
JP
Japan
Prior art keywords
voice
signal
section
noise
noise suppression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP29717693A
Other languages
Japanese (ja)
Other versions
JP2739811B2 (en
Inventor
Kazunori Ozawa
一範 小澤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to JP29717693A priority Critical patent/JP2739811B2/en
Priority to DE1994623703 priority patent/DE69423703T2/en
Priority to EP19940118782 priority patent/EP0655731B1/en
Publication of JPH07152395A publication Critical patent/JPH07152395A/en
Application granted granted Critical
Publication of JP2739811B2 publication Critical patent/JP2739811B2/en
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0316Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude
    • G10L21/0364Speech enhancement, e.g. noise reduction or echo cancellation by changing the amplitude for improving intelligibility

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Filters That Use Time-Delay Elements (AREA)
  • Noise Elimination (AREA)

Abstract

PURPOSE:To provide a noise suppression system suppressing a noise superposed on a sound signal in a preprocess or a postprocess of encoding a sound. CONSTITUTION:A characteristic amount calculation circuit 150 calculates characteristic amounts of a sound signal. A sound detection circuit 200 detects a non- sound section and a sound section by using at least one amount among the characteristic amounts. A storage circuit 250 stores a mean amplitude in the non-sound section. A noise suppression circuit 300 filters the sound signal by using a spectrum parameter among the characteristic amounts, and estimates and suppresses a noise signal based on the filtered result and the output of the storage circuit 250.

Description

【発明の詳細な説明】Detailed Description of the Invention

【0001】[0001]

【産業上の利用分野】本発明は、音声信号に重畳した雑
音を抑圧する雑音抑圧方式に関し、特に、音声符号化の
前処理あるいは後処理において動作させる雑音抑圧方式
に関する。
BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a noise suppression system for suppressing noise superimposed on a speech signal, and more particularly to a noise suppression system operated in pre-processing or post-processing of speech coding.

【0002】[0002]

【従来の技術】音声符号化の前処理として、音声区間と
無音区間とを判別する方式としては、例えば、J.リンチ
Jr.(J.Lynch, Jr.)氏らによる“スピーチ/サイレンス
・セグメンテーション・フォー・リアル―タイム・コー
ディング・ヴィア・ルール・ベースド・アダプティヴ・
エンドポイント・ディテクション”(@Speech/silences
egmentation for real-time coding via rule based ad
aptive endpointdetection"(Proc. ICASSP, pp.1348-13
51, 1987) と題した論文(文献1)等に記載された音
声検出方法が知られている。また、雑音の重畳した音声
から、雑音成分を除去する方法として、特開平2-278298
号明細書(文献2)等に記載のスペクトルサブトラクシ
ョン法が知られている。
2. Description of the Related Art As a method for discriminating a voice section from a silent section as a preprocessing of voice encoding, for example, J. Lynch is used.
Jr. (J.Lynch, Jr.) et al. “Speech / silence segmentation for real-time coding via rule based adaptive
Endpoint Detection ”(@ Speech / silences
egmentation for real-time coding via rule based ad
aptive endpoint detection "(Proc. ICASSP, pp.1348-13
51, 1987), a speech detection method described in a paper (Reference 1) and the like is known. Further, as a method for removing a noise component from a voice on which noise is superimposed, Japanese Patent Laid-Open No. 2-278298
The spectral subtraction method described in the specification (reference 2) and the like is known.

【0003】[0003]

【発明が解決しようとする課題】上述した文献1の従来
方式では、音声区間と無音区間の検出をしているのみで
あり、特に雑音抑圧は行っていなかった。仮に前記従来
方式を雑音抑圧に使おうとすると、音声区間に重畳した
非音声信号(雑音)の抑圧は困難である。さらに、上述
の文献2では、雑音の重畳したスペクトルから、雑音の
みのスペクトルを推定して除去することにより、雑音抑
圧を行う。しかしながら、音声符号化では、スペクトル
のみならず、位相成分も符号化して伝送するので、スペ
クトル上での雑音除去では雑音除去効果は不十分であ
り、波形上での雑音除去処理が必要である。また、上述
の従来方式は、音声符号化の後処理に適用することはで
きない。
In the above-mentioned conventional method of Document 1, only the voice section and the silent section are detected, and no noise is suppressed. If the conventional method is used for noise suppression, it is difficult to suppress the non-voice signal (noise) superimposed on the voice section. Furthermore, in the above-mentioned Document 2, noise suppression is performed by estimating and removing a spectrum of only noise from the spectrum on which noise is superimposed. However, in speech coding, not only the spectrum but also the phase component is coded and transmitted, so the noise removal effect on the spectrum is not sufficient, and noise removal processing on the waveform is necessary. Further, the above-mentioned conventional method cannot be applied to the post-processing of voice coding.

【0004】本発明の目的は、上述した問題点を解決
し、音声符号化の前処理、後処理のいずれにも付加する
ことが可能で、音声区間、非音声区間いずれでも、波形
上で雑音信号を抑圧することのできる雑音抑圧方式を提
供することにある。
An object of the present invention is to solve the above-mentioned problems and to add it to both pre-processing and post-processing of speech coding. In both speech section and non-speech section, noise is generated on the waveform. It is to provide a noise suppression method capable of suppressing a signal.

【0005】[0005]

【課題を解決するための手段】本発明によれば、音声信
号を入力しあらかじめ定められた時間長のフレームに分
割し、前記音声信号のスペクトル的特徴を含む特徴量を
計算する特徴量計算手段と、前記特徴量をのうちの少な
くとも1つを用いて、非音声区間と音声区間を検出する
音声検出手段と、非音声区間における平均振幅を記憶す
る記憶手段と、前記音声区間と前記非音声区間の少なく
とも1つの区間において、前記音声信号のスペクトル的
特徴を表すスペクトルパラメータを用いて前記音声信号
をフィルタリングし前記フィルタリング結果と前記記憶
手段の出力をもとに雑音信号を推定して抑圧する雑音抑
圧手段を有することを特徴とする雑音抑圧方式が得られ
る。
According to the present invention, a feature amount calculating means for inputting a voice signal, dividing the frame into frames of a predetermined time length, and calculating a feature amount including a spectral feature of the voice signal. And a voice detection unit that detects a non-voice section and a voice section by using at least one of the feature amounts, a storage unit that stores an average amplitude in the non-voice section, the voice section and the non-voice. In at least one of the intervals, noise that filters the audio signal using a spectral parameter that represents the spectral characteristics of the audio signal and estimates and suppresses a noise signal based on the filtering result and the output of the storage means. A noise suppression method characterized by having suppression means is obtained.

【0006】さらに本発明によれば、特徴量と音源信号
に関するインデクスを受信して復号する復号手段と、前
記特徴量のの少なくとも一つを用いて非音声区間と音声
区間を検出する音声検出手段と、非音声区間における平
均振幅を記憶する記憶手段と、前記非音声区間と前記音
声区間の少なくとも1つの区間において、前記記憶手段
の出力をもとに前記音源信号における雑音信号を推定し
て抑圧する雑音抑圧手段とを有することを特徴とする雑
音抑圧方式が得られる。
Further, according to the present invention, a decoding means for receiving and decoding an index relating to a feature amount and a sound source signal, and a voice detecting means for detecting a non-voice section and a voice section using at least one of the feature values. A storage means for storing the average amplitude in the non-voice section, and a noise signal in the sound source signal estimated and suppressed based on the output of the storage means in at least one of the non-voice section and the voice section. There is provided a noise suppressing means for performing the noise suppressing method.

【0007】[0007]

【作用】本発明による雑音抑圧方式の作用を示す。The operation of the noise suppression system according to the present invention will be described.

【0008】本発明では、音声区間に重畳した雑音信号
に対して抑圧を施す。音声信号をフレーム(例えば40
ms)に分割し、さらにサブフレーム(例えば8ms)
に分割する。特徴量計算部では、フレーム毎に、あるい
はサブフレーム毎に音声の特徴パラメータを計算する。
特徴パラメータとしては、種々のものが考えられるが、
ここでは、音声のスペクトル的特徴を表すスペクトルパ
ラメータと、音声の周期性を表すピッチ予測ゲインと、
平均振幅を計算する。なお、平均振幅のかわりに、パワ
ーを用いることもできる。
In the present invention, the noise signal superimposed on the voice section is suppressed. Frame the audio signal (eg 40
ms), and further subframe (for example, 8 ms)
Split into. The feature amount calculation unit calculates the feature parameter of the voice for each frame or for each subframe.
There are various possible characteristic parameters,
Here, a spectral parameter representing the spectral characteristics of the voice, a pitch prediction gain representing the periodicity of the voice,
Calculate the average amplitude. Note that power may be used instead of the average amplitude.

【0009】音声検出手段では、前記特徴量の一部、あ
るいは全てに対して、しきい値と比較することにより、
音声区間か、非音声区間かを判別する。ここで、しきい
値は固定の値でも良いし、ある規則に従い、時間的に変
化させても良い。
The voice detecting means compares some or all of the feature amounts with a threshold value,
It is determined whether it is a voice section or a non-voice section. Here, the threshold value may be a fixed value or may be changed with time according to a certain rule.

【0010】記憶手段では、前記音声検出手段で非音声
区間と判別された区間では、平均振幅、もしくは、前記
平均振幅を時間的に平滑化したものを記憶する。
The storage means stores the average amplitude or a temporally smoothed version of the average amplitude in the section determined to be the non-voice section by the voice detection section.

【0011】雑音抑圧手段では、音声区間、もしくは非
音声区間の少なくとも1つの区間において、雑音信号を
抑圧する。まず、当該フレームで求めた、前記スペクト
ルパラメータを用いて、入力音声を下式に従い逆フィル
タリングし、フィルタリング結果e(n)を得る。 ここで、aiは特徴量計算手段で求めたスペクトルパラメ
ータである。P は逆フィルタの次数である。e(n)には、
音声信号と雑音信号とが重畳していると考えられるが、
有声区間では、音声信号の部分は、ピッチ構造のため、
振幅の比較的大きなパルスとなる。一方、雑音信号の部
分は、振幅の比較的小さな雑音信号となる。従って、e
(n)をしきい値と比較し、しきい値よりも小さな信号
を、あらかじめ定められた値だけ抑圧するか、もしくは
0 としてしまう。
The noise suppressing means suppresses a noise signal in at least one of the voice section and the non-voice section. First, using the spectrum parameter obtained in the frame, the input voice is inversely filtered according to the following equation to obtain a filtering result e (n). Here, a i is a spectrum parameter obtained by the feature amount calculation means. P is the order of the inverse filter. e (n) is
It is considered that the voice signal and the noise signal are superposed,
In the voiced section, the voice signal part has a pitch structure,
The pulse has a relatively large amplitude. On the other hand, the noise signal portion becomes a noise signal having a relatively small amplitude. Therefore, e
(n) is compared with a threshold value, and signals smaller than the threshold value are suppressed by a predetermined value, or
Set it to 0.

【0012】つまりThat is,

【0013】 [0013]

【0014】ここで、K は、0<K<1 の定数である。Th1
は、前記記憶手段において、非音声区間で記憶しておい
た平均振幅に応じて決定する。次に、e'(n) と前記スペ
クトルパラメータを用いて、下式により、雑音の抑圧さ
れた信号を復元する。 また本発明では、送信側での入力した音声信号に対して
ではなく、音声復号側において音声信号を復元するさい
に、音声区間と非音声区間の少なくとも1つの区間の雑
音を抑圧する。雑音抑圧部の具体的な動作は第1の発明
の雑音抑圧手段と同一である。
Here, K is a constant of 0 <K <1. Th 1
Is determined according to the average amplitude stored in the non-voice section in the storage means. Next, using e ′ (n) and the spectrum parameter, the noise suppressed signal is restored by the following equation. Further, in the present invention, noise is suppressed in at least one section of the speech section and the non-speech section when the speech signal is restored on the speech decoding side, not on the input speech signal on the transmitting side. The specific operation of the noise suppression unit is the same as the noise suppression means of the first invention.

【0015】[0015]

【実施例】次に、本発明について図面を参照して説明す
る。
DESCRIPTION OF THE PREFERRED EMBODIMENTS Next, the present invention will be described with reference to the drawings.

【0016】図1は本発明による雑音抑圧方式の第1の
実施例を示すブロック図である。
FIG. 1 is a block diagram showing a first embodiment of the noise suppression system according to the present invention.

【0017】図において、入力端子100から音声信号
を入力し、フレーム分割回路110では音声信号をフレ
ーム(例えば40ms)毎に分割し、サブフレーム分割
回路120では、フレームの音声信号をフレームよりも
短いサブフレーム(例えば8ms)に分割する。
In the figure, a voice signal is input from an input terminal 100, a frame dividing circuit 110 divides the voice signal into frames (for example, 40 ms), and a subframe dividing circuit 120 shortens the voice signal of the frame to be shorter than the frame. It is divided into subframes (for example, 8 ms).

【0018】特徴量計算回路150では、前記音声信号
の特徴量として、スペクトルパラメータと、ピッチ周期
性と、平均振幅を計算する。ここで、スペクトルパラメ
ータの計算では、少なくとも一つのサブフレームの音声
信号に対して、サブフレーム長よりも長い窓(例えば2
4ms)をかけて音声を切り出してスペクトルパラメー
タをあらかじめ定められた次数(例えば10次)計算す
る。スペクトルパラメータとしては、以下では線形予測
係数aiを用いることとし、スペクトルパラメータの計算
には、周知のLPC 分析や、Burg分析等を用いることがで
きる。ここでは、Burg分析を用いることとする。Burg分
析の詳細については、中溝著による”信号解析とシステ
ム同定”と題した単行本(コロナ社1988年刊)の8
2〜87頁(文献3)に記載されているので説明は略す
る。また、他の方法として、自己相関法や、共分散法な
どを使用することもできる。また、ピッチ周期性を表す
ピッチ予測ゲインは、(4) 式に従い計算できる。 ここで、x(n)は入力音声信号、T はピッチ周期を表す遅
延量である。
The feature amount calculation circuit 150 calculates the spectrum parameter, pitch periodicity, and average amplitude as the feature amount of the voice signal. Here, in the calculation of the spectrum parameter, a window longer than the subframe length (for example, 2
It takes 4 ms) to cut out the voice and calculate the spectrum parameter with a predetermined order (for example, 10th order). As the spectral parameter, the linear prediction coefficient a i will be used below, and well-known LPC analysis, Burg analysis, etc. can be used for the calculation of the spectral parameter. Here, Burg analysis is used. For details of Burg analysis, refer to 8 of the book (Corona Publishing Co., Ltd., 1988) entitled "Signal Analysis and System Identification" by Nakamizo.
The description is omitted because it is described on pages 2 to 87 (Reference 3). Further, as another method, an autocorrelation method, a covariance method, or the like can be used. Further, the pitch prediction gain, which represents the pitch periodicity, can be calculated according to the equation (4). Here, x (n) is the input speech signal, and T is the delay amount representing the pitch period.

【0019】(4) 式のかわりに、簡便には、(5) 式を使
用することもできる。 また、平均振幅R の計算は下式に従う。
Instead of the equation (4), the equation (5) can be conveniently used. The calculation of the average amplitude R follows the formula below.

【0020】 [0020]

【0021】音声検出回路200では、上記の特徴量の
少なくとも一つを使用して音声区間と非音声区間の検出
を行う。種々の検出法が考えられるが、ここでは下記の
方法を用いる。平滑化したピッチ予測ゲインPg' がしき
い値Th1 以下で、平滑化した平均振幅R'がしきい値Th2
以下のときは、非音声区間と判断し、それ以外の区間は
音声区間とする。ここで、平滑化は下式に従う。 Pj'=(1- δ)・P'j-1+δ・P (7) 上式でP は平滑化を施すパラメータ(例えばピッチ予測
ゲイン、平均振幅等)である。δは平滑化時定数であ
り、0<δ<1の値をとる。Pj' は平滑化後のj 時刻の値で
ある。しきい値Th1 、Th2 は固定でも良いし時間的に変
化させてもよい。
The voice detection circuit 200 detects a voice section and a non-voice section by using at least one of the above feature amounts. Although various detection methods are possible, the following method is used here. The smoothed pitch prediction gain Pg 'is less than or equal to the threshold Th 1 , and the smoothed average amplitude R'is less than the threshold Th 2.
In the following cases, it is determined as a non-voice section, and the other sections are voice sections. Here, the smoothing follows the following equation. P j '= (1-δ) · P' j-1 + δ · P (7) In the above equation, P is a parameter for smoothing (for example, pitch prediction gain, average amplitude, etc.). δ is a smoothing time constant, and takes a value of 0 <δ <1. Pj 'is the j-time value after smoothing. The thresholds Th1 and Th2 may be fixed or may be changed with time.

【0022】記憶回路250では、非音声区間におい
て、平均振幅に(7) 式を適用して求めた平滑化平均振幅
R'をフレーム毎に、あるいはサブフレーム毎に計算して
記憶する。
In the storage circuit 250, the smoothed average amplitude obtained by applying the equation (7) to the average amplitude in the non-voice section.
R ′ is calculated and stored for each frame or subframe.

【0023】雑音抑圧回路300では、非音声区間およ
び音声区間の少なくとも一方の区間において、雑音信号
を抑圧する。ここで、雑音抑圧回路300の詳細を示す
ブロック図を図2に示す。
The noise suppression circuit 300 suppresses a noise signal in at least one of the non-voice section and the voice section. Here, a block diagram showing the details of the noise suppression circuit 300 is shown in FIG.

【0024】まず、逆フィルタリング回路310では、
当該フレームの特徴量計算回路150で求めた線形予測
係数aiを用いて前記(1) 式に従い逆フィルタリングを行
い、フィルタリング結果e(n)を求める。
First, in the inverse filtering circuit 310,
Inverse filtering is performed according to the equation (1) using the linear prediction coefficient ai obtained by the feature amount calculation circuit 150 of the frame to obtain the filtering result e (n).

【0025】次に、しきい値計算回路330では、記憶
回路250で記憶されていたR'をもとに例えば下式に従
いしきい値Th1 を計算する。 Th1=K2・R' (8) ここで0<K2とする。次に抑圧回路320では、音声区間
および非音声区間の少なくとも一方の区間において、
(2) 式に従い、e(n)に対して雑音抑圧処理を施し、抑圧
後の信号e'(n) を得る。
Next, the threshold value calculation circuit 330 calculates the threshold value Th 1 based on R ′ stored in the storage circuit 250, for example, according to the following equation. Th 1 = K 2 · R '(8) where 0 <K 2 . Next, in the suppression circuit 320, in at least one of the voice section and the non-voice section,
According to equation (2), noise suppression processing is performed on e (n) to obtain the suppressed signal e ′ (n).

【0026】次に、復元回路340では、e'(n) を入力
し(3) 式に従い、雑音抑圧後の音声x'(n) を復元し、出
力する。
Next, the restoration circuit 340 inputs e '(n), restores the noise-suppressed speech x' (n) according to the equation (3), and outputs it.

【0027】本発明の第2の実施例を図3に示す。図に
おいて、図1、図2と同一の構成番号を付した構成要素
は、図1と同様の動作を行うので説明を省略する。
A second embodiment of the present invention is shown in FIG. In the figure, the constituent elements with the same constituent numbers as in FIG. 1 and FIG. 2 perform the same operations as in FIG.

【0028】復号回路410は、端子400より、音声
の特徴量(例えばスペクトルパラメータ、ピッチ周期、
平均振幅)と音源信号に関するインデクスを入力し復号
する。
The decoding circuit 410 receives from the terminal 400 a voice feature amount (for example, spectrum parameter, pitch period,
The average amplitude) and the index of the sound source signal are input and decoded.

【0029】雑音抑圧回路500の詳細なブロック図を
図4に示す。図4において、音声区間および非音声区間
と判別された区間のうち、少なくとも一方の区間では、
抑圧回路510が、音源信号v(n)に対して(10)式に従
い、雑音抑圧処理を施して音源信号v'(n) を求める。
A detailed block diagram of the noise suppression circuit 500 is shown in FIG. In FIG. 4, in at least one of the sections determined to be the voice section and the non-voice section,
The suppression circuit 510 performs noise suppression processing on the sound source signal v (n) according to the equation (10) to obtain a sound source signal v ′ (n).

【0030】 [0030]

【0031】ここで、K は(2) 式のK と同一の値であ
る。しきい値Th1 も(2) 式と同じ値である。音声復号回
路520は、雑音が抑圧された音源信号v'(n) と特徴量
とを入力し、周知な方法により音声信号を復元して出力
する。本発明の意向を損なうことなく、上述した実施例
以外にも種々の変形が可能である。
Here, K has the same value as K in the equation (2). The threshold value Th 1 is also the same value as the expression (2). The voice decoding circuit 520 inputs the sound source signal v ′ (n) in which noise is suppressed and the feature amount, restores the voice signal by a well-known method, and outputs it. Various modifications other than the above-described embodiments are possible without impairing the intention of the present invention.

【0032】特徴量計算回路におけるスペクトルパラメ
ータは線形予測係数以外にも他の周知なパラメータを用
いることができる。
As the spectrum parameter in the feature amount calculation circuit, other well-known parameters can be used in addition to the linear prediction coefficient.

【0033】音声検出回路での音声区間、非音声区間の
検出法は他の衆知な方法を用いることができる。
As the method of detecting the voice section and the non-voice section in the voice detection circuit, other publicly known methods can be used.

【0034】特徴量としては、実施例で述べたパラメー
タ以外に、他の衆知なパラメータを用いることができ
る。
As the feature quantity, other well-known parameters can be used in addition to the parameters described in the embodiment.

【0035】また、第2の実施例において、特徴量が送
信側から伝送されないときは、受信側で音声を一旦復号
した後に、復号した音声波形から第1の実施例に示した
方法を用いて特徴量を計算し、雑音抑圧に使用する構成
としてもよい。
In the second embodiment, when the feature amount is not transmitted from the transmitting side, the voice is once decoded on the receiving side and then the method shown in the first embodiment is used from the decoded voice waveform. A feature amount may be calculated and used for noise suppression.

【0036】[0036]

【発明の効果】以上述べたように本発明ば、音声符号化
の前処理、後処理、いずれでも、雑音抑圧が可能であ
り、非音声区間の雑音の抑圧だけでなく、音声区間の音
声信号に重畳した非音声信号の抑圧を、波形上で実現す
ることができるという効果を奏する。
As described above, according to the present invention, noise can be suppressed by both pre-processing and post-processing of speech coding, and not only noise suppression in the non-speech section but also speech signal in the speech section. The effect of suppressing the non-voice signal superimposed on the waveform can be realized on the waveform.

【図面の簡単な説明】[Brief description of drawings]

【図1】本発明の第1の実施例のブロック図である。FIG. 1 is a block diagram of a first embodiment of the present invention.

【図2】図1中の雑音抑圧回路のブロック図である。FIG. 2 is a block diagram of a noise suppression circuit in FIG.

【図3】本発明の第2の実施例のブロック図である。FIG. 3 is a block diagram of a second embodiment of the present invention.

【図4】図3中の雑音抑圧回路のブロック図である。4 is a block diagram of a noise suppression circuit in FIG.

【符号の説明】[Explanation of symbols]

110 フレーム分割回路 120 サブフレーム分割回路 150 特徴量計算回路 200 音声検出回路 250 記憶回路 300,500 雑音抑圧回路 310 逆フィルタリング回路 320,510 抑圧回路 330 しきい値回路 340 復元回路 520 音声復号回路 110 frame division circuit 120 sub-frame division circuit 150 feature amount calculation circuit 200 speech detection circuit 250 storage circuit 300,500 noise suppression circuit 310 inverse filtering circuit 320,510 suppression circuit 330 threshold circuit 340 restoration circuit 520 speech decoding circuit

Claims (3)

【特許請求の範囲】[Claims] 【請求項1】 音声信号を入力しあらかじめ定められた
時間長のフレームに分割し、前記音声信号のスペクトル
的特徴を含む特徴量を計算する特徴量計算手段と、前記
特徴量のうち少なくとも1つを用いて、非音声区間と音
声区間を検出する音声検出手段と、非音声区間における
平均振幅を記憶する記憶手段と、前記音声区間と前記非
音声区間の少なくとも1つの区間において、前記スペク
トル的特徴を表す特徴量を用いて前記音声信号をフィル
タリングし前記フィルタリング結果と前記記憶手段の出
力をもとに雑音信号を推定して抑圧する雑音抑圧手段と
を有することを特徴とする雑音抑圧方式。
1. A feature amount calculation means for inputting a voice signal, dividing the frame into frames of a predetermined time length, and calculating a feature amount including a spectral feature of the voice signal, and at least one of the feature amounts. Using a voice detecting means for detecting a non-voice section and a voice section, a storage means for storing an average amplitude in the non-voice section, and the spectral feature in at least one section of the voice section and the non-voice section. A noise suppression method comprising: a noise suppression unit that filters the voice signal using a feature amount that represents and suppresses the noise signal by estimating the noise signal based on the filtering result and the output of the storage unit.
【請求項2】 特徴量と音源信号に関するインデクスを
受信して復号する復号手段と、前記特徴量のうちの少な
くとも1つを用いて非音声区間と音声区間を検出する音
声検出手段と、非音声区間における平均振幅を記憶する
記憶手段と、前記非音声区間と前記音声区間の少なくと
も1つの区間において、前記記憶手段の出力をもとに前
記音源信号における雑音信号を推定して抑圧する雑音抑
圧手段とを有することを特徴とする雑音抑圧方式。
2. Decoding means for receiving and decoding an index relating to a feature quantity and a sound source signal, voice detection means for detecting a non-voice section and a voice section using at least one of the feature quantities, and a non-voice A storage unit that stores an average amplitude in a section, and a noise suppression unit that estimates and suppresses a noise signal in the sound source signal based on the output of the storage unit in at least one section of the non-voice section and the voice section. A noise suppression system characterized by having:
【請求項3】 前記特徴量計算手段が、入力された音声
信号をフレーム毎に分割するフレーム分割回路と、フレ
ームの音声信号をフレームよりも短いサブフレームに分
割するサブフレーム分割回路と、前記音声信号の特徴量
としてスペクトルパラメータとピッチ周期性と平均振幅
を計算する特徴量計算回路とを有することを特徴とする
請求項1記載の雑音抑圧方式。
3. The feature quantity calculating means divides an input audio signal into frames, a frame division circuit that divides an audio signal of a frame into subframes shorter than a frame, and the audio. 2. The noise suppression system according to claim 1, further comprising a spectrum parameter, a pitch periodicity, and a feature amount calculation circuit that calculates an average amplitude as a feature amount of the signal.
JP29717693A 1993-11-29 1993-11-29 Noise suppression method Expired - Lifetime JP2739811B2 (en)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP29717693A JP2739811B2 (en) 1993-11-29 1993-11-29 Noise suppression method
DE1994623703 DE69423703T2 (en) 1993-11-29 1994-11-29 Noise reduction device for pre-processing and / or post-processing of speech signals
EP19940118782 EP0655731B1 (en) 1993-11-29 1994-11-29 Noise suppressor available in pre-processing and/or post-processing of a speech signal

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP29717693A JP2739811B2 (en) 1993-11-29 1993-11-29 Noise suppression method

Publications (2)

Publication Number Publication Date
JPH07152395A true JPH07152395A (en) 1995-06-16
JP2739811B2 JP2739811B2 (en) 1998-04-15

Family

ID=17843166

Family Applications (1)

Application Number Title Priority Date Filing Date
JP29717693A Expired - Lifetime JP2739811B2 (en) 1993-11-29 1993-11-29 Noise suppression method

Country Status (3)

Country Link
EP (1) EP0655731B1 (en)
JP (1) JP2739811B2 (en)
DE (1) DE69423703T2 (en)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011508897A (en) * 2007-12-06 2011-03-17 韓國電子通信研究院 Voice codec quality improving apparatus and method
US10755731B2 (en) 2016-09-08 2020-08-25 Fujitsu Limited Apparatus, method, and non-transitory computer-readable storage medium for storing program for utterance section detection

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3591068B2 (en) * 1995-06-30 2004-11-17 ソニー株式会社 Noise reduction method for audio signal
US7225001B1 (en) 2000-04-24 2007-05-29 Telefonaktiebolaget Lm Ericsson (Publ) System and method for distributed noise suppression
KR20140061285A (en) * 2010-08-11 2014-05-21 본 톤 커뮤니케이션즈 엘티디. Background sound removal for privacy and personalization use

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
AU633673B2 (en) * 1990-01-18 1993-02-04 Matsushita Electric Industrial Co., Ltd. Signal processing device
KR950013551B1 (en) * 1990-05-28 1995-11-08 마쯔시다덴기산교 가부시기가이샤 Noise signal predictting dvice
JPH05188994A (en) * 1992-01-07 1993-07-30 Sony Corp Noise suppression device

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2011508897A (en) * 2007-12-06 2011-03-17 韓國電子通信研究院 Voice codec quality improving apparatus and method
KR101235829B1 (en) * 2007-12-06 2013-02-21 한국전자통신연구원 Apparatus for enhancing quality of speech codec and method therefor
JP2013084002A (en) * 2007-12-06 2013-05-09 Korea Electronics Telecommun Device and method for enhancing quality of speech codec
JP2013101366A (en) * 2007-12-06 2013-05-23 Korea Electronics Telecommun Device and method for improving quality of voice codec
US9135926B2 (en) 2007-12-06 2015-09-15 Electronics And Telecommunications Research Institute Apparatus and method of enhancing quality of speech codec
US9135925B2 (en) 2007-12-06 2015-09-15 Electronics And Telecommunications Research Institute Apparatus and method of enhancing quality of speech codec
US9142222B2 (en) 2007-12-06 2015-09-22 Electronics And Telecommunications Research Institute Apparatus and method of enhancing quality of speech codec
US10755731B2 (en) 2016-09-08 2020-08-25 Fujitsu Limited Apparatus, method, and non-transitory computer-readable storage medium for storing program for utterance section detection

Also Published As

Publication number Publication date
DE69423703D1 (en) 2000-05-04
DE69423703T2 (en) 2000-07-27
EP0655731A2 (en) 1995-05-31
JP2739811B2 (en) 1998-04-15
EP0655731B1 (en) 2000-03-29
EP0655731A3 (en) 1997-05-28

Similar Documents

Publication Publication Date Title
EP0965123B1 (en) A high resolution post processing method for a speech decoder
AU730123B2 (en) Method and apparatus for processing sound signal
US5970441A (en) Detection of periodicity information from an audio signal
EP0275416B1 (en) Method for enhancing the quality of coded speech
Martin et al. New speech enhancement techniques for low bit rate speech coding
KR20010040669A (en) System and method for noise-compensated speech recognition
JPH08328591A (en) Method for adaptation of noise masking level to synthetic analytical voice coder using short-term perception weightingfilter
EP1386313B1 (en) Speech enhancement device
JP3451146B2 (en) Denoising system and method using spectral subtraction
KR20160030477A (en) Apparatus and method for selecting one of a first encoding algorithm and a second encoding algorithm using harmonics reduction
EP1096476B1 (en) Speech signal decoding
US6246979B1 (en) Method for voice signal coding and/or decoding by means of a long term prediction and a multipulse excitation signal
JP3558031B2 (en) Speech decoding device
JPH07160294A (en) Sound decoder
JP2739811B2 (en) Noise suppression method
JPH07199997A (en) Processing method of sound signal in processing system of sound signal and shortening method of processing time in itsprocessing
EP1442455B1 (en) Enhancement of a coded speech signal
JP3559485B2 (en) Post-processing method and device for audio signal and recording medium recording program
EP1100076A2 (en) Multimode speech encoder with gain smoothing
EP0713208A2 (en) Pitch lag estimation system
JPH08272394A (en) Voice encoding device
JPH1138998A (en) Noise suppression device and recording medium on which noise suppression processing program is recorded
JPH1138999A (en) Noise suppression device and recording medium on which program for suppressing and processing noise of speech is recorded
EP1521243A1 (en) Speech coding method applying noise reduction by modifying the codebook gain
EP1521242A1 (en) Speech coding method applying noise reduction by modifying the codebook gain

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 19971224

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080123

Year of fee payment: 10

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090123

Year of fee payment: 11

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100123

Year of fee payment: 12

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110123

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20110123

Year of fee payment: 13

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20120123

Year of fee payment: 14

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 15

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20130123

Year of fee payment: 15

EXPY Cancellation because of completion of term