JP3270866B2 - 雑音除去方法および雑音除去装置 - Google Patents

雑音除去方法および雑音除去装置

Info

Publication number
JP3270866B2
JP3270866B2 JP06411193A JP6411193A JP3270866B2 JP 3270866 B2 JP3270866 B2 JP 3270866B2 JP 06411193 A JP06411193 A JP 06411193A JP 6411193 A JP6411193 A JP 6411193A JP 3270866 B2 JP3270866 B2 JP 3270866B2
Authority
JP
Japan
Prior art keywords
noise
amplitude spectrum
ejw
estimated value
audio signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP06411193A
Other languages
English (en)
Other versions
JPH06274196A (ja
Inventor
活樹 南野
誠 赤羽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Priority to JP06411193A priority Critical patent/JP3270866B2/ja
Publication of JPH06274196A publication Critical patent/JPH06274196A/ja
Application granted granted Critical
Publication of JP3270866B2 publication Critical patent/JP3270866B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、音声信号に含まれる雑
音を除去する場合に用いて好適な雑音除去装置に関す
る。
【0002】
【従来の技術】従来の、音声信号に含まれる雑音を除去
する方法としては、例えば"Suppression of Acoustic N
oise in Speech Using Spectral Subtraction", S.F.Bo
ll, IEEE, Transactions on Acoustics, Speech, and S
ignal Processing, ASSP-27, 1979, pp.113-120に記載
されている、いわゆるスペクトルサブトラクションなど
が知られている。
【0003】スペクトルサブトラクションにおいては、
音声信号の無音声区間のスペクトルの平均値を、その音
声信号に含まれる雑音の推定値とし、この推定値分の信
号成分を音声信号から取り除くようになされている。
【0004】
【発明が解決しようとする課題】しかしながら、この方
法では、音声信号から、雑音の推定値を、一度取り除く
だけなので、音声信号に含まれる雑音を十分除去しきれ
ない課題があった。
【0005】本発明は、このような状況に鑑みてなされ
たものであり、音声信号に含まれる雑音を、常に十分に
除去することができるようにするものである。
【0006】
【課題を解決するための手段】請求項1に記載の雑音除
去方法は、音声信号から雑音を除去する雑音除去方法に
おいて、音声信号の無音声区間から、雑音の振幅スペク
トルの推定値を算出し、音声信号の振幅スペクトルか
ら、推定値を減算することを、推定値が所定値以下に収
束するまで繰り返すことを特徴とする。
【0007】請求項2に記載の雑音除去装置は、音声信
号から雑音を除去する雑音除去装置において、音声信号
の振幅スペクトルを算出する算出手段としてのプログラ
ムの処理ステップS2と、音声信号の無音声区間に対応
する振幅スペクトルから、雑音の振幅スペクトルの推定
値を算出する推定手段としてのプログラムの処理ステッ
プS3またはS7と、音声信号の振幅スペクトルから、
推定値を減算する減算手段としてのプログラムの処理ス
テップS4と、プログラムの処理ステップS7で算出さ
れた推定値が所定値以下に収束しているか否かを判定す
る判定手段としてのプログラムの処理ステップS8とを
備えることを特徴とする。
【0008】
【作用】請求項1に記載の雑音除去方法においては、音
声信号の無音声区間から、雑音の振幅スペクトルの推定
値を算出し、音声信号の振幅スペクトルから、推定値を
減算することを、推定値が所定値以下に収束するまで繰
り返す。従って、音声信号に含まれる雑音を、常に十分
に除去することができる。
【0009】請求項2に記載の雑音除去装置において
は、プログラムの処理ステップS2において、音声信号
の振幅スペクトルが算出され、プログラムの処理ステッ
プS3またはS7において、そのうちの無音声区間に対
応する振幅スペクトルから、雑音の振幅スペクトルの推
定値が算出される。そして、プログラムの処理ステップ
S4において、音声信号の振幅スペクトルから、推定値
が減算され、プログラムの処理ステップS8において、
ステップS7で算出された雑音の振幅スペクトルの推定
値が所定値以下に収束しているか否かが判定される。従
って、プログラムの処理ステップS8の判定結果によ
り、プログラムの処理ステップS7で算出される雑音の
振幅スペクトルの推定値が、所定値以下に収束するま
で、プログラムの処理ステップS4およびS7における
処理動作を繰り返すようにすることができるので、音声
信号に含まれる雑音を、常に十分に除去することができ
る。
【0010】
【実施例】図1は、本発明を適用した音声通信装置の一
実施例の構成を示すブロック図である。A/D変換部1
は、入力された音声信号を、所定のサンプリング周波数
fs(例えば、fs=12kHz)でサンプリングし、デ
ィジタル信号としての音声信号に変換する。雑音除去部
2は、後述するようにしてA/D変換部1からの音声信
号に含まれる雑音を除去する。符号化部3は、雑音除去
部2からの音声信号を符号化する。伝送部4は、符号化
部3で符号化された音声信号を変調し、電波として放
射、あるいは伝送信号として伝送路に出力する。
【0011】以上のように構成される音声通信装置で
は、まず最初に、A/D変換部1において、入力された
音声信号が、所定のサンプリング周波数fsでサンプリ
ングされ、雑音除去部2に出力される。雑音除去部2で
は、A/D変換部1からの音声信号に含まれる雑音が、
図2に示すフローチャートにしたがって除去される。
【0012】即ち、まず、ステップS1において、図3
に示すように、A/D変換部1より出力された音声信号
から、pサンプル(例えば、p=128)ずつずらしな
がら、Nサンプル(例えば、N=256)分の音声信号
が順次取り出され、これが1フレームとされる。ここ
で、以下、第iフレームのNサンプル分の音声信号を、
xi(n)(n=0,1,・・・,N−1)と表す。
【0013】さらに、ステップS1において、各フレー
ムごとの音声信号xi(n)に、例えば次式で示される
ハミングウインドウwH(n)あるいはハニングウイン
ドウwN(n)(nは時間)がかけられる。 wH(n)=0.54−0.46cos(2πn/(N
−1)) wN(n)=0.5−cos(2πn/(N−1))
【0014】即ち、ウインドウがかけられた音声信号x
i(n)をyi(n)と表すとすると、式 yi(n)=wH(n)×xi(n) あるいは yi(n)=wN(n)×xi(n) なる演算が行われる。
【0015】ウインドウがけされたフレームごとの音声
信号yi(n)は、ステップS2において、次式にした
がってフーリエ変換され、振幅スペクトル│Yi(ej
w)│が算 出されてステップS3に進む。
【0016】
【数1】
【0017】ステップS3において、図4に示すよう
に、ステップS2で算出された振幅スペクトル│Yi
(ejw)│のうち、入力された音声信号の音声区間(実
際に、発話された区間)が始まる直前の無音声区間M
(例えば、M=10)フレーム分の振幅スペクトル│Y
m(ejw)│(m=0,1,・・・,M−1)が取り出
される。そして、その平均値が、次式にしたがって算出
され、この平均値が、音声信号に含まれる雑音の振幅ス
ペクトルの推定値μ0(ejw)とされる。
【0018】
【数2】
【0019】なお、本実施例においては、説明を簡単に
するために、入力された音声信号の第0フレームから第
M−1フレームまでを無音声区間としている。
【0020】音声信号に含まれる雑音の振幅スペクトル
の推定値μ0(ejw)の算出後、ステップS4におい
て、各フレームの振幅スペクトル│Yi(ejw)│
ら、雑音の振幅スペクトルの推定値μ0(ejw)が減算
され、ステップS5に進み、その減算結果としての新た
な音声信号の振幅スペクトルの周波数成分の中で負にな
る成分があるか否かが判定される。
【0021】ステップS5において、各フレームの振幅
スペクトル│Yi(ejw)│から、雑音 の振幅スペクト
ルの推定値μ0(ejw)を減算した減算結果としての新
たな音声 信号の振幅スペクトルの周波数成分の中で負
になる成分があると判定された場合、ステップS6に進
み、負になる周波数成分が0に置き換えられ、ステップ
S7に進む。また、ステップS5において、ステップS
4で算出された新たな音声信号の振幅スペクトルの周波
数成分の中で負になる成分がないと判定された場合、ス
テップS6をスキップしてステップS7に進む。
【0022】即ち、各フレームの振幅スペクトル│Yi
(ejw)│から、雑音の振幅スペクトル の推定値μ0
(ejw)を減算した減算値としての新たな各フレームの
スペクトルをYi(0)(ejw)と表すと、ステップS4乃
至S6では、式 Yi(0)(ejw)=H0(ω)Yi(ejw) 但し、μ0(ejw)≦|Yi(ejw)|のとき、 H0(ω)=1−μ0(ejw)/|Yi(ejw)| で、μ0(ejw)>|Yi(ejw)|のとき、 H0(ω)=0 にしたがって、新たな音声信号のスペクトルYi(0)(e
jw)が算出される。
【0023】その後、ステップS7において、ステップ
S3における場合と同様にして、新たな音声信号のスペ
クトルYi(0)(ejw)のうち、入力された音声信号の音
声区間(実際に、発話された区間)が始まる直前の無音
声区間Mフレーム分に対応する振幅スペクトル│Ym(0)
(ejw)│が取り出され、その平均値が、次式にしたが
って算出される。そして、この平均値が、新たな音声信
号に含まれる雑音の振幅スペクトル、即ち入力された音
声信号に含まれる雑音の残差の振幅スペクトルの推定値
μ1(ejw)とされる。
【0024】
【数3】
【0025】雑音の残差の振幅スペクトルの推定値μ0
(ejw)の算出後、ステップS8に進み、この推定値μ
0(ejw)の各周波数成分すべてが所定値r以下である
か否かが判定される。ステップS8において、雑音の残
差の雑音の振幅スペクトルの推定値μ0(ejw)の各周
波数成分すべてが所定値r以下でないと判定された場
合、ステップS4に戻り、上述した場合と同様にして、
新たな音声信号の各フレームの振幅スペクトル│Yi(0)
(ejw)│から、雑音の残差の振幅スペクトルの推定値
μ1(ejw)が減算され、さらに新たな音声信号の振幅
スペクトル│Yi(1)(ejw)│が算出される。そして、
ステップS5,S6において、この振幅スペクトル Yi
(1)(ejw)の周波数成分の中で負になる成分がある場
合には、その負になる周波数成分が0に置き換えられ
る。
【0026】即ち、雑音の残差の振幅スペクトルの推定
値μ0(ejw)の各周波数成分すべてが所定値r以下で
ない場合には、式 Yi(1)(ejw)=H1(ω)Yi(0)(ejw) =H1(ω)H0(ω)Yi(ejw) 但し、μ1(ejw)≦|Yi(0)(ejw)|のとき、 H1(ω)=1−μ1(ejw)/|Yi(ejw)| で、μ1(ejw)>|Yi(0)(ejw)|のとき、 H1(ω)=0 にしたがって、さらに新たな音声信号のスペクトルYi
(1)(ejw)が算出されることになる。
【0027】以上から、ステップS4乃至S8では、式
【数4】 で示される雑音の残差の振幅スペクトルの推定値μk
(ejw)(k=0,1,・・・)が、式 μk(ejw)≦r, ∀ω (1) で示される条件を満たすまで、繰り返し算出されるとと
もに、式Yi(k)(ejw)=Hk(ω)Hk-1(ω)・・・
H0(ω)Yi(ejw) (2) 但し、μk(ejw)≦|Yi(k-1)(ejw)|のとき、 Hk(k)(ω)=1−μk(ejw)/|Yi(k-1)(ejw)| (3a) で、μk(ejw)>|Yi(k-1)(ejw)|のとき、 Hk(k)(ω)=0 (3b) にしたがって、雑音が除去された音声信号のスペクトル
Yi(k)(ejw)が算出されることになる。
【0028】なお、式(1)に示す条件を満足する雑音
の残差の振幅スペクトルの推定値μk(ejw)は、あら
かじめ計算しておくことができ、さらに式(3a)また
は(3b)から、式(2)における右辺のHk(ω)Hk
-1(ω)・・・H0(ω)は、フレームごとに計算する
ことができる
【0029】従って、式(2)に示される雑音が除去さ
れた音声信号のスペクトルYi(k)(ejw)は、フレーム
順に算出することができ、この場合、音声からの雑音除
去による処理時間の遅れを低減することができる。
【0030】ステップS8において、雑音の残差の振幅
スペクトルの推定値μk(ejw)の各周波数成分すべて
が所定値r以下であると判定された場合、即ち入力され
た音声信号に含まれる雑音が十分除去されたと考えられ
る場合、ステップS9に進み、雑音が除去された音声信
号のスペクトルYi(k)(ejw)が、次式にしたがって逆
フーリエ変換されることにより、時領域の音声信号yi
(k)(n)に変換され、ステップS10に進む。
【0031】
【数5】
【0032】ステップS10において、フレームごとの
音声信号yi(k)(n)が、pサンプルずつずらしながら
重ね合わされ、雑音が十分除去された音声信号として復
元されて、処理を終了する。
【0033】以上のようにして、雑音除去部2(図1)
で雑音が十分除去された音声信号は、符号化部3に入力
され、そこで符号化される。そして、伝送部4におい
て、符号化部3で符号化された音声信号が変調され、電
波として放射、あるいは伝送信号として伝送路に出力さ
れる。
【0034】次に、図5は、本発明を適用した音声認識
装置の一実施例の構成を示すブロック図である。図中、
図1の音声通信装置における場合と対応する部分につい
ては同一の符号を付してある。音響分析部11は、入力
された音声を音響分析し、例えば線形予測係数やケプス
トラム係数、所定の周波数帯域ごとのパワー、フォルマ
ント、またはゼロクロス数などの音声の特徴パラメータ
を抽出する。認識部12は、DPマッチング法やHMM
法、特開昭60−249198、特開昭60−2491
99、または特開昭60−252396などに開示され
ている音声認識装置の音声認識アルゴリズムなどに基づ
いて、入力された音声の特徴パラメータから音声認識処
理を行う。
【0035】以上のように構成される音声認識装置にお
いては、A/D変換部1において、入力された音声信号
が、所定のサンプリング周波数fsでサンプリングさ
れ、雑音除去部2に出力される。雑音除去部2では、A
/D変換部1からの音声信号に含まれる雑音が、上述し
たように図2に示すフローチャートにしたがって、十分
除去される。
【0036】雑音の十分除去された音声信号は、音響分
析部11に入力され、そこで音声の特徴パラメータが抽
出されて、認識部12に出力される。認識部12におい
て、音響分析部11からの音声の特徴パラメータから、
所定の音声認識アルゴリズムに基づいて、入力された音
声が認識される。そして、この認識結果は、例えば図示
せぬ装置を音声により操作するため(音声により所定の
タスクを実行させるため)に用いられる。
【0037】以上のように、雑音が十分除去された音声
に対して認識処理が行われるので、音声の認識率を向上
させることができる。
【0038】以上、本発明を音声通信装置と音声認識装
置に適用した場合について説明したが、本発明は、他の
音声を処理するあらゆる装置に適用することができる。
【0039】
【発明の効果】請求項1に記載の雑音除去方法によれ
ば、音声信号の無音声区間から、雑音の振幅スペクトル
の推定値を算出し、音声信号の振幅スペクトルから、推
定値を減算することを、推定値が所定値以下に収束する
まで繰り返す。従って、音声信号に含まれる雑音を、常
に十分に除去することができる。
【0040】請求項2に記載の雑音除去装置によれば、
算出手段において、音声信号の振幅スペクトルが算出さ
れ、推定手段において、そのうちの無音声区間に対応す
る振幅スペクトルから、雑音の振幅スペクトルの推定値
が算出される。そして、減算手段において、音声信号の
振幅スペクトルから、推定値が減算され、判定手段にお
いて、推定値が、所定値以下に収束しているか否かが判
定される。従って、判定手段の判定結果により、推定手
段で算出された推定値が、所定値以下に収束するまで、
減算手段および推定手段における処理動作を繰り返すよ
うにすることができるので、音声信号に含まれる雑音
を、常に十分に除去することができる。
【図面の簡単な説明】
【図1】本発明を適用した音声通信装置の一実施例の構
成を示すブロック図である。
【図2】図1の実施例の雑音除去部2の動作を説明する
フローチャートである。
【図3】図2のフローチャートのステップS1のウイン
ドウがけの処理を説明する図である。
【図4】音声信号に含まれる雑音の振幅スペクトルの推
定値を算出するのに用いる無音声区間を示す図である。
【図5】本発明を適用した音声認識装置の一実施例の構
成を示すブロック図である。
【符号の説明】
1 A/D変換部 2 雑音除去部 3 符号化部 4 伝送部 11 音響分析部 12 認識部
───────────────────────────────────────────────────── フロントページの続き (56)参考文献 特開 平3−179500(JP,A) 特開 平2−93697(JP,A) 特開 平4−238399(JP,A) 特開 昭60−69697(JP,A) 特開 平4−340599(JP,A) 特開 平3−212697(JP,A) 特開 昭60−140399(JP,A) (58)調査した分野(Int.Cl.7,DB名) G10L 21/02 G10L 15/20

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】 音声信号から雑音を除去する雑音除去方
    法において、 前記音声信号の無音声区間から、前記雑音の振幅スペク
    トルの推定値を算出し、前記音声信号の振幅スペクトル
    から、前記推定値を減算することを、前記推定値が所定
    値以下に収束するまで繰り返すことを特徴とする雑音除
    去方法。
  2. 【請求項2】 音声信号から雑音を除去する雑音除去装
    置において、 前記音声信号の振幅スペクトルを算出する算出手段と、 前記音声信号の無音声区間に対応する前記振幅スペクト
    ルから、前記雑音の振幅スペクトル推定値を算出する
    推定手段と、 前記音声信号の振幅スペクトルから、前記推定値を減算
    する減算手段と、 前記推定値が所定値以下に収束しているか否かを判定す
    る判定手段とを備えることを特徴とする雑音除去装置。
JP06411193A 1993-03-23 1993-03-23 雑音除去方法および雑音除去装置 Expired - Fee Related JP3270866B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP06411193A JP3270866B2 (ja) 1993-03-23 1993-03-23 雑音除去方法および雑音除去装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP06411193A JP3270866B2 (ja) 1993-03-23 1993-03-23 雑音除去方法および雑音除去装置

Publications (2)

Publication Number Publication Date
JPH06274196A JPH06274196A (ja) 1994-09-30
JP3270866B2 true JP3270866B2 (ja) 2002-04-02

Family

ID=13248640

Family Applications (1)

Application Number Title Priority Date Filing Date
JP06411193A Expired - Fee Related JP3270866B2 (ja) 1993-03-23 1993-03-23 雑音除去方法および雑音除去装置

Country Status (1)

Country Link
JP (1) JP3270866B2 (ja)

Families Citing this family (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
SE505156C2 (sv) * 1995-01-30 1997-07-07 Ericsson Telefon Ab L M Förfarande för bullerundertryckning genom spektral subtraktion
CN1121684C (zh) * 1995-09-14 2003-09-17 艾利森公司 用于选择性地改变一帧数字信号的方法和装置
JP3566197B2 (ja) * 2000-08-31 2004-09-15 松下電器産業株式会社 雑音抑圧装置及び雑音抑圧方法
JP3453130B2 (ja) * 2001-08-28 2003-10-06 日本電信電話株式会社 雑音源判別装置及び方法
JP4891805B2 (ja) * 2007-02-23 2012-03-07 日本電信電話株式会社 残響除去装置、残響除去方法、残響除去プログラム、記録媒体
JP5633673B2 (ja) * 2010-05-31 2014-12-03 ヤマハ株式会社 雑音抑圧装置およびプログラム
JP6221257B2 (ja) * 2013-02-26 2017-11-01 沖電気工業株式会社 信号処理装置、方法及びプログラム
JP6221258B2 (ja) * 2013-02-26 2017-11-01 沖電気工業株式会社 信号処理装置、方法及びプログラム

Also Published As

Publication number Publication date
JPH06274196A (ja) 1994-09-30

Similar Documents

Publication Publication Date Title
USRE43191E1 (en) Adaptive Weiner filtering using line spectral frequencies
JP3423906B2 (ja) 音声の動作特性検出装置および検出方法
US6173258B1 (en) Method for reducing noise distortions in a speech recognition system
JP4753821B2 (ja) 音信号補正方法、音信号補正装置及びコンピュータプログラム
JPH07271394A (ja) 確実な電話音声認識のための信号バイアスの除去
JPH0743598B2 (ja) 音声認識方法
JP2000132177A (ja) 音声処理装置及び方法
US20060165202A1 (en) Signal processor for robust pattern recognition
US20190139567A1 (en) Voice Activity Detection Feature Based on Modulation-Phase Differences
US5732388A (en) Feature extraction method for a speech signal
JP3907194B2 (ja) 音声認識装置、音声認識方法及び音声認識プログラム
JP2000132181A (ja) 音声処理装置及び方法
KR20030009516A (ko) 스피치 향상 장치
JP3270866B2 (ja) 雑音除去方法および雑音除去装置
US6965860B1 (en) Speech processing apparatus and method measuring signal to noise ratio and scaling speech and noise
JP2002123298A (ja) 信号符号化方法、装置及び信号符号化プログラムを記録した記録媒体
JP2007093635A (ja) 既知雑音除去装置
JP3354252B2 (ja) 音声認識装置
JPH08221097A (ja) 音声成分の検出法
JP3510458B2 (ja) 音声認識システムおよび音声認識制御プログラムを記録した記録媒体
JP2002023790A (ja) 音声特徴量抽出装置
JP4325044B2 (ja) 音声認識システム
US7155387B2 (en) Noise spectrum subtraction method and system
JPH11327593A (ja) 音声認識システム
JP3761497B2 (ja) 音声認識装置、音声認識方法、および、音声認識プログラム

Legal Events

Date Code Title Description
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20011204

LAPS Cancellation because of no payment of annual fees