JP2002258893A - 雑音推定装置、雑音除去装置及び記憶媒体 - Google Patents
雑音推定装置、雑音除去装置及び記憶媒体Info
- Publication number
- JP2002258893A JP2002258893A JP2001055700A JP2001055700A JP2002258893A JP 2002258893 A JP2002258893 A JP 2002258893A JP 2001055700 A JP2001055700 A JP 2001055700A JP 2001055700 A JP2001055700 A JP 2001055700A JP 2002258893 A JP2002258893 A JP 2002258893A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- frequency
- frequency domain
- input signal
- estimating
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Monitoring And Testing Of Transmission In General (AREA)
- Noise Elimination (AREA)
Abstract
理が可能な雑音推定装置、雑音除去装置を提供すること
を目的とする。 【解決手段】 本発明は、音声信号における雑音を推定
する雑音推定装置であり、所定期間の入力信号を抽出す
る時間領域抽出部12と、抽出された所定期間の入力信
号を周波数領域信号に変換する時間・周波数変換部13
と、周波数領域信号を所定周波数帯域毎に周波数領域分
割する周波数領域分割部14と、雑音を推定する雑音推
定部15とを有し、前記雑音推定部15は、分割された
周波数領域毎に、過去の所定期間の周波数領域信号を参
照して雑音を推定することを特徴とする。
Description
音除去装置及び記憶媒体に関する。
ル上で雑音成分のスペクトルを減算するスペクトルサブ
トラクション法がある。
方法でありながら、雑音除去効果が大きく、一般に広く
用いられている。時間kにおける音声信号s(k)に雑音
信号n(k)が加算されて、信号y(k)は生じたとする。
フーリエ変換して、 Y(f)=S(f)+N(f) …(2) と表すことができる。なお、Y(f)、S(f)及びN
(f)は、y(k)、s(k)及びn(k)をフーリエ変換した
ものである。フーリエ変換を行う信号の区間(フレー
ム)を長く、例えば、25ms程度の長さに設定するこ
とにより、実用上、s(k)とn(k)を独立と見なすことが
可能となる。
Y(f)からN(f)を引くことにより、元の音声信号
S(f)を得て、それを逆フーリエ変換することで、雑
音のない音声信号s(k)を得ることができる。
しいので、実用上は、あらかじめ、推定したN(f)を
用いる。N(f)は、雑音のスペクトルを対象フレーム
の直前数フレームの平均値や、無音声区間と思われる部
分の平均値を使用して推定する。
号から、直接、雑音のスペクトルを推定するのは難しい
ので、上記のような平均値を雑音スペクトルの値として
代用するのが一般的である。
きめのα倍して、差し引くと良いことが分かっている。
(4)式を用いる。
雑音推定方法である対象フレームの直前数フレームの平
均値や、無音声区間と思われるフレームの平均値を使用
して行う雑音スペクトル推定方法では、推定された雑音
値は、数フレーム又は無音声区間と思われるフレームの
平均値をも使用して行うために、局所的な誤差を含むと
いう問題がある。また、従来の雑音推定方法で推定した
雑音の値が小さく、雑音スペクトルを引き算しても効果
のない場合が生じたり、推定した雑音の値の方が、実際
の音声の信号より大きくなり、雑音スペクトルを引き算
した結果、マイナスになる場合が生じるという問題があ
る(特に、上記(4)式を用いた場合に、顕著とな
る。)。
定値よりやや大きめの値を用いて、引き算を行い、引き
算した値に対して、最低のレベルを設定し、それ以下に
はしないフロアリング処理等を行うことが必要となる。
を雑音として扱う場合では、雑音の無い音声に対してこ
の処理を行うと、逆に処理後の値を劣化させてしまう要
因にもなる。
あり、雑音の推定精度が高く、簡易で且つ高速な処理が
可能な雑音推定装置、雑音除去装置を提供することを目
的とするものである。
に、本件発明は、以下の特徴を有する課題を解決するた
めの手段を採用している。
おける雑音を推定する雑音推定装置において、所定期間
の入力信号を抽出する時間領域抽出手段(例えば、図1
における時間領域抽出部12)と、抽出された所定期間
の入力信号を周波数領域信号に変換する時間・周波数変
換手段(例えば、図1における時間・周波数変換部1
3)と、前記時間・周波数変換手段により周波数領域信
号に変換された入力信号を所定周波数帯域毎に周波数領
域分割する周波数領域分割手段(例えば、図1における
周波数領域分割部14)と、雑音を推定する雑音推定手
段(例えば、図1における雑音推定部15)とを有し、
前記雑音推定手段は、分割された周波数領域毎に、過去
の1又は複数の所定期間の周波数領域信号を参照して雑
音を推定することを特徴とする。
で且つ高速な処理が可能な雑音推定装置を提供すること
ができる。
載の雑音推定装置において、前記雑音推定装置は、周波
数領域信号の振幅値に基づいて推定することを特徴とす
る。
振幅値に基づいて雑音を推定しているので、高精度の雑
音スペクトルの推定を行うことができる。
は2記載の雑音推定装置において、前記雑音推定装置
は、過去の1又は複数の所定期間における特定の周波数
領域信号の内、最小の振幅値の周波数領域信号を、該特
定の周波数領域の雑音と推定することを特徴とする。
内、最小の振幅値の周波数領域信号を雑音と推定してい
るので、雑音の無い音声に対して処理を行っても処理後
劣化がほとんどない。
ら雑音除去する雑音除去装置において、所定期間の入力
信号を抽出する時間領域抽出手段と、抽出された所定期
間の入力信号を周波数領域信号に変換する時間・周波数
変換手段と、前記時間・周波数変換手段により周波数領
域信号に変換された入力信号を所定周波数帯域毎に周波
数領域分割する周波数領域分割手段と、雑音を除去する
雑音除去手段とを有し、前記雑音除去手段は、分割され
た周波数領域毎に推定された雑音を引き算して、雑音を
除去することを特徴とする。
で且つ高速な処理が可能な雑音除去装置を提供すること
ができる。
おける雑音を推定するプログラムを記憶した記憶媒体に
おいて、コンピュータを、所定期間の入力信号を抽出す
る時間領域抽出手段と、抽出された所定期間の入力信号
を周波数領域信号に変換する時間・周波数変換手段と、
前記時間・周波数変換手段により周波数領域信号に変換
された入力信号を所定周波数帯域毎に周波数領域分割す
る周波数領域分割手段と、分割された周波数領域毎に、
過去の1又は複数の所定期間の周波数領域信号を参照し
て雑音を推定する前記雑音推定手段として、機能させる
プログラムを記憶した記憶媒体である。
で且つ高速な処理が可能な雑音を推定するプログラムを
記憶した記憶媒体を提供することができる。
ら雑音除去するプログラムを記憶した記憶媒体におい
て、コンピュータを、所定期間の入力信号を抽出する時
間領域抽出手段と、抽出された所定期間の入力信号を周
波数領域信号に変換する時間・周波数変換手段と、前記
時間・周波数変換手段により周波数領域信号に変換され
た入力信号を所定周波数帯域毎に周波数領域分割する周
波数領域分割手段と、分割された周波数領域毎に推定さ
れた雑音を引き算して、雑音を除去する雑音除去手段と
して、機能させるプログラムを記憶した記憶媒体であ
る。
で且つ高速な処理が可能な雑音を除去するプログラムを
記憶した記憶媒体を提供することができる。
て図面と共に説明する。本実施の形態における雑音推定
装置10は、所定期間の入力信号を抽出する時間領域抽
出部12、抽出された所定期間の入力信号を周波数領域
信号に変換する時間・周波数変換部13、周波数領域信
号を所定周波数帯域毎に周波数領域分割する周波数領域
分割部14、雑音を推定する雑音推定部15を有する。
また、雑音推定部15は、周波数領域分析部16と最低
値検出部17から構成されている。
信号(音声データ)11から雑音を除去する装置であ
る。時間・周波数変換部13がFFT(Fast Fourier
Transform)を用いて周波数軸の信号(データ)に変
換できるように、時間領域抽出部12は、時間軸の信号
(データ)である入力信号(音声データ)11を、所定
期間(フレーム)毎に入力信号を抽出する。図2(A)
に示すように、例えば、25ms間の信号(フレーム)
を10ms毎に抽出する。時間・周波数変換部13は、
FFTにより、10ms毎に抽出された、25ms間の
信号(フレーム)を、周波数軸の信号(データ)に変換
する。周波数領域分割部14は、周波数領域信号を、時
間・周波数変換部13から得て、図2(B)に示すよう
に、所定周波数帯域(フィルタバンク)毎に周波数領域
分割する。各バンクは、図2(C)に示すような、振幅
スペクトルを有し、そのスペクトル数は同一である。
ものでもよく、人間の特性に合わせて、周波数が高くな
るに従い、帯域を拡大したバンク(メル・スケール・フ
ィルタ・バンク)としてもよい。
6は、フィルタバンク毎に、フィルタバンクの値(振幅
スペクトルの重み付き和)を求めて、フィルタバンク値
データベース18に格納する。
ケール・フィルタ・バンクに対して、バンクの中心が最
大のウエイトでバンクの端が零になる△状のウエイトに
より、各バンクのスペクトルを乗算し、その結果の振幅
値(1、2…Bi(t)…)を示す。
Bi(t)とする。最低値検出部17は、各バンク毎に、
過去のTフレーム前までのフィルタバンクの値をフィル
タバンク値データベース18から読み出して、最低のフ
ィルタバンクの値を検出する。前記雑音推定部15は、
この最低のフィルタバンク値を現在の雑音Ni(t)と推
定する。
ム前迄を雑音の推定に使用することを意味している。
いて説明する。
は、所定期間の入力信号を抽出する時間領域抽出部2
2、抽出された所定期間の入力信号を周波数領域信号に
変換する時間・周波数変換部23、周波数領域信号を所
定周波数帯域毎に周波数領域分割する周波数領域分割部
24、雑音を除去する雑音除去部25を有する。
23、周波数領域分割部24は、図1の時間領域抽出部
12、時間・周波数変換部13、周波数領域分割部14
と同じであるので、説明を省略する。
がバンク毎に除去される。つまり、バンクに分割された
雑音を有する音声信号から、バンク毎に、推定された雑
音を除去する。
を行う。
バンクの値Bi(t)’を雑音除去装置20の出力とす
る。
合に、0.5Bi(t)としたが、0でもよい。本実施の
形態では、実際には、Ni(t)=Bi(t)の場合であって
も、雑音でない可能性もあるので、Bi(t)’を0.5
Bi(t)とした。
いて説明する。
は、図1の雑音推定装置と図4の雑音除去装置を合体し
たものである。
出部32、抽出された所定期間の入力信号を周波数領域
信号に変換する時間・周波数変換部33、周波数領域信
号を所定周波数帯域毎に周波数領域分割する周波数領域
分割部34、雑音を推定する雑音推定部35及び雑音を
除去する雑音除去部35を有する。
ンクに分割された雑音を有する音声信号を、バンク毎に
推定された雑音を除去する。
に入力されて音声認識される。音響分析装置30の出力
を音声認識した単語正解精度を図6に示す。中継現場レ
ポート及び背景音のあるアナウンサーの読み上げた音声
についての、音声認識の結果である。これによれば、高
速な処理による雑音除去を行っているにも拘わらず、単
語正解精度は高い。
推定することにより、高精度の雑音スペクトルの推定を
行うことができる。
推定しているので、雑音の無い音声に対して処理を行っ
ても処理後劣化がほとんどない。
パラメータ数を削減し処理量を少なくすることができ
る。
精度が高く、簡易で且つ高速な処理が可能な雑音推定装
置、雑音除去装置を提供することができる。
である。
ための図である。
したときの、単語正解精度を説明するための図である。
Claims (6)
- 【請求項1】 入力信号における雑音を推定する雑音推
定装置において、 所定期間の入力信号を抽出する時間領域抽出手段と、 抽出された所定期間の入力信号を周波数領域信号に変換
する時間・周波数変換手段と、 前記時間・周波数変換手段により周波数領域信号に変換
された入力信号を所定周波数帯域毎に周波数領域分割す
る周波数領域分割手段と、 雑音を推定する雑音推定手段とを有し、 前記雑音推定手段は、分割された周波数領域毎に、過去
の1又は複数の所定期間の周波数領域信号を参照して雑
音を推定することを特徴とする雑音推定装置。 - 【請求項2】 請求項1記載の雑音推定装置において、 前記雑音推定装置は、周波数領域信号の振幅値に基づい
て推定することを特徴とする雑音推定装置。 - 【請求項3】 請求項1又は2記載の雑音推定装置にお
いて、 前記雑音推定装置は、過去の1又は複数の所定期間にお
ける特定の周波数領域信号の内、最小の振幅値の周波数
領域信号を、該特定の周波数領域の雑音と推定すること
を特徴とする雑音推定装置。 - 【請求項4】 入力信号から雑音除去する雑音除去装置
において、 所定期間の入力信号を抽出する時間領域抽出手段と、 抽出された所定期間の入力信号を周波数領域信号に変換
する時間・周波数変換手段と、 前記時間・周波数変換手段により周波数領域信号に変換
された入力信号を所定周波数帯域毎に周波数領域分割す
る周波数領域分割手段と、 雑音を除去する雑音除去手段とを有し、 前記雑音除去手段は、分割された周波数領域毎に推定さ
れた雑音を引き算して、雑音を除去することを特徴とす
る雑音除去装置。 - 【請求項5】 入力信号における雑音を推定するプログ
ラムを記憶した記憶媒体において、 コンピュータを、 所定期間の入力信号を抽出する時間領域抽出手段と、 抽出された所定期間の入力信号を周波数領域信号に変換
する時間・周波数変換手段と、 前記時間・周波数変換手段により周波数領域信号に変換
された入力信号を所定周波数帯域毎に周波数領域分割す
る周波数領域分割手段と、 分割された周波数領域毎に、過去の1又は複数の所定期
間の周波数領域信号を参照して雑音を推定する前記雑音
推定手段として、機能させるプログラムを記憶した記憶
媒体。 - 【請求項6】 入力信号から雑音除去するプログラムを
記憶した記憶媒体において、 コンピュータを、 所定期間の入力信号を抽出する時間領域抽出手段と、 抽出された所定期間の入力信号を周波数領域信号に変換
する時間・周波数変換手段と、 前記時間・周波数変換手段により周波数領域信号に変換
された入力信号を所定周波数帯域毎に周波数領域分割す
る周波数領域分割手段と、 分割された周波数領域毎に推定された雑音を引き算し
て、雑音を除去する雑音除去手段として、機能させるプ
ログラムを記憶した記憶媒体。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001055700A JP2002258893A (ja) | 2001-02-28 | 2001-02-28 | 雑音推定装置、雑音除去装置及び記憶媒体 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2001055700A JP2002258893A (ja) | 2001-02-28 | 2001-02-28 | 雑音推定装置、雑音除去装置及び記憶媒体 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2002258893A true JP2002258893A (ja) | 2002-09-11 |
Family
ID=18915847
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2001055700A Pending JP2002258893A (ja) | 2001-02-28 | 2001-02-28 | 雑音推定装置、雑音除去装置及び記憶媒体 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2002258893A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008085613A (ja) * | 2006-09-27 | 2008-04-10 | Toyota Motor Corp | 音声認識装置、音声認識方法、移動体、及びロボット |
-
2001
- 2001-02-28 JP JP2001055700A patent/JP2002258893A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2008085613A (ja) * | 2006-09-27 | 2008-04-10 | Toyota Motor Corp | 音声認識装置、音声認識方法、移動体、及びロボット |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US9064498B2 (en) | Apparatus and method for processing an audio signal for speech enhancement using a feature extraction | |
US7286980B2 (en) | Speech processing apparatus and method for enhancing speech information and suppressing noise in spectral divisions of a speech signal | |
US6122610A (en) | Noise suppression for low bitrate speech coder | |
EP2031583B1 (en) | Fast estimation of spectral noise power density for speech signal enhancement | |
US7957964B2 (en) | Apparatus and methods for noise suppression in sound signals | |
EP1768108A1 (en) | Noise suppression device and noise suppression method | |
KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
JP5752324B2 (ja) | 雑音の入った音声信号中のインパルス性干渉の単一チャネル抑制 | |
US7428490B2 (en) | Method for spectral subtraction in speech enhancement | |
US11622208B2 (en) | Apparatus and method for own voice suppression | |
JP4434813B2 (ja) | 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置 | |
KR20160116440A (ko) | 음성인식 시스템의 신호대잡음비 추정 장치 및 방법 | |
EP1635331A1 (en) | Method for estimating a signal to noise ratio | |
JP3279254B2 (ja) | スペクトル雑音除去装置 | |
JP2002258893A (ja) | 雑音推定装置、雑音除去装置及び記憶媒体 | |
Upadhyay et al. | Single channel speech enhancement utilizing iterative processing of multi-band spectral subtraction algorithm | |
Nower et al. | Restoration of instantaneous amplitude and phase using Kalman filter for speech enhancement | |
Upadhyay et al. | A perceptually motivated stationary wavelet packet filterbank using improved spectral over-subtraction for enhancement of speech in various noise environments | |
JP3761497B2 (ja) | 音声認識装置、音声認識方法、および、音声認識プログラム | |
Samui et al. | Two-Stage Temporal Processing for Single-Channel Speech Enhancement. | |
Shimamura et al. | Noise estimation with an inverse comb filter in non-stationary noise environments | |
Ma et al. | A perceptual kalman filtering-based approach for speech enhancement | |
Hendriks et al. | Adaptive time segmentation of noisy speech for improved speech enhancement | |
Uriz et al. | Low complexity noise power estimator for speech enhancement implemented on a dsPIC | |
Liu et al. | Restoration of instantaneous amplitude and phase of speech signal in noisy reverberant environments |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20060214 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20081212 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20090106 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20090227 |
|
A02 | Decision of refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A02 Effective date: 20091201 |