JPH04245300A - 雑音除去装置 - Google Patents
雑音除去装置Info
- Publication number
- JPH04245300A JPH04245300A JP3054151A JP5415191A JPH04245300A JP H04245300 A JPH04245300 A JP H04245300A JP 3054151 A JP3054151 A JP 3054151A JP 5415191 A JP5415191 A JP 5415191A JP H04245300 A JPH04245300 A JP H04245300A
- Authority
- JP
- Japan
- Prior art keywords
- noise
- feature vector
- time
- stationary
- stationary noise
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 239000013598 vector Substances 0.000 claims abstract description 171
- 238000000605 extraction Methods 0.000 claims abstract description 60
- 238000012937 correction Methods 0.000 claims description 34
- 238000001228 spectrum Methods 0.000 abstract description 4
- 230000003595 spectral effect Effects 0.000 description 23
- 238000010586 diagram Methods 0.000 description 14
- 238000000034 method Methods 0.000 description 6
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 239000000284 extract Substances 0.000 description 3
- 238000002474 experimental method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 101000822695 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C1 Proteins 0.000 description 1
- 101000655262 Clostridium perfringens (strain 13 / Type A) Small, acid-soluble spore protein C2 Proteins 0.000 description 1
- 101000582320 Homo sapiens Neurogenic differentiation factor 6 Proteins 0.000 description 1
- 102100030589 Neurogenic differentiation factor 6 Human genes 0.000 description 1
- 101000655256 Paraclostridium bifermentans Small, acid-soluble spore protein alpha Proteins 0.000 description 1
- 101000655264 Paraclostridium bifermentans Small, acid-soluble spore protein beta Proteins 0.000 description 1
- 238000004378 air conditioning Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000007796 conventional method Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000001629 suppression Effects 0.000 description 1
- 230000002195 synergetic effect Effects 0.000 description 1
Landscapes
- Circuit For Audible Band Transducer (AREA)
Abstract
め要約のデータは記録されません。
Description
いることができる、雑音中で発生された音声から雑音を
除去する技術に関するものである。
使用環境により様々な雑音が存在し、これらの雑音が音
声認識の認識率低下や通信の了解度を低下させる大きな
要因となっている。このような雑音には、例えば空調,
エンジン,モータ等の個体雑音などの短時間では性質が
余り変化しない定常的な雑音や、周囲の人間による話し
声、物体の移動音等の突発的な短時間でも性質が大きく
変化する非定常な雑音がある。
声の中から雑音部分を推定し、推定した雑音を、雑音を
含む音声から除去してクリアな音声に変換する、いわゆ
るスぺクトルサブトラクションと呼ばれる手法が存在し
ている。
ession of Acoustic Noi
se in Speech Using Sp
ectral Subtraction”,IEEE
Trans. on ASSP,Vol.AS
SP−27,No.2,pp.113−120(Apr
il,1979)に述べられているような、定常雑音の
除去を目的とした1つのチャンネルからの入力を用いる
スぺクトルサブトラクション(以後、1chスぺクトル
サブトラクションと称す)を用いた雑音除去装置は、図
7に示すような構成となっている。すなわち図7では、
マイクロホン201にて入力された雑音を含む音声が特
徴抽出部202にて時系列特徴ベクトルに変換され、定
常雑音推定部203は特徴抽出部202から得られた時
系列特徴ベクトルのなかから定常雑音の特徴ベクトルを
推定する。さらに、定常雑音除去部204は特徴抽出部
202が出力する雑音を含んだ時系列特徴ベクトル全体
から定常雑音推定部203にて推定した定常雑音の特徴
ベクトルを差し引き、定常雑音除去後のクリアな時系列
特徴ベクトルを出力する。
力による雑音除去手法を用いた自動車内の音声認識”、
電子情報通信学会技術研究報告,SP89−81,pp
.41−48(1989)に述べられているような、非
定常雑音の除去を目的とした2つのチャンネルを用いた
スぺクトルサブトラクション(以後、2chスぺクトル
サブトラクションと称す)を用いた雑音除去装置は、図
8に示すような構成となっている。すなわち図8では、
音声を主に集音するマイクロホン211と、マイクロホ
ン211に近接して設置した周囲雑音を主に集音するマ
イクロホン212とを設け、マイクロホン211はなる
べく音声が混入しない位置に設置し、音声とその近隣の
周囲雑音とを同時に2chで集音する。マイクロホン2
11にて入力された雑音を含む音声は特徴抽出部213
にて雑音を含む時系列特徴ベクトルに変換され、マイク
ロホン212にて入力された周囲雑音は特徴抽出部21
4にて雑音の時系列特徴ベクトルに変換される。補正係
数計算部215では、特徴抽出部213から得られた雑
音を含む音声の時系列特徴ベクトルと特徴抽出部214
から得られた雑音の時系列特徴ベクトルのうちの音声を
含まない同じ時間位置を比較して2入力間の補正係数を
算出する。非定常雑音推定部216では、補正係数計算
部215にて計算された補正係数を特徴抽出部214に
て得られた雑音の時系列特徴ベクトル全体に乗ずること
により、特徴抽出部213が出力する雑音を含む音声の
時系列特徴ベクトル中に含まれる非定常雑音の時系列特
徴ベクトルを推定する。非定常雑音除去部217では特
徴抽出部213にて得られた雑音を含む音声の時系列特
徴ベクトルから非定常雑音推定部216にて推定された
雑音の時系列特徴ベクトルを差し引くことにより非定常
雑音除去後のクリアな音声の時系列特徴ベクトルを出力
する。
chスぺクトルサブトラクションにおいては定常的な雑
音を仮定しているので、音声に非定常雑音を含む様な実
環境で用いた場合にはうまく非定常雑音が除去できない
という欠点を有していた。
ションにおいては、マイクロホン211とマイクロホン
212を完全に同じ位置に設置できないため、音声を入
力するマイクロホン211に入力される雑音と周囲雑音
を入力するマイクロホン212に入力される雑音の特性
が完全に同一とはならず、音声に含まれるノイズのうち
定常雑音が占める割合が大きい場合には、従来の1ch
スぺクトルサブトラクションに比べて雑音除去性能が低
くなるという欠点を有していた。
あり、その目的は、音声に混入した定常雑音も非定常雑
音も雑音の性質に依らず効率よく除去する雑音除去装置
を提供することにある。
除去装置は、音声を集音する第1のマイクロホンと、周
囲雑音を集音する第2のマイクロホンと、第1のマイク
ロホンから入力された音声を時系列特徴ベクトルに変換
する第1の特徴抽出部と、第2のマイクロホンより入力
された周囲雑音を時系列特徴ベクトルに変換する第2の
特徴抽出部と、第1の特徴抽出部が出力する時系列特徴
ベクトルから定常雑音を除去する第1の定常雑音除去部
と、第2の特徴抽出部が出力する時系列特徴ベクトルか
ら定常雑音を除去する第2の定常雑音除去部と、第1の
定常雑音除去部が出力する時系列特徴ベクトルと第2の
定常雑音除去部とを用いて非定常雑音を除去する非定常
雑音除去部とを有する。
を集音する第1のマイクロホンと、周囲雑音を集音する
第2のマイクロホンと、第1のマイクロホンから入力さ
れた音声を時系列特徴ベクトルに変換する第1の特徴抽
出部と、第2のマイクロホンより入力された周囲雑音を
時系列特徴ベクトルに変換する第2の特徴抽出部と、第
1の特徴抽出部から得られた時系列特徴ベクトルと第2
の特徴抽出部から得られた時系列特徴ベクトルとを用い
て非定常雑音を除去する非定常雑音除去部と、非定常雑
音除去部が出力する時系列特徴ベクトルから定常雑音を
除去する定常雑音除去部とを有する。
明第1の雑音除去装置に加えて、非定常雑音除去部が出
力する特徴ベクトルにホワイトノイズを付加するホワイ
トノイズ付加部を有する。
明による第2の雑音除去装置に加えて、定常雑音除去部
が出力する特徴ベクトルにホワイトノイズを付加するホ
ワイトノイズ付加部を有する。
明による第1または第3の雑音除去装置に加えて、第1
の特徴抽出部から出力された時系列特徴ベクトルと第2
の特徴抽出部から出力された時系列特徴ベクトルとから
2入力間の補正係数を求める補正係数計算部と、補正係
数と第2の定常雑音除去部が出力する特徴ベクトルと第
1の定常雑音除去部が出力する特徴ベクトルとを用いて
非定常雑音を除去する非定常雑音除去部を有することを
特徴とする。
明による第1または第2または第3または第4または第
5の雑音除去装置に加えて、第1の特徴抽出部が出力す
る特徴ベクトルから雑音区間を推定する雑音区間推定部
と、雑音区間推定部が推定した雑音区間内の時系列特徴
ベクトルを用いて定常雑音を除去する定常雑音除去部と
、雑音区間推定部が推定した雑音区間内の時系列特徴ベ
クトルを用いて非定常雑音を除去する非定常雑音除去部
とを有することを特徴とする。
囲雑音を入力するマイクロホンとを用いて、1chスぺ
クトルサブトラクションにより主として定常雑音を除去
する効果を得、2chスぺクトルサブトラクションによ
り非定常雑音を除去する効果を得ることにより、両者を
単独で用いた場合に有していた欠点を互いに補い、相乗
効果を得るものである。
作用を図1を用いて説明する。雑音を含む音声及び周囲
雑音はそれぞれ同時にマイクロホン1およびマイクロホ
ン2にて電気信号に変換され、それぞれ特徴抽出部3及
び特徴抽出部4にて時系列特徴ベクトルに変換される。 この特徴抽出部3及び特徴抽出部4は、入力信号の音響
的な特徴を時系列的に表現する時系列特徴ベクトル量へ
の変換器であり、例えば古井著:“ディジタル音声処理
”、東海大学出版,pp.37−49(1985)に述
べられているようなDFT(離散的フーリエ変換器:D
iscreteFourier Transform
er)あるいはFFT(高速フーリエ変換器:Fast
Fourier Transformer)ある
いはBPF(帯域フィルタバンク:Band Pas
s Filter Bank)等で構成され、例え
ばパワースペクトルあるいは振幅スペクトルあるいはB
PF出力等の特徴ベクトルの時系列データとして出力さ
れる。特徴抽出部3にて得られた時系列特徴ベクトルは
音声の前後に適当な長さの雑音を含んでおり、定常雑音
除去部5は特徴抽出部3から得られた時系列特徴ベクト
ルの中の発声直前または直後の雑音部分から定常雑音を
推定し、推定した定常雑音を入力された時系列特徴ベク
トル全体から除去する。時刻tにおける入力の時系列特
徴ベクトルをa(t)、雑音区間を時刻t=t1からt
=t2とする。このとき、定常雑音の特徴ベクトルbは
例えば、“オフィスオートメーション(OA)機器の標
準化に関する調査研究報告書(情報処理関連)”、日本
電子工業振興協会,pp.134−140(平成2年3
月)に述べられているように、
の全時系列特徴ベクトルを平均化したものを定常雑音と
する。この他、予め定めた区間の中のパワー最小の特徴
ベクトルを定常雑音としたり、定められた区間内の合計
パワー最小の数個の特徴ベクトルを平均したものを定常
雑音としても良い。次に、定常雑音除去部5は、入力の
時系列特徴ベクトルa(t)全体から、推定した定常雑
音bを除去する。入力の時系列特徴ベクトルがt=0か
らt=Tに亘り存在しているとき、定常雑音除去後の時
系列特徴ベクトルc(t)は、
場合は適当なしきい値(例えば0)にクリップするよう
にしても良い。定常雑音除去部6は定常雑音除去部5と
同様に入力の時系列特徴ベクトルから定常雑音を推定し
、推定した定常雑音を入力の時系列特徴ベクトル全体か
ら除去する。定常雑音除去部6の定常雑音推定は定常雑
音除去部5と同一の方法を用いても良いが、定常雑音除
去部5で求めた雑音区間t1,t2を用いて同じ時間位
置の時系列特徴ベクトルから定常雑音を推定する様にし
ても良い。このように定常雑音除去部5および定常雑音
除去部6にて音声の時系列特徴ベクトルと周囲雑音の時
系列特徴ベクトルとからそれぞれ定常雑音が除去される
が、実際の騒音環境のように多くの非定常雑音を含んで
いる場合は、このようにして定常雑音を除去された時系
列特徴ベクトルには、まだ多くの非定常雑音を含んでい
ることになる。非定常雑音除去部7は、まず定常雑音除
去部3にて定常雑音を除去された音声の時系列特徴ベク
トルと定常雑音除去部4にて定常雑音を除去された雑音
の時系列特徴ベクトルとから音声の時系列特徴ベクトル
に含まれる非定常雑音を推定する。2つのマイクロホン
にて入力された雑音は、たとえ同一音源から放射された
雑音であっても空間的な伝達経路が異なるため異なる特
性を有している。したがって、非定常雑音除去部7では
、まず2つのマイクロホンから入力された雑音を同一音
源からの雑音であるとみなし、2つの雑音の特性の補正
を行うための補正係数ベクトルαを求める。定常雑音除
去部3にて得られた音声の時系列特徴ベクトルs(t)
、定常雑音除去部4にて得られた周囲雑音の時系列特徴
ベクトルをn(t)、2つの雑音間の補正係数ベクトル
をα、予め定められた雑音区間の時刻をt=t3からt
=t4とすると、
られる。次に非定常雑音除去部7はここで求めたαを用
いて音声の時系列特徴ベクトルs(t)に含まれる非定
常雑音の時系列特徴ベクトルr(t)を推定する。すな
わち、t=0からt=Tなる時間区間の時系列特徴ベク
トルに対して、
定された非定常雑音r(t)を定常雑音除去後の音声の
時系列特徴ベクトルすなわちs(t)全体から除去する
。非定常雑音除去後の音声の時系列特徴ベクトルをc(
t)とすると、求める音声の時系列特徴ベクトルc(t
)は、
た成分は適当なクリップ値(例えば0)にクリップする
ように構成しても良い。すなわち、本発明による第1の
雑音除去装置は、まず2つの入力それぞれから1chス
ぺクトルサブトラクションを用いて定常雑音を除去し、
次に除去されずに残った雑音を非定常雑音とみなし2c
hスぺクトルサブトラクションを用いて除去することに
より、音声に多くの非定常雑音が含まれている場合には
非定常雑音除去が効果的に作用し従来の1chスぺクト
ルサブトラクションを単独で用いた場合より高い雑音除
去性能が得られ、音声に混入する雑音が殆ど定常な雑音
である場合には1chスぺクトルサブトラクションが有
効に作用して従来の2chスぺクトルサブトラクション
を単独で用いた場合より高い雑音除去性能が得られると
いう効果がある。例えば非定常雑音も定常雑音も多く含
む例として、展示会場で実際に収録した発声に対し、本
発明による第1の雑音除去装置を用いて雑音を除去した
後の音声を用いて音声認識実験を行った結果、そのまま
の音声の認識率は27.1%、従来の1chスぺクトル
サブトラクションを単独で用いた場合は55.6%、従
来の2chスペクトルサブトラクションを単独で用いた
場合は67.1%であったものが本発明による第1の雑
音除去装置を用いた場合の認識率は72.1%であり、
それぞれ単独で用いた場合より高い認識率が得られた。
示す。雑音を含む音声及び周囲雑音はそれぞれ同時にマ
イクロホン11およびマイクロホン12にて電気信号に
変換され、それぞれ特徴抽出部13及び特徴抽出部14
にて時系列特徴ベクトルに変換される。この特徴抽出部
13及び特徴抽出部14は、それぞれ図1における特徴
抽出部3及び4と同一の機能を有する。非定常雑音除去
部15は、特徴抽出部13にて得られた音声の時系列特
徴ベクトルと特徴抽出部14にて得られた周囲雑音の時
系列特徴ベクトルとを用いて、音声の時系列特徴ベクト
ルに含まれる非定常雑音を除去する。この非定常雑音除
去部15は図1における非定常雑音除去部7と同一の機
能を有する。この非定常雑音除去部15にて音声の時系
列特徴ベクトルに含まれる大部分の非定常雑音は除去さ
れるが、2つのマイクに入力される雑音が完全に同一で
はないため、音声の時系列特徴ベクトルに混入した雑音
は完全には除去されない。定常雑音除去部16は、非定
常雑音除去部15にて得られた音声の時系列特徴ベクト
ル中に除去されずに残った雑音を定常雑音とみなし除去
する。すなわち、本発明による第2の雑音除去装置は、
まず2chスぺクトルサブトラクションを用いて音声の
時系列特徴ベクトルに含まれる非定常雑音を除去し、続
いて除去されずに残った雑音を定常雑音とみなし1ch
スぺクトルサブトラクションを用いて除去することによ
り、音声に混入した非定常雑音も定常雑音も効率よく除
去されることになる。さらに、本発明による第1の雑音
除去装置に比べて、定常雑音除去部は1つで良く、より
少ない構成で同等の性能を有する雑音除去装置を実現す
ることが可能である。
示す。図3では、本発明による第1の雑音除去装置に加
えて、ホワイトノイズ付加部30にて非定常雑音除去部
7が出力する定常及び非定常雑音除去後の音声の時系列
特徴ベクトルに一定のホワイトノイズを付加する。この
ホワイトノイズ付加は雑音除去後の音声の時系列特徴ベ
クトルS(t)全体に、スペクトルの強度が周波数に対
して一定であるβなるホワイトノイズを付加する。ホワ
イトノイズ付加後の音声の時系列特徴ベクトルをV(t
)とすると、
ズを付加することにより、定常及び非定常の雑音除去操
作にて生じたパワーの低い音声の特徴ベクトルの細かい
変形による影響を除くものであり、よりクリアな音声を
得ることができる。実験によれば、本発明による第1の
雑音除去装置を用いて雑音を除去した音声を用いて認識
した場合に72.1%の認識率を有していたものが本発
明による第3の雑音除去装置を用いた場合92.1%と
なった。ここで加えるホワイトノイズは、スペクトルの
強度が周波数に対して一定であるホワイトノイズ以外に
も、様々な帯域を強調した、いわゆる“色の付いた”ノ
イズを用いても良い。
示す。図4では、本発明による第2の雑音除去装置に加
えて、ホワイトノイズ付加部40にて定常雑音除去部1
6が出力する非定常及び定常雑音除去後の音声の時系列
特徴ベクトルに一定のホワイトノイズを付加する。この
ホワイトノイズ付加部40は本発明による図3のホワイ
トノイズ付加部30と同一の機能を有し、βなるホワイ
トノイズを付加することにより、非定常及び定常の雑音
除去操作にて生じたパワーの低い音声の特徴ベクトルの
細かい変形による影響を除くものであり、よりクリアな
音声を得ることができる。
示す。図5では、本発明による第1の雑音除去装置を応
用した例を示すが、同様の構成を本発明による第3の雑
音除去装置に対して行っても良い。すなわち、図5では
本発明による第1の雑音除去装置に加えて、補正係数計
算部50にて、特徴抽出部3が出力する音声の時系列特
徴ベクトルd(t)と特徴抽出部4が出力する周囲雑音
の時系列特徴ベクトルe(t)とから2入力間の補正係
数ベクトルαを計算する。予め定めた雑音区間をt=t
1からt=t2とすると、
ず補正係数計算部50にて求めた補正係数ベクトルαと
定常雑音除去部6が出力する定常雑音除去後の周囲雑音
の時系列特徴ベクトルf(t)とを用いて、定常雑音除
去部5が出力する音声の時系列特徴ベクトルg(t)に
含まれる非定常雑音h(t)を推定する。すなわちt=
0からt=Tの時系列特徴ベクトルに対して、
の時系列特徴ベクトルg(t)から推定した非定常雑音
h(t)を除去する。得られた音声の時系列特徴ベクト
ルをk(t)とすると、
音除去装置は、定常雑音除去を行う前に予め2入力間の
補正係数を算出しておき、非定常雑音除去部51はこの
補正係数を用いて非定常雑音の除去を行う。このことに
より、定常雑音除去後の時系列特徴ベクトルから補正係
数を求める場合に比較して、より大きな信号をもとに補
正係数を推定できるので推定誤差が小さくなり、従って
より正確に非定常雑音の除去が可能となる。
示す。図6では、本発明による第1の雑音除去装置に対
して応用した例を示すが、本発明による第2または第3
または第4または第5の雑音除去装置に対しても同様な
構成をとることが可能である。すなわち図6では本発明
の第1の雑音除去装置に加えて、雑音区間推定部60は
、特徴抽出部3が出力する音声の時系列特徴ベクトルか
ら雑音区間を推定する。この雑音区間の推定方法は例え
ば、入力の時系列特徴ベクトルのパワー変化を監視して
おき、予め定めたしきい値以下のパワーを有する特徴ベ
クトルが予め定めた数以上持続する場合にこの区間を雑
音区間と定める。定常雑音推定部5は雑音区間推定部6
0が出力する雑音区間内の時系列特徴ベクトルから定常
雑音を推定し、入力の時系列特徴ベクトル全体から推定
した定常雑音を除去し、定常雑音除去部6は雑音区間推
定部60が出力する雑音区間内の時系列特徴ベクトルか
ら定常雑音を推定し、入力の時系列特徴ベクトル全体か
ら推定した定常雑音を除去する。また、非定常雑音除去
部7は雑音区間推定部60が出力する雑音区間内の2つ
の入力の特徴ベクトルから2入力間の補正係数を算出し
、求めた補正係数と周囲雑音の時系列特徴ベクトルとを
用いて音声の時系列特徴ベクトルに含まれる非定常雑音
を推定し、推定した非定常雑音を音声の時系列特徴ベク
トル全体から除去する。すなわち、本発明による第6の
雑音除去装置は、音声を入力するマイクロホンからの信
号をもとに雑音区間を推定する雑音区間推定部60を設
けることで雑音区間がより正しく推定でき、従って定常
及び非定常雑音をより正確に除去することが可能であり
、よりクリアな音声を得ることが可能となると同時に、
雑音区間推定部が1つでよいという利点を有する。
説明する。
を示す一実施例のブロック図である。この音声を集音す
るマイクロホン1と、周囲雑音を集音するマイクロホン
2と、マイクロホン1から入力された音声を時系列特徴
ベクトルに変換する特徴抽出部3と、マイクロホン2よ
り入力された周囲雑音を時系列特徴ベクトルに変換する
特徴抽出部4と、特徴抽出部3が出力する時系列特徴ベ
クトルから定常雑音を除去する定常雑音除去部5と、特
徴抽出部4が出力する時系列特徴ベクトルから定常雑音
を除去する定常雑音除去部6と、定常雑音除去部5が出
力する時系列特徴ベクトルと定常雑音除去部6が出力す
る時系列特徴ベクトルとを用いて非定常雑音を除去する
非定常雑音除去部7とを有している。
主に入力され電気信号に変換される。これと同時に、周
囲雑音はマイクロホン1に近接して設置され、マイクロ
ホン1に混入した雑音との相関が十分高くなるように設
置された周囲雑音を主に集音するマイクロホン2にて入
力され、電気信号に変換される。マイクロホン1に入力
された雑音を含む音声は特徴抽出部3にて雑音を含む音
声の時系列特徴ベクトルに変換され、マイクロホン2に
入力された周囲雑音は特徴抽出部4にて周囲雑音の時系
列特徴ベクトルに変換される。定常雑音除去部5では、
特徴抽出部3にて得られた雑音を含む音声の時系列特徴
ベクトルから定常雑音を推定し、推定した定常雑音を入
力の雑音を含む音声の時系列特徴ベクトル全体から除去
する。定常雑音除去部6では、特徴抽出部4にて得られ
た周囲雑音の時系列特徴ベクトルから定常雑音を推定し
、推定した定常雑音を入力の周囲雑音の時系列特徴ベク
トル全体から除去する。非定常雑音除去部7は、定常雑
音除去部5及び定常雑音除去部6が出力する定常雑音除
去後の2つの時系列特徴ベクトルを用いて2つの入力間
の補正係数を算出し、求めた補正係数と入力の定常雑音
除去後の周囲雑音の時系列特徴ベクトルとを用いて入力
の定常雑音除去後の音声の時系列特徴ベクトルに含まれ
る非定常雑音を推定し、推定した非定常雑音を入力の音
声の時系列特徴ベクトル全体から除去する。
を示す一実施例のブロック図である。この雑音除去装置
は、音声を集音するマイクロホン11と、周囲雑音を集
音するマイクロホン12と、マイクロホン11から入力
された音声を時系列特徴ベクトルに変換する特徴抽出部
13と、マイクロホン12より入力された周囲雑音を時
系列特徴ベクトルに変換する特徴抽出部14と、特徴抽
出部13から得られた時系列特徴ベクトルと特徴抽出部
14から得られた時系列特徴ベクトルとを用いて非定常
雑音を除去する非定常雑音除去部15と、非定常雑音除
去部15が出力する時系列特徴ベクトルから定常雑音を
除去する定常雑音除去部16とを有している。
て主に入力され電気信号に変換される。これと同時に、
周囲雑音はマイクロホン11に近接して設置され、マイ
クロホン11に混入した雑音との相関が十分高くなるよ
うに設置された周囲雑音を主に集音するマイクロホン1
2にて入力され、電気信号に変換される。マイクロホン
11に入力された雑音を含む音声は特徴抽出部13にて
雑音を含む音声の時系列特徴ベクトルに変換され、マイ
クロホン12に入力された周囲雑音は特徴抽出部14に
て周囲雑音の時系列特徴ベクトルに変換される。非定常
雑音除去部15は、特徴抽出部13及び特徴抽出部14
が出力する2つの時系列特徴ベクトルを用いて2つの入
力間の補正係数を算出し、求めた補正係数と入力の周囲
雑音の時系列特徴ベクトルとを用いて入力の音声の時系
列特徴ベクトルに含まれる非定常雑音を推定し、推定し
た非定常雑音を入力の音声の時系列特徴ベクトル全体か
ら除去する。定常雑音除去部16では、非定常雑音除去
部15にて得られた非定常雑音除去後の音声の時系列特
徴ベクトルから定常雑音を推定し、推定した定常雑音を
入力の音声の時系列特徴ベクトル全体から除去する。
を示す一実施例のブロック図である。図3では、図1に
示す一実施例の構成に加えて、ホワイトノイズ付加部3
0を有し、このホワイトノイズ付加部30にて、非定常
雑音除去部7から得られる定常及び非定常雑音除去後の
音声の時系列特徴ベクトルにホワイトノイズを付加する
ように構成されている。
を示す一実施例のブロック図である。図4では、図2に
示す一実施例の構成に加えて、ホワイトノイズ付加部4
0を有し、このホワイトノイズ付加部40にて、定常雑
音除去部16から得られる定常及び非定常雑音除去後の
音声の時系列特徴ベクトルにホワイトノイズを付加する
ように構成されている。
を示す一実施例のブロック図である。図5では、図1に
示す一実施例の構成に加えて、補正係数計算部50を有
し、この補正係数計算部50は、特徴抽出部3が出力す
る音声の時系列特徴ベクトルと特徴抽出部4が出力する
周囲雑音の時系列特徴ベクトルとから2入力間の補正係
数を計算し、非定常雑音除去部51は、補正係数計算部
50が出力する補正係数と定常雑音除去部6が出力する
定常雑音除去後の周囲雑音の時系列特徴ベクトルとを用
いて、定常雑音除去部5が出力する定常雑音除去後の音
声の時系列特徴ベクトル中に含まれる非定常雑音を推定
し、推定した非定常雑音を入力の定常雑音除去後の音声
の時系列特徴ベクトル全体から除去するように構成され
る。
を示す一実施例のブロック図である。図6では、図1に
示す一実施例の構成に加えて、雑音区間推定部60を有
し、この雑音区間推定部60は、特徴抽出部3から得ら
れた音声の時系列特徴ベクトルをもとに音声が含まれて
いない雑音区間を推定し、定常雑音除去部5は雑音区間
推定部60が出力する区間内の入力の音声の時系列特徴
ベクトルから定常雑音を推定し、推定した定常雑音を入
力の音声の時系列特徴ベクトル全体から除去し、定常雑
音除去部6は、雑音区間推定部60が出力する区間内の
入力の周囲雑音の時系列特徴ベクトルから定常雑音を推
定し、推定した定常雑音を入力の周囲雑音の時系列特徴
ベクトル全体から除去し、非定常雑音除去部7は、雑音
区間推定部が出力する雑音区間内の2つの入力の時系列
特徴ベクトルから2入力間の補正係数を計算し、定常雑
音除去部5から得られた定常雑音除去後の音声の時系列
特徴ベクトル中に含まれる非定常雑音を推定し、定常雑
音除去後の音声の時系列特徴ベクトル全体から求めた非
定常雑音を除去するように構成されている。
混入した定常雑音と非定常雑音が同時に効率よく除去さ
れ、高性能な雑音除去が可能となる。
示すブロック図である。
示すブロック図である。
示すブロック図である。
示すブロック図である。
示すブロック図である。
示すブロック図である。
いた雑音除去装置を示すブロック図である。
いた雑音除去装置を示すブロック図である。
,14 特徴抽出部 5,6,16 定常雑音除去部 7,15 非定常雑音除去部 30,40 ホワイトノイズ付加部 50 補正係数計算部 51 非定常雑音除去部 60 雑音区間推定部 201,211 音声入力用マイクロホン212
周囲雑音入力用マイクロホン202,213,214
特徴抽出部203 定常雑音推定部 204 定常雑音除去部 215 補正係数計算部 216 非定常雑音推定部 217 非定常雑音除去部
Claims (6)
- 【請求項1】音声を集音する第1のマイクロホンと、周
囲雑音を集音する第2のマイクロホンと、前記第1のマ
イクロホンから入力された音声を時系列特徴ベクトルに
変換する第1の特徴抽出部と、前記第2のマイクロホン
より入力された周囲雑音を時系列特徴ベクトルに変換す
る第2の特徴抽出部と、前記第1の特徴抽出部が出力す
る時系列特徴ベクトルから定常雑音を除去する第1の定
常雑音除去部と、前記第2の特徴抽出部が出力する時系
列特徴ベクトルから定常雑音を除去する第2の定常雑音
除去部と、前記第1の定常雑音除去部が出力する時系列
特徴ベクトルと前記第2の定常雑音除去部が出力する時
系列特徴ベクトルとを用いて非定常雑音を除去する非定
常雑音除去部とを有する雑音除去装置。 - 【請求項2】音声を集音する第1のマイクロホンと、周
囲雑音を集音する第2のマイクロホンと、前記第1のマ
イクロホンから入力された音声を時系列特徴ベクトルに
変換する第1の特徴抽出部と、前記第2のマイクロホン
より入力された周囲雑音を時系列特徴ベクトルに変換す
る第2の特徴抽出部と、前記第1の特徴抽出部から得ら
れた時系列特徴ベクトルと前記第2の特徴抽出部から得
られた時系列特徴ベクトルとを用いて非定常雑音を除去
する非定常雑音除去部と、前記非定常雑音除去部が出力
する時系列特徴ベクトルから定常雑音を除去する定常雑
音除去部とを有する雑音除去装置。 - 【請求項3】前記非定常雑音除去部が出力する特徴ベク
トルにホワイトノイズを付加するホワイトノイズ付加部
を有する請求項1記載の雑音除去装置。 - 【請求項4】前記定常雑音除去部が出力する特徴ベクト
ルにホワイトノイズを付加するホワイトノイズ付加部を
有する請求項2記載の雑音除去装置。 - 【請求項5】前記第1の特徴抽出部から出力された時系
列特徴ベクトルと前記第2の特徴抽出部から出力された
時系列特徴ベクトルとから2入力間の補正係数を求める
補正係数計算部と、当該補正係数と、前記第2の定常雑
音除去部が出力する特徴ベクトルと、前記第1の定常雑
音除去部が出力する特徴ベクトルとを用いて非定常雑音
を除去する非定常雑音除去部を有することを特徴とする
請求項1または3記載の雑音除去装置。 - 【請求項6】前記第1の特徴抽出部が出力する特徴ベク
トルから雑音区間を推定する雑音区間推定部と、当該雑
音区間推定部が推定した雑音区間内の時系列特徴ベクト
ルを用いて定常雑音を除去する定常雑音除去部と、前記
雑音区間推定部が推定した雑音区間内の時系列特徴ベク
トルを用いて非定常雑音を除去する非定常雑音除去部と
を有することを特徴とする請求項1〜5のいずれかに記
載の雑音除去装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3054151A JP2836271B2 (ja) | 1991-01-30 | 1991-01-30 | 雑音除去装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP3054151A JP2836271B2 (ja) | 1991-01-30 | 1991-01-30 | 雑音除去装置 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPH04245300A true JPH04245300A (ja) | 1992-09-01 |
JP2836271B2 JP2836271B2 (ja) | 1998-12-14 |
Family
ID=12962554
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP3054151A Expired - Lifetime JP2836271B2 (ja) | 1991-01-30 | 1991-01-30 | 雑音除去装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2836271B2 (ja) |
Cited By (12)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2005308771A (ja) * | 2004-04-16 | 2005-11-04 | Nec Corp | 雑音除去方法、雑音除去装置とシステム及び雑音除去用プログラム |
JP2006276856A (ja) * | 2005-03-25 | 2006-10-12 | Aisin Seiki Co Ltd | 音声信号前処理システム |
JP2007147736A (ja) * | 2005-11-24 | 2007-06-14 | Nec Access Technica Ltd | 音声通信装置 |
EP1813921A1 (en) * | 2006-01-30 | 2007-08-01 | Omron Corporation | Method of extracting, device for extracting and device for inspecting abnormal sound |
JP2008299341A (ja) * | 2008-07-08 | 2008-12-11 | Denso Corp | 雑音除去方法 |
JP2008311866A (ja) * | 2007-06-13 | 2008-12-25 | Toshiba Corp | 音響信号処理方法及び装置 |
JP2010271411A (ja) * | 2009-05-19 | 2010-12-02 | Nara Institute Of Science & Technology | 雑音抑圧装置およびプログラム |
US8036887B2 (en) | 1996-11-07 | 2011-10-11 | Panasonic Corporation | CELP speech decoder modifying an input vector with a fixed waveform to transform a waveform of the input vector |
JPWO2015141103A1 (ja) * | 2014-03-17 | 2017-04-06 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
CN110211602A (zh) * | 2019-05-17 | 2019-09-06 | 北京华控创为南京信息技术有限公司 | 智能语音增强通信方法及装置 |
WO2021101017A1 (ko) * | 2019-11-18 | 2021-05-27 | 삼성전자 주식회사 | 비정상 잡음을 판단하는 전자 장치 및 방법 |
CN118204658A (zh) * | 2024-04-10 | 2024-06-18 | 北海市万海船舶制造有限公司 | 铝合金船体焊接变形控制方法 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106157967A (zh) | 2015-04-28 | 2016-11-23 | 杜比实验室特许公司 | 脉冲噪声抑制 |
-
1991
- 1991-01-30 JP JP3054151A patent/JP2836271B2/ja not_active Expired - Lifetime
Cited By (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8036887B2 (en) | 1996-11-07 | 2011-10-11 | Panasonic Corporation | CELP speech decoder modifying an input vector with a fixed waveform to transform a waveform of the input vector |
JP2005308771A (ja) * | 2004-04-16 | 2005-11-04 | Nec Corp | 雑音除去方法、雑音除去装置とシステム及び雑音除去用プログラム |
JP4543731B2 (ja) * | 2004-04-16 | 2010-09-15 | 日本電気株式会社 | 雑音除去方法、雑音除去装置とシステム及び雑音除去用プログラム |
JP2006276856A (ja) * | 2005-03-25 | 2006-10-12 | Aisin Seiki Co Ltd | 音声信号前処理システム |
JP4527654B2 (ja) * | 2005-11-24 | 2010-08-18 | Necアクセステクニカ株式会社 | 音声通信装置 |
JP2007147736A (ja) * | 2005-11-24 | 2007-06-14 | Nec Access Technica Ltd | 音声通信装置 |
KR20070078784A (ko) * | 2006-01-30 | 2007-08-02 | 오므론 가부시키가이샤 | 이음(異音) 추출 방법, 이음 추출 장치 및 이음 검사 장치 |
EP1813921A1 (en) * | 2006-01-30 | 2007-08-01 | Omron Corporation | Method of extracting, device for extracting and device for inspecting abnormal sound |
JP2008311866A (ja) * | 2007-06-13 | 2008-12-25 | Toshiba Corp | 音響信号処理方法及び装置 |
JP2008299341A (ja) * | 2008-07-08 | 2008-12-11 | Denso Corp | 雑音除去方法 |
JP2010271411A (ja) * | 2009-05-19 | 2010-12-02 | Nara Institute Of Science & Technology | 雑音抑圧装置およびプログラム |
JPWO2015141103A1 (ja) * | 2014-03-17 | 2017-04-06 | 日本電気株式会社 | 信号処理装置、信号処理方法、および信号処理プログラム |
CN110211602A (zh) * | 2019-05-17 | 2019-09-06 | 北京华控创为南京信息技术有限公司 | 智能语音增强通信方法及装置 |
WO2021101017A1 (ko) * | 2019-11-18 | 2021-05-27 | 삼성전자 주식회사 | 비정상 잡음을 판단하는 전자 장치 및 방법 |
US11942105B2 (en) | 2019-11-18 | 2024-03-26 | Samsung Electronics Co., Ltd. | Electronic device and method for determining abnormal noise |
CN118204658A (zh) * | 2024-04-10 | 2024-06-18 | 北海市万海船舶制造有限公司 | 铝合金船体焊接变形控制方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2836271B2 (ja) | 1998-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US8160732B2 (en) | Noise suppressing method and noise suppressing apparatus | |
Sheikhzadeh et al. | An improved wavelet-based speech enhancement system | |
EP2352148B1 (en) | Noise gate, sound collection device, and noise removal method | |
JP2003534570A (ja) | 適応ビームフォーマーにおいてノイズを抑制する方法 | |
JP2836271B2 (ja) | 雑音除去装置 | |
WO2001031631A1 (en) | Mel-frequency domain based audible noise filter and method | |
KR20070050694A (ko) | 멀티채널 음성신호의 잡음제거 방법 및 장치 | |
JP3786038B2 (ja) | 入力信号処理方法および入力信号処理装置 | |
EP1286334A2 (en) | Method and circuit arrangement for reducing noise during voice communication in communications systems | |
KR100571427B1 (ko) | 잡음 환경에서의 음성 인식을 위한 특징 벡터 추출 장치및 역상관 필터링 방법 | |
Chen et al. | Study of the noise-reduction problem in the Karhunen–Loève expansion domain | |
JP3310225B2 (ja) | 雑音レベル時間変動率計算方法及び装置と雑音低減方法及び装置 | |
JP2002023790A (ja) | 音声特徴量抽出装置 | |
JP4051325B2 (ja) | 話者位置検出方法、装置、プログラム、および記録媒体 | |
JP3279254B2 (ja) | スペクトル雑音除去装置 | |
KR100848789B1 (ko) | 크로스토크를 제거하기 위한 후처리 방법 | |
KR101993003B1 (ko) | 잡음 제거 장치 및 방법 | |
KR101096091B1 (ko) | 음성 분리 장치 및 이를 이용한 단일 채널 음성 분리 방법 | |
KR100744375B1 (ko) | 음성 처리 장치 및 방법 | |
CN117351925B (zh) | 啸叫抑制方法、装置、电子设备和存储介质 | |
KR100468817B1 (ko) | 잡음 처리 기능을 갖춘 음성 인식 장치 및 음성 인식 방법 | |
KR100565428B1 (ko) | 인간 청각 모델을 이용한 부가잡음 제거장치 | |
Shimamura et al. | Noise estimation with an inverse comb filter in non-stationary noise environments | |
KR930008721A (ko) | 음성인식 시스템의 특징추출방법 | |
JPS61187000A (ja) | 音声のピツチ周波数抽出装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20071009 Year of fee payment: 9 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20081009 Year of fee payment: 10 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091009 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20091009 Year of fee payment: 11 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20101009 Year of fee payment: 12 |
|
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111009 Year of fee payment: 13 |
|
EXPY | Cancellation because of completion of term | ||
FPAY | Renewal fee payment (event date is renewal date of database) |
Free format text: PAYMENT UNTIL: 20111009 Year of fee payment: 13 |