JP2005284016A - 音声信号の雑音推定方法およびそれを用いた雑音除去装置 - Google Patents

音声信号の雑音推定方法およびそれを用いた雑音除去装置 Download PDF

Info

Publication number
JP2005284016A
JP2005284016A JP2004098734A JP2004098734A JP2005284016A JP 2005284016 A JP2005284016 A JP 2005284016A JP 2004098734 A JP2004098734 A JP 2004098734A JP 2004098734 A JP2004098734 A JP 2004098734A JP 2005284016 A JP2005284016 A JP 2005284016A
Authority
JP
Japan
Prior art keywords
noise
spectrum
speech signal
speech
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2004098734A
Other languages
English (en)
Inventor
Yukinao Kimoto
亨尚 木本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iwatsu Electric Co Ltd
Original Assignee
Iwatsu Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iwatsu Electric Co Ltd filed Critical Iwatsu Electric Co Ltd
Priority to JP2004098734A priority Critical patent/JP2005284016A/ja
Publication of JP2005284016A publication Critical patent/JP2005284016A/ja
Pending legal-status Critical Current

Links

Images

Abstract

【課題】限られた時間内で有色性雑音が含まれる音声信号の雑音スペクトル分布の推定精度を向上する。
【解決手段】雑音スペクトルの閾値を定め、雑音原スペクトルと閾値とを比較することにより、白色雑音に対しては平滑化処理を行い、有色雑音に対してはスペクトルのより忠実な推定を行う。更にこれを雑音除去法に用いることにより、音声信号から雑音を除去することにより、音声信号を精度良く復元することができる。
【選択図】 図1

Description

本発明は、音声信号の雑音推定方法と雑音除去装置に関するものである。
近年、音声信号の聴取者にとって必要な音のみを選択し、他の音を除去することにより、背景音に影響されない忠実な音声認識を実現することがますます必要となっている。また、携帯電話機の普及に伴い、劣悪な音環境においても話者の通話音のみを再生する必要性が高まっている。そのため、聴覚の情景解析(Auditory Scene Analysis )の手法を用いて音源信号を分離する研究が盛んに行われている。この手法は聴覚が利用している制約条件を発見的規則として定式化し音源分離に利用するもので、雑音除去に利用するとき、事前に雑音信号を抽出する必要のない究極的手法であるが、まだ研究段階である。
一方、事前に雑音信号を抽出することを前提とした雑音除去法は、遙かに簡単な処理で実現でき、種々の方法が検討され実用化されている。その代表的なものとして、スペクトラルサブトラクション法が非常に有効な手法として知られている(例えば、非特許文献1参照。)。この手法は、定常的な雑音を対象とし、音声信号がない区間(非音声区間)で、雑音のスペクトルを推定し、音声信号がある区間(音声区間)の音声信号に対して、周波数領域で雑音スペクトルを差し引くことにより雑音成分の除去を行う方法である。これに対して、推定した雑音スペクトルを一旦時間軸に戻してから、時間軸上で雑音成分の除去を行う手法も存在する。
Boll、"Suppression of Acoustic Noise in Speech Using Spectral Subtraction" 、IEEE Trans. on Acoustics、 speech and Signal processing 、Vol.Assp-27 、 No.2 、 April 1979 、 pp.113-120
このようにスペクトラルサブトラクション法は非音声区間を検出し、非音声区間で精度良く雑音を推定できることを前提としている。ところが、非音声区間での雑音スペクトルの推定は、限られた時間内でしか行えないため、雑音スペクトルの変動と計算誤差が無視できない。このため、雑音スペクトルを大きく推定した場合には音声スペクトルを壊すことがあり、雑音スペクトルを小さく推定した場合には雑音が除去できないことになる。
従来の雑音スペクトルの第1の推定方法は、一定の長さに区切られた時間(以降フレームと呼ぶ)の非音声区間の信号に対して、周波数スペクトルを求め、周波数軸を複数の区間に帯域分割を行い、帯域ごとの平均値を求めて雑音スペクトルを推定する方法である。本方法により、雑音スペクトルの変動の大きい部分は平滑化されるため、特定の周波数成分を持たない白色性雑音に対しては雑音スペクトルの推定精度が向上するが、エアコンやパソコンのファンなどによる特定の周波数において極大値を有する有色性雑音が存在する場合には、有色性雑音のピーク周波数成分の推定誤差が大きくなる問題がある。
また、第2の推定方法として、無音区間の過去数フレームの平均値を使用する方法がある。本方法では、1フレーム分の周波数軸上では平滑化の処理をしないため、有色性雑音が混在していても問題とはならない。しかし、誤差の少ない雑音推定を行うには過去の数フレームの平均値を必要とするため、雑音推定に時間がかかる。そのため、過去の数フレーム分の無音区間が取れない場合には雑音推定精度が悪くなる。
以上説明したように、限られた時間の無音区間の1タイムスロットで雑音スペクトルの推定を行う第1の推定方法においては、従来の周波数帯域毎の平均化処理法では有色性雑音の周波数成分のピーク値とスペクトル分布の推定精度を向上することにおいて改善の余地があった。
従って、本発明の目的は、短い無音区間でも高精度の雑音スペクトルの推定を行う雑音推定方法を提供すること、及びその雑音推定方法、それを用いて雑音が混入した音声信号から精度良く雑音を除去する雑音除去装置を提供することを目的とする。
前記課題を解決するために、本発明による音声信号における雑音推定方法は、無音区間の雑音原スペクトルに対し、白色雑音に対しては平滑化処理を行い、有色雑音に対してはスペクトルの忠実な推定を行うことを特徴とする。
また、本発明による音声信号における雑音除去装置は、本発明による音声信号の雑音推定方法を用いて、音声信号から推定した雑音を除去することを特徴とする。
即ち、前記課題を解決するために、請求項1に係わる本発明による音声信号における雑音推定方法は、無音区間の雑音原スペクトルに対し、該雑音原スペクトルの周波数標本点において、所定の周波数区間幅においてスペクトル平均強度とあらかじめ定めた閾値との比較を行い、区間スペクトル平均強度が前記閾値以下の場合には該雑音原スペクトルの平滑化を行い、区間スペクトル平均強度が前記閾値を超える場合には雑音原スペクトルをそのまま抽出することを特徴とする。
請求項2に係わる本発明による音声信号における雑音推定方法は、前記閾値εを、雑音原スペクトルのゼロ周波数の値に一致させるか、又はそのm倍とすることを特徴とする。
請求項3に係わる本発明による音声信号における雑音推定方法は、前記しきい値εを、n番目の帯域の雑音スペクトルの平均値pnと分散σnを用いて、
ε=pn+m×σn
から決定することを特徴とする。
請求項4に係わる本発明による音声信号における雑音推定装置は、請求項1ないし請求項3記載の本発明による音声信号の雑音推定方法を用いて、無音区間の雑音原スペクトルから雑音スペクトルを推定する手段と、無音区間に後続する音声信号から、音声スペクトルを算定する手段と、該音声スペクトルから前記雑音スペクトルを除去したのち、音声信号を復元する手段とを備えたことを特徴とする。
請求項5に係わる本発明による音声信号における雑音除去装置は、
請求項1ないし請求項4記載の本発明による音声信号の雑音推定方法を用いて、無音区間の雑音原スペクトルから雑音スペクトルを推定する手段と、該雑音スペクトルから雑音を復元する手段と、無音区間に後続する音声信号から前記雑音を除去することにより、音声信号を算出する手段とを備えたことを特徴とする。
本発明による音声信号における雑音推定方法により、有色雑音に対してはスペクトルのより忠実な推定を行うことができるため、雑音を精度良く推定できる。更にこれを雑音除去装置に用いることにより、音声信号を精度良く復元する雑音除去装置を実現することができる。
以下、図面に基づいて本発明の実施の一形態について説明する。ただし、以下の説明はあくまでも本発明の例示にすぎず、以下の記載によって説明の技術的範囲が限定されるものではない。
図1は本発明の雑音推定方法を示すフローチャートであり、図2は本発明の音声信号における雑音除去方法示すフローチャートである。図3は本発明の雑音除去装置の構成を示す図であり、図4は本発明を実施した第1の実験結果であり、図5は本発明を実施した第2の実験結果である。
雑音原スペクトルの主要な構成要素は、一般的に白色雑音(ホワイトノイズ)と有色性雑音である、白色雑音は平滑化処理により容易に推定可能であるが、有色性雑音のようにスペクトル分布が顕著なピークを有するときは、それに平滑化処理を行うと有色性雑音のピーク値近傍の推定時には、無視し得ない誤差が生じる。この問題を解決するため、本発明では雑音原スペクトルに対して所定の閾値よりも小さな雑音についてのみ、平滑化処理を適用し、所定の閾値以上の雑音原スペクトルに対しては、雑音原スペクトルと推定スペクトルを等しくすることにより、より正確な雑音のスペクトル強度の推定を行うことを可能とした。以下図面について、さらに詳細に説明する。
図1において、雑音推定プロセスが開始されると、先ずS2工程において入力信号から非音声区間を検出する。そのため、入力信号レベルが所定の閾値以下であれば、非音声区間と判断する。次に、S3工程で前記非音声区間から1フレーム分のN個のデータx(n)(n=0..N)を抽出した後、S4工程で(1)式を用いて離散フーリエ変換を行い、パワースペクトル(雑音原スペクトル)X(k)を得る。以下パワースペクトルを全てスペクトルと略す。
Figure 2005284016
ただし、(1)式において、前記抽出データN個に対し、ギブス現象が起こらないように、x(n)にはハミング窓のような窓関数をかけることが望ましい。
次に、S5工程において、雑音原スペクトルX(k)から閾値εを以下に説明するように計算する。該閾値を決定する第1の方法は、閾値を雑音原スペクトルの周波数ゼロの値に一致させるか、或いはそのm倍とする方法である。ただし、mは高々10以下の整数とするが、整数でなくても良い。本手法は、有色性雑音の顕著な極大値は白色性雑音の極大値よりもはるかに大きいことを有効に活用している。なお、mはあらかじめ設定する値であるが、使用者がそれを選択又は指定できるようにしてもよい。
閾値εを決定する第2の方法は雑音原スペクトルの分散σを(2)式から決定し、閾値をσに比例した値とすることにより決定する。
Figure 2005284016
閾値εは、例えばσをM(整数)倍(代表的なMの値として3倍)して求める。
ε=<p>+m×σ …(3)
ただし、<p>はX(k)の平均値である。
閾値εを決定した後、S6工程で各X(k)とεとの比較を行い、X(k)がεより大きくない場合には、S7工程に進み、周波数成分X(k)に対して平滑化処理を行い、雑音スペクトル推定値Yk(k=1..n..N)を得る。
X(k)がεより大きい場合には、S8工程に進み平滑化処理を行なう代わりに、雑音スペクトル推定値YkをX(k)に等しくする。
Yk=X(k) …(4)
以上の処理を全てのX(k)について行うことにより、S9工程にて音声信号1フレームの雑音スペクトルを確定する。従って、有色性雑音のスペクトル分布が顕著なピークを有するときでも、本発明により正確な雑音スペクトルを推定することが可能である。
前記実施例では、S5工程において閾値εを周波数に依存しない一定の値を用いたが、<p>を周波数帯域毎に設定すれば、更に雑音スペクトルの精度が向上する。また、<p>を直線で近似することも可能である。
<p>=af+b …(5)
この場合、a,bはX(K)の代表値(例えば3つの周波数におけるX)を用いて決定することができる。この直線近似は、白色雑音が−3db/octの関数として近似できるいわゆるピンクノイズに対して、特に有効である。
次に、本発明の雑音推定方法を用いて、雑音を除去する方法を図2で説明する。
最初に工程S10にて入力信号x(n)に対し音声信号であるか、非音声信号であるかを判定する。入力信号が非音声信号と判明した場合、工程S11に進み雑音推定スペクトルを決定する。ただし、工程S11の詳細は図1のS3からS9の工程を含む雑音スペクトル決定プロセスである。入力信号が音声信号と判明した場合、工程S12に進み音声信号のスペクトルから前記雑音推定スペクトルを差し引くことにより、雑音が除去された音声スペクトルを決定し、工程S13にて逆変換することにより、雑音が除去された音声信号を得ることができる。なお工程S12に進む直前にて、音声信号のスペクトルと雑音推定スペクトルを共に逆変換してから、時間軸上での引算により、雑音が除去された音声信号を得ることも可能である。
図3は本発明の図2のアルゴリズムを実現する雑音除去装置の構成を示す図である。入力信号は信号入力部14からスペクトル変換部15に伝達され、スペクトルに変換される。前記スペクトルは音声/非音声判定部16にて音声信号であるか、非音声信号であるかが判定される。非音声信号と判定された場合は前記スペクトルは雑音推定部17に伝達され雑音推定スペクトルが算出され、記憶部18にて次の非音声区間の雑音推定スペクトルが入力されるまで蓄積される。前記スペクトルが音声信号と判定された場合は前記スペクトルは雑音除去部19に伝達された後、記憶部18に蓄積された雑音推定スペクトルを読み出し、それを差し引くことにより、雑音除去スペクトルを出力する。当該雑音除去スペクトルはスペクトル変換部20に入力され、スペクトル変換部20にて音声信号に変換され、雑音除去音声出力部21に伝えられる。かくして、雑音が除去された音声信号が雑音除去音声出力部21から出力される。
以上の本発明の動作を検証するための、実際の雑音を想定して作成したデータに応用した結果を用いて説明する。本実験では、雑音データとして、室内騒音の代表として周波数が高くなるほどパワースペクトルが小さくなるいわゆるホスノイズに1k[Hz] の有色性雑音が加わった雑音を想定して作成したデータを用いている。サンプリング周波数は8k[Hz] 、1フレームのデータ数Nは256個であり、パワースペクトルを求めるためにFFT(高速フーリエ変換)を使用し、窓関数としてハミング窓を使用した。
まず、一定の閾値を用いる場合について説明する。有色性雑音を含む実際の雑音データのスペクトルを図4に示す。閾値は雑音原スペクトルの周波数がゼロの値に一致させおり、直線で表示している。図4より、本発明を用いることにより、1kHzの有色性雑音のー44dB以上の成分が除去できることは明らかである。
次に、閾値ε(k)を(5)式を用いて決定した時の閾値の周波数依存性を図5に示す。ただし、本図において(5)式のbは周波数がゼロの値に一致させ、傾きaはー3dB/octとしている。図5より、この閾値ε(k)を使用すると1kHzの有色性雑音のー49dB以上の成分が除去でき、閾値を一定とした場合よりもさらに有色性雑音の除去能力が向上することは明らかである。
本発明は音声認識の前処理や、携帯電話や会議通話装置等の音声品質の向上において効果を発揮して使用することができる。
本発明の音声信号における雑音推定方法用いた雑音推定方法を説明するためのフロー図である。 本発明の音声信号における雑音除去方法を説明するためのフロー図である。 本発明の音声信号における雑音推定方法用いた雑音除去装置の構成例を示す図である。 閾値を一定とした時の本発明の実験結果を示す図である。 閾値を直線で決定した時の本発明の実験結果を示す図である。
符号の説明
14 信号入力部
15,20 スペクトル変換部
16 音声/非音声判定部
17 雑音推定部
18 記憶部
19 雑音除去部
21 雑音除去音声出力部

Claims (5)

  1. 音源から無音声区間を検出する手段と、
    前記無音声区間を所定の時間スロットで分割した1タイムスロット分の雑音信号を抽出する手段と、
    該1タイムスロット分の雑音信号をパワースペクトルに変換する手段と、
    該パワースペクトルから閾値εを演算する手段と、
    該パワースペクトルが閾値εを超えない時に限って該パワースペクトルを平滑化して前記音声信号の雑音を推定する手段とを有する音声信号の雑音推定方法。
  2. 前記閾値εを、雑音源スペクトルのゼロ周波数の値に一致させるか、或いはそのm倍とすることを特徴とする請求項1記載の音声信号の雑音推定方法。
  3. 前記しきい値εを、雑音原スペクトルのn番目の帯域の平均値pnと分散σnを用いて、
    ε=pn+m×σn
    から決定することを特徴とする請求項1記載の音声信号の雑音推定方法。
  4. 音源から無音声区間を検出する手段と、
    前記無音声区間を所定の時間スロットで分割した1タイムスロット分の雑音信号を抽出する手段と、
    該1タイムスロット分の雑音信号をパワースペクトルに変換する手段と、
    該パワースペクトルから閾値εを演算する手段と、
    該パワースペクトルが閾値εを超えない時に限って該パワースペクトルを平滑化して前記音声信号の雑音を推定する手段と、
    無音区間に後続する音声信号から、音声スペクトルを算定する手段と、
    該音声スペクトルから前記雑音スペクトルを除去することにより雑音除去スペクトルを算出する手段と、
    該雑音除去スペクトルから音声信号を復元する手段とを備えた音声信号の雑音除去装置。
  5. 音源から無音声区間を検出する手段と、
    前記無音声区間を所定の時間スロットで分割した1タイムスロット分の雑音信号を抽出する手段と、
    該1タイムスロット分の雑音信号をパワースペクトルに変換する手段と、
    該パワースペクトルから閾値εを演算する手段と、
    該パワースペクトルが閾値εを超えない時に限って該パワースペクトルを平滑化して前記音声信号の雑音を推定する手段と、
    該雑音スペクトルから雑音を復元する手段と、
    無音区間に後続する音声信号から前記雑音を除去することにより雑音除去音声信号を算出する手段とを備えた音声信号の雑音除去装置。
JP2004098734A 2004-03-30 2004-03-30 音声信号の雑音推定方法およびそれを用いた雑音除去装置 Pending JP2005284016A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2004098734A JP2005284016A (ja) 2004-03-30 2004-03-30 音声信号の雑音推定方法およびそれを用いた雑音除去装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2004098734A JP2005284016A (ja) 2004-03-30 2004-03-30 音声信号の雑音推定方法およびそれを用いた雑音除去装置

Publications (1)

Publication Number Publication Date
JP2005284016A true JP2005284016A (ja) 2005-10-13

Family

ID=35182448

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2004098734A Pending JP2005284016A (ja) 2004-03-30 2004-03-30 音声信号の雑音推定方法およびそれを用いた雑音除去装置

Country Status (1)

Country Link
JP (1) JP2005284016A (ja)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009038136A1 (ja) * 2007-09-19 2009-03-26 Nec Corporation 雑音抑圧装置、その方法及びプログラム
JP2012508368A (ja) * 2008-11-07 2012-04-05 キューアーエスエス ゲーエムベーハー 振動解析方法、振動解析装置、振動解析のためのサンプルデータベース、及びその使用
JP2012113173A (ja) * 2010-11-25 2012-06-14 Fujitsu Ltd 雑音抑制装置、雑音抑制方法、及びプログラム
CN112331225A (zh) * 2020-10-26 2021-02-05 东南大学 一种高噪声环境下辅助听力的方法及装置

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2009038136A1 (ja) * 2007-09-19 2009-03-26 Nec Corporation 雑音抑圧装置、その方法及びプログラム
JPWO2009038136A1 (ja) * 2007-09-19 2011-01-06 日本電気株式会社 雑音抑圧装置、その方法及びプログラム
JP5483000B2 (ja) * 2007-09-19 2014-05-07 日本電気株式会社 雑音抑圧装置、その方法及びプログラム
JP2012508368A (ja) * 2008-11-07 2012-04-05 キューアーエスエス ゲーエムベーハー 振動解析方法、振動解析装置、振動解析のためのサンプルデータベース、及びその使用
JP2012113173A (ja) * 2010-11-25 2012-06-14 Fujitsu Ltd 雑音抑制装置、雑音抑制方法、及びプログラム
CN112331225A (zh) * 2020-10-26 2021-02-05 东南大学 一种高噪声环境下辅助听力的方法及装置
CN112331225B (zh) * 2020-10-26 2023-09-26 东南大学 一种高噪声环境下辅助听力的方法及装置

Similar Documents

Publication Publication Date Title
EP1638084B1 (en) Method and apparatus for multi-sensory speech enhancement
KR101120679B1 (ko) 이득-제한된 잡음 억제
Nakatani et al. Robust and accurate fundamental frequency estimation based on dominant harmonic components
RU2407074C2 (ru) Улучшение речи с помощью нескольких датчиков с использованием предшествующей чистой речи
KR101737824B1 (ko) 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치
JP4816711B2 (ja) 通話音声処理装置および通話音声処理方法
Tsilfidis et al. Blind single-channel suppression of late reverberation based on perceptual reverberation modeling
JP2000330597A (ja) 雑音抑圧装置
JP2007293059A (ja) 信号処理装置およびその方法
Elshamy et al. An iterative speech model-based a priori SNR estimator
JP2005284163A (ja) 雑音スペクトル推定方法、雑音抑圧方法および雑音抑圧装置
JP2005258158A (ja) ノイズ除去装置
JPH08160994A (ja) 雑音抑圧装置
JP2010102129A (ja) 基本周波数抽出方法、基本周波数抽出装置、およびプログラム
JP2005284016A (ja) 音声信号の雑音推定方法およびそれを用いた雑音除去装置
Tiwari et al. Speech enhancement using noise estimation with dynamic quantile tracking
KR101096091B1 (ko) 음성 분리 장치 및 이를 이용한 단일 채널 음성 분리 방법
JP6106618B2 (ja) 音声区間検出装置、音声認識装置、その方法、及びプログラム
JP3761497B2 (ja) 音声認識装置、音声認識方法、および、音声認識プログラム
JP2019060976A (ja) 音声処理プログラム、音声処理方法および音声処理装置
JP5134477B2 (ja) 目的信号区間推定装置、目的信号区間推定方法、目的信号区間推定プログラム及び記録媒体
KR20180087021A (ko) 실내전달함수 추정 방법 및 신호 처리 방법
Singh Noise estimation for real-time speech enhancement
CN116057626A (zh) 使用机器学习的降噪
WO2005112007A1 (ja) 音響信号除去装置、音響信号除去方法及び音響信号除去プログラム