WO2006123721A1

WO2006123721A1 - 雑音抑圧方法およびその装置

Info

Publication number: WO2006123721A1
Application number: PCT/JP2006/309867
Authority: WO
Inventors: Michiko Kazama; Mikio Tohyama; Koji Kushida
Original assignee: Yamaha Corporation; Waseda University
Priority date: 2005-05-17
Filing date: 2006-05-17
Publication date: 2006-11-23
Also published as: EP1914727A4; US8160732B2; US20080192956A1; EP1914727A1; JPWO2006123721A1; JP4958303B2; EP1914727B1; DE602006008481D1

Abstract

　スペクトルサブトラクション法により雑音を抑圧する方法において、雑音推定用スペクトルに必要な周波数分解能と、雑音抑圧用スペクトルに必要な時間分解能を両立させて、雑音抑圧性能を向上させる。雑音のスペクトルの推定演算に用いる観測信号のスペクトルを分析するために切り出す該観測信号の信号長を、雑音のスペクトルとの減算を行う被減算値としての観測信号のスペクトルを分析するために切り出す該観測信号の信号長よりも長く設定する。

Description

明細書

雑音抑圧方法およびその装置

技術分野

[0001] この発明は、いわゆるスペクトルサブトラクシヨン法により雑音を抑圧する方法およびその装置に関し、雑音抑圧性能を向上させたものである。

背景技術

[0002] 音声に含まれる雑音を抑圧する技術として、スペクトルサブトラクシヨン法がある。スベクトルサブトラクシヨン法は、音声に雑音が重畳した観測信号のスペクトル (以下「観測信号スペクトル」という。）を求め、該観測信号スペクトル力も雑音のスペクトル（以下「雑音スペクトル」という。）を推定し、該観測信号スペクトル力ゝら該雑音スペクトルを減算することにより、雑音を抑圧した音声のスペクトル (以下「音声スペクトル」と、う。）を得て、該音声スペクトルを時間領域の信号に変換することにより、雑音を抑制した音声を得るようにしたものである。

[0003] スペクトルサブトラクシヨン技術を開示した従来技術として、下記特許文献に記載されたものがある。

特許文献 1：特開平 11 3094号公報

特許文献 2 :特開 2002— 14694号公報

特許文献 3：特開 2003— 223186号公報

[0004] 従来のスペクトルサブトラクシヨン法は、雑音スペクトルの推定演算に用いる観測信号スペクトル (以下「雑音推定用スペクトル」という。）と、雑音スペクトルとの減算に用 V、られる被減算値としての観測信号スペクトル (以下「雑音抑圧用スペクトル」、う。 )に共通の観測信号スペクトルを使用していた。

発明の開示

発明が解決しょうとする課題

[0005] スペクトルサブトラクシヨン法の抑圧対象である雑音は定常雑音等の時間変化が少ない雑音であることから、雑音推定用スペクトルは、時間分解能よりは周波数分解能が重要である。これに対し、スペクトルサブトラクシヨン法の抽出対象である音声は時間変化が大きい信号であるから、雑音抑圧用スぺ外ルは、時間分解能が高いことが重要である。ところが、従来のスペクトルサブトラクシヨン法は、雑音推定用スペクトルと、雑音抑圧用スぺ外ルに共通の観測信号スペクトルを使用していたため、雑音推定用スペクトルに必要な周波数分解能と、雑音抑圧用スペクトルに必要な時間分解能を両立させることができず、雑音抑圧性能が十分ではな力つた。

[0006] この発明は、上述の点に鑑みてなされたもので、雑音推定用スペクトルに必要な周波数分解能と、雑音抑圧用スぺ外ルに必要な時間分解能を両立させて、雑音抑圧性能を向上させた雑音抑圧方法およびその装置を提供しょうとするものである。課題を解決するための手段

[0007] この発明の音声に雑音が重畳した観測信号から該雑音が抑圧された音声を得るための雑音抑圧方法は、観測信号から第 1の観測信号を切り出し、第 1の観測信号のスペクトルを分析し、第 1の観測信号のスペクトル力雑音のスペクトルを推定演算し、観測信号力第 2の観測信号を切り出し、第 2の観測信号のスペクトルを分析し、第 2の観測信号のスペクトル力前記雑音のスペクトルを減算し、音声のスペクトルを時間領域の信号に変換し、第 1の観測信号の信号長 (時間窓長）は、前記第 2の観測信号の信号長よりも長!ヽものである。

[0008] この発明の雑音抑圧方法によれば、雑音のスペクトルの推定演算に用いる観測信号のスぺ外ルを分析するために切り出す該観測信号の信号長を相対的に長く設定したので、雑音推定用スペクトルに必要な周波数分解能を高めることができる。また、雑音のスぺ外ルとの減算を行う被減算値としての観測信号のスぺ外ルを分析するために切り出す該観測信号の信号長を相対的に短く設定したので、雑音抑圧用スぺタトルに必要な時間分解能を高めることができる。これにより、雑音推定用スペクトルに必要な周波数分解能と、雑音抑圧用スペクトルに必要な時間分解能が両立し、雑音抑圧性能を向上させることができる。

[0009] この発明の雑音抑圧方法は、より具体的には、音声に雑音が重畳して時間とともに進行する観測信号を、該観測信号が進行する所定の時間間隔毎に、該時間間隔と同じかまたは該時間間隔よりも長い第 1の信号長で切り出し、前記第 1の信号長で切り出された観測信号のスぺ外ルを第 1のスペクトルとして分析し、前記観測信号を、前記所定の時間間隔毎または適宜の時間毎に、その先頭を前記第 1の信号長で切り出される観測信号の先頭に揃えて、該第 1の信号長よりも長い第 2の信号長で切り出し、前記第 2の信号長で切り出された観測信号のスペクトルを第 2のスペクトルとして分析し、前記第 2のスペクトルに基づいて、前記観測信号に含まれる雑音のスぺクトルを推定演算し、雑音が抑圧された音声のスペクトルを求めるために、前記所定の時間間隔毎に、前記第 1のスペクトルから前記雑音のスペクトルを減算し、前記所定の時間間隔毎に、前記求められた音声のスペクトルを時間領域の信号に変換し、前記変換された時間領域の信号を相互に連結して、雑音が抑圧された一連の音声を得るよう〖こすることがでさる。

[0010] この発明の雑音抑圧方法では、前記第 2のスペクトルを平滑ィ匕処理し、該平滑化処理された第 2のスペクトルに基づき前記雑音のスペクトルを推定演算する。ある、は、前記推定された雑音のスぺ外ルを平滑ィヒ処理した後に前記減算処理を行う。この平滑化処理により、雑音のスペクトルの実質的な周波数分解能は、第 1のスペクトルの実質的な周波数分解能に等しくなる (または近づく）。このように雑音推定用スぺクトルを長時間のデータを使うことにより高分解能で求めておいてから平滑ィ匕することで、 1つ 1つの減算結果 (音声スペクトルデータ）の精度 (有効性）が向上する。

[0011] また、この発明の雑音抑圧方法では、前記推定演算処理は、前記第 2のスペクトルを平滑化処理し、前記平滑化処理された第 2のスペクトルと該平滑化処理する前の前記第 2のスペクトルとを比較し、第 2のスペクトルにおけるディップ (スペクトルにおける窪み）を除去するために、前記比較処理において周波数ポイント毎に大きい方の値を選択し、前記ディップが除去された第 2のスペクトルに基づき前記雑音のスぺタトルを推定演算する。あるいは、前記減算処理は、前記推定された雑音のスペクトルを平滑化処理し、前記平滑化処理された雑音のスペクトルと前記平滑化処理する前の雑音のスペクトルとを比較し、雑音のスペクトルにおけるディップを除去するために、前記比較処理にぉ、て周波数ポイント毎に大き、方の値を選択し、前記ディップが除去された雑音のスペクトルを用いて前記第 1のスペクトルとの減算を行う。すなわち、雑音のスぺ外ルの推定演算に用いる観測信号のスペクトルを分析すると、分析されたスペクトルに大きなディップが出て、これが処理雑音 (信号処理に伴って新たに発生する雑音で、いわゆるミュージカルノイズ)となる場合がある。そこで、前記第 2のスペクトル力ディップを除去して力雑音のスペクトルを推定演算し、または、雑音のスペクトル力ディップを除去してから前記第 1のスペクトルとの減算を行うことにより、処理雑音の発生を抑制することができる。なお、この雑音のスペクトルの推定演算に用いる観測信号のスペクトルまたは雑音のスペクトル力ディップを除去する手法は、雑音のスペクトルの推定演算に用いる観測信号のスペクトルを分析するために切り出す該観測信号の信号長を、雑音のスペクトルとの減算を行う被減算値としての観測信号のスぺ外ルを分析するために切り出す該観測信号の信号長よりも長く設定する場合に限らず、両信号長を等しく設定する場合にも適用することができる。

[0012] この発明の雑音抑圧方法は、前記第 1のスペクトルの分析に使用する前記観測信号の信号長を、前記第 2の信号長と同じ長さに揃えるために、前記第 1の信号長で切り出された観測信号の末尾に後続して所定長の零信号を付加し、前記零信号が付カロされた観測信号について前記第 1のスペクトルの分析を行い、前記分析された第 1 のスペクトル力前記雑音のスペクトルを減算し、前記減算処理により得られた音声のスぺ外ルを前記時間領域の信号へ変換し、前記時間領域の信号を前記第 1の信号長に戻すために前記時間領域の信号の末尾から、前記零信号を付加した長さ分の信号を削除し、前記第 1の信号長に戻された時間領域の信号を相互に連結する。

[0013] この発明の雑音抑圧方法は、前記所定の時間間隔を、例えば、前記第 1の信号長の 1Z2の長さに設定することができる。この場合、前記時間領域の信号を前記所定の時間間隔毎に前記第 1の信号長で得られる信号とし、該時間領域の信号に三角窓を掛け、該三角窓が掛けられた時間領域の信号を順次加算して前記信号相互の連結を行うことができる。

[0014] この発明の音声に雑音が重畳した観測信号力雑音が抑圧された音声を得るための雑音抑圧装置は、音声に雑音が重畳して時間とともに進行する観測信号を、該観測信号が進行する所定の時間間隔毎に、該時間間隔と同じかまたは該時間間隔よりも長い第 1の信号長で切り出す第 1の信号切り出し部と、前記第 1の信号切り出し部で切り出された観測信号のスペクトルを第 1のスペクトルとして分析する第 1のスぺタトル分析部と、前記観測信号を、前記所定の時間間隔毎または適宜の時間毎に、その先頭を前記第 1の信号長で切り出される観測信号の先頭に揃えて、該第 1の信号長よりも長、第 2の信号長で切り出す第 2の信号切り出し部と、前記第 2の信号切り出し部で切り出された観測信号のスペクトルを第 2のスペクトルとして分析する第 2のスぺタトル分析部と、前記第 2のスペクトルに基づいて、前記観測信号に含まれる雑音のスペクトルを推定演算する雑音スぺ外ル推定演算部と、雑音が抑圧された音声のスベクトルを求めるために、前記所定の時間間隔毎に、前記第 1のスペクトルから前記雑音のスペクトルを減算する減算部と、前記所定の時間間隔毎に、前記求められた音声のスぺ外ルを時間領域の信号に変換する時間領域変換部と、前記変換された時間領域の信号を相互に連結して、雑音が抑圧された一連の音声を得る出力合成部と、を具備してなる。

この発明の雑音抑圧装置は、より具体的には、音声に雑音が重畳して時間とともに進行する観測信号を、該観測信号が進行する所定の時間間隔毎に、該時間間隔と同じかまたは該時間間隔よりも長い第 1の信号長で切り出す第 1の信号切り出し部と、前記第 1の信号切り出し部で切り出された観測信号のスペクトルを第 1のスペクトルとして分析する第 1のスペクトル分析部と、前記観測信号を、前記所定の時間間隔毎または適宜の時間毎に、その先頭を前記第 1の信号長で切り出される観測信号の先頭に揃えて、該第 1の信号長よりも長、第 2の信号長で切り出す第 2の信号切り出し部と、前記第 2の信号切り出し部で切り出された観測信号のスペクトルを第 2のスぺクトルとして分析する第 2のスペクトル分析部と、前記第 2のスペクトルに基づいて、前記観測信号に含まれる雑音のスペクトルを推定演算する雑音スぺ外ル推定演算部と、雑音が抑圧された音声のスペクトルを求めるために、前記所定の時間間隔毎に、前記第 1のスペクトルから前記雑音のスペクトルを減算する減算部と、前記所定の時間間隔毎に、前記求められた音声のスペクトルを時間領域の信号に変換する時間領域変換部と、前記変換された時間領域の信号を相互に連結して、雑音が抑圧された一連の音声を得る出力合成部と、を具備してなる。

この発明の音声に雑音が重畳した観測信号力該雑音が抑圧された音声を得るための雑音抑圧方法は、前記観測信号のスペクトルを分析し、前記観測信号のスぺクトルを平滑化処理し、前記平滑化処理された観測信号のスペクトルと、前記平滑化処理する前の観測信号のスペクトルとを比較し、前記観測信号のスペクトルにおけるデイッブを除去するために、前記比較処理において周波数ポイント毎に大きい方の値を選択し、前記ディップが除去された観測信号のスペクトルに基づき雑音のスペクトルを推定演算し、前記雑音が抑圧された音声のスペクトルを求めるために、前記観測信号のスペクトル力前記雑音のスペクトルを減算し、前記音声のスペクトルを時間領域の信号に変換する。

この発明の音声に雑音が重畳した観測信号力該雑音が抑圧された音声を得るための雑音抑圧方法は、前記観測信号のスペクトルを分析し、前記観測信号のスぺクトルカ雑音のスぺ外ルを推定演算し、前記推定された雑音のスぺ外ルを平滑ィ匕処理し、前記平滑ィヒ処理された雑音のスペクトルと前記平滑ィヒ処理する前の雑音のスペクトルとを比較し、前記雑音のスペクトルにおけるディップを除去するために、前記比較処理において周波数ポイント毎に大きい方の値を選択し、前記雑音が抑圧された音声のスペクトルを求めるために、前記観測信号のスペクトルから前記雑音のスベクトルを減算し、前記音声のスペクトルを時間領域の信号に変換する。

図面の簡単な説明

[0016] [図 1]この発明の雑音抑圧方法を利用した雑音抑圧処理の処理手順の概要を示すフローチャートである。

[図 2]図 1の雑音抑圧処理の動作説明図である。

[図 3]図 1の雑音抑圧処理を実行するための雑音抑圧装置の実施の形態を示す機能ブロックである。

[図 4]図 2ディップ除去部 22の動作を説明するスペクトル線図である。

[図 5]図 3の雑音推定部 28と抑圧演算部 40の具体例を示すブロック図である。

[図 6]従来のスペクトルサブトラクシヨン法とこの発明によるスペクトルサブトラクシヨン法について、定常雑音を入力したときの出力波形の違いを示す波形図である。

[図 7]この発明の雑音抑圧装置に雑音付き音声を入力した場合の波形図である。符号の説明

[0017] 16· ··フレーム切出し部（第 2の信号切り出し部）

18· ··高速フーリエ変換部 (第 2のスぺ外ル分析部） 22· ··ディップ除去部

24· ··平滑化処理部

28· 雑音推定部 (雑音スペクトル推定演算部）

32· ..フレーム切出し部（第 1の信号切り出し部）

38· ..高速フーリエ変換部 (第 1のスぺ外ル分析部)

42· '·逆高速フーリエ変換部（時間領域変換部）

44· ··出力合成部（出力合成部）

60· ' ·スペクトル減算部 (減算部）

発明を実施するための最良の形態

この発明の実施の形態を以下説明する。図 1は、この発明の雑音抑圧方法を利用した雑音抑圧処理の処理手順の概要を示す。図 2は、図 1の雑音抑圧処理の動作説明図である。図 1において、雑音抑圧対象である観測信号 X (n) (n=0, 1, 2, ···)は

0

、マイク等で収音された、雑音を含む音声信号 (例えば、電話通信で受信された音声信号、音声認識のために入力された信号等)のサンプル列であり、目的とする話者等の音声に背景雑音等の定常雑音が混入した雑音付き音声信号である。観測信号 X (

0 n)は、雑音抑圧用スペクトルの分析用と、雑音推定用スペクトルの分析用とで別々のフレーム長 (信号長すなわち時間窓長)でフレーム切り出し (信号切り出し)が行われる（SI, S2)。すなわち、雑音抑圧用スペクトルの分析用フレームの切り出し (S1)は、観測信号 X (n)を相対的に短いフレーム長 T1で切り出すことにより行われ (以下、

0

この相対的に短いフレーム長 T1を「雑音抑圧用フレーム長」、該フレーム長で切り出される観測信号 X (n)のフレームを「雑音抑圧用フレーム」とそれぞれいう。）、雑音推

0

定用スペクトルの分析用フレームの切り出し (S2)は、観測信号 X (n)を相対的に長

0

V、フレーム長 T2で切り出すことにより行われる（以下、この相対的に長、フレーム長 T2を「雑音推定用フレーム長」、該フレーム長で切り出される観測信号 X (n)のフレ

0

ームを「雑音推定用フレーム」とそれぞれいう。 )。これら雑音抑圧用フレームと雑音推定用フレームの切り出し (SI, S2)は、雑音抑圧用フレームと雑音推定用フレームの先頭を揃えて {つまり、両フレームの先頭に同一時刻の観測信号サンプル (最新のサンプル)を配置して }、観測信号が雑音抑圧用フレーム長 T1の 1Z2の時間を進行する毎に繰り返し行われる。切り出された雑音抑圧用フレームの末尾 (該フレーム中の最古のサンプル）には、該最古のサンプルに後続して所定長の零データ (信号値が零のサンプルデータすなわち零信号)が付加されて、そのフレーム長が、形式的 (擬似的）に、雑音推定用フレーム長 T2と同じ長さに揃えられる（S3)。この処理を行うのは、雑音抑圧用スペクトル力雑音スペクトルを減算するためには、これら両スぺタトルのデータ数 (周波数ポイント数）が揃っている必要があるためである。すなわち、雑音スペクトルのデータ数は雑音推定用スペクトルのデータ数に等しく、雑音抑圧用スベクトルのデータ数を雑音推定用スペクトルのデータ数に揃えるためには、周波数領域のデータに変換する前の時間領域でのデータ数 (サンプル数)を、雑音抑圧用フレームと雑音推定用フレームとで揃える必要がある。なお、雑音抑圧用フレーム長 T 1は、抽出対象の音声が話者音声である場合には、例えば、 20〜32mse_Cに設定することができる。雑音推定用フレーム長 T2は、抑圧対象の雑音が部屋の空調ノイズである場合には、例えば、雑音抑圧用フレーム長 T1の 8倍程度の長さ（例えば 256 msec)に設定することができる。

[0019] 図 2の「（a)雑音抑圧前の処理」は、上記ステップ S1〜S 3による動作を示す。すなわち、観測信号が新たに MZ2サンプル入力される毎 (T1Z2時間毎）に、最新の M サンプルの観測信号が雑音抑圧用フレームとして切り出され (つまり、雑音抑圧用フレームは、 MZ2サンプルずつオーバーラップして切り出される。最新の Nサンプル (N>M。図 2では、 N = 8Mに設定した場合を示す。）の観測信号が雑音推定用フレームとして切り出される。雑音抑圧用フレームの末尾には、 N— Mサンプル分の零データが付加されて、雑音抑圧用フレームのフレーム長が、形式的に、雑音推定用フレーム長 T2と同じ長さに揃えられる。

[0020] 図 1において、零データが付加された雑音抑圧用フレームのデータは、該雑音抑圧用フレームのデータが切り出される毎（すなわち、観測信号の MZ2サンプルの時間間隔毎）に高速フーリエ変換 (FFT: Fast Fourier Transform)されて、周波数領域のデータすなわち雑音抑圧用スペクトル X (k)に変換される（S4)。また、雑音推定

1

用フレームのデータは、該雑音推定用フレームのデータが切り出される毎（すなわち

、観測信号の MZ2サンプルの時間間隔毎）に高速フーリエ変換されて、周波数領域の信号すなわち雑音推定用スぺ外ル X (k)に変換される（S5)。そして、雑音推

2

定用スペクトル X (k)が求められる都度 (すなわち、観測信号の

2 MZ2サンプルの時間間隔毎に）、該雑音推定用スペクトル X (k)は適宜のディップ除去処理または平滑

2

化処理が施される（S6)。さらに、このディップ除去処理または平滑化処理が施される毎 (すなわち、観測信号の MZ2サンプルの時間間隔毎）に、該ディップ除去処理または平滑ィヒ処理された雑音推定用スペクトル X ' (k)と、前回の雑音スペクトルの推

2

定値とに基づいて、今回の雑音スペクトル N (k)を推定する演算が行われる（S7)。

[0021] また、雑音抑圧用スペクトル X (k)と雑音スペクトル N (k)が求められる毎 (すなわち

1

、観測信号の MZ2サンプルの時間間隔毎）に、雑音抑圧用スペクトル X (k)から雑

1 音スペクトル N (k)が減算されて、雑音が抑圧された音声スペクトル G (k)が求められる（S8)。この音声スペクトル G (k)は、逆高速フーリエ変換 (I FFT)されて、時間領域の信号すなわち音声信号に変換される（S9)。観測信号の MZ2サンプルの時間間隔毎に得られる各フレームの音声信号は、相互に連結されて（S10)、連続した音声信号 g(n)となって出力され、スピーカからの発声や、話者の音声認識処理等に利用される。

[0022] 図 2の「（b)雑音抑圧後の処理」は、上記ステップ S 10のフレーム合成動作を示す。

すなわち、逆高速フーリエ変換（S9)により得られた Nサンプルのフレームの末尾から、零データを付カ卩した分の N— Mサンプルを削除して、元の Mサンプルのフレームに戻す。そして、観測信号の MZ2サンプルの時間間隔毎に得られる各 Mサンプルのフレームのデータに三角窓を掛けて {すなわち、 1フレーム長（Mサンプル分の時間長）の前半の 1Z2フレームでゲインが 0から 1に直線的に上昇し、後半の 1Z2フレームでゲインが 1から 0に下降する特性のゲインを付与し }、フレームを相互に加算して（すなわち、 1Z2フレームずつオーバーラップして加算される）、連続した音声信号を作成する。これにより、フレーム間に切れ目や段差の無い連続した音声信号が得られる。

[0023] 次に、以上説明した図 1の雑音抑圧処理を実行するための雑音抑圧装置の実施の形態を説明する。この実施の形態では、

•サンプリング周波数 = 16kHz •M (雑音抑圧用フレーム長 Tl) = 512サンプル（32msec長に相当）

• N (雑音推定用フレーム長 T2) = 4096サンプノレ（256msec長に相当）

に設定した場合について説明する。図 3に雑音抑圧装置の機能ブロックを示す。入力信号 (雑音付き音声信号) X (n)は、雑音スペクトル出力部 10と雑音抑圧部 12に

0

共通に入力される。雑音スペクトル出力部 10に入力された雑音付き音声信号は、始めに雑音推定用スペクトル分析部 14で、雑音推定用の周波数分析が行われる。すなわち、フレーム切出し部 16は、新たに MZ2サンプル（256サンプル）の入力信号が入力される毎に、最新の N (4096)サンプルの入力信号を切り出す。高速フーリエ変換部 18は、切り出されたフレームを高速フーリエ変換して、周波数領域のデータすなわちスペクトルデータ (離散フーリエ変換) X (k) (k=0, 1, 2, ···)に変換する。

2

振幅スペクトル計算部 20は、求められたスペクトルデータ X (k)から、その振幅スぺク

2

トルを求める。

[0024] ディップ除去部 22は、求められた振幅スペクトルのディップすなわち周波数特性上の窪みを除去する。ディップ除去処理は例えば次のようにして行われる。すなわち、始めに振幅スペクトルを平滑ィ匕処理部 24で平滑ィ匕処理する。平滑ィ匕処理のアルゴリズムとしては、例えば移動平均法を用いることができる。移動平均法では、所定数の連続した周波数ポイント (すなわち所定の周波数帯域幅）における振幅の平均値を該周波数帯域の中央の周波数ポイントの振幅値として置き換える。 1回の平均で使用する連続した周波数ポイントの点数 (すなわち、平均値を求める周波数帯域幅）は、例えば 8点とすれば、平滑ィヒされた振幅スペクトル (雑音推定用振幅スペクトル)の実質的な周波数分解能は、雑音抑圧用振幅スペクトルの実質的な周波数分解能に等しくなる。この平均値算出および振幅値の置き換えを、周波数ポイントを 1ポイントずつずらして実行し、全周波数帯域にわたり平滑ィ匕した振幅スペクトルを求める。

[0025] 平滑化処理部 24における平滑化処理のアルゴリズムとしては、移動平均法のほかに、移動メディアン法を用いることもできる。移動メディアン法では、所定数 (例えば 8 点）の連続した周波数ポイント（すなわち所定の周波数帯域幅）の中で、振幅値の中央値を該周波数帯域の中央の周波数ポイントの振幅値として置き換える。そして、この振幅値の中央値の抽出および振幅値の置き換えを、周波数ポイントを 1ポイントずつずらして実行し、全周波数帯域にわたり平滑ィ匕した振幅スペクトルを求める。

[0026] ディップ除去部 22において、比較部 26は、平滑ィ匕処理部 24で平滑ィ匕された振幅スペクトルと平滑ィ匕される前の振幅スペクトルとを比較して、周波数ポイント毎に大きい方の値を選択し、該選択した値を繋いで構成される一連の特性を、雑音推定用振幅スペクトル | X (k) |として出力する。これにより、ディップが除去された雑音推定

2

用振幅スペクトル | X (k) |が得られる。

2

[0027] 図 4は、ディップ除去部 22の動作を示す {全振幅スペクトルの一部の周波数領域（ 0〜： LOOHz)のみを拡大して示す。 }。平滑化する前の振幅スペクトル Aと移動平均法で平滑ィ匕した振幅スペクトル Bが比較され、周波数ポイント毎に黒点で示す大き!/、方の値が選択されて、該選択された値を繋いで構成される一連の特性が、ディップが除去された振幅スペクトルとしてディップ除去部 22から出力される。これにより、振幅スペクトル Aのディップ (谷）が除去され、処理雑音が低減される。

[0028] なお、図 3の比較部 26をなくして、平滑ィ匕処理部 24の出力信号 (すなわち、移動平均法、移動メディアン法等で平滑化された振幅スぺ外ル)を雑音推定用振幅スぺクトル | X (k) |として雑音推定用スペクトル分析部 14から出力する（すなわち、デイツ

2

プ除去部 22に代えて、平滑ィ匕処理部 24のみを配置する）こともできる。

[0029] 図 3において、雑音推定部 28は、ディップが除去されあるいは平滑ィ匕された振幅スベクトルに基づき、任意の推定アルゴリズムで、観測信号に含まれる雑音の振幅スぺタトル (以下「雑音振幅スペクトル」という。）を推定演算する。なお、ディップ除去部 22 (あるいは、ディップ除去部 22に代えて平滑ィ匕処理部 24)は、雑音推定部 28の前に配置する代わりに、雑音推定部 28の後に配置することもできる。

[0030] 一方、雑音抑圧部 12に入力された入力信号 (雑音付き音声信号 ) x (n)は、始め

0

に抑圧用スペクトル分析部 30で雑音抑圧用（すなわち、雑音スペクトルが減算される被減算値としての観測信号スぺ外ルの作成用)の周波数分析が行われる。すなわち、フレーム切出し部 32は、新たに MZ2サンプル（256サンプル）の入力信号が入力される毎に、最新の M (512)サンプルの入力信号を切り出す。零データ発生部 34は、 N—M (3584)サンプル分の零データを発生する。加算部 36は、フレーム切出し部 32で切り出された Mサンプルの入力信号の末尾に N— Mサンプル分の零データを付加して、該切り出された入力信号を、形式的に、雑音推定用フレーム長 T2と同じ長さに揃える。高速フーリエ変換部 38は、この零データが付加されたデータを高速フ一リエ変換して、周波数領域のデータすなわちスペクトルデータ (離散フーリエ変換） X (k) (k=0, 1, 2, · · ·)に変換し、雑音抑圧用スペクトルとして出力する。

1

[0031] 抑圧演算部 40は、抑圧用スペクトル分析部 30から出力される雑音抑圧用スぺタトル X (k)と、雑音スペクトル出力部 10から出力される雑音振幅スペクトル I N (k)

1 I に基づき、任意の抑圧アルゴリズムで雑音抑圧処理を行う。抑圧演算部 40から出力される雑音が抑圧された音声スペクトル G (k)は、逆高速フーリエ変換部 42で逆高速フーリエ変換されて、時間領域の信号に戻される。逆高速フーリエ変換部 42から出力される信号は、 N (4096)サンプルのデータであるので、出力合成部 44で、零データを付カ卩した分の下位 N— M (3584)サンプルが除去されて、元の M (512)サンプルのデータに戻され、さらにフレームどうしが連結されて、連続した音声信号 g (n) として出力される。

[0032] 雑音推定部 28と抑圧演算部 40の具体例を図 5に示す。雑音推定部 28において、スペクトル包絡線抽出部 45は、図 3の雑音推定用スペクトル分析部 14から出力される雑音推定用振幅スペクトル I X (k)

2 Iに含まれる細力な凹凸特性を除去して、該雑音推定用振幅スペクトル I X (k)

2 I の包絡線 I X ' (k)

2 Iを抽出するものである。これは、後述する相関値算出において、雑音推定用振幅スペクトル I X (k)

2 I そのものを用いると、スペクトルの相関値が低くなり、「音声区間」と「雑音区間」の区別が明確でなくなるためである。すなわち、雑音は、長時間観測を繰り返してそのスぺタトルを平均してみれば、そのスペクトルは広、帯域にわたってほぼ一様となる滑らかな分布となることが期待できる。しかし、短時間で見れば多くの山谷を有するスペクトルの変動が観察される。一方、音声は、雑音とは異なり、その全体的な周波数特性は特定の周波数帯域に大きな振幅値を持っており、全周波数帯域に一様に分布していない。この具体例では、この「全周波数帯域に一様に分布する雑音」と、「ある特定の周波数帯域に大きな振幅値を持つ音声」を、スペクトルの相関値の大小で区別して雑音スペクトルを推定するので、雑音振幅スペクトルが持ってヽる細かな凹凸特性を除去する。 [0033] スペクトル包絡線抽出部 45は、例えば、雑音推定用振幅スペクトル | X (k) |を時

2 間波形と見立ててローパスフィルタ処理をすることにより、包絡線を抽出する。ローバスフィルタ処理は、例えば、雑音推定用振幅スペクトル | X (k) | を直接ローバスフ

2

ィルタにかける、あるいは雑音推定用振幅スペクトル | X (k) |を周波数軸方向に移

2

動平均処理をする等により行うことができる。また、スペクトル包絡線抽出部 45により雑音推定用振幅スペクトル I X (k) | の包絡線 | X ' (k) |を抽出する別の方法とし

2 2

て、雑音推定用振幅スペクトル I X (k) |をさらにフーリエ変換してケプストラムによ

2

つて求める方法もある。

[0034] 雑音振幅スペクトル初期値出力部 46は雑音振幅スペクトルの初期値を出力する。

すなわち、本装置の起動当初は、参照する雑音振幅スペクトルデータがないため、初期値を設定する。雑音振幅スペクトル初期値の設定方法としては、例えば、次の方法が考えられる。

(方法 1)起動直後に入力された、音声の混入して、な、背景雑音のみのデータをフ一リエ変換し、該フーリエ変換されたデータから求められる振幅スペクトルデータを雑音振幅スペクトル初期値として設定する。

(方法 2)予め背景雑音に相当する振幅スペクトルデータをメモリに保持しておき、起動時にそれを読み出して雑音振幅スペクトル初期値として設定する。あるいは、予め背景雑音に相当する振幅スペクトルデータの包絡線データをメモリに保持しておき、起動時にそれを読み出して雑音振幅スペクトル包絡線データの初期値として設定する。

(方法 3)ホワイトノイズやピンクノイズの振幅スペクトルデータを雑音振幅スペクトル初期値として設定する。

[0035] 雑音振幅スペクトル更新部 48は、後述する雑音振幅スペクトル算出部 50で半フレーム (T1/2)ごとに求められる雑音振幅スペクトル I N (k) Iを順次入力し、半フレーム分遅延して、前回 (半フレーム前)観測された信号区間の観測信号について推定された雑音振幅スペクトル I N (k) Iとして順次出力するものである。起動当初は

0

雑音振幅スペクトル I N (k) I は未だ推定されていないので、雑音振幅スペクトル更新部 48は雑音振幅スペクトル初期値出力部 46で設定された雑音振幅スペクトルの初期値を出力する。スペクトル包絡線抽出部 52は、スペクトル包絡線抽出部 45と同様の方法により、雑音振幅スペクトル I N (k) |の包絡線 | N ' (k) |を抽出する。

0 0

相関値算出部 54は、スペクトル包絡線抽出部 45で抽出された現フレームの雑音推定用振幅スペクトル包絡線 I X' (k) |と、スペクトル包絡線抽出部 52で抽出され

2

た雑音振幅スペクトル包絡線 | N ' (k) | の相関値 (相関係数） pを求める。相関値

0

は、

雑音推定用振幅スペクトル包絡線 | X，（k) | =x (但し、 k= l， 2,…， K)

2 k

雑音振幅スペクトル包絡線を I N ' (k) | =y (但し、 k= l, 2, · ··, K)

0 k

とすると、（1)式により求められる。

[数 1]

ただし、

»( = - Uxj /K)²

雑音振幅スペクトル算出部 50は、求められた相関値 pに応じて、現在観測されている信号区間の音声信号について雑音振幅スペクトル I N (k) Iを、（2)式により求める。

I N (k) I (k)

I …

但し、 I N (k) I ：現在観測されているフレームの音声信号について推定

される雑音振幅スペクトル

I N (k) I ：前

0 回 (半フレーム前)観測されたフレームの音声信号につ、て推定された雑音振幅スペクトル

I X (k) | ：現在観測されているフレームの雑音推定用振幅スペクトル

2

：現在観測されて、るフレームの音声信号のスペクトルの包絡線と前回観測されたフレームの音声信号について推定された雑音のスペクトルの包絡線との相関値

1, m:定数 (1は 1以上の値、 mは 0以上の値）

[0038] (2)式は、前回 {半フレーム (T1/2)前 }推定した雑音振幅スペクトル I N (k)

0 Iと

、今回算出した雑音推定用振幅スぺ外ルは（k) Iを、求められた相関値 pに応じ

2

た比率で加算して、新たな雑音振幅スペクトル I N (k) Iを推定するものである。すなわち、相関値 pが低いときは、入力信号に含まれる音声成分が多い (つまり、有音区間）と判断されるので、前回推定した雑音振幅スペクトル I N (k)

0 I の比率を高くし、今回算出した雑音推定用振幅スぺ外ル I X (k)

2 Iを比率を低くして加算する。つまり、雑音振幅スペクトル I N (k) Iが音声成分の影響で変化しないようにする。これに対し、相関値 pが高いときは、入力信号に含まれる音声成分が少ない（つまり、無音区間）と判断されるので、前回推定した雑音振幅スペクトル I N (k)

0 I の比率を低くし、今回算出した雑音推定用振幅スぺ外ル I X (k)

2 Iを比率を高くして加算する。つまり、雑音振幅スペクトル I N (k) I力定常雑音の緩やかな変化に追従して変化するようにする。そして、相関値 pが限りなく 1に近いときに、前回推定した雑音振幅スペクトル I N (k)

0 Iと、今回算出した雑音推定用振幅スペクトル I X (k)

2 Iを同じ比率 (0. 5 : 0. 5)で加算する。このようにして、主に無音区間で雑音振幅スぺタトルが更新される。

[0039] (2)式において、 1は、低相関値に対する感度を調整するための定数である。 1値が大きいほど低相関時の雑音振幅スペクトル推定値の更新量が少なくなる。また、 (2) 式において、 mは、更新量を調整するための定数である。 m値が大きいほど更新量が少、なくなる。

[0040] 抑圧演算部 40に入力される雑音抑圧用スペクトル X (k)は、振幅スペクトル計算部

1

56と位相スペクトル計算部 58に入力される。振幅スペクトル計算部 56は、（3)式により雑音抑圧用スペクトル X (k)の振幅スペクトル I X (k) Iを求める。 I x 1 (k) I ={x R (k)²+x I(k)²}¹² -(3)

但し、 X (k):X (k)の実数部

R 1

X (k) :X (k)の虚数部

I 1

また、位相スペクトル計算部 58は、（4)式により雑音抑圧用スペクトル X (k)の位相ス

1

ぺクトノレ 0 (k)を求める。

Θ (k)=tan^_1{X(k)/X (k) } ·'·(4)

I R

[0041] スペクトル減算部 60は、（5)式により、振幅スペクトル計算部 56で求めた現フレームの雑音抑圧用振幅スペクトル I X (k)

1 Iから、雑音推定部 28で求めた現フレームの雑音振幅スペクトル I N(k) Iを減算することにより、雑音振幅スペクトルを除去した現フレームの音声信号の振幅スペクトル I Y(k) Iを求める。

I Y(k) I = |x 1(k) I I N(k) I … ）

なお、 I x^k) I— I N(k) Iが負の値となる周波数ポイントでは、引き過ぎであるので、減算値 I Y(k) Iを負の値のままとせずに、零とするのがよい。

[0042] 再合成部 62は、スペクトル減算部 60で求めた現フレームの音声信号の振幅スぺクトル I Y(k) Iと、位相スペクトル計算部 58で求めた現フレームの雑音抑圧用スぺクトル X (k)の位相スペクトル 0 (k)とを再合成して、（6)式に示す複素スペクトルすな

1

わち雑音が抑圧された音声スペクトル G (k)を作成する。

G(k)= I Y(k) I e^fl(k) ー(6)

作成された音声スペクトル G(k)は、図 3の逆高速フーリエ変換部 42に供給される。

[0043] 図 6は、雑音抑圧装置に定常雑音を入力したときの出力波形を示す。 (a)は原雑音である。 (b)、 (c)は、従来のスペクトルサブトラクシヨンによる手法すなわち観測信号の切り出しフレーム長を雑音推定用と雑音抑圧用とで共通にしたときの雑音抑圧出力であり、（b)は、両切り出しフレーム長を 32msecに設定したときのもの、（c)は、両切り出しフレーム長を 256msecに設定したときのものである。（d)、（e)は、この発明による雑音抑圧方法による雑音抑圧出力であり、いずれも切り出しフレーム長を、雑音推定用（T2)を 256msec、雑音抑圧用（T1)を 32msecに設定したときのものである。 (d)はディップ除去部 22 (図 3)によるディップ除去処理を行わなかったときのもの、（c)は同ディップ除去処理を行ったときのものである。図 6によれば、（a)の原雑音に対する減音量は、

(b)の従来手法の場合： 20dB

(c)の従来手法の場合： 19dB

(d)の本発明手法 (ディップ除去処理無し)の場合： 36dB

(e)の本発明手法 (ディップ除去処理有り）の場合： 64dB

であった。したがって、この発明によるスペクトルサブトラクシヨン法 (d)、（e)は、従来のスペクトルサブトラクシヨン法 (b)、 (c)に比べて高い雑音抑圧効果が得られることがわかる。また、この発明による雑音抑圧方法では、ディップ除去処理を行った場合 (e )の方が、ディップ除去処理を行わなかった場合 (d)よりも高ヽ雑音抑圧効果が得られることがゎカゝる。

[0044] 図 7は、この発明の雑音抑圧装置に、雑音付き音声を入力した場合の波形図を示す。ここでは、雑音推定用フレーム長 T2を 256msecとし、雑音抑圧用フレーム長 T1 を 32msecに設定した。（a)は原雑音付き音声である。（b)は雑音抑圧出力である。 ( c)は、抑圧音 (消された音)である。図 7によれば、（a)の雑音付き音声から、（c)の定常雑音が抑圧されて、 (b)の音声が得られることがわかる。

[0045] 前記実施の形態では、振幅スペクトルサブトラクシヨン法を用いて、入力信号の振幅スペクトル I X (k) I の包絡線 I X ' (k) に基づき雑音振

2 I 幅スペクトル

2 I N (k)

Iを推定し、入力信号の振幅スペクトル I X (k) Iから雑音振幅スペクトル I N (k) Iを減算して雑音抑圧を行った力これに代えて、パワースペクトルサブトラクシヨン法を用いて、入力信号のパワースペクトル I X (k) I ²の包絡線 I X ' (k) I ²に基づ

2 2

き雑音のパワースペクトル I N (k) 1 ²を推定し、入力信号のパワースペクトル I X (k

2

) I ²から雑音のパワースぺ外ル I N (k) I ²を減算して雑音抑圧を行うこともできる。

[0046] 前記実施の形態では、雑音推定処理を所定時間間隔 (T1Z2時間毎)毎に必ず行うようにした力適宜の時間毎に行うようにしてもよい。例えば、無音声区間、微少音声区間等の雑音推定が容易な区間を実時間で検出し、該雑音推定が容易な区間でのみ雑音推定処理を行い、それ以外の区間では雑音推定処理を行わない (一時停止する)ことができる。また、雑音変動が少ない区間や処理負荷を減らしたい区間も雑音推定処理を行わない (一時停止する)ことができる。これらの場合、雑音推定処理を一時停止して、る区間では、雑音振幅スペクトル更新部 48のデータ (雑音振幅スペクトル | N (k) | )の更新は行わず、この雑音振幅スペクトル更新部 48に保持さ

0

れている最新の（一時停止直前の)雑音振幅スペクトル I N (k) |に基づいて雑音

0

抑圧処理を行うことができる。

[0047] 前記実施の形態では周波数分析手法として FFTを用いた場合にっ、て説明した力この発明は FFT以外の周波数分析手法を用いることもできる。

[0048] 前記実施の形態では、雑音抑圧用に観測信号を切り出す時間窓長 (雑音抑圧用フレーム長 T1すなわち Mサンプル分の時間）を、該切り出しを行う時間間隔 (MZ2 サンプル分の時間）よりも長く設定したが、これは出力合成の際にオーバーラップ処理を行うためであり、オーバーラップ処理を行わない場合は、これら両時間間隔を等しく設定することができる。

[0049] 本発明を詳細にまた特定の実施態様を参照して説明してきたが、本発明の精神、範囲または意図の範囲を逸脱することなく様々な変更や修正を加えることができることは当業者にとって明らかである。

本発明は、 2005年 5月 17日出願の日本特許出願 (特願 2005-144744)に基づくものであり、その内容はここに参照として取り込まれる。

Claims

請求の範囲

[1] 音声に雑音が重畳した観測信号力該雑音が抑圧された音声を得るための雑音抑圧方法は、

前記観測信号から第 1の観測信号を切り出し、

前記第 1の観測信号のスペクトルを分析し、

前記第 1の観測信号のスペクトル力雑音のスペクトルを推定演算し、前記観測信号から第 2の観測信号を切り出し、

前記第 2の観測信号のスペクトルを分析し、

前記第 2の観測信号のスペクトル力前記雑音のスペクトルを減算し、前記音声のスペクトルを時間領域の信号に変換し、

前記第 1の観測信号の信号長は、前記第 2の観測信号の信号長よりも長い。

[2] 雑音抑圧方法は、

音声に雑音が重畳して時間とともに進行する観測信号を、該観測信号が進行する所定の時間間隔毎に、該時間間隔と同じかまたは該時間間隔よりも長い第 1の信号長で切り出し、

前記第 1の信号長で切り出された観測信号のスペクトルを第 1のスペクトルとして分祈し、

前記観測信号を、前記所定の時間間隔毎または適宜の時間毎に、その先頭を前記第 1の信号長で切り出される観測信号の先頭に揃えて、該第 1の信号長よりも長い第 2の信号長で切り出し、

前記第 2の信号長で切り出された観測信号のスペクトルを第 2のスペクトルとして分祈し、

前記第 2のスペクトルに基づ、て、前記観測信号に含まれる雑音のスペクトルを推定演算し、

雑音が抑圧された音声のスペクトルを求めるために、前記所定の時間間隔毎に、前記第 1のスペクトル力前記雑音のスペクトルを減算し、

前記所定の時間間隔毎に、前記求められた音声のスペクトルを時間領域の信号に変換し、前記変換された時間領域の信号を相互に連結して、雑音が抑圧された一連の音声を得る。

[3] 請求項 2記載の雑音抑圧方法であって、前記第 2のスペクトルを平滑化処理し、該平滑ィ匕処理された第 2のスペクトルに基づき前記雑音のスペクトルを推定演算する。

[4] 請求項 2記載の雑音抑圧方法であって、前記推定された雑音のスペクトルを平滑ィ匕処理した後に前記減算処理を行う。

[5] 請求項 2記載の雑音抑圧方法であって、前記推定演算処理は、

前記第 2のスペクトルを平滑ィ匕処理し、

前記平滑化処理された第 2のスペクトルと該平滑化処理する前の前記第 2のスぺタトルとを比較し、

第 2のスペクトルにおけるディップを除去するために、前記比較処理にお!、て周波数ポイント毎に大き 1、方の値を選択し、

前記ディップが除去された第 2のスペクトルに基づき前記雑音のスペクトルを推定演算する。

[6] 請求項 2記載の雑音抑圧方法であって、前記減算処理は、

前記推定された雑音のスペクトルを平滑ィ匕処理し、

前記平滑化処理された雑音のスペクトルと前記平滑化処理する前の雑音のスぺタトルとを比較し、

雑音のスペクトルにおけるディップを除去するために、前記比較処理にぉ、て周波数ポイント毎に大き、方の値を選択し、

前記ディップが除去された雑音のスぺクトルを用ヽて前記第 1のスぺクトルとの減算を行う。

[7] 請求項 2に記載の雑音抑圧方法であって、前記第 1のスペクトルの分析に使用する前記観測信号の信号長を、前記第 2の信号長と同じ長さに揃えるために、前記第 1の信号長で切り出された観測信号の末尾に後続して所定長の零信号を付加し、前記零信号が付加された観測信号にっヽて前記第 1のスペクトルの分析を行ヽ、前記分析された第 1のスペクトル力前記雑音のスペクトルを減算し、

前記減算処理により得られた音声のスペクトルを前記時間領域の信号へ変換し、前記時間領域の信号を前記第 1の信号長に戻すために前記時間領域の信号の末尾から、前記零信号を付加した長さ分の信号を削除し、

前記第 1の信号長に戻された時間領域の信号を相互に連結する。

[8] 請求項 2に記載の雑音抑圧方法であって、前記所定の時間間隔が、前記第 1の信号長の 1Z2の長さである。

[9] 請求項 8記載の雑音抑圧方法であって、前記時間領域の信号が前記所定の時間間隔毎に前記第 1の信号長で得られる信号であり、該時間領域の信号に三角窓を掛け、該三角窓が掛けられた時間領域の信号を順次加算して前記信号相互の連結を行

[10] 音声に雑音が重畳した観測信号力雑音が抑圧された音声を得るための雑音抑圧装置は、

第 1の信号長を有する前記観測信号のスぺ外ルを分析する第 1のスぺ外ル分析部と、

第 2の信号長を有する前記観測信号のスぺ外ルを分析する第 2のスぺ外ル分析部と、

前記第 2のスペクトル分析部で分析された観測信号のスペクトル力雑音のスぺタトルを推定演算する雑音スペクトル推定演算部と、

雑音が抑圧された音声のスペクトルを求めるために、前記第 1のスペクトル分析部で分析されたスぺ外ルカ前記雑音のスペクトルを減算する減算部と、

前記求められた音声のスペクトルを時間領域の信号に変換する時間領域変換部とを具備し、

前記第 2の信号長が、前記第 1の信号長よりも長い。

[11] 雑音抑圧装置は、

音声に雑音が重畳して時間とともに進行する観測信号を、該観測信号が進行する所定の時間間隔毎に、該時間間隔と同じかまたは該時間間隔よりも長い第 1の信号長で切り出す第 1の信号切り出し部と、

前記第 1の信号切り出し部で切り出された観測信号のスペクトルを第 1のスペクトルとして分析する第 1のスペクトル分析部と、前記観測信号を、前記所定の時間間隔毎または適宜の時間毎に、その先頭を前記第 1の信号長で切り出される観測信号の先頭に揃えて、該第 1の信号長よりも長い第 2の信号長で切り出す第 2の信号切り出し部と、

前記第 2の信号切り出し部で切り出された観測信号のスペクトルを第 2のスペクトルとして分析する第 2のスペクトル分析部と、

前記第 2のスペクトルに基づ、て、前記観測信号に含まれる雑音のスペクトルを推定演算する雑音スペクトル推定演算部と、

雑音が抑圧された音声のスペクトルを求めるために、前記所定の時間間隔毎に、前記第 1のスペクトル力前記雑音のスペクトルを減算する減算部と、

前記所定の時間間隔毎に、前記求められた音声のスペクトルを時間領域の信号に変換する時間領域変換部と、

前記変換された時間領域の信号を相互に連結して、雑音が抑圧された一連の音声を得る出力合成部と、

を具備してなる。

[12] 音声に雑音が重畳した観測信号力該雑音が抑圧された音声を得るための雑音抑圧方法は、

前記観測信号のスぺ外ルを分析し、

前記観測信号のスペクトルを平滑ィヒ処理し、

前記平滑化処理された観測信号のスペクトルと、前記平滑化処理する前の観測信号のスペクトルとを比較し、

前記観測信号のスペクトルにおけるディップを除去するために、前記比較処理にお V、て周波数ポイント毎に大き、方の値を選択し、

前記ディップが除去された観測信号のスペクトルに基づき雑音のスペクトルを推定

■i^fl "し、

前記雑音が抑圧された音声のスペクトルを求めるために、前記観測信号のスぺタトルカ前記雑音のスペクトルを減算し、

前記音声のスペクトルを時間領域の信号に変換する。

[13] 音声に雑音が重畳した観測信号力該雑音が抑圧された音声を得るための雑音抑圧方法は、

前記観測信号のスぺ外ルを分析し、

前記観測信号のスぺ外ルカも雑音のスぺ外ルを推定演算し、

前記推定された雑音のスペクトルを平滑ィヒ処理し、

前記雑音のスペクトルにおけるディップを除去するために、前記比較処理にぉ、て周波数ポイント毎に大きい方の値を選択し、

前記音声のスペクトルを時間領域の信号に変換する。