JP4350690B2

JP4350690B2 - 音声品質向上方法及び装置

Info

Publication number: JP4350690B2
Application number: JP2005258585A
Authority: JP
Inventors: チャンウキム
Original assignee: LG Electronics Inc
Current assignee: LG Electronics Inc
Priority date: 2004-09-07
Filing date: 2005-09-06
Publication date: 2009-10-21
Anticipated expiration: 2025-09-06
Also published as: US7590524B2; KR20060022525A; DE602005004464D1; CN1746974A; EP1632935A1; BRPI0503959A; RU2005127995A; US20060074640A1; ATE385027T1; RU2391778C2; CN100520913C; EP1632935B1; KR100640865B1; JP2006079085A; DE602005004464T2

Description

本発明は効果的な音声品質向上方法および装置に関する。

従来、様々な音質向上方法が提案されてきた。その代表的な方法の一つがスペクトルサブトラクション方法（spectral subtraction method：以下、ＳＳＭ）である。以下、そのＳＳＭを図１に基づいて説明する。

ＳＳＭは、ショートタイムスペクトルの大きさを直接推定する方法である。

ＳＳＭで音声は、無相関ランダム変数で表示される雑音が加えられた形態でモデリングされる。その音声のモデリングは次の式１のように表される。

（数学式１）
y[n]=s[n]+d[n]
上記式１で y[n] は入力音声である。また、式１で d[n] は s[n] と無相関した雑音であると仮定する。

これに基づき、電力スペクトル密度を求めると、次の式２のように表される。

（数学式２）

上記の式２で

をショートタイム離散時間フーリエ変換（Discrete-Time Fourier Transform；以下、ＤＴＦＴでに表示すると、次の式３となる。

（数学式３）

音声フレーム自体のスペクトルを求めるためには、位相が分からなければならず、事実上、雑音の交った音声の位相で音声フレームのフレーム位相を決定しても大きな問題がないことが立証された。[１]
[１] D.L.Wang and J.S Lim,"The unimportance of phase in 音声 enhancement,"IEEE Trans. on Acoust．音声, and Signal Processing, vol-ASSP.30,pp.679-681,1982.

上記の雑音の交った音声の位相で音声フレームの位相を決定する場合、得ようとするショートタイムＤＴＦＴは次の式４から求められる。

（数学式４）

上記の式４の

は、上記の式２から求められる。

は雑音の交った音声の位相を用いる。その結果、式４から得ようとする

の推定値を得ることができ、

は、音声がない時に雑音から推定できる。

次に、他の音声品質向上方法のうちの一つである適応ライン向上技法（Adaptive Line Enhancer; 以下、ＡＬＥ）について図２を参照して説明する。

ＡＬＥの説明に先立って、一般的な適応フィルタを用いる場合について先ず説明する。
これは、ＡＬＥが適応フィルタを用いる方法から更に発展したものであるからである。

まず、適応フィルターを用いる場合は、両マイクロフォンの入力、即ち、一つのマイクロフォンの入力の雑音の交った音声と、他方のマイクロフォンの入力の純粋な雑音を受信した後には、２つのマイクロフォン間の距離などで伝達関数などが生じる。しかし、それを適応フィルターで除去して、きれいな音声だけを得ることができる。
上述した適応フィルタを用いる方法は、場合によって非常に効果的で実用的な目的で有用に用いられてきた。しかし、２つのマイクロフォンを設置しなければならない。そして、２つのマイクロファンの間の距離をどの程度にするべきかなどの構造的な不具合がある。そのため、端末機に適用するには無理が伴う。

ＡＬＥは、上記の適応フィルタを用いる方法を改良したもので、同一のマイクロフォンから得た信号ｓ[ｎ]とｄ[ｎ]を、ピッチ周期だけの差異を置いて適応フィルタリングする方法である。前記のピッチ周期は音声信号の有声音部分の周期である。
一方、有線信号の場合には、周期的なインパルス列（impulse train）がボーカルトラクト(vocal tract)を励起させる構造となっている。したがって、有声音でＡＬＥは最も大きな効果を発揮する。しかし、無声音の場合は、音声の歪みなどの現象が現れる。

次に、ほかの音声品質向上方法のうちの一つである適応コムフィルタを用いる方法について説明する。適応コムフィルタを用いる場合もＡＬＥと類似した点があり、有声音により優れた効果を発揮する。有声音の場合に励起信号は周期的な信号であるが、周知のように、インパルス列をフーリエ変換しても、その結果を見ると、周波数領域でインパルス列に現れる。

したがって、有声音の場合、ピッチ周波数の倍となる部分でピークが周期的に現れる形態で構成される。勿論、全体のスペクトルの輪郭は、フォルマントというボーカルトラクトの反響に表示される。

雑音の交った音声を

として表示し、音声を

として表示し、雑音を除去した音声を推定したものを

として表示する場合に、適応コムフィルタによって向上した音声は次の式５のように表される。

（数学式５）

上記の式５で

は抽出されたピッチ手記を表し、

はコムフィルタの係数を表す。
Ｌの値は通常小さい値（１〜６）を用いる。

一方、適応コムフィルタは、一般的にノイジが周期的ではないため、それを除去するのに効果的である。

しかしながら、上記の従来技術に係る音声品質向上方法を用いるには次のような問題があった。

まず、ＳＳＭで

は、音声がない時に雑音から推定する。ところが、その

を信頼性よく測定することができない。即ち、

は、雑音の

が固定された信号であると仮定する場合に推定できる。しかし、実際の場合はそうであるとしても、時間に従ったスペクトルの変化はある。特に、携帯用端末機などの場合は、続けて周辺の環境が変わるので、実質に

を信頼度よく測定することができない。

また、ＡＬＥや適応コムフィルタを用いる技法は、有声音より優れた性能を発揮する。

しかし、これらの方法は、有声信号に対してのみ適用可能であり、有声/無線決定が多少外れて無声信号にその方法が適用される場合には、却って性能低下を引き起こす。

また、一部の音声の場合、低周波数では有声特性を現わすが、高周波数では無声特性を現わしたりもする。このような点がＡＬＥの性能低下をもたらす。

本発明は上記の問題点を鑑みて案出したもので、無声音での雑音除去を通して音声品質の低下を防ぐのに適した音声品質向上方法及び装置を提供することにある。

他の目的として、ＡＬＥとＳＳＭを適用して、雑音を効果的に除去することのできる音声品質向上方法及び装置を提供する。

上記目的を達成するための本発明に係る音声品質向上方法は、入力音声を有声音と無声音とに区分するステップ；前記有声音の雑音を除去するための適応フィルタリングを行うステップ；前記無声音に対するスペクトルサブトラクションを行うステップを備えてなることを特徴とする。

より好ましくは、前記有声音の雑音を除去するために、前記適応フィルタリングを用いる適応ライン向上技法(ＡＬＥ)を行う。ここで、前記適応ライン向上技法(ＡＬＥ)により、前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を、スペクトルサブトラクションに用いる。

より好ましくは、前記適応フィルタリングは、前記有声音に当たるフレームから抽出したピッチ周期を用いる。

より好ましくは、前記入力音声に対して低域通過フィルタリング及び高域通過フィルタリングを行うステップを更に備える。前記高域通過フィルタリングの出力から雑音を除去するための適応コムフィルタリングを更に行う。ここで、前記適応コムフィルタリングは、
前記高域通過フィルタリングの出力が有声音の場合に行う。また、前記低域通過フィルタリングの出力を、前記有声音と前記無声音とに区分する。
より好ましくは、前記有声音の区間で得た雑音スペクトルデータを前記スペクトルサブトラクションに用いる。ここで、前記雑音スペクトルデータは、前記適応フィルタリングによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値である。

上記目的を達成するための本発明に係る音声品質向上方法は、入力音声を有声音と無声音とに区分する決定ブロック；前記有声音に対して適応ライン向上技法（ＡＬＥ）を行うＡＬＥブロック；前記無声音に対してスペクトルサブトラクションを行うＳＳブロックを含んで構成されることを特徴とする。

より好ましくは、前記入力音声を低域通過フィルタリングして、前記決定ブロックに出力する低域通過フィルタ；前記入力音声を高域通過フィルタリングする高域通過フィルタを更に備える。前記高域通過フィルタの出力が有声音の場合に、前記高域通過フィルタの出力から雑音を除去するための適応コムフィルタを更に備える。そして、前記適応コムフィルタは、前記有声音から抽出したピッチ周期を用いる。

より好ましくは、前記有声音からピッチ周期を抽出するピッチ抽出器を更に備える。ここで、前記ピッチ抽出器は、前記抽出したピッチ周期をＡＬＥブロックに提供する。

より好ましくは、前記ＳＳブロックは、前記ＡＬＥブロックで推定した雑音スペクトルを用いる。
より好ましくは、前記ＳＳブロックは、前記ＡＬＥブロックによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を用いる。

上記目的を達成するために、本発明は、例えば、以下の手段を提供する。
（項目１）
入力音声を有声音と無声音とに区分するステップ；
前記有声音の雑音を除去するための適応フィルタリングを行うステップ；
前記無声音に対するスペクトルサブトラクションを行うステップを備えてなることを特徴とする音声品質向上方法。
（項目２）
前記有声音の雑音を除去するために、前記適応フィルタリングを用いる適応ライン向上技法(ＡＬＥ)を行うことを特徴とする項目１に記載の音声品質向上方法。
（項目３）
前記適応ライン向上技法(ＡＬＥ)により、前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を、スペクトルサブトラクションに用いることを特徴とする項目２に記載の音声品質向上方法。
（項目４）
前記適応フィルタリングは、前記有声音に当たるフレームから抽出したピッチ周期を用いることを特徴とする項目１に記載の音声品質向上方法。
（項目５）
前記入力音声に対して低域通過フィルタリング及び高域通過フィルタリングを行うステップを更に備えることを特徴とする項目１に記載の音声品質向上方法。
（項目６）
前記高域通過フィルタリングの出力から雑音を除去するための適応コムフィルタリングを更に行うことを特徴とする項目５に記載の音声品質向上方法。
（項目７）
前記適応コムフィルタリングは、
前記高域通過フィルタリングの出力が有声音の場合に行うことを特徴とする項目６に記載の音声品質向上方法。
（項目８）
前記低域通過フィルタリングの出力を、前記有声音と前記無声音とに区分することを特徴とする項目５に記載の音声品質向上方法。
（項目９）
前記有声音の区間で得た雑音スペクトルデータを前記スペクトルサブトラクションに用いることを特徴とする項目１に記載の音声品質向上方法。
（項目１０）
前記雑音スペクトルデータは、前記適応フィルタリングによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値であることを特徴とする項目９に記載の音声品質向上方法。
（項目１１）
入力音声を有声音と無声音とに区分する決定ブロック；
前記有声音に対して適応ライン向上技法（ＡＬＥ）を行うＡＬＥブロック；
前記無声音に対してスペクトルサブトラクションを行うＳＳブロックを含んで構成されることを特徴とする音声品質向上装置。
（項目１２）
前記入力音声を低域通過フィルタリングして、前記決定ブロックに出力する低域通過フィルタ；
前記入力音声を高域通過フィルタリングする高域通過フィルタを更に備えることを特徴とする項目１１に記載の音声品質向上装置。
（項目１３）
前記高域通過フィルタの出力が有声音の場合に、前記高域通過フィルタの出力から雑音を除去するための適応コムフィルタを更に備えることを特徴とする項目１２に記載の音声品質向上装置。
（項目１４）
前記適応コムフィルタは、
前記有声音から抽出したピッチ周期を用いることを特徴とする項目１３に記載の音声品質向上装置。
（項目１５）
前記有声音からピッチ周期を抽出するピッチ抽出器を更に備えることを特徴とする項目１１に記載の音声品質向上装置。
（項目１６）
前記ピッチ抽出器は、前記抽出したピッチ周期をＡＬＥブロックに提供することを特徴とする項目１５に記載の音声品質向上装置。
（項目１７）
前記ＳＳブロックは、前記ＡＬＥブロックで推定した雑音スペクトルを用いることを特徴とする項目１１に記載の音声品質向上装置。
（項目１８）
前記ＳＳブロックは、前記ＡＬＥブロックによって前の有声音に当たる所定のフレームで推定した雑音スペクトルの平均値を用いることを特徴とする項目１１に記載の音声品質向上装置。

本発明によれば、ＡＬＥやＳＳＭより優れた性能を期待することができる。本発明は、ピッチ特性が最も強く現れる低周波数成分に対してＡＬＥを行った後、再び高周波数の成分が有声音である場合には適応コムフィルタを更に用いるので、低周波数が有声的な特性を有し、高周波数が無声的な特性を有する時にも効果的な性能を発揮する。

本発明は、音声の固有の特徴であるピッチ特性に基づき、音声品質を向上させるので、不分明な雑音などに対して、他の音質向上方法（例えば、ウィンナーフィルタリング（Wiener filtering）或いはＳＳＭ）より強い特性を持つ。

以上の本発明は、特に、携帯用端末機で単一のマイクロフォンを用いる時、雑音除去に有用であり、携帯用録音機で雑音を除去しながら録音をするのにも有用である。

また、本発明は、一般の有/無線電話機で雑音を除去するための用途や、その他ＰＤＡなどで音声を録音するための用途としても使用可能である。

以下、本発明に係る音声品質向上方法及び装置についての好適な実施例を、添付の図面に基づいて詳細に説明する。

本発明に係る音声品質の向上方法は、有声音に対して所定の音声品質の向上方法を行い、それによって得た雑音スペクトルを用いて、無声音に対するＳＳＭを行う。

まず、図３を参照して、本発明に係る装置の構成を説明する。

図３は本発明に係る音声品質向上装置を説明するための図面である。

図３を参照すると、本発明に係る装置は、入力された音声ｙ[ｎ]を低域通過フィルタリングする低域通過フィルタ（以下、ＬＰＦ）５１と、前記入力された音声ｙ[ｎ]を高域通過フィルタリングする高域通過フィルタ（以下、ＨＰＦ）５０とを備える。

本発明に係る装置は、高周波数成分に対する処理のために、適応コムフィルタ５６を備え、低周波数成分に対する処理のために、有声/無声決定ブロック５２と、ピッチ抽出機５３と、スペクトルサブトラクションブロック５５とを備える。また、ＡＬＥブロック５４をさらに備える。ここで、ＡＬＥブロック５４の代わりに他の音質向上方法を用いる手段を備えることもできる。

ＨＰＦ５０の出力は適応コムフィルタ５６に入力され、ＬＰＦ５１の出力は有声音か無声音かによって互いに異なる経路（ＡＬＥを用いる経路とＳＳＭを用いる経路）をとる。

有声/無声決定ブロック５２は、ＬＰＦ５１を通過した音声が有声音か無声音かを判断する。有声/無声決定ブロック５２の判断結果から、ＡＬＥを使用するかＳＳＭを使用するかが決定される。即ち、有声/無声決定ブロック５２は、ＬＰＦ５１を通過した音声で無声音に当たるフレームは、ＳＳＭを用いるスペクトルサブトラクションブロック５５に伝達する。

反面、ＬＰＦ５１を通過した音声で有声音に当たるフレームは、ＡＬＥを用いる経路に伝達される。ＡＬＥを用いる経路は、ピッチ抽出機５３と、ＡＬＥブロック５４とで構成される。ピッチ抽出機５３は、有声音に当たるフレームでピッチ周期を抽出する。そうして、ピッチ抽出機５３は、抽出したピッチ周期Ｔ₀を適応フィルタ５６に提供する。
また、ピッチ抽出機５３は、抽出した前記ピッチ周期をＡＬＥブロック５４に提供する。
ＡＬＥブロック５４は、ピッチ周期をＡＬＥに用いて、有声音に当たるフレームに対して音声品質を向上させる。

一方、上述したように、本発明では有声音に当たるフレームに対して音声品質を向上させるための手段として、ＡＬＥブロック５４を用いたが、これは一つの実施例に過ぎない。

一方、一般的なピッチ周波数が存在する周波数の範囲が５０〜４００Ｈｚなので、本発明では、前記周波数の範囲に充分に属しながらピッチ周期の影響に最も優れた部分を通過させるように、ＬＰＦ５１のカットオフ周波数を定める。

好ましくは、そのカットオフ周波数は８００Ｈｚ程度が良い。

上述した本発明の一実施例のとおりＡＬＥを適用させると、４００Ｈｚから４０００Ｈｚまでの範囲と再び結合させ、０〜４ｋＨｚの帯域幅を有する音声を得る。

これは、８ｋＨｚサンプリングレートの場合であり、そのような場合に対比して、本発明では適応コムフィルタ５６を更に用いる。

本発明に係る適応コムフィルタ５６は、高周波数でピッチ成分として現れるインパルス列のように見える部分の間にある雑音を除去する。特に、適応コムフィルタ５６は、高周波数の成分で有声音に当たる分明な信号が存在する場合にのみ動作する。

一方、ＳＳＭを用いるスペクトルサブトラクションブロック５５は、有声音の区間で得た雑音スペクトルデータを用いる。即ち、スペクトルサブトラクションブロック５５は、ＡＬＥブロック５４で前の有声音の所定のフレームで推定した雑音スペクトルの平均値を用いる。

言い換えると、前記雑音スペクトルデータは、有声音で雑音スペクトルを得るごとに所定の個数のフレームの雑音スペクトルデータトレインに対する平均を出して得る。

その結果、スペクトルサブトラクションブロック５５の出力と、適応コムフィルター５６の出力から雑音を除去した音声

を得ることができる。

図４は、本発明に係る音声品質向上の手順を説明するための図面である。

図４を参照すると、所定の音声ｙ[ｎ]が入力されると（Ｓ１）、まず、その入力された音声ｙ[ｎ]に対して低域通過フィルタリングＳ２、及び高域通過フィルタリングＳ３を行う。

一方、一般的にピッチ周波数が存在する周波数の範囲が５０〜４００Ｈｚであるため、本発明では前記周波数の範囲に充分に属しながらピッチ周期の影響に最も優れた部分を低域通過フィルタリングさせる。

上記で低域通過フィルタリングのカットオフ周波数は８００Ｈｚ程度が好ましい。次いで、低域通過フィルタリングの出力が有声音か無声音かを区分する（Ｓ４）。

もし、低域通過フィルタリングの出力が有声音であれば、該有声音に当たるフレームに対しては所定の音質向上方法を行う。本発明では、有声音に対する音質向上方法としてＡＬＥを適用する。それによって、有声音に当たるフレームに対してＡＬＥ技法を行う(Ｓ６)。

勿論、ＡＬＥ技法に先立って、有声音に当たるフレームでピッチ周期を抽出する(Ｓ５)。

その抽出されたピッチ周期は適応コムフィルタリングのために用いられ、また、ＡＬＥ技法にも用いられる。

反面、低域通過フィルタリングの出力が無声音であれば、該無声音に当たるフレームに対してはスペクトルサブトラクションを行う(Ｓ９)。

スペクトルサブトラクションを行う時は、ＡＬＥ技法によって前の有声音の所定のフレームで推定した雑音スペクトルの平均値を用いる。即ち、ＡＬＥ技法によって有声音で雑音スペクトルを得るごとに、所定の個数のフレームの雑音スペクトルデータトレインに対する平均値を用いる。その値が有声音から得た雑音スペクトルデータである。
一方、入力された音声ｙ[ｎ]を高域通過フィルタリングした出力に対しては、該雑音を除去するための適応コムフィルタリングを行う(Ｓ８)。この時は低域通過フィルタリングされた出力のうち、有声音から抽出したピッチ周期を適応コムフィルタリングするのに用いる。この際、適応コムフィルタリングに先立ち、高域通過フィルタリングした出力が有声音に当たるかを先に判断した後(Ｓ７)、有声音に当たる明らかな信号が存在する時、適応コムフィルタリングを行う。その結果、スペクトルサブトラクションの結果と、適応コムフィルタリングの結果から雑音を除去した音声

を得ることができる。

以上で説明した内容を通じて、当業者であれば本発明の技術思想を逸脱しない範囲で多様な変更および修正が可能なことが分かる。したがって、本発明の技術的な範囲は明細書の詳細な説明に記載された内容に限定されるものではなく、特許請求の範囲によって定められなければならない。

以上のように、本発明の好ましい実施形態を用いて本発明を例示してきたが、本発明は、この実施形態に限定して解釈されるべきものではない。本発明は、特許請求の範囲によってのみその範囲が解釈されるべきであることが理解される。当業者は、本発明の具体的な好ましい実施形態の記載から、本発明の記載および技術常識に基づいて等価な範囲を実施することができることが理解される。本明細書において引用した文献は、その内容自体が具体的に本明細書に記載されているのと同様にその内容が本明細書に対する参考として援用されるべきであることが理解される。

無声音での雑音除去を通して音声品質の低下を減らし、特に、ＡＬＥとＳＳＭを適用して、雑音を効果的に除去することのできる音声品質向上方法及び装置を提供する。

本発明に係る音声品質向上方法は、入力音声を有声音と無声音とに区分するステップ；前記有声音の雑音を除去するための適応フィルタリングを行うステップ；前記無声音に対するスペクトルサブトラクションを行うステップを備えてなることを特徴とする。

一般的なＡＬＥを説明するための図面である。一般的なＳＳＭを説明するための図面である。本発明に係る音声品質向上装置を説明するための図面である。本発明に係る音声品質向上の手順を説明するための図面である。

Claims

入力音声を有声音と無声音とに区分することと、
前記有声音の雑音を除去するために、前記有声音に対して適応フィルタリングを行うことと、
前記有声音の雑音を除去するために、前記有声音に対して前記適応フィルタリングを用いる適応ライン向上技法を行うことと、
前記無声音に対してスペクトルサブトラクションを行うことと
を含み、
前記適応ライン向上技法により、前の有声音に対応する所定のフレームから推定された雑音スペクトルの平均値が前記スペクトルサブトラクションに用いられる、音声の品質を向上する方法。
前記適応フィルタリングは、前記有声音に対応するフレームから抽出されたピッチ周期を用いる、請求項１に記載の方法。
前記入力音声に対して低域通過フィルタリングと高域通過フィルタリングとのうちの少なくとも１つを行うことをさらに含む、請求項１に記載の方法。
前記高域通過フィルタリングの出力の雑音を除去するために前記高域通過フィルタリングの出力に対して適応コムフィルタリングを行うことをさらに含む、請求項３に記載の方法。
前記適応コムフィルタリングは、前記高域通過フィルタリングの出力が有声音に対応する場合に行われる、請求項４に記載の方法。
前記低域通過フィルタリングの出力は、前記有声音と前記無声音とに区分される、請求項３に記載の方法。
入力音声を有声音と無声音とに区分することと、
前記有声音の雑音を除去するために、前記有声音に対して適応フィルタリングを行うことと、
前記無声音に対してスペクトルサブトラクションを行うことと
を含み、
前記有声音の区間から得られた雑音スペクトルデータが前記スペクトルサブトラクションに用いられ、前記雑音スペクトルデータは、前記適応フィルタリングによって前の有声音に対応する所定のフレームから推定された雑音スペクトルを平均することから得られる値である、音声の品質を向上する方法。
入力音声を有声音と無声音とに区分する決定ブロックと、
前記有声音の雑音を除去するために前記有声音に対して適応ライン向上技法を行う適応ライン向上技法（ＡＬＥ）ブロックと、
前記無声音に対してスペクトルサブトラクションを行うスペクトルサブトラクション（ＳＳ）ブロックと
を備え、前記ＳＳブロックは、前記ＡＬＥブロックによって前の有声音に対応する所定のフレームから推定された雑音スペクトルの平均値を用いる、音声の品質を向上する装置。
前記入力音声を低域通過フィルタリングして、前記決定ブロックに出力する低域通過フィルタと、
前記入力音声を高域通過フィルタリングする高域通過フィルタと
をさらに備える、請求項８に記載の装置。
前記高域通過フィルタの出力が有声音に対応する場合に、前記高域通過フィルタの出力から雑音を除去するための適応コムフィルタをさらに備える、請求項９に記載の装置。
前記適応コムフィルタは、前記有声音から抽出されたピッチ周期を用いる、請求項１０に記載の装置。
前記有声音からピッチ周期を抽出するピッチ抽出器をさらに備える、請求項８に記載の装置。
前記ピッチ抽出器は、前記抽出されたピッチ周期を前記ＡＬＥブロックに提供する、請求項１２に記載の装置。
音声の品質を向上する方法であって、
前記方法は、
入力音声を受信することと、
前記入力音声に対して高域通過フィルタリングを行うことと、
前記高域通過フィルタリングの出力が有声音に対応する場合に、前記高域通過フィルタリングの出力に対して適応コムフィルタリングを行うことと、
前記入力音声に対して低域通過フィルタリングを行うことと、
前記低域通過フィルタリングの出力が有声音に対応する場合に、前記低域通過フィルタリングの出力に対して前記適応コムフィルタリングを用いる適応ライン向上技法を行うことと、
前記低域通過フィルタリングの出力が無声音に対応する場合に、前記低域通過フィルタリングの出力に対してスペクトルサブトラクションを行うことと
を含み、
前記スペクトルサブトラクションは、前記適応ライン向上技法により、前の有声音に対応する所定のフレームから推定された雑音スペクトルの平均値を用いる、方法。