JP3591068B2

JP3591068B2 - 音声信号の雑音低減方法

Info

Publication number: JP3591068B2
Application number: JP18796695A
Authority: JP
Inventors: チャン・ジョセフ; 正之西口
Original assignee: Sony Corp
Current assignee: Sony Corp
Priority date: 1995-06-30
Filing date: 1995-06-30
Publication date: 2004-11-17
Anticipated expiration: 2019-11-17
Also published as: EP0751491A2; MY116658A; EP0751491B1; JPH0916194A; EP0751491A3; US5812970A; DE69627580D1; KR970002850A; CA2179871A1; CA2179871C; ID20523A; DE69627580T2

Description

【０００１】
【産業上の利用分野】
本発明は、入力される音声信号の所定の周波数帯域を抑圧するフィルタを有する音声符号化装置に音声信号を供給する音声信号の雑音低減方法に関する。
【０００２】
【従来の技術】
携帯用電話機や音声認識等の応用において、収音された音声信号に含まれる環境雑音や背景雑音等の雑音を抑圧し、音声成分を強調することが必要とされている。
【０００３】
このような音声強調、あるいは雑音低減の技術として、減衰ファクタの調整のために条件付き確率関数を用いる例が、文献「軟判定雑音抑圧フィルタを用いる音声強調」（ＳｐｅｅｃｈＥｎｈａｎｃｅｍｅｎｔＵｓｉｎｇａＳｏｆｔ−ＤｅｃｉｓｉｏｎＮｏｉｓｅＳｕｐｐｒｅｓｓｉｏｎＦｉｌｔｅｒ，Ｒ．Ｊ．ＭｃＡｕｌａｙ，Ｍ．Ｌ．Ｍａｌｐａｓｓ，ＩＥＥＥＴｒａｎｓ．Ａｃｏｕｓｔ．，Ｓｐｅｅｃｈ，ＳｉｇｎａｌＰｒｏｃｅｓｓｉｎｇ，Ｖｏｌ．２８，ｐｐ．１３７−１４５，Ａｐｒｉｌ１９８０）や、「移動電話システムにおける周波数領域雑音抑圧研究」（ＦｒｅｑｕｅｎｃｙＤｏｍａｉｎＮｏｉｓｅＳｕｐｐｒｅｓｓｉｏｎＡｐｐｒｏａｃｈｉｎＭｏｂｉｌＴｅｌｅｐｈｏｎｅＳｙｓｔｅｍｓ，Ｊ．Ｙａｎｇ，ＩＥＥＥＩＣＡＳＳＰ，Ｖｏｌ．ＩＩ，ｐｐ．３６３−３６６，Ａｐｒｉｌ１９９３）等に開示されている。
【０００４】
【発明が解決しようとする課題】
しかしながら、これらの雑音抑圧技術においては、不適切な固定のＳＮＲ（信号対雑音比）に基づく動作をするため、または不適切な抑圧フィルタにより、音色の不自然さや歪んだ音声を生ずることがある。実際の運用の際に、最適の性能を得るために雑音抑圧装置のパラメータの１つであるＳＮＲを調整することは、ユーザにとって望ましいことではない。さらに、従来の音声信号強調技術は、短時間ＳＮＲの大きな変動がある音声信号に対して副作用として発生してしまう歪を持たせずに充分雑音を除去することは困難である。
【０００５】
また、このような音声強調、あるいは雑音低減方法においては、雑音区間検出の技術が用いられ、入力レベルやパワー等を所定の閾値で比較することにより、雑音区間判別を行っているが、音声にトラッキングすることを防ぐために閾値の時定数を大きくすると、ノイズレベルが変化するとき、特に増加するときに追従できなくなり、誤判別が生じ易くなる。
【０００６】
ここで、本発明人は、上述した問題を解決するために、特願平６−９９８６９号に記載の明細書及び図面において、音声信号の雑音低減方法を提案している。
【０００７】
上記音声信号の雑音低減方法は、入力音声信号に基づいて算出された信号レベルと雑音レベルとの比いわゆるＳＮ比及び音声存在確率に基づいて、音声成分を算出するための最尤フィルタを適応的に制御することで雑音抑圧を行う音声信号の雑音低減方法であって、上記音声存在確率の算出に、入力信号のスペクトルから推定雑音スペクトルを減算したものを用いることを特徴とするものである。
【０００８】
また、上記音声信号の雑音低減方法によれば、上記最尤フィルタが上記入力音声信号のＳＮ比に応じて最適の抑圧フィルタに調整されるため、上記入力音声信号に対して充分な雑音除去を行うことが可能である。
【０００９】
ところが、上記音声存在確率を算出するのに、複雑な演算を有すると共に、膨大な演算量が要求されるため、演算の簡略化が望まれる。
【００１０】
また、例えば音声信号符号化装置に雑音低減装置にて処理を施した音声信号を入力する場合を考えると、上記音声信号符号化装置は予め高域通過フィルタを有していたり、高域側をブーストするフィルタを有しているため、上記雑音低減装置で低域側の抑圧が既になされていると上記音声信号符号化装置においてさらに低域側が抑圧され周波数特性が変化し、聴覚上不自然な音声が出力される虞がある。
【００１１】
また、従来の雑音低減方法では、雑音低減処理は、入力される音声信号の強さ例えばピッチ強度に基づいてではなく、単に推定される雑音レベルに応じて行われるため、やはり聴覚上不自然な音声が出力される虞がある。
【００１２】
そこで、上記ピッチ強度を求めるのに、先ずピッチラグを時間波形のピーク値とピーク値との間で求め、このピッチラグで自己相関値を求める方法が知られているが、この場合高速フーリエ変換処理における自己相関関数を用いており、（ＮｌｏｇＮ）の項の計算が必要で、さらにＮの算出も必要となるため演算が複雑になってしまう。
【００１３】
そこで、本発明は、上述した実情に鑑みてなされたものであり、入力信号の雑音抑圧を行うのに演算を簡略化することが可能である音声信号の雑音低減方法を提供することを目的とする。
【００１４】
また、本発明は、特に上記入力音声信号のピッチ強度の大きいときに所定の帯域の抑圧を抑えることが可能である音声信号の雑音低減方法を提供することも目的とする。
【００１５】
【課題を解決するための手段】
本発明は、上述の課題を解決するために、入力される音声信号の所定の周波数帯域を抑圧するフィルタを有する音声符号化装置に音声信号を供給する音声信号の雑音低減方法において、上記音声符号化装置のフィルタは、上記所定の周波数帯域における雑音抑圧量を小さくするように周波数特性を制御するものであり、上記雑音抑圧量を上記入力される音声信号のピッチ強度に応じて変化させるものである。
【００１７】
また、上記所定の周波数帯域は、音声信号の低域側であり、上記雑音抑圧量は、上記入力される音声信号の低域側の雑音抑圧を小さくするように変化することが挙げられる。
【００１８】
また、本発明は、上述の問題を解決するために、入力される音声信号の所定の周波数帯域を抑圧するフィルタを有する音声符号化装置に音声信号を供給する音声信号の雑音低減方法において、上記入力される音声信号のピッチ強度に応じて、雑音抑圧を行う際の各周波数帯域毎の信号レベルと雑音レベルとの比に対する雑音抑圧特性を変化させるものである。
【００１９】
また、本発明は、上述の問題を解決するために、入力される音声信号の所定の周波数帯域を抑圧するフィルタを有する音声符号化装置に音声信号を供給する音声信号の雑音低減方法において、雑音抑圧の特性を決定する各パラメータをニューラルネットに入力し、上記入力される音声信号の音声区間及び雑音区間の判別が行われるものである。
【００２０】
また、本発明は、上述の問題を解決するために、入力される音声信号の所定の周波数帯域を抑圧するフィルタを有する音声符号化装置に音声信号を供給する音声信号の雑音低減方法において、雑音抑圧する際の特性に基づいて処理される最大抑圧量は、ｄＢ領域で略線形的に変化するものである。
【００２１】
また、本発明は、上述の問題を解決するために、入力される音声信号の所定の周波数帯域を抑圧するフィルタを有する音声符号化装置に音声信号を供給する音声信号の雑音低減方法において、上記入力される音声信号のピッチ強度は、信号レベルのピークを選出して得られるピッチ位置の近傍での自己相関を計算することで求められ、雑音抑圧する際の特性は、上記ピッチ強度に基づいて制御されるものである。
【００２２】
また、本発明は、上述の問題を解決するために、入力される音声信号の所定の周波数帯域を抑圧するフィルタを有する音声符号化装置に音声信号を供給する音声信号の雑音低減方法において、上記入力される音声信号のフレーム化処理は、当該音声信号の特徴を示すパラメータの算出用フレームと、算出されたパラメータを用いてスペクトルの修正を行うフレームとでそれぞれ独立して行われるものである。
【００２３】
【作用】
本発明の音声信号の雑音低減方法によれば、雑音低減に用いるフィルタの特性を制御し、入力される音声信号の所定の周波数帯域における雑音抑圧量を小さくすることで、入力される音声信号の所定の周波数帯域を抑圧するフィルタを有する音声符号化装置に音声信号を供給する。
【００２４】
また、上記音声符号化装置が、音声信号の低域側を抑圧するフィルタを有している場合、入力される音声信号の低域側の雑音抑圧を小さくするように雑音抑圧量を制御する。
【００２５】
また、本発明の音声信号の雑音低減方法によれば、入力される音声信号のピッチが検出され、検出されたピッチのピッチ強度が得られる。得られたピッチ強度に応じて、雑音抑圧する際の周波数特性が制御される。
【００２６】
また、本発明の音声信号の雑音低減方法によれば、雑音抑圧する際の周波数特性を決定する各パラメータをニューラルネットワークに入力すると、入力される音声信号の音声区間及び雑音区間の判別が行われ、この判別は処理を行う回数が増加する程正確になる。
【００２７】
また、本発明の音声信号の雑音低減方法によれば、入力される音声信号のピッチ強度は、例えば１つの位相内で２つのピークを選出し、各ピークにおける自己相関値とピーク間の相互相関値とを算出し、これら自己相関値及び相互相関値に基づいて得られる。また、上記ピッチ強度に応じて、雑音抑圧する際の周波数特性が制御される。
【００２８】
また、本発明の音声信号の雑音低減方法によれば、入力される音声信号のフレーム化処理をスペクトルの修正用と、当該音声信号の特徴を示すパラメータの算出用とでそれぞれ独立して行い、例えば上記パラメータの算出用のフレーム化処理を上記スペクトルの修飾用のフレーム化処理よりもサンプル数を多くとるようにする。
【００２９】
【実施例】
以下、本発明の音声信号の雑音低減方法について、図面を参照しながら説明する。
【００３０】
ここで、雑音低減装置に適用した本発明の音声信号の雑音低減方法の一例を図１に示す。
【００３１】
上記雑音低減装置は、雑音抑圧フィルタ特性生成部３５において音声信号入力端子１３からの入力音声信号の雑音抑圧量を設定し、スペクトラム修正部１０にて後述するように、上記雑音抑圧量に基づいて上記入力音声信号中の雑音を低減する。また、音声信号出力端子１４から出力される音声信号は、例えば符号励振線形予測符号化のアルゴリズムにより動作する符号化装置に送られる。
【００３２】
上記雑音低減装置において、音声信号入力端子１３には、音声（Ｓｐｅｅｃｈ）成分と雑音（Ｎｏｉｓｅ）成分とを含む入力音声信号ｙ［ｔ］が供給されている。この入力音声信号ｙ［ｔ］は、例えば標本化周波数がＦＳのディジタル信号である。り、フレーム化処理部２１に送られて、フレーム長がＦＬサンプルのフレームに分割され、以下各フレーム毎に処理が行われる。
【００３３】
フレーム化処理部２１は、上記入力音声信号のフレーム化処理を、スペクトルの修飾用の処理を行う第１フレーム化処理部２２と、当該音声信号の特徴を示すパラメータの算出用の処理を行う第２フレーム化処理部１とでそれぞれ独立して行う部分であり、一方は後述するように雑音抑圧フィルタ特性生成部３５に送られ上記入力音声信号の信号特性を示すパラメータを算出するのに用いられ、もう一方は後述するようにスペクトラム修正部１０にて上記信号特性を示すパラメータに基づいて得られる雑音抑圧の特性に応じてスペクトルを修正するのに用いられる。
【００３４】
ここで、第１フレーム化処理部２２は、例えば図２のＡに示すように、上記入力音声信号を１６８サンプル単位すなわち上記フレーム長ＦＬが１６８サンプルのフレームに分割化するいわゆるフレーム化処理を行っており、ｋ番目のフレームをｆｒａｍｅ１_ｋとして取り出して窓掛け処理部２に出力している。なお、第１フレーム化処理２２にて得られる各フレームｆｒａｍｅ１_ｋは１６０サンプルを周期として取り出され、前後のフレームとは８サンプルのオーバーラップを有している。
【００３５】
また、第２フレーム化処理部１は、例えば図２のＢに示すように、上記入力音声信号を２００サンプル単位すなわち上記フレーム長ＦＬが２００サンプルとなるようにフレーム化処理しており、ｋ番目のフレームをｆｒａｍｅ２_ｋとして取り出して信号特性計算部３１とフィルタ処理部８とに出力している。なお、第２フレーム化処理部１にて得られる各フレームｆｒａｍｅ２_ｋは、１６０サンプルを周期として取り出され、１つ前のフレームであるｆｒａｍｅ２_ｋ＋１とは８サンプル、また、１つ後のフレームであるｆｒａｍｅ２_ｋ−１とは４０サンプルのオーバーラップを有している。
【００３６】
また、上記周波数やサンプル数の具体例を挙げると、標本化周波数ＦＳを８０００Ｈｚ、すなわち８ｋＨｚとすると、上記第１フレーム化処理部２２及び第２フレーム化処理部１ともに、フレーム間隔ＦＩが１６０サンプルであるため、２０ｍｓ毎にフレーム化処理が行われることになる。
【００３７】
図１に戻って、窓かけ処理部２では、次の直交変換である、例えば高速フーリエ変換処理部３での計算に先立って、上記第１フレーム化処理部２２より送られる各フレーム化信号ｙ−ｆｒａｍｅ１_ｊ，ｋに対して、窓関数ｗ_{ｉｎｐｕｔ} による窓かけ処理が施される。なお、各フレーム毎の信号処理の終段での後述する逆高速フーリエ変換処理のあとには、出力信号に対して窓関数ｗ_{ｏｕｔｐｕｔ}による窓かけ処理が施される。このような各窓関数ｗ_{ｉｎｐｕｔ} 及びｗ_{ｏｕｔｐｕｔ}の一例を、次の（１）式及び（２）式にそれぞれ示す。
【００３８】
【数１】

【００３９】
次に、高速フーリエ変換処理部３では、窓関数ｗ_{ｉｎｐｕｔ} による窓かけ処理が施されたフレーム化信号ｙ−ｆｒａｍｅ１_ｊ，ｋに対して、２５６ポイントの高速フーリエ変換処理が施され、得られた周波数スペクトル振幅値は、バンド分割部４及びスペクトラム修正部１０に出力される。
【００４０】
また、雑音抑圧フィルタ特性生成部３５は、信号特性計算部３１、上記ａｄｊ値計算部３２、ＣＥ値及びＮＲ値計算部３６及びＨｎ計算部７を有して成る部分である。
【００４１】
上記雑音抑圧フィルタ特性生成部３５において、バンド分割部４は、高速フーリエ変換処理部３から出力される入力音声信号を高速フーリエ変換処理して得られる周波数スペクトルの振幅値を、例えば１８バンドに分割して、バンドを識別するバンド番号をｗとして、各バンドの振幅Ｙ［ｗ，ｋ］を、信号特性計算部３１と雑音スペクトル推定部２６と初期フィルタ応答計算部３３とに出力する。ここで、バンド分割する際の周波数レンジの一例を次の表に示す。
【００４２】
【表１】

【００４３】
これらの周波数帯域は、人間の聴覚システムが高域ほど知覚分解能が劣化することに基づいている。各帯域の振幅として、対応する周波数レンジ内の最大ＦＦＴ（高速フーリエ変換処理における周波数帯域の）振幅を用いる。
【００４４】
また、信号特性計算部３１は、第２フレーム化処理部１にて出力されるｙ−ｆｒａｍｅ２_ｊ，ｋとバンド分割部４にて出力されるＹ［ｗ，ｋ］とからフレーム毎のＲＭＳ値であるＲＭＳ［ｋ］、フレーム毎の相対エネルギであるｄＢ_ｒｅｌ［ｋ］、フレーム毎の推定雑音レベル値であるＭｉｎＲＭＳ［ｋ］、フレーム毎の最大ＲＭＳ値であるＭａｘＲＭＳ［ｋ］、フレーム毎の最大ＳＮＲ値であるＭａｘＳＮＲ［ｋ］を算出する。また、ｙ−ｆｒａｍｅ２_ｊ，ｋから後述するピッチを検出し、このピッチ強度を求める。
【００４５】
先ず、上記ピッチの検出とピッチ強度の算出について説明する。
【００４６】
ピッチの検出において、例えば図３に示すように、入力音声信号ｙ−ｆｒａｍｅ２_ｊ，ｋの各フレーム中で１番強いピークがピークｘ［ｍ１］として検出され、ピーク［ｍ１］と同じ位相内で２番目に強いピークがピークｘ［ｍ２］として検出される。なお、ｍ１及びｍ２は、各ピークに対応する時間ｔの値である。また、ピッチｐの距離がピークｘ［ｍ１］及びピークｘ［ｍ２］間の距離｜ｍ１−ｍ２｜として得られる。このピッチｐの最大ピッチ強度ｍａｘ＿Ｒｘｘは、（６）式に示すように、（３）式乃至（５）式にて求められるピークｘ［ｍ１］とピークｘ［ｍ２］との相互相関値ｎｒｇ０、ピークｘ［ｍ１］の自己相関値ｎｒｇ１及びピークｘ［ｍ２］の自己相関値ｎｒｇ２に基づいて得ることができる。
【００４７】
【数２】

【００４８】
続いて、上記各値の算出方法を説明する。
【００４９】
ＲＭＳ［ｋ］は、第ｋフレームｆｒａｍｅ２_ｋのＲＭＳ値であって、例えば次式で計算される。
【００５０】
【数３】

【００５１】
第ｋフレームｆｒａｍｅ２_ｋの相対エネルギｄＢ_ｒｅｌ［ｋ］は、前フレームｆｒａｍｅ２_ｋ−１からの減衰エネルギに関連する第ｋフレームの相対エネルギを示すものであって、このｄＢ表示の相対エネルギｄＢ_ｒｅｌ［ｋ］は、例えば次の（８）式により計算され、この（８）式中のエネルギ値Ｅ［ｋ］及び減衰エネルギ値Ｅ_{ｄｅｃａｙ} ［ｋ］は、それぞれ次の（９）式及び（１０）式により求められる。
【００５２】
【数４】

【００５３】
また、上記（１０）式においては、減衰時間（ディケイタイム）を０．６５秒とした例を示している。
【００５４】
このような、エネルギＥ［ｋ］及び減衰エネルギＥ_{ｄｅｃａｙ} ［ｋ］の具体例を、図４に示す。
【００５５】
また、第ｋフレームｆｒａｍｅ２_ｋの最大ＲＭＳ値ＭａｘＲＭＳ［ｋ］は、後述する各フレームの推定雑音レベル値と最大ＳＮ比とを見積もるのに必要な値であって、以下の（１１）式にて算出される。（１１）式で、θは減衰定数（ｄｅｃａｙｃｏｎｓｔａｎｔ）であり、例えば３．２秒で最大ＲＭＳ値が１／ｅだけ減衰するような値、すなわちθ＝０．９９３７６９が用いられる。
【００５６】
【数５】

【００５７】
第ｋフレームｆｒａｍｅ２_ｋの推定雑音レベル値ＭｉｎＲＭＳ［ｋ］は、バックグラウンドノイズ、あるいは背景雑音のレベルを評価するのに好適な最小のＲＭＳ値であって、現時点から前に５個の局所極小値（ｌｏｃａｌｍｉｎｉｍｕｍ）、すなわち（１２）式を満たす値の内で最小となる値である。
【００５８】
【数６】

【００５９】
この推定雑音レベル値ＭｉｎＲＭＳ［ｋ］は、音声（Ｓｐｅｅｃｈ）無しの背景雑音、いわゆるバックグラウンドノイズのときに上昇してゆくように設定されている。ノイズレベルが高いときの上昇レートは指数関数的であるが、低いノイズレベルのときには、より大きな上昇を得るために固定の上昇レートが用いられる。
【００６０】
これらのＲＭＳ値ＲＭＳ［ｋ］、推定雑音レベル値ＭｉｎＲＭＳ［ｋ］及び最大ＲＭＳ値ＭａｘＲＭＳ［ｋ］の具体例を、図５に示す。
【００６１】
第ｋフレームｆｒａｍｅ２_ｋの最大ＳＮ比ＭａｘＳＮＲ［ｋ］は、ＭａｘＲＭＳ［ｋ］とＭｉｎＲＭＳ［ｋ］とに基づいて、以下の（１３）式により推定される値である。
【００６２】
【数７】

【００６３】
また、この最大ＳＮ比値ＭａｘＳＮＲからは、相対ノイズレベルを示す０から１までの範囲の正規化パラメータＮＲ＿ｌｅｖｅｌ［ｋ］が算出される。このＮＲ＿ｌｅｖｅｌ［ｋ］には、以下の関数が用いられる。
【００６４】
【数８】

【００６５】
次に、雑音スペクトル推定部２６は、ＲＭＳ［ｋ］、ｄＢ_ｒｅｌ［ｋ］、ＮＲ＿ｌｅｖｅｌ［ｋ］、ＭｉｎＲＭＳ［ｋ］及びＭａｘＳＮＲ［ｋ］に基づいて、音声（ｓｐｅｅｃｈ）を背景雑音（ｂａｃｋｇｒｏｕｎｄｎｏｉｓｅ）から区別する。すなわち、次の条件が正しいとき、第ｋフレーム中の信号は背景雑音として分類される。こうして分類された背景雑音が示す振幅値は、ノイズスペクトルの時間平均推定値Ｎ［ｗ，ｋ］として算出され、初期フィルタ応答計算部３３に出力される。
【００６６】
【数９】

【００６７】
ここで図６は、上記（１５）式中のｄＢ表示の相対エネルギｄＢ_ｒｅｌ［ｋ］と、最大ＳＮ比ＭａｘＳＮＲ［ｋ］と、雑音判別の閾値の１つであるｄＢｔｈｒｅｓ_ｒｅｌ［ｋ］との具体例を示している。
【００６８】
また図７は、上記（１４）式中のＭａｘＳＮＲ［ｋ］の関数としてのＮＲ＿ｌｅｖｅｌ［ｋ］を示している。
【００６９】
第ｋフレームが背景雑音、あるいはノイズとして分類される場合、上記ノイズスペクトルの時間平均推定値Ｎ［ｗ，ｋ］は、現在フレームの信号の入力信号スペクトルの振幅Ｙ［ｗ，ｋ］によって、次の（１６）式のように更新される。なお、ｗは上記バンド分割のバンド番号を示すものである。
【００７０】
【数１０】

【００７１】
ここで、第ｋフレームが音声（ｓｐｅｅｃｈ）として分類された場合、Ｎ［ｗ，ｋ］はＮ［ｗ，ｋ−１］の値をそのまま用いる。
【００７２】
次に、ａｄｊ値計算部３２は、ＲＭＳ［ｋ］、ＭｉｎＲＭＳ［ｋ］及びＭａｘＲＭＳ［ｋ］に基づいて、後述するａｄｊ１［ｋ］、ａｄｊ２［ｋ］及びａｄｊ３［ｗ，ｋ］を用いて、（１７）式によりａｄｊ［ｗ，ｋ］を算出し、ＣＥ値及びＮＲ値計算部３６に出力する。
【００７３】
【数１１】

【００７４】
ここで、（１７）式中のａｄｊ１［ｋ］は、全ての帯域において、高いＳＮ比における後述するフィルタ処理による雑音抑圧動作を抑える効果を有する値であり、以下の（１８）式にて定義される。
【００７５】
【数１２】

【００７６】
また、（１７）式中のａｄｊ２［ｋ］は、非常に低いノイズレベルや非常に高いノイズレベルに対して、上記フィルタ処理による雑音抑圧レートを抑える効果を有する値であり、以下の（１９）式にて定義される。
【００７７】
【数１３】

【００７８】
また、（１７）式中のａｄｊ３［ｗ，ｋ］は、図３で示したような入力音声信号のピッチｐの強度、特に最大ピッチ強度ｍａｘ＿Ｒｘｘが大きいときに、低域側と高域側とにおける雑音抑圧量を低減するように制御する値であり、例えばピッチ強度が所定値より大きくかつ入力音声信号レベルが雑音レベルより大きい場合は、図８のＡに示すような低域側で所定値をとり高域側で周波数ｗに対して線形的に変化するとともに他の周波数帯域では０である値であり、また、その他の場合は、図８のＢに示すように低域側で所定値をとるとともに他の周波数帯域では０である値である。
【００７９】
このａｄｊ３［ｗ，ｋ］の定義の一例を、（２０）式に示す。
【００８０】
【数１４】

【００８１】
この（２０）式において、最大ピッチ強度ｍａｘ＿Ｒｘｘ［ｔ］は、最初の最大ピッチ強度ｍａｘ＿Ｒｘｘ［０］で規格化して用いており、また、入力音声レベルと雑音レベルとの比較は、ＭｉｎＲＭＳ［ｋ］及びＭａｘＲＭＳ［ｋ］を用いて得られる値を用いて行われる。
【００８２】
また、ＣＥ値及びＮＲ値計算部３６は、フィルタ特性を制御するＮＲ値を求めてＨｎ値計算部７に出力する。
【００８３】
ここで、例えば上記ＮＲ値であるＮＲ［ｗ，ｋ］は、以下の（２１）式で定義される。
【００８４】
【数１５】

【００８５】
（２１）式のＮＲ´［ｗ，ｋ］は、上記ａｄｊ値計算部３２から送られるａｄｊ［ｗ，ｋ］を用いて（２２）式にて求められる値である。
【００８６】
また、上記ＣＥ値及びＮＲ値計算部３６は、（２１）式で用いるＣＥ［ｋ］の算出も行っている。このＣＥ［ｋ］は、上記入力信号スペクトルの振幅Ｙ［ｗ，ｋ］中に含まれる子音成分をフレーム毎に検出した子音検出結果を表す値である。この子音検出処理の具体例について説明する。
【００８７】
上記ピッチ強度が所定値より大きくかつ入力音声信号レベルが雑音レベルより大きい場合、すなわち（２０）式の最初に示されている条件が満たされる場合、ＣＥ［ｋ］は、例えば０．５をとる。また、上記条件を満たさない場合は、以下の方法で決定されるＣＥ［ｋ］を用いる。
【００８８】
先ず、上記Ｙ［ｗ，ｋ］中の連続するサンプル間で符号が、例えば正から負、あるいは負から正というように逆転する箇所、または、逆の符号を有するサンプル間で０という値を有するサンプルが存在する箇所がゼロクロスとして検出される。このゼロクロスの数が、フレーム毎に検出され、この値がゼロクロス数ＺＣ［ｋ］として以下の処理に用いられる。
【００８９】
次に、トーン、すなわち上記Ｙ［ｗ，ｋ］の周波数成分の分布を表す値、例えば、図９に示すように、高域における上記入力信号スペクトルの平均レベルｔ′と低域における上記入力信号スペクトルの平均レベルｂ′との比ｔ′／ｂ´（＝ｔｏｎｅ［ｋ］）が検出される。この値ｔ′及び値ｂ´は、以下の（２３）式にて定義される誤差関数ＥＲＲ（ｆｃ，ｂ，ｔ）が最小値をとるような値ｔ及び値ｂである。（２３）式において、ＮＢはバンド数を表し、Ｙ_ｍａｘ［ｗ，ｋ］はバンドｗにおけるＹ［ｗ，ｋ］の最大値を表し、ｆｃは高域と低域とを分離する点を表す。また、図９において、周波数ｆｃにおいて、低域側のＹ［ｗ，ｋ］の平均値を値ｂとして、また、高域側のＹ［ｗ，ｋ］の平均値を値ｔとしている。
【００９０】
【数１６】

【００９１】
さらに、ＲＭＳ値及びゼロクロス数に基づいて、有声音声が検出されたフレームの近傍のフレーム、すなわち音声近接フレームが検出され、このフレーム数として音節近接フレーム数ｓｐｃｈ＿ｐｒｏｘ［ｋ］が、以下の（２４）式に基づいて得られ、出力される。
【００９２】
【数１７】

【００９３】
そして、上記ゼロクロス数、上記音声近接フレーム数、上記トーン及びＲＭＳ値に基づいて、各フレームのＹ［ｗ，ｋ］中の子音成分の検出が行われる。この子音検出結果としてＣＥ［ｋ］が、以下の（２５）式に基づいて得られる。
【００９４】
【数１８】

【００９５】
また、各シンボルＣ１、Ｃ２、Ｃ３、Ｃ４．１乃至Ｃ４．７は、以下の表にて定義される。
【００９６】
【表２】

【００９７】
上記表２において、ＣＤＳ０、ＣＤＳ１、ＣＤＳ２、Ｔ、Ｚｌｏｗ及びＺｈｉｇｈの各値は、子音検出の感度を決定する定数であり、例えばＣＤＳ０＝ＣＤＳ１＝ＣＤＳ２＝１．４１、Ｔ＝２０、Ｚｌｏｗ＝２０、Ｚｈｉｇｈ＝７５の値をとる。また、（２５）式のＥは、０から１までの値をとるもので、０に近いほど通常の子音抑圧量に近くなるように後述するフィルタ応答が調整され、また、１に近いほど子音抑圧量が最低量となるように上記フィルタ応答が調整される値であり、例えば０．７が用いられる。
【００９８】
また、上記表２によれば、あるフレームにおいて、シンボルＣ１が成立することは上記フレームの信号レベルが最低ノイズレベルより大きいことを示し、シンボルＣ２が成立することは上記フレームのゼロクロス数が所定のゼロクロス数Ｚｌｏｗ、本実施例では２０より大きいことを示し、また、シンボルＣ３が成立することは上記フレームが有声音声が検出されたフレームよりＴフレーム以内、本実施例では２０フレーム以内であることを示している。
【００９９】
また、シンボルＣ４．１が成立することは上記フレームにおいて信号レベルが変化することを示し、シンボルＣ４．２が成立することは上記フレームが音声信号が変化して１フレーム後であって信号レベルが変化するフレームであることを示し、また、シンボルＣ４．３が成立することは上記フレームが音声信号が変化して２フレーム後であって信号レベルが変化するフレームであることを示している。また、シンボルＣ４．４が成立することは、上記フレームにおいて、ゼロクロス数が所定のゼロクロス数Ｚｈｉｇｈ、本実施例では７５より大きいことを示している。また、シンボルＣ４．５が成立することは上記フレームにおいてトーン値が変化することを示し、シンボルＣ４．６が成立することは上記フレームが音声信号が変化して１フレーム後であってトーン値が変化するフレームであることを示し、シンボルＣ４．７が成立することは上記フレームが音声信号が変化して２フレーム後であってトーン値が変化するフレームであることを示している。
【０１００】
また、（２５）式によれば、このフレームが子音成分を含んでいることの条件は、上述のシンボルＣ１乃至Ｃ３の条件を満たすこと、ｔｏｎｅ［ｋ］が０．６より大きいこと及び上述のＣ４．１乃至Ｃ４．７の条件の内の少なくとも１つが満たされることである。
【０１０１】
また、初期フィルタ応答計算部３３は、雑音スペクトル推定部２６から出力される雑音時間平均値Ｎ［ｗ，ｋ］と、バンド分割部４から出力されるＹ［ｗ，ｋ］とをフィルタ抑圧曲線テーブル部３４に送り、フィルタ抑圧曲線テーブル部３４に収納されるＹ［ｗ，ｋ］とＮ［ｗ，ｋ］とに応じたＨ［ｗ，ｋ］の値を探し出し、このＨ［ｗ，ｋ］をＨｎ値計算部７に出力する。なお、フィルタ抑圧曲線テーブル部３４は、Ｈ［ｗ，ｋ］に関する表が格納されている。
【０１０２】
Ｈｎ値計算部７は、バンド分割された入力信号スペクトルの振幅Ｙ［ｗ，ｋ］と、ノイズスペクトルの時間平均推定値Ｎ［ｗ，ｋ］と、上記ＮＲ［ｗ，ｋ］とから、上記バンド分割された入力信号スペクトルの振幅Ｙ［ｗ，ｋ］から雑音成分を低減するためのプレフィルタである。ここでは、Ｙ［ｗ，ｋ］がＮ［ｗ，ｋ］に応じてＨｎ［ｗ，ｋ］に変換され、このフィルタ応答Ｈｎ［ｗ，ｋ］が出力される。なお、このＨｎ［ｗ，ｋ］値は、以下の（２６）式に基づいて算出される。
【０１０３】
【数１９】

【０１０４】
また、上記（２６）式中の値Ｈ［ｗ］［Ｓ／Ｎ＝ｒ］は、ＳＮ比をある値ｒに固定したとき最適なノイズ抑圧フィルタ特性に当たり、この値は、Ｙ［ｗ，ｋ］／Ｎ［ｗ，ｋ］の値に応じてテーブル化されており、上記フィルタ抑圧曲線テーブル部３４に格納されている。なお、上記Ｈ［ｗ］［Ｓ／Ｎ＝ｒ］は、ｄＢ領域で直線的に変化する値である。
【０１０５】
さらに、上記（２６）式を（２７）式のように変形すると、最大抑圧量の関数である左辺は、ＮＲ［ｗ，ｋ］と直線関係にあることが示され、両者の関係を図１０のように示すことができる。
【０１０６】
また、フィルタ処理部８では、上記Ｈｎ［ｗ，ｋ］値が周波数軸方向と時間軸方向とについて円滑化するフィルタ処理を行い、得られる信号として円滑化信号Ｈ_{ｔ＿ｓｍｏｏｔｈ}［ｗ，ｋ］が出力される。上記周波数軸方向へのフィルタ処理は、Ｈｎ［ｗ，ｋ］の有効インパルス応答長を短くする効果がある。これにより周波数領域での乗算によるフィルタの実現に起因する環状畳み込みによるエリアシングの発生を未然に防いでいる。また、上記時間軸方向へのフィルタ処理は、突発的な雑音を抑えるフィルタの変化の速さを制限する効果がある。
【０１０７】
先ず、上記周波数軸方向へのフィルタ処理についての説明を行う。上記各バンドのＨｎ［ｗ，ｋ］に、メディアン（中央値）フィルタ処理が施される。次の（２８）式及び（２９）式にて、この方法を示す。
【０１０８】
【数２０】

【０１０９】
（２８）式の第１段階（Ｓｔｅｐ１）において、Ｈ１［ｗ，ｋ］は、単一の、あるいは孤立した０のバンドを無くしたＨｎ［ｗ，ｋ］であり、（２９）式の第２段階（Ｓｔｅｐ２）において、Ｈ２［ｗ，ｋ］は、単一の、あるいは孤立した突出したバンドを無くしたＨ１［ｗ，ｋ］である。このようにして、上記Ｈｎ［ｗ，ｋ］は、Ｈ２［ｗ，ｋ］に変換される。
【０１１０】
次に、上記時間軸方向へのフィルタ処理についての説明を行う。この時間軸方向へのフィルタ処理を施す際において、入力信号には、音声（ｓｐｅｅｃｈ）、バックグラウンドノイズ、そして音声（ｓｐｅｅｃｈ）の立ち上がり部分である過度的状態の３種あることを考慮に入れる。音声の信号Ｈ_{ｓｐｅｅｃｈ}［ｗ，ｋ］に対しては、次の（３０）式に示すように、時間軸での円滑化、あるいはスムージングを行う。
【０１１１】
【数２１】

【０１１２】
また、背景雑音の信号に対しては、次の（３１）式に示すような時間軸での円滑化、あるいはスムージングを行う。
【０１１３】
また、過度的状態の信号に対しては、この時間軸でのスムージングを行われない。
【０１１４】
以上のスムージング処理が行われた信号を用いて、（３２）式により円滑化出力信号Ｈ_{ｔ＿ｓｍｏｏｔｈ}［ｗ，ｋ］を得る。
【０１１５】
【数２２】

【０１１６】
ここで、（３２）式中のα_ｓｐは次の（３３）式から、α_ｔｒは次の（３４）式からそれぞれ求められる。
【０１１７】
続いて、バンド変換部９では、フィルタ処理部８からの、例えば１８バンド分の円滑化信号Ｈ_{ｔ＿ｓｍｏｏｔｈ}［ｗ，ｋ］が、例えば１２８バンド分の信号Ｈ_１２８［ｗ，ｋ］に、補間処理により拡張変換され、この変換された信号Ｈ_１２８［ｗ，ｋ］が出力される。この変換は、例えば２段階で行っており、１８バンドから６４バンドへの拡張はゼロ次ホールドにより、６４バンドから１２８バンドへの拡張はローパスフィルタ型の補間処理により、それぞれ行っている。
【０１１８】
次に、スペクトラム修正部１０では、高速フーリエ変換処理部３で得られたフレーム化信号ｙ−ｆｒａｍｅ_ｊ，ｋの高速フーリエ変換処理にて得られるＦＦＴ係数の実部と虚部とに各々上記信号Ｈ_１２８［ｗ，ｋ］を乗じてスペクトラム修正、すなわち雑音成分を低減する処理が行われ、得られた信号が出力される。この結果、スペクトルの振幅は修正されるが位相は変形を受けない。
【０１１９】
次に逆高速フーリエ変換処理部１１では、スペクトラム修正部１０にて得られた信号を用いて、逆高速フーリエ変換処理が行われ、得られたＩＦＦＴ信号が出力される。
【０１２０】
次に、オーバーラップ加算部１２では、各フレーム毎のＩＦＦＴ信号のフレーム境界部分についての重ね合わせが行われ、得られた出力音声信号が音声信号出力端子１４より出力される。
【０１２１】
さらに、この出力を例えば符号励振線形予測符号化のアルゴリズムに用いた場合を考える。
【０１２２】
ここで、上記符号励振線形予測符号化のアルゴリズムによる符号化装置を図１１に、また、復号化装置を図１２にそれぞれ示す。
【０１２３】
上記符号化装置は、図１１に示すように、入力端子６１から入力音声信号が入力され、線形予測符号分析またはＬＰＣ（ｌｉｎｅａｒｐｒｉｄｉｃｔｉｖｅｃｏｄｉｎｇ）分析部６２及び減算器６４に送られる。
【０１２４】
ＬＰＣ分析部６２は、上記入力音声信号の線形予測を行いこの予測フィルタ係数を合成フィルタ６３に出力する。合成フィルタ６３は、２つのコードブックの１つである固定コードブック６７からのコードワードに乗算器８１の利得を掛けたデータと、ダイナミックコードブック６８からのコードワードに乗算器８２の利得とを掛けたデータとを加算器６９にて加算された出力が、上記ＬＰＣ分析部６２から送られる予測フィルタ係数を持つＬＰＣ合成フィルタに入力され、その合成出力が、減算器６４に出力する。
【０１２５】
また、減算器６４は、上記入力音声信号と合成フィルタ６３からの合成出力との差を取り出し聴覚重み付けフィルタ６５に出力する。聴覚重み付けフィルタ６５は、周波数帯域毎に入力音声信号のスペクトルに応じた重みを付けて、誤差検出部６６に出力する。誤差検出部６６は、聴覚重み付けフィルタ６５からの出力の重み付き誤差のエネルギを算出して、固定コードブック６７及びダイナミックコードブック６８のコードブックサーチにおいて、この重み付き誤差エネルギが最小になるような各コードブックのコードワードが取り出される。
【０１２６】
上記符号化装置からは上記固定コードブック６７のコードワードのインデックス、ダイナミックコードブック６８のコードワードのインデックス、各乗算器に対応する利得のインデックス、ＬＰＣ分析部６２からフィルタ係数を生成する各パラメータの量子化インデックス等が復号化装置に伝送され、復号化装置にて各インデックスを用いた復号化処理がなされる。
【０１２７】
そこで、上記復号化装置は、図１２に示すように、固定コードブック７１は上記符号化装置から送られる上記固定コードブック６７のコードワードのインデックスに基づいて、ダイナミックコードブック７２は上記ダイナミックコードブック６８のコードワードのインデックスに基づいて、各コードワードを固定コードブック７１あるいはダイナミックコードブック７２より取り出す。また、乗算器８３、８４は、各対応する利得インデックスに基づいて動作し、合成フィルタ７４は、上記量子化インデックス等の各パラメータが送られ、これらパラメータを用いて、２つのコードブックからのコードワードに利得が乗算されたデータを励起信号と合成した合成出力をポストフィルタ７５に出力する。ポストフィルタ７５では、いわゆるフォルマント強調を行い、信号の谷間と山とをより明確にする操作が行われる。フォルマント強調がなされた音声信号が出力端子７６より出力される。
【０１２８】
また、ここで、例えば聴覚上より好ましい音声信号を得るために、上記アルゴリズムでは、符号化する音声信号の低域側を抑圧したり、高域側をブートするフィルタ処理が含まれており、上記復号化装置からのデコーダ出力信号は、低域側が抑圧された音声信号となっている。
【０１２９】
従って、上述のように本発明の音声信号の雑音低減方法では、上記フィルタ処理に応じて、ａｄｊ値計算部３２におけるａｄｊ３［ｗ，ｋ］の値を、特にピッチが大きい音声信号に対しては低域側で所定値を有し、さらに高域側で周波数に対して線形関係を有するように見積もることで、結果的に低域側の音声信号の抑圧が抑えられるため、上記アルゴリズムの処理によるフォルマント強調がなされた音声信号の低域側は、過度な抑圧を受ける虞がない、すなわち符号化処理等により本来の周波数特性の変化を減少させることができる。
【０１３０】
なお、ここでは、上記雑音低減装置が、低域側の音声信号を抑圧したり、高域側ブーストするようなフィルタ処理を行う音声符号化装置に出力する例を挙げたが、雑音抑圧する際の高域側の音声信号の抑圧を抑えるようにａｄｊ３［ｗ，ｋ］を設定することで、例えば高域側の音声信号を抑圧するような音声符号化装置に出力する場合にも用いることが可能である。
【０１３１】
また、ＣＥ値及びＮＲ値計算部３６において、ＣＥ値をピッチの大きさに応じて計算方法を変えて、このＣＥ値に応じてＮＲ値を決定するため、ピッチ強度に応じたＮＲ値を得ることが可能であり入力される音声信号に即したＮＲ値により雑音抑圧を行うことが可能になるため、スペクトル量子化誤差を減少させることができる。
【０１３２】
また、Ｈｎ値計算部７において、Ｈｎ［ｗ，ｋ］を入力されるＮＲ［ｗ，ｋ］に対して、ｄＢ領域で略直線的に変化させることで、Ｈｎ値の変化に対するＮＲ値の寄与は常に連続しており、急激にＮＲ値が変化してもＨｎ値の変化はこれに対応する。
【０１３３】
また、信号特性計算部３１にて最大ピッチ強度を算出するのに、例えば高速フーリエ変換処理において用いる（Ｎ＋ｌｏｇＮ）といった自己相関関数による複雑な計算を行う必要がなくなり、例えば２００サンプルの処理を行った場合、上記自己相関関数では５００００回の処理が必要であったのに対して、本発明では３０００回の処理で済むため、演算処理の速度を上げることができる。
【０１３４】
また、図２のＡに示したように、第１フレーム化処理部２２のフレーム化処理ではフレーム長ＦＬが１６８サンプル、各フレームは前後のフレームと８サンプルずつオーバーラップ部分を有するようにサンプリングされ、また、図２のＢに示したように、第２フレーム化処理部１のフレーム化処理をフレーム長ＦＬが２００サンプル、各フレームは１つ手前のフレームとは４０サンプル、１つ先のフレームとは８サンプルのオーバーラップ部分を有するようにサンプリングさせて、かつ、第１フレーム化処理部２２と第２フレーム化処理部１とで各フレームの開始位置を同じにして、上記第２フレーム化処理部１の方が上記第１フレーム化処理部２２よりも３２サンプル分だけ後ろにずらすことで、第１フレーム化処理部２２及び第２フレーム化処理部１間で、遅延が生じることがなく、信号特性値を算出するためのサンプル数を多くとることができる。
【０１３５】
また、上記ＲＭＳ［ｋ］と、上記ＭｉｎＲＭＳ［ｋ］と、上記ｔｏｎｅ［ｗ，ｋ］と、上記ＺＣ［ｗ，ｋ］と、上記Ｒｘｘとを、図１３に示すように、例えばバックプロパゲーションタイプのニューラルネットワークの入力として用いて、雑音区間推定を行ってもよい。
【０１３６】
上記ニューラルネットワークにおいて、上記ＲＭＳ［ｋ］、上記ＭｉｎＲＭＳ［ｋ］、上記ｔｏｎｅ［ｗ，ｋ］、上記ＺＣ［ｗ，ｋ］、上記Ｒｘｘの各値が入力層の各端子に入力される。
【０１３７】
入力層の各端子に入力された各値は、中間層に出力されるが、この際にシナプス荷重いわゆる重みが付けられる。すなわち、重みが乗ぜられる。
【０１３８】
また、中間層では、それぞれに重みが付けられた各値と、バイアス５１からバイアス値が入力され、所定の処理が行われた後、処理結果が出力される。この処理結果には重みが付けられる。
【０１３９】
出力層では、中間層から出力される重みが付けられた処理結果にバイアス５２からバイアス値が入力され、所定の処理が行われた後、雑音区間推定の結果が出力される。
【０１４０】
なお、バイアス５１、５２から出力される各バイアス値及び各出力に付けられる重みは、いわゆる望ましい変換を実現させるために適応的に決定される。従って、処理されるデータが多ければ多いほど確からしさが向上する。すなわち、処理が行われれば行われる程、音声と雑音との分類において、より入力音声信号に即した推定雑音レベル及びスペクトルが定まり、正確なＨｎ値の算出を行うことができるようになる。
【０１４１】
【発明の効果】
以上説明したように、本発明の音声信号の雑音低減方法によれば、入力される音声信号のピッチ強度に応じて雑音低減に用いるフィルタの特性を制御し、上記入力される音声信号の所定の周波数帯域、例えば高域側や低域側における雑音抑圧量を小さくすることで、上記雑音抑圧量に基づいて処理された音声信号を音声符号化しても聴覚上不自然な音声となる虞がなくなる、すなわち音質が向上する。
【図面の簡単な説明】
【図１】本発明の音声信号の雑音低減方法を適用した雑音低減装置の要部を示すブロック図である。
【図２】上記雑音低減装置のフレーム化処理部におけるフレーム化処理を説明する図である。
【図３】上記雑音低減装置の信号特性計算部におけるピッチ検出処理を説明する図である。
【図４】上記雑音低減装置におけるエネルギＥ［ｋ］及び減衰エネルギＥ_{ｄｅｃａｙ}［ｋ］の具体例を示す図である。
【図５】上記雑音低減装置におけるＲＭＳ値ＲＭＳ［ｋ］、推定雑音レベル値ＭｉｎＲＭＳ［ｋ］及び最大ＲＭＳ値ＭａｘＲＭＳ［ｋ］の具体例を示す図である。
【図６】上記雑音低減装置におけるｄＢ表示の相対エネルギｄＢ_ｒｅｌ［ｋ］、最大ＳＮ比ＭａｘＳＮＲ［ｋ］、及び雑音判別の閾値の１つであるｄＢｔｈｒｅｓ_ｒｅｌ［ｋ］の具体例を示す図である。
【図７】上記雑音低減装置における最大ＳＮ比ＭａｘＳＮＲ［ｋ］に対して定義される関数としてのＮＲ＿ｌｅｖｅｌ［ｋ］を示すグラフである。
【図８】上記雑音低減装置のａｄｊ値計算部にて得られるａｄｊ３［ｗ，ｋ］と周波数との関係を示すグラフである。
【図９】上記雑音低減装置における入力信号スペクトルの周波数領域の分布を示す値を求める方法を説明する図である。
【図１０】上記雑音低減装置のＣＥ値及びＮＲ値計算部にて得られるＮＲ［ｗ，ｋ］と、Ｈｎ値計算部にて得られる最大抑圧量との関係を表すグラフである。
【図１１】上記雑音低減装置の出力を用いる例としての符号励振線形予測符号化のアルゴリズムによる符号化装置の要部を示すブロック図である。
【図１２】上記符号化装置により符号化された音声信号を復号化するための復号化装置の要部を示すブロック図である。
【図１３】本発明の音声信号の雑音低減方法において、雑音区間推定を行う実施例を示す図である。
【符号の説明】
１第２フレーム化処理部
７Ｈｎ値計算部
２１フレーム化処理部
２２第１フレーム化処理部
３１信号特性計算部
３２ａｄｊ値計算部
３６ＣＥ値及びＮＲ値計算部

Claims

入力される音声信号の所定の周波数帯域を抑圧するフィルタを有する音声符号化装置に音声信号を供給する音声信号の雑音低減方法において、
上記音声符号化装置のフィルタは、上記所定の周波数帯域における雑音抑圧量を小さくするように周波数特性を制御するものであり、上記雑音抑圧量を上記入力される音声信号のピッチ強度に応じて変化させること
を特徴とする音声信号の雑音低減方法。
上記雑音抑圧量は、上記入力される音声信号の高域側の雑音抑圧を小さくするように変化することを特徴とする請求項１記載の音声信号の雑音低減方法。
上記所定の周波数帯域は、音声信号の低域側であり、
上記雑音抑圧量は、上記入力される音声信号の低域側の雑音抑圧を小さくするように変化することを特徴とする請求項１記載の音声信号の雑音低減方法。