WO2012070670A1

WO2012070670A1 - 信号処理装置、信号処理方法、及び信号処理プログラム

Info

Publication number: WO2012070670A1
Application number: PCT/JP2011/077285
Authority: WO
Inventors: 昭彦杉山
Original assignee: 日本電気株式会社
Priority date: 2010-11-25
Filing date: 2011-11-21
Publication date: 2012-05-31
Also published as: CN103238180A; JPWO2012070670A1; US20130246060A1

Abstract

　背景音を考慮して雑音抑圧を行なうことにより高品質な出力信号を得ること。　本願により開示された信号処理装置は、第１信号と第２信号とが混在した混在信号を処理して第２信号を抑圧する抑圧手段を備えている。また信号処理装置は、この信号処理装置、混在信号に含まれる背景音信号を推定する背景音推定手段を含む。さらに、信号処理装置は、抑圧手段による抑圧結果が背景音より小さくならないように第２信号の抑圧を抑制する抑制手段を備える。

Description

信号処理装置、信号処理方法、及び信号処理プログラム

　本発明は、劣化信号中の第２信号を抑圧して第１信号を強調するための信号処理技術に関する。

　劣化信号（第１信号に第２信号が重畳された信号）から第２信号を抑圧し、強調信号（第１信号を強調した信号）を出力する雑音抑圧技術（ｎｏｉｓｅ　ｓｕｐｐｒｅｓｓｉｎｇ　ｔｅｃｈｎｏｌｏｇｙ）が知られている。ノイズサプレッサは、所望の音声信号に重畳されている雑音（ノイズ）を抑圧するシステムである。ノイズサプレッサは、たとえば、携帯電話など様々な音声端末において利用されている。
　この種の技術に関し、特許文献１には、入力信号に１より小さな抑圧係数を乗算することによって、ノイズを抑圧する方法が開示されており、特許文献２には、推定された雑音を劣化信号から直接減算することによって、雑音を抑圧する方法が開示されている。

特許第４２８２２２７号特開平８−２２１０９２号

　しかしながら、上述の特許文献１に開示された方法によって雑音を抑圧した結果、出力信号が背景音よりも小さくなり、出力信号が人等にとって不自然に聞こえる場合があった。この問題は、不連続な雑音を消去するときに、より顕著となる。これは、雑音を抑圧したときの出力が背景音より小さく、抑圧しないときの出力が背景音よりも大きく、その不連続性が知覚されやすいためである。
　以上を踏まえ、本発明は、上述の課題を解決する信号処理技術を提供することを目的とする。

　上記目的を達成するため、本発明に係る装置は、第１信号と第２信号とが混在した混在信号を処理して前記第２信号を抑圧する抑圧手段と、前記混在信号に含まれる背景音信号を推定する背景音推定手段と、前記抑圧手段による抑圧結果が前記背景音より小さくならないように前記第２信号の抑圧を抑制する抑制手段と、を備える。
　上記目的を達成するため、本発明に係る方法は、第１信号と第２信号とが混在した混在信号を入力し、前記混在信号に含まれる背景音信号を推定し、抑圧結果が前記背景音より小さくならないように抑制しつつ前記第２信号の抑圧を行なう。
　上記目的を達成するため、本発明に係るプログラムは、第１信号と第２信号とが混在した混在信号を入力する入力ステップと、前記混在信号に含まれる背景音信号を推定する背景音推定ステップと、抑圧結果が前記背景音より小さくならないように抑制しつつ前記第２信号の抑圧を行なう抑圧ステップと、をコンピュータに実行させる。

　本発明によれば、背景音を考慮して雑音抑圧を行なうことにより高品質な出力信号を得ることができる。

本発明の第１実施形態に係る信号処理装置の構成を示すブロック図である。本発明の第２実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第２実施形態に係る変換部の構成を示すブロック図である。本発明の第２実施形態に係る逆変換部の構成を示すブロック図である。本発明の第２実施形態に係る雑音推定部の構成を示すブロック図である。本発明の第２実施形態に係る推定雑音計算部の構成を示すブロック図である。本発明の第２実施形態に係る更新判定部の構成を示すブロック図である。本発明の第２実施形態に係る重み付き劣化音声計算部の構成を示すブロック図である。本発明の第２実施形態に係る非線形関数の例を示す図である。本発明の第３実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第４実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第５実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第６実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第７実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第７実施形態に係る抑圧係数生成部の構成を示すブロック図である。本発明の第７実施形態に係る推定先天的ＳＮＲ計算部の構成を示すブロック図である。本発明の第７実施形態に係る重み付き加算部の構成を示すブロック図である。本発明の第７実施形態に係る雑音抑圧係数計算部の構成を示すブロック図である。本発明の第８実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第９実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１０実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１１実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１２実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１３実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１４実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１５実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１６実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１７実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１８実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１９実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の他の実施形態に係る雑音抑圧装置の構成を示すブロック図である。

　以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。
　（第１実施形態）
　本発明の第１実施形態としての信号処理装置１００について、図１を用いて説明する。
信号処理装置１００は、第１信号と第２信号とが混在した混在信号を処理して前記第２信号を抑圧するための装置である。
　図１に示すように、信号処理装置１００は、背景音推定部１０１と抑圧抑制部１０２と信号抑圧部１０３とを含む。背景音推定部１０１は、混在信号に含まれる背景音信号を推定する。抑圧抑制部１０２は、抑圧結果が前記背景音信号より小さくならないように前記第２信号の抑圧を抑制する。信号抑圧部１０３は、混在信号を処理して第２信号を抑圧する。
　以上の構成により、背景音を残して、より高品質な信号処理を達成できる。
　（第２実施形態）
　本発明の第２実施形態としての雑音抑圧装置について図２乃至図１１を用いて説明する。本実施形態の雑音抑圧装置２００は、たとえばデジタルカメラ、ノートパソコン、携帯電話などといった装置の一部としても機能する。しかし、本発明はこれに限定されるものではなく、入力信号から雑音の除去を要求されるあらゆる信号処理装置に適用可能である。
　《全体構成》
　図２は、雑音抑圧装置２００の全体構成を示すブロック図である。図２に示すように、雑音抑圧装置２００は、入力端子２０１と、変換部２０２と、逆変換部２０３と出力端子２０４の他、雑音抑圧部２０５と雑音推定部２０６と背景音推定部２０７と雑音補正部２０８とを含む。入力端子２０１には、劣化信号（第１信号としての所望信号と第２信号としての雑音の混在する混在信号）が、サンプル値系列として供給される。入力端子２０１に供給された劣化信号は、変換部２０２においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は各周波数ごとに独立に処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル２２０は雑音抑圧部２０５へ供給され、位相スペクトル２３０は逆変換部２０３に供給される。なお、ここでは雑音抑圧部２０５に振幅スペクトル２２０が供給されているが、本発明はこれに限定されるものではなく、その二乗に相当するパワースペクトルが雑音抑圧部２０５に供給されても良い。
　雑音推定部２０６は、変換部２０２から供給される劣化信号振幅スペクトル２２０を用いて、雑音を推定し、推定第２信号の一例としての雑音情報２５０（推定雑音）を生成する。また、背景音推定部２０７は、変換部２０２から供給された劣化信号振幅スペクトル２２０を用いて背景音を推定し、入力（劣化信号振幅スペクトル２２０）から背景音を減算した値αを雑音補正部２０８に渡す。そして、雑音補正部２０８は、周波数ごとにαと雑音情報Ｘ１の小さい方を選択して、雑音抑圧部２０５に供給する。雑音補正部２０８は、雑音情報が、値α（＝入力−背景音）を超えないように調整する。つまり、雑音補正部２０８は、雑音抑圧結果が背景音よりも小さくならないように、雑音の抑圧程度を抑えめにする。具体的には、雑音補正部２０８は、α（＝入力−背景音）が雑音情報Ｘ１よりも小さい場合にはαを雑音抑圧部２０５に提供し、α（＝入力−背景音）が雑音情報Ｘ１よりも大きい場合にはＸ１を雑音抑圧部２０５に提供する。
　背景音推定部２０７は、逐次背景音の推定を行なって推定背景音を更新する。背景音推定部２０７は、推定背景音を、劣化信号の振幅を平均して求めることができる。平均化の手法としては、有限サンプル数のスライディング窓を用いた方法や漏れ積分を用いた方法を適用することができる。前者は、信号処理の分野では、有限インパルス応答長フィルタの演算として知られており、フィルタのタップ数がスライディング窓の長さに対応する。有限サンプル数をＬとすると、背景音推定部２０７は、次式で平均値を求めることができる。

漏れ積分では、以下の式のような一次漏れ積分が最も広く用いられている。

ただし、βは０＜β＜１を満たす定数である。
　背景音推定部２０７は、背景音の推定を、劣化信号の振幅が背景音推定値に近い（所定倍以内又は所定値差以内の）ときだけ行なうこともできる。背景音推定部２０７は、背景音推定の初期値を、劣化信号振幅の平均として求めることができる。背景音推定部２０７は、初期値を得た後は、背景音推定値に近い劣化信号だけを平均化操作に利用する。
　補正後の雑音情報２６０は、雑音抑圧部２０５に供給されて劣化信号振幅スペクトル２２０から減算され、強調信号振幅スペクトル２４０として逆変換部２０３に供給される。逆変換部２０３は、変換部２０２から供給された位相スペクトル２３０と、強調信号振幅スペクトル２４０とを合成して逆変換を行い、強調信号として、出力端子２０４に供給する。
　《変換部の構成》
　図３は、変換部２０２の構成を示すブロック図である。図３に示すように、変換部２０２はフレーム分割部３０１、窓がけ処理部（ｗｉｎｄｏｗｉｎｇ　ｕｎｉｔ）３０２、及びフーリエ変換部３０３を含む。劣化信号サンプルは、フレーム分割部３０１に供給され、Ｋ／２サンプル毎のフレームに分割される。ここで、Ｋは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部３０２に供給され、窓関数（ｗｉｎｄｏｗ　ｆｕｎｃｔｉｏｎ）であるｗ（ｔ）との乗算が行なわれる。第ｎフレームの入力信号ｙｎ（ｔ）（ｔ＝０，１，．．．，Ｋ／２−１）に対するｗ（ｔ）で窓がけ（ｗｉｎｄｏｗｉｎｇ）された信号は、次式で与えられる。

　また、窓がけ処理部３０２は、連続する２フレームの一部を重ね合わせ（オーバラップ）して窓がけしてもよい。オーバラップ長としてフレーム長の５０％を仮定すれば、ｔ＝０，１，．．．，Ｋ／２−１に対して、以下の式で得られる左辺が、窓がけ処理部３０２の出力となる。

　窓がけ処理部３０２は、実数信号に対しては、左右対称窓関数を用いてもよい。また、窓関数は、ＭＭＳＥ　ＳＴＳＡ法における抑圧係数を１に設定したとき、又はＳＳ法においてゼロを減算したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、ｗ（ｔ）＋ｗ（ｔ＋Ｋ／２）＝１となることを意味する。
　以後、連続する２フレームの５０％をオーバラップして窓がけする場合を例として説明を続ける。窓かけ処理部３０２は、ｗ（ｔ）として、たとえば、次式に示すハニング窓を用いてもよい。

　このほかにも、ハミング窓、ケイザー窓、ブラックマン窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部３０３に供給され、劣化信号振幅スペクトルＹｎ（ｋ）に変換される。劣化信号スペクトルＹｎ（ｋ）は位相と振幅に分離され、劣化信号位相スペクトルａｒｇ　Ｙｎ（ｋ）は逆変換部２０３に、劣化信号振幅スペクトル｜Ｙｎ（ｋ）｜は雑音推定部２０６に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルが利用されても良い。
　《逆変換部の構成》
　図４は、逆変換部２０３の構成を示すブロック図である。図４に示すように、逆変換部２０３は逆フーリエ変換部４０１、窓がけ処理部４０２、及び、フレーム合成部４０３を含む。逆フーリエ変換部４０１は、雑音抑圧部２０５から供給された強調信号振幅スペクトル２４０と変換部２０２から供給された劣化信号位相スペクトル２３０とを乗算して、強調信号（以下の式の左辺）を求める。

　逆フーリエ変換部４０１は、得られた強調信号に逆フーリエ変換を施し、１フレームがＫサンプルを含む時間領域サンプル値系列ｘｎ（ｔ）（ｔ＝０，１，．．．，Ｋ−１）として、窓がけ処理部４０２に供給する。窓がけ処理部４０２は、ｘｎ（ｔ）と窓関数ｗ（ｔ）との乗算を行なう。第ｎフレームの入力信号ｘｎ（ｔ）（ｔ＝０，１，．．．，Ｋ／２−１）に対してｗ（ｔ）で窓がけされた信号は、次式の左辺で与えられる。

　また、連続する２フレームの一部を重ね合わせ（オーバラップ）して窓がけすることも広く行なわれている。フレーム長の５０％をオーバラップ長として仮定すれば、ｔ＝０，１，．．．，Ｋ／２−１に対して、以下の式の左辺が、窓がけ処理部４０２の出力となり、フレーム合成部４０３に伝達される。

　フレーム合成部４０３は、窓がけ処理部４０２からの隣接する２フレームの出力を、Ｋ／２サンプルずつ取り出して重ね合わせ、以下の式によって、ｔ＝０，１，．．．，Ｋ−１における出力信号（以下の式の左辺）を得る。得られた出力信号は、フレーム合成部４０３から出力端子２０４に伝達される。

　なお、図３と図４において変換部２０２と逆変換部２０３における変換をフーリエ変換として説明したが、フーリエ変換に代えて、コサイン変換、修正コサイン変換、アダマール変換、ハール変換、ウェーブレット変換など、他の変換が用いられても良い。たとえば、コサイン変換や修正コサイン変換は、変換結果として振幅だけしか得られない。このため、図２における変換部２０２から逆変換部２０３に至る経路は不要になる。変換部２０２、逆変換部２０３がハール変換を用いた場合は、乗算が不要となり、ＬＳＩ化したときの面積を小さくすることができる。変換部２０２、逆変換部２０３がウェーブレット変換を用いた場合は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。
　《雑音推定部の構成》
　図５は、図２の雑音推定部２０６の構成を示すブロック図である。雑音推定部２０６は、推定雑音計算部５０１、重み付き劣化音声計算部５０２、及びカウンタ５０３から構成される。雑音推定部２０６に供給された劣化音声パワースペクトルは、推定雑音計算部５０１、及び重み付き劣化音声計算部５０２に伝達される。重み付き劣化音声計算部５０２は、供給された劣化音声パワースペクトルと推定雑音パワースペクトルを用いて重み付き劣化音声パワースペクトルを計算し、推定雑音計算部５０１に伝達する。推定雑音計算部５０１は、劣化音声パワースペクトル、重み付き劣化音声パワースペクトル、及びカウンタ５０３から供給されるカウント値を用いて雑音のパワースペクトルを推定し、推定雑音パワースペクトルとして出力すると同時に、重み付き劣化音声計算部５０２に帰還する。
　図６は、図５に含まれる推定雑音計算部５０１の構成を示すブロック図である。推定雑音計算部５０１は、更新判定部６０１、レジスタ長記憶部６０２、推定雑音記憶部６０３、スイッチ６０４、シフトレジスタ６０５、加算器６０６、最小値選択部６０７、除算部６０８、カウンタ６０９を有する。スイッチ６０４には、重み付き劣化音声パワースペクトルが供給されている。スイッチ６０４が回路を閉じたときに、重み付き劣化音声パワースペクトルは、シフトレジスタ６０５に伝達される。シフトレジスタ６０５は、更新判定部６０１から供給される制御信号に応じて、内部レジスタの記憶値を隣接レジスタにシフトする。シフトレジスタ長は、後述するレジスタ長記憶部６０２に記憶されている値に等しい。シフトレジスタ６０５の全レジスタ出力は、加算器６０６に供給される。加算器６０６は、供給された全レジスタ出力を加算して、加算結果を除算部６０８に伝達する。
　一方、更新判定部６０１には、カウント値、周波数別劣化音声パワースペクトル及び周波数別推定雑音パワースペクトルが供給されている。更新判定部６０１は、カウント値が予め設定された値に到達するまでは常に″１″を、カウント値が予め設定された値に到達した後は、入力された劣化音声信号が雑音であると判定されたときに″１″を、それ以外のときに″０″を出力し、カウンタ６０９、スイッチ６０４、及びシフトレジスタ６０５に伝達する。スイッチ６０４は、更新判定部から供給された信号が″１″のときに回路を閉じ、″０″のときに開く。カウンタ６０９は、更新判定部６０１から供給された信号が″１″のときにカウント値を増加し、″０″のときには変更しない。シフトレジスタ６０５は、更新判定部６０１から供給された信号が″１″のときにスイッチ６０４から供給される信号サンプルを１サンプル取り込むと同時に、内部レジスタの記憶値を隣接レジスタにシフトする。最小値選択部６０７には、カウンタ６０９の出力とレジスタ長記憶部６０２の出力が供給されている。
　最小値選択部６０７は、供給されたカウント値とレジスタ長のうち、小さい方を選択して、除算部６０８に伝達する。除算部６０８は、加算器６０６から供給された劣化音声パワースペクトルの加算値を、カウント値又はレジスタ長の小さい方の値で除算し、商を周波数別推定雑音パワースペクトルλｎ（ｋ）として出力する。Ｂｎ（ｋ）（ｎ＝０，１，．．．，Ｎ−１）をシフトレジスタ６０５に保存されている劣化音声パワースペクトルのサンプル値とすると、λｎ（ｋ）は、以下の式で与えられる。

　ただし、Ｎはカウント値とレジスタ長のうち、小さい方の値である。カウント値はゼロから始まって単調に増加するので、最初はカウント値で除算が行なわれ、後にはレジスタ長で除算が行なわれる。レジスタ長で除算が行なわれることは、シフトレジスタに格納された値の平均値を求めることになる。最初は、シフトレジスタ６０５に十分多くの値が記憶されていないために、実際に値が記憶されているレジスタの数で除算が行なわれる。実際に値が記憶されているレジスタの数は、カウント値がレジスタ長より小さいときはカウント値に等しく、カウント値がレジスタ長より大きくなると、レジスタ長と等しくなる。
　図７は、図６に含まれる更新判定部６０１の構成を示すブロック図である。更新判定部６０１は、論理和計算部７０１、比較部７０２、７０４、閾値記憶部７０５、７０３、閾値計算部７０６を有する。図５のカウンタ５０３から供給されるカウント値は、比較部７０２に伝達される。閾値記憶部７０３の出力である閾値も、比較部７０２に伝達される。比較部７０２は、供給されたカウント値と閾値を比較し、カウント値が閾値より小さいときに″１″を、カウント値が閾値より大きいときに″０″を、論理和計算部７０１に伝達する。一方、閾値計算部７０６は、図６の推定雑音記憶部６０３から供給される推定雑音パワースペクトルに応じた値を計算し、閾値として閾値記憶部７０５に出力する。最も簡単な閾値の計算方法は、推定雑音パワースペクトルを定数倍することである。
　その他に、閾値計算部７０６は、高次多項式や非線形関数を用いて閾値を計算することも可能である。閾値記憶部７０５は、閾値計算部７０６から出力された閾値を記憶し、１フレーム前に記憶された閾値を比較部７０４へ出力する。比較部７０４は、閾値記憶部７０５から供給される閾値と変換部２０２から供給される劣化音声パワースペクトルを比較し、劣化音声パワースペクトルが閾値よりも小さければ″１″を、大きければ″０″を論理和計算部７０１に出力する。すなわち、比較部７０４は、推定雑音パワースペクトルの大きさをもとに、劣化音声信号が雑音であるか否かを判別している。論理和計算部７０１は、比較部７０２の出力値と比較部７０４の出力値との論理和を計算し、計算結果を図６のスイッチ６０４、シフトレジスタ６０５及びカウンタ６０９に出力する。このように、初期状態や無音区間だけでなく、有音区間でも劣化音声パワーが小さい場合には、更新判定部６０１は″１″を出力する。すなわち、推定雑音の更新が行われる。閾値の計算は各周波数ごとに行われるため、各周波数ごとに推定雑音の更新を行うことができる。
　図８は、重み付き劣化音声計算部５０２の構成を示すブロック図である。重み付き劣化音声計算部５０２は、推定雑音記憶部８０１、周波数別ＳＮＲ計算部８０２、非線形処理部８０４、及び乗算器８０３を有する。推定雑音記憶部８０１は、図５の推定雑音計算部５０１から供給される推定雑音パワースペクトルを記憶し、１フレーム前に記憶された推定雑音パワースペクトルを周波数別ＳＮＲ計算部８０２へ出力する。周波数別ＳＮＲ計算部８０２は、推定雑音記憶部８０１から供給される推定雑音パワースペクトルと変換部２０２から供給される劣化音声パワースペクトルを用いてＳＮＲ（Ｓｉｇｎａｌ−ｔｏ−Ｎｏｉｓｅ　Ｒａｔｉｏ）を周波数帯域ごとに求め、非線形処理部８０４に出力する。具体的には、周波数別ＳＮＲ計算部８０２は、次式にしたがって、供給された劣化音声パワースペクトルを推定雑音パワースペクトルで除算して周波数別ＳＮＲγｎ（ｋ）ハットを求める。ここに、λｎ−１（ｋ）は１フレーム前に記憶された推定雑音パワースペクトルである。

　非線形処理部８０４は、周波数別ＳＮＲ計算部８０２から供給されるＳＮＲを用いて重み係数ベクトルを計算し、重み係数ベクトルを乗算器８０３に出力する。乗算器８０３は、変換部２０２から供給される劣化音声パワースペクトルと、非線形処理部８０４から供給される重み係数ベクトルの積を周波数帯域ごとに計算し、重み付き劣化音声パワースペクトルを図５の推定雑音計算部５０１に出力する。
　非線形処理部８０４は、多重化された入力値それぞれに応じた実数値を出力する、非線形関数を有する。図９に、非線形関数の例を示す。ｆ１を入力値としたとき、図９に示される非線形関数の出力値ｆ２は、以下の式で表わされる。ただし、ａとｂは任意の実数である。

　非線形処理部８０４は、周波数別ＳＮＲ計算部８０２から供給される周波数帯域別ＳＮＲを、非線形関数によって処理して重み係数を求め、乗算器８０３に伝達する。すなわち、非線形処理部８０４はＳＮＲに応じた１から０までの重み係数を出力する。非線形処理部８０４はＳＮＲが小さい時は１を、大きい時は０を出力する。
　図８の乗算器８０３で劣化音声パワースペクトルと乗算される重み係数は、ＳＮＲに応じた値になっており、ＳＮＲが大きい程、すなわち劣化音声に含まれる音声成分が大きい程、重み係数の値は小さくなる。推定雑音の更新には一般に劣化音声パワースペクトルが用いられる。しかし、本実施の形態では、推定雑音の更新に用いられる劣化音声パワースペクトルに対して、乗算器８０３がＳＮＲに応じた重みづけを行う。これにより、雑音抑圧装置２００は、劣化音声パワースペクトルに含まれる音声成分の影響を小さくすることができ、より精度の高い雑音推定を行うことができる。なお、重み係数の計算に乗算器８０３が非線形関数を用いた例を示したが、乗算器８０３は非線形関数以外にも線形関数や高次多項式など、他の形で表されるＳＮＲの関数を用いることも可能である。
　以上のように本実施形態の構成によれば、出力信号が背景音よりも小さくならず、不連続性を知覚することのない高品質な信号処理を達成できる。
　（第３実施形態）
　図１０は、本発明の第３実施形態としての雑音抑圧装置１０００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置１０００は、第２実施形態と異なり、背景音推定部１００７に雑音抑圧部２０５の出力がフィードバックされている。
　背景音推定部１００７は、所望信号の有無に応じて背景音の推定の要否を判定する。つまり、所望信号がないときのみ背景音情報を更新する。これ以外の背景音推定部１００７の動作は、第２実施形態の背景音推定で説明した通りであるので、詳細を省略する。
　以上により、第２実施形態の効果に加えて、効率的かつ的確に背景音を推定することができる。
　（第４実施形態）
　図１１は、本発明の第４実施形態としての雑音抑圧装置１１００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置１１００は、第２実施形態と異なり、雑音記憶部１１０６から読出された雑音情報を用いて雑音補正部２０８での補正が行なわれる。他の構成及び動作は、第２実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
　雑音記憶部１１０６は、半導体メモリなどの記憶素子を含み、雑音情報（雑音の特性に関する情報）を記憶している。雑音記憶部１１０６は、雑音情報として、雑音のスペクトルの形を記憶している。雑音記憶部１１０６は、スペクトルに加えて、位相の周波数特性、特定の周波数における強弱や時間変化などの特徴量などを記憶しても良い。雑音情報は、その他、統計量（最大、最小、分散、メジアン）などでも良い。スペクトルが１０２４の周波数成分で表わされている場合、雑音記憶部１１０６には、１０２４の振幅（又はパワー）データが記憶されている。雑音記憶部１１０６に記録された雑音情報２５０は、雑音補正部２０８に供給される。
　雑音補正部２０８は、周波数成分ごとに、α（＝入力−背景音）と、Ｘ２（＝記憶雑音）のいずれか小さい方を選択して雑音抑圧部２０５に出力する。
　本実施形態によっても、第２実施形態と同様に、出力信号が背景音よりも小さくならず、不連続性を知覚することのない高品質な信号処理を行なうことができる。
　（第５実施形態）
　図１２は、本発明の第５実施形態としての雑音抑圧装置１２００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置１２００は、第４実施形態と異なり、背景音推定部１００７に雑音抑圧部２０５の出力がフィードバックされている。他の構成及び動作は、第４実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
　背景音推定部１００７は、所望信号がないときのみ背景音情報を更新する。これ以外の背景音推定部１００７の動作は、第２実施形態の背景音推定で説明した通りであるので、詳細を省略する。
　雑音補正部２０８は、周波数成分ごとに、α（＝入力−背景音）と、Ｘ２（＝記憶雑音）のいずれか小さい方を選択して雑音抑圧部２０５に出力する。
　以上により、第４実施形態の効果に加えて、効率的かつ的確に背景音を推定することができる。
　（第６実施形態）
　図１３は、本発明の第６実施形態としての雑音抑圧装置１３００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置１３００は、第４実施形態と異なり、雑音記憶部１１０６からの出力に対して雑音修正部１３０１で修正を加えた上で雑音補正部２０８に供給している。他の構成及び動作は、第４実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
　雑音修正部１３０１は、雑音抑圧部２０５から供給された強調信号振幅スペクトル２４０を受けとり、雑音抑圧結果のフィードバックに応じて雑音を修正する。具体的には、雑音抑圧結果がゼロとなるように、雑音修正情報を更新する。雑音補正部２０８は、周波数成分ごとに、α（＝入力−背景音）と、Ｘ３（＝修正雑音）のいずれか小さい方を選択して雑音抑圧部２０５に出力する。
　本実施形態によっても、第４実施形態と同様に、出力信号が背景音よりも小さくならず、不連続性を知覚することのない高品質な信号処理を行なうことができ、さらに、抑圧結果に応じて雑音を修正することで、より精度の高い雑音抑圧を実行できる。
　なお、本実施形態において、背景音推定部２０７に雑音抑圧部２０５の出力がフィードバックされてもよい（点線矢印）。その場合、背景音推定部２０７は、所望信号がないときのみ背景音情報を更新する。背景音推定部２０７は、周波数成分ごとに、所望信号が強い場合には、背景音の更新を行なわない。さらに背景音推定部２０７は、周りがうるさいときに背景音を推定しない。背景音推定部２０７は、一度背景音を推定したら、それに近い（所定倍以内又は所定値差以内の）振幅の時に新たな背景音推定を行なう。振幅が、推定背景音に近いときのみ新たな推定を行なう。そうすれば、上記効果に加えて、効率的かつ的確に背景音を推定することができる。
　（第７実施形態）
　図１４は、本発明の第７実施形態としての雑音抑圧装置１４００の概略構成を示すブロック図である。図２と図１４を見比べると、本実施形態に係る雑音抑圧装置１４００は、第２実施形態と異なり、雑音情報と劣化信号とを用いて抑圧係数を生成する抑圧係数生成部１４１０を備えている。また、本実施形態に係る雑音抑圧装置１４００は、乗算を行なう雑音抑圧部１４０５を備えている。その他の構成及び動作は、第２実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
　《抑圧係数生成部の構成》
　図１５は、図１４に含まれる抑圧係数生成部１４１０の構成を示すブロック図である。図１５に示すように、抑圧係数生成部１４１０は、後天的ＳＮＲ計算部１５０１と推定先天的ＳＮＲ計算部１５０２と雑音抑圧係数計算部１５０３と、音声非存在確率記憶部１５０４とを備えている。
　後天的ＳＮＲ計算部１５０１は、入力された劣化音声パワースペクトルと推定雑音パワースペクトルを用いて周波数別に後天的ＳＮＲを計算し、推定先天的ＳＮＲ計算部１５０２と雑音抑圧係数計算部１５０３に供給する。推定先天的ＳＮＲ計算部１５０２は、入力された後天的ＳＮＲ、及び雑音抑圧係数計算部１５０３から帰還された抑圧係数を用いて先天的ＳＮＲを推定し、推定先天的ＳＮＲとして、雑音抑圧係数計算部１５０３に伝達する。雑音抑圧係数計算部１５０３は、入力として供給された後天的ＳＮＲ、推定先天的ＳＮＲ及び音声非存在確率記憶部１５０４から供給される音声非存在確率を用いて雑音抑圧係数を生成し、抑圧係数Ｇｎ（ｋ）バーとして出力する。
　図１６は、図１５に含まれる推定先天的ＳＮＲ計算部１５０２の構成を示すブロック図である。推定先天的ＳＮＲ計算部１５０２は、値域限定処理部１６０１、後天的ＳＮＲ記憶部１６０２、抑圧係数記憶部１６０３、乗算器１６０４、１６０５、重み記憶部１６０６、重み付き加算部１６０７、加算器１６０８を有する。後天的ＳＮＲ計算部１５０１から供給される後天的ＳＮＲγｎ（ｋ）（ｋ＝０，１，．．．，Ｍ−１）は、後天的ＳＮＲ記憶部１６０２と加算器１６０８とに伝達される。後天的ＳＮＲ記憶部１６０２は、第ｎフレームにおける後天的ＳＮＲγｎ（ｋ）を記憶すると共に、第ｎ−１フレームにおける後天的ＳＮＲγｎ−１（ｋ）を乗算器１６０５に伝達する。
　抑圧係数記憶部１６０３は、第ｎフレームにおける抑圧係数Ｇｎ（ｋ）バーを記憶すると共に、第ｎ−１フレームにおける抑圧係数Ｇｎ−１（ｋ）バーを乗算器１６０４に伝達する。乗算器１６０４は、供給されたＧｎ（ｋ）バーを２乗してＧｎ−１２（ｋ）バーを求め、乗算器１６０５に伝達する。乗算器１６０５は、Ｇｎ−１２（ｋ）バーとγｎ−１（ｋ）とをｋ＝０，１，．．．，Ｍ−１に対して乗算して、Ｇｎ−１２（ｋ）バーγｎ−１（ｋ）を求め、結果を重み付き加算部１６０７に過去の推定ＳＮＲとして伝達する。
　加算器１６０８の他方の端子には−１が供給されており、加算結果γｎ（ｋ）−１が値域限定処理部１６０１に伝達される。値域限定処理部１６０１は、加算器１６０８から供給された加算結果γｎ（ｋ）−１に値域限定演算子Ｐ［・］による演算を施し、結果であるＰ［γｎ（ｋ）−１］を重み付き加算部１６０７に瞬時推定ＳＮＲとして伝達する。ただし、Ｐ［ｘ］は次式で定められる。

　重み付き加算部１６０７には、また、重み記憶部１６０６から重みが供給されている。重み付き加算部１６０７は、これらの供給された瞬時推定ＳＮＲ、過去の推定ＳＮＲ、重みを用いて推定先天的ＳＮＲを求める。重みをαとし、ξｎ（ｋ）ハットを推定先天的ＳＮＲとすると、ξｎ（ｋ）ハットは、次式によって計算される。ここに、Ｇｎ−１２（ｋ）γ−１（ｋ）バー＝１とする。

　図１７は、図１６に含まれる重み付き加算部１６０７の構成を示すブロック図である。重み付き加算部１６０７は、乗算器１７０１、１７０３、定数乗算器１７０５、加算器１７０２、１７０４を有する。図１６の値域限定処理部１６０１から周波数帯域別瞬時推定ＳＮＲが、図１６の乗算器１６０５から過去の周波数帯域別ＳＮＲが、図１６の重み記憶部１６０６から重みが、それぞれ入力として供給される。値αを有する重みは、定数乗算器１７０５と乗算器１７０３に伝達される。定数乗算器１７０５は入力信号を−１倍して得られた−αを、加算器１７０４に伝達する。加算器１７０４のもう一方の入力としては１が供給されており、加算器１７０４の出力は両者の和である１−αとなる。１−αは乗算器１７０１に供給されて、もう一方の入力である周波数帯域別瞬時推定ＳＮＲＰ［γｎ（ｋ）−１］と乗算され、積である（１−α）Ｐ［γｎ（ｋ）−１］が加算器１７０２に伝達される。一方、乗算器１７０３では、重みとして供給されたαと過去の推定ＳＮＲが乗算され、積であるαＧｎ−１２（ｋ）バーγｎ−１（ｋ）が加算器１７０２に伝達される。加算器１７０２は、（１−α）Ｐ［γｎ（ｋ）−１］とαＧｎ−１２（ｋ）バーγｎ−１（ｋ）の和を、周波数帯域別推定先天的ＳＮＲとして、出力する。
　図１８は、図１５に含まれる雑音抑圧係数計算部１５０３を示すブロック図である。雑音抑圧係数計算部１５０３は、ＭＭＳＥ　ＳＴＳＡゲイン関数値計算部１８０１、一般化尤度比計算部１８０２、及び抑圧係数計算部１８０３を有する。以下、ＩＥＥＥ　ＴＲＡＮＳＡＣＴＩＯＮＳ　ＯＮ　ＡＣＯＵＳＴＩＣＳ，ＳＰＥＥＣＨ，ＡＮＤ　ＳＩＧＮＡＬ　ＰＲＯＣＥＳＳＩＮＧ，ＶＯＬ．３２，ＮＯ．６，ＰＰ．１１０９−１１２１，ＤＥＣ，１９８４、１１０９~１１２１ページに記載されている計算式をもとに、抑圧係数の計算方法を説明する。
　フレーム番号をｎ、周波数番号をｋとし、γｎ（ｋ）を後天的ＳＮＲ計算部１５０１から供給される周波数別後天的ＳＮＲ、ξｎ（ｋ）ハットを推定先天的ＳＮＲ計算部１５０２から供給される周波数別推定先天的ＳＮＲ、ｑを音声非存在確率記憶部１５０４から供給される音声非存在確率とする。
　また、ηｎ（ｋ）＝ξｎ（ｋ）ハット／（１−ｑ）、ｖｎ（ｋ）＝（ηｎ（ｋ）γｎ（ｋ））／（１＋ηｎ（ｋ））とする。
　ＭＭＳＥ　ＳＴＳＡゲイン関数値計算部１８０１は、後天的ＳＮＲ計算部１５０１から供給される後天的ＳＮＲγｎ（ｋ）、推定先天的ＳＮＲ計算部１５０２から供給される推定先天的ＳＮＲξｎ（ｋ）ハット、及び、音声非存在確率記憶部１５０４から供給される音声非存在確率ｑをもとに、周波数帯域ごとにＭＭＳＥ　ＳＴＳＡゲイン関数値を計算し、抑圧係数計算部１８０３に出力する。周波数帯域毎のＭＭＳＥ　ＳＴＳＡゲイン関数値Ｇｎ（ｋ）は、以下の式で与えられる。

　ここに、Ｉ０（ｚ）は０次変形ベッセル関数、Ｉ１（ｚ）は１次変形ベッセル関数である。変形ベッセル関数については、１９８５年、数学辞典、岩波書店、３７４．Ｇページに記載されている。
　一般化尤度比計算部１８０２は、後天的ＳＮＲ計算部１５０１から供給される後天的ＳＮＲγｎ（ｋ）、推定先天的ＳＮＲ計算部１５０２から供給される推定先天的ＳＮＲξｎ（ｋ）ハット、及び、音声非存在確率記憶部１５０４から供給される音声非存在確率ｑをもとに、周波数帯域ごとに一般化尤度比を計算し、抑圧係数計算部１８０３に伝達する。周波数帯域毎の一般化尤度比Λｎ（ｋ）は、以下の式で与えられる。

　抑圧係数計算部１８０３は、ＭＭＳＥ　ＳＴＳＡゲイン関数値計算部１８０１から供給されるＭＭＳＥ　ＳＴＳＡゲイン関数値Ｇｎ（ｋ）と、一般化尤度比計算部１８０２から供給される一般化尤度比Λｎ（ｋ）から、周波数帯域ごとに抑圧係数を計算する。周波数帯域毎の抑圧係数Ｇｎ（ｋ）バーは、以下の式で与えられる。

　抑圧係数計算部１８０３は、周波数帯域別にＳＮＲを計算する代わりに、複数の周波数帯域から構成される広い帯域に共通なＳＮＲを求めて、これを用いることも可能である。
　以上の構成により、雑音抑圧装置１４００は、抑圧係数を用いた雑音抑圧においても、所望信号と雑音の比に応じて雑音が小さくなるように制御するので、高品質の信号処理が可能となる。つまり、本実施形態によっても、第２実施形態と同様に、出力信号が背景音よりも小さくならず、不連続性を知覚することのない高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
　（第８実施形態）
　図１９は、本発明の第８実施形態としての雑音抑圧装置１９００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置１９００は、第７実施形態（図１４）と異なり、背景音推定部１００７に雑音抑圧部１４０５の出力がフィードバックされている。
　背景音推定部１００７は、所望信号がないときのみ背景音情報を更新する。背景音推定部１００７は、周波数成分ごとに、所望信号が強い場合には、背景音の更新を行なわない。背景音推定部１００７は、さらに周りがうるさいときに背景音を推定しない。背景音推定部１００７は、一度背景音を推定したら、それに近い（所定倍以内又は所定値差以内の）振幅の時に新たな背景音推定を行なう。背景音推定部１００７は、振幅が、推定背景音に近いときのみ新たな推定を行なう。
　以上により、第７実施形態の効果に加えて、効率的かつ的確に背景音を推定することができる。
　（第９実施形態）
　図２０は、本発明の第９実施形態としての雑音抑圧装置２０００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置２０００は、第７実施形態（図１４）と異なり、雑音補正部２０８を有さず、その代わりに、抑圧係数生成部１４１０から供給された抑圧係数を背景音に応じて補正する抑圧係数補正部２００１を備えている。また、背景音推定部２００７は、劣化信号振幅を変換部２０２から受けて、背景音を推定する。背景音推定部２００７は、さらに、得られた背景音推定値と入力の比βを計算して、抑圧係数補正部２００１に供給する。その他の構成及び動作は、第５実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
　抑圧係数補正部２００１は、抑圧係数生成部１４１０で生成された抑圧係数を入力信号（周波数）の重要度別に補正する。
　これにより、抑圧係数補正部２００１は、背景音があると推定される周波数成分信号については、抑圧係数を小さくして、雑音抑圧部１４０５における信号の抑圧を抑制する。
　以上の構成により、抑圧係数を用いた雑音抑圧においても、同様に所望信号と雑音の比に応じて抑圧係数が小さくなるように制御するので、高品質の信号処理が可能となる。つまり、本実施形態によっても、第２実施形態と同様に、出力信号が背景音よりも小さくならず、不連続性を知覚することのない高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
　（第１０実施形態）
　図２１は、本発明の第１０実施形態としての雑音抑圧装置２１００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置２１００は、第９実施形態（図２０）の構成に加えて、背景音推定部２１０７に雑音抑圧部１４０５の出力がフィードバックされている。
　背景音推定部２１０７は、所望信号がないときのみ背景音情報を更新する。背景音推定部２１０７は、周波数成分ごとに、所望信号が強い場合には、背景音の更新を行なわない。背景音推定部２１０７は、さらに周りがうるさいときに背景音を推定しない。背景音推定部２１０７は、一度背景音を推定したら、それに近い（所定倍以内又は所定値差以内の）振幅の時に新たな背景音推定を行なう。背景音推定部２１０７は、振幅が、推定背景音に近いときのみ新たな推定を行なう。
　以上により、第９実施形態の効果に加えて、効率的かつ的確に背景音を推定することができる。
　（第１１実施形態）
　図２２は、本発明の第１１実施形態としての雑音抑圧装置２２００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置２２００は、第７実施形態（図１４）と比較すると、雑音推定部２０６を持たず、雑音記憶部１１０６から読出された雑音情報を用いて雑音補正部２０８での補正が行なわれる。他の構成及び動作は、第２実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。雑音補正部２０８は、周波数成分ごとに、α（＝入力−背景音）と、Ｘ２（＝記憶雑音）のいずれか小さい方を選択して抑圧係数生成部１４１０に出力する。
　本実施形態によっても、第７実施形態と同様に、所望信号と雑音の比に応じて雑音が小さくなるように制御するので、高品質な信号処理を行なうことができる。
　（第１２実施形態）
　図２３は、本発明の第１２実施形態としての雑音抑圧装置２３００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置２３００は、第１１実施形態（図２２）の構成に加えて、背景音推定部１００７に雑音抑圧部１４０５の出力をフィードバックしている。
　背景音推定部１００７は、所望信号がないときのみ背景音情報を更新する。背景音推定部１００７は、周波数成分ごとに、所望信号が強い場合には、背景音の更新を行なわない。背景音推定部１００７は、さらに周りがうるさいときに背景音を推定しない。背景音推定部１００７は、一度背景音を推定したら、それに近い（所定倍以内又は所定値差以内の）振幅の時に新たな背景音推定を行なう。背景音推定部１００７は、振幅が、推定背景音に近いときのみ新たな推定を行なう。
　以上により、第１１実施形態の効果に加えて、効率的かつ的確に背景音を推定することができる。
　（第１３実施形態）
　図２４は、本発明の第１３実施形態としての雑音抑圧装置２４００の概略構成を示すブロック図である。図２０と図２４とを見比べると、本実施形態に係る雑音抑圧装置２４００は、第９実施形態（図２０）の雑音推定部２０６を持たず、雑音記憶部１１０６から読出された雑音情報を用いて抑圧係数生成部１４１０が抑圧係数の生成を行なう。他の構成及び動作は、第９実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
　本実施形態によっても、第９実施形態と同様に、所望信号と雑音の比に応じて雑音が小さくなるように制御するので、高品質な信号処理を行なうことができる。
　（第１４実施形態）
　図２５は、本発明の第１４実施形態としての雑音抑圧装置２５００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置２５００は、第１３実施形態（図２４）の構成に加えて、背景音推定部２１０７に雑音抑圧部１４０５の出力をフィードバックしている。
　背景音推定部２１０７は、所望信号がないときのみ背景音情報を更新する。背景音推定部２１０７は、周波数成分ごとに、所望信号が強い場合には、背景音の更新を行なわない。背景音推定部２１０７は、さらに周りがうるさいときに背景音を推定しない。背景音推定部２１０７は、一度背景音を推定したら、それに近い（所定倍以内又は所定値差以内の）振幅の時に新たな背景音推定を行なう。背景音推定部２１０７は、振幅が、推定背景音に近いときのみ新たな推定を行なう。
　以上により、第１３実施形態の効果に加えて、効率的かつ的確に背景音を推定することができる。
　（第１５実施形態）
　図２６は、本発明の第１５実施形態としての雑音抑圧装置２６００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置２６００は、第１４実施形態（図２５）の構成を有し、さらに、抑圧係数生成部２６１０に対して、抑圧係数補正部２００１での補正後の抑圧係数をフィードバックしている。抑圧係数生成部２６１０は、フィードバックされた抑圧係数を用いて次の抑圧係数を生成する。これにより抑圧係数の精度が上がり音質の向上につながる。
　その他の構成及び動作は、第１４実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
　本実施形態によっても、第１４実施形態と同様に、所望信号と雑音の比に応じて雑音が小さくなるように制御するので、高品質な信号処理を行なうことができ、さらに、より精度の高い雑音抑圧を実行できる。
　（第１６実施形態）
　図２７は、本発明の第１６実施形態としての雑音抑圧装置２７００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置２７００は、第１５実施形態（図２６）の構成に加えて、背景音推定部２１０７に雑音抑圧部１４０５の出力をフィードバックしたものである。
　背景音推定部２１０７は、所望信号がないときのみ背景音情報を更新する。背景音推定部２１０７は、周波数成分ごとに、所望信号が強い場合には、背景音の更新を行なわない。背景音推定部２１０７は、さらに周りがうるさいときに背景音を推定しない。背景音推定部２１０７は、一度背景音を推定したら、それに近い（所定倍以内又は所定値差以内の）振幅の時に新たな背景音推定を行なう。背景音推定部２１０７は、振幅が、推定背景音に近いときのみ新たな推定を行なう。
　以上により、第１５実施形態の効果に加えて、効率的かつ的確に背景音を推定することができる。
　（第１７実施形態）
　図２８は、本発明の第１７実施形態としての雑音抑圧装置２８００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置２８００は、第１１実施形態（図２２）の構成に雑音修正部１３０１を追加したものである。雑音抑圧装置２８００は、雑音記憶部１１０６からの出力に対して雑音修正部１３０１で修正を加え、修正された雑音情報を雑音補正部２０８に供給している。雑音修正部１３０１は、雑音抑圧部１４０５からの出力２４０を受けとり、雑音抑圧結果のフィードバックに応じて雑音を修正する。
　その他の構成及び動作は、第１１実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
　本実施形態によっても、第１１実施形態と同様に、所望信号と雑音の比に応じて雑音が小さくなるように制御するので、高品質な信号処理を行なうことができ、さらに、抑圧結果に応じて雑音を修正することで、より精度の高い雑音抑圧を実行できる。
　（第１８実施形態）
　図２９は、本発明の第１８実施形態としての雑音抑圧装置２９００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置２９００は、第１３実施形態（図２４）の構成に雑音修正部１３０１を追加したものである。雑音抑圧装置２９００は、雑音記憶部１１０６からの出力に対して雑音修正部１３０１で修正を加え、修正された雑音情報を抑圧係数生成部１４１０に供給している。雑音修正部１３０１は、雑音抑圧部１４０５からの出力２４０を受けとり、雑音抑圧結果のフィードバックに応じて雑音を修正する。
　その他の構成及び動作は、第１３実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
　本実施形態によっても、第１３実施形態と同様に、所望信号と雑音の比に応じて雑音が小さくなるように制御するので、高品質な信号処理を行なうことができ、さらに、抑圧結果に応じて雑音を修正することで、より精度の高い雑音抑圧を実行できる。
　（第１９実施形態）
　図３０は、本発明の第１９実施形態としての雑音抑圧装置３０００の概略構成を示すブロック図である。本実施形態に係る雑音抑圧装置３０００は、第１８実施形態（図２９）の構成を有し、さらに、抑圧係数生成部２６１０に対して、抑圧係数補正部２００１での補正後の抑圧係数をフィードバックしている。抑圧係数生成部２６１０は、フィードバックされた抑圧係数を用いて次の抑圧係数を生成する。これにより抑圧係数の精度が上がり音質の向上につながる。
　その他の構成及び動作は、第１８実施形態と同様であるため、同じ構成については同じ符号を付して、詳細な説明を省略する。
　本実施形態によっても、第１８実施形態と同様に、所望信号と雑音の比に応じて雑音が小さくなるように制御するので、高品質な信号処理を行なうことができ、さらに、抑圧係数のフィードバック制御により、より精度の高い雑音抑圧を実行できる。
　（他の実施形態）
　以上説明してきた第１乃至第１９実施形態では、それぞれ別々の特徴を持つ雑音抑圧装置について説明したが、それらの特徴を如何様に組み合わせた雑音抑圧装置も、本発明の範疇に含まれる。
　また、本発明は、複数の機器から構成されるシステムに適用しても良いし、単体の装置に適用しても良い。さらに、本発明は、実施形態の機能を実現するソフトウェアの信号処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるＷＷＷサーバも、本発明の範疇に含まれる。
　図３１は、第１実施形態を信号処理プログラムにより構成する場合に、その信号処理プログラムを実行するコンピュータ３１００の構成図である。コンピュータ３１００は、入力部３１０１と、ＣＰＵ３１０２と、メモリ３１０３と、出力部３１０４とを含む。
　ＣＰＵ３１０２は、信号処理プログラムを読み込むことにより、コンピュータ３１００の動作を制御する。すなわち、ＣＰＵ３１０２は、メモリ３１０３に格納された信号処理プログラムを実行し、第１信号と第２信号とが混在した混在信号を入力する（Ｓ３１１１）。次にＣＰＵ３１０２は、混在信号に含まれる背景音信号を推定する（Ｓ３１１２）。さらに続けて、ＣＰＵ３１０２は、抑圧結果が背景音以下にならないように抑制しつつ、第２信号を抑圧する（Ｓ３１１３）。これにより、第１実施形態と同様の効果を得ることができる。
　以上、実施形態を参照して本願発明を説明したが、本願発明は上記実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解しうる様々な変更をすることができる。
　この出願は、２０１０年１１月２５日に出願された日本出願特願２０１０−２６３０２２を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

　第１信号と第２信号とが混在した混在信号を処理して前記第２信号を抑圧する抑圧手段と、
　前記混在信号から背景音信号を推定する背景音推定手段と、
　前記抑圧手段による出力が、推定された前記背景音信号よりも小さくならないように前記第２信号の抑圧を抑制する抑制手段と、
　を備える信号処理装置。
　前記混在信号に混在すると推定される推定第２信号を提供する推定手段を備え、
　前記抑制手段は、前記推定手段によって提供される前記推定第２信号に対して、前記背景音に応じた補正を加えて補正値を出力し、
　前記抑圧手段は、前記混在信号から前記補正値を減算することで前記第２信号の抑圧を抑制する請求項１に記載の信号処理装置。
　前記混在信号に混在すると推定される推定第２信号を記憶する記憶手段を備え、
　前記抑圧手段は、前記記憶手段によって提供される前記推定第２信号に対して、前記背景音に応じた補正を加えて補正値を出力し、
　前記抑圧手段は、前記混在信号から前記補正値を減算することで前記第２信号の抑圧を抑制する請求項１に記載の信号処理装置。
　前記抑圧手段による前記抑圧結果に応じて、前記記憶手段から読出した前記推定第２信号を修正する修正手段をさらに備え、
　前記抑圧手段は、修正された前記推定第２信号に対して前記補正を加える請求項３に記載の信号処理装置。
　前記推定第２信号に基づいて抑圧係数を生成する抑圧係数生成手段をさらに備え、
　前記抑圧手段は、生成された前記抑圧係数を前記混在信号に乗算することによって前記混在信号中の前記第２信号を抑圧する請求項２乃至４のいずれか１項に記載の信号処理装置。
　前記推定第２信号に基づいて抑圧係数を生成する抑圧係数生成手段と、
　前記背景音に応じて前記抑圧係数を補正する抑圧係数補正手段と、
　をさらに備え、
　前記抑圧手段は、前記抑圧係数補正手段により補正された前記抑圧係数を前記混在信号に乗算することによって前記混在信号中の前記第２信号を抑圧する手段である請求項２乃至４のいずれか１項に記載の信号処理装置。
　前記背景音推定手段は、
　前記抑圧手段による抑圧結果が所定条件を満たす場合には前記背景音の推定を行わない請求項１乃至６のいずれか１項に記載の信号処理装置。
　第１信号と第２信号とが混在した混在信号を入力し、
　前記混在信号に含まれる背景音信号を推定し、
　出力結果が推定された前記背景音信号より小さくならないように抑制しつつ前記第２信号の抑圧を行なう信号処理方法。
　第１信号と第２信号とが混在した混在信号を入力する入力ステップと、
　前記混在信号に含まれる背景音信号を推定する背景音推定ステップと、
　出力結果が推定された前記背景音信号より小さくならないように抑制しつつ前記第２信号の抑圧を行なう抑圧ステップと、
　をコンピュータに実行させる信号処理プログラム。