JP6528679B2

JP6528679B2 - 信号処理装置、信号処理方法および信号処理プログラム

Info

Publication number: JP6528679B2
Application number: JP2015504258A
Authority: JP
Inventors: 昭彦杉山; 良次宮原
Original assignee: NEC Corp
Current assignee: NEC Corp
Priority date: 2013-03-05
Filing date: 2014-02-26
Publication date: 2019-06-12
Anticipated expiration: 2034-02-26
Also published as: TW201642252A; TW201642253A; JPWO2014136629A1; TW201503115A; TWI587293B; US20160019914A1; TWI581256B; US9715885B2; TWI585753B; WO2014136629A1

Description

本発明は、信号の変化を検出する技術に関する。

上記技術分野において、特許文献１には、位相成分の時間方向の連続性を評価し、周波数ごとの振幅成分を平滑化する技術が開示されている（段落０１３５〜０１３８）。特許文献２には、位相の時間方向変動量を計測することで、周波数急変を検出する記載がある。特許文献３には、段落００２４に、「パルス性ノイズが重畳されたことに伴った複素平面上におけるＩ、Ｑ信号の複素ベクトルの位相変化を常時監視することによって、強電界環境下でのパルス性ノイズを確実に検出する」と記載されている。この位相変化は、時間軸に沿ったものである。また、特許文献４の段落００３１には、「位相直線化部２５は、直線化により、極座標変換部２４から入力された位相信号θのとびを直して、その結果の位相信号θ'を位相検出部２６へ出力する」と記載がある。また、特許文献４の段落００５１には、位相傾検出手段について記載があり、段落００４０には、「図５には、位相検出部２６の入出力信号（入力信号である位相θ'、出力信号である位相傾ｄθ'）の一例を示してある」と記載されている。特許文献４の段落００３１には、「位相直線化部２５は、直線化により、極座標変換部２４から入力された位相信号θのとびを直して、その結果の位相信号θ'を位相検出部２６へ出力する」と記載がある。特許文献５には、振幅を用いた衝撃音の検出技術が開示されている。

特開2010-237703号公報特開2011-254122号公報特開2007-251908号公報特開2011-199808号公報ＷＯ２００８／１１１４６２

M. Kato, A. Sugiyama, and M. Serizawa, "Noise suppression with high speech quality based on weighted noise estimation and MMSE STSA," IEICE Trans. Fundamentals (Japanese Edition), vol.J87-A, no.7, pp.851-860, July 2004. R. Martin, "Spectral subtraction based on minimum statistics," EUSPICO-94, pp.1182-1185, Sept. 1994 「ディジタル記録媒体のための動画信号および付随する音響信号の1.5 Mbit/s符号化−第3部音響」、日本工業規格 JIS X 4323、99ページ、1996年11月。 A. D. Cheveigne and H. Kawahara, "YIN, a fundamental frequency estimator for speech and music," J. Acoustic Soc. Amer., vol. 111, no. 4, pp.1917-1930 J. L. Flanagan et al., "Speech Coding," IEEE Transactions on Communications, Vol. 27, no. 4, April 1979. A. Subramanya et al., "Automatic removal of typed keystrokes from speech signals," IEEE Signal Processing Letters, Vol. 14, No. 5, pp.363-366, May 2007. J. Murphy et al., "Joint Baysian removal of impulse and background noise," IEEE Proceedings of ICASSP, pp.261-264, May 2011. R. Talmon et al., "Transient noise reduction useing nonlocal diffusion filters," IEEE Transactions on Audio, Speech, and Language Processing, Vol. 19, No. 6, pp.1584-1599, Jun. 2011.

しかしながら、上述の先行技術文献に記載の技術の中で、特許文献１および４は、入力信号の急変を検出する技術ではない。また、特許文献２では、「周波数」の急変を検出しようとするものであり、特許文献３では、ＡＭ信号の位相の時間変化を用いてパルス性ノイズを検出しようとするものである。特許文献５は、振幅のみを用いた衝撃音の検出技術であり、ロバスト性に不足があった。すなわち、これらの文献に記載の技術では、信号の急変を効果的に検出できなかった。

本発明の目的は、上述の課題を解決する技術を提供することにある。

上記目的を達成するため、本発明に係る装置は、
入力信号を、周波数領域における位相成分信号および振幅成分信号に変換する変換手段と、
前記位相成分信号および前記振幅成分信号の特徴量を計算する計算手段と、
前記計算手段によって計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
を備え、
前記計算手段は、前記位相成分信号から、各周波数の位相変化（φn＝θn−θn-1）を求め、該位相変化の差（φn−φn-1）を回転角とする回転ベクトルcos(φn−φn-1)＋ｊsin(φn−φn-1)の大きさを前記特徴量として求める。

上記目的を達成するため、本発明に係る他の装置は、
入力信号を、周波数領域における位相成分信号に変換する変換手段と、
前記入力信号の急増部の位置に基づいて、第１位相傾きを算出する第１算出手段と、
周波数領域における前記位相成分信号の第２位相傾きを算出する第２算出手段と、
前記第１位相傾きと前記第２位相傾きに基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
を備えたことを特徴とする。

上記目的を達成するため、本発明に係るさらに他の装置は、
入力信号を、周波数領域における位相成分信号に変換する変換手段と、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成する生成手段と、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する判定手段と、
を備えたことを特徴とする。

上記目的を達成するため、本発明に係る方法は、
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号の急増部の位置に基づいて、第１位相傾きを算出し、
周波数領域における前記位相成分信号の第２位相傾きを算出し、
前記第１位相傾きと前記第２位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
各ステップを含むことを特徴とする信号処理方法である。

上記目的を達成するため、本発明に係る他の方法は、
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、
各ステップを含むことを特徴とする信号処理方法である。

上記目的を達成するため、本発明に係るプログラムは、
入力信号を、周波数領域における位相成分信号に変換し、前記入力信号の急増部の位置に基づいて、第１位相傾きを算出し、
周波数領域における前記位相成分信号の第２位相傾きを算出し、
前記第１位相傾きと前記第２位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、各ステップをコンピュータに実行させることを特徴とする信号処理プログラムである。

上記目的を達成するため、本発明に係るプログラムは、
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、各ステップをコンピュータに実行させることを特徴とする信号処理プログラムである。

本発明によれば、信号の急変を効果的に検出できる。

本発明の第１実施形態に係る信号処理装置の構成を示すブロック図である。本発明の第２実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第２実施形態に係る変換部の構成を示すブロック図である。本発明の第２実施形態に係る逆変換部の構成を示すブロック図である。本発明の第２実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。本発明の第２実施形態に係る位相制御部の動作を説明する図である。本発明の第２実施形態に係る位相制御部の動作を説明する図である。本発明の第２実施形態に係る位相制御部の動作を説明する図である。本発明の第２実施形態に係る位相制御部の動作を説明する図である。本発明の第２実施形態に係る位相制御部の動作を説明する図である。本発明の第２実施形態に係る位相制御部の動作を説明する図である。本発明の第２実施形態に係る計算部および急変判定部の構成を説明する図である。本発明の第２実施形態に係る計算部の処理を説明する図である。本発明の第２実施形態に係る雑音抑圧装置のハードウェア構成を示すブロック図である。本発明の第２実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。本発明の第３実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第３実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。本発明の第４実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。本発明の第４実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。本発明の第５実施形態にかかる適用例を説明する図である。本発明の第５実施形態にかかる適用例を説明する図である。本発明の第６実施形態に係る信号処理装置の構成を示すブロック図である。本発明の第７実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第７実施形態に係る変換部の構成を示すブロック図である。本発明の第７実施形態に係る逆変換部の構成を示すブロック図である。本発明の第７実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。本発明の第７実施形態に係る算出部および急変判定部の構成を説明する図である。本発明の第７実施形態に係る算出部の処理を説明する図である。本発明の第７実施形態に係る雑音抑圧装置のハードウェア構成を示すブロック図である。本発明の第７実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。本発明の第７実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。本発明の第７実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。本発明の第８実施形態に係る変換部の構成を示すブロック図である。本発明の第９実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１０実施形態にかかる適用例を説明する図である。本発明の第１０実施形態にかかる適用例を説明する図である。本発明の第１１実施形態に係る信号処理装置の構成を示すブロック図である。本発明の第１２実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１３実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１３実施形態に係る相関除去部の構成の一例を示すブロック図である。本発明の第１３実施形態に係る相関除去部の構成の他の例を示すブロック図である。本発明の第１３実施形態に係る変換部の構成を示すブロック図である。本発明の第１３実施形態に係る逆変換部の構成を示すブロック図である。本発明の第１３実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。本発明の第１３実施形態に係る算出部および急変判定部の構成を説明する図である。本発明の第１３実施形態に係る算出部の処理を説明する図である。本発明の第１３実施形態に係る雑音抑圧装置のハードウェア構成を示すブロック図である。本発明の第１３実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。本発明の第１３実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。本発明の第１３実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。本発明の第１４実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１５実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１６実施形態に係る信号処理装置の構成を示すブロック図である。本発明の第１７実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１７実施形態に係る変換部の構成を示すブロック図である。本発明の第１７実施形態に係る逆変換部の構成を示すブロック図である。本発明の第１７実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。本発明の第１７実施形態に係る直線性計算部および急変判定部の構成を説明する図である。本発明の第１７実施形態に係る直線性計算部の処理を説明する図である。本発明の第１７実施形態に係る雑音抑圧装置のハードウェア構成を示すブロック図である。本発明の第１７実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。本発明の第１８実施形態に係る雑音抑圧装置の構成を示すブロック図である。本発明の第１８実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。本発明の第１９実施形態に係る位相制御部および振幅制御部の構成を示すブロック図である。本発明の第１９実施形態に係る雑音抑圧装置の処理の流れを説明するフローチャートである。本発明の第２０実施形態にかかる適用例を説明する図である。本発明の第２０実施形態にかかる適用例を説明する図である。本発明の第２１実施形態にかかる適用例を説明する図である。本発明の第２１実施形態にかかる適用例を説明する図である。

以下に、図面を参照して、本発明の実施の形態について例示的に詳しく説明する。ただし、以下の実施の形態に記載されている構成要素はあくまで例示であり、本発明の技術範囲をそれらのみに限定する趣旨のものではない。なお、以下の説明中における「音声信号」とは、音声その他の音響に従って生ずる直接的の電気的変化であって、音声その他の音響を伝送するためのものをいい、音声に限定されない。

［第１実施形態］
本発明の第１実施形態としての信号処理装置１００について、図１を用いて説明する。信号処理装置１００は、入力信号急変を検出するための装置である。
図１に示すように、信号処理装置１００は、変換部１０１と計算部１０２と信号急変判定部１０３とを含む。変換部１０１は、入力信号１１０を、周波数領域における位相成分信号１２０および振幅成分信号１３０に変換する。計算部１０２は、位相成分信号１２０および振幅成分信号１３０の変化を計算する。信号急変判定部１０３は、計算された変化に基づいて入力信号の急変を判定する。

以上の構成により、周波数領域における位相成分信号と振幅成分信号との変化に応じて、入力信号の急変を効果的に検出することができる。

［第２実施形態］
《全体構成》
本発明の第２実施形態としての雑音抑圧装置について図２乃至図１１を用いて説明する。本実施形態の雑音抑圧装置は、例えばデジタルカメラ、ノートパソコン、携帯電話、キーボード、ゲーム機のコントローラ、携帯電話の押しボタンなどの雑音抑圧に適用できる。すなわち、音声、音楽、環境音などの目的とする信号を、これらに重畳された信号（ノイズまたは妨害信号）に対して強調することができる。ただし、本発明はこれに限定されるものではなく、入力信号からの信号急変検出を要求されるあらゆる信号処理装置に適用可能である。なお、本実施形態では、信号の急変の一例として、衝撃音を検出して抑圧する雑音抑圧装置について説明する。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に抑圧する。簡単に説明すると、衝撃音を含む時間領域信号を周波数領域信号に変換し、周波数空間における位相成分および振幅成分の変化を算出する。そして、それらの変化の組合せに応じて、衝撃音の存在を判定する。

図２は、雑音抑圧装置２００の全体構成を示すブロック図である。入力端子２０６には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子２０６に供給された劣化信号は、変換部２０１においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は周波数ごとに独立して処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル（振幅成分）２３０は雑音抑圧部２０５および計算部２０８へ供給され、位相スペクトル（位相成分）２２０は位相制御部２０２および計算部２０８に供給される。なお、ここでは変換部２０１が雑音抑圧部２０５に劣化信号振幅スペクトル２３０を供給しているが、本発明はこれに限定されるものではなく、振幅スペクトルの二乗に相当するパワースペクトルを雑音抑圧部２０５に供給してもよい。

雑音抑圧部２０５は、変換部２０１から供給される劣化信号振幅スペクトル２３０を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部２０５は、変換部２０１から供給された劣化信号振幅スペクトル２３０と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部２０３に伝達する。さらに雑音抑圧部２０５は、急変判定部２０９から判定結果を入力し、信号の急変の有無またはその程度に応じて、雑音の抑圧の程度を変更する。雑音抑圧部２０５は目的音検出を用いて目的音を保護する一方、信号急変検出時は振幅を推定背景音に置換してもよい。

位相制御部２０２は、変換部２０１から供給された劣化信号位相スペクトル２２０を回転（シフト）させ、強調信号位相スペクトル２４０として逆変換部２０４へ供給する。また、位相の回転量（シフト量）を、振幅制御部２０３へ伝達する。振幅制御部２０３は、位相制御部２０２から位相の回転量（シフト量）を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル２５０を逆変換部２０４へ供給する。逆変換部２０４は、位相制御部２０２から供給された強調信号位相スペクトル２４０と、振幅制御部２０３から供給された補正振幅スペクトル２５０とを合成して逆変換を行い、強調信号として、出力端子２０７に供給する。

計算部２０８は、変換部２０１から供給された位相成分信号２２０と振幅成分信号２３０とを用いて、その周波数領域でのそれぞれの変化を計算する。急変判定部２０９は、計算部２０８が計算した変化に基づいて、信号の急変がどの程度存在するか(存在可能性)を周波数点ごとに判定する。

《変換部の構成》
図３は、変換部２０１の構成を示すブロック図である。図３に示すように、変換部２０１はフレーム分割部３０１、窓がけ処理部(windowing unit)３０２、およびフーリエ変換部３０３を含む。劣化信号サンプルは、フレーム分割部３０１に供給され、Ｋ／２サンプルごとのフレームに分割される。ここで、Ｋは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部３０２に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第ｎフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式（１）で与えられる。

また、連続する２フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の５０％を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式（２）で得られる左辺が、窓がけ処理部３０２の出力となる。

実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部２０１の出力を逆変換部２０４に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w²(t)+w² (t+K/2)=1 となることを意味する。

以後、連続する２フレームの５０％をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば、次式（３）に示すハニング窓を用いることができる。

このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部３０３に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部２０２と計算部２０８に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部２０５と計算部２０８に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。

《逆変換部の構成》
図４は、逆変換部２０４の構成を示すブロック図である。図４に示すように、逆変換部２０４は逆フーリエ変換部４０１、窓がけ処理部４０２およびフレーム合成部４０３を含む。逆フーリエ変換部４０１は、振幅制御部２０３から供給された強調信号振幅スペクトル２５０と位相制御部２０２から供給された強調信号位相スペクトル２４０ (arg Xn(k))とを乗算して、強調信号（以下の式（４）の左辺）を求める。

得られた強調信号に逆フーリエ変換を施し、１フレームがＫサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部４０２に供給され、窓関数w(t)との乗算が行なわれる。第ｎフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式（５）の左辺で与えられる。

また、連続する２フレームの一部を重ね合わせ（オーバラップ）して窓がけしてもよい。フレーム長の５０％をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部４０２の出力となり、フレーム合成部４０３に伝達される。

フレーム合成部４０３は、窓がけ処理部４０２からの隣接する２フレームの出力を、Ｋ／２サンプルずつ取り出して重ね合わせ、以下の式（７）によって、t=0, 1, ..., K-1における出力信号（式（７）の左辺）を得る。得られた強調音声信号２６０は、フレーム合成部４０３から出力端子２０７に伝達される。

なお、図３と図４において変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、ＬＳＩ化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。

また、変換部２０１において得られる周波数成分を複数統合してから、雑音抑圧部２０５で実際の抑圧を行うこともできる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することによって、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。

《雑音抑圧部の構成》
雑音抑圧部２０５は、変換部２０１から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部２０１からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部２０３へ供給する。

また、急変判定部２０９から、急変がどの程度存在するかの情報（信号の急変が存在する確からしさ、存在可能性）を受けて、信号の急変が存在する可能性に応じて、雑音抑圧の程度を変更することもできる。さらに、信号の急変が存在する可能性を周波数成分、周波数帯域（任意の数の連続する周波数成分を統合したもの）、あるいはフレーム単位で判定し、その急変を抑圧すべく、前記周波数成分、周波数帯域、あるいはフレーム単位で異なった信号処理を施すことができる。

雑音の推定には、非特許文献１や非特許文献２に記載の方法など、様々な推定方法が利用できる。

例えば、非特許文献１には、推定雑音スペクトルを、目的音が発生していないフレームの劣化信号振幅スペクトルの平均値とする方法が開示されている。この方法では目的音の発生を検出する必要がある。目的音の発生している区間は、強調信号のパワーで判断することができる。

理想的な動作状態として、強調信号は雑音以外の目的音となっている。また、目的音や雑音のレベルは、隣接フレーム間で大きく変化しない。これらのことから、１フレーム過去の強調信号レベルを雑音区間判定の指標とする。１フレーム過去の強調信号パワーが一定値以下の時には、現フレームを雑音区間と判定する。雑音スペクトルは、雑音区間と判定されたフレームの劣化信号振幅スペクトルを平均化することで推定できる。

また、非特許文献１には、推定雑音スペクトルを、劣化信号振幅スペクトルが供給され始めた推定初期の平均値とする方法も開示されている。この場合、推定が開始された直後には目的音が含まれないという条件を満たす必要がある。条件が満たされる場合、推定初期の劣化信号振幅スペクトルを推定雑音スペクトルとすることができる。

さらに、非特許文献２には、推定雑音スペクトルを、統計的な劣化信号振幅スペクトルの最小値から求める方法が開示されている。この方法では、統計的に一定時間における劣化信号振幅スペクトルの最小値を保持し、その最小値から雑音スペクトルを推定する。劣化信号振幅スペクトルの最小値は、雑音スペクトルのスペクトル形状と似ているため、雑音スペクトル形状の推定値として用いることができる。しかし、最小値では、本来の雑音レベルより小さくなる。そのため、最小値を適切に増幅させたものを推定雑音スペクトルとして用いる。

雑音抑圧部２０５においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部２０１から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部２０１から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。

また、雑音抑圧部２０５は、急変判定部２０９から急変判定結果（信号の急変が存在するか否かの情報）を入力し、信号の急変の有無またはその程度に応じて、雑音抑圧の程度を変更する。例えば、信号急変のあった周波数成分、周波数帯域、あるいはフレーム単位で、その急変を抑圧すべく信号処理を施すことができる。

急変判定部２０９で急変と判定されたときには、劣化信号振幅スペクトルと推定雑音スペクトルのうち小さい方を、強調信号振幅スペクトルとして、振幅制御部２０３へ供給する。すなわち、劣化信号振幅スペクトルが推定雑音スペクトルより小さいときには劣化信号振幅スペクトルをそのまま出力し、それ以外のときには入力信号を推定雑音スペクトルで置き換えて出力することもできる。

さらに、この置き換えに先立って、重要な劣化信号振幅スペクトル成分を検出して、検出された重要な劣化信号振幅スペクトル成分を推定雑音スペクトルによる置き換えの対象から除外することもできる。重要な劣化信号振幅スペクトル成分を検出する際の重要度の指標としては、劣化信号振幅スペクトルの大きさを用いることができる。振幅が大きな成分は目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。

また、重要度の指標として、劣化信号振幅スペクトルのピーク性を用いることもできる。ピーク、すなわち周波数軸に沿って周辺よりも大きな値を有する劣化信号振幅は、目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。特に、顕著なピーク、すなわち周辺の振幅値よりも著しく大きな振幅値はその重要度が高いので、確実に保護することで目的とする信号の音質をさらに高めることができる。

ピークの検出は、例えば、非特許文献３の純音成分検出方法や、非特許文献４に、その方法が開示されている。さらに、検出されたピークを所定の条件に従って評価し、条件を満たさないピークは除外してもよい。例えば、前記推定雑音よりも小さな値をとるピークは、目的とする信号である可能性は低い。すなわち、推定雑音を基準として、それよりも十分に大きいものだけをピークとして残し、それ以外を除外することができる。十分に大きいかどうかは推定雑音の定数倍と比較することで、判定できる。このように、検出されたピークが所定の条件を満たすかどうかを評価してから最終的なピーク成分を選択することによって、誤ったピークの検出を低減し、信号急変部の抑圧効果を高くすることができる。

また、急変存在の確からしさに応じて、振幅制御部２０３へ供給する信号を変化させることもできる。前記置き換えを行った結果と劣化信号振幅スペクトルを、急変存在の確からしさに対応して混合したものを、強調信号振幅スペクトルとして出力する。急変存在の確からしさが高いほど、前記置き換えを行った結果に大きな重みをつけて、前記混合処理を実行する。

雑音抑圧部２０５は、信号の急変の存在可能性に応じて、抑圧度０、抑圧度１、抑圧度２というように多段で抑圧を行なってもよい。あるいは急変判定部の判定結果（例えば０〜１の数値）に応じて無段階に抑圧の程度を変えてもよい。

《位相制御部および振幅制御部の構成》
図５は位相制御部２０２および振幅制御部２０３の構成を示すブロック図である。図５に示すように、位相制御部２０２は位相回転部５０１と回転量生成部５０２とを含み、振幅制御部２０３は、補正量算出部５０３と振幅補正部５０４とを含む。

回転量生成部５０２は、急変判定部２０９から「信号の急変が存在する」と判定された周波数成分について、劣化信号位相スペクトルの回転量を生成し、位相回転部５０１と補正量算出部５０３に供給する。位相回転部５０１では、回転量生成部５０２から回転量が供給されると、変換部２０１から供給された劣化信号位相スペクトル２２０を、供給された回転量だけ回転（シフト）させ、強調信号位相スペクトル２４０として逆変換部２０４へ供給する。

補正量算出部５０３では、回転量生成部５０２から供給される回転量に基づいて、振幅の補正係数を決定し、振幅補正部５０４に供給する。

回転量生成部５０２は、例えば乱数によって回転量を生成する。乱数により、劣化信号位相スペクトルを各周波数で回転させると、劣化信号位相スペクトル２２０の形状が変化する。この形状の変化により、衝撃音などの信号急変部の特徴を弱めることができる。

乱数には、その発生確率が一様な一様乱数や、発生確率が正規分布を示す正規乱数などがあるが、まず、一様乱数による回転量の生成法を説明する。一様乱数は線形合同法などで発生させることができる。例えば、線形合同法で発生させた一様乱数は、０〜（２^Ｍ）−１の範囲に一様に分布する。ここで、Ｍは任意の整数であり、^はべき乗を表している。位相の回転量φは、０〜２πの範囲に分布させる必要がある。そこで、発生させた一様乱数を変換する。変換は、以下の式（８）で行う。ここで、Ｒは一様乱数であり、Ｒmaxはその一様乱数が発生しうる最大の値である。前述した線形合同法で発生させる場合には、Rmax=(2^M)-1となる。

計算の簡単化のために、Ｒの値をそのまま回転量とすることもできる。回転量であるので２πはちょうど一回転を表す。位相を２π回転させた場合は回転させていない場合と同一である。よって、２π＋αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、式（８）により回転量φを求めればよい。急変判定部２０９の判定結果に応じて、いつどのくらい乱数化を行なうのかを決定してもよい。

位相回転部５０１は、回転量生成部５０２から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度に回転量φの値を加算することで回転させることができる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させることができる。

回転量φの正規ベクトルは、式（９）で求められる。ここで、Φは回転ベクトルであり、jはsqrt(-1)を示す。なお、sqrtは二乗根を表している。

補正量算出部５０３による、補正係数算出方法について説明する。まず、位相の回転により出力レベルの低下が生じることを、図６および図７を用いて説明する。図６および図７は、劣化信号が図２に示すブロック図で処理された場合の信号を示している。図６と図７の違いは位相回転の有無である。図６は位相回転を行わない場合の信号を、図７は位相回転をフレーム３から行った場合の信号を示している。

まず、位相を回転しない場合の信号について図６を用いて説明する。図６の最上部に描かれているのは、劣化信号である。劣化信号はフレーム分割部３０１においてフレーム分割される。点線で区切られた、上から２番目の信号が、フレーム分割後の信号である。ここでは、連続した４フレーム分の信号を図示した。また、フレームのオーバラップ率は５０％としている。

フレームに分割された信号は窓掛け処理部３０２によって窓掛けが行われる。点線で区切られた、上から３番目の信号が窓掛け処理後の信号である。図６では位相回転による影響を明確に示すため、矩形窓による重み付けをしている。

次に、フーリエ変換部３０３によって、周波数領域の信号に変換されるが、図６では周波数領域での信号は省略した。位相回転の点線より下部は、逆変換部２０４の逆フーリエ変換部４０１により、時間領域へ変換された信号を図示している。点線で区切られた、上から４番目の信号が位相回転後の信号である。ただし、図６では位相回転を行っていないため、窓掛け処理後の信号から変化していない。

逆変換部２０４の逆フーリエ変換部４０１から出力された強調信号に対して、窓掛け処理を再度実施する。図６では、矩形窓による重み付けを実施した場合を示している。窓掛け処理された信号は、フレーム合成部４０３において合成される。この時、フレーム間の時間を揃える必要がある。フレームのオーバラップ率が５０％であるので、ちょうど半分ずつフレームが重なる。位相の回転を実施していない場合、図６のように入力信号と出力信号は一致する。

一方、位相を回転する場合の信号について図７を用いて説明する。図７に示したのは位相回転をフレーム３から実施した場合の信号である。最上部に描かれているのは、図６と同じ劣化信号である。フレーム分割後および窓掛け処理後の信号も図６と同様である。

図７では、フレーム３から一定の位相回転を実施した場合を描いている。位相回転処理の点線下部に示した右向き三角形の区間に注目する。位相回転処理により、フレーム３および４の信号が時間方向にシフトしている。位相回転を施した信号を再度窓掛け処理し、フレーム合成する。このとき、フレーム２とフレーム３が重なるiiの区間で、フレーム２とフレーム３の信号に違いが生じる。これにより、フレーム合成後の出力信号レベルがiiの区間において小さくなる。つまり、位相の回転を実施する場合、図７のiiの区間で出力信号レベルが低下する。

この位相回転による出力信号レベルの低下は、時間領域における加算を周波数領域の加算に置き換え、周波数領域のベクトル合成でも説明できる。

図８に、フレーム分割および窓掛け処理後の連続した２フレームの劣化信号を、x1[n]およびx2[m]として示す。なお、オーバラップ率は50%としている。ここで、nはx1の離散時間を、mはx2の離散時間を表しており、オーバラップ率が50%の場合には、以下の式（１０）が成立する。

また、x1とx2の関係は、以下の式（１１）のようになる。

まず、時間領域信号から周波数領域信号への変換および逆変換の式を示す。周波数領域信号X[k]は、時間領域信号x[n]のフーリエ変換によって、以下の式（１２）のように表現される。ここで、ｋは離散周波数を表し、Ｌはフレーム長である。

また、周波数領域信号X[k]を逆変換により、時間領域信号x[n]に戻すと、以下の式（１３）のように表現される。

これに基づいて、時間領域信号x1[n],x2[m]を、周波数領域信号X1[k],X2[k] に変換すると、以下の式（１４）、式（１５）のように表現される。

周波数領域信号X1[k],X2[k]を、逆変換によってそれぞれ時間領域信号x1[n],x2[m]に戻すと、式（１３）より、以下の式（１６）、式（１７）のように表現される。

逆変換部は、フーリエ変換により周波数領域信号を時間領域信号に変換する。その後、フレーム合成部により、前フレームと現フレームの強調信号をオーバラップ加算する。例えば、図示した例のオーバラップ率５０％では、離散時間m=L/2〜L-1の区間で隣接フレームの加算が行われる。この加算区間m=L/2〜L-1を考える。

時間領域の加算に、式（１６）および式(１７)を代入すると、以下の式（１８）のように表現される。

さらに、式（１８）中の周波数領域信号X1[k],X2[k]に式（１４），式（１５）を代入すると、以下の式（１９）のように表現される。

さらに、式（１９）を展開すると、以下の式（２０）のように表現される。

ここで、式（２０）の各項に含まれる総和演算を考える。任意の整数gを導入し、以下の式（２１）が成立する。

デルタ関数δ[g]のフーリエ逆変換式は、式（２２）で示される。

ここで、デルタ関数δ[g]は、以下の式（２３）で示される。

式（２２）より、式（２１）は、以下の式（２４）に変形できる。

式（２４）の関係から、式（２０）は、以下の式（２５）で表わされる。

よって、式（２０）は、以下の式（２６）となる。

さて、ここで周波数領域信号X2[k]に対し、位相回転を行った場合を考える。このときの時間領域信号は、図９のようになる。

X2[k]の位相スペクトルを、φ[k]回転させたとき、その逆変換は以下の式（２７）となる。

これを、式（１８）に代入すると、以下の式（２８）が成立する。

これを展開すると、以下の式（２９）が成立する。

ここで、オーバラップ率５０％と仮定し、オーバラップ区間のn=L/2〜L-1について考える。オーバラップ区間では、式（１１）より、以下の式（３０）のように展開できる。

ここで、それぞれの項にある括弧内の

の項は、ベクトル合成であるから、特定の周波数ｋに注目すると、図１０のように描ける。もし、位相回転が行われていないとき、つまりφ[k]=0の場合は、図１１のようになる。

式（３１）の絶対値を求めると、以下の式（３２）となる。

よって、式（３１）の絶対値が最大になる条件は、φ[k]=０の場合であり、その値は２である。つまり、位相回転が行われると、出力信号の大きさが小さくなることがわかる。この出力信号レベルの低下量を補正するように、補正量算出部５０３において強調信号振幅スペクトルの振幅補正量を決定する。

ここでは、位相回転量が一様乱数によって決定されると仮定し、補正量の算出方法を具体的に説明する。ここでは、問題簡単化のため、位相の回転による大きさの変動に着目し、それぞれの周波数成分が単位ベクトルに正規化されているものとする。

まず、位相回転を行わない場合を考える。連続するフレーム間で位相が同じ場合の合成ベクトルは、図１１に示されるＳのようになり、そのベクトルの大きさ|Ｓ|は、以下の式（３３）で表わされる。

一方、一様乱数により位相回転を行う場合、連続するフレーム間位相差φは、-πから+πまでの範囲に一様に分布する。この連続するフレーム間で位相が異なる場合の合成ベクトルは、図１０に示されるベクトルS′のようになる。そのベクトルの大きさ|S′|は、以下の式（３４）で表わされる。

さて、ここで、期待値E(|S′|^2)を求めると、以下の式（３５）のようになる。

ここで、φが-πから+πまで一様分布することから、以下の式（３６）のようになる。

このため、|S'|^2の期待値は、以下の式（３７）で表わされる。

さて、位相の回転をしない場合の、期待値E(|S|^2)は、式（３３）より以下の式（３８）で表わされる。

式（３７）と式（３８）の比を取ると、以下の式（３９）が成立する。

つまり、位相を一様乱数で回転させる場合、出力信号のパワー平均値は入力と比較して、1/2だけ小さくなる。振幅補正部５０４では振幅値に対し補正を行うので、補正量算出部５０３は補正係数をsqrt(2)とし、振幅補正部５０４に伝達する。

以上、一様乱数による回転量生成の場合を例に挙げて説明したが、正規乱数などでもその分散と平均値が決まれば、補正係数を一意に定めることができる。正規乱数を使う場合の補正係数の導出を以下に説明する。

正規乱数の場合φの発生確率が正規分布により決定される。そのため、正規乱数による位相回転を実施した場合のパワー期待値を求めるには、φの発生確率に基づいて、重み付けを行う必要がある。

具体的には、φの発生確率に基づいた、重み関数f(φ)を導入する。その重み関数f(φ)により、cos(φ)を重みづけする。さらに、重み付け関数f(φ)の積分値で正規化することにより、パワー期待値を求めることができる。

正規乱数による位相回転を行った場合の出力パワー期待値Ｅ(S"^2)は、一様乱数の出力パワー期待値である式（３５）に、重み付け関数f(φ)およびその積分値を導入し、以下の式（４０）のように表現できる。

重み関数f(φ)は、正規分布により表現できるので、以下の式（４１）が成立する。

ここで、σは分散をμは平均を表している。

例えば、平均値μ＝０，分散σ＝１の標準正規分布では、以下の式（４２）となるので、となるので、これを式（４０）に代入すると、式（４３）のようになる。

ここで、式（４３）の右辺、第２項を数値計算すると、式（４４）が成立するので、位相の回転をしない場合の、E(|S^2|)との比は、式（４５）で表わされる。

補正量算出部５０３は、位相を標準正規分布の正規乱数で回転させる場合、振幅補正部５０４に補正係数をsqrt(1/0.805)として、伝達する。位相回転はフレーム内の全ての周波数に対して行ってもよいが、信号の急変を検出した一部の周波数に対して行っても構わない。振幅補正は位相回転を行った周波数、つまり信号急変を検出した周波数に対して行う。よって、位相回転を行わない周波数の補正係数は、1.0とする。位相回転を行った周波数の補正係数のみ、上記で導出した値とする。

このように振幅制御部２０３では、位相制御部２０２から伝達された位相の回転量を用いて振幅補正係数を算出し、雑音抑圧部２０５から供給された強調信号振幅スペクトルに乗じ、逆変換部２０４に供給する。これにより、劣化信号位相スペクトルを回転させ、強調信号位相スペクトルを得た場合の出力レベル低下を解消することができる。

なお、算出した振幅補正量が無視できる（補正係数が1.0に近い）とき、補正量算出と振幅補正の演算量を削減したいときなど、必要と認めるときには、振幅補正自体を省略することも可能である。そのときには、位相回転部５０１における位相回転だけを実施する。

また、これまでは乱数を用いて位相を回転する例について説明したが、厳密な意味での乱数を用いない構成でも同様な効果を得ることができる。入力された劣化信号の位相特性に存在する特有のパターンをなくする、あるいは弱くすることが位相回転の目的であるので、その目的を達成することができる数列は何でも位相回転に利用することができる。例えば、フレーム長の半分（振幅およびパワースペクトルが独立な周波数成分の数）より周期が長く、一周期内で相関の小さい数列の利用は有効である。

《計算部および急変判定部の構成》
図１２は、計算部２０８および急変判定部２０９の内部構成について説明するための図である。図１２に示すように、計算部２０８は、周波数方向に位相の変化量を算出する変化量算出部１２０１と、位相の変化量の平坦度を算出する平坦度算出部１２０２と、周波数方向に振幅の平坦度を算出する振幅平坦度算出部１２０３を含んでいる。

変化量算出部１２０１は、位相成分信号２２０（p(k) 、kは周波数）を入力して、隣接する周波数の位相差Δp(k)=p(k)-p(k-1)を位相の変化量１２１０（位相の傾き）として求める。

平坦度算出部１２０２は、変化量算出部１２０１で得られた位相変化量Δp(k)=p(k)-p(k-1)の、周波数軸に沿った平坦度（バラツキ）を調べる。隣接する周波数の位相変化量の差分Δ₂p(k)=Δp(k)-Δp(k-1)を平坦度１２２０とする。位相変化量が平坦であれば差分は０になる。周波数成分ごと、帯域ごと、全周波数のいずれかに対して、一つの平坦度１２２０を求めてもよい。また、単一あるいは複数の帯域における平坦度を統合して、全周波数における平坦度の代わりに用いてもよい。

位相の周波数方向の変化量が、信号の急変が存在するときに平坦になる理由は次の通りである。変換部２０１のフレーム内に孤立パルスが存在すると仮定する。孤立パルスをフーリエ変換したときの周波数方向の位相の傾きは、孤立パルスの位置に対応して一意に求まることが知られている。例えば、変換部におけるフレーム長がＬサンプルで孤立パルス位置がｎ０（０≦ｎ０≦Ｌ―１）であるとき、位相の傾きは−２πｎ０/Ｌとなる。これは、振幅ａの孤立パルスに関して、フーリエ変換によって得られるｋ番目の周波数成分Ｄ（ｋ）が、次式で与えられるためである。Ｄ（ｋ）＝ａ・ｅｘｐ(-jθ（ｋ）)θ（ｋ）＝−２π・ｋ・ｎ０／Ｌ
位相θ（ｋ）は、明らかにｋ、すなわち周波数に比例している。このため、位相の微分に相当する周波数方向変化量Δθ（ｋ）＝−２π・ｎ０／Ｌとなり、これは定数である。すなわち、周波数方向の位相の変化量は、一定値（平坦）となる。

ここで、周波数ごとではなく周波数帯域（サブバンド）またはフレームごとに判定すると、より大局的な判定によって、信号急変成分以外の位相成分による判定誤りを低減することができる。さらに、周波数帯域ごとまたはフレームごとの判定結果を用いて、周波数ごとの判定結果を修正してもよい。例えば、ある周波数帯域の判定結果が「信号急変が存在する」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在する」に設定することで、他の信号成分の妨害による判定誤りを低減することができる。その反対に、ある周波数帯域の判定結果が「信号急変が存在しない」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在しない」に設定することで、他の信号成分の妨害による判定誤りを低減することもできる。あるいは、前記帯域内の各周波数で、判定の容易さ（閾値）を「存在」と判定しやすい方向へ修正して、各周波数独自に判定を行うという構成自体は維持してもよい。周波数ごとまたは周波数帯域ごとに判定結果を求めると、周波数ごとまたは周波数帯域ごとに急変を抑圧することができ、より精度のより精度の高い抑圧を行なうことが可能となる。

さらに、位相の微分値を位相変化量としてさらにその微分値を平坦度１２２０としてもよい。その場合、位相の二次微分値が０に近ければ（所定値以下であれば）平坦と判定できる。帯域ごとあるいは周波数成分ごとに判定すると、よりきめ細かな信号急変の判定処理を行なうことができる。つまり、信号急変を帯域ごとあるいは周波数成分ごとに独立して抑圧することもでき、より精度の高い信号急変の抑圧を行なうことが可能となる。

ここでは変化量算出部１２０１は、隣接周波数間の位相の差分を用いて変化量を算出したが、本発明はこれに限定されるものではない。位相の周波数による微分で直線性（位相変化の平坦度）を判定してもよい。複数の周波数における複数の微分結果のバラツキが小さいほど直線性が高い。局所的な直線性は、局所的な微分結果を用いて評価することができる。特に、隣接する2周波数成分間の微分は差分で近似できるので、その場合は複数の差分のバラツキが小さいほど直線性が高いと判断する。バラツキの指標として、平坦度を用いることができる。

振幅平坦度算出部１２０３は、周波数軸に沿った振幅変化１２２５を算出して、急変判定部２０９に供給する。隣接する周波数間で振幅の変化が小さい周波数が信号急変を表す。振幅変化は、帯域ごと、あるいは全周波数のいずれかに対して、一つの平坦度１２２５を求めてもよい。具体的には、以下の式（４６）のように、平坦度を表わすＦＭ(Flatness Measure)を求める。ｘ（ｎ）は周波数ｎにおける振幅またはパワースペクトル、Ｎは平坦度算出区間に含まれる周波数成分の数である。

ＦＭは０．０から１．０の値をとる。完全に平坦な場合、ＦＭは１．０である。平坦度については、非特許文献３に開示がある。

平坦度はまた、別の指標を用いて表すこともできる。例えば、帯域ごと、あるいは全周波数のいずれかに対してｘ（ｎ）の平均を求め、各周波数成分ｎにおけるｘ（ｎ）とその平均値との差分二乗値総和を帯域ごと、あるいは全周波数の平坦度とすることができる。全周波数の代わりに、単一あるいは複数の周波数帯域において前記差分二乗値総和を一つ求め、これを平坦度とすることもできる。このようにして求めた平坦度は、完全に平坦な場合に０．０、平坦度が低下するに従って大きな値をとる。

別の平坦度の指標として、滑らかさを用いてもよい。滑らかさは、周波数軸に沿った隣接サンプル間の差分絶対値総和で表現することができる。凹凸の多い（滑らかでない）波形で滑らかさは大きな値を、少ない（滑らかな）波形で小さな値をとる。この指標は、全変動量(TV: Total Variation)として知られている。

これまで、平坦度として周波数軸に沿った平坦度を用いてきたが、時間軸に沿った平坦度を利用することもできる。信号急変部では急激に振幅およびパワーが増加するので、この性質を用いると、時間軸に沿った平坦度が低いときに、信号急変が存在すると判定することができる。具体的には、現フレームと直前フレームの振幅またはパワーの差が一定値以上となるときに、平坦度が低い、すなわち信号急変が存在すると判定する。また、数フレーム過去のフレームから現在のフレームまでの複数フレームに対して隣接フレーム間の振幅またはパワーの差を求め、これらを線形または非線形結合した結果を平坦度として定義することもできる。過去のフレームの情報を用いることで、低域成分を含むなまった信号急変部を検出しやすくなり、その抑圧性能が向上する。なお、隣接フレームの振幅またはパワー差を計算する際には、これを周波数成分ごと、帯域ごと、あるいは全周波数のいずれかに対して計算してもよい。さらに、単一または複数の帯域に対して前記振幅またはパワー差を計算することもできる。例えば、単一の帯域、特に高周波域で前記振幅またはパワー差を計算することによって、音声やその他の信号の影響を低減することができ、より正確に信号急変部を検出することが可能となる。

これまで説明した２つの平坦度、すなわち周波数軸に沿った平坦度と時間軸に沿った平坦度は、それぞれを単独で用いることもできるし、両方を組み合わせて用いることもできる。組合せの例としては、２つの平坦度の線形または非線形結合に基づく信号急変部の検出や、それぞれの平坦度に基づいた検出結果の組合せなどがある。周波数方向の平坦度は大きいときに、時間方向の平坦度は小さいときに信号急変の検出と判定するので、組合せの際にどちらかを逆数にしてから組み合わせるなどの工夫が必要となる。

急変判定部２０９は、位相変化量の平坦度と振幅平坦度の２つの指標を用いて、信号の急変を判定する。振幅が周波数軸に沿って平坦である（バラツキが小さい）とき、信号急変部である可能性が高いと考えられるからである。これは、信号急変がパルス性（短時間に振幅が増加して、減少する）であることと、インパルスのフーリエ変換が白色信号（全周波数で振幅およびパワーが等しい）となることから自明である。判定の方法としては例えば以下のいずれかを選択することができる。

（１）位相変化量の平坦度と振幅平坦度が共にそれぞれの条件を満たす場合（例えば位相の二次微分値がＮ＝０．１以下で、振幅平坦度ＦＭがМ＝０．８以上の場合）、信号の急変があると判定
（２）平行度と振幅平坦度を単独で用いたときの判定結果の論理和。信号急変の存在可能性を算出するときは、平行度による存在可能性と振幅平坦度による存在可能性のうち、大きい方（または小さい方）に基づく判定
（３）位相変化量の平坦度と振幅平坦度の両方の平均が条件を満たす場合（例えば位相の二次微分値ＰＸと、振幅平坦度ＦＭと１．０との差分値ＱＸ＝（１．０−ＦＭ）との平均ＡＶ１＝（ＰＸ＋ＱＸ）／２が０．１以下）に、信号の急変があると判定
（４）位相変化量の平坦度と振幅平坦度とに対して重み付けを行ないつつ両方を合わせた複合的な条件を満たす場合（例えば位相の二次微分値ＰＸと、振幅平坦度ＦＭと１．０との差分値ＱＸ＝（１．０−ＦＭ）との重み付け平均ＡＶ２＝（０．８×ＰＸ＋０．２×ＱＸ）が０．１以下）に、信号の急変があると判定
（５）位相変化量の平坦度と振幅平坦度とを、線形または非線形関数を用いて組み合わせ、組み合わせた結果が一定値より大きいときに信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。

（６）位相変化量の平坦度と振幅平坦度との中でいずれか大きい方（理想値に近い方）のみを用いて、その大きい方が条件を満たす場合（例えば位相の二次微分値ＰＸと、振幅平坦度ＦＭと１．０との差分値ＱＸと、いずれか大きい方を閾値とを比較する）信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
（７）事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルが平坦であれば、位相平坦度の重みを小さくする。
（８）事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルの最小値よりも入力された劣化信号の振幅またはパワースペクトルが小さいときは、信号急変を検出するための閾値を一時的に大きく変更して、検出されにくくする。

特定の信号を処理する場合、例えばノイズが小さくてインパルスに近い衝撃音を検出・抑圧する場合、振幅またはパワーに関する情報の方が位相情報よりも信頼できるときがある。例えば、静かな環境でピストルの発砲音を検出する際には、振幅のみを用いて検出してもよい。一方、ノイズの振幅またはパワーが大きく変化する場合、例えば、空港の警備での発砲音の検出の場合、静かな(ノイズが小さい)状況と、ノイズが大きい状況とで、振幅と位相の重み付けを変えることが効果的である。この場合、振幅と位相の重み付けを、ノイズの有無や時間帯に応じて変化させてもよい。例えば、管制塔からフライトスケジュールの最新情報を入手することができれば、飛行機の離着陸時刻が分かるため、飛行機が来るタイミング（ノイズが多いタイミング）では位相の重み付けを大きくして発砲音の検出に用いることができる。発砲音（検出対象の衝撃音）以外の信号が混在するときには、位相情報を用いた衝撃音の検出が振幅を用いた検出よりも効果的だからである。一方、ノイズが小さい状況では、入力された劣化信号の周波数領域ベクトルの絶対値、つまり振幅値を重視して判定する方が効果的に衝撃音を検出できる。もちろんここでも振幅スペクトルの代わりにパワースペクトルの値を用いてもよい。また、信号の種類によって、衝撃音の振幅が平坦でない場合がある。その場合は、位相平坦度の重みを大きくして検出を行なうことにより高精度で信号の急変を検出できる。さらに、衝撃音の振幅またはパワースペクトルに関する情報が事前に得られるときには、得られた情報を用いて振幅が平坦なときと同じ結果が得られるように、振幅平坦度の計算結果を補正することもできる。具体的には、振幅スペクトル２３０を衝撃音の振幅またはパワースペクトル形状の逆数を各周波数成分で乗じた後に、振幅平坦度を算出する。

急変判定部２０９は判定結果１２３０として、信号急変あり（１）または信号急変無し（０）を出力する。ただし、平坦度の絶対値と対応させた、０と１の間の値を判定結果１２３０として出力してもよい。その場合、信号急変が存在する尤もらしさ(存在可能性)を得ることが可能となる。存在可能性は、例えば、次のようにして求めることができる。まず、正の値を閾値として定める。閾値が正の値になるのは、前記位相平坦度と振幅平坦度の双方とも、より大きな正の値が信号急変の存在可能性の高さを表すからである。また、両者の最小値は０である。次に、両指標を組み合わせて得られた値(組み合わせ指標)が閾値を超えるとき、信号急変の存在可能性を１とする。また、組み合わせ指標が０になるとき、存在可能性を０とする。存在可能性の一般値は、組み合わせ指標の関数として定義する。このような関数の最も簡単なものは、直線である。存在可能性として、組み合わせ指標に比例した値が定められる。直線の傾きとｙ切片(前記組み合わせ指標が０のときの関数値)は、前述の組み合わせ指標が０および１に等しいときの境界条件を満足するように定める。関数としては、任意の線形または非線形関数や多項式などを用いてもよい。

図１３は、位相およびその変化量をグラフに示したものである。周波数領域において、周波数軸に沿って、グラフ１３０１のように位相が変化する場合、その位相変化量は、周波数領域において、周波数軸に沿って、グラフ１３０２に示すように変化する。この変化が平坦な周波数１３０３を導き出すことにより、位相の直線性を判別する。

信号の急変部では位相が直線的に変化することが分かっているため、このように位相の直線性を求めてその平坦度を判定することにより、信号の急変の存在またはその程度を判定することが可能となる。そして、衝撃音など信号の急変が存在する周波数成分、周波数帯域または全周波数において、位相スペクトルを回転操作することや振幅スペクトルを抑圧することにより、その急変を抑圧したり、その影響を弱くしたりすることができるため、高品質な強調信号を得ることができる。

図１４は、本実施形態にかかる雑音抑圧装置２００をソフトウェアを用いて実現する場合のハードウェア構成について説明する図である。

雑音抑圧装置２００は、プロセッサ１４１０、ＲＯＭ(Read Only Memory)１４２０、ＲＡＭ(Random Access Memory)１４４０、ストレージ１４５０、入出力インタフェース１４６０、操作部１４６１、入力部１４６２、および出力部１４６３を備えている。雑音抑圧装置２００は、カメラ１４６４を備えていてもよい。プロセッサ１４１０は中央処理部であって、様々なプログラムを実行することにより雑音抑圧装置２００全体を制御する。

ＲＯＭ１４２０は、プロセッサ１４１０が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。ＲＡＭ１４４０は、不図示のプログラムロード領域の他に、入力信号２１０、位相成分信号２２０、振幅成分信号２３０、強調信号２６０、位相変化量１２１０、位相変化平坦度１２２０、振幅平坦度１２２５および急変判定結果１２３０等を記憶する領域を有している。

また、ストレージ１４５０は、雑音抑圧プログラム１４５１を格納している。雑音抑圧プログラム１４５１は、変換モジュール、位相制御モジュール、振幅制御モジュール、逆変換モジュール、雑音抑圧モジュール、位相直線性計算モジュール、振幅平坦度判定モジュール、および急変判定モジュールを含んでいる。雑音抑圧プログラム１４５１に含まれる各モジュールをプロセッサ１４１０が実行することにより、図２の変換部２０１、位相制御部２０２、振幅制御部２０３、逆変換部２０４、雑音抑圧部２０５、計算部２０８、急変判定部２０９の各機能を実現できる。なお、ストレージ１４５０はノイズデータベースを格納してもよい。

プロセッサ１４１０が実行した雑音抑圧プログラム１４５１の出力である強調信号は、入出力インタフェース１４６０を介して出力部１４６３から出力される。これにより、例えば、入力部１４６２から入力した操作部１４６１の操作音などを抑圧することができる。また、入力部１４６２から入力した入力信号に信号急変が含まれたことを検出してカメラ１４６４による撮影を開始するなどといった適用法も可能である。

図１５は、上記雑音抑圧プログラム１４５１による信号急変判定処理の流れを説明するためのフローチャートである。まず、ステップＳ１５０１において、入力部１４６２から信号を入力すると、ステップＳ１５０３に進む。ステップＳ１５０３では、変換部２１０が入力信号を周波数領域に変換して、振幅・位相に分割する。次に、ステップＳ１５０５では、計算部２０８が離散周波数ｋを１に、カウント値Ｉ（ｋ）を０に設定して、順次周波数空間での処理を開始する。ステップＳ１５０７に進むと、計算部２０８が、設定された周波数での位相の変化（微分値または差分値）を算出する。さらにステップＳ１５０９では、計算部２０８が位相変化の変化（微分値または差分値）を算出する。さらにステップＳ１５１０では、計算部２０８が上述した式（４６）を用いて、振幅Ａ（ｋ）の平坦度ＦＭ（ｋ）を算出する。次にステップＳ１５１１では、急変判定部２０９が位相変化の平坦度の絶対値および振幅の平坦度をそれぞれ閾値Ｎ、Мと比較する。具体的には位相変化の変化の絶対値が所定の閾値Ｎを越えず、かつ、振幅の平坦度ＦＭが閾値М以上の場合、ステップＳ１５１３に進んで、その周波数ｋにおいて信号の急変が存在すると判定し、フラグを立てる（Ｉ（ｋ）＝１とする）。一方、位相変化と振幅の変化が条件に合致しなかった場合、ステップＳ１５１４においてＩ（ｋ）＝０とする。以上のステップＳ１５０７〜Ｓ１５１４を、ｋ＝Ｆ（Ｆはフレーム全体の周波数成分数）になるまで繰り返す。最終的には、ステップＳ１５１７において、Ｉ（ｋ）＝１となったｋの周波数で信号急変ありと判定し、判定結果を、雑音抑圧部２０５および位相制御部２０２に供給する。以上のステップＳ１５０１〜Ｓ１５１４の処理は全フレームに対して繰り返し行なわれる。なお、ステップＳ１５１７に変えて、フレーム内でＩ（ｋ）を積算し、Ｉ（ｋ）の積算値が所定の閾値を超えた場合に、急変判定部２０９は信号急変を含むフレームと判定してもよい。また、この際、急変判定結果を次の周波数帯域に積算してもよい。
また、ハングオーバーの作用として、続くフレームにおける閾値Ｎを大きく、またМを小さく設定することができる。このように続くフレームの閾値を設定することによって、信号急変(衝撃音)の検出を容易にし、検出漏れを低減することができる。続くフレームにおける閾値ＮとМの設定は、いずれか一方に対して、または双方を同時に行うことができる。

以上の処理により、信号急変（衝撃音）をより正確に検出することができ、適宜、その信号急変（衝撃音）を適切に抑圧することが可能となる。

［第３実施形態］
次に本発明の第３実施形態に係る雑音抑圧装置について、図１６を用いて説明する。図１６は、本実施形態に係る雑音抑圧装置１６００の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置１６００は、上記第２実施形態と比べると、変換部１６０１が複素信号１６５０を生成し、計算部１６０８および急変判定部１６０９がその複素信号１６５０に基づいて位相直線性の計算および信号急変の判定を行なう点で異なる。その他の構成および動作は、第２実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

図１７は、計算部１６０８および急変判定部２０９の内部構成について説明するための図である。図１７に示すように、計算部１６０８は、周波数方向に位相の変化量を算出する変化量算出部１７０１と、位相の変化量の平坦度を算出する平坦度算出部１２０２を含んでいる。変化量算出部１７０１は、複素信号１６５０（q(k)、kは周波数）を入力して、隣接する周波数の位相差Δp(k)=p(k)-p(k-1)を、位相の変化量１２１０（位相の傾き）として求める。

平坦度算出部１２０２は、変化量算出部１２０１で得られた位相変化量Δp(k)=p(k)-p(k-1)の、周波数軸に沿った平坦度（バラツキ）を調べる。隣接する周波数の位相変化量の差Δ₂p(k)=Δp(k)-Δp(k-1)を平坦度１２２０とする。位相変化量が平坦であれば差分は０になる。周波数成分ごと、帯域ごと、全周波数のいずれかに対して、一つの平坦度１２２０を求めてもよい。また、単一あるいは複数の帯域における平坦度を統合して、全周波数における平坦度の代わりに用いてもよい。

さらに、位相の微分値を位相変化量としてさらにその微分値を平坦度１２２０としてもよい。その場合、位相の二次微分値が０に近ければ（所定値以下であれば）平坦と判定できる。帯域ごとあるいは周波数成分ごとに判定すると、よりきめ細かな信号急変の検出処理を行なうことができる。つまり、信号急変を帯域ごとあるいは周波数成分ごとに独立して抑圧することもでき、より精度の高い抑圧を行なうことが可能となる。

急変判定部２０９は、算出された平坦度の絶対値が一定以下の場合、その平坦度に対応する周波数（一つの周波数成分、周波数帯域、または、全周波数（つまり一つのフレーム））は信号急変を含むと判定する。判定結果１２３０として、信号急変あり（１）または信号急変無し（０）を出力する。ただし、平坦度の絶対値と対応させた、０と１の間の値を判定結果１２３０として出力してもよい。その場合、信号急変が存在する尤もらしさ(可能性)を得ることが可能となる。

以上説明したとおり本実施形態によれば、位相成分信号の代わりに複素信号を用いて位相の直線性を検出することができる。

［第４実施形態］
次に本発明の第４実施形態に係る雑音抑圧装置について、図１８を用いて説明する。本実施形態に係る雑音抑圧装置１８００は、上記第３実施形態と比べると、計算部１６０８に代えて計算部１８０８を有する点で異なる。図１８は、本実施形態に係る雑音抑圧装置に含まれる計算部１８０８の機能構成を説明するための図である。本実施形態に係る計算部１８０８は、上記第３実施形態と比べると、単位ベクトル生成部１８８１と回転ベクトル生成部１８８２と１８８３とを備えている点で異なる。また、急変判定部１８０９が、回転ベクトルに基づいて、信号の急変の有無またはその程度を判定する点でも異なる。その他の構成および動作は、第３実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

単位ベクトル生成部１８８１は、複素信号１６５０を用いて、入力スペクトル（複素ベクトル）を周波数成分ごとに単位ベクトル化する。具体的には、複素信号１６５０の実数部と虚数部をそれぞれ振幅値で除算する。

回転ベクトル変換部１８８２は、単位ベクトル１８１０を、隣接周波数間の回転ベクトル（第１回転ベクトル１８２０）に変換する。ここでの回転ベクトルの回転量（位相）は隣接周波数における単位ベクトル間の位相変化量と同義となる。基準ベクトルの共役A*と回転後のベクトルBとの内積をとる乗算を行ない、以下のように回転ベクトルRotVecを求める。RotVec = A*・B

具体的には、基準ベクトルの実部同士の積と虚部同士の積の和が回転ベクトルの実部、基準ベクトルの実部と虚部の積二つの差が回転ベクトルの虚部とすることで、回転ベクトル１８２０を算出できる。

さらに、回転ベクトル変換部１８８３は、回転ベクトル変換部１８８２によって得られた第１回転ベクトル１８２０の、周波数軸に沿った平坦度（バラツキ）を調べる。周波数軸に沿った位相変化量が一定であると、回転ベクトルのバラツキが小さくなる。そのため、第１回転ベクトル１８２０の変化量を周波数軸に沿って求める。具体的には、第１回転ベクトル１８２０について、隣接周波数間の回転ベクトル（第２回転ベクトル１８３０）を求める。これは第１回転ベクトルを微分したことと同義である。そして、急変判定部１８０９は、第２回転ベクトル１８３０の実部を平坦度として認識する。これは、次の理由による。

第２回転ベクトル１８３０も単位ベクトルなので、その実部は−１から１の値をとる。位相が直線的に変化するほど、第１回転ベクトルの角度変化量が小さい（回転ベクトルのバラツキが小さい）。そして、第１回転ベクトルの変化量が小さい（回転ベクトルのバラツキが小さい）ほど、第２回転ベクトルの角度が小さくなる。第２回転ベクトルの角度が小さいほど、その実部が大きくなる。ここでも、周波数点ごと、帯域ごと、全周波数のいずれかについて、一つの平坦度を求めてもよい。

なお、平坦度の求め方としては、上述したものに限られない。例えば、隣接する周波数成分ごとに前記第１回転ベクトルの差ベクトルを算出した上で、差ベクトルの実部、虚部をそれぞれ二乗して加算することで得られる差ベクトルの大きさを平坦度として用いてもよい。また、第２回転ベクトルの角度を平坦度として用いることもできる。第２回転ベクトルの角度は、隣接する周波数成分の第１回転ベクトルの角度差に相当する。

急変判定部１８０９は、第２回転ベクトル１８３０の実部、および、振幅平坦度ＦＭの２つの指標を用いて、信号の急変を判定する。振幅平坦度の判定への利用に関しては、すでに急変判定部２０９の動作に関して説明した通りである。第２回転ベクトル１８３０の実部に関しては、実部があらかじめ定められた＋１に近い閾値Ｎ（例えば０．７や０．８）を越えているか否か、またはＮと＋１の間のどの位置に存在しているかに応じて、急変の存在またはその程度を判定する。そして、判定結果１８４０として、信号急変あり（１）または信号急変無し（０）を出力する。ただし、平坦度の絶対値と対応させた、０と１の間の値を判定結果１８４０として出力してもよい。その場合、信号急変が存在する尤もらしさ(可能性)を得ることが可能となる。例えば、平坦度を、周波数成分ごとに第１閾値と比較し、第１閾値以下と判定された周波数bin数をカウントして、そのカウント値が第２閾値以上であれば、そのフレームに急変部が存在するものとして、フレームごとに検出してもよい。

なお、ここでも、第２実施形態で説明したのと同様に、位相変化の平坦度と振幅の平坦度とを状況に応じてバランスよく用いて、信号の急変を検出することができる。また、帯域ごとあるいは周波数成分ごとに判定すると、よりきめ細かな信号急変の検出処理を行なうことができる。つまり、信号急変を帯域ごとあるいは周波数成分ごとに独立して抑圧することもでき、より精度の高い抑圧を行なうことが可能となる。

図１９は、本実施形態にかかる雑音抑圧プログラムを実行した場合の信号急変検出処理の流れを説明するためのフローチャートである。まず、ステップＳ１５０１において、入力部１４６２から音声信号を入力すると、ステップＳ１９０３に進む。ステップＳ１９０３では、変換部２１０が入力信号を周波数領域に変換して、周波数成分ごとの複素信号を生成する。次に、ステップＳ１５０５では、離散周波数ｋを１に、カウント値Ｉ（ｋ）を０に設定して、順次周波数空間での処理を開始する。ステップＳ１９０７に進むと、設定された周波数で複素信号を単位ベクトル化する。次に、ステップＳ１９０８では、隣接する周波数成分の単位ベクトルから第１回転ベクトルに変換する。さらにステップＳ１９０９では隣接する周波数成分の第１回転ベクトルから第２回転ベクトルに変換する。さらにステップＳ１５１０では、計算部１２０３が上述した式（４６）を用いて、振幅Ａ（ｋ）の平坦度ＦＭ（ｋ）を算出する。ステップＳ１９１１では、第２回転ベクトルの実部を閾値Ｎと比較し、振幅平坦度を閾値Мと比較する。その結果、実部が閾値Ｎを越え、かつ振幅平坦度が閾値Мを越えた場合、ステップＳ１５１３に進んでＩ（ｋ）＝１とする。一方、実部が所定の閾値Ｎ以下または振幅平坦度が閾値М以下の場合、ステップＳ１５１４においてＩ（ｋ）＝０とする。以上のステップＳ１９０７〜Ｓ１５１４を、ｋ＝Ｆ（Ｆはフレーム全体の周波数成分数）になるまで繰り返す。最終的には、ステップＳ１５１７において、Ｉ（ｋ）＝１となったｋの周波数で信号急変ありと判定し、判定結果を、雑音抑圧部２０５および位相制御部２０２に供給する。

以上説明したとおり本実施形態によれば、複素信号を用いて位相の回転ベクトルの回転ベクトルから直線性を検出し、振幅平坦度と合わせて衝撃音を検出することができる。なお、平坦度の判定で回転ベクトルの実部を使うために単位ベクトル化したが、本発明はこれに限定されるものではない。また、第２回転ベクトルの実部に代えて第２回転ベクトルの角度の大きさを閾値と比較し、角度の大きさが閾値より大きい場合に信号急変ありと判定してもよい。

［第５実施形態］
なお、上記第１乃至第４実施形態では、信号急変部を抑圧することを目的とした雑音抑圧装置に信号急変検出方法を適用した場合について説明したが、本発明はこれに限定されるものではない。衝撃音の検出を目的とした様々な装置、システムおよび状況で利用することができる。さらに検出対象は衝撃音（急激に立ち上がってすぐにたち下がる音声信号）に限定されない。信号が急激に立ち上がって（またはたち下がって）そのままとなる場合であっても、急変部として検出できる。

例えば、現在のオーディオ符号化方式（例えばＭＰＥＧＡＡＣの符号化部）において、いわゆるアタックと呼ばれる信号急変部では、通常とは異なった情報圧縮方式が採用されているが、その際の信号急変部の検出にも適用することができる。信号急変部では、分析窓長を変更して、プリエコーと呼ばれる先行雑音の抑圧を行うので、検出が必要となる。振幅やエントロピーの変化などを用いて検出する方法に比べて精度良く急変を検出し、効果的に情報圧縮を行なうことができる。

また、図２０に示すように、車両２０００にマイク２００１と計算部２０８と急変判定部２０９と映像記録部２００２とを搭載する適用例も考えられる。映像記録部２００２が衝撃音の検出をトリガーにしてカメラによる撮影画像の上書き保存禁止を行なえば、事故状況の記録を残すことができる。その際に、衝撃音検出から一定時間の遅延の後に、上書き保存禁止を行ってもよい。衝撃そのものをトリガーにした場合と異なり、衝撃が小さい場合や、他の車両が事故にあった場合にも事故状況の自動記録を行なえるという利点がある。

また、図２１に示すように、心電計２１００に計算部２０８と急変判定部２０９とアラーム部２１０１とを接続する適用例も考える。心電図の異常心拍の検出をより正確かつ効果的に行なうことができる。特に雑音の多い場合に有効である。同様に、胎児のエコーのモニターにも適用できる。雑音による妨害で正しく心音がとれない場合があるが、そのようなときに本技術は有効である。すなわち、生体信号の急変検出に広く適用できる。

［第６実施形態］
本発明の第６実施形態としての信号処理装置２２００について、図２２を用いて説明する。信号処理装置２２００は、入力信号急変を検出するための装置である。図２２に示すように、信号処理装置２２００は、変換部２２０１と第１算出部２２０２と第２算出部２２０３と信号急変判定部２２０４とを含む。

変換部２２０１は、入力信号２２１０を、周波数領域における位相成分信号２２２０および振幅成分信号２２３０に変換する。第１算出部２２０２は、入力信号２２１０の時間領域における急増部の位置に基づいて、位相の傾き２２５０を算出する。孤立パルスをフーリエ変換したときの周波数方向の位相の傾きは、孤立パルスの位置に対応して一意に求まることが知られている。例えば、変換部におけるフレーム長がＬサンプルで孤立パルス位置がｎ０であるとき、位相の傾きは−２πｎ０/Ｌとなる。急増部を同定するための指標としては、例えば振幅絶対値の最大値を用いることができる。この指標は、実際の信号が孤立パルスに近いとき（ほぼ単峰性形状）には正確な位置を与える。一方、双峰性の形状を有するパルスのときは、振幅最大値は正確な位置を与えない。このような場合は、振幅絶対値の最大値と振幅絶対値の２番目に大きな値を用いた指標が有効である。例えば、両者の位置の中間値や両者の位置の重みづけ平均などを用いることができる。パルスがより時間軸に沿って広がっているときには、パルスのおおよその中心部を利用することで正確な位置を求めることができる。そのような指標には重心がある。第２算出部２２０２は、周波数領域における位相成分信号２２２０の傾き２２６０を算出する。信号急変判定部２２０４は、第１算出部２２０２によって算出された傾きと第２算出部２２０３によって算出された傾きに基づいて入力信号の急変を判定する。

以上の構成により、周波数領域における位相成分信号の傾きと時間領域信号の急増部の位置から求めた位相の傾きとの一致程度を用いて、入力信号の急変を効果的に検出することができる。

［第７実施形態］
《全体構成》
本発明の第７実施形態としての雑音抑圧装置について図２３乃至図３０を用いて説明する。本実施形態の雑音抑圧装置は、例えばデジタルカメラ、ノートパソコン、携帯電話、キーボード、ゲーム機のコントローラ、携帯電話の押しボタンなどの雑音抑圧に適用できる。すなわち、音声、音楽、環境音などの目的とする信号を、これらに重畳された信号（ノイズまたは妨害信号）に対して強調することができる。ただし、本発明はこれに限定されるものではなく、入力信号からの信号急変検出を要求されるあらゆる信号処理装置に適用可能である。なお、本実施形態では、信号の急変の一例として、衝撃音を検出して抑圧する雑音抑圧装置について説明する。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に抑圧する。簡単に説明すると、衝撃音を含む時間領域信号を周波数領域信号に変換し、周波数空間における位相成分の傾きを算出する。また、時間領域信号の急増部を孤立パルスとみなしたときの周波数領域の位相の傾き、すなわち−２πｎ０/Ｎを求める。そして、それら２種類の位相の傾きの一致程度に応じて、衝撃音の存在を判定する。

図２３は、雑音抑圧装置２３００の全体構成を示すブロック図である。入力端子２３０６には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子２３０６に供給された劣化信号は、変換部２３０１においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は周波数ごとに独立して処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル（振幅成分）２３３０は雑音抑圧部２３０５へ供給され、位相スペクトル（位相成分）２３２０は位相制御部２３０２および算出部２３８１に供給される。さらに、変換部２３０１は、フレーム分割後であって高速フーリエ変換などの変換を施す前の時間領域信号２３７０を算出部２３８２に供給する。なお、ここでは変換部２３０１が雑音抑圧部２３０５に劣化信号振幅スペクトル２３３０を供給しているが、本発明はこれに限定されるものではなく、振幅スペクトルの二乗に相当するパワースペクトルを雑音抑圧部２３０５に供給してもよい。

雑音抑圧部２３０５は、変換部２３０１から供給される劣化信号振幅スペクトル２３３０を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部２３０５は、変換部２３０１から供給された劣化信号振幅スペクトル２３３０と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部２３０３に伝達する。さらに雑音抑圧部２３０５は、急変判定部２３０９から判定結果を入力し、信号の急変の有無またはその程度に応じて、雑音の抑圧の程度を変更する。雑音抑圧部２３０５は、所望信号の検出を行って所望信号成分を周波数ごとに保護する一方、信号急変が存在し、所望信号成分が検出されないときには、振幅を推定背景音に置換してもよい。

位相制御部２３０２は、変換部２３０１から供給された劣化信号位相スペクトル２３２０を回転（シフト）させ、強調信号位相スペクトル２３４０として逆変換部２３０４へ供給する。また、位相の回転量（シフト量）を、振幅制御部２３０３へ伝達する。振幅制御部２３０３は、位相制御部２３０２から位相の回転量（シフト量）を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル２３５０を逆変換部２３０４へ供給する。逆変換部２３０４は、位相制御部２３０２から供給された強調信号位相スペクトル２３４０と、振幅制御部２３０３から供給された補正振幅スペクトル２３５０とを合成して逆変換を行い、強調信号として、出力端子２３０７に供給する。

算出部２３８１は、変換部２３０１から供給された位相成分信号２３２０を周波数で微分することにより、各周波数での位相の傾き（変化）を算出する。一方、算出部２３８２は、フレームに分割された劣化信号サンプル２３７０を変換部２３０１から入力して、フレームの信号絶対値を算出し、急増部を示す時間から、周波数領域の位相の傾きを算出する。急変判定部２３０９は、算出部２３８１、２３８２から提供された位相の傾きを比較し、それらの類似度に基づいて、信号の急変がどの程度存在するか（存在可能性）を周波数点ごとに判定する。

ここで、傾きの類似度は、時間領域信号から求めた傾きと周波数領域信号から求めた傾きの差分絶対値を用いることができるが、これに限定されない。これら２つの傾きの比の値と１との距離や、両者の和をどちらかの傾きの２倍で正規化した値と１との距離などを用いてもよい。類似度に基づく存在可能性は、例えば、次のようにして求めることができる。まず、正の値を閾値として定める。差分絶対値がこの閾値よりも大きいとき、存在可能性を０とする。また、差分絶対値が０に等しいとき、存在可能性を１とする。存在可能性の一般値は、差分絶対値の関数として定義する。このような関数の最も簡単なものは、直線である。存在可能性として、差分絶対値に比例した値が定められる。直線の傾きとｙ切片(前記差分絶対値がゼロのときの関数値)は、前述の差分絶対値が０および１に等しいときの境界条件を満足するように定める。関数としては、任意の線形または非線形関数や多項式などを用いてもよい。

《変換部の構成》
図２４は、変換部２３０１の構成を示すブロック図である。図２４に示すように、変換部２３０１はフレーム分割部２４０１、窓がけ処理部(windowing unit)２４０２、およびフーリエ変換部２４０３を含む。劣化信号サンプルは、フレーム分割部３０１に供給され、Ｋ／２サンプルごとのフレームに分割される。ここで、Ｋは偶数とする。フレームに分割された劣化信号サンプル２３７０は、窓がけ処理部２４０２と算出部２３８２に供給され、窓がけ処理部２４０２では窓関数(window function)であるw(t)との乗算が行なわれる。第ｎフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式で与えられる。

また、連続する２フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の５０％を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式で得られる左辺が、窓がけ処理部２４０２の出力となる。

実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部２３０１の出力を逆変換部２３０４に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w²(t)+w² (t+K/2)=1 となることを意味する。

以後、連続する２フレームの５０％をオーバラップして窓がけする場合を例として説明を続ける。w(t)としては、例えば、次式に示すハニング窓を用いることができる。

このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部２４０３に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部２３０２と算出部２３８１に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部２３０５と算出部２３８２に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。

《逆変換部の構成》
図２５は、逆変換部２３０４の構成を示すブロック図である。図２５に示すように、逆変換部２３０４は逆フーリエ変換部２５０１、窓がけ処理部２５０２およびフレーム合成部２５０３を含む。逆フーリエ変換部２５０１は、振幅制御部２３０３から供給された強調信号振幅スペクトル２３５０と位相制御部２３０２から供給された強調信号位相スペクトル２３４０(arg Xn(k))とを乗算して、強調信号（以下の式の左辺）を求める。

得られた強調信号に逆フーリエ変換を施し、１フレームがＫサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部２５０２に供給され、窓関数w(t)との乗算が行なわれる。第ｎフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式の左辺で与えられる。

また、連続する２フレームの一部を重ね合わせ（オーバラップ）して窓がけしてもよい。フレーム長の５０％をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部２５０２の出力となり、フレーム合成部２５０３に伝達される。

フレーム合成部２５０３は、窓がけ処理部２５０２からの隣接する２フレームの出力を、Ｋ／２サンプルずつ取り出して重ね合わせ、以下の式によって、t=0, 1, ..., K-1における出力信号（左辺）を得る。得られた強調信号２３６０は、フレーム合成部２５０３から出力端子２３０７に伝達される。

なお、図２４と図２５において変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、ＬＳＩ化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。

また、変換部２３０１において得られる周波数成分を複数統合してから、雑音抑圧部２３０５で実際の抑圧を行うこともできる。統合後の周波数成分の数は、統合前の周波数成分の数よりも小さくなる。具体的には、周波数成分の統合によって得られる統合周波数成分に対して共通の抑圧度を求め、その抑圧度を同一統合周波数成分に属する個別の周波数成分に対して共通に用いる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することによって、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。

《雑音抑圧部の構成》
図２３に戻ると、雑音抑圧部２３０５は、変換部２３０１から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部２３０１からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部２３０３へ供給する。また、急変判定部２３０９から急変判定結果（信号の急変が存在するか否かの情報）を受けて、急変と判定されたときには、劣化信号振幅スペクトルと推定雑音スペクトルのうち小さい方を、強調信号振幅スペクトルとして、振幅制御部２３０３へ供給する。このとき、雑音抑圧部２３０５は、所望信号の検出を行って所望信号成分を周波数ごとに保護してもよい。

また、急変判定部２３０９から、急変がどの程度存在するかの情報（信号の急変が存在する確からしさ、存在可能性）を受けて、信号の急変が存在する可能性に応じて、雑音抑圧の程度を変更することもできる。さらに、信号の急変が存在する可能性を周波数成分、周波数帯域（任意の数の連続する周波数成分を統合したもの）、あるいはフレーム単位で判定し、その急変を抑圧すべく、周波数成分、周波数帯域、あるいはフレーム単位で異なった信号処理を施すことができる。

例えば、非特許文献１には、推定雑音スペクトルを、所望信号が発生していないフレームの劣化信号振幅スペクトルの平均値とする方法が開示されている。この方法では所望信号の存在を検出する必要がある。所望信号の存在する区間は、強調信号のパワーで判断することができる。

理想的な動作状態として、強調信号は雑音以外の所望信号となっている。また、所望信号や雑音のレベルは、隣接フレーム間で大きく変化しない。これらのことから、１フレーム過去の強調信号レベルを雑音区間判定の指標とする。１フレーム過去の強調信号パワーが一定値以下の時には、現フレームを雑音区間と判定する。雑音スペクトルは、雑音区間と判定されたフレームの劣化信号振幅スペクトルを平均化することで推定できる。

また、非特許文献１には、推定雑音スペクトルを、劣化信号振幅スペクトルが供給され始めた推定初期の平均値とする方法も開示されている。この場合、推定が開始された直後には所望信号が含まれないという条件を満たす必要がある。条件が満たされる場合、推定初期の劣化信号振幅スペクトルを推定雑音スペクトルとすることができる。

雑音抑圧部２３０５においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部２３０１から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部２３０１から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。

また、雑音抑圧部２３０５は、急変判定部２３０９から急変判定結果（信号の急変が存在するか否かの情報）を入力し、信号の急変の有無またはその程度に応じて、雑音抑圧の程度を変更する。例えば、信号急変のあった周波数成分、周波数帯域、あるいはフレーム単位で、その急変を抑圧すべく信号処理を施すことができる。

急変判定部２３０９で急変と判定されたときには、劣化信号振幅スペクトルと推定雑音スペクトルのうち小さい方を、強調信号振幅スペクトルとして、振幅制御部２３０３へ供給する。すなわち、劣化信号振幅スペクトルが推定雑音スペクトルより小さいときには劣化信号振幅スペクトルをそのまま出力し、それ以外のときには入力信号を推定雑音スペクトルで置き換えて出力することもできる。

ピークの検出は、例えば、非特許文献３の純音成分検出方法や、非特許文献４に、その方法が開示されている。さらに、検出されたピークを所定の条件に従って評価し、条件を満たさないピークは除外してもよい。例えば、推定雑音よりも小さな値をとるピークは、目的とする信号である可能性は低い。すなわち、推定雑音を基準として、それよりも十分に大きいものだけをピークとして残し、それ以外を除外することができる。十分に大きいかどうかは推定雑音の定数倍と比較することで、判定できる。このように、検出されたピークが所定の条件を満たすかどうかを評価してから最終的なピーク成分を選択することによって、誤ったピークの検出を低減し、信号急変部の抑圧効果を高くすることができる。

また、急変存在の確からしさに応じて、振幅制御部２３０３へ供給する信号を変化させることもできる。その置き換えを行った結果と劣化信号振幅スペクトルを、急変存在の確からしさに対応して混合したものを、強調信号振幅スペクトルとして出力する。急変存在の確からしさが高いほど、その置き換えを行った結果に大きな重みをつけて、混合処理を実行する。

雑音抑圧部２３０５は、信号の急変の存在可能性に応じて、抑圧度０、抑圧度１、抑圧度２というように多段で抑圧を行なってもよい。あるいは急変判定部の判定結果（例えば０〜１の数値）に応じて無段階に抑圧の程度を変えてもよい。

《位相制御部および振幅制御部の構成》
図２６は位相制御部２３０２および振幅制御部２３０３の構成を示すブロック図である。図２６に示すように、位相制御部２３０２は位相回転部２６０１と回転量生成部２６０２とを含み、振幅制御部２３０３は、補正量算出部２６０３と振幅補正部２６０４とを含む。

回転量生成部２６０２は、急変判定部２３０９から「信号の急変が存在する」と判定された周波数成分について、劣化信号位相スペクトルの回転量を生成し、位相回転部２６０１と補正量算出部２６０３に供給する。位相回転部２６０１では、回転量生成部２６０２から回転量が供給されると、変換部２３０１から供給された劣化信号位相スペクトル２３２０を、供給された回転量だけ回転（シフト）させ、強調信号位相スペクトル２３４０として逆変換部２３０４へ供給する。

補正量算出部２６０３では、回転量生成部２６０２から供給される回転量に基づいて、振幅の補正係数を決定し、振幅補正部２６０４に供給する。

回転量生成部２６０２は、例えば乱数によって回転量を生成する。乱数により、劣化信号位相スペクトルを各周波数で回転させると、劣化信号位相スペクトル２３２０の形状が変化する。この形状の変化により、衝撃音などの信号急変部の特徴を弱めることができる。

乱数には、その発生確率が一様な一様乱数や、発生確率が正規分布を示す正規乱数などがあるが、まず、一様乱数による回転量の生成法を説明する。一様乱数は線形合同法などで発生させることができる。例えば、線形合同法で発生させた一様乱数は、０〜（２^Ｍ）−１の範囲に一様に分布する。ここで、Ｍは任意の整数であり、^はべき乗を表している。位相の回転量φは、０〜２πの範囲に分布させる必要がある。そこで、発生させた一様乱数を変換する。変換は、以下の式で行う。ここで、Ｒは一様乱数であり、Ｒmaxはその一様乱数が発生しうる最大の値である。前述した線形合同法で発生させる場合には、Rmax=(2^M)-1となる。

計算の簡単化のために、Ｒの値をそのまま回転量とすることもできる。回転量であるので２πはちょうど一回転を表す。位相を２π回転させた場合は回転させていない場合と同一である。よって、２π＋αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、上式により回転量φを求めればよい。急変判定部２３０９の判定結果に応じて、いつどのくらい乱数化を行なうのかを決定してもよい。

位相回転部２６０１は、回転量生成部２６０２から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度に回転量φの値を加算することで回転させることができる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させることができる。

回転量φの正規ベクトルは、以下の式で求められる。ここで、Φは回転ベクトルであり、jはsqrt(-1)を示す。なお、sqrtは二乗根を表している。

補正量算出部２６０３による補正係数算出方法は、図５の補正量算出部５０３について説明した方法と同様であるため、ここでは説明を省略する。

《算出部および急変判定部の構成》
図２７は、算出部２３８１、２３８２および急変判定部２３０９の内部構成について説明するための図である。図２７に示すように、算出部２３８２は、急増部検出部２７０１、遅延時間算出部２７０２、位相変換部２７０３および傾き算出部２７０４を備える。一方、算出部２３８１は、傾き算出部２７０５を備える。

急増部検出部２７０１は、フレーム内の信号の絶対値を算出し、その絶対値の最大値２７１０を検出する。遅延時間算出部２７０２は、フレーム内の最大値を示す相対位置（フレーム開始から最大値の存在するタイミングまでの時間）をｎ０として出力する。

次に、位相変換部２７０３は、遅延時間ｎ０２７２０を周波数領域の位相に変換する。具体的には以下の式に基づいて変換する。ここで、Ｌは変換部２３０１のフレーム長、０≦ｎ０≦Ｌ―１である。入力が振幅ａの孤立パルスであることを仮定すると、フーリエ変換によって得られるｋ番目の周波数成分Ｄ（ｋ）は、次式で与えられる。Ｄ（ｋ）＝ａ・ｅｘｐ(-jθ（ｋ）)θ（ｋ）＝−２π・ｋ・ｎ０／Ｌ
傾き算出部２７０４は、このように導き出した位相２７３０を微分して、周波数領域での位相の傾き２７４０を以下のように導き出す。傾き２７４０＝−２π・ｎ０／Ｌ

一方、傾き算出部２７０５は、変換部２３０１から入力した位相成分信号を微分して、周波数領域での位相の傾き２７５０を導き出す。傾き算出部２７０４、２７０５はそれぞれ、位相の周波数による微分によって傾きを算出してもよいし、他の方法で傾きを算出してもよい。

平行度算出部２７０６は、傾き算出部２７０４から提供された傾き２７４０と傾き算出部２７０５から提供された傾き２７５０とを、周波数ごとに比較してその傾きの類似度を算出する。つまり、周波数領域における位相成分信号の、算出部２３８２が算出した直線に対する算出部２３８１が算出した直線の平行度を各周波数で算出する。急変判定部２７０７では、そのような平行度が一定値を越えていれば、信号の急変がその周波数に存在すると判定する。

ここで、周波数ごとではなく周波数帯域（サブバンド）またはフレームごとに判定すると、より大局的な判定によって、信号急変成分以外の位相成分による判定誤りを低減することができる。さらに、周波数帯域ごとまたはフレームごとの判定結果を用いて、周波数ごとの判定結果を修正してもよい。例えば、ある周波数帯域の判定結果が「信号急変が存在する」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在する」に設定することで、他の信号成分の妨害による判定誤りを低減することができる。その反対に、ある周波数帯域の判定結果が「信号急変が存在しない」であるときに、その周波数帯域内の全周波数の判定結果を強制的に「信号急変が存在しない」に設定することで、他の信号成分の妨害による判定誤りを低減することもできる。あるいは、前記帯域内の各周波数で、判定の容易さ（閾値）を「存在」と判定しやすい方向へ修正して、各周波数独自に判定を行うという構成自体は維持してもよい。周波数ごとまたは周波数帯域ごとに判定結果を求めると、周波数ごとまたは周波数帯域ごとに急変を抑圧することができ、より精度の高い信号急変の抑圧を行なうことが可能となる。

急変判定部２３０９は判定結果２７３０として、信号急変あり（１）または信号急変無し（０）を出力する。ただし、急変判定部２７０７が平行度と対応させた、０と１の間の値を急変の存在可能性として出力するときには、判定結果２７３０は急変の存在可能性を表す０と１の間の値となる。その場合、信号急変が含まれている尤もらしさ（急変の存在可能性）を得ることが可能となる。存在可能性は、例えば、次のようにして求めることができる。まず、逆正接関数(arctangent)を用いて、傾き２７４０と傾き２７５０を傾きに対応した角度に変換する。角度の範囲は、-90度から90度とする。これら２角度の差の絶対値が０に近いほど、信号急変の存在可能性が高い。また、２角度の差の絶対値は、180度がその最大値となる。そこで、正の値を閾値として定める。２角度の差が閾値を超えるとき、信号急変の存在可能性を０とする。また、角度の差が０になるとき、存在可能性を１とする。存在可能性の一般値は、角度の差の関数として定義する。このような関数の最も簡単なものは、直線である。存在可能性として、２角度の差に比例した値が定められる。直線の傾きとｙ切片（２角度の差が０のときの関数値）は、角度の差が０および１に等しいときの境界条件を満足するように定める。関数としては、任意の線形または非線形関数や多項式などを用いてもよい。

図２８は、位相およびその変化量をグラフに示したものである。周波数領域において、周波数軸に沿って、グラフ２８０１のように位相が変化する場合、その位相変化量は、周波数領域において、周波数軸に沿って、グラフ２８０２に示すように変化する。

一方、急増部のフレーム内相対位置から、周波数領域で直線２８０３として示される位相を算出できる。

本実施形態では、位相成分信号２８０１と直線２８０３とが平行になる部分がどの程度あるかに応じて、信号急変の存在を判定する。

位相の傾きを縦軸にとり、周波数を横軸にとると、直線２８０３の傾きに近似する範囲は、範囲２８４０で示される。したがって、範囲２８４０とグラフ２８０２との重なる部分が所定の閾値よりも大きい場合に、急変判定部２３０９は、信号の急変が存在すると判定する。

図２９は、本実施形態にかかる雑音抑圧装置２３００をソフトウェアを用いて実現する場合のハードウェア構成について説明する図である。

雑音抑圧装置２３００は、プロセッサ２９１０、ＲＯＭ(Read Only Memory)２９２０、ＲＡＭ(Random Access Memory)２９４０、ストレージ２９５０、入出力インタフェース２９６０、操作部２９６１、入力部２９６２、および出力部２９６３を備えている。雑音抑圧装置２３００は、カメラ２９６４を備えていてもよい。プロセッサ２９１０は中央処理部であって、様々なプログラムを実行することにより雑音抑圧装置２３００全体を制御する。

ＲＯＭ２９２０は、プロセッサ２９１０が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。ＲＡＭ２９４０は、不図示のプログラムロード領域の他に、入力信号２３１０、位相成分信号２３２０、振幅成分信号２３３０、強調信号２３６０を記憶する領域を有している。さらに、ＲＡＭ２９４０は、振幅最大値タイミング２７１０、遅延時間２７２０、位相信号２７３０および位相の傾き２７４０、２７５０等を記憶する領域を有している。

また、ストレージ２９５０は、雑音抑圧プログラム２９５１を格納している。雑音抑圧プログラム２９５１は、変換モジュール、位相制御モジュール、振幅制御モジュール、逆変換モジュール、雑音抑圧モジュール、位相傾き算出モジュール、および急変判定モジュールを含んでいる。雑音抑圧プログラム２９５１に含まれる各モジュールをプロセッサ２９１０が実行することにより、図２３の変換部２３０１、位相制御部２３０２、振幅制御部２３０３、逆変換部２３０４、雑音抑圧部２３０５、算出部２３８１、２３８２、急変判定部２３０９の各機能を実現できる。なお、ストレージ２９５０はノイズデータベースを格納してもよい。

プロセッサ２９１０が実行した雑音抑圧プログラム２９５１に関する出力である強調信号は、入出力インタフェース２９６０を介して出力部２９６３から出力される。これにより、例えば、入力部２９６２から入力した操作部１４６１の操作音などを抑圧することができる。また、入力部２９６２から入力した入力信号に信号急変が含まれたことを検出してカメラ２９６４による撮影を開始するなどといった適用法も可能である。

図３０Ａは、上記雑音抑圧プログラム２９５１による信号急変判定処理の流れを説明するためのフローチャートである。ステップＳ３００１では、算出部２３８２において、時間領域での振幅最大値からの位相の傾き算出処理を開始させる。ステップＳ３００２では、算出部２３８１において、周波数領域での位相の傾き算出処理を開始させる。

次にステップＳ３００５において、ステップＳ３００１とステップＳ３００３の両方で傾きを算出するまで待機し、両方のやり方で傾きが算出できれば、ステップＳ３００７に進み、算出した傾きを周波数ごとに比較する。ステップＳ３００９において、傾きの差分絶対値が所定の閾値Ｎ以下か否かを判定し、Ｎ以下であれば、ステップＳ３０１１に進み、その周波数ｋについて、フラグを立てる（Ｉ（ｋ）＝１とする）。一方、Ｎ以下でない場合、ステップＳ３０１４においてＩ（ｋ）＝０とする。ステップＳ３０１５ではｋ＝Ｆ（Ｆはフレーム全体の周波数成分数）を判定し、ｋ＝Ｆでなければ、ステップＳ３０１７に進み、ｋ＝ｋ＋１としてステップＳ３００７に戻り、フレーム全体にわたって周波数ごとに傾き比較を行なう。最終的には、ステップＳ３０１９において、Ｉ（ｋ）＝１となったｋの周波数で信号の急変ありと判定し、判定結果を、雑音抑圧部２３０５および位相制御部２３０２に供給する。なお、ステップＳ３０１９に変えて、フレーム内でＩ（ｋ）を積算し、Ｉ（ｋ）の積算値が所定の閾値を超えた場合に、急変判定部２３０９は信号の急変を含むフレームと判定してもよい。また、この際、急変判定結果を次の周波数帯域にハングオーバして積算してもよい。

また、ハングオーバの作用として、続くフレームにおける閾値Ｎを大きく設定することができる。このように続くフレームの閾値を設定することによって、信号急変（例えば衝撃音）の検出を容易にし、検出漏れを低減することができる。

図３０Ｂは、算出部２３８２が行なう傾き算出処理の流れを説明するためのフローチャートである。まず、ステップＳ３０２１で信号を入力すると、ステップＳ３０２３に進んでフレーム分割部２４０１がフレーム分割を行なう。次にステップＳ３０２５では、急増部検出部２７０１が、低相関信号の急増部を検出する。ステップＳ３０２７では、遅延時間算出部２７０２が急増部のフレーム内相対位置（フレーム開始から急増部の存在するタイミングまでの時間）をｎ０として出力する。

次に、ステップＳ３０２９において位相変換部２７０３は、遅延時間ｎ０２７２０を周波数領域の位相に変換する。ステップＳ３０３１において、傾き算出部２７０４は、導き出した位相を微分して、周波数領域での位相の傾きを導き出し、ステップＳ３０３３でバッファリングする。

図３０Ｃは、算出部２３８１が行なう傾き算出処理の流れを説明するためのフローチャートである。ステップＳ３０５１で信号を入力するとステップＳ３０５３に進み、フレーム分割、窓処理を経てフーリエ変換により、周波数領域での位相成分信号を抽出する。次にステップＳ３０５５で、周波数のステップｋを１に設定すると、ステップＳ３０５７では、位相Ｐ（ｋ）を微分して傾きΔＰ（ｋ）を算出し、ステップＳ３０５９において、その傾きをバッファリングする。ステップＳ３０６１では、ｋ＝Ｆ（Ｆはフレーム全体の周波数成分数）を判定し、ｋ＝Ｆでなければ、ステップＳ３０６３に進み、ｋ＝ｋ＋１としてステップＳ３０５７に戻り、フレーム全体にわたって周波数ごとに傾き算出を行なう。

以上の処理により、信号の急変をより正確に検出することができ、適宜、その急変部を適切に抑圧することが可能となる。なお、本実施形態では位相の傾きを微分値で求めたが、単位ベクトルの回転量など別の指標を求めて、判定に用いてもよい。

［第８実施形態］
次に本発明の第８実施形態に係る雑音抑圧装置について、図３１を用いて説明する。図３１は、本実施形態に係る雑音抑圧装置の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置は、上記第７実施形態と比べると、変換部３１０１において、窓がけ処理部２４０２における窓がけ処理後の信号を、算出部２３８２に出力する点で異なる。その他の構成および動作は、第７実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

本実施形態によれば、窓がけ後の時間領域信号、すなわちフーリエ変換に用いる信号と同じ信号から求めた傾きを用いて平行度を求めることができる。これにより、周波数領域信号を用いて求めた位相の傾きとの整合性が高くなり、より正確な信号の急変判定を行うことができる。
［第９実施形態］
次に本発明の第９実施形態に係る雑音抑圧装置３２００について、図３２を用いて説明する。図３２は、本実施形態に係る雑音抑圧装置３２００の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置３２００は、上記第７実施形態と比べると、振幅平坦度算出部３２０１を追加的に備えている点で異なる。その他の構成および動作は、第２実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

振幅平坦度算出部３２０１は、周波数軸に沿った振幅変化を算出して、急変判定部３２０９に供給する。隣接する周波数間で振幅の変化が小さい周波数が信号急変を表す。振幅変化は、帯域ごと、あるいは全周波数のいずれかに対して、一つの平坦度を求めてもよい。具体的には、以下の式のように、平坦度を表わすＦＭ(Flatness Measure)を求める。ｘ（ｎ）は周波数ｎにおける振幅またはパワースペクトル、Ｎは平坦度算出区間に含まれる周波数成分の数である。

振幅平坦度算出部３２０３の本質的な機能は、振幅の情報を用いて、信号急変の存在可能性を求めることであるから、その他の方法で代替してもよい。振幅情報を用いて信号急変を検出する技術は、非特許文献６、非特許文献７、非特許文献８などに開示されている。

急変判定部３２０９は、傾きの類似度（平行度）と振幅平坦度の２つの指標を用いて、信号の急変を判定する。振幅が周波数軸に沿って平坦である（バラツキが小さい）とき、信号急変部である可能性が高いと考えられるからである。これは、信号急変がパルス性（短時間に振幅が増加して、減少する）であることと、インパルスのフーリエ変換が白色信号（全周波数で振幅およびパワーが等しい）となることから自明である。判定の方法としては例えば以下のいずれかを選択することができる。

（１）平行度と振幅平坦度が共にそれぞれの条件を満たす場合（例えば傾きの差分値がＮ＝０．１以下で、振幅平坦度ＦＭがМ＝０．８以上の場合）、信号の急変があると判定
（1.5）平行度と振幅平坦度を単独で用いたときの判定結果の論理和。信号急変の存在可能性を算出するときは、平行度による存在可能性と振幅平坦度による存在可能性のうち、大きい方（または小さい方）に基づく判定
（２）平行度と振幅平坦度の両方の平均が条件を満たす場合（例えば傾きの差分値ＰＸと、振幅平坦度ＦＭと１．０との差分値ＱＸ＝（１．０−ＦＭ）との平均ＡＶ１＝（ＰＸ＋ＱＸ）／２が０．１以下）に、信号の急変があると判定
（３）傾きの差分値と振幅平坦度とに対して重み付けを行ないつつ両方を合わせた複合的な条件を満たす場合（例えば傾きの差分値ＰＸと、振幅平坦度ＦＭと１．０との差分値ＱＸ＝（１．０−ＦＭ）との重み付け平均ＡＶ２＝（０．８×ＰＸ＋０．２×ＱＸ）が０．１以下）に、信号の急変があると判定
（４）傾きの差分値と振幅平坦度とを、線形または非線形関数を用いて組み合わせ、組み合わせた結果が一定値より大きいときに信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。

（５）傾きの差分値と振幅平坦度との中でいずれか理想値により近い方（差分値は小さい方、平坦度は大きい方）のみを用いて、その理想値により近い方が条件を満たす場合に信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
（６）事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルが平坦であれば、傾きの差分値の重みを小さくする。
（７）事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルの最小値よりも入力された劣化信号の振幅またはパワースペクトルが小さいときは、信号急変を検出するための閾値を一時的に大きく変更して、検出されにくくする。

特定の信号を処理する場合、例えばノイズが小さくてインパルスに近い衝撃音を検出・抑圧する場合、振幅またはパワーに関する情報の方が位相情報よりも信頼できるときがある。例えば、静かな環境でピストルの発砲音を検出する際には、振幅のみを用いて検出してもよい。一方、ノイズの振幅またはパワーが大きく変化する場合、例えば、空港の警備での発砲音の検出の場合、静かな(ノイズが小さい)状況と、ノイズが大きい状況とで、振幅と位相の重み付けを変えることが効果的である。この場合、振幅と位相の重み付けを、ノイズの有無や時間帯に応じて変化させてもよい。例えば、管制塔からフライトスケジュールの最新情報を入手することができれば、飛行機の離着陸時刻が分かるため、飛行機が来るタイミング（ノイズが多いタイミング）では位相の重み付けを大きくして発砲音の検出に用いることができる。発砲音（検出対象の衝撃音）以外の信号が混在するときには、位相情報を用いた衝撃音の検出が振幅を用いた検出よりも効果的だからである。

一方、ノイズが小さい状況では、入力された劣化信号の周波数領域ベクトルの絶対値、つまり振幅値を重視して判定する方が効果的に衝撃音を検出できる。もちろんここでも振幅スペクトルの代わりにパワースペクトルの値を用いてもよい。また、信号の種類によって、衝撃音の振幅が平坦でない場合がある。その場合は、位相平坦度の重みを大きくして検出を行なうことにより高精度で信号の急変を検出できる。さらに、衝撃音の振幅またはパワースペクトルに関する情報が事前に得られるときには、得られた情報を用いて振幅が平坦なときと同じ結果が得られるように、振幅平坦度の計算結果を補正することもできる。具体的には、振幅スペクトル２３３０を衝撃音の振幅またはパワースペクトル形状の逆数を各周波数成分で乗じた後に、振幅平坦度を算出する。

以上説明したとおり本実施形態によれば、振幅平坦度を併せて用いて信号急変部を検出することができる。これにより、信号急変（衝撃音）をより正確に検出することができ、適宜、その信号急変（衝撃音）を適切に抑圧することが可能となる。

［第１０実施形態］
なお、上記第６乃至第９実施形態では、信号急変部を抑圧することを目的とした雑音抑圧装置に信号急変検出方法を適用した場合について説明したが、本発明はこれに限定されるものではない。衝撃音（急激に立ち上がってすぐにたち下がる信号）の検出を目的とした様々な装置、システムおよび状況で利用することができる。また、信号が急激に立ち上がって（またはたち下がって）そのままとなる場合であっても、急変部として検出できる。

また、図３３に示すように車両３３００にマイク３３０１と算出部２３８１、２３８２と急変判定部２３０９と映像記録部３３０２とを搭載する適用例も考えられる。映像記録部３３０２が衝撃音の検出をトリガーにしてカメラによる撮影画像の上書き保存禁止を行なえば、事故状況の記録を残すことができる。その際に、衝撃音検出から一定時間の遅延の後に、上書き保存禁止を行ってもよい。衝撃そのものをトリガーにした場合と異なり、衝撃が小さい場合や、他の車両が事故にあった場合にも事故状況の自動記録を行なえるという利点がある。

また、図３４に示すように、心電計３４００に算出部２３８１、２３８２と急変判定部２３０９とアラーム部３４０１とを接続する適用例も考える。心電図の異常心拍の検出をより正確かつ効果的に行なうことができる。特に雑音の多い場合に有効である。同様に、胎児のエコーのモニターにも適用できる。雑音による妨害で正しく心音がとれない場合があるが、そのようなときにも本技術は有効である。すなわち生体信号の急変検出に広く適用できる。

［第１１実施形態］
本発明の第１１実施形態としての信号処理装置３５００について、図３５を用いて説明する。信号処理装置３５００は、入力信号急変を検出するための装置である。図３５に示すように、信号処理装置３５００は、変換部３５０１と相関除去部３５０２と信号急変検出部３５０４とを含む。

変換部３５０１は、入力信号３５１０を、周波数領域における位相成分信号３５２０および振幅成分信号３５３０に変換する。

相関除去部３５０２は、入力信号３５１０に含まれる、時間相関のある成分を除去して、入力信号３５１０よりも時間相関の小さい低相関信号３５５０を生成する。

信号の急変を構成する成分は、過去の信号に基づいて予測することができず、時間相関が小さい。一方、相関除去部３５０２では、信号の急変成分以外の時間相関が大きい成分を除去して、信号の急変成分を強調する。

相関除去は、通常、相関成分の予測と予測信号の入力信号からの減算による出力計算の２つの処理から構成される。予測は、過去の信号サンプルの線形結合で表すことができ、線形結合の重み係数、すなわち予測フィルタの係数は、レビンゾン−ダービン法、共分散法、最小二乗法などが知られている。このようにして求めた予測フィルタ係数は、予測誤差を最小化するものとなっている。

信号急変判定部３５０４は、低相関信号３５５０と位相成分信号３５２０とに基づいて、入力信号３５１０に含まれる急変を判定する。

以上の構成により、信号の急変成分に対応した低相関信号と位相成分信号とを用いるため、入力信号の急変を効果的に検出することができる。

［第１２実施形態］
本発明の第１２実施形態としての信号処理装置３６００について、図３６を用いて説明する。信号処理装置３６００は、入力信号急変を検出するための装置である。図３６に示すように、信号処理装置３６００は、変換部３６０１と相関除去部３６０２と第１算出部３６０３と第２算出部３６０５と信号急変判定部３６０９とを含む。

変換部３６０１は、入力信号３６１０を、周波数領域における位相成分信号３６２０および振幅成分信号３６３０に変換する。相関除去部３６０２は、入力信号３６１０に含まれる、時間相関のある成分を除去して、入力信号３６１０よりも時間相関の小さい低相関信号３６４０を生成し、第１算出部３６０３に供給する。第１算出部３６０３は、低相関信号３６４０の時間領域における急増部の位置に基づいて、位相の傾き３６５０を算出する。孤立パルスをフーリエ変換したときの周波数方向の位相の傾きは、孤立パルスの位置に対応して一意に求まることが知られている。例えば、変換部におけるフレーム長がＮサンプルで孤立パルス位置がｎ０であるとき、位相の傾きは−２πｎ０/Ｎとなる。急増部を同定するための指標としては、例えば振幅絶対値の最大値を用いることができる。この指標は、実際の信号が孤立パルスに近いとき（ほぼ単峰性形状）には正確な位置を与える。一方、双峰性の形状を有するパルスのときは、振幅最大値は正確な位置を与えない。このような場合は、振幅絶対値の最大値と振幅絶対値の２番目に大きな値を用いた指標が有効である。例えば、両者の位置の中間値や両者の位置の重みづけ平均などを用いることができる。パルスがより時間軸に沿って広がっているときには、パルスのおおよその中心部を利用することで正確な位置を求めることができる。そのような指標には重心がある。第２算出部３６０５は、周波数領域における位相成分信号３６２０の傾き３６６０を算出する。信号急変判定部３６０９は、第１算出部３６０３によって算出された傾きと第２算出部３６０５によって算出された傾きに基づいて入力信号の急変を判定する。

以上の構成により、周波数領域における位相成分信号の傾きと信号の急変成分に対応した低相関信号の急増部から求めた位相の傾きとの一致程度を用いて、入力信号の急変を効果的に検出することができる。

［第１３実施形態］
《全体構成》
本発明の第１３実施形態としての雑音抑圧装置について図３７Ａ乃至図４５を用いて説明する。本実施形態の雑音抑圧装置は、例えばデジタルカメラ、ノートパソコン、携帯電話、キーボード、ゲーム機のコントローラ、携帯電話の押しボタンなどの雑音抑圧に適用できる。すなわち、音声、音楽、環境音などの目的とする信号を、これらに重畳された信号（ノイズまたは妨害信号）に対して強調することができる。ただし、本発明はこれに限定されるものではなく、入力信号からの信号急変検出を要求されるあらゆる信号処理装置に適用可能である。なお、本実施形態では、信号の急変の一例として、衝撃音を検出して抑圧する雑音抑圧装置について説明する。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に抑圧する。簡単に説明すると、衝撃音を含む時間領域信号を周波数領域信号に変換し、周波数空間における位相成分の傾きを算出する。また、時間領域信号の相関を除去して得られる低相関信号の急増部を孤立パルスとみなしたときの周波数領域の位相の傾き、すなわち−２πｎ０/Ｎを求める。ｎ０は急増部の位置である。そして、それら２種類の位相の傾きの一致程度に応じて、衝撃音の存在を判定する。

図３７Ａは、雑音抑圧装置３７００の全体構成を示すブロック図である。入力端子３７０６には、劣化信号(所望信号と雑音の混在する信号)が、サンプル値系列として供給される。入力端子３７０６に供給された劣化信号は、変換部３７０１においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は周波数ごとに独立して処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル（振幅成分）３７３０は雑音抑圧部３７０５へ供給され、位相スペクトル（位相成分）３７２０は位相制御部３７０２および算出部３７８１に供給される。さらに、入力端子３７０６に供給された劣化信号は、相関除去部３７１２で相関成分を除去されて低相関信号３７７０となり、算出部３７８２に供給される。なお、ここでは変換部３７０１が雑音抑圧部３７０５に劣化信号振幅スペクトル３７３０を供給しているが、本発明はこれに限定されるものではなく、振幅スペクトルの二乗に相当するパワースペクトルを雑音抑圧部３７０５に供給してもよい。

雑音抑圧部３７０５は、変換部３７０１から供給される劣化信号振幅スペクトル３７３０を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部３０５は、変換部３７０１から供給された劣化信号振幅スペクトル３７３０と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部３７０３に伝達する。さらに雑音抑圧部３７０５は、急変判定部３７０９から判定結果を入力し、信号の急変の有無またはその程度に応じて、雑音の抑圧の程度を変更する。雑音抑圧部３７０５は目的音検出を用いて保護をする一方、衝撃音検出時は振幅を推定背景音に置換する。

位相制御部３７０２は、変換部３７０１から供給された劣化信号位相スペクトル３７２０を回転（シフト）させ、強調信号位相スペクトル３７４０として逆変換部３７０４へ供給する。また、位相の回転量（シフト量）を、振幅制御部３７０３へ伝達する。振幅制御部３７０３は、位相制御部３７０２から位相の回転量（シフト量）を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル３７５０を逆変換部３７０４へ供給する。逆変換部３７０４は、位相制御部３７０２から供給された強調信号位相スペクトル３７４０と、振幅制御部３７０３から供給された補正振幅スペクトル３７５０とを合成して逆変換を行い、強調信号として、出力端子３７０７に供給する。

算出部３７８１は、変換部３７０１から供給された位相成分信号３７２０を周波数で微分することにより、各周波数での位相の変化（傾き）を算出する。一方、算出部３７８２は、フレームに分割された低相関信号３７７０を入力して信号絶対値を算出し、信号絶対値の急増部を示す位置に基づいて、周波数領域の位相の傾きを算出する。

急変判定部３７０９は、算出部３７８１、３７８２から提供された位相の傾きを比較し、それらの類似度に基づいて、信号の急変がどの程度存在するか（存在可能性）を周波数点ごとに判定する。具体的には、算出部３７８１、３７８２から、位相成分信号に対応する回転ベクトルを入力し、それら２つの回転ベクトル同士の回転ベクトルを算出して、その絶対値が０に近い場合（あらかじめ定められた閾値０．１以下の場合）に、信号の急変が存在したと判定する。

傾きの類似度は、時間領域信号から求めた傾きと周波数領域信号から求めた傾きの差分絶対値を用いることができるが、これに限定されない。２つの傾きの比の値と１との距離や、両者の和をどちらかの傾きの２倍で正規化した値と１との距離などを用いてもよい。類似度に基づく存在可能性は、例えば、次のようにして求めることができる。まず、正の値を閾値として定める。差分絶対値がこの閾値よりも大きいとき、存在可能性を０とする。また、差分絶対値が０に等しいとき、存在可能性を１とする。存在可能性の一般値は、差分絶対値の関数として定義する。このような関数の最も簡単なものは、直線である。存在可能性として、差分絶対値に比例した値が定められる。直線の傾きとｙ切片(前記差分絶対値がゼロのときの関数値)は、前述の差分絶対値が０および１に等しいときの境界条件を満足するように定める。関数としては、任意の線形または非線形関数や多項式などを用いてもよい。

《相関除去部の構成》
図３７Ｂ、図３７Ｃは、相関除去部３７１２の構成を示すブロック図である。図３７Ｂに示すように、相関除去部３７１２は予測部３７８３、減算器３７８４、フレーム分割部３７８５を含む。劣化信号サンプル３７１０は予測部３７８３に供給され、予測部３７８３は相関のある信号３７８６を予測して減算器３７８４に供給する。予測の方法としては、適応フィルタを用いた線形予測やレビンソン・ダービン法などが知られている。減算器３７８４は、予測部３７８３から供給された予測信号３７８６を劣化信号３７１０から減算して、その差を低相関信号３７８７としてフレーム分割部３７８５に供給する。フレーム分割部３７８５は、低相関信号３７８７に対してフレーム分割を施し、フレーム化された低相関信号３７７０として出力する。

図３７Ｃは、図３７Ｂとは異なり、まずフレーム分割を行ってから、予測を行うこともできる。フレーム分割の後で予測を行う構成を示す。図３７Ｃは、フレーム分割部３７９５、予測部３７９３、減算器３７９４を含む。フレーム分割部３７９５は、劣化信号３７１０に対してフレーム分割を施し、分割された信号サンプル３７９６を予測部３７９３と減算器３７９４に供給する。予測部３７９３は、フレーム化された劣化信号３７９６に含まれる相関のある信号を予測して、減算器３７９４に供給する。減算器３７９４は、予測部３７９３から供給された予測信号３７９７をフレーム化された劣化信号３７９６から減算して、その差をフレーム化された低相関信号３７７０として出力する。

《変換部の構成》
図３８Ａは、変換部３７０１の構成を示すブロック図である。図３８Ａに示すように、変換部３７０１はフレーム分割部３８０１、窓がけ処理部(windowing unit)３８０２、およびフーリエ変換部３８０２を含む。劣化信号サンプルは、フレーム分割部３８０１に供給され、Ｋ／２サンプルごとのフレームに分割される。ここで、Ｋは偶数とする。フレームに分割された劣化信号サンプル３８０４は、窓がけ処理部３８０２に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第ｎフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式で与えられる。

また、連続する２フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の５０％を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式で得られる左辺が、窓がけ処理部３８０２の出力となる。

実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部３７０１の出力を逆変換部３７０４に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w² (t)+w² (t+K/2)=1 となることを意味する。

このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部３８０３に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部３７０２と算出部３７８１に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部３７０５に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。

《逆変換部の構成》
図３８Ｂは、逆変換部３７０４の構成を示すブロック図である。図３８Ｂに示すように、逆変換部３７０４は逆フーリエ変換部３８１１、窓がけ処理部３８１２およびフレーム合成部３８１３を含む。逆フーリエ変換部３８１１は、振幅制御部３７０３から供給された強調信号振幅スペクトル３７５０と位相制御部３７０２から供給された強調信号位相スペクトル３７４０ arg Xn(k)とを乗算して、強調信号（以下の式の左辺）を求める。

得られた強調信号に逆フーリエ変換を施し、１フレームがＫサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部３８１２に供給され、窓関数w(t)との乗算が行なわれる。第ｎフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式の左辺で与えられる。

また、連続する２フレームの一部を重ね合わせ（オーバラップ）して窓がけしてもよい。フレーム長の５０％をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部３８１２の出力となり、フレーム合成部３８１３に伝達される。

フレーム合成部３８１３は、窓がけ処理部３８１２からの隣接する２フレームの出力を、Ｋ／２サンプルずつ取り出して重ね合わせ、以下の式によって、t=0, 1, ..., K-1における出力信号（式の左辺）を得る。得られた強調信号３７６０は、フレーム合成部３８１３から出力端子３７０７に伝達される。

なお、図３８Ａと図３８Ｂにおいて変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、ＬＳＩ化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。

また、変換部３７０１において得られる周波数成分を複数統合してから、雑音抑圧部３７０５で実際の抑圧を行うこともできる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することによって、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。

《雑音抑圧部の構成》
雑音抑圧部３７０５は、変換部３７０１から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部３７０１からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部３７０３へ供給する。

また、急変判定部３７０９から急変がどの程度存在するかの情報（信号の急変が存在する確からしさ、存在可能性）を受けて、信号の急変が存在する可能性に応じて、雑音抑圧の程度を変更することもできる。さらに、信号の急変が存在する可能性を周波数成分、周波数帯域（任意の数の連続する周波数成分を統合したもの）、あるいはフレーム単位で判定し、その急変を抑圧すべく、前記周波数成分、周波数帯域、あるいはフレーム単位で異なった信号処理を施すことができる。

雑音抑圧部３７０５においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部３７０１から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部３７０１から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。

また、雑音抑圧部３７０５は、急変判定部３７０９から急変判定結果（信号の急変が存在するか否かの情報）を入力し、信号の急変の有無またはその程度に応じて、雑音抑圧の程度を変更する。例えば、信号急変のあった周波数成分、周波数帯域、あるいはフレーム単位で、その急変を抑圧すべく信号処理を施すことができる。

急変判定部３７０９で急変と判定されたときには、劣化信号振幅スペクトルと推定雑音スペクトルのうち小さい方を、強調信号振幅スペクトルとして、振幅制御部３７０３へ供給する。すなわち、劣化信号振幅スペクトルが推定雑音スペクトルより小さいときには劣化信号振幅スペクトルをそのまま出力し、それ以外のときには入力信号を推定雑音スペクトルで置き換えて出力することもできる。

また、急変存在の確からしさに応じて、振幅制御部３７０３へ供給する信号を変化させることもできる。その置き換えを行った結果と劣化信号振幅スペクトルを、急変存在の確からしさに対応して混合したものを、強調信号振幅スペクトルとして出力する。急変存在の確からしさが高いほど、置き換えを行った結果に大きな重みをつけて、混合処理を実行する。

つまり、雑音抑圧部３７０５は、信号の急変の存在可能性に応じて、抑圧度０、抑圧度１、抑圧度２というように多段で抑圧を行なってもよい。あるいは急変判定部の判定結果（例えば０〜１の数値）に応じて無段階に抑圧の程度を変えてもよい。

《位相制御部および振幅制御部の構成》
図３９は位相制御部３７０２および振幅制御部３７０３の構成を示すブロック図である。図３９に示すように、位相制御部３７０２は位相回転部３９０１と回転量生成部３９０２とを含み、振幅制御部３７０３は、補正量算出部３９０３と振幅補正部３９０４とを含む。

回転量生成部３９０２は、急変判定部３７０９から「信号の急変が存在する」と判定された周波数成分について、劣化信号位相スペクトルの回転量を生成し、位相回転部３９０１と補正量算出部３９０３に供給する。位相回転部３９０１では、回転量生成部３９０２から回転量が供給されると、変換部３７０１から供給された劣化信号位相スペクトル３７２０を、供給された回転量だけ回転（シフト）させ、強調信号位相スペクトル３７４０として逆変換部３７０４へ供給する。

補正量算出部３９０３では、回転量生成部３９０２から供給される回転量に基づいて、振幅の補正係数を決定し、振幅補正部３９０４に供給する。

回転量生成部３９０２は、例えば乱数によって回転量を生成する。乱数により、劣化信号位相スペクトルを各周波数で回転させると、劣化信号位相スペクトル３７２０の形状が変化する。この形状の変化により、衝撃音などの信号急変部の特徴を弱めることができる。

計算の簡単化のために、Ｒの値をそのまま回転量とすることもできる。回転量であるので２πはちょうど一回転を表す。位相を２π回転させた場合は回転させていない場合と同一である。よって、２π＋αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、上式により回転量φを求めればよい。急変判定部３７０９の判定結果に応じて、いつどのくらい乱数化を行なうのかを決定してもよい。

位相回転部３９０１は、回転量生成部３９０２から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度に回転量φの値を加算することで回転させることができる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させることができる。

補正量算出部３９０３による、補正係数算出方法は、図５の補正量算出部５０３について説明した方法と同様であるため、ここでは説明を省略する。

《算出部および急変判定部の構成》
図４０は、算出部３７８１、３７８２および急変判定部３７０９の内部構成について説明するための図である。図４０に示すように、算出部３７８２は、急増部検出部４００１、遅延時間算出部４００２、位相変換部４００３および傾き算出部４００４を備える。一方、算出部３７８１は、傾き算出部４００５を備える。

急増部検出部４００１は、フレーム内の信号の絶対値を算出し、その絶対値の最大値４０１０を検出する。遅延時間算出部４００２は、フレーム内の最大値を示す相対位置（フレーム開始から最大値の存在するタイミングまでの時間）をｎ０として出力する。

次に、位相変換部４００３は、遅延時間τ４０２０を周波数領域の位相に変換する。具体的には以下の式に基づいて変換する。ここで、Lは変換部３７０１のフレーム長、０≦ｎ０≦Ｌ―１である。入力が振幅ａの孤立パルスであることを仮定すると、フーリエ変換によって得られるｋ番目の周波数成分Ｄ（ｋ）は、次式で与えられる。
Ｄ（ｋ）＝ａ・ｅｘｐ(- jθ（ｋ）)θ（ｋ）＝−２π・ｋ・ｎ０／Ｌ
傾き算出部４００４は、このように導き出した位相４０３０を微分して、周波数領域での位相の傾き４０４０を以下のように導き出す。傾き４０４０＝−２π・ｎ０／Ｌ

一方、傾き算出部４００５は、変換部３７０１から入力した位相成分信号を微分して、周波数領域での位相の傾き４０５０を導き出す。傾き算出部４００４、４００５はそれぞれ、位相の周波数による微分によって傾きを算出してもよいし、他の方法で傾きを算出してもよい。

平行度算出部４００６は、傾き算出部４００４から提供された傾き４０４０と傾き算出部４００５から提供された傾き４０５０とを、周波数ごとに比較してその傾きの類似度を算出する。つまり、周波数領域における位相成分信号の、算出部３７８２が算出した直線に対する算出部３７８１が算出した直線の平行度を各周波数で算出する。急変判定部４００７では、そのような平行度が一定値を越えていれば、信号の急変がその周波数に存在すると判定する。

急変判定部３７０９は判定結果４０３０として、信号急変あり（１）または信号急変無し（０）を出力する。ただし、急変判定部４００７が平行度と対応させた、０と１の間の値を急変の存在可能性として出力するときには、判定結果４０３０は急変の存在可能性を表す０と１の間の値となる。その場合、信号急変が含まれている尤もらしさを得ることが可能となる。

図４１は、位相およびその変化量をグラフに示したものである。周波数領域において、周波数軸に沿って、グラフ４１０１のように位相が変化する場合、その位相変化量は、周波数領域において、周波数軸に沿って、グラフ４１０２に示すように変化する。

一方、急増部のフレーム内相対位置から、周波数領域で直線４１０３として示される位相を算出できる。

本実施形態では、位相成分信号４１０１と直線４１０３とが平行になる部分がどの程度あるかに応じて、信号急変の存在を判定する。

位相の傾きを縦軸にとり、周波数を横軸にとると、直線４１０３の傾きに近似する範囲は、範囲４１０４で示される。したがって、範囲４１０４とグラフ４１０２との重なる部分４１０５が所定の閾値よりも大きい場合に、急変判定部４００７は、信号急変が存在すると判定する。

図４２は、本実施形態にかかる雑音抑圧装置３７００をソフトウェアを用いて実現する場合のハードウェア構成について説明する図である。

雑音抑圧装置３７００は、プロセッサ４２１０、ＲＯＭ(Read Only Memory)４２２０、ＲＡＭ(Random Access Memory)４２４０、ストレージ４２５０、入出力インタフェース４２６０、操作部４２６１、入力部４２６２、および出力部４２６３を備えている。雑音抑圧装置３７００は、カメラ４２６４を備えていてもよい。プロセッサ４２１０は中央処理部であって、様々なプログラムを実行することにより雑音抑圧装置３７００全体を制御する。

ＲＯＭ４２２０は、プロセッサ４２１０が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。ＲＡＭ４２４０は、不図示のプログラムロード領域の他に、入力信号３１０、位相成分信号３２０、振幅成分信号３３０、強調信号３６０を記憶する領域を有している。さらに、ＲＡＭ４２４０は、振幅最大値タイミング４０１０、遅延時間４０２０、位相信号４０３０および位相の傾き４０４０、４０５０等を記憶する領域を有している。

また、ストレージ４２５０は、雑音抑圧プログラム４２５１を格納している。雑音抑圧プログラム４２５１は、変換モジュール、位相制御モジュール、振幅制御モジュール、逆変換モジュール、雑音抑圧モジュール、位相傾き算出モジュール、および急変判定モジュールを含んでいる。雑音抑圧プログラム４２５１に含まれる各モジュールをプロセッサ４２１０が実行することにより、図３Ａの変換部３０１、位相制御部３０２、振幅制御部３０３、逆変換部３０４、雑音抑圧部３０５、算出部３８１、３８２、急変判定部３０９の各機能を実現できる。なお、ストレージ４２５０はノイズデータベースを格納してもよい。

プロセッサ４２１０が実行した雑音抑圧プログラム４２５１に関する出力である強調信号は、入出力インタフェース４２６０を介して出力部４２６３から出力される。これにより、例えば、入力部４２６２から入力した操作部４２６１の操作音などを抑圧することができる。また、入力部４２６２から入力した入力信号に信号急変が含まれたことを検出してカメラ４２６４による撮影を開始するなどといった適用法も可能である。

図４３Ａは、上記雑音抑圧プログラム４２５１による信号急変判定処理の流れを説明するためのフローチャートである。ステップＳ４３０１では、相関除去部３１２、および算出部３８２において、低相関信号の急増部に対応した位相の傾き算出処理を開始させる。ステップＳ４３０３では、算出部３８１において、周波数領域での位相の傾き算出処理を開始させる。

次にステップＳ４３０５において、ステップＳ４３０１とステップＳ４３０３の両方で傾きを算出するまで待機し、両方のやり方で傾きが算出できれば、ステップＳ４３０７に進み、算出した傾きを周波数ごとに比較する。ステップＳ４３０９において、傾きの差分絶対値が所定の閾値Ｎ以下か否かを判定し、Ｎ以下であれば、ステップＳ４３１１に進み、その周波数ｋについて、フラグを立てる（Ｉ（ｋ）＝１とする）。一方、Ｎ以下でない場合、ステップＳ４３１３においてＩ（ｋ）＝０とする。ステップＳ４３１５ではｋ＝Ｆ（Ｆはフレーム全体の周波数成分数）を判定し、ｋ＝Ｆでなければ、ステップＳ４３１７に進み、ｋ＝ｋ＋１としてステップＳ４３０７に戻り、フレーム全体にわたって周波数ごとに傾き比較を行なう。最終的には、ステップＳ４３１９において、Ｉ（ｋ）＝１となったｋの周波数で信号の急変ありと判定し、判定結果を、雑音抑圧部３７０５および位相制御部３０２に供給する。なお、ステップＳ４３１９に変えて、フレーム内でＩ（ｋ）を積算し、Ｉ（ｋ）の積算値が所定の閾値を超えた場合に、急変判定部３７０９は信号の急変を含むフレームと判定してもよい。また、この際、急変判定結果を次の周波数帯域にハングオーバして積算してもよい。

また、ハングオーバーの作用として、続くフレームにおける閾値Ｎを大きく、設定することができる。このように続くフレームの閾値を設定することによって、信号急変（衝撃音）の検出を容易にし、検出漏れを低減することができる。

図４３Ｂは、相関除去部３７１２、および算出部３７８２が行なう傾き算出処理の流れを説明するためのフローチャートである。まず、ステップＳ４３２１で信号を入力すると、ステップＳ４３２２に進んで、相関除去部３７１２が、入力信号３１０に含まれている時間相関のある成分を予測してこれを取り除き、低相関信号を生成した後にフレーム分割を行なう。ステップＳ４３２５では、急増部検出部４００１が、低相関信号の急増部を検出する。ステップＳ４３２７では、遅延時間算出部４００２が急増部のフレーム内相対位置（フレーム開始から急増部の存在するタイミングまでの時間）をｎ０として出力する。

次に、ステップＳ４３２９において位相変換部４００３は、遅延時間ｎ０４０２０を周波数領域の位相に変換する。ステップＳ４３３１において、傾き算出部４００４は、導き出した位相を微分して、周波数領域での位相の傾きを導き出し、ステップＳ４３３３でバッファリングする。

図４３Ｃは、算出部３７８１が行なう傾き算出処理の流れを説明するためのフローチャートである。ステップＳ４３５１で信号を入力するとステップＳ４３５３に進み、フレーム分割、窓処理を経てフーリエ変換により、周波数領域での位相成分信号を抽出する。次にステップＳ４３５５で、周波数のステップｋを１に設定すると、ステップＳ４３５７では、位相Ｐ（ｋ）を微分して傾きΔＰ（ｋ）を算出し、ステップＳ４３５９において、その傾きをバッファリングする。ステップＳ４３６１では、ｋ＝Ｆ（Ｆはフレーム全体の周波数成分数）を判定し、ｋ＝Ｆでなければ、ステップＳ４３６３に進み、ｋ＝ｋ＋１としてステップＳ４３５７に戻り、フレーム全体にわたって周波数ごとに傾き算出を行なう。

以上の処理により、相関を除去した低相関信号を用いて信号急変部での位相の傾きを推定して比較するので、入力信号に時間相関のある成分が含まれている状況において、信号の急変の検出精度を大幅に向上させることができる。例えば、音楽が大音量で鳴っている状況で、信号の急変がある場合、本実施形態の方法によれば、その検出精度を大幅に向上させることができる。結果的に、信号の急変をより正確に検出することができ、適宜、その信号急変を適切に抑圧することが可能となる。なお、本実施形態では位相の傾きを微分値で求めたが、単位ベクトルの回転量など別の指標を求めて、判定に用いてもよい。

［第１４実施形態］
次に本発明の第１４実施形態に係る雑音抑圧装置について、図４４を用いて説明する。図４４は、本実施形態に係る雑音抑圧装置４４００の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置４４００は、上記第１３実施形態と比べると、相関除去部３７１２と算出部３７８２との間に窓かけ部４４８６を設けた点が異なる。その他の構成および動作は、第１３実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

以上説明したとおり本実施形態によれば、窓がけ後の時間領域信号、すなわちフーリエ変換に用いる信号と同じ信号から求めた傾きを用いて平行度を求めることができる。これにより、周波数領域信号を用いて求めた位相の傾きとの整合性が高くなり、より正確な信号の急変判定を行うことができる。

［第１５実施形態］
次に本発明の第１５実施形態に係る雑音抑圧装置４５００について、図４５を用いて説明する。図４５は、本実施形態に係る雑音抑圧装置４５００の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置４５００は、上記第１３実施形態と比べると、振幅平坦度算出部４５０１を追加的に備えている点で異なる。その他の構成および動作は、第１３実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

振幅平坦度算出部４５０１は、周波数軸に沿った振幅変化を算出して、急変判定部４５０９に供給する。隣接する周波数間で振幅の変化が小さい周波数が信号急変を表す。振幅変化は、帯域ごと、あるいは全周波数のいずれかに対して、一つの平坦度を求めてもよい。具体的には、以下の式のように、平坦度を表わすＦＭ(Flatness Measure)を求める。ｘ（ｎ）は周波数ｎにおける振幅またはパワースペクトル、Ｎは平坦度算出区間に含まれる周波数成分の数である。

急変判定部４５０９は、傾きの類似度（平行度）と振幅平坦度の２つの指標を用いて、信号の急変を判定する。振幅が周波数軸に沿って平坦である（バラツキが小さい）とき、信号急変部である可能性が高いと考えられるからである。これは、信号急変がパルス性（短時間に振幅が増加して、減少する）であることと、インパルスのフーリエ変換が白色信号（全周波数で振幅およびパワーが等しい）となることから自明である。判定の方法としては例えば以下のいずれかを選択することができる。

（１）平行度と振幅平坦度が共にそれぞれの条件を満たす場合（例えば傾きの差分値がＮ＝０．１以下で、振幅平坦度ＦＭがМ＝０．８以上の場合）、信号の急変があると判定。
（２）平行度と振幅平坦度を単独で用いたときの判定結果の論理和。信号急変の存在可能性を算出するときは、平行度による存在可能性と振幅平坦度による存在可能性のうち、大きい方（または小さい方）に基づく判定。
（３）平行度と振幅平坦度の両方の平均が条件を満たす場合（例えば傾きの差分値ＰＸと、振幅平坦度ＦＭと１．０との差分値ＱＸ＝（１．０−ＦＭ）との平均ＡＶ１＝（ＰＸ＋ＱＸ）／２が０．１以下）に、信号の急変があると判定。
（４）傾きの差分値と振幅平坦度とに対して重み付けを行ないつつ両方を合わせた複合的な条件を満たす場合（例えば傾きの差分値ＰＸと、振幅平坦度ＦＭと１．０との差分値ＱＸ＝（１．０−ＦＭ）との重み付け平均ＡＶ２＝（０．８×ＰＸ＋０．２×ＱＸ）が０．１以下）に、信号の急変があると判定。
（５）傾きの差分値と振幅平坦度とを、線形または非線形関数を用いて組み合わせ、組み合わせた結果が一定値より大きいときに信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
（６）傾きの差分値と振幅平坦度との中でいずれか理想値により近い方（差分値は小さい方、平坦度は大きい方）のみを用いて、その理想値により近い方が条件を満たす場合に信号の急変があると判定。時間方向の振幅平坦度が含まれるときには、その逆数を代わりに用いる。
（７）事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルが平坦であれば、傾きの差分値の重みを小さくする。
（８）事前に検出しようとする急変信号の振幅またはパワースペクトルに関する情報が得られて、振幅またはパワースペクトルの最小値よりも入力された劣化信号の振幅またはパワースペクトルが小さいときは、信号急変を検出するための閾値を一時的に大きく変更して、検出されにくくする。

特定の信号を処理する場合、例えばノイズが小さくてインパルスに近い衝撃音を検出・抑圧する場合、振幅またはパワーに関する情報の方が位相情報よりも信頼できるときがある。例えば、静かな環境でピストルの発砲音を検出する際には、振幅のみを用いて検出してもよい。一方、ノイズの振幅またはパワーが大きく変化する場合、例えば、空港の警備での発砲音の検出の場合、静かな（ノイズが小さい）状況と、ノイズが大きい状況とで、振幅と位相の重み付けを変えることが効果的である。この場合、振幅と位相の重み付けを、ノイズの有無や時間帯に応じて変化させてもよい。例えば、管制塔からフライトスケジュールの最新情報を入手することができれば、飛行機の離着陸時刻が分かるため、飛行機が来るタイミング（ノイズが多いタイミング）では位相の重み付けを大きくして発砲音の検出に用いることができる。発砲音（検出対象の衝撃音）以外の信号が混在するときには、位相情報を用いた衝撃音の検出が振幅を用いた検出よりも効果的だからである。一方、ノイズが小さい状況では、入力された劣化信号の周波数領域ベクトルの絶対値、つまり振幅値を重視して判定する方が効果的に衝撃音を検出できる。もちろんここでも振幅スペクトルの代わりにパワースペクトルの値を用いてもよい。また、信号の種類によって、衝撃音の振幅が平坦でない場合がある。その場合は、位相平坦度の重みを大きくして検出を行なうことにより高精度で信号の急変を検出できる。さらに、衝撃音の振幅またはパワースペクトルに関する情報が事前に得られるときには、得られた情報を用いて振幅が平坦なときと同じ結果が得られるように、振幅平坦度の計算結果を補正することもできる。具体的には、振幅スペクトル３７３０を衝撃音の振幅またはパワースペクトル形状の逆数を各周波数成分で乗じた後に、振幅平坦度を算出する。

［第１６実施形態］
本発明の第１６実施形態としての信号処理装置４６００について、図４６を用いて説明する。信号処理装置４６００は、入力信号急変を検出するための装置である。

図４６に示すように、信号処理装置４６００は、変換部４６０１と直線性計算部４６０２と信号急変判定部４６０４とを含む。変換部４６０１は、入力信号４６１０を、周波数領域における位相成分信号４６２０および振幅成分信号４６３０に変換する。直線性計算部４６０２は、位相成分信号４６２０の直線性４６４０を計算する。また、信号急変判定部４６０４は、直線性計算部４６０２によって計算された直線性４６４０に基づいて入力信号急変の存在可能性（推定された存在確率）を計算する。

以上の構成により、周波数領域における位相成分信号がどの程度直線的であるかに応じて、入力信号の急変を精度良く検出することができる。

［第１７実施形態］
《全体構成》
本発明の第１７実施形態としての雑音抑圧装置について図４７乃至図５４を用いて説明する。本実施形態の雑音抑圧装置は、例えばデジタルカメラ、ノートパソコン、携帯電話、キーボード、ゲーム機のコントローラ、携帯電話の押しボタンなどの雑音抑圧に適用できる。すなわち、音声、音楽、環境音などの目的とする信号（所望信号）を、これらに重畳された信号（ノイズまたは妨害信号）に対して強調することができる。ただし、本発明はこれに限定されるものではなく、入力信号からの信号急変判定を要求されるあらゆる信号処理装置に適用可能である。なお、本実施形態では、信号の急変の一例として、衝撃音を検出して抑圧する雑音抑圧装置について説明する。本実施形態としての雑音抑圧装置は、例えば、マイクの近くでボタン押下などの操作がなされるような形態において、かかるボタン操作により発生する衝撃音を適切に抑圧する。簡単に説明すると、衝撃音を含む時間領域信号を周波数領域信号に変換し、周波数空間に対する位相成分の直線性を計算する。そして、直線性の高さ（傾きのバラツキ）に応じて、衝撃音の存在可能性（推定された存在確率）を計算する。

図４７は、雑音抑圧装置４７００の全体構成を示すブロック図である。入力端子４７０６には、劣化信号（所望信号と雑音の混在する信号）が、サンプル値系列として供給される。入力端子４７０６に供給された劣化信号は、変換部４７０１においてフーリエ変換などの変換を施されて複数の周波数成分に分割される。複数の周波数成分は周波数ごとに独立して処理される。ここでは、特定の周波数成分に注目して説明を続ける。周波数成分のうち振幅スペクトル（振幅成分）４７３０は雑音抑圧部４７０５へ供給され、位相スペクトル（位相成分）４７２０は位相制御部４７０２および直線性計算部４７０８に供給される。なお、ここでは変換部４７０１が雑音抑圧部４７０５に劣化信号振幅スペクトル４７３０を供給しているが、本発明はこれに限定されるものではなく、その二乗に相当するパワースペクトルを雑音抑圧部４７０５に供給してもよい。

雑音抑圧部４７０５は、変換部４７０１から供給される劣化信号振幅スペクトル４７３０を用いて、雑音を推定し、推定雑音スペクトルを生成する。また、雑音抑圧部４７０５は、変換部４７０１から供給された劣化信号振幅スペクトル４７３０と、生成した推定雑音スペクトルとを用いて雑音を抑圧し、雑音抑圧結果としての強調信号振幅スペクトルを振幅制御部４７０３に伝達する。さらに雑音抑圧部４７０５は、急変判定部４７０９から判定結果を入力し、信号の急変の有無またはその程度に応じて、異なった強度で雑音を抑圧する。雑音抑圧部４７０５は、所望信号の検出を行って所望信号成分を周波数ごとに保護する一方、信号急変が存在し、所望信号成分が検出されないときには、振幅を推定背景音に置換してもよい。

位相制御部４７０２は、変換部４７０１から供給された劣化信号位相スペクトル４７２０を回転（シフト）させ、強調信号位相スペクトル４７４０として逆変換部４７０４へ供給する。また、位相の回転量（シフト量）を、振幅制御部４７０３へ伝達する。振幅制御部４７０３は、位相制御部４７０２から位相の回転量（シフト量）を受け取って振幅補正量を算出し、その振幅補正量を用いて、強調信号振幅スペクトルを各周波数で補正し、補正振幅スペクトル４７５０を逆変換部４７０４へ供給する。逆変換部４７０４は、位相制御部４７０２から供給された強調信号位相スペクトル４７４０と、振幅制御部４７０３から供給された補正振幅スペクトルとを合成して逆変換を行い、強調信号として、出力端子４７０７に供給する。

直線性計算部４７０８は、変換部４７０１から供給された位相スペクトル４７２０を用いて、その周波数領域での直線性を計算する。急変判定部４７０９は、直線性計算部４７０８が計算した直線性に基づいて、信号急変の存在可能性（推定された存在確率）を計算する。

衝撃音（信号の急変）が存在するときに、位相の直線を用いてその存在可能性を推定できる理由は次の通りである。変換部４７０１のフレーム内に孤立パルスが存在すると仮定する。孤立パルスをフーリエ変換したときの周波数方向の位相の傾きは、孤立パルスの位置に対応して一意に求まることが知られている。例えば、変換部におけるフレーム長がＬサンプルで孤立パルス位置がｎ０（０≦ｎ０≦Ｌ―１）であるとき、位相の傾きは−２πｎ０/Ｌとなる。これは、振幅ａの孤立パルスに関して、フーリエ変換によって得られるｋ番目の周波数成分Ｄ（ｋ）が、次式で与えられるためである。
Ｄ（ｋ）＝ａ・ｅｘｐ(jθ（ｋ）)θ（ｋ）＝−２π・ｋ・ｎ０／Ｌ
位相θ（ｋ）は、明らかにｋ、すなわち周波数に比例しており、右下がりの直線となっている。

《変換部の構成》
図４８は、変換部４７０１の構成を示すブロック図である。図４８に示すように、変換部４７０１はフレーム分割部４８０１、窓がけ処理部(windowing unit)４８０２、およびフーリエ変換部４８０３を含む。劣化信号サンプルは、フレーム分割部４８０１に供給され、Ｋ／２サンプルごとのフレームに分割される。ここで、Ｋは偶数とする。フレームに分割された劣化信号サンプルは、窓がけ処理部４８０２に供給され、窓関数(window function)であるw(t)との乗算が行なわれる。第ｎフレームの入力信号yn(t) (t=0, 1, ..., K/2-1) に対するw(t)で窓がけ(windowing)された信号は、次式で与えられる。

また、連続する２フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。オーバラップ長としてフレーム長の５０％を仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式で得られる左辺が、窓がけ処理部４８０２の出力となる。

実数信号に対しては、左右対称窓関数が用いられる。また、窓関数は、変換部４７０１の出力を逆変換部４７０４に直接供給したときの入力信号と出力信号が計算誤差を除いて一致するように設計される。これは、w²(t)+w²(t+K/2)=1 となることを意味する。

このほかにも、ハミング窓、三角窓など、様々な窓関数が知られている。窓がけされた出力はフーリエ変換部４８０３に供給され、劣化信号スペクトルYn(k)に変換される。劣化信号スペクトルYn(k)は位相と振幅に分離され、劣化信号位相スペクトル arg Yn(k)は、位相制御部４７０２と直線性計算部４７０８に、劣化信号振幅スペクトル|Yn(k)|は、雑音抑圧部４７０５に供給される。既に説明したように、振幅スペクトルの代わりにパワースペクトルを利用することもできる。

《逆変換部の構成》
図４９は、逆変換部４７０４の構成を示すブロック図である。図４９に示すように、逆変換部４７０４は逆フーリエ変換部４９０１、窓がけ処理部４９０２およびフレーム合成部４９０３を含む。逆フーリエ変換部４９０１は、振幅制御部４７０３から供給された強調信号振幅スペクトル４７５０と位相制御部４７０２から供給された強調信号位相スペクトル４７４０ arg Xn(k)とを乗算して、強調信号（以下の式の左辺）を求める。

得られた強調信号に逆フーリエ変換を施し、１フレームがＫサンプルを含む時間領域サンプル値系列xn(t) (t=0, 1, ..., K-1)として、窓がけ処理部４９０２に供給され、窓関数w(t)との乗算が行なわれる。第ｎフレームの入力信号xn(t) (t=0, 1, ..., K/2-1)に対してw(t)で窓がけされた信号は、次式の左辺で与えられる。

また、連続する２フレームの一部を重ね合わせ(オーバラップ)して窓がけしてもよい。フレーム長の５０％をオーバラップ長として仮定すれば、t=0, 1, ..., K/2-1 に対して、以下の式の左辺が、窓がけ処理部４９０２の出力となり、フレーム合成部４９０３に伝達される。

フレーム合成部４９０３は、窓がけ処理部４９０２からの隣接する２フレームの出力を、Ｋ／２サンプルずつ取り出して重ね合わせ、以下の式によって、t=0, 1, ..., K-1における出力信号（式の左辺）を得る。得られた強調音声信号４７６０は、フレーム合成部４９０３から出力端子４７０７に伝達される。

なお、図４８と図４９において変換部と逆変換部における変換をフーリエ変換として説明したが、フーリエ変換に代えて、アダマール変換、ハール変換、ウェーブレット変換など、他の変換を用いることもできる。ハール変換は、乗算が不要となり、ＬＳＩ化したときの面積を小さくすることができる。ウェーブレット変換は、周波数によって時間解像度を異なったものに変更できるために、雑音抑圧効果の向上が期待できる。

また、変換部４７０１において得られる周波数成分を複数統合してから、雑音抑圧部４７０５で実際の抑圧を行うこともできる。統合後の周波数成分の数は、統合前の周波数成分の数よりも小さくなる。具体的には、周波数成分の統合によって得られる統合周波数成分に対して共通の抑圧度を求め、その抑圧度を同一統合周波数成分に属する個別の周波数成分に対して共通に用いる。その際、聴覚特性の弁別能力が高い低周波領域から、能力が低い高周波領域に向かって、よりたくさんの周波数成分を統合することによって、高い音質を達成することができる。このように、複数の周波数成分を統合してから雑音抑圧を実行すると、雑音抑圧を適用する周波数成分の数が少なくなり、全体の演算量を削減することができる。

《雑音抑圧部の構成》
雑音抑圧部４７０５は、変換部４７０１から供給される劣化信号振幅スペクトルを用いて雑音を推定し、推定雑音スペクトルを生成する。そして、変換部４７０１からの劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて抑圧係数を求め、劣化信号振幅スペクトルに乗じ、強調信号振幅スペクトルとして、振幅制御部４７０３へ供給する。また、急変判定部４７０９から信号急変の存在可能性（信号の急変がどの程度存在するかの情報）を受けて、存在可能性に応じて、劣化信号振幅スペクトルと推定雑音スペクトルを混合したものを、強調信号振幅スペクトルとして、振幅制御部４７０３へ供給する。このとき、雑音抑圧部４７０５は、所望信号の検出を行って所望信号成分を周波数ごとに保護してもよい。

雑音抑圧部４７０５においては、様々な抑圧を行うことが可能であるが、代表的なものとして、SS(Spectrum Subtraction:スペクトル減算)法とMMSE STSA(Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator:最小二乗平均誤差短時間振幅スペクトル推定)法とが挙げられる。SS法の場合は、変換部４７０１から供給された劣化信号振幅スペクトルから推定雑音スペクトルを減算する。MMSE STSA法の場合は、変換部４７０１から供給された劣化信号振幅スペクトルと生成した推定雑音スペクトルとを用いて、抑圧係数を計算し、この抑圧係数を劣化信号振幅スペクトルに乗算する。この抑圧係数は、強調信号の平均二乗パワーを最小化するように決定される。

また、雑音抑圧部４７０５は、急変判定部４７０９から受けた急変の存在可能性（信号の急変がどの程度存在するかの情報）に応じて、雑音抑圧の程度を変更する。例えば、存在可能性に応じて、劣化信号振幅スペクトルと推定雑音スペクトルを混合したものを、強調信号振幅スペクトルとして、振幅制御部４７０３へ供給してもよい。具体的には、信号急変の存在可能性の高い周波数成分、周波数帯域、あるいはフレーム単位で、その急変を抑圧すべく、より推定雑音スペクトルの混合割合を高く（強力な抑圧を適用）する。抑圧程度の設定は、存在可能性に応じて無段階に制御してもよいし、抑圧度０、抑圧度１、抑圧度２というように多段で（離散的な段階で）抑圧を行なってもよい。

さらに、この置き換えに先立って、重要な劣化信号振幅スペクトル成分を検出して、検出された重要な劣化信号振幅スペクトル成分を推定雑音スペクトルによる置き換えの対象から除外したり、劣化信号振幅スペクトルの混合割合を高くしたりすることもできる。重要な劣化信号振幅スペクトル成分を検出する際の重要度の指標としては、劣化信号振幅スペクトルの大きさを用いることができる。振幅が大きな成分は目的とする信号の成分である確率が高く、これを保持することは目的とする信号の音質劣化を防止することにつながる。

ピークの検出は、例えば、非特許文献３の純音成分検出方法や、非特許文献５に、その方法が開示されている。さらに、検出されたピークを所定の条件に従って評価し、条件を満たさないピークは除外してもよい。例えば、前記推定雑音よりも小さな値をとるピークは、目的とする信号である可能性は低い。すなわち、推定雑音を基準として、それよりも十分に大きいものだけをピークとして残し、それ以外を除外することができる。十分に大きいかどうかは推定雑音の定数倍と比較することで、判定できる。このように、検出されたピークが所定の条件を満たすかどうかを評価してから最終的なピーク成分を選択することによって、誤ったピークの検出を低減し、信号急変部の抑圧効果を高くすることができる。

《位相制御部および振幅制御部の構成》
図５０は位相制御部４７０２および振幅制御部４７０３の構成を示すブロック図である。図５０に示すように、位相制御部４７０２は位相回転部５００１と回転量生成部５００２とを含み、振幅制御部４７０３は、補正量算出部５００３と振幅補正部５００４とを含む。

回転量生成部５００２は、急変判定部４７０９から「信号の急変が存在する」と判定された周波数成分について、劣化信号位相スペクトルの回転量を生成し、位相回転部５００１と補正量算出部５００３に供給する。位相回転部５００１では、回転量生成部５００２から回転量が供給されると、変換部４７０１から供給された劣化信号位相スペクトル４７２０を、供給された回転量だけ回転（シフト）させ、強調信号位相スペクトル４７４０として逆変換部４７０４へ供給する。

補正量算出部５００３では、回転量生成部５００２から供給される回転量に基づいて、振幅の補正係数を決定し、振幅補正部５００４に供給する。

回転量生成部５００２は、例えば乱数によって回転量を生成する。乱数により、劣化信号位相スペクトルを各周波数で回転させると、劣化信号位相スペクトル４７２０の形状が変化する。この形状の変化により、衝撃音などの信号急変部の特徴を弱めることができる。

計算の簡単化のために、Ｒの値をそのまま回転量とすることもできる。回転量であるので２πはちょうど一回転を表す。位相を２π回転させた場合は回転させていない場合と同一である。よって、２π＋αという回転量は、回転量がαの場合と同じになる。ここでは、線形合同法により一様乱数を発生させた場合を説明したが、それ以外の方法で一様乱数を発生させた場合でも、上式により回転量φを求めればよい。急変判定部４７０９の判定結果に応じて、いつどのくらい乱数化を行なうのかを決定してもよい。

位相回転部５００１は、回転量生成部５００２から回転量を受け取り、劣化信号位相スペクトルを回転させる。もし、劣化信号位相スペクトルが角度で表現されている場合には、その角度に回転量φの値を加算することで回転させることができる。劣化信号位相スペクトルが複素数の正規ベクトルで表現されている場合には、回転量φの正規ベクトルを求め、劣化信号位相スペクトルに乗算することで回転させることができる。

補正量算出部５００３による補正係数算出方法は、図５の補正量算出部５０３について説明した方法と同様であるため、ここでは説明を省略する。

《直線性計算部および急変判定部の構成》
図５１は、直線性計算部４７０８および急変判定部４７０９の内部構成について説明するための図である。図５１に示すように、直線性計算部４７０８は、周波数方向に位相の変化量を算出する変化量算出部５１０１と、位相の変化量の平坦度を算出する平坦度算出部５１０２を含んでいる。変化量算出部５１０１は、位相成分信号４７２０（p(k)、kは周波数）を入力して、隣接する周波数の位相差Δp(k)=p(k)-p(k-1)を位相の変化量５１１０（位相の傾き）として求める。

平坦度算出部５１０２は、変化量算出部５１０１で得られた位相変化量Δp(k)=p(k)-p(k-1)の、周波数軸に沿った平坦度（バラツキ）を調べる。隣接する周波数の位相変化量の差Δ₂p(k)=Δp(k)-Δp(k-1)を平坦度５１２０とする。位相変化量が平坦であれば差分は０になる。周波数成分ごと、帯域ごと、全周波数のいずれかに対して、一つの平坦度５１２０を求めてもよい。また、単一あるいは複数の帯域における平坦度を統合して、全周波数における平坦度の代わりに用いてもよい。

ここで、周波数ごとではなく周波数帯域（サブバンド）またはフレームごとに平坦度を求めると、より大局的な判定によって、信号急変成分以外の位相成分による平坦度の誤差を低減することができる。例えば、フレームごとの平坦度として、各周波数における平坦度の周波数方向総和を求めてもよい。この修正によって、各周波数における平坦度の信頼性を高めることができる。さらに、周波数帯域ごとまたはフレームごとの平坦度を用いて、周波数ごとの平坦度を修正してもよい。例えば、ある周波数帯域の平坦度が「信号急変が存在する」ことを表すときに、その周波数帯域内の全周波数の平坦度を強制的に「信号急変が存在する」を表すように修正することで、他の信号成分の妨害による平坦度の誤差を低減することができる。その反対に、ある周波数帯域の平坦度が「信号急変が存在しない」を表すときに、その周波数帯域内の全周波数の平坦度を強制的に「信号急変が存在しない」を表すように修正することで、他の信号成分の妨害による平坦度の誤差を低減することもできる。あるいは、前記帯域内の各周波数で、平坦度を「存在」と判定しやすい方向へ一律に修正して、各周波数独自の平坦度を求めるという構成自体は維持してもよい。周波数ごとまたは周波数帯域ごとに平坦度を求めると、周波数ごとまたは周波数帯域ごとに急変の抑圧程度を変更することができ、より精度の高い抑圧を行なうことが可能となる。

さらに、位相の微分値を位相変化量としてさらにその微分値を平坦度１２２０としてもよい。その場合、位相の二次微分値が０に近ければ（所定値以下であれば）平坦度が高いことになる。

ここでは変化量算出部５１０１は、隣接周波数間の位相の差分を用いて変化量を算出したが、本発明はこれに限定されるものではない。位相の周波数による微分で直線性（位相変化の平坦度）を判定してもよい。複数の周波数における複数の微分結果のバラツキが小さいほど直線性が高い。局所的な直線性は、局所的な微分結果を用いて評価することができる。特に、隣接する2周波数成分間の微分は差分で近似できるので、その場合は複数の差分のバラツキが小さいほど直線性が高いと判断する。バラツキの指標として、平坦度(Flatness Measure)を用いることができる。

急変判定部４７０９は、算出された平坦度を信号の急変が存在する可能性とする。さらに、平坦度を所定の線形関数、非線形関数、多項式などを用いて変換した結果を、信号の急変が存在する可能性５１３０として出力してもよい。信号の急変をその「存在可能性」として検出することによって、「存在そのもの」よりも高品質な抑圧を達成できる。これは、「存在そのもの」の判定、すなわち２値判定で判定誤りを生じた場合、抑圧に与える影響が致命的になるためである。「抑圧する」、または「抑圧しない」の２つだけの選択肢なので、抑圧するべきでないときに判定誤りによって抑圧を適用することで、致命的な歪を目的とする信号に与えることになり、これが知覚されることになる。反対に、抑圧するべきときに抑圧を適用しないと、信号の急変がそのまま残り、知覚される。反対に、「存在可能性」、すなわち連続的な値を用いて判定を行い、その判定結果に応じた程度の抑圧を行うことによって、どちらの判定誤りの影響をも小さくすることができる。

図５２は、位相およびその変化量をグラフに示したものである。周波数領域において、周波数軸に沿って、グラフ５２０１のように位相が変化する場合、その位相変化量は、周波数領域において、周波数軸に沿って、グラフ５２０２に示すように変化する。この変化の平坦度５２０３を導き出すことにより、位相の直線性を判別する。

信号の急変部では位相が直線的に変化することが分かっているため、このように位相の直線性、すなわち位相変化の平坦度を算出することにより、信号の急変の存在可能性を評価することが可能となる。そして、衝撃音など信号の急変が存在するフレームにおいて、位相スペクトルを回転操作することにより、その急変を抑圧したり、その影響を低減することができるため、高品質な強調信号を得ることができる。

図５３は、本実施形態にかかる雑音抑圧装置４７００をソフトウェアを用いて実現する場合のハードウェア構成について説明する図である。

雑音抑圧装置４７００は、プロセッサ５３１０、ＲＯＭ(Read Only Memory)５３２０、ＲＡＭ(Random Access Memory)５３４０、ストレージ５３５０、入出力インタフェース５３６０、操作部５３６１、入力部５３６２、および出力部５３６３を備えている。雑音抑圧装置４７００は、カメラ５３６４を備えていてもよい。プロセッサ５３１０は中央処理部であって、様々なプログラムを実行することにより雑音抑圧装置４７００全体を制御する。

ＲＯＭ５３２０は、プロセッサ５３１０が最初に実行すべきブートプログラムの他、各種パラメータ等を記憶している。ＲＡＭ５３４０は、不図示のプログラムロード領域の他に、入力信号４７１０、位相成分信号４７２０、振幅成分信号４７３０、強調信号４７６０、位相変化量５１１０、平坦度５１２０および急変判定結果５１３０等を記憶する領域を有している。

また、ストレージ５３５０は、雑音抑圧プログラム５３５１を格納している。雑音抑圧プログラム５３５１は、変換モジュール、位相制御モジュール、振幅制御モジュール、逆変換モジュール、雑音抑圧モジュール、直線性計算モジュール、急変判定モジュールを含んでいる。雑音抑圧プログラム５３５１に含まれる各モジュールをプロセッサ５３１０が実行することにより、図４７の変換部４７０１、位相制御部４７０２、振幅制御部４７０３、逆変換部４７０４、雑音抑圧部４７０５、直線性計算部４７０８、急変判定部４７０９の各機能を実現できる。なお、ストレージ５３５０はノイズデータベースを格納してもよい。

プロセッサ５３１０が実行した雑音抑圧プログラム５３５１の出力である強調信号は、入出力インタフェース５３６０を介して出力部５３６３から出力される。これにより、例えば、入力部５３６２から入力した操作部５３６１の操作音などを抑圧することができる。また、入力部５３６２から入力した入力信号に衝撃音が含まれたことを検出してカメラ５３６４による撮影を開始するなどといった適用法も可能である。

図５４は、上記雑音抑圧プログラム５３５１による処理の流れを説明するためのフローチャートである。まず、ステップＳ５４０１において、入力部５３６２から信号を入力すると、ステップＳ５４０３に進む。ステップＳ５４０３では、変換部４７０１が入力信号を周波数領域に変換して、振幅・位相に分割する。次に、ステップＳ５４０５では、離散周波数ｋを１に、カウント値Ｉを０に設定して、順次周波数空間での処理を開始する。ステップＳ５４０７に進むと、設定された周波数での位相の変化を算出する。さらにステップＳ５４０９では、位相変化の変化を算出する。位相変化の変化の大きさに応じて、位相の直線性を判断する。具体的には位相変化の変化がどれだけ０に近いかに基づいて、周波数ｋにおける直線性の高さの指標とする。さらにフレーム単位で信号急変の存在可能性を算出するために、位相変化の変化が所定の閾値Ｎ未満のとき、ステップＳ５４１３においてＩをインクリメントする。

一方、位相変化の変化が所定の閾値Ｎ以上の場合、位相変化が平坦ではない、すなわち位相の直線性が低いと判断して、ＩをインクリメントせずにステップＳ５４１５に進む。以上のステップＳ５４０７〜Ｓ５４１３を、ｋ＝Ｆ（Ｆはフレーム全体の周波数成分数）になるまで繰り返す。最終的には、ステップＳ５４１７において、Ｉ（直線性の高い周波数）を所定の閾値Мと比較する。ＩがＭ以上の場合に衝撃音（信号急変）ありのフレームと判定し（Ｓ５４２１）、それ以外を衝撃音（信号急変）なしと判定する（Ｓ５４２３）。周波数ごとの信号急変存在可能性を、雑音抑圧部４７０５および位相制御部４７０２に供給する（Ｓ５４２５）。合わせて、フレームごとの信号急変存在の有無である判定結果を雑音抑圧部４７０５および位相制御部４７０２に供給してもよい。

以上の処理により、衝撃音に代表される信号の急変をより正確に検出することができ、適宜、その衝撃音（信号の急変）を適切に抑圧することが可能となる。

［第１８実施形態］
次に本発明の第１８実施形態に係る雑音抑圧装置について、図５５を用いて説明する。図５５は、本実施形態に係る雑音抑圧装置５５００の機能構成を説明するための図である。本実施形態に係る雑音抑圧装置５５００は、上記第１７実施形態と比べると、変換部５５０１が複素信号５５５０を生成し、直線性検出部５５０８および急変判定部５５０９がその複素信号５５５０に基づいて検出および判定を行なう点で異なる。その他の構成および動作は、第１７実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

図５６は、直線性検出部５５０８および急変判定部４７０９の内部構成について説明するための図である。図５６に示すように、直線性検出部５５０８は、周波数方向に位相の変化量を算出する変化量算出部５６０１と、位相の変化量の平坦度を算出する平坦度算出部５１０２を含んでいる。変化量算出部５６０１は、複素信号５５５０（q(k)(kは周波数））を入力して、隣接する周波数の位相差Δp(k)=p(k)-p(k-1)を、位相の変化量５１１０（位相の傾き）として求める。

平坦度算出部５１０２は、変化量算出部５１０１で得られた位相変化量Δp(k)=p(k)-p(k-1)の、周波数軸に沿った平坦度（バラツキ）を調べる。隣接する周波数の位相変化量の差Δ2p(k)=Δp(k)-Δp(k-1)を平坦度５１２０とする。位相変化量が平坦であれば差分は０になる。周波数毎、帯域毎（周波数を任意の幅に区切った帯域）、全周波数のいずれかに対して、一つの平坦度５１２０を求めてもよい。また、位相の微分値を位相変化量としてさらにその微分値を平坦度５１２０としてもよい。その場合、位相の二次微分値が０に近ければ（所定値以下であれば）平坦と判定できる。帯域ごとに判定すると、よりきめ細かな処理を行なうことができる。つまり、衝撃音を帯域ごとに分けて消すこともでき、より精度のよい衝撃音抑圧を行なうことが可能となる。

急変判定部４７０９は、例えば、算出された平坦度の絶対値が一定以下の場合、その平坦度に対応する周波数（一つの周波数成分、周波数帯域、または、全帯域（つまり一つのフレーム））は衝撃音を含むと判定する。判定結果５１３０としては、平坦度の絶対値と対応させた、０と１の間の値を判定結果５１３０として出力する。これにより、衝撃音が含まれている尤もらしさを得ることが可能となる。

以上説明したとおり本実施形態では、位相成分信号の代わりに複素信号を用いて位相の直線性を検出することができる。

［第１９実施形態］
次に本発明の第１９実施形態に係る雑音抑圧装置について、図５７を用いて説明する。図５７は、本実施形態に係る雑音抑圧装置に含まれる直線性検出部５７０８の機能構成を説明するための図である。本実施形態に係る直線性検出部５７０８は、上記第１８実施形態と比べると、単位ベクトル生成部５７８１と回転ベクトル変換部５７８２と回転ベクトル変換部５７８３とを備えている点で異なる。また、急変判定部５７０９が、回転ベクトルから、信号の急変の有無またはその程度を判定する点でも異なる。その他の構成および動作は、第１８実施形態と同様であるため、同じ構成および動作については同じ符号を付してその詳しい説明を省略する。

単位ベクトル生成部５７８１は、複素信号５５５０を用いて、入力スペクトル（複素ベクトル）を周波数ごとに単位ベクトル化する。具体的には、複素信号５５５０の実数部と虚数部をそれぞれ振幅値で除算する。

回転ベクトル変換部５７８２は、単位ベクトル５７１０を、隣接周波数間の回転ベクトル（第１回転ベクトル５７２０）に変換する。ここでの回転ベクトルの回転量は位相変化量と同義となる。基準ベクトルの共役A*と回転後のベクトルBとの内積をとる乗算を行ない、以下のように回転ベクトルRotVecを求める。RotVec = A*・B
具体的には、基準ベクトルの実部同士を積算して、虚部同士を積算して、それらを足して、虚部は一方を引き算する。そうすると回転ベクトル５７２０が算出できる。

さらに、回転ベクトル変換部５７８３は、回転ベクトル変換部５７８２により得られる第１回転ベクトル５７２０の、周波数軸に沿った平坦度（バラツキ）を調べる。周波数方向の位相変化量が一定であると回転ベクトルのバラツキが小さくなる。そのため第１回転ベクトル５７２０の変化量を周波数軸に沿って求める。具体的には、第１回転ベクトル５７２０について、隣接周波数間の回転ベクトル（第２回転ベクトル５７３０）を求める。これは第１回転ベクトルを微分したのと同義である。

そこで、急変判定部５７０９は、第２回転ベクトル５７３０の実部を平坦度として認識する。

第２回転ベクトル５７３０も単位ベクトルなので、その実部は−１から１の値をとる。位相が直線的に変化するほど、第１回転ベクトルの角度変化量が小さい（回転ベクトルのバラツキが小さい）。そして、第１回転ベクトルの変化量が小さい（回転ベクトルのバラツキが小さい）ほど、第２回転ベクトルの実部が大きくなる。すなわち、第２回転ベクトルの角度が小さくなる。ここでも、周波数毎、帯域毎（周波数を任意の幅に区切った帯域）、全周波数のいずれかについて、一つの平坦度を求めてもよい。

急変判定部５７０９は、第２回転ベクトル５７３０の実部を急変の存在可能性とみなして、＋１に近い閾値（例えば0.7や0.8）を越えているか否かによって急変の存在またはその程度を判定する。判定結果５７４０として、衝撃音の存在可能性（１〜０）を出力する。このように、衝撃音が含まれている尤もらしさを得ることが可能となる。

図５８は、本実施形態にかかる雑音抑圧プログラムによる処理の流れを説明するためのフローチャートである。まず、ステップＳ５４０１において、音声入力部５３６２から音声信号を入力すると、ステップＳ５８０３に進む。ステップＳ５８０３では、変換部５５０１が周波数領域で入力信号から複素信号を生成する。次に、ステップＳ５４０５では、離散周波数ｋを１に設定して、順次周波数空間での処理を開始する。ステップＳ５８０７に進むと、設定された周波数で複素信号を単位ベクトル化する。次に、ステップＳ５８０８では、隣接する周波数成分の単位ベクトルから第１回転ベクトルに変換する。さらにステップＳ５８０９では隣接する周波数成分の第１回転ベクトルから第２回転ベクトルに変換する。ステップＳ５８１１では、第２回転ベクトルの実部を、信号急変の存在可能性と見なして、閾値Ｎと比較する。実部が所定の閾値Ｎを越えた場合、位相は平坦に変化すると判断され、直線性が高いと判断して、ステップＳ５４１３においてＩ（ｋ）＝１とする。一方、実部が所定の閾値Ｎ以下の場合、位相変化は平坦ではない判断され、直線性が低いと判断して、ステップＳ５４１４においてＩ（ｋ）＝０とする。以上のステップＳ５４０７〜Ｓ５４１４を、ｋ＝Ｆ（Ｆはフレーム全体の周波数ステップ数）になるまで繰り返す。最終的には、ステップＳ５４１７において、Ｉ（ｋ）＝１となったｋの周波数で信号急変ありと判定し、判定結果を、雑音抑圧部４７０５および位相制御部４７０２に供給する。

以上説明したとおり本実施形態では、複素信号を用いて位相の回転ベクトルの回転ベクトルから直線性を検出できる。なおここで、平坦度の判定で、回転ベクトルの実部を使うためには単位ベクトル化したが、本発明はこれに限定されるものではない。また、第２回転ベクトルの実部に代えて第２回転ベクトルの角度の大きさを閾値と比較し、角度の大きさが閾値より大きい場合に信号急変ありと判定してもよい。

［第２０実施形態］
なお、上記第１２乃至１９実施形態では、信号急変部を抑圧することを目的とした雑音抑圧装置に信号急変検出方法を適用した場合について説明したが、本発明はこれに限定されるものではない。衝撃音の検出を目的とした様々な装置、システムおよび状況で利用することができる。さらに検出対象は衝撃音（急激に立ち上がってすぐにたち下がる音声信号）に限定されない。信号が急激に立ち上がって（またはたち下がって）そのままとなる場合であっても、急変部として検出できる。

また、図５９に示すように、車両５９００にマイク２００１と直線性計算部４７０８と急変判定部４７０９と映像記録部５９０２とを搭載する適用例も考えられる。映像記録部５９０２が衝撃音の検出をトリガーにしてカメラによる撮影画像の上書き保存禁止を行なえば、事故状況の記録を残すことができる。その際に、衝撃音検出から一定時間の遅延の後に、上書き保存禁止を行ってもよい。衝撃そのものをトリガーにした場合と異なり、衝撃が小さい場合や、他の車両が事故にあった場合にも事故状況の自動記録を行なえるという利点がある。

また、図６０に示すように、心電計６０００に計算部４７０８と急変判定部４７０９とアラーム部６００１とを接続する適用例も考える。心電図の異常心拍の検出をより正確かつ効果的に行なうことができる。特に雑音の多い場合に有効である。同様に、胎児のエコーのモニターにも適用できる。雑音による妨害で正しく心音がとれない場合があるが、そのようなときに本技術は有効である。すなわち、生体信号の急変検出に広く適用できる。

［第２１実施形態］
同様に図６１に示すように、上記実施形態では、ハードディスクドライブ６１００の異常検知のために本発明の衝撃音検出を利用してもよいし、図６２に示すように、例えば空港など騒音が大きい状況での発砲音や爆発音の検出に、本願発明を利用してもよい。

［他の実施形態］
以上、実施形態を参照して本発明を説明したが、本発明は上記実施形態に限定されるものではない。本発明の構成や詳細には、本発明のスコープ内で当業者が理解し得る様々な変更をすることができる。また、それぞれの実施形態に含まれる別々の特徴を如何様に組み合わせたシステムまたは装置も、本発明の範疇に含まれる。

また、本発明は、複数の機器から構成されるシステムに適用されてもよいし、単体の装置に適用されてもよい。さらに、本発明は、実施形態の機能を実現する情報処理プログラムが、システムあるいは装置に直接あるいは遠隔から供給される場合にも適用可能である。したがって、本発明の機能をコンピュータで実現するために、コンピュータにインストールされるプログラム、あるいはそのプログラムを格納した媒体、そのプログラムをダウンロードさせるＷＷＷ(World Wide Web)サーバも、本発明の範疇に含まれる。特に、少なくとも、非一時的コンピュータ可読媒体（non-transitory computer readable medium）
は本発明の範疇に含まれる。

なお、上記の各実施形態においては、以下に示すような信号処理装置、信号処理方法および信号処理プログラムの特徴的構成が示されている（以下のように限定されるわけではない）。
（付記１）
入力信号を、周波数領域における位相成分信号および振幅成分信号に変換する変換手段と、
前記位相成分信号および前記振幅成分信号の特徴量を計算する計算手段と、
前記計算手段によって計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
を備えたことを特徴とする信号処理装置。
（付記２）
前記計算手段は、前記位相成分信号の変化の平坦度を前記特徴量として算出することを特徴とする付記１に記載の信号処理装置。
（付記３）
前記計算手段は、前記振幅成分信号の平坦度を前記特徴量として算出することを特徴とする付記１または２に記載の信号処理装置。
（付記４）
前記判定手段は、前記位相成分信号の変化と前記振幅成分信号の変化とをそれぞれ重み付け加算して得た値に基づいて前記信号の急変に関する存在可能性の判定を行なうことを特徴とする付記１、２または３に記載の信号処理装置。
（付記５）
前記判定手段は、前記位相成分信号の変化と前記振幅成分信号の変化とを平均して得た値に基づいて前記信号の急変に関する存在可能性の判定を行なうことを特徴とする付記１、２または３に記載の信号処理装置。
（付記６）
前記判定手段は、前記位相成分信号の変化と前記振幅成分信号の変化とを非線形結合して得た値に基づいて前記信号の急変に関する存在可能性の判定を行なうことを特徴とする付記１、２または３に記載の信号処理装置。
（付記７）
前記計算手段は、周波数領域における前記位相成分信号の微分値の平坦度を計算し、
前記判定手段は、前記微分値の前記平坦度が高く、かつ、前記振幅成分信号の平坦度が高ければ、前記入力信号の急変に関する存在可能性が高いと判定することを特徴とする付記１乃至５のいずれか１項に記載の信号処理装置。
（付記８）
前記計算手段は、前記位相成分信号から、各周波数の位相変化（φn＝θn−θn-1）を求め、該位相変化の差（φn−φn-1）を回転角とする回転ベクトルcos(φn−φn-1)＋ｊsin(φn−φn-1)の大きさを前記特徴量として求めることを特徴とする付記１乃至７のいずれか１項に記載の信号処理装置。
（付記９）
前記変換手段は、位相成分信号および振幅成分信号を含む複素信号を出力し、
前記計算手段は、
各周波数における前記複素信号を単位ベクトルに正規化する正規化手段と、
隣接周波数における前記単位ベクトルの比から第１回転ベクトルを算出する第１算出手段と、
隣接周波数における前記第１回転ベクトルの比から第２回転ベクトルを算出する第２算出手段と、
を備え、
前記判定手段は、
前記第２回転ベクトルの実部の大きさに基づいて、前記入力信号の急変に関する存在可能性を判定することを特徴とする付記１乃至８のいずれか１項に記載の信号処理装置。
（付記１０）
前記変換手段は、位相成分信号および振幅成分信号を含む複素信号を出力し、
前記計算手段は、
各周波数における前記複素信号を単位ベクトルに正規化する正規化手段と、
隣接周波数における前記単位ベクトルの比から第１回転ベクトルを算出する第１算出手段と、
隣接周波数における前記第１回転ベクトルの比から第２回転ベクトルを算出する第２算出手段と、
を備え、
前記判定手段は、
前記第２回転ベクトルの角度の大きさに基づいて、前記入力信号の急変を検出することを特徴とする付記１乃至８のいずれか１項に記載の信号処理装置。
（付記１１）
前記判定手段で求めた前記急変に関する存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする付記１乃至１０のいずれか１項に記載の信号処理装置。
（付記１２）
前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする付記１乃至１１のいずれか１項に記載の信号処理装置。
（付記１３）
入力信号を、周波数領域における位相成分信号に変換する変換手段と、
前記入力信号の急増部の位置に基づいて、第１位相傾きを算出する第１算出手段と、
周波数領域における前記位相成分信号の第２位相傾きを算出する第２算出手段と、
前記第１位相傾きと前記第２位相傾きに基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
を備えたことを特徴とする信号処理装置。
（付記１４）
前記判定手段は、
前記第１位相傾きと前記第２位相傾きとの類似度に基づいて、前記入力信号の急変に関する存在可能性を判定することを特徴とする付記１３に記載の信号処理装置。
（付記１５）
前記第１算出手段は、
フレーム内の信号絶対値が急増する位置を検出する急増部検出手段と、
フレーム開始から前記急増部の存在する位置までの遅延時間を算出する遅延時間算出手段と、
前記遅延時間を、周波数領域の位相に変換する位相変換手段と、
を含むことを特徴とする付記１３または１４に記載の信号処理装置。
（付記１６）
前記変換手段はさらに前記入力信号の周波数領域における振幅成分信号を算出し、前記振幅成分信号の平坦度を算出する算出手段をさらに備え、
前記判定手段は、さらに前記振幅成分信号の平坦度を考慮して前記入力信号の急変の存在可能性を判定することを特徴とする付記１３に記載の信号処理装置。
（付記１７）
前記判定手段は、前記第１位相傾きと前記第２位相傾きとの類似度、および前記振幅成分信号の平坦度を、それぞれ重み付けして得た値に基づいて前記信号の急変の存在可能性の判定を行なうことを特徴とする付記１３乃至１６のいずれか１項に記載の信号処理装置。
（付記１８）
前記判定手段で求めた前記急変の存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする付記１３乃至１７のいずれか１項に記載の信号処理装置。
（付記１９）
前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする付記１３乃至１８のいずれか１項に記載の信号処理装置。
（付記２０）
入力信号を、周波数領域における位相成分信号に変換する変換手段と、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成する生成手段と、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する判定手段と、
を備えたことを特徴とする信号処理装置。
（付記２１）
前記低相関信号の急増部の位置に基づいて、信号急変部における第１相傾きを算出する第１算出手段と、
周波数領域における前記位相成分信号の第２位相傾きを算出する第２算出手段と、
をさらに有し、
前記判定手段は、
前記第１位相傾きと前記第２位相傾きとに基づいて前記入力信号の急変の存在可能性を判定することを特徴とする付記２０に記載の信号処理装置。
（付記２２）
前記判定手段は、
前記第１位相傾きと前記第２位相傾きとの類似度に基づいて、前記入力信号の急変の存在可能性を判定することを特徴とする付記２１に記載の信号処理装置。
（付記２３）
前記第１算出手段は、
フレーム内の信号絶対値が急増する位置を検出する急増部検出手段と、
フレーム開始から前記急増部の存在する位置までの遅延時間を算出する遅延時間算出手段と、
前記遅延時間を、周波数領域の位相に変換する位相変換手段と、
を含むことを特徴とする付記２１または２２に記載の信号処理装置。
（付記２４）
前記変換手段はさらに前記入力信号の周波数領域における振幅成分信号を算出し、前記振幅成分信号の平坦度を算出する算出手段をさらに備え、
前記判定手段は、さらに前記振幅成分信号の平坦度を考慮して前記入力信号の急変の存在可能性を判定することを特徴とする付記２０に記載の信号処理装置。
（付記２５）
前記判定手段で求めた前記急変の存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする付記２０乃至２４のいずれか１項に記載の信号処理装置。
（付記２６）
前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする付記２０乃至２５のいずれか１項に記載の信号処理装置。
（付記２７）
入力信号を、周波数領域における位相成分信号に変換する変換手段と、
周波数領域における前記位相成分信号の直線性を計算する直線性計算手段と、
前記直線性計算手段によって計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する判定手段と、
を備えたことを特徴とする信号処理装置。
（付記２８）
前記直線性計算手段は、周波数領域における前記位相成分信号の変化に基づいて、前記直線性を計算することを特徴とする付記２７に記載の信号処理装置。
（付記２９）
前記直線性計算手段は、周波数領域における前記位相成分信号の微分値の平坦度を計算し、
前記判定手段は、前記微分値の平坦度が高ければ、前記入力信号の急変の存在可能性が高いと判定することを特徴とする付記２７または２８に記載の信号処理装置。
（付記３０）
前記直線性計算手段は、
周波数ごとに位相成分と隣接周波数における位相成分の差として位相成分差を算出し、
前記位相成分差の隣接周波数における差に基づいて、前記直線性を計算することを特徴とする付記２７、２８または２９記載の信号処理装置。
（付記３１）
前記直線性計算手段は、
前記位相成分差の隣接周波数における差をフレームごとに加算した総和を前記フレームの直線性として計算し、
前記判定手段は、
前記総和が閾値以上なら、前記位相成分差の隣接周波数における差が大きくなるように修正することを特徴とする付記３０に記載の信号処理装置。
（付記３２）
入力信号を、周波数領域における位相成分信号および振幅成分信号に変換し、
前記位相成分信号および前記振幅成分信号の特徴量を計算し
計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する、
各ステップを含むことを特徴とする信号処理方法。
（付記３３）
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号の急増部の位置に基づいて、第１位相傾きを算出し、
周波数領域における前記位相成分信号の第２位相傾きを算出し、
前記第１位相傾きと前記第２位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
各ステップを含むことを特徴とする信号処理方法。
（付記３４）
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、
各ステップを含むことを特徴とする信号処理方法。
（付記３５）
入力信号を、周波数領域における位相成分信号に変換し、
周波数領域における前記位相成分信号の直線性を計算し、
計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する、
各ステップを含むことを特徴とする信号処理方法。
（付記３６）
入力信号を、周波数領域における位相成分信号および振幅成分信号に変換し、
前記位相成分信号および前記振幅成分信号の特徴量を計算し
計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する、
各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
（付記３７）
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号の急増部の位置に基づいて、第１位相傾きを算出し、
周波数領域における前記位相成分信号の第２位相傾きを算出し、
前記第１位相傾きと前記第２位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
（付記３８）
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、
各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
（付記３９）
入力信号を、周波数領域における位相成分信号に変換し、
周波数領域における前記位相成分信号の直線性を計算し、
計算された前記直線性に基づいて前記入力信号の急変の存在可能性を計算する、
各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。

この出願は、２０１３年３月５日に出願された日本国特許出願特願２０１３−０４２４４８号、特願２０１３−０４２４４９号、特願２０１３−０４２４５０号、特願２０１３−０４２４５１号、を基礎とする優先権を主張し、その開示の全てをここに取り込む。

Claims

入力信号を、周波数領域における位相成分信号および振幅成分信号に変換する変換手段と、
前記位相成分信号および前記振幅成分信号の特徴量を計算する計算手段と、
前記計算手段によって計算された前記特徴量に基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
を備え、
前記計算手段は、前記位相成分信号から、各周波数の位相変化（φn＝θn−θn-1）を求め、該位相変化の差（φn−φn-1）を回転角とする回転ベクトルcos(φn−φn-1)＋ｊsin(φn−φn-1)の大きさを前記特徴量として求める信号処理装置。
前記変換手段は、位相成分信号および振幅成分信号を含む複素信号を出力し、
前記計算手段は、
各周波数における前記複素信号を単位ベクトルに正規化する正規化手段と、
隣接周波数における前記単位ベクトルの比から第１回転ベクトルを算出する第１算出手段と、
隣接周波数における前記第１回転ベクトルの比から第２回転ベクトルを算出する第２算出手段と、
を備え、
前記判定手段は、前記第２回転ベクトルの実部の大きさに基づいて、前記入力信号の急変に関する存在可能性を判定することを特徴とする請求項１に記載の信号処理装置。
前記変換手段は、位相成分信号および振幅成分信号を含む複素信号を出力し、
前記計算手段は、
各周波数における前記複素信号を単位ベクトルに正規化する正規化手段と、
隣接周波数における前記単位ベクトルの比から第１回転ベクトルを算出する第１算出手段と、
隣接周波数における前記第１回転ベクトルの比から第２回転ベクトルを算出する第２算出手段と、
を備え、
前記判定手段は、前記第２回転ベクトルの角度の大きさに基づいて、前記入力信号の急変を検出することを特徴とする請求項１に記載の信号処理装置。
前記判定手段で求めた前記急変に関する存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする請求項１乃至３のいずれか１項に記載の信号処理装置。
前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする請求項１乃至４のいずれか１項に記載の信号処理装置。
入力信号を、周波数領域における位相成分信号および振幅成分信号にフレーム毎に変換する変換手段と、
前記入力信号の急増部の位置に基づいて、第１位相傾きを算出する第１算出手段と、
周波数領域における前記位相成分信号の第２位相傾きを算出する第２算出手段と、
前記第１位相傾きと前記第２位相傾きとに基づいて前記入力信号の急変に関する存在可能性を判定する判定手段と、
を備えたことを特徴とする信号処理装置。
前記判定手段は、前記第１位相傾きと前記第２位相傾きとの類似度に基づいて、前記入力信号の急変に関する存在可能性を判定することを特徴とする請求項６に記載の信号処理装置。
前記第１算出手段は、フレーム内の信号絶対値が急増する位置を検出する急増部検出手段と、フレーム開始から前記急増部の存在する位置までの遅延時間を算出する遅延時間算出手段と、前記遅延時間を、周波数領域の位相に変換する位相変換手段と、を含むことを特徴とする請求項６または７に記載の信号処理装置。
前記変換手段はさらに前記入力信号の周波数領域における振幅成分信号を算出し、前記振幅成分信号の平坦度を算出する算出手段をさらに備え、
前記判定手段は、さらに前記振幅成分信号の平坦度を考慮して前記入力信号の急変の存在可能性を判定することを特徴とする請求項８に記載の信号処理装置。
前記判定手段は、前記第１位相傾きと前記第２位相傾きとの類似度、および前記振幅成分信号の平坦度を、それぞれ重み付けして得た値に基づいて前記信号の急変の存在可能性の判定を行なうことを特徴とする請求項６乃至９のいずれか１項に記載の信号処理装置。
前記判定手段で求めた前記急変の存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする請求項６乃至１０のいずれか１項に記載の信号処理装置。
前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする請求項６乃至１１のいずれか１項に記載の信号処理装置。
入力信号を、周波数領域における位相成分信号および振幅成分信号にフレーム毎に変換する変換手段と、
前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成する生成手段と、
前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する判定手段と、
を備えたことを特徴とする信号処理装置。
前記低相関信号の急増部の位置に基づいて、信号急変部における第１相傾きを算出する第１算出手段と、
周波数領域における前記位相成分信号の第２位相傾きを算出する第２算出手段と、
をさらに有し、
前記判定手段は、前記第１位相傾きと前記第２位相傾きとに基づいて前記入力信号の急変の存在可能性を判定することを特徴とする請求項１３に記載の信号処理装置。
前記判定手段は、前記第１位相傾きと前記第２位相傾きとの類似度に基づいて、前記入力信号の急変の存在可能性を判定することを特徴とする請求項１４に記載の信号処理装置。
前記第１算出手段は、フレーム内の信号絶対値が急増する位置を検出する急増部検出手段と、
フレーム開始から前記急増部の存在する位置までの遅延時間を算出する遅延時間算出手段と、
前記遅延時間を、周波数領域の位相に変換する位相変換手段と、
を含むことを特徴とする請求項１４または１５に記載の信号処理装置。
前記変換手段はさらに前記入力信号の周波数領域における振幅成分信号を算出し、前記振幅成分信号の平坦度を算出する算出手段をさらに備え、
前記判定手段は、さらに前記振幅成分信号の平坦度を考慮して前記入力信号の急変の存在可能性を判定することを特徴とする請求項１３に記載の信号処理装置。
前記判定手段で求めた前記急変の存在可能性に対応した程度で、振幅の抑圧を行なう振幅制御手段をさらに備えたことを特徴とする請求項１３乃至１７のいずれか１項に記載の信号処理装置。
前記判定手段で前記急変を含むと判定されたフレームについて、前記入力信号の位相を変化させる位相制御手段をさらに備えたことを特徴とする請求項１３乃至１８のいずれか１項に記載の信号処理装置。
入力信号を、周波数領域における位相成分信号に変換し、
前記入力信号の急増部の位置に基づいて、第１位相傾きを算出し、
周波数領域における前記位相成分信号の第２位相傾きを算出し、
前記第１位相傾きと前記第２位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、
各ステップを含むことを特徴とする信号処理方法。
入力信号を、周波数領域における位相成分信号に変換し、前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、各ステップを含むことを特徴とする信号処理方法。
入力信号を、周波数領域における位相成分信号に変換し、前記入力信号の急増部の位置に基づいて、第１位相傾きを算出し、周波数領域における前記位相成分信号の第２位相傾きを算出し、前記第１位相傾きと前記第２位相傾きとに基づいて前記入力信号の急変の存在可能性を判定する、各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。
入力信号を、周波数領域における位相成分信号に変換し、前記入力信号に含まれる時間相関のある成分を前記入力信号から除いて低相関信号を生成し、前記低相関信号と前記位相成分信号とに基づいて、前記入力信号に含まれる急変の存在可能性を判定する、各ステップをコンピュータに実行させることを特徴とする信号処理プログラム。