JP3759685B2

JP3759685B2 - 雑音区間判定装置，雑音抑圧装置及び推定雑音情報更新方法

Info

Publication number: JP3759685B2
Application number: JP13773799A
Authority: JP
Inventors: 裕久田崎
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1999-05-18
Filing date: 1999-05-18
Publication date: 2006-03-29
Anticipated expiration: 2019-05-18
Also published as: JP2000330598A

Description

【０００１】
【発明の属する技術分野】
この発明は、ディジタル音声信号中の背景雑音が支配的な区間を判定する雑音区間判定装置、ディジタル音声信号に含まれている音声以外の雑音成分を抑圧する雑音抑圧装置、及び雑音区間判定装置や雑音抑圧装置などで使用される推定雑音情報更新方法に関するものである。
【０００２】
【従来の技術】
従来の雑音区間判定装置としては、特開平３−４８９００号公報、特開平４−５８２９７号公報に開示されているものがある。
特開平３−４８９００号公報に開示されている雑音区間判定装置は、雑音区間判定装置の性能向上を目的としたものであり、現在のフレームの入力音声に対して特徴パラメータを算出し、全ての特徴パラメー又は雑音区間の特徴パラメータを記憶する。
【０００３】
そして、Ｓフレーム前から数えてＮフレーム分の過去の特徴パラメータ集合を取り出して、現在のフレームの特徴ベクトルとの距離ベクトル又はベクトルのノルムを求めて、これを変換パラメータとし、この変換パラメータと予め設定された標準パターンとを比較して雑音区間を判定するようにしたものである。
【０００４】
即ち、過去のフレームの特徴パラメータと現在のフレームの特徴パラメータを用いて、現在のフレームが有音区間であるか否かを判定するための判定用パラメータとして変換パラメータを求め、この変換パラメータを用いて現在のフレームの判定を行っている。
【０００５】
なお、背景雑音の影響を回避するために雑音区間の特徴パラメータのみを記憶する構成の場合、現在のフレームに対する雑音区間判定（一次判定）を行い、その結果が雑音区間と判定したときに現在のフレームの特徴パラメータを記憶するようにしている。
この従来の雑音区間判定装置における推定雑音情報は、Ｓフレーム前から数えてＮフレーム分の過去の特徴パラメータ集合であり、その更新は、現在のフレームが雑音区間であると一次判定されたときに現在のフレームの特徴パラメータをバッファに追加記憶することによって行われている。
【０００６】
特開平４−５８２９７号公報に開示されている雑音区間判定装置は、上記特開平３−４８９００号公報に開示されている雑音区間判定装置と同様に、雑音区間判定装置の性能向上を目的としたものであり、現在のフレームの入力音声に対して特徴パラメータを算出し、雑音区間であると一次判定されたフレームの特徴ベクトルを記憶する。
【０００７】
そして、Ｓフレーム前から数えてＮフレーム分の過去の特徴パラメータ集合を取り出して、この集合に基づいて雑音標準パターンを作成し、現在のフレームの特徴パラメータを雑音標準パターンと比較することで、雑音区間を判定するようにしたものである。
【０００８】
この従来の雑音区間判定装置における推定雑音情報は、Ｓフレーム前から数えてＮフレーム分の過去の特徴パラメータ集合、または、この集合に基づいて作成された雑音標準パターンであり、その更新は、現在のフレームが雑音区間であると一次判定されたときに現在のフレームの特徴パラメータをバッファに追加記憶することによって行われている。
【０００９】
従来の雑音抑圧装置としては、特開平９−３１１６９８号公報に開示されているものがある。
特開平９−３１１６９８号公報に開示されている雑音抑圧装置は、雑音抑圧後の音質を改善することを目的としたものであり、音声区間では推定雑音信号（推定雑音情報）の更新を停止させるか、または、雑音区間より遅い追従速度で更新させるようにしている。現在のフレームが音声区間であるか雑音区間であるかの判定については、短期間信号のパワー平均値の差、相関係数、ＬＰＣ係数の変化などを用いることができると記載されている。
【００１０】
【発明が解決しようとする課題】
従来の雑音区間判定装置は以上のように構成されているので、現在のフレームが雑音区間であるか否かの一次判定を実施して、その判定結果に基づいて推定雑音情報を更新するが、この一次判定に誤りが生じると、音声区間の特徴が推定雑音情報に取り込まれてしまうため、雑音区間の判定精度が低下するなどの課題があった。特に、背景雑音レベルが高い場合、レベルの低い音声区間（例えば、音声の立ち上がり区間）と、雑音が変動している区間の判定が困難であるため、一次判定に誤りが生じ易く、その誤った一次判定が雑音区間の判定精度の低下をもたらすという課題があった。
【００１１】
また、従来の雑音抑圧装置は以上のように構成されているので、現在のフレームが音声区間であるか雑音区間であるかの判定を実施して、その判定結果に基づいて推定雑音情報の更新を制御しているが、その判定に誤りが生じると、音声区間の特徴が推定雑音情報に取り込まれてしまうため、この推定雑音情報を用いて雑音抑圧処理を実施すると、雑音抑圧後の音質が劣化するなどの課題があった。特に、背景雑音レベルが高い場合、レベルの低い音声区間（例えば、音声の立ち上がり区間）と、雑音が変動している区間の判定が困難であるため、判定を誤って音声区間の特徴を推定雑音情報に取り込み易く、雑音抑圧後の音質が劣化し易いという課題があった。
【００１２】
この発明は上記のような課題を解決するためになされたもので、雑音区間の一次判定精度を高めて、精度よく雑音区間を判定することができる雑音区間判定装置を得ることを目的とする。
また、この発明は、雑音区間の判定精度を高めて、精度よく雑音を抑圧することができる雑音抑圧装置を得ることを目的とする。
さらに、この発明は、音声区間の特徴の取り込みを抑制して、精度よく推定雑音情報を更新することができる推定雑音情報更新方法を得ることを目的とする。
【００１３】
【課題を解決するための手段】
この発明に係る雑音区間判定装置は、記憶手段に記憶されている現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果を総合してＮフレーム前のフレームが雑音区間又は音声区間の何れであるかを判定する遅延判定手段を設け、その遅延判定手段の判定結果に応じて雑音区間又は音声区間の平均的な非遅延判定用パラメータを更新したのち、雑音区間及び音声区間の平均的な非遅延判定用パラメータと記憶手段に記憶されている現在のフレームよりＮフレーム前のフレームの非遅延判定用パラメータとを用いて判定用閾値を更新するようにしたものである。
【００１４】
この発明に係る雑音区間判定装置は、パラメータ分析手段により取得された現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果を総合してＮフレーム前のフレームが雑音区間又は音声区間の何れであるかを判定する遅延判定手段を設け、その遅延判定手段の判定結果に応じて雑音区間又は音声区間の平均的な非遅延判定用パラメータを更新したのち、雑音区間及び音声区間の平均的な非遅延判定用パラメータと上記パラメータ分析手段により取得された現在のフレームよりＮフレーム前のフレームの非遅延判定用パラメータとを用いて判定用閾値を更新するようにしたものである。
【００１５】
この発明に係る雑音区間判定装置は、遅延判定用パラメータと非遅延判定用パラメータを共通化するようにしたものである。
【００１６】
この発明に係る雑音区間判定装置は、現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと更新手段により更新された判定用閾値とを比較し、それらの比較結果を総合してＮフレーム前のフレームが雑音区間又は音声区間の何れであるかを判定するようにしたものである。
【００１７】
この発明に係る雑音区間判定装置は、遅延判定手段が音声区間である可能性の大きさを算出すると、その音声区間である可能性の大きさに基づいて更新速度を算出し、その更新速度と現在のフレームよりＮフレーム前のフレームの非遅延判定用パラメータとを用いて、雑音区間及び音声区間の平均的な非遅延判定用パラメータを更新するようにしたものである。
【００１８】
この発明に係る雑音区間判定装置は、更新手段により更新された判定用閾値の変動を分析し、その変動が大きい程、遅延判定手段の判定対象のフレームであるＮフレームを現在のフレームより過去のフレームに設定する遅延制御手段を設けたものである。
【００１９】
この発明に係る雑音区間判定装置は、現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果と非遅延判定手段によるＮフレーム前のフレームの判定結果とを総合して、Ｎフレーム前のフレームが雑音区間又は音声区間の何れであるかを判定するようにしたものである。
【００２０】
この発明に係る雑音区間判定装置は、判定用閾値を更新する際、非遅延判定手段の判定結果を用いて更新するようにしたものである。
【００２１】
この発明に係る雑音抑圧装置は、記憶手段に記憶されている現在のフレームよりＮフレーム前のフレームのスペクトルと遅延判定手段の判定結果とを用いて推定雑音スペクトルを更新する更新手段を設け、その更新手段により更新された推定雑音スペクトルを用いて入力音声の現在のフレームにおけるスペクトルを補正するようにしたものである。
【００２２】
この発明に係る雑音抑圧装置は、スペクトル分析手段により分析された現在のフレームよりＮフレーム前のフレームのスペクトルと遅延判定手段の判定結果とを用いて推定雑音スペクトルを更新する更新手段を設け、その更新手段により更新された推定雑音スペクトルを用いて入力音声の現在のフレームにおけるスペクトルを補正するようにしたものである。
【００２３】
この発明に係る雑音抑圧装置は、スペクトル分析手段により取得された入力音声のスペクトルから遅延判定用パラメータを算出するようにしたものである。
【００２４】
この発明に係る雑音抑圧装置は、更新手段により更新された推定雑音スペクトルから遅延判定用パラメータを算出するようにしたものである。
【００２５】
この発明に係る雑音抑圧装置は、遅延判定手段が音声区間である可能性の大きさを算出すると、その音声区間である可能性の大きさに基づいて更新速度を算出し、その更新速度と現在のフレームよりＮフレーム前のフレームのスペクトルとを用いて、推定雑音スペクトルを更新するようにしたものである。
【００２６】
この発明に係る雑音抑圧装置は、更新手段により更新された推定雑音スペクトルの変動を分析し、その変動が大きい程、遅延判定手段の判定対象のフレームであるＮフレームを現在のフレームより過去のフレームに設定する遅延制御手段を設けたものである。
【００２７】
この発明に係る雑音抑圧装置は、記憶手段に記憶されている入力音声の複数のフレームにおける遅延判定用パラメータからＮフレーム前が雑音区間又は音声区間の何れであるかを判定し、その判定結果と記憶手段に記憶されている入力音声のＮフレーム前の非遅延判定用パラメータから判定用閾値を更新する一方、スペクトル分析手段により取得された入力音声のスペクトルと非遅延判定手段の判定結果から推定雑音スペクトルを更新し、その推定雑音スペクトルを用いて入力音声の現在のフレームにおけるスペクトルを補正するようにしたものである。
【００２８】
この発明に係る雑音抑圧装置は、パラメータ分析手段により取得された入力音声の複数のフレームにおける遅延判定用パラメータからＮフレーム前が雑音区間又は音声区間の何れであるかを判定し、その判定結果とパラメータ分析手段により取得された入力音声のＮフレーム前の非遅延判定用パラメータから判定用閾値を更新する一方、スペクトル分析手段により取得された入力音声のスペクトルと非遅延判定手段の判定結果から推定雑音スペクトルを更新し、その推定雑音スペクトルを用いて入力音声の現在のフレームにおけるスペクトルを補正するようにしたものである。
【００２９】
この発明に係る推定雑音情報更新方法は、遅延判定用パラメータと特徴情報を記憶すると、入力音声の現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果を総合してＮフレーム前のフレームが雑音区間又は音声区間の何れであるかを判定し、その判定結果と現在のフレームよりＮフレーム前のフレームの特徴情報とを用いて推定雑音情報を更新するようにしたものである。
【００３０】
この発明に係る推定雑音情報更新方法は、遅延判定用パラメータと特徴情報を取得すると、その入力音声の現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果を総合してＮフレーム前のフレームが雑音区間又は音声区間の何れであるかを判定し、その判定結果と現在のフレームよりＮフレーム前のフレームの特徴情報とを用いて推定雑音情報を更新するようにしたものである。
【００３１】
この発明に係る推定雑音情報更新方法は、遅延判定用パラメータと特徴情報を共通化するようにしたものである。
【００３３】
この発明に係る推定雑音情報更新方法は、音声区間である可能性の大きさを算出して、その音声区間である可能性の大きさに基づいて更新速度を算出し、その更新速度と現在のフレームよりＮフレーム前のフレームの特徴情報とを用いて、推定雑音情報を更新するようにしたものである。
【００３４】
この発明に係る推定雑音情報更新方法は、推定雑音情報の変動を分析し、その変動が大きい程、判定対象のフレームであるＮフレームを現在のフレームより過去のフレームに設定するようにしたものである。
【００３５】
【発明の実施の形態】
以下、この発明の実施の一形態を説明する。
実施の形態１．
図１はこの発明の実施の形態１による雑音区間判定装置を示す構成図であり、図において、１は入力音声をフレーム毎に分析して、その入力音声の特徴を表す遅延判定用パラメータと非遅延判定用パラメータを取得するパラメータ分析部（パラメータ分析手段）、２は非遅延判定用パラメータを取得する非遅延判定用パラメータ分析部、３は遅延判定用パラメータを取得する遅延判定用パラメータ分析部である。
【００３６】
４はパラメータ分析部１により取得された遅延判定用パラメータと非遅延判定用パラメータを記憶する記憶部（記憶手段）、５は記憶部４に記憶されている入力音声の複数のフレームにおける遅延判定用パラメータからＮフレーム前が雑音区間又は音声区間の何れであるかを判定する遅延判定部（遅延判定手段）、６は記憶部４に記憶されている入力音声のＮフレーム前の非遅延判定用パラメータと遅延判定部５の判定結果から判定用閾値を更新する閾値算出部（更新手段）、７はパラメータ分析部１により取得された入力音声の現在のフレームにおける非遅延判定用パラメータと閾値算出部６により更新された判定用閾値を比較して、現在のフレームが雑音区間又は音声区間の何れであるかを判定する非遅延判定部（非遅延判定手段）である。
【００３７】
次に動作について説明する。
まず、フレームと呼ばれる所定の時間長の入力音声が、パラメータ分析部１内の非遅延判定用パラメータ分析部２と遅延判定用パラメータ分析部３に入力される。
【００３８】
非遅延判定用パラメータ分析部２は、入力音声を分析して、入力音声（現在のフレーム）の特徴を表す所定のパラメータを求め、これを非遅延判定用パラメータとして出力する。
一方、遅延判定用パラメータ分析部３は、入力音声を分析して、非遅延判定用パラメータ分析部２と異なる所定のパラメータ（現在のフレームの特徴を表す所定のパラメータ）を求め、これを遅延判定用パラメータとして出力する。
【００３９】
ここで、非遅延判定用パラメータ及び遅延判定用パラメータとしては、入力音声のパワー、帯域パワー、高域強調などの所定の加工処理を施した入力音声のパワー、ＬＳＰなどのスペクトル特徴を表すスペクトルパラメータ、このスペクトルパラメータを用いてスペクトル特徴を取り除いた後の残差信号のパワー、ピッチ周期の相関の大きさなど、従来の雑音区間判定装置で用いられている様々なパラメータを、単独または複数で用いることができる。
【００４０】
記憶部４は、パラメータ分析部１が非遅延判定用パラメータと遅延判定用パラメータを出力すると、これらを記憶するが、記憶部４は、（Ｎ＋１）フレーム分の非遅延判定用パラメータと、Ｍフレーム分の遅延判定用パラメータを記憶することができる能力を有する。
【００４１】
なお、記憶部４は、パラメータ分析部１が新たに現在のフレームの非遅延判定用パラメータと遅延判定用パラメータを出力すると、その内部に記憶されている最も過去のフレームの両パラメータ、即ち、（Ｎ＋１）フレーム前の非遅延判定用パラメータと、Ｍフレーム前の遅延判定用パラメータを忘却し、現在のフレームの非遅延判定用パラメータと、現在のフレームの遅延判定用パラメータを記憶することで内部状態を更新する。
この更新処理により、記憶部４内には、常にＮフレーム前から現在のフレームまでの、合計（Ｎ＋１）フレーム分の最新の非遅延判定用パラメータと、（Ｍ−１）フレーム前から現在のフレームまでの、合計Ｍフレーム分の最新の遅延判定用パラメータが格納されている状態が保たれる。ただし、Ｎは１以上の整数、ＭはＮより大きい整数である。
【００４２】
遅延判定部５は、記憶部４が非遅延判定用パラメータと遅延判定用パラメータを記憶すると、記憶部４に記憶されているＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が雑音区間であるか、音声区間であるかを判定し、その判定結果を閾値算出部６に出力する。
【００４３】
上記の判定は例えば以下のように行うことができる。
Ｍを雑音区間が必ず含まれるほど大きく取れる場合には、Ｍフレーム分の遅延判定用パラメータから雑音区間フレームを特定し、その雑音区間フレームの遅延判定用パラメータから平均的な雑音区間の遅延判定用パラメータを求める。
Ｍをそれほど大きく取れない場合には、各フレームの遅延判定用パラメータを用いて平均的な雑音区間の遅延判定用パラメータを逐次更新する。
【００４４】
そして、遅延判定部５の判定対象であるＮフレーム前及びその近傍のフレームの各遅延判定用パラメータと、この平均的な雑音区間の遅延判定用パラメータを比較して、各フレームに対する暫定的な雑音／音声区間の判定を行う。この暫定的な判定において、Ｎフレーム前が音声区間であると判定され、なおかつ、その前後の少なくとも一方に音声区間と判定されたフレームが所定数以上存在する場合に、Ｎフレーム前が音声区間であると判定する。
即ち、Ｎフレーム前の情報だけでなく、その近傍（現在を含む）の情報を用いて総合的に判定を行う。
【００４５】
図１９は遅延判定部５における判定方法の一例を説明する説明図である。
図１９では遅延判定用パラメータとして入力音声のパワーを使用し、背景雑音区間のパワーがある程度定常で、かつ、音声区間の大半より低い値となる条件を前提にして判定を行う。
【００４６】
図１９の場合には、ａの区間のパワー値が低いので暫定的に雑音区間と判定される。
ただし、図１９（１）では、Ｎフレーム前は暫定的に音声区間であると判定されるが、その前後に音声区間と判定されるフレームがないため、最終的にＮフレーム前は雑音区間であると判定される。
これに対し、図１９（２）では、Ｎフレーム前に加えて、（Ｎ−１）フレーム前以降に音声区間と判定されるフレームが多く存在するので、最終的にＮフレーム前は音声区間であると判定される。
【００４７】
閾値算出部６は、遅延判定部５が判定結果を出力すると、その判定結果と記憶部４に記憶されているＮフレーム前の非遅延判定用パラメータとを用いて、非遅延判定部７が使用する判定用閾値を更新し、更新後の判定用閾値を非遅延判定部７に出力する。
【００４８】
この更新は、例えば以下のように、１より小さい正の値αを更新速度として行うことができる。
まず、閾値算出部６は、内部パラメータとして、雑音区間の平均的な非遅延判定用パラメータＰｎと音声区間の平均的な非遅延判定用パラメータＰｓを更新する。
具体的には、遅延判定部５の判定結果が、Ｎフレーム前が雑音区間であるとする判定の場合、Ｎフレーム前の非遅延判定用パラメータＰを用いて雑音区間の平均的な非遅延判定用パラメータＰｎを更新する。
遅延判定部５の判定結果が、Ｎフレーム前が音声区間であるとする判定の場合、Ｎフレーム前の非遅延判定用パラメータＰを用いて音声区間の平均的な非遅延判定用パラメータＰｓを更新する。
【００４９】
この２つの内部パラメータの更新は、（１）式と（２）式に示すように、１フレーム前の非遅延判定用パラメータＰｎ又はＰｓにαを乗じたものと、Ｎフレーム前の非遅延判定用パラメータＰに（１−α）を乗じたものを加算することにより行う。
Ｐｎ←Ｐｎ×α＋Ｐ×（１−α）（１）
Ｐｓ←Ｐｓ×α＋Ｐ×（１−α）（２）
【００５０】
そして、閾値算出部６は、この２つの内部パラメータを用いて、以下の（３）式と（４）式によって第１の判定用閾値である判定用閾値Ｔｈ１と第２の判定用閾値である判定用閾値Ｔｈ２とを算出し、これを出力とする。なお、βとγは０より大きく１より小さい値で、βの方がγより小さい値をもつ。
Ｔｈ１＝Ｐｎ×β＋Ｐｓ×（１−β）（３）
Ｔｈ２＝Ｐｎ×γ＋Ｐｓ×（１−γ）（４）
【００５１】
非遅延判定部７は、閾値算出部６が判定用閾値Ｔｈ１，Ｔｈ２を更新すると、非遅延判定用パラメータ分析部２が出力する現在のフレームの非遅延判定用パラメータと、閾値算出部６が出力する判定用閾値とを比較して、現在のフレームが雑音区間であるか、音声区間であるかを判定し、その判定結果を出力する。
その判定は、前フレームが音声区間であって、現在のフレームの非遅延判定用パラメータが判定用閾値Ｔｈ１より大きい場合、または、前フレームが雑音区間であって、現在のフレームの非遅延判定用パラメータが判定用閾値Ｔｈ２より大きい場合に音声区間であると判定し、それ以外であれば雑音区間であると判定する。
【００５２】
なお、この実施の形態１では、雑音区間の平均的な非遅延判定用パラメータＰｎと音声区間の平均的な非遅延判定用パラメータＰｓを更新する更新速度として共通のαという値を用いたが、異なる更新速度を与えて、判定結果が良くなるように調整することも可能である。また、判定用閾値を更新するための値βとγは固定値である必要はなく、ＰｎとＰｓの値の差の大きさなどに基づいて適応的な値を与えてもよい。
【００５３】
また、この実施の形態１では、２つの判定用閾値Ｔｈ１，Ｔｈ２を用いたが、一つの判定用閾値だけの構成も可能である。また、ＰｎまたはＰｓの一方のみを更新するようにして、これをそのまま判定用閾値とする構成も可能である。また、記憶部４に記憶されている複数のフレームの非遅延判定用パラメータを用いて非遅延判定を行ってもよい。非遅延判定部７については、この他にも従来の様々な雑音区間判定装置で用いられてきた各種判定方法を用いることができる。
【００５４】
以上で明らかなように、この実施の形態１によれば、Ｎフレーム前が雑音区間であるか否かを、Ｎフレーム前を含む過去から現在までの複数フレームの遅延判定用パラメータに基づいて一次判定を実施し、この判定結果とＮフレーム前の非遅延判定用パラメータに基づいて非遅延判定に用いる判定用閾値を更新するようにしたので、一次判定においては、判定対象フレームであるＮフレーム前から見て過去と未来の情報を用いることができるので誤判定が抑制でき、その結果として、音声区間のパラメータを用いて判定用閾値である推定雑音情報（雑音区間の平均的な非遅延判定用パラメータ）を更新したり、雑音区間のパラメータを用いて判定用閾値である推定音声情報（音声区間の平均的な非遅延判定用パラメータ）を更新することが少なくなり、最終的な雑音区間判定の精度が向上する効果がある。背景雑音レベルが高い場合でも、音声の立ち上がり区間のようにレベルの低い音声区間と、雑音が変動して特徴パラメータが変化したのかが精度良く一次判定でき、安定に雑音区間判定が行える効果がある。
【００５５】
実施の形態２．
図２はこの発明の実施の形態２による雑音区間判定装置を示す構成図であり、図において、図１と同一符号は同一または相当部分を示すので説明を省略する。１１は入力音声を数フレーム分記憶する記憶部（記憶手段）、１２が記憶部１１に記憶されている入力音声を分析して、その入力音声の特徴を表す遅延判定用パラメータと非遅延判定用パラメータを取得するパラメータ分析部（パラメータ分析手段）、１３は非遅延判定用パラメータを取得する非遅延判定用パラメータ分析部、１４は遅延判定用パラメータを取得する遅延判定用パラメータ分析部である。
【００５６】
次に動作について説明する。
まず、フレームと呼ばれる所定の時間長の入力音声が、記憶部１１に入力される。
記憶部１１は、Ｍフレーム分の入力音声を記憶することができる能力を有し、その内部に記憶されている最も過去のフレームの入力音声を忘却し、入力された現在のフレームの入力音声を記憶することで内部状態を更新する。
この更新処理により、この記憶部１１内には、常に（Ｍ−１）フレーム前から現在のフレームまでの、合計Ｍフレーム分の最新の入力音声が格納されている状態が保たれる。
【００５７】
パラメータ分析部１２内の非遅延判定用パラメータ分析部１３は、記憶部１１に記憶されているＮフレーム前の入力音声と現在のフレームの入力音声を分析して、各フレームの入力音声の特徴を表す所定のパラメータを求め、これを各フレームの非遅延判定用パラメータとして出力する。
一方、パラメータ分析部１２内の遅延判定用パラメータ分析部１４は、記憶部１１に記憶されているＭフレーム分の入力音声を分析して、非遅延判定用パラメータ分析部１３と異なる所定のパラメータを求め、これを各フレームの遅延判定用パラメータとして出力する。
なお、非遅延判定用パラメータ及び遅延判定用パラメータについては、上記実施の形態１と同様に、従来の雑音区間判定装置で用いられている様々なパラメータを、単独または複数で用いることができる。
【００５８】
遅延判定部５は、遅延判定用パラメータ分析部１４がＭフレーム分の遅延判定用パラメータを出力すると、そのＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が雑音区間であるか、音声区間であるかを判定し、その判定結果を閾値算出部６に出力する。
【００５９】
閾値算出部６は、遅延判定部５が判定結果を出力すると、その判定結果と、非遅延判定用パラメータ分析部１３が出力するＮフレーム前の非遅延判定用パラメータとを用いて、非遅延判定部７が使用する判定用閾値を更新し、更新後の判定用閾値を非遅延判定部７に出力する。
【００６０】
そして、非遅延判定部７は、閾値算出部６が更新後の判定用閾値を出力すると、非遅延判定用パラメータ分析部１３が出力する現在のフレームの非遅延判定用パラメータと、更新後の判定用閾値とを比較して、現在のフレームが雑音区間であるか音声区間であるかを判定し、この判定結果を出力する。
遅延判定部５における判定方法、閾値算出部６における更新方法、非遅延判定部７における判定方法については、上記実施の形態１と同様な方法を用いることができる。
【００６１】
なお、この実施の形態２では、遅延判定部５が、遅延判定用パラメータ分析部１４が既に分析済みの複数フレームの遅延判定用パラメータを用いて判定を行ったが、遅延判定部５内での判定の信頼度が低いと判断される場合に、遅延判定部５が遅延判定用パラメータ分析部１４に別の遅延判定用パラメータの分析と出力を要求し、遅延判定用パラメータ分析部１４がこれに応えて、複数フレーム分の別の遅延判定用パラメータの分析と出力を行い、遅延判定部５が、このパラメータを用いて判定を行うようにすることもできる。
【００６２】
以上で明らかなように、この実施の形態２によれば、Ｍフレーム分の入力音声を記憶しておき、これから過去及び現在の非遅延判定用パラメータと遅延判定用パラメータを算出し、上記実施の形態１と同様にして一次判定と判定用閾値の更新を行うようにしたので、上記実施の形態１が持つ効果に加えて、非遅延判定用パラメータと遅延判定用パラメータの情報量の合計が入力音声の情報量を上回る場合に、記憶部１１の容量を削減できる効果が得られる。
【００６３】
また、遅延判定部５が、必要に応じて別の遅延判定用パラメータの分析と出力を要求する構成とした場合には、メモリ量を増加させず、平均的な処理量をあまり増加させないで、一次判定精度を改善でき、音声区間のパラメータを用いて判定用閾値である推定雑音情報（雑音区間の平均的な非遅延判定用パラメータ）を更新したり、雑音区間のパラメータを用いて判定用閾値である推定音声情報（音声区間の平均的な非遅延判定用パラメータ）を更新することが少なくなり、最終的な雑音区間判定の精度が向上する効果がある。
【００６４】
実施の形態３．
図３はこの発明の実施の形態３による雑音区間判定装置を示す構成図であり、図において、２１は入力音声をフレーム毎に分析して、その入力音声の特徴を表す判定用パラメータを取得するパラメータ分析部（パラメータ分析手段）、２２はパラメータ分析部２１により取得された判定用パラメーを記憶する記憶部（記憶手段）、２３は記憶部２２に記憶されている入力音声の複数のフレームにおける判定用パラメータからＮフレーム前が雑音区間又は音声区間の何れであるかを判定する遅延判定部（遅延判定手段）である。
【００６５】
２４は記憶部２２に記憶されている入力音声のＮフレーム前の判定用パラメータと遅延判定部２３の判定結果から判定用閾値を更新する閾値算出部（更新手段）、２５はパラメータ分析部２１により取得された入力音声の現在のフレームにおける非遅延判定用パラメータと閾値算出部２４により更新された判定用閾値を比較して、現在のフレームが雑音区間又は音声区間の何れであるかを判定する非遅延判定部（非遅延判定手段）である。
【００６６】
次に動作について説明する。
まず、フレームと呼ばれる所定の時間長の入力音声が、パラメータ分析部２１に入力される。
パラメータ分析部２１は、入力音声を分析して、入力音声（現在のフレーム）の特徴を表す所定のパラメータを求め、これを判定用パラメータとして出力する。なお、判定用パラメータについては、上記実施の形態１における非遅延判定用パラメータと同じものを用いる。
【００６７】
記憶部２２は、Ｍフレーム分の判定用パラメータを記憶することができる能力を有し、その内部に記憶されている最も過去のフレームの判定用パラメータ（Ｍフレーム前の判定用パラメータ）を忘却し、パラメータ分析部２１が出力する現在のフレームの判定用パラメータを記憶することで、内部状態を更新する。
この更新処理により、この記憶部２２内には、常に（Ｍ−１）フレーム前から現在のフレームまでの、合計Ｍフレーム分の最新の判定用パラメータが格納されている状態が保たれる。
【００６８】
遅延判定部２３は、記憶部２２に記憶されているＭフレーム分の判定用パラメータを用いて、Ｎフレーム前が雑音区間であるか、音声区間であるかを判定し、その判定結果を閾値算出部２４に出力する。
判定方法としては、上記実施の形態１における遅延判定部５の判定に用いる遅延判定用パラメータを、判定用パラメータに変更したものを用いることができる。
なお、遅延判定部２３の判定に用いるパラメータについては、判定用パラメータが複数のパラメータで構成されている場合に、その一部だけを用いて簡易に判定するようにしても構わない。
【００６９】
閾値算出部２４は、遅延判定部２３が判定結果を出力すると、その判定結果と、記憶部２２に記憶されているＮフレーム前の判定用パラメータとを用いて、非遅延判定部２５が使用する判定用閾値を更新し、更新後の判定用閾値を非遅延判定部２５に出力する。
更新方法としては、上記実施の形態１における閾値算出部６の更新に用いる遅延判定用パラメータを、判定用パラメータに変更したものを用いることができる。
【００７０】
そして、非遅延判定部２５は、閾値算出部２４が更新後の判定用閾値を出力すると、パラメータ分析部２１が出力する現在のフレームの判定用パラメータと、更新後の判定用閾値とを比較して、現在のフレームが雑音区間であるか音声区間であるかを判定し、この判定結果を出力する。
判定方法としては、上記実施の形態１における非遅延判定部７の判定に用いる非遅延判定用パラメータを、判定用パラメータに変更したものを用いることができる。
【００７１】
なお、この実施の形態３は、上記実施の形態１における非遅延判定用パラメータと遅延判定用パラメータを共通化して判定用パラメータのみとしたものに相当するが、同様に実施の形態２における非遅延判定用パラメータと遅延判定用パラメータを共通化して判定用パラメータのみとした構成も可能である。
【００７２】
以上で明らかなように、この実施の形態３によれば、上記実施の形態１における非遅延判定用パラメータと遅延判定用パラメータを共通化して判定用パラメータのみとしたので、上記実施の形態１が持つ効果に加えて、パラメータ分析処理量、記憶部２２における必要な記憶容量が削減できる効果がある。同様に実施の形態２における非遅延判定用パラメータと遅延判定用パラメータを共通化して判定用パラメータのみとしたので、上記実施の形態２が持つ効果に加えて、パラメータ分析処理量や記憶容量が削減できる効果がある。
【００７３】
実施の形態４．
図４はこの発明の実施の形態４による雑音区間判定装置を示す構成図であり、図において、図３と同一符号は同一または相当部分を示すので説明を省略する。２６は閾値算出部２４により更新された判定用閾値と入力音声の複数のフレームにおける遅延判定用パラメータを比較して、Ｎフレーム前が雑音区間又は音声区間の何れであるかを判定する遅延判定部（遅延判定手段）である。
【００７４】
次に動作について説明する。
まず、フレームと呼ばれる所定の時間長の入力音声が、パラメータ分析部２１に入力される。パラメータ分析部２１は、入力音声を分析して、入力音声（現在のフレーム）の特徴を表す所定のパラメータを求め、これを判定用パラメータとして出力する。
【００７５】
記憶部２２は、Ｍフレーム分の判定用パラメータを記憶することができる能力を有し、その内部に記憶されている最も過去のフレームの判定用パラメータ（Ｍフレーム前の判定用パラメータ）を忘却し、パラメータ分析部２１が出力する現在のフレームの判定用パラメータを記憶することで、内部状態を更新する。
【００７６】
遅延判定部２６は、記憶部２２に記憶されているＭフレーム分の判定用パラメータと、閾値算出部２４にて前フレームまでに更新されている判定用閾値を用いて、Ｎフレーム前が雑音区間であるか音声区間であるかを判定し、その判定結果を閾値算出部２４に出力する。この判定は例えば以下のように行うことができる。
【００７７】
遅延判定部２６の判定対象であるＮフレーム前及びその近傍のフレームの各判定用パラメータと、閾値算出部２４から出力された判定用閾値を比較して、各フレームに対する暫定的な雑音／音声区間の判定を行う。この暫定的な判定においてＮフレーム前が音声区間であると判定され、なおかつ、その前後の少なくとも一方に音声区間と判定されるフレームが所定数以上存在する場合には、Ｎフレーム前が音声区間であると判定する。即ち、Ｎフレーム前の情報だけでなく、その近傍（現在を含む）の情報を用いて、総合的に判定を行う。
なお、遅延判定部２６の判定に用いるパラメータについては、前記判定用パラメータが複数のパラメータで構成されている場合に、その一部だけを用いて簡易に判定するようにしても構わない。
【００７８】
閾値算出部２４は、遅延判定部２６が判定結果を出力すると、その判定結果と、記憶部２２に記憶されているＮフレーム前の判定用パラメータとを用いて、非遅延判定部２５が使用する判定用閾値を更新し、更新後の判定用閾値を非遅延判定部２５に出力する。
【００７９】
そして、非遅延判定部２５は、閾値算出部２４が更新後の判定用閾値を出力すると、パラメータ分析部２１が出力する現在のフレームの判定用パラメータと、更新後の判定用閾値とを比較して、現在のフレームが雑音区間であるか音声区間であるかを判定し、この判定結果を出力する。
【００８０】
以上で明らかなように、この実施の形態４によれば、上記実施の形態３の構成において、遅延判定部２６が、閾値算出部２４から出力される判定用閾値を用いて判定を行うようにしたので、上記実施の形態３が持つ効果に加えて、遅延判定部２６内での処理が簡易化でき、なおかつ、安定に更新された判定用閾値を利用することで一次判定の精度が一層改善し、音声区間のパラメータを用いて判定用閾値である推定雑音情報（雑音区間の平均的な非遅延判定用パラメータ）を更新したり、雑音区間のパラメータを用いて判定用閾値である推定音声情報（音声区間の平均的な非遅延判定用パラメータ）を更新することが少なくなり、最終的な雑音区間判定の精度が向上する効果がある。
【００８１】
実施の形態５．
上記実施の形態１では、遅延判定部５が判定結果のみを出力し、閾値算出部６が、遅延判定部５の判定結果が音声区間であるか雑音区間であるかに応じて判定用閾値の更新を行うものについて示したが、遅延判定部５が、Ｎフレーム前が音声区間である可能性の大きさを出力し、閾値算出部６がこの可能性の大きさに応じて判定用閾値の更新速度を制御する構成も可能である。
以下、図１に基づいて、動作が新規な部分のみ説明する。
【００８２】
遅延判定部５は、記憶部４に記憶されているＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が音声区間である可能性の大きさを算出して、その可能性の大きさを閾値算出部６に出力する。この算出は例えば以下のように行うことができる。
【００８３】
Ｍを雑音区間が必ず含まれるほど大きく取れる場合には、まず、Ｍフレーム分の遅延判定用パラメータから雑音区間フレームを特定する。
そして、この雑音区間フレームの遅延判定用パラメータから平均的な雑音区間の遅延判定用パラメータを求める。一方、Ｍをそれほど大きく取れない場合には、各フレームの遅延判定用パラメータを用いて平均的な雑音区間の遅延判定用パラメータを逐次更新する。
【００８４】
そして、遅延判定部５の判定対象であるＮフレーム前及びその近傍のフレームの各遅延判定用パラメータと、この平均的な雑音区間の遅延判定用パラメータとの距離を計算する。この複数の距離値を、予め用意しておいたニューラルネットワークに入力して、出力値として、Ｎフレーム前が音声区間である可能性の大きさを得る。
なお、このニューラルネットワークは、音声区間と雑音区間が正しく判定されている様々な雑音重畳音声データを分析して、上記と同様の距離値と正しい判定結果（音声区間なら１、雑音区間なら０）を教師信号として与えて学習を行っておく。この場合、常に０〜１の値が出力される。
【００８５】
閾値算出部６は、遅延判定部５により算出されたＮフレーム前が音声区間である可能性の大きさと、記憶部４に記憶されているＮフレーム前の非遅延判定用パラメータとを用いて、非遅延判定部７が使用する判定用閾値を更新し、更新後の判定用閾値を非遅延判定部７に出力する。この更新は、例えば以下のように行うことができる。
【００８６】
まず、内部パラメータとして、雑音区間の平均的な非遅延判定用パラメータＰｎと、音声区間の平均的な非遅延判定用パラメータＰｓを更新する。
具体的には、遅延判定部５により算出されたＮフレーム前が音声区間である可能性の大きさＱと、更新速度に関する固定値Ｃｎ，Ｃｓ（１より小さい正の固定値）とを用いて、（５）式及び（６）式から２つの更新速度αｎ，αｓを算出する。
【００８７】
そして、この２つの更新速度αｎ，αｓと、Ｎフレーム前の非遅延判定用パラメータＰとを用いて、（７）式及び（８）式から雑音区間の平均的な非遅延判定用パラメータＰｎと音声区間の平均的な非遅延判定用パラメータＰｓを更新する。
音声区間である可能性が高い場合には、Ｑが１に近づくため、αｎが１に近づくとともに、αｓが１−Ｃｓに近づき、Ｐｎの更新は殆ど行われず、Ｐｓの更新速度が大きくなる。
逆に音声区間である可能性が低い場合には、Ｑが０に近づくため、αｎが１−Ｃｎに近づくとともに、αｓが１に近づき、Ｐｓの更新は殆ど行われず、Ｐｎの更新速度が大きくなる。
【００８８】
αｎ＝１−Ｃｎ×（１−Ｑ）×（１−Ｑ）（５）
αｓ＝１−Ｃｓ×Ｑ×Ｑ（６）
Ｐｎ←Ｐｎ×αｎ＋Ｐ×（１−αｎ）（７）
Ｐｓ←Ｐｓ×αｓ＋Ｐ×（１−αｓ）（８）
そして、この２つの内部パラメータを用いて、前記（３）式と（４）式によって２つの判定用閾値Ｔｈ１，Ｔｈ２を算出し、これを出力とする。
【００８９】
この実施の形態５では、遅延判定部５において、遅延判定用パラメータ上での距離をニューラルネットワークに入力して音声区間である可能性の大きさを求めたが、距離に上限値を与えたり、対数距離、複数のパラメータの各々の重要度に基づいた重み付け距離などの尺度を用いても構わないし、ニューラルネットワークではなく、適切な演算式によって算出しても構わない。
更に更新速度の制御方法は（５）式と（６）式に限定されるものではなく、Ｑが０．６以上の時にのみＰｓの更新を行い、Ｑが０．４以下の時にのみＰｎの更新を行うなど、様々な方法が可能である。また、上記実施の形態２から実施の形態４の遅延判定部と閾値算出部を、この実施の形態５と同様なものに変更した構成も可能である。
【００９０】
以上で明らかなように、この実施の形態５によれば、上記実施の形態１から実施の形態４の構成において、Ｎフレーム前が音声区間である可能性の大きさを算出し、この可能性の大きさに基づいて判定用閾値の更新速度を制御するようにしたので、上記実施の形態１から実施の形態４が持つ効果に加えて、遅延判定部において音声区間であるか雑音区間であるかを２値判定していた場合に避けられない誤判定による判定用閾値の急激な更新を緩和でき、最終的な雑音区間判定の精度が向上する効果がある。この実施の形態５の場合、雑音区間であるか音声区間であるか曖昧な場合には、判定用閾値の更新が自動的に遅く制御されることにより上記の効果が得られる。
【００９１】
実施の形態６．
図５はこの発明の実施の形態６による雑音区間判定装置を示す構成図であり、図において、図１と同一符号は同一または相当部分を示すので説明を省略する。３１は閾値算出部６により更新された判定用閾値の変動を分析する変動性分析部（遅延制御手段）、３２は変動性分析部３１により分析された変動の大きさに応じて遅延フレーム数を示すＮの値を制御する遅延制御部（遅延制御手段）である。
【００９２】
次に動作について説明する。
まず、フレームと呼ばれる所定の時間長の入力音声が、パラメータ分析部１内の非遅延判定用パラメータ分析部２と遅延判定用パラメータ分析部３に入力される。
非遅延判定用パラメータ分析部２は、入力音声を分析して、入力音声（現在のフレーム）の特徴を表す所定のパラメータを求め、これを非遅延判定用パラメータとして出力する。
一方、遅延判定用パラメータ分析部３は、入力音声を分析して、非遅延判定用パラメータ分析部２と異なる所定のパラメータを求め、これを遅延判定用パラメータとして出力する。
【００９３】
記憶部４は、（Ｎ＋１）フレーム分の非遅延判定用パラメータとＭフレーム分の遅延判定用パラメータを記憶することができる能力を有し、その内部に記憶されている最も過去のフレームの両パラメータ、即ち、（Ｎ＋１）フレーム前の非遅延判定用パラメータと、Ｍフレーム前の遅延判定用パラメータを忘却し、非遅延判定用パラメータ分析部２が出力する現在のフレームの非遅延判定用パラメータと、遅延判定用パラメータ分析部３が出力する現在のフレームの遅延判定用パラメータを記憶することで、内部状態を更新する。
【００９４】
遅延判定部５は、記憶部４に記憶されているＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が雑音区間であるか音声区間であるかを判定し、その判定結果を閾値算出部６に出力する。
閾値算出部６は、遅延判定部５の判定結果と、記憶部４に記憶されているＮフレーム前の非遅延判定用パラメータとを用いて、非遅延判定部７が使用する判定用閾値を更新し、更新後の判定用閾値を非遅延判定部７と変動性分析部３１に出力する。
【００９５】
非遅延判定部７は、非遅延判定用パラメータ分析部２が出力する現在のフレームの非遅延判定用パラメータと、閾値算出部６が出力する判定用閾値とを比較して、現在のフレームが雑音区間であるか音声区間であるかを判定し、この判定結果を出力する。
【００９６】
変動性分析部３１は、閾値算出部６から出力された判定用閾値の変動の大きさを分析して、その結果を遅延制御部３２に出力する。
変動の分析としては、過去の複数フレーム分の判定用閾値を記憶しておき、その最大値と最小値の差の大きさを固定値にて正規化した値を求めたり、フレーム毎の判定用閾値の変化量を求めて、その最大値や標準偏差を固定値にて正規化した値を求めるなど、様々な方法が可能である。
【００９７】
変動性分析部３１で求める変動の大きさは、雑音の変動性に関するものである。従って、判定用閾値として、上記実施の形態１と同様に、雑音区間の平均的な非遅延判定用パラメータと音声区間の平均的な非遅延判定用パラメータを用いている場合には、雑音区間の平均的な非遅延判定用パラメータの変動の大きさを分析する。
【００９８】
遅延制御部３２は、変動性分析部３１により分析された変動の大きさが大きいほど、遅延フレーム数Ｎを大きく制御し、このＮの値を記憶部４、遅延判定部５及び閾値算出部６に出力する。
記憶部４、遅延判定部５及び閾値算出部６は前記した通り、このＮの値を用いて、次のフレーム以降の各処理を行う。
【００９９】
Ｎの制御方法の一例としては、上限値と下限値を与え、変動の大きさが所定の閾値を上回るフレームと下回るフレームをカウントアップし、所定の閾値を上回るフレーム数の方が所定数より多くなったらＮを１増やし、逆に所定の閾値を下回るフレーム数の方が所定数より多くなったらＮを１減らし、Ｎを増減させたらフレーム数のカウントを初期化する。なお、変動の大きさに関する所定の閾値については、Ｎの値毎に用意しておいて現在のＮの値に応じて与えればよい。
【０１００】
なお、この実施の形態６では、上記実施の形態１をベースにして、変動性分析部３１と遅延制御部３２を追加した構成としているが、上記実施の形態２から実施の形態５に対して、同様の変動性分析部３１と遅延制御部３２を追加した構成も可能である。
【０１０１】
以上で明らかなように、この実施の形態６によれば、上記実施の形態１から実施の形態５の構成において、判定用閾値の変動の大きさを分析し、その大きさが大きいほど、遅延フレーム数Ｎを大きく制御するようにしたので、上記実施の形態１から実施の形態５が持つ効果に加えて、雑音の変動が大きく一次判定誤りの可能性が高い場合に遅延フレーム数Ｎを増やして、一次判定誤りの増加を抑制することができ、最終的な雑音区間判定の精度が向上する効果がある。雑音の変動性が小さい場合には、遅延フレーム数Ｎを減らすことで、記憶部４における記憶容量を減らすことができ、判定用閾値の雑音に対する追従性が向上して最終的な雑音区間判定の精度が向上する効果がある。
【０１０２】
実施の形態７．
図６はこの発明の実施の形態７による雑音区間判定装置を示す構成図であり、図において、図１と同一符号は同一または相当部分を示すので説明を省略する。３３は雑音区間又は音声区間の何れであるかを判定する際、非遅延判定部７の判定結果を考慮して判定する遅延判定部（遅延判定手段）である。
【０１０３】
次に動作について説明する。
まず、フレームと呼ばれる所定の時間長の入力音声が、判定用パラメータ分析部１内の非遅延判定用パラメータ分析部２と遅延判定用パラメータ分析部３に入力される。
非遅延判定用パラメータ分析部２は、入力音声を分析して、入力音声（現在のフレーム）の特徴を表す所定のパラメータを求め、これを非遅延判定用パラメータとして出力する。
一方、遅延判定用パラメータ分析部３は、入力音声を分析して、非遅延判定用パラメータ分析部２と異なる所定のパラメータを求め、これを遅延判定用パラメータとして出力する。
【０１０４】
記憶部４は、（Ｎ＋１）フレーム分の非遅延判定用パラメータ、Ｍフレーム分の遅延判定用パラメータ、Ｍフレーム分の非遅延判定部７の判定結果を記憶することができる能力を有し、その内部に記憶されている最も過去のフレームの各パラメータ、即ち、（Ｎ＋１）フレーム前の非遅延判定用パラメータ、Ｍフレーム前の遅延判定用パラメータ及びＭフレーム分の非遅延判定部７の判定結果を忘却し、非遅延判定用パラメータ分析部２が出力する現在のフレームの非遅延判定用パラメータと、遅延判定用パラメータ分析部３が出力する現在のフレームの遅延判定用パラメータと、非遅延判定部７が出力する判定結果を記憶することで、内部状態を更新する。
【０１０５】
遅延判定部３３は、記憶部４に記憶されているＭフレーム分の遅延判定用パラメータとＭフレーム分の非遅延判定部７の判定結果を用いて、Ｎフレーム前が雑音区間であるか音声区間であるかを判定し、その判定結果を閾値算出部６に出力する。その判定方法は以下の通りである。
【０１０６】
まず、上記実施の形態１における遅延判定部５と同様の方法を用いて、記憶部４に記憶されているＭフレーム分の遅延判定用パラメータから第一の判定を行う。
次に、記憶部４に記憶されているＭフレーム分の非遅延判定部７の判定結果を用いて、Ｎフレーム前が雑音区間であるか音声区間であるかの第二の判定を行う。この第二の判定は、Ｎフレーム前の非遅延判定部７の判定結果が音声区間であるという判定であり、なおかつ、その前後の少なくとも一方に音声区間があると判定されたフレームが所定数以上存在する場合に、Ｎフレーム前が音声区間であると判定する。
【０１０７】
そして、第一の判定と第二の判定の結果が一致する場合には、それらの判定結果を遅延判定部３３の判定結果として出力する。
一方、第一の判定と第二の判定の結果が一致しない場合には、音声区間であるか雑音区間であるかの判定を実施せず、「不定」という判定結果を出力する。なお、判定方法の詳細については、ここで説明した方法に限定されるものではない。
【０１０８】
閾値算出部６は、遅延判定部３３の判定結果と、記憶部４に記憶されているＮフレーム前の非遅延判定用パラメータとを用いて、非遅延判定部７が使用する判定用閾値を更新し、更新後の判定用閾値を非遅延判定部７に出力する。
更新方法としては、遅延判定部３３の判定結果が、Ｎフレーム前が雑音区間であるとする判定の場合には、Ｎフレーム前の非遅延判定用パラメータを用いて雑音区間の平均的な非遅延判定用パラメータを更新する。遅延判定部３３の判定結果が、Ｎフレーム前が音声区間であるとする判定の場合には、Ｎフレーム前の非遅延判定用パラメータを用いて音声区間の平均的な非遅延判定用パラメータを更新する。遅延判定部３３の判定結果が「不定」である場合には、どちらの更新も行わない。
【０１０９】
最後に、非遅延判定部７は、非遅延判定用パラメータ分析部２が出力する現在のフレームの非遅延判定用パラメータと、閾値算出部６が出力する判定用閾値とを比較して、現在のフレームが雑音区間であるか音声区間であるかを判定し、この判定結果を出力する。
【０１１０】
なお、この実施の形態７において、遅延判定部３３がＭフレーム分の非遅延判定部７の判定結果のみを用いて判定を行い、遅延判定用パラメータ分析部３、記憶部４内の遅延判定用パラメータを省略する構成も可能である。
また、この実施の形態７は、上記実施の形態１において、Ｍフレーム分の判定結果を記憶して、遅延判定に使用するようにしたものであるが、上記実施の形態２においても同様な変更が可能である。
【０１１１】
以上で明らかなように、この実施の形態７によれば、上記実施の形態１及び実施の形態２の構成において、少なくとも複数の非遅延判定部７の判定結果を用いて遅延判定を行うようにしたので、判定のための情報量が増えることで一次判定（遅延判定）の精度が改善し、最終的な雑音区間判定の精度が向上する効果がある。また、一次判定において音声区間か雑音区間かの判定がつかない場合に判定用閾値の更新を行わないようにしたので、音声区間の情報を用いて誤って雑音区間に関する判定用閾値を更新したり、雑音区間の情報を用いて誤って音声区間に関する判定用閾値を更新することを抑制でき、最終的な雑音区間判定が安定化する効果がある。
【０１１２】
実施の形態８．
上記実施の形態７では、遅延判定部３３が複数の非遅延判定部７の判定結果を用いて遅延判定を行うようにしたが、遅延判定部３３は上記実施の形態１と同じ方法で判定を行い、閾値算出部６が遅延判定部３３の判定結果と、記憶部４に記憶されているＮフレーム前の非遅延判定用パラメータと複数フレーム分の非遅延判定部７の判定結果を用いて判定用閾値を算出する構成も可能である。以下、図６に基づいて、動作が新規な部分のみ説明する。
【０１１３】
遅延判定部３３は、上記実施の形態１における遅延判定部５と同様に、記憶部４に記憶されているＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が雑音区間であるか音声区間であるか判定し、その判定結果を閾値算出部６に出力する。
【０１１４】
閾値算出部６は、遅延判定部３３の判定結果と、記憶部４に記憶されているＮフレーム前の非遅延判定用パラメータと、記憶部４に記憶されているＭフレーム分の非遅延判定部７の判定結果を用いて、非遅延判定部７が使用する判定用閾値を更新し、更新後の判定用閾値を非遅延判定部７に出力する。
【０１１５】
更新方法としては、遅延判定部３３の判定結果と、Ｎフレーム前の非遅延判定部７の判定結果の両方が雑音区間である場合には、Ｎフレーム前の非遅延判定用パラメータを用いて雑音区間の平均的な非遅延判定用パラメータを更新する。
遅延判定部３３の判定結果と、Ｎフレーム前の非遅延判定部７の判定結果の両方が音声区間である場合には、Ｎフレーム前の非遅延判定用パラメータを用いて音声区間の平均的な非遅延判定用パラメータを更新する。
遅延判定部３３の判定結果と、Ｎフレーム前の非遅延判定部７の判定結果が一致しない場合には、どちらの更新も行わない。なお、更新方法の詳細については、ここで説明した方法に限定されるものではない。
【０１１６】
なお、この実施の形態８において、閾値算出部６がＮフレーム前の非遅延判定用パラメータとＭフレーム分の非遅延判定部７の判定結果だけを用いて更新を行い、遅延判定用パラメータ分析部３、記憶部４内の遅延判定用パラメータ、遅延判定部３３を省略する構成も可能である。
また、この実施の形態８は、上記実施の形態１における記憶部４と閾値算出部６を変更したものであるが、上記実施の形態２においても同様な変更が可能である。
【０１１７】
以上で明らかなように、この実施の形態８によれば、上記実施の形態１及び実施の形態２の構成において、少なくとも記憶部４に記憶されている非遅延判定用パラメータと非遅延判定部７の判定結果を用いて、非遅延判定のための判定用閾値を算出するようにしたので、遅延判定結果と合わせた場合には誤った閾値の更新が抑制され、最終的な雑音区間判定の精度が向上する効果がある。遅延判定結果を用いない場合には、より簡単な構成とできる効果がある。また、遅延判定部３３の判定結果と、Ｎフレーム前の非遅延判定部７の判定結果が一致しない場合には判定用閾値の更新を行わないようにしたので、音声区間の情報を用いて誤って雑音区間に関する判定用閾値を更新したり、雑音区間の情報を用いて誤って音声区間に関する判定用閾値を更新することを抑制でき、最終的な雑音区間判定が安定化する効果がある。
【０１１８】
実施の形態９．
図７はこの発明の実施の形態９による雑音抑圧装置を示す構成図であり、図において、４１は入力音声をフレーム毎に分析して、その入力音声のスペクトルを取得するスペクトル分析部（スペクトル分析手段）、４２は入力音声に応じて推定雑音スペクトルを更新する推定雑音スペクトル更新部、４３は入力音声をフレーム毎に分析して、その入力音声の特徴を表す遅延判定用パラメータを取得するパラメータ分析部（パラメータ分析手段）、４４はスペクトル分析部４１により取得されたスペクトルとパラメータ分析部４３により取得された遅延判定用パラメータを記憶する記憶部（記憶手段）、４５は記憶部４４に記憶されている入力音声の複数のフレームにおける遅延判定用パラメータからＮフレーム前が雑音区間又は音声区間の何れであるかを判定する遅延判定部（遅延判定手段）、４６は記憶部４４に記憶されている入力音声のＮフレーム前のスペクトルと遅延判定部４５の判定結果から推定雑音スペクトルを更新する更新部（更新手段）である。
【０１１９】
４７は推定雑音スペクトル更新部４２の更新部４６により更新された推定雑音スペクトルを用いて入力音声の現在のフレームにおけるスペクトルを補正するスペクトル補正部（補正手段）、４８はスペクトル補正部４７により補正されたスペクトルをフーリエ変換により信号領域に変換し、その得られた信号を連接して出力音声を生成する出力音声生成部（音声生成手段）である。
【０１２０】
次に動作について説明する。
まず、フレームと呼ばれる所定の時間長の入力音声が、スペクトル分析部４１と推定雑音スペクトル更新部４２内のパラメータ分析部４３に入力される。
【０１２１】
スペクトル分析部４１は、入力音声を分析して、入力音声（現在のフレーム）のスペクトルを求め、これを入力音声スペクトルとして、スペクトル補正部４７に出力する。また、この入力音声スペクトルの各周波数成分のパワーを求めて、その得られたパワースペクトルを必要に応じてスペクトル補正部４７に出力する。
さらに、このパワースペクトルを対数領域に変換して、その得られた対数パワースペクトルを推定雑音スペクトル更新部４２内の記憶部４４に出力する。なお、入力音声スペクトルの算出は、入力音声にハニング窓や台形窓をかけた信号に対してＦＦＴやＤＦＴなどのフーリエ変換を行うことによって実行できる。
【０１２２】
推定雑音スペクトル更新部４２内のパラメータ分析部４３は、入力音声を分析して、入力音声（現在のフレーム）の特徴を表す所定のパラメータを求め、これを遅延判定用パラメータとして出力する。
ここで、遅延判定用パラメータとしては、入力音声のパワー、帯域パワー、高域強調などの所定加工処理を施した入力音声のパワー、ＬＳＰなどのスペクトル特徴を表すスペクトルパラメータ、このスペクトルパラメータを用いてスペクトル特徴を取り除いた後の残差信号のパワー、ピッチ周期の相関の大きさなど、従来の雑音区間判定装置で用いられている様々なパラメータを、単独または複数用いることができる。
【０１２３】
記憶部４４は、（Ｎ＋１）フレーム分の対数パワースペクトルとＭフレーム分の遅延判定用パラメータを記憶することができる能力を有し、その内部に記憶されている最も過去のフレームの両パラメータ、即ち、（Ｎ＋１）フレーム前の対数パワースペクトルとＭフレーム前の遅延判定用パラメータを忘却し、スペクトル分析部４１が出力する現在のフレームの対数パワースペクトルと、パラメータ分析部４３が出力する現在のフレームの遅延判定用パラメータを記憶することで、内部状態を更新する。
【０１２４】
この更新処理により、この記憶部４４内には、常にＮフレーム前から現在のフレームまでの、合計（Ｎ＋１）フレーム分の最新の対数パワースペクトルと、（Ｍ−１）フレーム前から現在のフレームまでの、合計Ｍフレーム分の最新の遅延判定用パラメータが格納されている状態が保たれる。なお、Ｎは１以上の整数、ＭはＮより大きい整数である。
【０１２５】
遅延判定部４５は、記憶部４４に記憶されているＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が雑音区間であるか音声区間であるかを判定し、その判定結果を更新部４６に出力する。この判定は例えば以下のように行うことができる。
【０１２６】
Ｍを雑音区間が必ず含まれるほど大きく取れる場合には、まず、Ｍフレーム分の遅延判定用パラメータから雑音区間フレームを特定する。
そして、この雑音区間フレームの遅延判定用パラメータから平均的な雑音区間の遅延判定用パラメータを求める。一方、Ｍをそれほど大きく取れない場合には、各フレームの遅延判定用パラメータを用いて平均的な雑音区間の遅延判定用パラメータを逐次更新する。
【０１２７】
そして、遅延判定部４５の判定対象であるＮフレーム前及びその近傍のフレームの各遅延判定用パラメータと、この平均的な雑音区間の遅延判定用パラメータを比較して、各フレームに対する暫定的な雑音／音声区間の判定を行う。
この暫定的な判定において、Ｎフレーム前が音声区間であると判定され、なおかつ、その前後の少なくとも一方に音声区間があると判定されたフレームが所定数以上存在する場合には、Ｎフレーム前が音声区間であると判定する。即ち、Ｎフレーム前の情報だけでなく、その近傍（現在を含む）の情報を用いて、総合的に判定を行う。この判定方法の一例については、上記実施の形態１において、図１９を用いて説明した通りである。
【０１２８】
更新部４６は、遅延判定部４５の判定結果と、記憶部４４に記憶されているＮフレーム前の対数パワースペクトルとを用いて、雑音区間の平均的な対数パワースペクトルである推定雑音スペクトルを更新し、更新後の推定雑音スペクトルをスペクトル補正部４７に出力する。この更新は、例えば以下のように、１より小さい正の値αを更新速度として行うことができる。
【０１２９】
遅延判定部４５の判定結果が、Ｎフレーム前が雑音区間であるとする判定の場合に限り、Ｎフレーム前の対数パワースペクトルｌｏｇ（Ｓｐ）を下記の（９）式に代入して、推定雑音スペクトルの対数値ｌｏｇ（Ｓｐｎ）を更新する。
即ち、１フレーム前の推定雑音スペクトルの対数値ｌｏｇ（Ｓｐｎ）にαを乗じたものと、Ｎフレーム前の対数パワースペクトルｌｏｇ（Ｓｐ）に（１−α）を乗じたものを加算して、新たな推定雑音スペクトルの対数値ｌｏｇ（Ｓｐｎ）とする。なお、Ｓｐ及びＳｐｎは、各周波数成分の値を要素とするベクトルとなっている。

【０１３０】
スペクトル補正部４７は、推定雑音スペクトル更新部４２内の更新部４６が出力する推定雑音スペクトルを用いて、スペクトル分析部４１が出力する現在のフレームの入力音声スペクトルに対する補正処理を実施し、その得られた補正スペクトルを出力音声生成部４８に出力する。
【０１３１】
この補正処理の最も簡単なものとしては、各周波数ｆの成分毎に、下記の（１０）式に従って、入力音声のパワースペクトルＳｐから推定雑音スペクトルＳｐｎを減算したときのパワースペクトルの減少率ｇを算出し、この減少率ｇを入力音声スペクトルに対応する各周波数成分に乗じる方法がある。

【０１３２】
なお、この補正処理については、補正によって振幅が小さくなり過ぎた周波数成分に対して適切な振幅値を与えるように修正するなど、従来の雑音抑圧装置に用いられている様々な処理を適用することができる。
【０１３３】
出力音声生成部４８は、スペクトル補正部４７が出力する補正スペクトルに対して、逆ＦＦＴ、逆ＤＦＴなどのフーリエ変換処理を行って、信号領域に戻し、その得られた信号をハニング窓や台形窓などの適切な窓をかけつつフレーム間を連接し、その連接した信号をフレーム周期毎に出力音声として出力する。
【０１３４】
なお、この実施の形態９では、記憶部４４に対数パワースペクトルを記憶する構成としたが、同情報を含む入力音声スペクトルそのものや、等価な振幅スペクトルやパワースペクトルなどを記憶する構成としても構わない。
【０１３５】
以上で明らかなように、この実施の形態９によれば、Ｎフレーム前が雑音区間であるか否かを、Ｎフレーム前を含む過去から現在までの複数のフレームの遅延判定用パラメータに基づいて判定し、この判定結果とＮフレーム前の対数パワースペクトルに基づいて推定雑音スペクトルを更新するようにしたので、Ｎフレーム前が雑音区間であるか否かの判定においては、判定対象フレームであるＮフレーム前から見て過去と未来の情報を用いることができるので誤判定が抑制でき、その結果として、パワーが大きい音声区間の対数パワースペクトルを用いて推定雑音スペクトルを過大に更新することが少なくなり、スペクトル補正部４７における過剰な補正が抑制され、最終的に雑音抑圧された出力音声における音質が改善する効果が得られる。
【０１３６】
実施の形態１０．
図８はこの発明の実施の形態１０による雑音抑圧装置を示す構成図であり、図において、図７と同一符号は同一または相当部分を示すので説明を省略する。
５１は入力音声を数フレーム分記憶する記憶部（記憶手段）、５２は記憶部５１に記憶されている入力音声を分析して、その入力音声のＮフレーム前のスペクトルを取得するスペクトル分析部（スペクトル分析手段）、５３は入力音声に応じて推定雑音スペクトルを更新する推定雑音スペクトル更新部、５４は記憶部５１に記憶されている入力音声を分析して、その入力音声の特徴を表す遅延判定用パラメータを取得するパラメータ分析部（パラメータ分析手段）である。
【０１３７】
次に動作について説明する。
まず、フレームと呼ばれる所定の時間長の入力音声が、記憶部５１に入力される。記憶部５１は、Ｍフレーム分の入力音声を記憶することができる能力を有し、その内部に記憶されている最も過去のフレームの入力音声を忘却し、入力された現在のフレームの入力音声を記憶することで、内部状態を更新する。この更新処理により、この記憶部５１内には、常に（Ｍ−１）フレーム前から現在のフレームまでの、合計Ｍフレーム分の最新の入力音声が格納されている状態が保たれる。
【０１３８】
スペクトル分析部５２は、記憶部５１に記憶されている入力音声を分析して、入力音声（現在のフレーム）のスペクトルを求め、これを入力音声スペクトルとして、スペクトル補正部４７に出力する。また、必要に応じて、この入力音声スペクトルの各周波数成分のパワーを求めて、その得られたパワースペクトルをスペクトル補正部４７に出力する。
さらに、スペクトル分析部５２は、記憶部５１に記憶されているＮフレーム前の入力音声を分析して、Ｎフレーム前のスペクトルを求め、その各周波数成分のパワーを求めて、対数領域に変換して、その得られた対数パワースペクトルを推定雑音スペクトル更新部４５内の更新部４６に出力する。
なお、スペクトルの算出は、入力音声にハニング窓や台形窓をかけた信号に対して、ＦＦＴやＤＦＴなどのフーリエ変換を行うことによって実行できる。
【０１３９】
推定雑音スペクトル更新部５３内のパラメータ分析部５４は、記憶部５１に記憶されているＭフレーム分の入力音声を分析して、入力音声（各フレーム）の特徴を表す所定のパラメータを求め、これを各フレームの遅延判定用パラメータとして出力する。
なお、非遅延判定用パラメータ及び遅延判定用パラメータについては、上記実施の形態９と同様に、従来の雑音区間判定装置で用いられている様々なパラメータを、単独または複数用いることができる。
【０１４０】
遅延判定部４５は、パラメータ分析部５４が出力するＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が雑音区間であるか音声区間であるかを判定し、その判定結果を更新部４６に出力する。
更新部４６は、遅延判定部４５の判定結果と、スペクトル分析部５２が出力するＮフレーム前の対数パワースペクトルとを用いて、雑音区間の平均的な対数パワースペクトルである推定雑音スペクトルを更新し、更新後の推定雑音スペクトルをスペクトル補正部４７に出力する。
【０１４１】
スペクトル補正部４７は、推定雑音スペクトル更新部５３内の更新部４６が出力する推定雑音スペクトルを用いて、スペクトル分析部５２が出力する現在のフレームの入力音声スペクトルに対する補正処理を実施し、その得られた補正スペクトルを出力音声生成部４８に出力する。
【０１４２】
出力音声生成部４８は、スペクトル補正部４７が出力する補正スペクトルに対して、逆ＦＦＴ、逆ＤＦＴなどのフーリエ変換処理を行って、信号領域に戻し、その得られた信号をハニング窓や台形窓などの適切な窓をかけつつフレーム間を連接し、その連接した信号をフレーム周期毎に出力音声として出力する。
【０１４３】
以上で明らかなように、この実施の形態１０によれば、Ｍフレーム分の入力音声を記憶しておき、これから過去及び現在の入力音声スペクトルと遅延判定用パラメータを算出し、上記実施の形態９と同様にして、雑音区間の判定と推定雑音スペクトルの更新を行うようにしたので、上記実施の形態９が持つ効果に加えて、（Ｎ＋１）フレーム分の対数パワースペクトルとＭフレーム分の遅延判定用パラメータの情報量の合計が（Ｎ＋１）フレーム分の入力音声の情報量を上回る場合に、記憶部５１の容量を削減できる効果が得られる。
【０１４４】
実施の形態１１．
図９はこの発明の実施の形態１１による雑音抑圧装置を示す構成図であり、図において、図７と同一符号は同一または相当部分を示すので説明を省略する。
５５はスペクトル分析部４１により取得された入力音声のスペクトルから遅延判定用パラメータを算出するパラメータ分析部（パラメータ分析手段）である。
【０１４５】
次に動作について説明する。
まず、フレームと呼ばれる所定の時間長の入力音声が、スペクトル分析部４１に入力される。
【０１４６】
スペクトル分析部４１は、入力音声を分析して、入力音声（現在のフレーム）のスペクトルを求め、これを入力音声スペクトルとして、スペクトル補正部４７に出力する。また、この入力音声スペクトルの各周波数成分のパワーを求めて、その得られたパワースペクトルを必要に応じてスペクトル補正部４７に出力する。
さらに、このパワースペクトルを対数領域に変換して、その得られた対数パワースペクトルを推定雑音スペクトル更新部４２内の記憶部４４及びパラメータ分析部５５に出力する。なお、入力音声スペクトルの算出は、入力音声にハニング窓や台形窓をかけた信号に対してＦＦＴやＤＦＴなどのフーリエ変換を行うことによって実行できる。
【０１４７】
推定雑音スペクトル更新部４２内のパラメータ分析部５５は、スペクトル分析部４１が出力する対数パワースペクトルを分析して、入力音声（現在のフレーム）の特徴を表す所定のパラメータを求め、これを遅延判定用パラメータとして出力する。
【０１４８】
ここで、遅延判定用パラメータとしては、対数領域で所定帯域内を平均することで算出した帯域パワー（低域パワー、高域パワーの２分割が最も単純）、全帯域のパワー、高域に重みを強く設定して加算した対数スペクトルの重み付き和、対数パワースペクトルをフーリエ変換して求められるケプストラムなどのスペクトルパラメータ、このスペクトルパラメータを用いてスペクトル特徴を取り除いた後の残差信号のパワー、ケプストラムの高次から求められるピッチ周期の相関の大きさなど、様々なパラメータを、単独または複数用いることができる。
【０１４９】
記憶部４４は、（Ｎ＋１）フレーム分の対数パワースペクトルとＭフレーム分の遅延判定用パラメータを記憶することができる能力を有し、上記実施の形態９と同様に、その内部に記憶されている最も過去のフレームの両パラメータ、即ち、（Ｎ＋１）フレーム前の対数パワースペクトルとＭフレーム前の遅延判定用パラメータを忘却し、スペクトル分析部５１が出力する現在のフレームの対数パワースペクトルと、パラメータ分析部５５が出力する現在のフレームの遅延判定用パラメータを記憶することで、内部状態を更新する。
【０１５０】
遅延判定部４５は、記憶部４４に記憶されているＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が雑音区間であるか音声区間であるかを判定し、その判定結果を更新部４６に出力する。
更新部４６は、遅延判定部４５の判定結果と、記憶部４４に記憶されているＮフレーム前の対数パワースペクトルとを用いて、雑音区間の平均的な対数パワースペクトルである推定雑音スペクトルを更新し、更新後の推定雑音スペクトルをスペクトル補正部４７に出力する。
【０１５１】
スペクトル補正部４７は、推定雑音スペクトル更新部４２内の更新部４６が出力する推定雑音スペクトルを用いて、スペクトル分析部４１が出力する現在のフレームの入力音声スペクトルに対する補正処理を実施し、その得られた補正スペクトルを出力音声生成部４８に出力する。
【０１５２】
そして、出力音声生成部４８は、スペクトル補正部４７が出力する補正スペクトルに対して、逆ＦＦＴ、逆ＤＦＴなどのフーリエ変換処理を行って、信号領域に戻し、その得られた信号をハニング窓や台形窓などの適切な窓をかけつつフレーム間を連接し、その連接した信号をフレーム周期毎に出力音声として出力する。
【０１５３】
なお、この実施の形態１１では、パラメータ分析部５５が対数パワースペクトルを分析して遅延判定用パラメータを算出したが、対数パワースペクトルではなく、入力音声スペクトルやそのパワースペクトルを分析して算出を行うようにしても構わない。
また、この実施の形態１１は、上記実施の形態９における遅延判定用パラメータをスペクトル分析部４１の出力結果を用いて分析するようにしたものに相当するが、同様に実施の形態１０における遅延判定用パラメータを、スペクトル分析部４１の出力結果を用いて分析するようにした構成も可能である。
【０１５４】
以上で明らかなように、この実施の形態１１によれば、上記実施の形態９における遅延判定用パラメータをスペクトル分析部４１の出力結果を用いて分析するようにしたので、上記実施の形態９が持つ効果に加えて、パラメータ分析処理量を削減できる効果がある。同程度の処理量であれば、より精度の高い雑音区間判定が行えるため、パワーが大きい音声区間の対数パワースペクトルを用いて推定雑音スペクトルを過大に更新することが少なくなり、スペクトル補正部４７における過剰な補正が抑制され、最終的に雑音抑圧された出力音声における音質が改善する効果が得られる。
【０１５５】
同様に実施の形態１０における遅延判定用パラメータをスペクトル分析部４１の出力結果を用いて分析するようにしたので、上記実施の形態９が持つ効果に加えて、パラメータ分析処理量を削減できる効果がある。同程度の処理量であれば、より精度の高い雑音区間判定が行えるため、パワーが大きい音声区間の対数パワースペクトルを用いて推定雑音スペクトルを過大に更新することが少なくなり、スペクトル補正部４７における過剰な補正が抑制され、最終的に雑音抑圧された出力音声における音質が改善する効果が得られる。
【０１５６】
実施の形態１２．
図１０はこの発明の実施の形態１２による雑音抑圧装置を示す構成図であり、図において、図９と同一符号は同一または相当部分を示すので説明を省略する。５６は更新部４６により更新された推定雑音スペクトルから遅延判定用パラメータを算出するパラメータ算出部（遅延判定手段）、５７はパラメータ算出部５６により算出された遅延判定用パラメータと記憶部４４に記憶されている入力音声の複数のフレームにおける遅延判定用パラメータを比較して、Ｎフレーム前が雑音区間又は音声区間の何れであるかを判定する遅延判定部（遅延判定手段）である。
【０１５７】
次に動作について説明する。
更新部４６は、遅延判定部５７の判定結果と、記憶部４４に記憶されているＮフレーム前の対数パワースペクトルとを用いて、雑音区間の平均的な対数パワースペクトルである推定雑音スペクトルを更新し、更新後の推定雑音スペクトルをスペクトル補正部４７とパラメータ算出部５６に出力する。
【０１５８】
パラメータ算出部５６は、更新部４６が出力する推定雑音スペクトルを分析して、平均的な雑音の特徴を表す所定のパラメータを求め、これを遅延判定用パラメータとして出力する。なお、ここにおける所定のパラメータ及びその算出方法には、パラメータ分析部５５と同じものを用いる。
【０１５９】
遅延判定部５７は、記憶部４４に記憶されているＭフレーム分の遅延判定用パラメータと、パラメータ算出部５６が出力する雑音区間の平均的な遅延判定用パラメータとを比較して、Ｎフレーム前が雑音区間であるか音声区間であるかを判定し、その判定結果を更新部４６に出力する。なお、判定方法については、上記実施の形態４の遅延判定部２６と同様の方法を用いることができる。
【０１６０】
以上で明らかなように、この実施の形態１２によれば、上記実施の形態１１の構成において、遅延判定部５７が、推定雑音スペクトルを分析して算出された遅延判定用パラメータを用いて判定を行うようにしたので、上記実施の形態１１が持つ効果に加えて、遅延判定部５７内での処理が簡易化でき、なおかつ、安定に更新された推定雑音スペクトルを利用することで雑音区間の判定精度が一層改善され、その結果として、パワーが大きい音声区間の対数パワースペクトルを用いて推定雑音スペクトルを過大に更新することが少なくなり、スペクトル補正部４７における過剰な補正が抑制され、最終的に雑音抑圧された出力音声における音質が改善する効果が得られる。
【０１６１】
実施の形態１３．
上記実施の形態９では、遅延判定部４５が判定結果のみを出力し、更新部４６が遅延判定部４５の判定結果が雑音区間である場合に、推定雑音スペクトルの更新を行うものについて示したが、遅延判定部４５がＮフレーム前が音声区間である可能性の大きさを出力し、更新部４６がこの可能性の大きさに応じて推定雑音スペクトルの更新速度を制御する構成も可能である。以下、図７に基づいて、動作が新規な部分のみ説明する。
【０１６２】
遅延判定部４５は、記憶部４４に記憶されているＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が音声区間である可能性の大きさを算出し、その可能性の大きさを更新部４６に出力する。この音声区間の可能性の大きさの算出方法については、上記実施の形態５の遅延判定部５と同様の方法を用いることができる。
【０１６３】
更新部４６は、遅延判定部４５により算出されたＮフレーム前が音声区間である可能性の大きさと、記憶部４４に記憶されているＮフレーム前の対数パワースペクトルとを用いて、雑音区間の平均的な対数パワースペクトルである推定雑音スペクトルを更新し、更新後の推定雑音スペクトルをスペクトル補正部４７に出力する。この更新は、例えば以下のように行うことができる。
【０１６４】
まず、遅延判定部４５により算出されたＮフレーム前が音声区間である可能性の大きさＱと、更新速度に関する固定値Ｃ（１より小さい正の固定値）とを用いて、下記の（１１）式に基づいて更新速度αを算出する。
そして、この更新速度αと対数パワースペクトルｌｏｇ（Ｓｐ）を（９）式に代入して推定雑音スペクトルの対数値ｌｏｇ（Ｓｐｎ）を更新する。
即ち、１フレーム前の推定雑音スペクトルの対数値ｌｏｇ（Ｓｐｎ）にαを乗じたものと、Ｎフレーム前の対数パワースペクトルｌｏｇ（Ｓｐ）に（１−α）を乗じたものを加算して、新たな推定雑音スペクトルの対数値ｌｏｇ（Ｓｐｎ）とする。なお、Ｓｐ及びＳｐｎは、各周波数成分の値を要素とするベクトルとなっている。
α＝１−Ｃ×（１−Ｑ）×（１−Ｑ）（１１）
【０１６５】
音声区間である可能性が高い場合には、Ｑが１に近づくため、αが１に近づき、推定雑音スペクトルＳｐｎの更新は殆ど行われない。逆に音声区間である可能性が低い場合には、Ｑが０に近づくため、αが１−Ｃに近づき、推定雑音スペクトルＳｐｎの更新は殆ど行われない。
【０１６６】
なお、更新速度αの制御方法は、（１１）式に限定されるものではなく、Ｑが０．４以下の時にのみＳｐｎの更新を行うなど、様々な方法が可能である。また、上記実施の形態１０から実施の形態１２の遅延判定部と更新部をこの実施の形態１３と同様なものに変更した構成も可能である。
【０１６７】
以上で明らかなように、この実施の形態１３によれば、上記実施の形態９から実施の形態１２の構成において、遅延判定部４５がＮフレーム前が音声区間である可能性の大きさを算出し、この可能性の大きさに基づいて制御した更新速度を用いて推定雑音スペクトルの更新を行うようにしたので、上記実施の形態９から実施の形態１２が持つ効果に加えて、遅延判定部４５において音声区間であるか雑音区間であるかを２値判定していた場合に避けられない誤判定による推定雑音スペクトルの急激な更新を緩和でき、スペクトル補正部４７における過剰な補正が抑制され、最終的に雑音抑圧された出力音声における音質が改善する効果が得られる。
【０１６８】
実施の形態１４．
図１１はこの発明の実施の形態１４による雑音抑圧装置を示す構成図であり、図において、図７と同一符号は同一または相当部分を示すので説明を省略する。５８は更新部４６により更新された推定雑音スペクトルの変動を分析する変動性分析部（遅延制御手段）、５９は変動性分析部５８により分析された変動の大きさに応じて遅延フレーム数を示すＮの値を制御する遅延制御部（遅延制御手段）である。
【０１６９】
次に動作について説明する。
まず、フレームと呼ばれる所定の時間長の入力音声が、スペクトル分析部４１と推定雑音スペクトル更新部４２内のパラメータ分析部４３に入力される。
【０１７０】
スペクトル分析部４１は、入力音声を分析して、入力音声（現在のフレーム）のスペクトルを求め、これを入力音声スペクトルとして、スペクトル補正部４７に出力する。また、この入力音声スペクトルの各周波数成分のパワーを求めて、その得られたパワースペクトルを必要に応じてスペクトル補正部４７に出力する。
さらに、このパワースペクトルを対数領域に変換して、その得られた対数パワースペクトルを推定雑音スペクトル更新部４２内の記憶部４４に出力する。
【０１７１】
推定雑音スペクトル更新部４２内のパラメータ分析部４３は、入力音声を分析して、入力音声（現在のフレーム）の特徴を表す所定のパラメータを求め、これを遅延判定用パラメータとして出力する。
【０１７２】
記憶部４４は、（Ｎ＋１）フレーム分の対数パワースペクトルとＭフレーム分の遅延判定用パラメータを記憶することができる能力を有し、その内部に記憶されている最も過去のフレームの両パラメータ、即ち、（Ｎ＋１）フレーム前の対数パワースペクトルとＭフレーム前の遅延判定用パラメータを忘却し、スペクトル分析部４１が出力する現在のフレームの対数パワースペクトルと、パラメータ分析部４３が出力する現在のフレームの遅延判定用パラメータを記憶することで、内部状態を更新する。
【０１７３】
遅延判定部４５は、記憶部４４に記憶されているＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が雑音区間であるか音声区間であるかを判定し、その判定結果を更新部４６に出力する。
更新部４６は、遅延判定部４５の判定結果と、記憶部４４に記憶されているＮフレーム前の対数パワースペクトルとを用いて、雑音区間の平均的な対数パワースペクトルである推定雑音スペクトルを更新し、更新後の推定雑音スペクトルをスペクトル補正部４７と変動性分析部５８に出力する。
なお、遅延判定部４５における判定方法、更新部４６における更新方法については、上記実施の形態９と同様の方法を用いることができる。
【０１７４】
変動性分析部５８は、更新部４６が出力する推定雑音スペクトルの変動の大きさを分析して、その得られた結果を遅延制御部５９に出力する。
変動の分析としては、過去の複数フレーム分の推定雑音スペクトルを記憶しておき、各々を周波数方向に平滑化した後、周波数毎の最大値と最小値の差の大きさを周波数毎の平均値にて正規化した値を求めたり、フレーム間の周波数毎の変化量を求めて、その最大値や標準偏差を平均値にて正規化した値を求め、それらを全周波数成分で重み付け平均を算出するなど、様々な方法が可能である。
【０１７５】
遅延制御部５９は、変動性分析部５８により分析された変動の大きさが大きいほど、遅延フレーム数Ｎを大きく制御し、このＮを記憶部４４、遅延判定部４５及び更新部４６に出力する。記憶部４４、遅延判定部４５及び更新部４６は前記した通り、このＮの値を用いて次のフレーム以降の各処理を行う。Ｎの制御方法については、上記実施の形態６の遅延制御部と同様な方法を用いることができる。
【０１７６】
スペクトル補正部４７は、推定雑音スペクトル更新部４２内の更新部４６が出力する推定雑音スペクトルを用いて、スペクトル分析部４１が出力する現在のフレームの入力音声スペクトルに対する補正処理を実施し、その得られた補正スペクトルを出力音声生成部４８に出力する。
そして、出力音声生成部４８は、スペクトル補正部４７が出力する補正スペクトルに対して、逆ＦＦＴ、逆ＤＦＴなどのフーリエ変換処理を行って、信号領域に戻し、その得られた信号をハニング窓や台形窓などの適切な窓をかけつつフレーム間を連接し、その連接した信号をフレーム周期毎に出力音声として出力する。
【０１７７】
なお、この実施の形態１４では、上記実施の形態９をベースに変動性分析部５８と遅延制御部５９を追加した構成としているが、上記実施の形態１０から実施の形態１３に同様の変動性分析部５８と遅延制御部５９を追加した構成も可能である。
【０１７８】
以上で明らかなように、この実施の形態１４によれば、上記実施の形態９から実施の形態１３の構成において、推定雑音スペクトルの変動の大きさを分析し、その大きさが大きいほど、遅延フレーム数Ｎを大きく制御するようにしたので、上記実施の形態９から実施の形態１３が持つ効果に加えて、推定雑音スペクトルの変動が大きく、雑音区間判定の誤りの可能性が高い場合には、遅延フレーム数Ｎを増やして、判定誤りの増加を抑制することができ、その結果として、パワーが大きい音声区間の対数パワースペクトルを用いて推定雑音スペクトルを過大に更新することが少なくなり、スペクトル補正部４７における過剰な補正が抑制され、最終的に雑音抑圧された出力音声における音質が改善する効果が得られる。推定雑音スペクトルの変動が小さい場合には、遅延フレーム数Ｎを減らすことで、記憶部４４における記憶容量を減らすことができ、推定雑音スペクトルの雑音に対する追従性が向上して最終的に雑音抑圧された出力音声における音質が改善する効果が得られる。
【０１７９】
実施の形態１５．
図１２はこの発明の実施の形態１５による雑音抑圧装置を示す構成図であり、図において、図７と同一符号は同一または相当部分を示すので説明を省略する。６０はスペクトル分析部４１により取得された入力音声のスペクトルと雑音区間判定装置における非遅延判定部７の判定結果から推定雑音スペクトルを更新する推定雑音スペクトル更新部（更新手段）である。
【０１８０】
次に動作について説明する。
まず、フレームと呼ばれる所定の時間長の入力音声が、スペクトル分析部４１と雑音区間判定装置内のパラメータ分析部１に入力される。
雑音区間判定装置内の各構成要素は、上記実施の形態１の雑音区間判定装置と同様に動作し、最終的に非遅延判定部７が判定結果を出力する。
【０１８１】
スペクトル分析部４１は、入力音声を分析して、入力音声（現在のフレーム）のスペクトルを求め、これを入力音声スペクトルとして、スペクトル補正部４７に出力する。また、この入力音声スペクトルの各周波数成分のパワーを求めて、その得られたパワースペクトルを必要に応じてスペクトル補正部４７に出力する。
さらに、このパワースペクトルを対数領域に変換して、その得られた対数パワースペクトルを推定雑音スペクトル更新部６０に出力する。
【０１８２】
推定雑音スペクトル更新部６０は、雑音区間判定装置における非遅延判定部７が出力する判定結果と、スペクトル分析部４１が出力する対数パワースペクトルとを用いて、雑音区間の平均的な対数パワースペクトルである推定雑音スペクトルを更新し、更新後の推定雑音スペクトルをスペクトル補正部４７に出力する。この更新は、例えば以下のように、１より小さい正の値αを更新速度として行うことができる。
【０１８３】
非遅延判定部７の判定結果が雑音区間である場合に限り、対数パワースペクトルｌｏｇ（Ｓｐ）を（９）式に代入して、推定雑音スペクトルの対数値ｌｏｇ（Ｓｐｎ）を更新する。即ち、１フレーム前の推定雑音スペクトルの対数値ｌｏｇ（Ｓｐｎ）にαを乗じたものと、対数パワースペクトルｌｏｇ（Ｓｐ）に（１−α）を乗じたものを加算して、新たな推定雑音スペクトルの対数値ｌｏｇ（Ｓｐｎ）とする。
【０１８４】
スペクトル補正部４７は、推定雑音スペクトル更新部６０が出力する推定雑音スペクトルを用いて、スペクトル分析部４１が出力する現在のフレームの入力音声スペクトルに対する補正処理を実施し、その得られた補正スペクトルを出力音声生成部４８に出力する。
そして、出力音声生成部４８は、スペクトル補正部４７が出力する補正スペクトルに対して、逆ＦＦＴ、逆ＤＦＴなどのフーリエ変換処理を行って、信号領域に戻し、その得られた信号をハニング窓や台形窓などの適切な窓をかけつつフレーム間を連接し、連接した信号をフレーム周期毎に出力音声として出力する。
【０１８５】
なお、上記実施の形態１５では、雑音区間判定装置の構成を上記実施の形態１の雑音区間判定装置と同一としたが、上記実施の形態２から実施の形態８の雑音区間判定装置と同一の構成でも構わない。
【０１８６】
以上で明らかなように、この実施の形態１５によれば、上記実施の形態１から実施の形態８の雑音区間判定装置を用いて、高精度に雑音区間の判定を実施し、この判定結果を用いて推定雑音スペクトルを更新するようにしたので、パワーが大きい音声区間の対数パワースペクトルを用いて推定雑音スペクトルを過大に更新することが少なくなり、スペクトル補正部４７における過剰な補正が抑制され、最終的に雑音抑圧された出力音声における音質が改善する効果が得られる。
【０１８７】
実施の形態１６．
図１３はこの発明の実施の形態１６による推定雑音情報更新方法を示すフローチャートである。図において、ＳＴ１は分析ステップ、ＳＴ２は記憶ステップ、ＳＴ３は遅延判定ステップ、ＳＴ４は遅延更新ステップである。
この実施の形態１６では、雑音が重畳した音声が入力されたときに、その雑音に関する所定の特徴情報の推定値である推定雑音情報を更新する。
【０１８８】
次に動作について説明する。
まず、ステップＳＴ１において、現在のフレームの入力音声を分析して、遅延判定用パラメータと入力音声の所定の特徴を表す特徴情報を取得する。
【０１８９】
遅延判定用パラメータとしては、入力音声のパワー、帯域パワー、高域強調などの所定加工処理を施した入力音声のパワー、ＬＳＰなどのスペクトル特徴を表すスペクトルパラメータ、このスペクトルパラメータを用いてスペクトル特徴を取り除いた後の残差信号のパワー、ピッチ周期の相関の大きさなど、従来の雑音区間判定装置で用いられている様々なパラメータを、単独または複数用いることができる。
【０１９０】
特徴情報については、雑音区間判定装置における判定用閾値を推定雑音情報として更新する場合には、遅延判定用パラメータと同様のパラメータとなる。一方、雑音抑圧装置における推定雑音スペクトルを推定雑音情報として更新する場合には、入力音声の対数パワースペクトル、パワースペクトル、振幅スペクトルなどになる。
【０１９１】
ステップＳＴ２において、それまでに記憶されているＮフレーム前の特徴情報とＭフレーム前の遅延判定用パラメータを忘却し、ステップＳＴ１で取得した現在のフレームの特徴情報と遅延判定用パラメータを記憶することで、記憶内容を更新する。
この更新処理により、常にＮフレーム前から現在のフレームまでの、合計（Ｎ＋１）フレーム分の最新の特徴情報と、（Ｍ−１）フレーム前から現在のフレームまでの、合計Ｍフレーム分の最新の遅延判定用パラメータが記憶されている状態が保たれる。なお、Ｎは１以上の整数、ＭはＮより大きい整数である。
【０１９２】
ステップＳＴ３において、ステップＳＴ２で記憶してあるＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が雑音区間であるか音声区間であるかを判定する。この判定方法については、上記実施の形態１における遅延判定部５に関して説明したものと同じ方法を用いることができる。
【０１９３】
ステップＳＴ４において、ステップＳＴ３における判定結果と、ステップＳＴ２で記憶してあるＮフレーム前の特徴情報とを用いて、雑音区間の平均的な特徴情報である推定雑音情報を更新する。この更新方法についても、上記実施の形態１における閾値算出部６ないし上記実施の形態９における更新部４６に関して説明したものと同じ方法を用いることができる。
【０１９４】
以上で明らかなように、この実施の形態１６によれば、Ｎフレーム前が雑音区間であるか否かを、Ｎフレーム前を含む過去から現在までの複数フレームの遅延判定用パラメータに基づいて判定し、この判定結果とＮフレーム前の特徴情報に基づいて推定雑音情報を更新するようにしたので、Ｎフレーム前が雑音区間であるか否かの判定においては、判定対象フレームであるＮフレーム前から見て過去と未来の情報を用いることができるので誤判定が抑制でき、その結果として、音声区間の特徴情報を用いて推定雑音情報を更新することが少なくなり、推定雑音情報の精度が向上する効果が得られる。
なお、この実施の形態１６の雑音情報更新方法を用いた雑音区間判定装置が上記実施の形態１であり、この実施の形態１６の雑音情報更新方法を用いた雑音抑圧装置が上記実施の形態９である。
【０１９５】
実施の形態１７．
図１４はこの発明の実施の形態１７による推定雑音情報更新方法を示すフローチャートである。図において、ＳＴ１１は記憶ステップ、ＳＴ１２は分析ステップ、ＳＴ１３は遅延判定ステップ、ＳＴ１４は遅延更新ステップである。
【０１９６】
次に動作について説明する。
まず、ステップＳＴ１１において、それまでに記憶されているＭフレーム前の入力音声を忘却し、現在のフレームの入力音声を記憶することで、記憶内容を更新する。この更新処理により、常に（Ｍ−１）フレーム前から現在のフレームまでの、合計Ｍフレーム分の最新の入力音声が記憶されている状態が保たれる。なお、Ｎは１以上の整数、ＭはＮより大きい整数である。
【０１９７】
ステップＳＴ１２において、ステップＳＴ１１で記憶してある入力音声を分析して、Ｍフレーム分の遅延判定用パラメータと、Ｎフレーム前の入力音声の所定の特徴を表す特徴情報を取得する。遅延判定用パラメータと特徴情報については上記実施の形態１６と同様である。
【０１９８】
ステップＳＴ１３において、ステップＳＴ１２で取得されたＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が雑音区間であるか音声区間であるかを判定する。
ステップＳＴ１４において、ステップＳＴ１３における判定結果と、ステップＳＴ１２で取得されたＮフレーム前の特徴情報とを用いて、雑音区間の平均的な特徴情報である推定雑音情報を更新する。
なお、ステップＳＴ１３における判定方法と、ステップＳＴ１４における更新方法については、上記実施の形態１６と同様である。
【０１９９】
以上で明らかなように、この実施の形態１７によれば、Ｎフレーム前が雑音区間であるか否かを、Ｎフレーム前を含む過去から現在までの複数フレームの遅延判定用パラメータに基づいて判定し、この判定結果とＮフレーム前の特徴情報に基づいて推定雑音情報を更新するようにしたので、Ｎフレーム前が雑音区間であるか否かの判定においては、判定対象フレームであるＮフレーム前から見て過去と未来の情報を用いることができるので誤判定が抑制でき、その結果として、音声区間の特徴情報を用いて推定雑音情報を更新することが少なくなり、推定雑音情報の精度が向上する効果が得られる。
なお、この実施の形態１７の雑音情報更新方法を用いた雑音区間判定装置が上記実施の形態２であり、この実施の形態１７の雑音情報更新方法を用いた雑音抑圧装置が上記実施の形態１０である。
【０２００】
実施の形態１８．
図１５はこの発明の実施の形態１８による推定雑音情報更新方法を示すフローチャートである。図において、ＳＴ２１は分析ステップ、ＳＴ２２は記憶ステップ、ＳＴ２３は遅延判定ステップ、ＳＴ２４は遅延更新ステップである。
【０２０１】
次に動作について説明する。
まず、ステップＳＴ２１において、現在のフレームの入力音声を分析して、入力音声の所定の特徴を表す特徴情報を取得する。特徴情報については上記実施の形態１６と同様である。
【０２０２】
ステップＳＴ２２において、それまでに記憶されているＭフレーム前の特徴情報を忘却し、ステップＳＴ２１で取得された現在のフレームの特徴情報を記憶することで、記憶内容を更新する。この更新処理により、常に（Ｍ−１）フレーム前から現在のフレームまでの、合計Ｍフレーム分の最新の特徴情報が記憶されている状態が保たれる。
【０２０３】
ステップＳＴ２３において、ステップＳＴ２２で記憶してあるＭフレーム分の特徴情報を用いて、Ｎフレーム前が雑音区間であるか音声区間であるかを判定する。この判定方法については、上記実施の形態１の遅延判定部５における遅延判定用パラメータの代わりに特徴情報を用いるようにした場合と同じものを用いることができる。なお、当然のことであるが、特徴情報の一部を取得したり、特徴情報を変換して別のパラメータとしてから判定に用いる構成も可能である。
【０２０４】
ステップＳＴ２４において、ステップＳＴ２３における判定結果と、ステップＳＴ２２で記憶してあるＮフレーム前の特徴情報とを用いて、雑音区間の平均的な特徴情報である推定雑音情報を更新する。この更新方法については、上記実施の形態１における閾値算出部６ないし上記実施の形態９における更新部４６に関して説明したものと同じ方法を用いることができる。
【０２０５】
なお、この実施の形態１８は、上記実施の形態１６における特徴情報と遅延判定用パラメータを共通化した構成に相当するが、同様に実施の形態１７における特徴情報と遅延判定用パラメータを共通化した構成も可能である。
【０２０６】
以上で明らかなように、この実施の形態１８によれば、上記実施の形態１６における特徴情報と遅延判定用パラメータを共通化したので、上記実施の形態１６が持つ効果に加えて、パラメータ分析処理量と必要な記憶容量が削減できる効果がある。同様に実施の形態１７における特徴情報と遅延判定用パラメータを共通化したので、上記実施の形態１７が持つ効果に加えて、パラメータ分析処理量と必要な記憶容量が削減できる効果がある。
なお、この実施の形態１８の雑音情報更新方法を用いた雑音区間判定装置が上記実施の形態３であり、この実施の形態１８の雑音情報更新方法を用いた雑音抑圧装置が上記実施の形態１１である。
【０２０７】
実施の形態１９．
図１６はこの発明の実施の形態１９による推定雑音情報更新方法を示すフローチャートである。図において、ＳＴ３１は分析ステップ、ＳＴ３２は記憶ステップ、ＳＴ３３は遅延判定ステップ、ＳＴ３４は遅延更新ステップである。
【０２０８】
次に動作について説明する。
まず、ステップＳＴ３１において、現在のフレームの入力音声を分析して、入力音声の所定の特徴を表す特徴情報を取得する。特徴情報については上記実施の形態１６と同様である。
【０２０９】
ステップＳＴ３２において、それまでに記憶されているＭフレーム前の特徴情報を忘却し、ステップＳＴ３１で取得された現在のフレームの特徴情報を記憶することで、記憶内容を更新する。この更新処理により、常に（Ｍ−１）フレーム前から現在のフレームまでの、合計Ｍフレーム分の最新の特徴情報が記憶されている状態が保たれる。
【０２１０】
ステップＳＴ３３において、ステップＳＴ３２で記憶してあるＭフレーム分の特徴情報中に含まれる各フレームの遅延判定用パラメータと、推定雑音情報に含まれる遅延判定用パラメータとを比較して、Ｎフレーム前が雑音区間であるか音声区間であるかを判定する。ここで、特徴情報の一部を遅延判定用パラメータとしたが、特徴情報を再分析したり、別のパラメータに変換して遅延判定用パラメータとする構成も可能である。
【０２１１】
ステップＳＴ３４において、ステップＳＴ３３における判定結果と、ステップＳＴ３２で記憶してあるＮフレーム前の特徴情報とを用いて、雑音区間の平均的な特徴情報である推定雑音情報を更新する。
【０２１２】
以上で明らかなように、この実施の形態１９によれば、上記実施の形態１８の構成において、推定雑音情報を用いて判定を行うようにしたので、上記実施の形態１８が持つ効果に加えて、ステップＳＴ３３の遅延判定処理が簡易化でき、なおかつ、安定に更新された推定雑音情報を利用することで遅延判定の精度が一層改善し、音声区間の特徴情報を用いて推定雑音情報を更新することが少なくなり、推定雑音情報の精度が向上する効果が得られる。
なお、この実施の形態１９の雑音情報更新方法を用いた雑音区間判定装置が上記実施の形態４であり、この実施の形態４の雑音情報更新方法を用いた雑音抑圧装置が上記実施の形態１２である。
【０２１３】
実施の形態２０．
図１７はこの発明の実施の形態２０による推定雑音情報更新方法を示すフローチャートである。図において、ＳＴ４１は分析ステップ、ＳＴ４２は記憶ステップ、ＳＴ４３は遅延判定ステップ、ＳＴ４４は遅延更新ステップである。
【０２１４】
次に動作について説明する。
まず、ステップＳＴ４１において、現在のフレームの入力音声を分析して、遅延判定用パラメータと、入力音声の所定の特徴を表す特徴情報を取得する。
【０２１５】
ステップＳＴ４２において、それまでに記憶されている（Ｎ＋１）フレーム前の特徴情報とＭフレーム前の遅延判定用パラメータを忘却し、ステップＳＴ４１で取得された現在のフレームの特徴情報と遅延判定用パラメータを記憶することで、記憶内容を更新する。
【０２１６】
ステップＳＴ４３において、ステップＳＴ４２で記憶してあるＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が音声区間である可能性の大きさを算出する。この算出方法については、上記実施の形態５における遅延判定部５に関して説明したものと同じ方法を用いることができる。
【０２１７】
ステップＳＴ４４において、ステップＳＴ４３で算出されたＮフレーム前が音声区間である可能性の大きさと、ステップＳＴ４２で記憶してあるＮフレーム前の特徴情報とを用いて、雑音区間の平均的な特徴情報である推定雑音情報を更新する。音声区間の可能性の大きさが大きいほど、推定雑音情報の更新速度を小さく制御する。この更新方法については、上記実施の形態５における閾値算出部６ないし上記実施の形態１３における更新部４６に関して説明したものと同じ方法を用いることができる。
【０２１８】
以上で明らかなように、この実施の形態２０によれば、上記実施の形態１６から実施の形態１９の構成において、Ｎフレーム前が音声区間である可能性の大きさを算出し、この可能性の大きさに基づいて推定雑音情報の更新速度を制御するようにしたので、上記実施の形態１６から実施の形態１９が持つ効果に加えて、音声区間であるか雑音区間であるかを２値判定していた場合に避けられない誤判定による推定雑音情報の急激な更新を緩和でき、推定雑音情報の精度が向上する効果が得られる。
なお、この実施の形態２０の雑音情報更新方法を用いた雑音区間判定装置が上記実施の形態５であり、この実施の形態２０の雑音情報更新方法を用いた雑音抑圧装置が上記実施の形態１３である。
【０２１９】
実施の形態２１．
図１８はこの発明の実施の形態２１による推定雑音情報更新方法を示すフローチャートである。図において、ＳＴ５１は分析ステップ、ＳＴ５２は記憶ステップ、ＳＴ５３は遅延判定ステップ、ＳＴ５４は遅延更新ステップ、ＳＴ５５は変動性分析ステップ、ＳＴ５６は遅延制御ステップである。
【０２２０】
次に動作について説明する。
ステップＳＴ５１において、現在のフレームの入力音声を分析して、遅延判定用パラメータと、入力音声の所定の特徴を表す特徴情報を取得する。
【０２２１】
ステップＳＴ５２において、それまでに記憶されている（Ｎ＋１）フレーム前の特徴情報とＭフレーム前の遅延判定用パラメータを忘却し、ステップＳＴ５１で取得された現在のフレームの特徴情報と遅延判定用パラメータを記憶することで、記憶内容を更新する。
【０２２２】
ステップＳＴ５３において、ステップＳＴ５２で記憶してあるＭフレーム分の遅延判定用パラメータを用いて、Ｎフレーム前が雑音区間であるか音声区間であるかを判定する。
ステップＳＴ５４において、ステップＳＴ５３における判定結果と、ステップＳＴ５２で記憶してあるＮフレーム前の特徴情報とを用いて、雑音区間の平均的な特徴情報である推定雑音情報を更新する。
【０２２３】
ステップＳＴ５５において、過去の推定雑音情報と、ステップＳＴ５４で更新された推定雑音情報を比較することで、推定雑音情報における時間方向の変動の大きさを分析する。なお、ステップＳＴ５５における分析方法としては、上記実施の形態６及び実施の形態１４における変動性分析部３１に関して説明したものと同じ方法を用いることができる。
【０２２４】
ステップＳＴ５６において、ステップＳＴ５４で分析した変動の大きさが大きいほど、遅延フレーム数Ｎを大きく制御し、このＮを次のフレーム以降のステップＳＴ５２，ＳＴ５３，ＳＴ５４で使用するようにする。Ｎの制御方法については、上記実施の形態６の遅延制御部３２に関して説明したものと同じ方法を用いることができる。
【０２２５】
なお、この実施の形態２１では、上記実施の形態１６をベースに変動性分析ステップと遅延制御ステップを追加した構成としているが、上記実施の形態１７から実施の形態２０に、同様の変動性分析ステップと遅延制御ステップを追加した構成も可能である。
【０２２６】
以上で明らかなように、この実施の形態２１によれば、上記実施の形態１６から実施の形態２０の構成において、推定雑音情報の変動の大きさを分析し、その大きさが大きいほど、遅延フレーム数Ｎを大きく制御するようにしたので、上記実施の形態１６から実施の形態２０が持つ効果に加えて、雑音の変動が大きく雑音区間判定の判定誤りの可能性が高い場合に遅延フレーム数Ｎを増やして、その判定誤りの増加を抑制することができ、推定雑音情報の精度が向上する効果が得られる。雑音の変動性が小さい場合には、遅延フレーム数Ｎを減らすことで、必要な記憶容量を減らすことができ、推定雑音情報の雑音に対する追従性が向上して最終的な推定雑音情報の精度が向上する効果が得られる。
【０２２７】
【発明の効果】
以上のように、この発明によれば、記憶手段に記憶されている現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果を総合してＮフレーム前のフレームが雑音区間又は音声区間の何れであるかを判定する遅延判定手段を設け、その遅延判定手段の判定結果に応じて雑音区間又は音声区間の平均的な非遅延判定用パラメータを更新したのち、雑音区間及び音声区間の平均的な非遅延判定用パラメータと記憶手段に記憶されている現在のフレームよりＮフレーム前のフレームの非遅延判定用パラメータとを用いて判定用閾値を更新するように構成したので、精度の高い一次判定結果を利用して雑音区間の最終判定を実施することができるようになり、その結果、精度よく雑音区間を判定することができる効果がある。
【０２２８】
この発明によれば、パラメータ分析手段により取得された現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果を総合してＮフレーム前のフレームが雑音区間又は音声区間の何れであるかを判定する遅延判定手段を設け、その遅延判定手段の判定結果に応じて雑音区間又は音声区間の平均的な非遅延判定用パラメータを更新したのち、雑音区間及び音声区間の平均的な非遅延判定用パラメータと上記パラメータ分析手段により取得された現在のフレームよりＮフレーム前のフレームの非遅延判定用パラメータとを用いて判定用閾値を更新するように構成したので、精度の高い一次判定結果を利用して雑音区間の最終判定を実施することができるようになり、その結果、精度よく雑音区間を判定することができる効果がある。
また、非遅延判定用パラメータと遅延判定用パラメータの情報量の合計が入力音声の情報量を上回る場合、記憶手段の容量を削減することができる効果がある。
【０２２９】
この発明によれば、遅延判定用パラメータと非遅延判定用パラメータを共通化するように構成したので、パラメータの分析処理量や記憶容量が削減できる効果がある。
【０２３０】
この発明によれば、現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと更新手段により更新された判定用閾値とを比較し、それらの比較結果を総合してＮフレーム前のフレームが雑音区間又は音声区間の何れであるかを判定するように構成したので、一次判定の精度が一層改善され、最終的な雑音区間の判定精度が向上する効果がある。
【０２３１】
この発明によれば、遅延判定手段が音声区間である可能性の大きさを算出すると、その音声区間である可能性の大きさに基づいて更新速度を算出し、その更新速度と現在のフレームよりＮフレーム前のフレームの非遅延判定用パラメータとを用いて、雑音区間及び音声区間の平均的な非遅延判定用パラメータを更新するように構成したので、２値判定による一次判定では避けることができない誤判定に伴う判定用閾値の急激な更新を緩和できるようになり、その結果、最終的な雑音区間の判定精度が向上する効果がある。
【０２３２】
この発明によれば、更新手段により更新された判定用閾値の変動を分析し、その変動が大きい程、遅延判定手段の判定対象のフレームであるＮフレームを現在のフレームより過去のフレームに設定する遅延制御手段を設けるように構成したので、雑音の変動が大きい場合には、一次判定の誤りの増加を抑制することができる一方、雑音の変動が小さい場合には、記憶手段の記憶容量を抑制して、判定用閾値の雑音に対する追従性を向上することができる効果がある。
【０２３３】
この発明によれば、現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果と非遅延判定手段によるＮフレーム前のフレームの判定結果とを総合して、Ｎフレーム前のフレームが雑音区間又は音声区間の何れであるかを判定するように構成したので、一次判定の精度が一層改善され、最終的な雑音区間の判定精度が向上する効果がある。
【０２３４】
この発明によれば、判定用閾値を更新する際、非遅延判定手段の判定結果を用いて更新するように構成したので、誤った判定用閾値の更新が抑制され、最終的な雑音区間の判定精度が向上する効果がある。
【０２３５】
この発明によれば、記憶手段に記憶されている現在のフレームよりＮフレーム前のフレームのスペクトルと遅延判定手段の判定結果とを用いて推定雑音スペクトルを更新する更新手段を設け、その更新手段により更新された推定雑音スペクトルを用いて入力音声の現在のフレームにおけるスペクトルを補正するように構成したので、雑音区間の誤判定に伴う推定雑音スペクトルの過大な更新が抑制され、出力音声の音質が向上する効果がある。
【０２３６】
この発明によれば、スペクトル分析手段により分析された現在のフレームよりＮフレーム前のフレームのスペクトルと遅延判定手段の判定結果とを用いて推定雑音スペクトルを更新する更新手段を設け、その更新手段により更新された推定雑音スペクトルを用いて入力音声の現在のフレームにおけるスペクトルを補正するように構成したので、雑音区間の誤判定に伴う推定雑音スペクトルの過大な更新が抑制され、出力音声の音質が向上する効果がある。
また、スペクトルと遅延判定用パラメータの情報量の合計が入力音声の情報量を上回る場合に、記憶手段の容量を削減することができる効果がある。
【０２３７】
この発明によれば、スペクトル分析手段により取得された入力音声のスペクトルから遅延判定用パラメータを算出するように構成したので、パラメータの分析処理量を削減することができる効果がある。
【０２３８】
この発明によれば、更新手段により更新された推定雑音スペクトルから遅延判定用パラメータを算出するように構成したので、安定に更新された推定雑音スペクトルを利用することで雑音区間の判定精度が一層改善され、出力音声の音質が向上する効果がある。
【０２３９】
この発明によれば、遅延判定手段が音声区間である可能性の大きさを算出すると、その音声区間である可能性の大きさに基づいて更新速度を算出し、その更新速度と現在のフレームよりＮフレーム前のフレームのスペクトルとを用いて、推定雑音スペクトルを更新するように構成したので、２値判定による雑音区間の判定では避けることができない誤判定に伴う推定雑音スペクトルの急激な更新を緩和できるようになり、その結果、出力音声の音質が向上する効果がある。
【０２４０】
この発明によれば、更新手段により更新された推定雑音スペクトルの変動を分析し、その変動が大きい程、遅延判定手段の判定対象のフレームであるＮフレームを現在のフレームより過去のフレームに設定する遅延制御手段を設けるように構成したので、推定雑音スペクトルの変動が大きい場合には、判定誤りの増加を抑制することができる一方、推定雑音スペクトルの変動が小さい場合には、記憶手段の記憶容量を抑制して、推定雑音スペクトルの雑音に対する追従性を向上することができる効果がある。
【０２４１】
この発明によれば、記憶手段に記憶されている入力音声の複数のフレームにおける遅延判定用パラメータからＮフレーム前が雑音区間又は音声区間の何れであるかを判定し、その判定結果と記憶手段に記憶されている入力音声のＮフレーム前の非遅延判定用パラメータから判定用閾値を更新する一方、スペクトル分析手段により取得された入力音声のスペクトルと非遅延判定手段の判定結果から推定雑音スペクトルを更新し、その推定雑音スペクトルを用いて入力音声の現在のフレームにおけるスペクトルを補正するように構成したので、雑音区間の誤判定に伴う推定雑音スペクトルの過大な更新が抑制され、出力音声の音質が向上する効果がある。
【０２４２】
この発明によれば、パラメータ分析手段により取得された入力音声の複数のフレームにおける遅延判定用パラメータからＮフレーム前が雑音区間又は音声区間の何れであるかを判定し、その判定結果とパラメータ分析手段により取得された入力音声のＮフレーム前の非遅延判定用パラメータから判定用閾値を更新する一方、スペクトル分析手段により取得された入力音声のスペクトルと非遅延判定手段の判定結果から推定雑音スペクトルを更新し、その推定雑音スペクトルを用いて入力音声の現在のフレームにおけるスペクトルを補正するように構成したので、雑音区間の誤判定に伴う推定雑音スペクトルの過大な更新が抑制され、出力音声の音質が向上する効果がある。
【０２４３】
この発明によれば、遅延判定用パラメータと特徴情報を記憶すると、入力音声の現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果を総合してＮフレーム前のフレームが雑音区間又は音声区間の何れであるかを判定し、その判定結果と現在のフレームよりＮフレーム前のフレームの特徴情報とを用いて推定雑音情報を更新するように構成したので、雑音区間の誤判定が抑制され、精度よく推定雑音情報を更新することができる効果がある。
【０２４４】
この発明によれば、遅延判定用パラメータと特徴情報を取得すると、その入力音声の現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果を総合してＮフレーム前のフレームが雑音区間又は音声区間の何れであるかを判定し、その判定結果と現在のフレームよりＮフレーム前のフレームの特徴情報とを用いて推定雑音情報を更新するように構成したので、雑音区間の誤判定が抑制され、精度よく推定雑音情報を更新することができる効果がある。
【０２４５】
この発明によれば、遅延判定用パラメータと特徴情報を共通化するように構成したので、パラメータの分析処理量と必要な記憶容量を削減することができる効果がある。
【０２４７】
この発明によれば、音声区間である可能性の大きさを算出して、その音声区間である可能性の大きさに基づいて更新速度を算出し、その更新速度と現在のフレームよりＮフレーム前のフレームの特徴情報とを用いて、推定雑音情報を更新するように構成したので、２値判定による雑音区間の判定では避けることができない誤判定に伴う推定雑音情報の急激な更新を緩和できるようになり、その結果、精度よく推定雑音情報を更新することができる効果がある。
【０２４８】
この発明によれば、推定雑音情報の変動を分析し、その変動が大きい程、判定対象のフレームであるＮフレームを現在のフレームより過去のフレームに設定するように構成したので、推定雑音情報の変動が大きい場合には、判定誤りの増加を抑制することができる一方、推定雑音情報の変動が小さい場合には、記憶容量を抑制して、推定雑音情報の雑音に対する追従性を向上することができる効果がある。
【図面の簡単な説明】
【図１】この発明の実施の形態１による雑音区間判定装置を示す構成図である。
【図２】この発明の実施の形態２による雑音区間判定装置を示す構成図である。
【図３】この発明の実施の形態３による雑音区間判定装置を示す構成図である。
【図４】この発明の実施の形態４による雑音区間判定装置を示す構成図である。
【図５】この発明の実施の形態６による雑音区間判定装置を示す構成図である。
【図６】この発明の実施の形態７による雑音区間判定装置を示す構成図である。
【図７】この発明の実施の形態９による雑音抑圧装置を示す構成図である。
【図８】この発明の実施の形態１０による雑音抑圧装置を示す構成図である。
【図９】この発明の実施の形態１１による雑音抑圧装置を示す構成図である。
【図１０】この発明の実施の形態１２による雑音抑圧装置を示す構成図である。
【図１１】この発明の実施の形態１４による雑音抑圧装置を示す構成図である。
【図１２】この発明の実施の形態１５による雑音抑圧装置を示す構成図である。
【図１３】この発明の実施の形態１６による推定雑音情報更新方法を示すフローチャートである。
【図１４】この発明の実施の形態１７による推定雑音情報更新方法を示すフローチャートである。
【図１５】この発明の実施の形態１８による推定雑音情報更新方法を示すフローチャートである。
【図１６】この発明の実施の形態１９による推定雑音情報更新方法を示すフローチャートである。
【図１７】この発明の実施の形態２０による推定雑音情報更新方法を示すフローチャートである。
【図１８】この発明の実施の形態２１による推定雑音情報更新方法を示すフローチャートである。
【図１９】遅延判定部における判定方法の一例を説明する説明図である。
【符号の説明】
１，１２，２１，４３，５４，５５パラメータ分析部（パラメータ分析手段）、４，１１，２２，４４，５１記憶部（記憶手段）、５，２３，２６，３３，４５，５７遅延判定部（遅延判定手段）、６，２４閾値算出部（更新手段）、７，２５非遅延判定部（非遅延判定手段）、３１，５８変動性分析部（遅延制御手段）、３２，５９遅延制御部（遅延制御手段）、４１，５２スペクトル分析部（スペクトル分析手段）、４６更新部（更新手段）、４７スペクトル補正部（補正手段）、４８出力音声生成部（音声生成手段）、５６パラメータ算出部（遅延判定手段）、６０推定雑音スペクトル更新部（更新手段）。

Claims

入力音声をフレーム毎に分析して、その入力音声の特徴を表す遅延判定用パラメータと非遅延判定用パラメータを取得するパラメータ分析手段と、上記パラメータ分析手段により取得された遅延判定用パラメータと非遅延判定用パラメータを記憶する記憶手段と、上記記憶手段に記憶されている現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果がＮフレーム前のフレームが音声区間である旨を示し、かつ、そのフレームの近傍に音声区間であるフレームが所定数以上存在する旨を示していれば、Ｎフレーム前のフレームが音声区間であると判定し、それらの比較結果がそれ以外を示していれば、Ｎフレーム前のフレームが雑音区間であると判定する遅延判定手段と、上記遅延判定手段によりＮフレーム前のフレームが音声区間であると判定された場合、Ｎフレーム前の非遅延判定用パラメータにしたがって音声区間の平均的な非遅延判定用パラメータを更新し、Ｎフレーム前のフレームが雑音区間であると判定された場合、Ｎフレーム前の非遅延判定用パラメータにしたがって雑音区間の平均的な非遅延判定用パラメータを更新し、その後、雑音区間及び音声区間の平均的な非遅延判定用パラメータと上記記憶手段に記憶されている現在のフレームよりＮフレーム前のフレームの非遅延判定用パラメータにしたがって第１及び第２の判定用閾値を更新する更新手段と、現在のフレームより１フレーム前のフレームの判定結果が音声区間であって、上記パラメータ分析手段により取得された現在のフレームの非遅延判定用パラメータが上記更新手段により更新された第１の判定用閾値より大きい場合、または、現在のフレームより１フレーム前のフレームの判定結果が雑音区間であって、現在のフレームの非遅延判定用パラメータが上記更新手段により更新された第２の判定用閾値より大きい場合、現在のフレームが音声区間であると判定し、それ以外であれば、現在のフレームが雑音区間であると判定する非遅延判定手段とを備えた雑音区間判定装置。
入力音声を数フレーム分記憶する記憶手段と、上記記憶手段に記憶されている入力音声を分析して、その入力音声の特徴を表す遅延判定用パラメータと非遅延判定用パラメータを取得するパラメータ分析手段と、上記パラメータ分析手段により取得された現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果がＮフレーム前のフレームが音声区間である旨を示し、かつ、そのフレームの近傍に音声区間であるフレームが所定数以上存在する旨を示していれば、Ｎフレーム前のフレームが音声区間であると判定し、それらの比較結果がそれ以外を示していれば、Ｎフレーム前のフレームが雑音区間であると判定する遅延判定手段と、上記遅延判定手段によりＮフレーム前のフレームが音声区間であると判定された場合、Ｎフレーム前の非遅延判定用パラメータにしたがって音声区間の平均的な非遅延判定用パラメータを更新し、Ｎフレーム前のフレームが雑音区間であると判定された場合、Ｎフレーム前の非遅延判定用パラメータにしたがって雑音区間の平均的な非遅延判定用パラメータを更新し、その後、雑音区間及び音声区間の平均的な非遅延判定用パラメータと上記パラメータ分析手段により取得された現在のフレームよりＮフレーム前のフレームの非遅延判定用パラメータにしたがって第１及び第２の判定用閾値を更新する更新手段と、現在のフレームより１フレーム前のフレームの判定結果が音声区間であって、上記パラメータ分析手段により取得された現在のフレームの非遅延判定用パラメータが上記更新手段により更新された第１の判定用閾値より大きい場合、または、現在のフレームより１フレーム前のフレームの判定結果が雑音区間であって、現在のフレームの非遅延判定用パラメータが上記更新手段により更新された第２の判定用閾値より大きい場合、現在のフレームが音声区間であると判定し、それ以外であれば、現在のフレームが雑音区間であると判定する非遅延判定手段とを備えた雑音区間判定装置。
パラメータ分析手段は、遅延判定用パラメータと非遅延判定用パラメータを共通化することを特徴とする請求項１または請求項２記載の雑音区間判定装置。
遅延判定手段は、現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと更新手段により更新された判定用閾値とを比較し、それらの比較結果がＮフレーム前のフレームが音声区間である旨を示し、かつ、そのフレームの近傍に音声区間であるフレームが所定数以上存在する旨を示していれば、Ｎフレーム前のフレームが音声区間であると判定し、それらの比較結果がそれ以外を示していれば、Ｎフレーム前のフレームが雑音区間であると判定することを特徴とする請求項３記載の雑音区間判定装置。
更新手段は、遅延判定手段が音声区間である可能性の大きさを算出すると、音声区間である可能性が高い程、音声区間の平均的な非遅延判定用パラメータが大きくなるように更新し、音声区間である可能性が低い程、雑音区間の平均的な非遅延判定用パラメータが大きくなるように更新することを特徴とする請求項１から請求項４のうちのいずれか１項記載の雑音区間判定装置。
更新手段により更新された判定用閾値の変動を分析し、その変動が大きい程、遅延判定手段の判定対象のフレームであるＮフレームを現在のフレームより過去のフレームに設定する遅延制御手段を設けたことを特徴とする請求項１から請求項５のうちのいずれか１項記載の雑音区間判定装置。
遅延判定手段は、現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果がＮフレーム前のフレームが音声区間である旨を示し、かつ、そのフレームの近傍に音声区間であるフレームが所定数以上存在する旨を示していれば、Ｎフレーム前のフレームが音声区間であると判定し、それらの比較結果がそれ以外を示していれば、Ｎフレーム前のフレームが雑音区間であると判定する第１の判定処理と、非遅延判定手段の判定結果がＮフレーム前が音声区間である旨を示し、かつ、そのフレームの近傍に音声区間であるフレームが所定数以上存在する旨を示していれば、Ｎフレーム前のフレームが音声区間であると判定し、上記非遅延判定手段の判定結果がそれ以外を示していれば、Ｎフレーム前のフレームが雑音区間であると判定する第２の判定処理とを実施し、その第１の判定処理の判定結果と上記第２の判定処理の判定結果が一致する場合に限り、その判定結果を出力することを特徴とする請求項１または請求項２記載の雑音区間判定装置。
更新手段は、遅延判定手段の判定結果と非遅延判定手段の判定結果が一致する場合に限り、判定用閾値を更新することを特徴とする請求項１または請求項２記載の雑音区間判定装置。
入力音声をフレーム毎に分析して、その入力音声のスペクトルを取得するスペクトル分析手段と、その入力音声をフレーム毎に分析して、その入力音声の特徴を表す遅延判定用パラメータを取得するパラメータ分析手段と、上記スペクトル分析手段により取得されたスペクトルと上記パラメータ分析手段により取得された遅延判定用パラメータを記憶する記憶手段と、上記記憶手段に記憶されている現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果がＮフレーム前のフレームが音声区間である旨を示し、かつ、そのフレームの近傍に音声区間であるフレームが所定数以上存在する旨を示していれば、Ｎフレーム前のフレームが音声区間であると判定し、それらの比較結果がそれ以外を示していれば、Ｎフレーム前のフレームが雑音区間であると判定する遅延判定手段と、上記遅延判定手段によりＮフレーム前のフレームが雑音区間であると判定された場合に限り、上記記憶手段に記憶されている現在のフレームよりＮフレーム前のフレームのスペクトルにしたがって推定雑音スペクトルを更新する更新手段と、入力音声の現在のフレームにおけるスペクトルから上記更新手段により更新された推定雑音スペクトルを減算したときのスペクトルの減少率を求め、その減少率を入力音声の現在のフレームにおけるスペクトルに乗じる補正処理を実施する補正手段と、上記補正手段により補正されたスペクトルを信号領域の出力音声に変換する音声生成手段とを備えた雑音抑圧装置。
入力音声を数フレーム分記憶する記憶手段と、上記記憶手段に記憶されている入力音声を分析して、その入力音声のＮフレーム前のスペクトルを取得するスペクトル分析手段と、上記記憶手段に記憶されている入力音声を分析して、その入力音声の特徴を表す遅延判定用パラメータを取得するパラメータ分析手段と、上記パラメータ分析手段により分析された現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果がＮフレーム前のフレームが音声区間である旨を示し、かつ、そのフレームの近傍に音声区間であるフレームが所定数以上存在する旨を示していれば、Ｎフレーム前のフレームが音声区間であると判定し、それらの比較結果がそれ以外を示していれば、Ｎフレーム前のフレームが雑音区間であると判定する遅延判定手段と、上記遅延判定手段によりＮフレーム前のフレームが雑音区間であると判定された場合に限り、上記スペクトル分析手段により分析された現在のフレームよりＮフレーム前のフレームのスペクトルにしたがって推定雑音スペクトルを更新する更新手段と、入力音声の現在のフレームにおけるスペクトルから上記更新手段により更新された推定雑音スペクトルを減算したときのスペクトルの減少率を求め、その減少率を入力音声の現在のフレームにおけるスペクトルに乗じる補正処理を実施する補正手段と、上記補正手段により補正されたスペクトルを信号領域の出力音声に変換する音声生成手段とを備えた雑音抑圧装置。
パラメータ分析手段は、スペクトル分析手段により取得された入力音声のスペクトルから遅延判定用パラメータを算出することを特徴とする請求項９または請求項１０記載の雑音抑圧装置。
遅延判定手段は、更新手段により更新された推定雑音スペクトルから遅延判定用パラメータを算出することを特徴とする請求項９または請求項１０記載の雑音抑圧装置。
更新手段は、遅延判定手段が音声区間である可能性の大きさを算出すると、その音声区間である可能性が低い程、Ｎフレーム前のフレームのスペクトルに大きな重みを付けて推定雑音スペクトルを更新することを特徴とする請求項９から請求項１２のうちのいずれか１項記載の雑音抑圧装置。
更新手段により更新された推定雑音スペクトルの変動を分析し、その変動が大きい程、遅延判定手段の判定対象のフレームであるＮフレームを現在のフレームより過去のフレームに設定する遅延制御手段を設けたことを特徴とする請求項９から請求項１３のうちのいずれか１項記載の雑音抑圧装置。
入力音声をフレーム毎に分析して、その入力音声の特徴を表す遅延判定用パラメータと非遅延判定用パラメータを取得するパラメータ分析手段と、上記パラメータ分析手段により取得された遅延判定用パラメータと非遅延判定用パラメータを記憶する記憶手段と、上記記憶手段に記憶されている現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果がＮフレーム前のフレームが音声区間である旨を示し、かつ、そのフレームの近傍に音声区間であるフレームが所定数以上存在する旨を示していれば、Ｎフレーム前のフレームが音声区間であると判定し、それらの比較結果がそれ以外を示していれば、Ｎフレーム前のフレームが雑音区間であると判定する遅延判定手段と、上記遅延判定手段によりＮフレーム前のフレームが音声区間であると判定された場合、Ｎフレーム前の非遅延判定用パラメータにしたがって音声区間の平均的な非遅延判定用パラメータを更新し、Ｎフレーム前のフレームが雑音区間であると判定された場合、Ｎフレーム前の非遅延判定用パラメータにしたがって雑音区間の平均的な非遅延判定用パラメータを更新し、その後、雑音区間及び音声区間の平均的な非遅延判定用パラメータと上記記憶手段に記憶されている現在のフレームよりＮフレーム前のフレームの非遅延判定用パラメータにしたがって第１及び第２の判定用閾値を更新する更新手段と、現在のフレームより１フレーム前のフレームの判定結果が音声区間であって、上記パラメータ分析手段により取得された現在のフレームの非遅延判定用パラメータが上記更新手段により更新された第１の判定用閾値より大きい場合、または、現在のフレームより１フレーム前のフレームの判定結果が雑音区間であって、現在のフレームの非遅延判定用パラメータが上記更新手段により更新された第２の判定用閾値より大きい場合、現在のフレームが音声区間であると判定し、それ以外であれば、現在のフレームが雑音区間であると判定する非遅延判定手段と、その入力音声をフレーム毎に分析して、その入力音声のスペクトルを取得するスペクトル分析手段と、上記非遅延判定手段により現フレームが雑音区間であると判定された場合に限り、上記スペクトル分析手段により分析された入力音声のスペクトルにしたがって推定雑音スペクトルを更新する更新手段と、入力音声の現在のフレームにおけるスペクトルから上記更新手段により更新された推定雑音スペクトルを減算したときのスペクトルの減少率を求め、その減少率を入力音声の現在のフレームにおけるスペクトルに乗じる補正処理を実施する補正手段と、上記補正手段により補正されたスペクトルを信号領域の出力音声に変換する音声生成手段とを備えた雑音抑圧装置。
入力音声を数フレーム分記憶する記憶手段と、上記記憶手段に記憶されている入力音声を分析して、その入力音声の特徴を表す遅延判定用パラメータと非遅延判定用パラメータを取得するパラメータ分析手段と、上記パラメータ分析手段により取得された現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果がＮフレーム前のフレームが音声区間である旨を示し、かつ、そのフレームの近傍に音声区間であるフレームが所定数以上存在する旨を示していれば、Ｎフレーム前のフレームが音声区間であると判定し、それらの比較結果がそれ以外を示していれば、Ｎフレーム前のフレームが雑音区間であると判定する遅延判定手段と、上記遅延判定手段によりＮフレーム前のフレームが音声区間であると判定された場合、Ｎフレーム前の非遅延判定用パラメータにしたがって音声区間の平均的な非遅延判定用パラメータを更新し、Ｎフレーム前のフレームが雑音区間であると判定された場合、Ｎフレーム前の非遅延判定用パラメータにしたがって雑音区間の平均的な非遅延判定用パラメータを更新し、その後、雑音区間及び音声区間の平均的な非遅延判定用パラメータと上記パラメータ分析手段により取得された現在のフレームよりＮフレーム前のフレームの非遅延判定用パラメータにしたがって第１及び第２の判定用閾値を更新する更新手段と、現在のフレームより１フレーム前のフレームの判定結果が音声区間であって、上記パラメータ分析手段により取得された現在のフレームの非遅延判定用パラメータが上記更新手段により更新された第１の判定用閾値より大きい場合、または、現在のフレームより１フレーム前のフレームの判定結果が雑音区間であって、現在のフレームの非遅延判定用パラメータが上記更新手段により更新された第２の判定用閾値より大きい場合、現在のフレームが音声区間であると判定し、それ以外であれば、現在のフレームが雑音区間であると判定する非遅延判定手段と、その入力音声をフレーム毎に分析して、その入力音声のスペクトルを取得するスペクトル分析手段と、上記非遅延判定手段により現フレームが雑音区間であると判定された場合に限り、上記スペクトル分析手段により分析された入力音声のスペクトルにしたがって推定雑音スペクトルを更新する更新手段と、入力音声の現在のフレームにおけるスペクトルから上記更新手段により更新された推定雑音スペクトルを減算したときのスペクトルの減少率を求め、その減少率を入力音声の現在のフレームにおけるスペクトルに乗じる補正処理を実施する補正手段と、上記補正手段により補正されたスペクトルを信号領域の出力音声に変換する音声生成手段とを備えた雑音抑圧装置。
入力音声をフレーム毎に分析して、その入力音声の特徴を表す遅延判定用パラメータと特徴情報を取得し、その遅延判定用パラメータと特徴情報を記憶すると、その入力音声の現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果がＮフレーム前のフレームが音声区間である旨を示し、かつ、そのフレームの近傍に音声区間であるフレームが所定数以上存在する旨を示していれば、Ｎフレーム前のフレームが音声区間であると判定し、それらの比較結果がそれ以外を示していれば、Ｎフレーム前のフレームが雑音区間であると判定し、その判定結果が、Ｎフレーム前のフレームが雑音区間である旨を示す場合に限り、Ｎフレーム前のフレームの特徴情報にしたがって推定雑音情報を更新する推定雑音情報更新方法。
入力音声を数フレーム分記憶して、その入力音声をフレーム毎に分析し、その入力音声の特徴を表す遅延判定用パラメータと特徴情報を取得すると、その入力音声の現在のフレームよりＮフレーム前のフレーム及びそのフレームの近傍のフレームの遅延判定用パラメータと平均的な雑音区間の遅延判定用パラメータとを比較し、それらの比較結果がＮフレーム前のフレームが音声区間である旨を示し、かつ、そのフレームの近傍に音声区間であるフレームが所定数以上存在する旨を示していれば、Ｎフレーム前のフレームが音声区間であると判定し、それらの比較結果がそれ以外を示していれば、Ｎフレーム前のフレームが雑音区間であると判定し、その判定結果が、Ｎフレーム前のフレームが雑音区間である旨を示す場合に限り、Ｎフレーム前のフレームの特徴情報にしたがって推定雑音情報を更新する推定雑音情報更新方法。
遅延判定用パラメータと特徴情報を共通化することを特徴とする請求項１７または請求項１８記載の推定雑音情報更新方法。
音声区間である可能性の大きさを算出し、その音声区間である可能性が低い程、Ｎフレーム前のフレームの特徴情報に大きな重みを付けて推定雑音スペクトルを更新することを特徴とする請求項１７から請求項１９のうちのいずれか１項記載の推定雑音情報更新方法。
推定雑音情報の変動を分析し、その変動が大きい程、判定対象のフレームであるＮフレームを現在のフレームより過去のフレームに設定することを特徴とする請求項１７から請求項２０のうちのいずれか１項記載の推定雑音情報更新方法。