JP3960834B2

JP3960834B2 - 音声強調装置及び音声強調方法

Info

Publication number: JP3960834B2
Application number: JP2002077327A
Authority: JP
Inventors: 幼華王; 幸司吉田
Original assignee: Panasonic Corp; Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Corp; Panasonic Holdings Corp
Priority date: 2002-03-19
Filing date: 2002-03-19
Publication date: 2007-08-15
Anticipated expiration: 2022-03-19
Also published as: JP2003280696A

Description

【０００１】
【発明の属する技術分野】
本発明は、音声強調装置及び音声強調方法に関し、特に通信に用いて好適な音声強調装置及び音声強調方法に関する。
【０００２】
【従来の技術】
従来の音声符号化通信において、低ビットレートで音声を符号化して通信を行うと、背景雑音のない音声に対しては高品質な音声での通話を提供することができるが、背景雑音が含まれた音声に対しては低ビットレート符号化特有の耳障りな歪みが生じ、音質が劣化する。
【０００３】
この音質が劣化する問題の対処するため雑音抑圧処理を行うことがある。この雑音抑圧処理に関する音声強調技術としてスペクトルサブトラクション法、およびコムフィルタ法がある。
【０００４】
スペクトルサブトラクション法（ＳＳ法）は、雑音情報に着目して無音区間で雑音の性質を推定して雑音を含む音声信号の短時間パワスペクトルから雑音の短時間パワスペクトルを減算する、または減衰係数を乗算することにより音声信号のパワスペクトルを推定して雑音を抑圧する方法である。ＳＳ法は、例えば、文献１（S.Boll,Suppression of acoustic noise in speech using spectral subtraction,IEEE Trans.Acoustics,Speech,and Signal Processing,vol.ASSP-27,pp.113-120,1979）、文献２(R.J.McAulay,M.L.Malpass,Speech enhancement using a soft-decision noise suppression filter,IEEE.Trans.Acoustics,Speech,and Signal Processing,vol.ASSP-28,pp.137-145.1980)に記載されているものがある。
【０００５】
しかしながら、ＳＳ法では、音声からノイズを差し引いた後の残留ノイズとして、音声ピッチ間の残留ノイズに起因する歪を生じる。
【０００６】
例えば、音声強調方法として用いられる文献１に示したＳＳ法では、ノイズ情報のみに着目し、短時間のノイズ特性を定常と見なして、音声とノイズを区別せず、一律にノイズベース（推定されたノイズのスペクトル特性）を差し引く。しかし、ＳＳ法では、音声の情報（例えば、音声のピッチ）は利用していない。実際の通信では、ノイズの特性が定常でないため、差し引かれた後の残留ノイズ、特に音声ピッチ間の残留ノイズにより、いわゆる「ミュジカルノイズ」と呼ばれる不自然な歪を生じる。
【０００７】
この不自然な歪みの改善法として、音声パワ対ノイズパワの比（ＳＮＲ）に基づき、減衰係数を乗じてノイズを減衰する方法、例えば、特許第２７１４６５６号及び特願平９-５１８８２０号に開示されたものが提案されている。
【０００８】
これらに開示された方法では、音声の大きい（ＳＮＲが大きい）帯域とノイズの大きい（ＳＮＲが小さい）帯域を区別して異なる減衰係数を用いるため、ミュジカルノイズを抑制し、音質を向上させた。
【０００９】
しかし、特許第２７１４６５６号及び特願平９-５１８８２０号に開示された方法では、処理する周波数チャネル数（１６チャネル）は十分でないので、音声ピッチ調波情報を雑音から分離し抽出することがむずかしい。
【００１０】
また、音声とノイズ両方の帯域に減衰係数を用いるため、互いに影響を及ぼし合う結果、減衰係数は大きくすることができない。例えば、減衰係数を大きくすると、ＳＮＲ推定の誤りによって、音声の歪みを生じる可能性がある。この結果、ノイズの減衰が不十分となる。
【００１１】
一方、コムフィルタ法は、音声情報に着目し、音声ピッチにコムフィルタをかけることにより雑音減衰を行う方法である。コムフィルタとは、周波数領域単位で入力された信号を所定の比率で減衰させ、または減衰させずに信号を出力するフィルタであり、櫛状の減衰特性をもつ。デジタルデータ処理でコムフィルタ法を実現する場合、コムフィルタ法では、コムフィルタの減衰特性を周波数領域毎に減衰特性のデータを作成し、周波数毎に音声スペクトルを乗算することにより雑音を抑圧できる。
【００１２】
コムフィルタ法に関する文献として、文献３(J.S.Lim etc.,Evaluation of an adaptive comb filtering method for enhancing speech degraded by white noise addition,IEEE Trans.Acoustics,Speech,and Signal Processing,vol.ASSP26,pp.354-358,1978)に示すものがある。
【００１３】
従来のコムフィルタ法では、基本周波数であるピッチに推定誤差があると、その高調波では誤差分が拡大し、本来の高調波成分がその通過帯域からはずれる可能性がより大きくなる。また、準周期性を持つ音声とそうでない音声を判別する必要があるため、実現性に問題がある。また、移動体通信において、単に雑音を抑圧することによって、自然感のある周囲騒音も抑圧され、通話の違和感を生じることがある。
【００１４】
通話の違和感を解消する方法として、音声と雑音を分離し、それぞれ符号化と復号化を行うことによって良好な音声と周囲騒音を再生する技術がある。例えば、文献４（三関公生, 押切正浩, 音声・背景雑音分離にもとづく低レート音声符号化, 日本音響学会講演論文集, pp.235-236, 平成10年3月）に示した方法がある。
【００１５】
文献４に示した方法は、ＳＳ法を用いて音声強調を行い、雑音抑圧された入力信号を音声成分とし、入力信号と音声成分を減算した結果を雑音成分とする方法である。基本的にはＳＳ法と同じ方法であるため、本方法による分離方法では良好な音声と雑音特性を得ることが難しい。
【００１６】
【発明が解決しようとする課題】
このように、従来の装置においては、音声の歪みが少なくかつ雑音を十分に除去することが難しいという問題がある。
【００１７】
発明は、かかる点に鑑みてなされたものであり、音声の歪みが少なくかつ雑音を十分に除去することができる音声強調装置を提供するとともに、良好な音声と雑音の特性を得られる音声強調装置及び音声強調方法を提供することを目的とする。
【００１８】
【課題を解決するための手段】
本発明の音声強調装置は、入力信号のスペクトルを所定の周波数単位で分割した周波数分割スペクトルを出力する周波数分割手段と、周波数分割スペクトルに基づいて無音と判定した周波数領域の信号を減衰する第一コムフィルタを作成する第一コムフィルタ作成手段と、周波数分割スペクトルに基づいて第一コムフィルタより多くの雑音のピークを取り除いたフィルタである第二コムフィルタを作成する第二コムフィルタ作成手段と、前記周波数分割スペクトルから音声ピッチを推定するピッチ推定手段と、前記第二コムフィルタと前記音声ピッチに基づいてピッチ調波構造を表すピッチ調波修復コムフィルタを作成するピッチ調波構造修復手段と、前記ピッチ調波修復コムフィルタの通過域と重複する第一コムフィルタの通過域のみを通過域とするように前記第一コムフィルタを修正するコムフィルタ修正手段と、前記コムフィルタ修正手段において修正された第一コムフィルタを用いて前記周波数分割スペクトルのノイズを抑圧する抑圧手段と、ノイズを抑圧した前記周波数分割スペクトルを周波数領域で連続したスペクトル信号に合成する音声周波数合成手段と、を具備する構成を採る。
【００１９】
この構成によれば、音声信号のスペクトルから音声ピークである可能性の高いピークを取り出して音声ピッチを推定するコムフィルタを作成し、このコムフィルタから正確な音声ピッチ情報を取得し、また、できる限り多くの音声情報を取り出してノイズ信号の抑圧を行うコムフィルタを作成し、このコムフィルタを用いて雑音に埋もれた音声スペクトルのピークを抑圧しないことにより、正しい音声ピッチ情報に基づいて欠落した音声ピッチ調波構造を補ったコムフィルタを作成することができ、このコムフィルタを用いてノイズ信号を抑圧することにより、音声歪みの少ない音声強調を行うことができる。
【００２０】
本発明の音声強調装置は、第一コムフィルタと第二コムフィルタとから音声スペクトルに音声成分が含まれているか否か判定する音声／雑音フレーム検出手段を具備し、コムフィルタ修正手段は、前記音声／雑音フレーム検出手段の判定が音声成分を含まない結果である場合、前記第一コムフィルタに各周波数成分で信号を減衰する修正をする構成を採る。
【００２１】
本発明の音声強調装置は、前記音声／雑音フレーム検出手段は、第一コムフィルタの通過域における入力信号のパワスペクトルの和と第一コムフィルタの阻止域における入力信号のパワスペクトルの和の比を第一結果とし、第二コムフィルタの通過域における入力信号のパワスペクトルの和と第二コムフィルタの阻止域における入力信号のパワスペクトルの和の比を第二結果とし、第一結果と第二結果を加算した結果が所定の閾値より大きい場合、前記加算結果を用い、前記加算結果が所定の閾値以下である場合、第二結果を用いて音声スペクトルに音声が含まれるか否か判定する構成を採る。
【００２２】
これらの構成によれば、第一コムフィルタと第二コムフィルタとから音声スペクトルに音声成分が含まれているか否か判定し、この判定が音声成分を含まない結果である場合、前記第一コムフィルタに各周波数成分で信号を減衰することにより、突発的に発生するノイズを抑圧することができる。
【００２３】
本発明の音声強調装置は、第一コムフィルタ生成手段は、入力信号のパワスペクトルの極小値から所定の範囲を阻止域とする第一コムフィルタを作成する構成を採る。
【００２４】
この構成によれば、入力信号のパワスペクトルの極小値から所定の範囲を阻止域とするコムフィルタを作成し、このコムフィルタを用いてノイズ信号を抑圧することにより、音声とノイズのレベル差が少ない場合でも、音声ピッチ調波構造を抽出して修復して音声歪を低減することができる。
【００２５】
本発明の音声強調装置は、入力信号のパワスペクトルからノイズベースを減算し、減算結果の自己相関関数を用いて音声ピッチを推定するピッチ推定手段を具備し、コムフィルタ修正手段は、前記ピッチ推定手段において推定した音声ピッチで前記第一コムフィルタに含まれる音声ピッチ調波構造を修正する構成を採る。
【００２６】
この構成によれば、入力信号のパワスペクトルからノイズベースを減算し、減算結果の自己相関関数に基づいて音声ピッチを推定し、推定した音声ピッチでコムフィルタに含まれる音声ピッチ調波構造を修正することにより、コムフィルタのピッチ調波構造の修復を行うことができ、音声歪みの少ない音声強調を行うことができる。
【００２７】
本発明の音声強調装置は、入力信号のパワスペクトルからノイズベースを減算した結果に、直流成分に所定のパワを持つ擬似ピークを生成する直流成分生成手段を具備し、ピッチ推定手段は、前記直流成分生成手段において擬似ピークを生成した前記パワスペクトルから音声ピッチを推定する構成を採る。
【００２８】
この構成によれば、入力信号のパワスペクトルからノイズベースを減算した結果に直流成分に所定のパワを持つ擬似ピークを生成し、直流成分を生成したスペクトルの自己相関関数に基づいて音声ピッチを推定し、推定した音声ピッチでコムフィルタに含まれる音声ピッチ調波構造を修正することにより、音声スペクトルの調波ピークが少ない場合でも、ピッチ情報を得てコムフィルタのピッチ調波構造の修復を行うことができ、音声歪みの少ない音声強調を行うことができる。
【００２９】
本発明の音声強調装置は、入力信号のパワスペクトルからノイズベースを減算した結果において、パワが所定の閾値以上である周波数領域の数の移動平均を算出するノイズ特性推定手段を具備し、第二コムフィルタ作成手段は、前記移動平均から入力信号に音声が含まれるか否か判断した結果より第二コムフィルタを作成する構成を採る。
【００３０】
この構成によれば、入力信号のノイズレベルの分布を検出し、この分布に基づいて音声スペクトルからコムフィルタを生成する基準を決定し、作成したコムフィルタからピッチ情報を取得することにより、雑音の状態に応じたピッチ情報を取得してコムフィルタを作成することができ、音声歪みの少ない音声強調を行うことができる。
【００３１】
本発明の音声強調装置は、入力信号のパワスペクトルからノイズベースを減算した結果において、パワが所定の閾値以上である周波数領域の数の移動平均を算出するノイズ特性推定手段を具備し、第二コムフィルタ作成手段は、ノイズ特性推定手段において算出された移動平均が所定の値以下である場合、所定の周波数領域を阻止域とする第二コムフィルタを作成する構成を採る。
【００３２】
この構成によれば、ノイズ特性の推定結果に基づいて周波数成分を選択し、第二コムフィルタにおいて、選択された周波数領域をすべて阻止域に変換することによって、分散値の大きいノイズにより生成した偽のピッチ調波を減少し、偽のピッチ調波を生じにくい低周波数領域におけるピッチ調波を基準に、ピッチ調波構造の修復を行えば、正確にピッチ調波構造を修復することができる。
【００３３】
本発明の音声強調装置は、入力信号のパワスペクトルとノイズベースから信号対雑音比を算出するＳＮＲ推定手段を具備し、抑圧手段は、前記信号対雑音比から周波数分割スペクトルのノイズの抑圧量を決定する構成を採る。
【００３４】
この構成によれば、修正コムフィルタの通過域と阻止域において、入力音声パワスペクトルからノイズベースを減算する量とノイズ減衰の度合いをＳＮＲ推定値の大きさに応じて調整することによって、異なるＳＮＲの環境下でも適切なノイズ減衰を行い、音声歪と残留ノイズの少ない音声強調を実現できる。
【００３５】
本発明の音声強調装置は、ＳＮＲ推定手段は、音声成分のレベルを入力信号のパワスペクトルの移動平均値より算出し、雑音成分のレベルをノイズベースの推定値に各周波数成分別に重み計数を乗算した値より算出し、前記音声成分のレベルと前記雑音成分のレベルの比から信号対雑音比を算出する構成を採る。
【００３６】
この構成によれば、入力音声パワスペクトルの移動平均値からノイズベースを減算して音声レベルの計算することにより、ノイズの影響を減少し、低ＳＮＲの環境下でも正確な音声レベルを計算することができる。また、ノイズベース推定値の各周波数成分に重み係数を乗算して計算することにより、異なるノイズに対して適切な減衰を行い、音声歪を低減することができる。
【００３７】
本発明の音声強調装置は、信号対雑音比と前記信号対雑音比の移動平均値との偏差を算出し、前記偏差を用いて前記信号対雑音比の移動平均値を更新する変動抑圧手段を具備し、抑圧手段は、変動抑圧手段において更新された前記信号対雑音比の移動平均値から周波数分割スペクトルのノイズの抑圧量を決定する構成を採る。
【００３８】
この構成によれば、ＳＮＲ推定値とＳＮＲ推定値の長期移動平均値の偏差を計算し、ＳＮＲ推定値の長期移動平均値と前記偏差の一部を加算してＳＮＲ推定値として用いることによって、ＳＮＲの変動を有効に抑制し、安定的にＳＮＲの大きさに応じてノイズ減衰のレベル調整を行うことができる。
【００３９】
本発明の音声強調装置は、所定の時間単位で更新速度の異なる二つのノイズベースの移動平均値を算出し、第一移動平均値より更新速度の速い第二移動平均値で第一移動平均値の更新条件を変更し、第一移動平均値をノイズベース推定値として出力するノイズベース更新手段を具備する構成を採る。
【００４０】
この構成によれば、更新速度の速い移動平均係数を用いてノイズベースの推定を行うことによって、音声区間においても雑音レベルの急激な変動を追跡することができる。また、更新速度の遅いノイズベースの更新は、更新速度の速いノイズベースに基づいて行うことによって、正確にノイズベースの推定を行うことができ、雑音レベルの急激な変動によるノイズベース更新の停止を防止することができる。
【００４１】
本発明の無線通信装置は、上記いずれかに記載の音声強調装置を具備する構成を採る。
【００４２】
この構成によれば、音声信号のスペクトルから音声ピークである可能性の高いピークを取り出して音声ピッチを推定するコムフィルタを作成し、このコムフィルタから正確な音声ピッチ情報を取得し、また、できる限り多くの音声情報を取り出して力信号の抑圧を行うコムフィルタを作成し、このコムフィルタを用いて雑音に埋もれた音声スペクトルのピークを抑圧しないことにより、正しい音声ピッチ情報に基づいて欠落した音声ピッチ調波構造を補ったコムフィルタを作成することができ、このコムフィルタを用いてノイズ信号を抑圧することにより、音声歪みの少ない音声強調を行うことができる。
【００５３】
本発明の音声強調方法は、入力信号のスペクトルを所定の周波数単位で分割した周波数分割スペクトルを出力する周波数分割ステップと、周波数分割スペクトルに基づいて無音と判定した周波数領域の信号を減衰する第一コムフィルタを作成する第一コムフィルタ作成ステップと、周波数分割スペクトルに基づいて第一コムフィルタより多くの雑音のピークを取り除いたフィルタである第二コムフィルタを作成する第二コムフィルタ作成ステップと、前記周波数分割スペクトルから音声ピッチを推定するピッチ推定ステップと、前記第二コムフィルタと前記音声ピッチに基づいてピッチ調波構造を表すピッチ調波修復コムフィルタを作成するピッチ調波構造修復ステップと、前記ピッチ調波修復コムフィルタの通過域と重複する第一コムフィルタの通過域のみを通過域とするように前記第一コムフィルタを修正するコムフィルタ修正ステップと、前記修正された第一コムフィルタを用いて前記周波数分割スペクトルのノイズを抑圧する抑圧ステップと、ノイズを抑圧した前記周波数分割スペクトルを周波数領域で連続したスペクトル信号に合成する音声周波数合成ステップと、を具備するようにした。
【００５４】
この方法によれば、音声信号のスペクトルから音声ピークである可能性の高いピークを取り出して音声ピッチを推定するコムフィルタを作成し、このコムフィルタから正確な音声ピッチ情報を取得し、また、できる限り多くの音声情報を取り出して力信号の抑圧を行うコムフィルタを作成し、このコムフィルタを用いて雑音に埋もれた音声スペクトルのピークを抑圧しないことにより、正しい音声ピッチ情報に基づいて欠落した音声ピッチ調波構造を補ったコムフィルタを作成することができ、このコムフィルタを用いて音声信号を抑圧することにより、音声歪みの少ない音声強調を行うことができる。
【００５７】
本発明の音声強調プログラムは、入力信号のスペクトルを所定の周波数単位で分割した周波数分割スペクトルを出力する周波数分割ステップと、周波数分割スペクトルに基づいて無音と判定した周波数領域の信号を減衰する第一コムフィルタを作成する第一コムフィルタ作成ステップと、周波数分割スペクトルに基づいて第一コムフィルタより多くの雑音のピークを取り除いたフィルタである第二コムフィルタを作成する第二コムフィルタ作成ステップと、前記周波数分割スペクトルから音声ピッチを推定するピッチ推定ステップと、前記第二コムフィルタと前記音声ピッチに基づいてピッチ調波構造を表すピッチ調波修復コムフィルタを作成するピッチ調波構造修復ステップと、前記ピッチ調波修復コムフィルタの通過域と重複する第一コムフィルタの通過域のみを通過域とするように前記第一コムフィルタを修正するコムフィルタ修正ステップと、前記修正された第一コムフィルタを用いて前記周波数分割スペクトルのノイズを抑圧する抑圧ステップと、ノイズを抑圧した前記周波数分割スペクトルを周波数領域で連続したスペクトル信号に合成する音声周波数合成ステップと、をコンピュータに実行させる構成を採る。
【００５８】
この構成によれば、音声信号のスペクトルから音声ピークである可能性の高いピークを取り出して音声ピッチを推定するコムフィルタを作成し、このコムフィルタから正確な音声ピッチ情報を取得し、また、できる限り多くの音声情報を取り出してノイズ信号の抑圧を行うコムフィルタを作成し、このコムフィルタを用いて雑音に埋もれた音声スペクトルのピークを抑圧しないことにより、正しい音声ピッチ情報に基づいて欠落した音声ピッチ調波構造を補ったコムフィルタを作成することができ、このコムフィルタを用いてノイズ信号を抑圧することにより、音声歪みの少ない音声強調を行うことができる。
【００６１】
本発明のサーバ装置は、入力信号のスペクトルを所定の周波数単位で分割した周波数分割スペクトルを出力する周波数分割ステップと、周波数分割スペクトルに基づいて無音と判定した周波数領域の信号を減衰する第一コムフィルタを作成する第一コムフィルタ作成ステップと、周波数分割スペクトルに基づいて第一コムフィルタより多くの雑音のピークを取り除いたフィルタである第二コムフィルタを作成する第二コムフィルタ作成ステップと、前記周波数分割スペクトルから音声ピッチを推定するピッチ推定ステップと、前記第二コムフィルタと前記音声ピッチに基づいてピッチ調波構造を表すピッチ調波修復コムフィルタを作成するピッチ調波構造修復ステップと、前記ピッチ調波修復コムフィルタの通過域と重複する第一コムフィルタの通過域のみを通過域とするように前記第一コムフィルタを修正するコムフィルタ修正ステップと、前記修正された第一コムフィルタを用いて前記周波数分割スペクトルのノイズを抑圧する抑圧ステップと、ノイズを抑圧した前記周波数分割スペクトルを周波数領域で連続したスペクトル信号に合成する音声周波数合成ステップと、をコンピュータに実行させることを特徴とする音声強調プログラムを記憶し、要求に応じて前記音声強調プログラムを出力する構成を採る。
【００６２】
この構成によれば、音声信号のスペクトルから音声ピークである可能性の高いピークを取り出して音声ピッチを推定するコムフィルタを作成し、このコムフィルタから正確な音声ピッチ情報を取得し、また、できる限り多くの音声情報を取り出して力信号の抑圧を行うコムフィルタを作成し、このコムフィルタを用いて雑音に埋もれた音声スペクトルのピークを抑圧しないことにより、正しい音声ピッチ情報に基づいて欠落した音声ピッチ調波構造を補ったコムフィルタを作成することができ、このコムフィルタを用いてノイズ信号を抑圧することにより、音声歪みの少ない音声強調を行うことができる。
【００６５】
【発明の実施の形態】
本発明の骨子は、音声信号の周波数分割スペクトルに基づいて音声抑圧に用いるコムフィルタより多くの雑音のピークを取り除いたコムフィルタを生成し、このコムフィルタを用いて音声信号のピッチ情報を取得し、コムフィルタの音声ピッチを補うことである。
【００６６】
以下、本発明の実施の形態について図面を参照して詳細に説明する。
（実施の形態１）
図１は、本発明の実施の形態１に係る音声強調装置の構成を示すブロック図である。図１において、音声強調装置１００は、時間分割部１０１と、窓掛け部１０２と、ＦＦＴ部１０３と、周波数分割部１０４と、ノイズベース推定部１０５と、第一音声/非音声識別部１０６と、第二音声/非音声識別部１０７と、第一コムフィルタ生成部１０８と、第二コムフィルタ生成部１０９と、有声/無声判別部１１０と、ピッチ推定部１１１と、ピッチ調波構造修復部１１２と、コムフィルタ修正部１１３と、音声分離係数計算部１１４と、乗算部１１５と、音声周波数合成部１１６と、ＩＦＦＴ部１１７と、から主に構成される。
【００６７】
時間分割部１０１は、入力された音声信号から所定時間単位で区切られたフレームを構成し、窓掛け部１０２に出力する窓掛け部１０２は、時間分割部１０１から出力されたフレームにハニングウインドウ等を利用した窓掛け処理を行ってＦＦＴ部１０３に出力する。ＦＦＴ部１０３は、窓掛け部１０２から出力された音声信号にＦＦＴ（Fast Fourier Transform）を行い、音声スペクトル信号を周波数分割部１０４に出力する。
【００６８】
周波数分割部１０４は、ＦＦＴ部１０３から出力された音声スペクトルを各周波数成分に分割して、周波数成分毎に分割された音声スペクトルＳ_f（ｋ）（ただし、ｋは周波数成分を特定する番号）をノイズベース推定部１０５、第一音声/非音声識別部１０６、第二音声/非音声識別部１０７、及び乗算部１１５に出力する。なお、周波数成分は、所定の周波数単位で分割された音声スペクトルの最小単位を示すものである。Ｓ_f（ｋ）は式（１）で示される。
【００６９】
【数１】

ここで、Ｒｅ｛Ｄ_f（ｋ）｝²は、ＦＦＴ変換後の入力音声信号のスペクトルの実数部を示し、Ｉｍ｛Ｄ_f（ｋ）｝²は、ＦＦＴ変換後の入力音声信号のスペクトルの虚数部を示す。
【００７０】
ノイズベース推定部１０５は、フレームに音声成分が含まれていない判定結果が出力された場合、周波数分割部１０４から出力された音声スペクトルの周波数成分毎の短時間パワスペクトルを用いてノイズベースを更新する。
【００７１】
具体的には、式（２）を用いて各周波数成分におけるノイズベースを推定し、推定されたノイズベースを音声/非音声識別部１０６と音声/非音声識別部１０７に出力する。
【００７２】
【数２】

ここで、Ｐ_base（ｎ−１、ｋ）はノイズベース、ｎは処理を行うフレームを特定する番号、kは周波数成分を特定する番号を示す。また、Θ_baseは音声とノイズを判別する閾値、αは移動平均係数を示す。
【００７３】
第一音声/非音声識別部１０６と第二音声/非音声識別部１０７は、周波数分割部１０４から出力された音声スペクトル信号とノイズベース推定部１０５から出力されるノイズベースの値の差が所定の閾値以上である場合、音声成分を含む有音部分と判定し、それ以外の場合、音声成分を含まない雑音のみの無音部分であると判定する。
【００７４】
そして、第一音声/非音声識別部１０６は、判定結果を第一コムフィルタ生成部１０８に出力し、第二音声/非音声識別部１０７は、判定結果を第二コムフィルタ生成部１０９に出力する。
【００７５】
第一コムフィルタ生成部１０８は、音声ピッチ調波情報を多く抽出するように、第一音声/非音声識別部１０６の閾値を低く設定して、各周波数成分における音声成分の有無に基づいて音声ピッチ調波構造を強調するコムフィルタを生成して、このコムフィルタ結果をコムフィルタ修正部１１３に出力する。
【００７６】
具体的には、以下の式（３）を用いて第一コムフィルタCOMB＿low(k)を生成する。
【００７７】
【数３】

ここでΘ_lowは第１コムフィルタ用閾値である。また、ＨＢは、ＦＦＴ変換長つまり高速フーリエ変換を行うデータ数であり、例えばＨＢ＝５１２とする。
【００７８】
第二コムフィルタ生成部１０９は、雑音情報に影響されないように、第二音声/非音声識別部１０７の閾値を高く設定して、各周波数成分における音声成分の有無に基づいて音声ピッチ調波構造を修復する基準コムフィルタとして生成して、このコムフィルタの結果を有声/無声判別部１１０およびピッチ調波構造修復部１１２に出力する。具体的には、以下の式（４）を用いて第二コムフィルタを生成する。
【数４】

ここでΘ_highは第２コムフィルタ用閾値であり、Θ_highはΘ_lowより大きい値である。
【００７９】
有声/無声判別部１１０は、第二コムフィルタ生成部１０９から出力された結果に基づいて有声と無声を判別し、判別結果をピッチ推定部１１１に出力する。
【００８０】
具体的には、以下の式（５）と式（６）を用いて入力音声信号の低周波数領域と高周波数領域に分けて、第二コムフィルタの通過域（すなわち、COMB＿high(k)=1）の周波数成分の個数を加算する。
【００８１】
【数５】

【００８２】
【数６】

ここで、式（５）と式（６）共に設定された閾値より大きい場合、または式（５）は設定された閾値より大きく、かつ式（６）は設定された閾値より小さい場合は有声と判別し、それ以外の場合は無声と判別する。
【００８３】
有声と判別した場合は音声ピッチの推定と音声ピッチ調波構造の修復を行い、無声と判別した場合は音声ピッチの推定と音声ピッチ調波構造の修復を行わない。
【００８４】
ピッチ推定部１１１は、周波数分割部１０４から出力された音声スペクトルから音声ピッチ周期を推定し、推定結果をピッチ調波構造修復部１１２に出力する。
【００８５】
ピッチ調波構造修復部１１２は、ピッチ推定部１１１から出力された推定結果と第二コムフィルタ生成部１０９の結果に基づいてピッチの修復を行い、その結果をコムフィルタ修正部１１３に出力する。
【００８６】
具体的には、音声ピッチ調波構造の修復は以下のステップで行う。第１のステップでは、第二コムフィルタCOMB＿high(k)の通過域毎の音声スペクトルのパワのピークを抽出し、全ての通過域からピッチ調波構造修復の基準となるピッチ基準コムフィルタCOMB＿int(k)を生成する。
【００８７】
第２のステップでは、ピッチ基準コムフィルタのピークとピークの間隔を計算し、所定の閾値（例えば１．５倍のピッチ周期）を超えたら、ピッチ推定の結果に基づいて欠落したピッチ調波の挿入を行い、ピッチ調波挿入コムフィルタCOMB＿rec(k)を生成する。
【００８８】
第３のステップでは、ピッチ周期の値に応じてピッチ調波挿入コムフィルタの櫛、すなわち通過域の幅を広くするピッチ調波修復コムフィルタCOMB＿ext(k)を生成する。
【００８９】
コムフィルタ修正部１１３は、ピッチ調波構造修復部１１２から出力された推定結果と第一コムフィルタ生成部１０８から出力された結果を組み合せてコムフィルタの修正を行い、その結果を音声分離係数計算部１１４に出力する。
【００９０】
具体的には、ピッチ調波修復コムフィルタCOMB＿ext(k)の通過域と第一コムフィルタCOMB＿low(k)の通過域を比較して、重複する部分があれば、第一コムフィルタの通過域を修正後のコムフィルタの通過域とし、それ以外の部分は修正後のコムフィルタの阻止域とすることによって修正後のコムフィルタCOMB＿res(k)を生成する。
【００９１】
音声分離係数計算部１１４は、コムフィルタ修正部１１３において生成されたコムフィルタに、周波数特性に基づいた分離係数を乗算して、周波数成分毎に入力信号の分離係数の設定を行い、各周波数成分の分離係数を乗算部１１５に出力する。
【００９２】
例えば、以下の式（７）から分離係数seps(k)を算出して入力信号に乗算することもできる。
【００９３】
【数７】

ここでｇｃは定数、ｋは周波数成分を特定する変数、γはノイズベースの減算量を調整する係数である。また、Ｐ_MAX（ｎ）は、Ｐ_base（ｎ、ｋ）の最大値を示す。また、ｇｃ・Ｐ_MAX（ｎ）/Ｐ_base（ｎ、ｋ）はフレーム毎にノイズベース推定値の正規化を行い、その逆数を利用した減衰係数であり、COMB＿res(k)はコムフィルタの修正結果である。
【００９４】
図２及び図３は本発明の音声強調結果の一例であり、上記のコムフィルタの生成、ピッチ調波構造の修復、コムフィルタの修正の各過程および音声分離係数(減衰係数)を示す。図２は、本実施の形態にかかる音声強調装置で作成されるコムフィルタの例を示す図である。図２において、縦軸はスペクトルのパワ及び、フィルタの減衰度を示し、横軸は周波数を示す。
【００９５】
コムフィルタは、Ｓ１に示す減衰特性を持ち、減衰特性は、周波数成分毎に設定される。第一コムフィルタ生成部１０８は、音声成分を含まない周波数領域の信号を減衰し、音声信号を含む周波数領域の信号を減衰しない減衰特性のコムフィルタを作成する。
【００９６】
雑音成分を含む音声スペクトルＳ２は、Ｓ１の減衰特性を持つコムフィルタをかけることにより、雑音成分を含む周波数領域の信号が減衰されてパワが小さくなり、音声信号を含む部分は減衰されずパワが変化しない。得られた音声スペクトルは、雑音成分の周波数領域がより低くなりピークが失われずに強調されたスペクトル形状となり、ピッチ調波情報が失われない雑音を抑圧した音声スペクトルＳ３が出力される。
【００９７】
図３に、本実施の形態にかかる音声処理装置におけるコムフィルタの修復の例を示す。図３において、縦軸は減衰度を示し、横軸は、周波数成分を示す。具体的には、横軸には、２５６の周波数成分があり、０ｋHzから４ｋHzの領域を示す。
【００９８】
Ｃ１は生成されたコムフィルタを、Ｃ２はコムフィルタＣ１にピッチの修復を行ったコムフィルタを、Ｃ３は、コムフィルタＣ２にピッチの幅を修正したコムフィルタを示す。
【００９９】
コムフィルタＣ１は、１００から１４０までの周波数成分でピッチ情報が失われている。ピッチ調波構造修復部１１２は、ピッチ推定部１１１において推定されたピッチ周期情報に基づいてコムフィルタＣ１の１００から１４０までの周波数成分にあるピッチ調波情報を補う。これによりコムフィルタＣ２が得られる。
【０１００】
次に、ピッチ調波構造修復部１１２は、周波数分割部１０４から出力された音声スペクトルに基づいてコムフィルタＣ２のピッチ調波の幅を修正する。これによりコムフィルタＣ３が得られる。
【０１０１】
乗算部１１５は、周波数分割部１０４から出力された音声スペクトルに音声分離係数計算部１１４から出力された分離係数を周波数成分毎に乗算する。そして、乗算した結果を音声周波数合成部１１６に出力する。
【０１０２】
音声周波数合成部１１６は、乗算部１１５から出力された各周波数成分のスペクトルを所定の処理時間単位で周波数領域の連続する音声スペクトルに合成してＩＦＦＴ部１１７に出力する。
【０１０３】
ＩＦＦＴ部１１７は、音声周波数合成部１１６から出力された音声スペクトルにＩＦＦＴ（Inverse Fast Fourier Transform）を行って音声信号に変換した信号を出力する。
【０１０４】
このように、本実施の形態の音声強調装置によれば、音声信号のスペクトルから音声ピークである可能性の高いピークを取り出して音声ピッチを推定するコムフィルタを作成し、このコムフィルタから正確な音声ピッチ情報を取得し、また、できる限り多くの音声情報を取り出してノイズ信号の抑圧を行うコムフィルタを作成し、このコムフィルタを用いて雑音に埋もれた音声スペクトルのピークを抑圧しないことにより、正しい音声ピッチ情報に基づいて欠落した音声ピッチ調波構造を補ったコムフィルタを作成することができ、このコムフィルタを用いてノイズ信号を抑圧することにより、音声歪みの少ない音声強調を行うことができる。
【０１０５】
具体的には、本発明の実施の形態の音声強調装置によれば、周波数成分毎のノイズベースの推定及び音声/非音声識別を行うことによって周波数領域において、音声ピッチ調波情報を抽出する第一コムフィルタを生成することができる。
【０１０６】
また、第二コムフィルタはピッチ調波の基本構造を提供することによって、ピッチ推定誤差による音声の高調波成分がコムフィルタの通過域からはずれることはない。
【０１０７】
また、第二コムフィルタの生成結果に基づいて有声/無声の判別を行い、ピッチ調波構造を持つ有声の場合のみ音声ピッチの推定を行い、その結果に基づいて欠落したピッチ調波構造を修復することにより、雑音に埋もれた音声情報の復元が可能となり、音声ピッチ調波欠落による音声歪を減少することができる。また、修正後のコムフィルタの結果に基づいて周波数成分毎に音声スペクトルの減衰を行うかどうかを決めるので、減衰を大きくしても音声歪の少ない音声強調を行うことができる。
【０１０８】
また、第一音声/非音声識別閾値を低く設定して第一コムフィルタを生成することによって、音声情報をより多く抽出することができる。一方、第二音声/非音声識別閾値を高く設定して第二コムフィルタを生成することによって、雑音情報の影響を受け難いコムフィルタを生成することができる。その結果に基づいて正確に音声ピッチ調波構造の修復を行うことができる。
【０１０９】
また、第二コムフィルタの生成結果に基づいて有声と無声の判別を行うことによって、少ない演算量で簡単に有声と無声を判別することができる。また、無声区間の場合は音声ピッチ推定と音声ピッチ調波構造の修復を行わないことによって、ピッチ調波構造を持たない無声区間にも対応できる。
【０１１０】
また、音声ピッチ推定結果に基づいてピッチ調波を挿入することによって、音声ピッチ調波を修復することができる。また、ピッチ調波の幅はピッチの推定結果によって自動的に調整することによって、音声ピッチ推定誤差による影響を低減し、より確実に音声ピッチ調波構造を修復することができる。更に、音声ピッチ調波構造修復の結果と第一コムフィルタの結果を比較し、重複する部分があれば、第一コムフィルタの通過域を修正後のコムフィルタの通過域とし、それ以外は修正後のコムフィルタの阻止域とすることによって、音声ピッチ調波情報のみ抽出し、ピッチ調波間のノイズ情報を抑圧することができる。
【０１１１】
（実施の形態２）
図４は実施の形態２にかかる音声強調装置の構成の例を示すブロック図である。但し、図１と共通する構成については図１と同一番号を付し、詳しい説明を省略する。
【０１１２】
図４の音声強調装置３００は、音声／雑音フレーム検出部３０１を具備し、第一コムフィルタと第二コムフィルタとから音声スペクトルに音声成分が含まれているか否か判定し、この判定が音声成分を含まない結果である場合、前記第一コムフィルタに各周波数成分で信号を減衰する修正をする点が図１の音声強調装置と異なる。
【０１１３】
具体的には、図４の音声強調装置３００は、第一コムフィルタの通過域における入力音声パワスペクトルの和と第一コムフィルタの阻止域における入力音声パワスペクトルの和の比を第１結果とし、第二コムフィルタの通過域における入力音声パワスペクトルの和と第二コムフィルタの阻止域における入力音声パワスペクトルの和の比を第２結果として、それが所定の閾値より大きい場合は第１結果と第２結果を加算し、所定の閾値より小さい場合は第２結果を用いることによって音声／雑音フレームを検出する点が、図１の音声強調装置と異なる。
【０１１４】
図４において、第一コムフィルタ生成部１０８と第二コムフィルタ生成部１０９から出力された結果および入力音声パワスペクトルを音声／雑音フレーム検出部３０１に入力し、音声／雑音フレーム検出部３０１で計算した音声／雑音フレーム検出結果をコムフィルタ修正部１１３に出力する。
【０１１５】
具体的には、まず、以下の式（８）と式（９）を用いて第一コムフィルタと第二コムフィルタに基づく音声と雑音のＳＮ比を計算する。
【０１１６】
【数８】

【０１１７】
【数９】

次に、以下の式（１０）により当該フレームのＳＮ比（SNR＿frame(n)）を算出する。
【０１１８】
【数１０】

ここで、Θ_snは閾値である。そして、SNR＿frame(n)とΘ_snの比較により音声／雑音フレームの検出を行う。音声/雑音フレームの検出結果が雑音フレーム（すなわち、SNR＿frame(n)＜Θ_sn）であれば、修正コムフィルタCOMB＿res(k)の各周波数成分をすべて阻止域にする。
【０１１９】
このように、本実施の形態の音声強調装置によれば、第一コムフィルタと第二コムフィルタとから音声スペクトルに音声成分が含まれているか否か判定し、この判定が音声成分を含まない結果である場合、前記第一コムフィルタに各周波数成分で信号を減衰する修正をすることにより、突発的に発生するノイズを抑圧することができる。
【０１２０】
具体的には、本実施の形態の音声強調装置によれば、音声/非音声識別閾値の低い第一コムフィルタの結果に基づいて音声とノイズのＳＮ比を計算することによって、音声と雑音をより検出しやすくなる。一方、音声/非音声識別閾値の高い第二コムフィルタの結果に基づいて音声と雑音のＳＮ比を計算することによって、突発ノイズによる誤検出を少なくすることができる。上記音声/雑音フレーム検出を用いれば、両方の長所を活かすことができ、より確実に音声/雑音フレームを検出し、突発ノイズによる音声／雑音フレームの検出への影響を最小限にすることができる。
【０１２１】
（実施の形態３）
図５は実施の形態３にかかる音声強調装置の構成の例を示すブロック図である。但し、図１と共通する構成については図１と同一番号を付し、詳しい説明を省略する。
【０１２２】
図５の音声強調装置４００は、局部最小値計算部４０１を具備し、入力信号のパワスペクトルの極小値から所定の範囲を阻止域とするコムフィルタを作成する点が図１の音声強調装置と異なる。
【０１２３】
具体的には、図５の音声強調装置４００は、所定の周波数領域において、入力音声パワスペクトルの局部最小値を第一コムフィルタの阻止域とし、それ以外の周波数成分を通過域とすることによって第一コムフィルタを生成する点が、図１の音声強調装置と異なる。
【０１２４】
図５において、入力音声スペクトルを局部最小値計算部４０１に入力し、局部最小値計算部４０１の出力は第一音声/非音声識別部１０６により設定された閾値と共に第一コムフィルタ生成部１０８に入力し、第一コムフィルタ生成部１０８の結果をコムフィルタ修正部１１３に出力する。
【０１２５】
局部最小値計算部４０１は入力された音声パワスペクトルに基づいて、所定の周波数領域における局部最小値に位置する周波数成分を第一コムフィルタの通過域と阻止域の変換点の周波数成分とする。具体的には、所定の周波数領域において、以下の手順で第一コムフィルタを生成する。
【０１２６】
周波数成分毎に分割された音声スペクトルＳ_f（ｋ）（ただし、ｋは周波数成分を特定する番号）について、隣接する周波数成分Ｓ_f（ｋ−１）及びＳ_f（ｋ＋１）の両方のパワより小さい場合、第一コムフィルタを阻止域とし、上記条件を満たさない場合、第一コムフィルタを通過域とする。所定の周波数領域以外の周波数領域に対しては、実施の形態１と同じ手段で第一コムフィルタを生成する。
【０１２７】
このように、本実施の形態の音声強調装置によれば、入力信号のパワスペクトルの極小値から所定の範囲を阻止域とするコムフィルタを作成し、このコムフィルタを用いて入力信号を抑圧することにより、音声とノイズのレベル差が少ない場合でも、音声ピッチ調波構造を抽出して修復して音声歪を低減することができる。
【０１２８】
具体的には、本実施の形態の音声強調装置によれば、所定の周波数領域（特に、低域の周波数帯域帯域）において、局部最小値を抽出し、局部最小値の周波数成分を第一コムフィルタの阻止域とし、それ以外の周波数成分を通過域とすることによって、音声がノイズに埋もれやすい低ＳＮ比の環境下でも音声ピッチ調波構造をより確実に抽出して修復することができ、音声ピッチ調波構造の欠落による音声歪を低減することができる。
【０１２９】
（実施の形態４）
図６は、実施の形態４にかかる音声強調装置の構成の例を示すブロック図である。但し、図１と共通する構成については図１と同一番号を付し、詳しい説明を省略する。
【０１３０】
図６の音声強調装置５００は、ノイズベース減算部５０１を具備し、入力信号のパワスペクトルからノイズベースを減算し、減算結果の自己相関関数に基づいて音声ピッチを推定し、推定した音声ピッチで第一コムフィルタに含まれる音声ピッチ調波構造を修正する点が図１の音声強調装置と異なる。
【０１３１】
具体的には、図６の音声強調装置５００は、入力音声のパワスペクトルからノイズベースを減算して自己相関関数を計算し、周波数領域で入力音声のパワスペクトルの自己相関関数に基づいてピッチ推定値を計算する方法を採る点が、図１の音声強調装置と異なる。
【０１３２】
図６において、入力音声パワスペクトルとノイズベース推定部１０５により推定されたノイズベースの推定値をノイズベース減算部５０１に入力し、ノイズベース減算部５０１は入力音声パワスペクトルからノイズベースの推定値を減算し、その結果をピッチ推定部１１１に入力する。また、有声/無声判別部１１０から出力されたピッチ推定を行うかどうかの信号もピッチ推定部１１１に入力する。ピッチ推定部１１１で推定されたピッチ周期はピッチ調波構造修復部１１２に出力する。
【０１３３】
ピッチ推定部１１１は入力音声パワスペクトルからノイズベースを減算した結果を用いて自己相関関数を計算し、自己相関関数の最大値に対応する遅延をピッチ周期とする。
【０１３４】
具体的には、以下の式（１１）を用いて入力音声パワスペクトルからノイズベースを減算し、式（１２）を用いて自己相関関数を計算する。
【０１３５】
【数１１】

【０１３６】
【数１２】

ここでＫ_Mは周波数の上限である。式（１２）で計算された自己相関関数の最大値に対応するτをピッチ周期とする。
【０１３７】
このように、本実施の形態の音声強調装置によれば、入力信号のパワスペクトルからノイズベースを減算し、減算結果の自己相関関数に基づいて音声ピッチを推定し、推定した音声ピッチで第一コムフィルタに含まれる音声ピッチ調波構造を修正することにより、ピッチ調波構造の修復を行うことができ、音声歪みの少ない音声強調を行うことができる。
【０１３８】
具体的には、本実施の形態の音声強調装置によれば、ピッチ推定部１１１は入力音声パワスペクトルからノイズベースを減算した結果を用いて自己相関関数を計算することによって、ノイズによるピッチ推定誤差を減少し、より正確にピッチ調波構造の修復を行うことができる。
【０１３９】
（実施の形態５）
図７は、実施の形態５にかかる音声強調装置の構成の例を示すブロック図である。但し、図１と共通する構成については図１と同一番号を付し、詳しい説明を省略する。
【０１４０】
図７の音声強調装置６００は、入力信号のパワスペクトルからノイズベースを減算した結果に直流成分に所定のパワを持つ擬似ピークを生成し、直流成分を生成したスペクトルの自己相関関数に基づいて音声ピッチを推定し、推定した音声ピッチでコムフィルタの音声ピッチを修正する点が図１の音声強調装置と異なる。
【０１４１】
具体的には、図７の音声強調装置６００は、直流成分生成部６０１を具備し、自己相関関数を計算するとき、適当なエネルギを持つ擬似パワスペクトルを直流成分として生成し、それに基づいて自己相関関数を計算する点が図１の音声強調装置と異なる。
【０１４２】
図７において、直流成分生成部６０１は直流成分に適当なエネルギを持つパワスペクトルを生成し、ピッチ推定部１１１に入力する。また、有声/無声判別部１１０によりピッチ推定を行うかどうかの信号もピッチ推定部１１１に入力する。ピッチ推定部１１１で推定されたピッチ周期はピッチ調波構造修復部１１２に出力する。
【０１４３】
具体的には、第一音声ピッチ調波のパワスペクトルと同じエネルギを持つ擬似パワスペクトルを直流成分として付加した入力スペクトルを用いて自己相関関数を計算し、その結果に基づいてピッチ周期を推定する。
【０１４４】
このように、本実施の形態の音声強調装置によれば、入力信号のパワスペクトルからノイズベースを減算した結果に直流成分に所定のパワを持つ擬似ピークを生成し、直流成分を生成したスペクトルの自己相関関数に基づいて音声ピッチを推定し、推定した音声ピッチでピッチ調波構造を修復することにより、ピッチ調波の一部がノイズに埋もれても、ピッチ情報を得てピッチ調波構造の修復を行うことができ、音声歪みの少ない音声強調を行うことができる。
【０１４５】
具体的には、本実施の形態の音声強調装置によれば、入力音声信号は直流成分が含まれなくても、周波数領域において、直流成分はピッチ調波の基点として利用することができる。直流成分に適当なエネルギを持つ擬似パワスペクトルを生成することによって、参照となるピッチ調波は一つが増える。それを利用して自己相関関数を計算すれば、より正確にピッチ推定を行うことができる。特に第一音声ピッチ調波のエネルギが大きく高次ピッチ調波のエネルギが小さい場合、あるいは低周波数領域における雑音レベルが高いときにピッチ推定の誤差を減少するために非常に有効である。
【０１４６】
なお、実施の形態５は、実施の形態４と組み合せることができる。すなわち、図７の音声強調装置に実施の形態４に記載のノイズベース減算部５０１を用いれば、実施の形態４の効果も得ることができる。
【０１４７】
（実施の形態６）
図８は実施の形態６にかかる音声強調装置の構成の例を示すブロック図である。但し、図１または図４と共通する構成については図１または図４と同一番号を付し、詳しい説明を省略する。
【０１４８】
図８の音声強調装置７００は、第三音声/非音声識別部７０１と、第三コムフィルタ生成部７０２と、ノイズ特性推定部７０３とを具備し、入力信号のノイズ分散値を推定し、第三コムフィルタの通過域における周波数成分の個数の移動平均を計算し、その値が大きい場合はノイズの分散値が大きいと判断し、逆にノイズの分散値が小さいと判断し、その結果に基づいて第二コムフィルタを生成するときの音声/非音声識別閾値を設定する点が、図１の音声強調装置と異なる。
【０１４９】
具体的には、図８の音声強調装置７００は、ノイズの特性を推定する第三コムフィルタを周波数領域で生成し、雑音フレームにおいて、第三コムフィルタの通過域の周波数成分の個数を加算し、その移動平均値に基づいて第二音声/非音声の識別閾値を決定する点が、図１の音声強調装置と異なる。
【０１５０】
第三音声/非音声識別部７０１は、周波数分割部１０４から出力された音声スペクトル信号とノイズベース推定部１０５から出力されるノイズベースの値の差が所定の閾値以上である場合、通過域と判定し、それ以外の場合、阻止域と判定する。判定結果を第三コムフィルタ生成部７０２に出力する。
【０１５１】
第三コムフィルタ生成部７０２は、第三音声/非音声識別部７０１から出力された音声/非音声識別結果に基づいてコムフィルタの通過域/阻止域を生成し、その結果をノイズ特性推定部７０３に出力する。ノイズ特性推定部７０３は、音声/雑音フレーム検出部３０１から検出された雑音フレームにおいて、第三コムフィルタの通過域における周波数成分の個数を加算し、所定のフレーム数に渡って平均値を計算し、その結果を第二音声/非音声識別部１０７に出力する。具体的には、以下の式（１３）を用いてノイズ特性の推定を行う。
【０１５２】
【数１３】

ここで、COMB＿var(k)は第三コムフィルタ、NS＿var(n)はノイズ特性の推定結果、α_Vは移動平均係数である。
【０１５３】
そして、第二音声/非音声識別閾値をNS＿var(n)で適応的に制御するようにし、NS＿var(n)の値が大きければ、雑音の特性として分散が大きいと判断し、第二音声/非音声識別閾値を高く設定し、逆に、その値が小さければ、雑音の特性として分散が小さいと判断し、第二音声/非音声識別閾値を低く設定する。
【０１５４】
このように、本実施の形態の音声強調装置によれば、入力信号のノイズレベルの分布を検出し、この分布に基づいて音声スペクトルからコムフィルタを生成する基準を決定し、ノイズの種類に対応して雑音を抑圧することができ、音声歪みの少ない音声強調を行うことができる。
【０１５５】
具体的には、本実施の形態の音声強調装置によれば、ノイズの特性を推定するための第三コムフィルタを設けることによって、簡単な計算で間接的にノイズの分散値を推定することができ、その結果に基づいて第二音声/非音声識別閾値を設定すれば、第二コムフィルタを生成するとき、分散値の大きいノイズによる偽のピッチ調波の混入を減少することができる。また、分散値の小さいノイズの場合は、より多くの音声ピッチ調波情報を残すことができる。
【０１５６】
（実施の形態７）
図９は、実施の形態７にかかる音声強調装置の構成の例を示すブロック図である。但し、図１及び図４と共通する構成については図１及び図４と同一番号を付し、詳しい説明を省略する。
【０１５７】
図９の音声強調装置８００は、周波数領域選択部８０１を具備し、音声ピッチ調波構造の修復を行うとき、第三コムフィルタの結果に基づいて第二コムフィルタの所定の周波数領域における周波数成分をすべて阻止域に変換する点が、図１の音声強調装置と異なる。
【０１５８】
図９において、ノイズ特性推定部７０３は、第三コムフィルタ生成部７０２から出力された結果に基づいてノイズの特性を推定し、その結果を周波数領域選択部８０１に出力する。周波数領域選択部８０１は、ノイズ特性の推定結果に基づいて第二コムフィルタを阻止域にする中間周波数領域を決定し、その結果を第二コムフィルタ生成部１０９に出力する。
【０１５９】
具体的には、ノイズ特性推定部７０３により計算されたノイズ特性の移動平均値がある閾値を越えたら、分散値の大きいノイズと判断し、第二コムフィルタの中間周波数領域、例えば１ｋHz〜２ｋHz間の周波数成分をすべて阻止域に変換する。
【０１６０】
このように、本実施の形態の音声強調装置によれば、ノイズ特性の推定結果に基づいて周波数成分を選択し、第二コムフィルタにおいて、選択された周波数領域をすべて阻止域に変換することによって、分散値の大きいノイズにより生成した偽のピッチ調波を減少し、偽のピッチ調波を生じにくい低周波数領域におけるピッチ調波を基準に、実施の形態１に記載したピッチ調波構造の修復を行えば、正確にピッチ調波構造を修復することができる。
【０１６１】
なお、実施の形態７は、実施の形態６と組み合せることができる。すなわち、図９の音声強調装置に実施の形態６に記載のノイズ特性推定部７０３を用いれば、実施の形態６の効果も得ることができる。
【０１６２】
（実施の形態８）
図１０は、実施の形態８にかかる音声強調装置の構成の例を示すブロック図である。但し、図１と共通する構成については図１と同一番号を付し、詳しい説明を省略する。
【０１６３】
図１０の音声強調装置９００は、ＳＮＲ推定部９０１を具備し、音声分離係数計算手段において、ノイズの減衰量をＳＮＲ推定値の大きさに応じて調整する点が、図１の音声強調装置と異なる。
【０１６４】
図１０において、ＳＮＲ推定部９０１は入力音声パワスペクトルおよびノイズベース推定部１０５から出力されたノイズベースの推定値に基づいて音声レベルと雑音レベルの比を計算し、その結果を音声分離係数計算部１１４に出力する。音声分離係数計算部１１４はＳＮＲ推定値の大きさに応じて周波数成分毎のノイズの減衰量を計算し、乗算部１１５で入力音声スペクトルと乗算する。具体的には、以下の式（１４）〜（１６）を用いてＳＮＲを計算する。
【０１６５】
【数１４】

【０１６６】
【数１５】

【０１６７】
【数１６】

ここで、Ｓ_p（ｎ）は音声レベルの移動平均値を、Ｎ_s（ｎ）はノイズの移動平均値を、α_Sは移動平均係数を示す。
【０１６８】
ＳＮＲの値に応じて、修正コムフィルタの通過域と阻止域において、音声分離係数(ノイズの減衰量)は以下の式（１７）を用いて計算する。
【０１６９】
【数１７】

ここで、γ（ｎ）はノイズベースを減算する量を示す係数で、ｇｃ（ｎ）はノイズ減衰の度合い係数である。異なるＳＮ比の環境に対応できるように、γ（ｎ）とｇｃ（ｎ）の値をＳＮＲの推定値より自動的に調整できるようにする。例えば、γ（ｎ）の大きさはＳＮＲ（ｎ）の値に正比例し、ｇｃ（ｎ）の大きさはＳＮＲ（ｎ）の値に反比例するように自動的に調整する。
【０１７０】
このように、本実施の形態の音声分離装置によれば、修正コムフィルタの通過域と阻止域において、入力音声パワスペクトルからノイズベースを減算する量とノイズ減衰の度合いをＳＮＲ推定値の大きさに応じて調整することによって、異なるＳＮＲの環境下でも適切なノイズ減衰を行い、音声歪と残留ノイズの少ない音声強調を実現できる。
【０１７１】
（実施の形態９）
図１１は、実施の形態９にかかる音声強調装置の構成の例を示すブロック図である。但し、図１及び図１０と共通する構成については図１及び図１０と同一番号を付し、詳しい説明を省略する。
【０１７２】
図１１の音声強調装置１０００は、ノイズベース減算部１００１と、重み係数計算部１００２とを具備し、音声成分のレベルを入力信号のパワスペクトルの移動平均値より算出し、雑音成分のレベルをノイズベースの推定値に各周波数成分別に重み計数を乗算した値より算出し、前記音声成分のレベルと前記雑音成分のレベルの比から信号対雑音比を算出する点が、図１の音声強調装置と異なる。
【０１７３】
図１１において、ノイズベース推定部１０５はノイズベースを推定し、その結果をノイズベース減算部１００１と重み係数計算部１００２に出力する。ノイズベース減算部１００１は入力音声パワスペクトルの移動平均値を計算し、移動平均値からノイズベースの推定値を減算してＳＮＲ推定部９０１に出力する。重み係数計算部１００２はノイズベース推定値の各周波数成分に重み係数を計算し、その結果をＳＮＲ推定部９０１に出力する。ＳＮＲ推定部９０１は音声レベルと雑音レベルの比を計算し、その結果を音声分離係数計算部１１４に出力する。具体的には、以下の式（１８）〜式（２０）を用いてＳＮＲを計算する。
【０１７４】
【数１８】

【０１７５】
【数１９】

【０１７６】
【数２０】

ここで、βはノイズベースを減算する量を示す係数で、δ（ｋ）は重み係数である。重み係数δ（ｋ）は音声の特性を利用して設定する。例えば、中間周波数領域における音声スペクトルのエネルギが小さいが音声の明瞭性に与える影響が大きいので、中間周波数領域におけるノイズに対して重み係数の値を増やして雑音レベルを計算すれば、異なるノイズに対して適切な減衰を行うことができる。
【０１７７】
このように、本実施の形態の音声強調装置によれば、入力音声パワスペクトルの移動平均値からノイズベースを減算して音声レベルの計算することにより、ノイズの影響を減少し、低ＳＮＲの環境下でも正確な音声レベルを計算することができる。また、ノイズベース推定値の各周波数成分に重み係数を乗算して計算することにより、異なるノイズに対して適切な減衰を行い、音声歪を低減することができる。
【０１７８】
なお、実施の形態９は、実施の形態８と組み合せることができる。すなわち、図１１の音声強調装置に実施の形態８に記載のＳＮＲ推定部９０１を用いれば、実施の形態８の効果も得ることができる。
【０１７９】
（実施の形態１０）
図１２は、実施の形態１０にかかる音声強調装置の構成の例を示すブロック図である。但し、図１、図１０及び図１１と共通する構成については図１、図１０及び図１１と同一番号を付し、詳しい説明を省略する。
【０１８０】
図１２の音声強調装置１１００は、ＳＮＲの変動を抑えるＳＮＲ変動抑圧部１１０１を具備し、ＳＮＲ変動抑圧部１１０１は、ＳＮＲ推定値とＳＮＲ推定値の長期移動平均値の結果に基づいてＳＮＲの変動を抑圧する点が、図１の音声強調装置と異なる。
【０１８１】
図１２において、ＳＮＲ推定部９０１は音声レベルと雑音レベルの比を計算し、その結果をＳＮＲ変動抑圧部１１０１に出力する。ＳＮＲ変動抑圧部１１０１はＳＮＲ推定値に基づいてＳＮＲの長期移動平均値を計算し、その結果とＳＮＲ推定値の偏差を計算し、ＳＮＲ推定値の長期移動平均値と前記偏差の一部を加算してＳＮＲ変動抑圧結果として用いる。そして、変動が抑圧されたＳＮＲ推定値を音声分離係数計算部１１４に出力する。
【０１８２】
具体的には、以下の式（２１）を用いてＳＮＲの長期移動平均値を計算し、式（２２）を用いてＳＮＲの変動を抑圧するＳＮＲの推定値を計算する。
【０１８３】
【数２１】

【０１８４】
【数２２】

ここで、α_rは移動平均係数で、μは加算する偏差の大きさを決める係数である。
【０１８５】
このように、本実施の形態の音声強調装置によれば、ＳＮＲ推定値とＳＮＲ推定値の長期移動平均値の偏差を計算し、ＳＮＲ推定値の長期移動平均値と前記偏差の一部を加算してＳＮＲ推定値として用いることによって、ＳＮＲの変動を有効に抑制し、安定的にＳＮＲの大きさに応じてノイズ減衰のレベル調整を行うことができる。
【０１８６】
なお、実施の形態１０は、実施の形態８あるいは実施の形態９と組み合せることができる。すなわち、図１２の音声強調装置に実施の形態８に記載のＳＮＲ推定部９０１を用いれば、実施の形態８の効果も得ることができ、図１２の音声強調装置に実施の形態９に記載のノイズベース減算と重み係数計算手段を用いてＳＮＲの推定を行えば、実施の形態９の効果も得ることができる。
【０１８７】
（実施の形態１１）
図１３は、実施の形態１１にかかる音声強調装置の構成の例を示すブロック図である。但し、図１と共通する構成については図１と同一番号を付し、詳しい説明を省略する。
【０１８８】
図１３の音声強調装置１２００は、更新速度の速いノイズベース更新部１２０１を具備し、音声区間においてもノイズベースの追跡を行うことができる点が、図１の音声強調装置と異なる。
【０１８９】
図１３において、ノイズベース更新部１２０１は、入力音声パワスペクトルに基づいて更新速度の速い移動平均係数を用いてノイズベースを推定し、その結果をノイズベース推定部１０５に出力する。ノイズベース推定部１０５は、更新速度の遅い移動平均係数を用いてノイズベースを推定し、その結果を第一音声/非音声識別部１０６および第二音声/非音声識別部１０７に出力する。
【０１９０】
具体的には、以下の式（２３）と式（２４）を用いて更新速度の速いノイズベースと更新速度の遅いノイズベースを推定する。
【０１９１】
【数２３】

【０１９２】
【数２４】

ここで、α_fとα_sはそれぞれ速い更新係数と遅い更新係数であり、Θ_fastは音声と雑音を識別する閾値である。
【０１９３】
このように、本実施の形態の音声強調装置によれば、更新速度の速い移動平均係数を用いてノイズベースの推定を行うことによって、音声区間においても雑音レベルの急激な変動を追跡することができる。また、更新速度の遅いノイズベースの更新は、更新速度の速いノイズベースに基づいて行うことによって、正確にノイズベースの推定を行うことができ、雑音レベルの急激な変動によるノイズベース更新の停止を防止することができる。
【０１９４】
（実施の形態１２）
図１４は、本発明の実施の形態１２に係る雑音分離装置の構成を示すブロック図である。本実施の形態の雑音分離装置１３００は、雑音を含む音声信号から雑音信号を分離、抽出するものである。
【０１９５】
図１４において、雑音分離装置１３００は、時間分割部１０１と、窓掛け部１０２と、ＦＦＴ部１０３と、周波数分割部１０４と、ノイズベース推定部１０５と、音声/非音声識別部１３０１と、雑音コムフィルタ生成部１３０２と、実数虚数分離部１３０３と、雑音分離係数計算部１３０４と、乗算部１３０５と、雑音周波数合成部１３０６と、ＩＦＦＴ部１３０７と、から主に構成される。
【０１９６】
ここで、但し、図１と共通する構成については図１と同一番号を付し、詳しい説明を省略する。
【０１９７】
音声/非音声識別部１３０１は、周波数分割部１０４から出力された音声スペクトル信号とノイズベース推定部１０５から出力されたノイズベースの推定値の差が所定の閾値以上である場合、音声成分を含む有音部分と判定し、それ以外の場合、音声成分を含まない雑音のみの無音部分であると判定し、その結果を雑音コムフィルタ生成部１３０２に出力する。雑音コムフィルタ生成部１３０２は、音声/非音声識別部１３０１の結果に基づいて雑音分離コムフィルタを生成して、このコムフィルタを実数虚数分離部１３０３に出力する。
【０１９８】
具体的には、雑音コムフィルタ生成部１３０２は、音声情報を抑制するように音声/非音声識別の閾値を低く設定して以下の式（２５）を用いて雑音分離コムフィルタを生成する。
【０１９９】
【数２５】

ここでΘ_nosは雑音分離用閾値である。
【０２００】
実数虚数分離部１３０３は、入力音声スペクトルの実数部と虚数部を分離し、その結果を雑音分離係数計算部１３０４に出力する。雑音分離係数計算部１３０４は、雑音分離コムフィルタの通過域と阻止域に対して、周波数成分毎に別々の分離係数を計算し、その結果を乗算部１３０５に出力する。
【０２０１】
具体的には、以下の式（２６）と式（２７）を用いて、雑音分離コムフィルタの阻止域において、雑音分離係数は１とし、雑音分離コムフィルタの通過域において、雑音分離係数は入力音声スペクトルの実数部と虚数部に対して、別々の乱数とノイズベースの推定値を乗算する。
【０２０２】
【数２６】

【０２０３】
【数２７】

ここでｒｄ_re（ｉ）は、実数部に用いられるランダム関数で均一分布の乱数により構成され、ｒｄ_im（ｉ）は、虚数部に用いられるランダム関数で均一分布の乱数により構成される。
【０２０４】
乗算部１３０５は、周波数分割部１０４から出力された音声スペクトルに雑音分離係数計算部１３０４から出力された分離係数を周波数成分毎に乗算する。そして、乗算の結果得られた雑音スペクトルを雑音周波数合成部１３０６に出力する。
【０２０５】
雑音周波数合成部１３０６は、乗算部１３０５から出力された周波数成分のスペクトルを所定の処理時間単位で、周波数領域で連続する雑音スペクトルに合成してＩＦＦＴ部１３０７に出力する。
【０２０６】
ＩＦＦＴ部１３０７は、雑音周波数合成部１３０６から出力された雑音スペクトルにＩＦＦＴ（Inverse Fast Fourier Transform）を行って雑音信号に変換した信号を出力する。
【０２０７】
このように、本実施の形態の雑音分離装置によれば、雑音専用コムフィルタを生成することにより、雑音の特性を最大限に抽出することができる。また、雑音分離コムフィルタの阻止域において、雑音成分を減衰せず、雑音分離コムフィルタの通過域において、入力音声スペクトルの実数部と虚数部に対して、別々の乱数とノイズベースの推定値を乗算することによって、雑音成分の実数部と虚数部の振幅と位相はすべてランダム化され、良好な雑音分離特性を得ることができる。
【０２０８】
（実施の形態１３）
図１５は、実施の形態１３に係る雑音分離装置の構成の例を示すブロック図である。但し、図１及び図１４と共通する構成については図１及び図１４と同一番号を付し、詳しい説明を省略する。
【０２０９】
図１５の雑音分離装置は、雑音成分保存部１４０１を具備し、雑音分離用コムフィルタの阻止域における入力音声のスペクトル成分をメモリに保存し、その値を雑音分離用コムフィルタの通過域に用いる点が、図１４と異なる。
【０２１０】
図１５において、雑音成分保存部１４０１は、雑音コムフィルタ生成部１３０２から出力された雑音コムフィルタの阻止域において入力音声スペクトルを保存し、雑音コムフィルタの通過域において雑音成分保存結果を雑音分離係数計算部１３０４に出力する。
【０２１１】
具体的には、例えば所定数のメモリを用意して雑音コムフィルタの阻止域における入力音声スペクトルを低周波数領域から高周波数領域まで順次に保存し、雑音コムフィルタの通過域において同じ低周波数領域から高周波数領域までの順で、最新の保存されたデータかつもっとも近い周波数成分を有するものを選択して雑音コムフィルタの通過域における入力音声スペクトルとして用いる。
【０２１２】
このように、本実施の形態の雑音分離装置によれば、雑音分離用コムフィルタの阻止域における入力音声のスペクトル成分をメモリに保存し、その値を雑音分離用コムフィルタの通過域に用いることにより、実際の雑音と特性の近い擬似雑音を再構成することができ、良好な雑音分離特性を得ることができる。
【０２１３】
なお、実施の形態１３は、実施の形態１２と組み合せることができる。すなわち、図１５の雑音分離装置に実施の形態１２に雑音分離係数計算部１３０４を用いれば、実施の形態１２の効果も得ることができる。
【０２１４】
なお、本発明は上記実施の形態に限定されず、複数の実施の形態を組み合わせる、または種々変更して実施することが可能である。例えば、上記実施の形態では、音声強調装置または雑音抑圧装置として行う場合について説明しているが、これに限られるものではなく、この音声強調方法または雑音抑圧方法をソフトウェアとして行うことも可能である。
【０２１５】
例えば、上記音声強調方法または雑音抑圧方法を実行するプログラムを予めＲＯＭ（Read Only Memory）に格納しておき、そのプログラムをＣＰＵ（Central Processor Unit）によって動作させるようにしても良い。
【０２１６】
また、上記音声強調方法または雑音抑圧方法を実行するプログラムをコンピュータで読み取り可能な記憶媒体に格納し、記憶媒体に格納されたプログラムをコンピュータのＲＡＭ（Random Access memory）に記録して、コンピュータをそのプログラムにしたがって動作させるようにしても良い。
【０２１７】
また、上記音声強調または雑音抑圧を行うプログラムをサーバに格納し、サーバに格納されたプログラムをクライアントに転送して、クライアント上でそのプログラムを実行させてもよい。このような場合においても、上記実施の形態と同様の作用及び効果を呈する。
【０２１８】
また、上記いずれかの実施の形態に係る音声強調装置または雑音抑圧装置は、無線通信装置、通信端末、基地局装置等に搭載することもできる。この結果、通信時の音声を音声強調または雑音抽出できる。
【０２１９】
【発明の効果】
以上説明したように、本発明の音声強調装置及び音声強調方法によれば、音声信号の周波数分割スペクトルに基づいて音声抑圧に用いるコムフィルタより多くの雑音のピークを取り除いたコムフィルタを生成し、このコムフィルタを用いて音声信号のピッチ情報を取得し、コムフィルタの音声ピッチを補うことにより、音声の歪みが少なくかつ雑音を十分に除去することができる。
【図面の簡単な説明】
【図１】本発明の実施の形態１に係る音声強調装置の構成を示すブロック図
【図２】上記実施の形態にかかる音声強調装置で作成されるコムフィルタの例を示す図
【図３】上記実施の形態にかかる音声処理装置におけるコムフィルタの修復の例を示す図
【図４】本発明の実施の形態２に係る音声強調装置の構成を示すブロック図
【図５】本発明の実施の形態３に係る音声強調装置の構成を示すブロック図
【図６】本発明の実施の形態４に係る音声強調装置の構成を示すブロック図
【図７】本発明の実施の形態５に係る音声強調装置の構成を示すブロック図
【図８】本発明の実施の形態６に係る音声強調装置の構成を示すブロック図
【図９】本発明の実施の形態７に係る音声強調装置の構成を示すブロック図
【図１０】本発明の実施の形態８に係る音声強調装置の構成を示すブロック図
【図１１】本発明の実施の形態９に係る音声強調装置の構成を示すブロック図
【図１２】本発明の実施の形態１０に係る音声強調装置の構成を示すブロック図
【図１３】本発明の実施の形態１１に係る音声強調装置の構成を示すブロック図
【図１４】本発明の実施の形態１２に係る雑音分離装置の構成を示すブロック図
【図１５】本発明の実施の形態１３に係る雑音分離装置の構成を示すブロック図
【符号の説明】
１０３ＦＦＴ部
１０４周波数分割部
１０５ノイズベース推定部
１０６第一音声/非音声識別部
１０７第二音声/非音声識別部
１０８第一コムフィルタ生成部
１０９第二コムフィルタ生成部
１１０有音/無声判別部
１１１ピッチ推定部
１１２ピッチ調波構造修復部
１１３コムフィルタ修正部
１１４音声分離係数計算部
１１５、１３０５乗算部
１１６音声周波数合成部
１１７ＩＦＦＴ部
３０１音声／雑音フレーム検出部
４０１局部最小値計算部
５０１、１００１ノイズベース減算部
６０１直流成分生成部
７０１第３音声/非音声識別部
７０２第三コムフィルタ生成部
７０３ノイズ特性推定部
８０１周波数領域選択部
９０１ＳＮＲ推定部
１００２重み係数計算部
１１０１ＳＮＲ変動抑圧部
１２０１ノイズベース更新部
１３０１音声/非音声識別部
１３０２雑音コムフィルタ生成部
１３０３実数虚数分離部
１３０４雑音分離係数計算部
１３０６雑音周波数合成部
１４０１雑音成分保存部

Claims

入力信号のスペクトルを所定の周波数単位で分割した周波数分割スペクトルを出力する周波数分割手段と、周波数分割スペクトルに基づいて無音と判定した周波数領域の信号を減衰する第一コムフィルタを作成する第一コムフィルタ作成手段と、周波数分割スペクトルに基づいて第一コムフィルタより多くの雑音のピークを取り除いたフィルタである第二コムフィルタを作成する第二コムフィルタ作成手段と、前記周波数分割スペクトルから音声ピッチを推定するピッチ推定手段と、前記第二コムフィルタと前記音声ピッチに基づいてピッチ調波構造を表すピッチ調波修復コムフィルタを作成するピッチ調波構造修復手段と、前記ピッチ調波修復コムフィルタの通過域と重複する第一コムフィルタの通過域のみを通過域とするように前記第一コムフィルタを修正するコムフィルタ修正手段と、前記コムフィルタ修正手段において修正された第一コムフィルタを用いて前記周波数分割スペクトルのノイズを抑圧する抑圧手段と、ノイズを抑圧した前記周波数分割スペクトルを周波数領域で連続したスペクトル信号に合成する音声周波数合成手段と、を具備することを特徴とする音声強調装置。
第一コムフィルタと第二コムフィルタとから音声スペクトルに音声成分が含まれているか否か判定する音声／雑音フレーム検出手段を具備し、コムフィルタ修正手段は、前記音声／雑音フレーム検出手段の判定が音声成分を含まない結果である場合、前記第一コムフィルタに各周波数成分で信号を減衰する修正をすることを特徴とする請求項１に記載の音声強調装置。
前記音声／雑音フレーム検出手段は、第一コムフィルタの通過域における入力信号のパワスペクトルの和と第一コムフィルタの阻止域における入力信号のパワスペクトルの和の比を第一結果とし、第二コムフィルタの通過域における入力信号のパワスペクトルの和と第二コムフィルタの阻止域における入力信号のパワスペクトルの和の比を第二結果とし、第一結果と第二結果を加算した結果が所定の閾値より大きい場合、前記加算結果を用い、前記加算結果が所定の閾値以下である場合、第二結果を用いて音声スペクトルに音声が含まれるか否か判定することを特徴とする請求項２に記載の音声強調装置。
第一コムフィルタ生成手段は、入力信号のパワスペクトルの極小値から所定の範囲を阻止域とする第一コムフィルタを作成することを特徴とする請求項１から請求項３のいずれかに記載の音声強調装置。
入力信号のパワスペクトルからノイズベースを減算し、減算結果の自己相関関数を用いて音声ピッチを推定するピッチ推定手段を具備し、コムフィルタ修正手段は、前記ピッチ推定手段において推定した音声ピッチで前記第一コムフィルタに含まれる音声ピッチ調波構造を修正することを特徴とする請求項１から請求項４のいずれかに記載の音声強調装置。
入力信号のパワスペクトルからノイズベースを減算した結果に、直流成分に所定のパワを持つ擬似ピークを生成する直流成分生成手段を具備し、ピッチ推定手段は、前記直流成分生成手段において擬似ピークを生成した前記パワスペクトルから音声ピッチを推定することを特徴とする請求項５に記載の音声強調装置。
入力信号のパワスペクトルからノイズベースを減算した結果において、パワが所定の閾値以上である周波数領域の数の移動平均を算出するノイズ特性推定手段を具備し、第二コムフィルタ作成手段は、前記移動平均から入力信号に音声が含まれるか否か判断した結果より第二コムフィルタを作成することを特徴とする請求項１から請求項６のいずれかに記載の音声強調装置。
入力信号のパワスペクトルからノイズベースを減算した結果において、パワが所定の閾値以上である周波数領域の数の移動平均を算出するノイズ特性推定手段を具備し、第二コムフィルタ作成手段は、ノイズ特性推定手段において算出された移動平均が所定の値以下である場合、所定の周波数領域を阻止域とする第二コムフィルタを作成することを特徴とする請求項１から請求項７のいずれかに記載の音声強調装置。
入力信号のパワスペクトルとノイズベースから信号対雑音比を算出するＳＮＲ推定手段を具備し、抑圧手段は、前記信号対雑音比から周波数分割スペクトルのノイズの抑圧量を決定することを特徴とする請求項１から請求項８のいずれかに記載の音声強調装置。
ＳＮＲ推定手段は、音声成分のレベルを入力信号のパワスペクトルの移動平均値より算出し、雑音成分のレベルをノイズベースの推定値に各周波数成分別に重み計数を乗算した値より算出し、前記音声成分のレベルと前記雑音成分のレベルの比から信号対雑音比を算出することを特徴とする請求項９に記載の音声強調装置。
信号対雑音比と前記信号対雑音比の移動平均値との偏差を算出し、前記偏差を用いて前記信号対雑音比の移動平均値を更新する変動抑圧手段を具備し、抑圧手段は、変動抑圧手段において更新された前記信号対雑音比の移動平均値から周波数分割スペクトルのノイズの抑圧量を決定することを特徴とする請求項９または請求項１０に記載の音声強調装置。
所定の時間単位で更新速度の異なる二つのノイズベースの移動平均値を算出し、第一移動平均値より更新速度の速い第二移動平均値で第一移動平均値の更新条件を変更し、第一移動平均値をノイズベース推定値として出力するノイズベース更新手段を具備することを特徴とする請求項１から請求項１１のいずれかに記載の音声強調装置。
請求項１から請求項１２のいずれかに記載の雑音抑圧装置を具備することを特徴とする無線通信装置。
入力信号のスペクトルを所定の周波数単位で分割した周波数分割スペクトルを出力する周波数分割ステップと、周波数分割スペクトルに基づいて無音と判定した周波数領域の信号を減衰する第一コムフィルタを作成する第一コムフィルタ作成ステップと、周波数分割スペクトルに基づいて第一コムフィルタより多くの雑音のピークを取り除いたフィルタである第二コムフィルタを作成する第二コムフィルタ作成ステップと、前記周波数分割スペクトルから音声ピッチを推定するピッチ推定ステップと、前記第二コムフィルタと前記音声ピッチに基づいてピッチ調波構造を表すピッチ調波修復コムフィルタを作成するピッチ調波構造修復ステップと、前記ピッチ調波修復コムフィルタの通過域と重複する第一コムフィルタの通過域のみを通過域とするように前記第一コムフィルタを修正するコムフィルタ修正ステップと、前記修正された第一コムフィルタを用いて前記周波数分割スペクトルのノイズを抑圧する抑圧ステップと、ノイズを抑圧した前記周波数分割スペクトルを周波数領域で連続したスペクトル信号に合成する音声周波数合成ステップと、を具備することを特徴とする音声強調方法
入力信号のスペクトルを所定の周波数単位で分割した周波数分割スペクトルを出力する周波数分割ステップと、周波数分割スペクトルに基づいて無音と判定した周波数領域の信号を減衰する第一コムフィルタを作成する第一コムフィルタ作成ステップと、周波数分割スペクトルに基づいて第一コムフィルタより多くの雑音のピークを取り除いたフィルタである第二コムフィルタを作成する第二コムフィルタ作成ステップと、前記周波数分割スペクトルから音声ピッチを推定するピッチ推定ステップと、前記第二コムフィルタと前記音声ピッチに基づいてピッチ調波構造を表すピッチ調波修復コムフィルタを作成するピッチ調波構造修復ステップと、前記ピッチ調波修復コムフィルタの通過域と重複する第一コムフィルタの通過域のみを通過域とするように前記第一コムフィルタを修正するコムフィルタ修正ステップと、前記修正された第一コムフィルタを用いて前記周波数分割スペクトルのノイズを抑圧する抑圧ステップと、ノイズを抑圧した前記周波数分割スペクトルを周波数領域で連続したスペクトル信号に合成する音声周波数合成ステップと、をコンピュータに実行させることを特徴とする音声強調プログラム。
入力信号のスペクトルを所定の周波数単位で分割した周波数分割スペクトルを出力する周波数分割ステップと、周波数分割スペクトルに基づいて無音と判定した周波数領域の信号を減衰する第一コムフィルタを作成する第一コムフィルタ作成ステップと、周波数分割スペクトルに基づいて第一コムフィルタより多くの雑音のピークを取り除いたフィルタである第二コムフィルタを作成する第二コムフィルタ作成ステップと、前記周波数分割スペクトルから音声ピッチを推定するピッチ推定ステップと、前記第二コムフィルタと前記音声ピッチに基づいてピッチ調波構造を表すピッチ調波修復コムフィルタを作成するピッチ調波構造修復ステップと、前記ピッチ調波修復コムフィルタの通過域と重複する第一コムフィルタの通過域のみを通過域とするように前記第一コムフィルタを修正するコムフィルタ修正ステップと、前記修正された第一コムフィルタを用いて前記周波数分割スペクトルのノイズを抑圧する抑圧ステップと、ノイズを抑圧した前記周波数分割スペクトルを周波数領域で連続したスペクトル信号に合成する音声周波数合成ステップと、をコンピュータに実行させることを特徴とする音声強調プログラムを記憶し、要求に応じて前記音声強調プログラムを出力することを特徴とするサーバ装置。