JP2008052117A

JP2008052117A - 雑音除去装置、方法及びプログラム

Info

Publication number: JP2008052117A
Application number: JP2006229341A
Authority: JP
Inventors: Makoto Morito; 誠森戸
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2006-08-25
Filing date: 2006-08-25
Publication date: 2008-03-06
Also published as: US20080052067A1; US7917359B2; CN101131819A

Abstract

【課題】少ない演算量、処理量で、雑音成分を適切に除去できる雑音除去装置を提供する。
【解決手段】本発明は、雑音の混入した音声信号から雑音成分を除去する雑音除去装置に関する。そして、上記音声信号のスペクトルから、そのピーク位置を検出するピーク検出手段と、上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得るマスク処理手段とを有することを特徴とする。
【選択図】図２

Description

本発明は、雑音の含まれる音声信号から雑音成分を除去する雑音除去装置、方法及びプログラムに関するものである。

電話、携帯電話を利用して音声を入力する機会は非常に多い。しかし、雑音（例えば、交差点の雑音、オフィスの雑音など）が含まれ、目的とする音声が伝わり難かったり、音声認識装置の誤認識を起こしたりする場合が多い。そのため、不要な雑音を除去する処理が必要となる。雑音除去の方法は従来からも提案されている。

非特許文献１では、無相関性雑音の除去を目的とした音声処理方式として、ＳＰＡＣ（ＳｐｅａｃｈＰｒｏｃｅｓｓｉｎｇｓｙｓｔｅｍｂｙｕｓｅｏｆＡｕｔｏｃｏｒｒｅｌａｔｉｏｎｆｕｎｃｔｉｏｎ）方式を提案している。

周期波の自己相関関数ψは、原信号と同じ周波数成分からなり、周期の検出も容易である。一方、ランダム雑音の自己相関関数ψは、その原点付近に振幅成分が集中する。ＳＰＡＣ方式は、このような自己相関関数ψの性質を利用し、音声の短時間自己相関関数を波形とみなし、その１周期の波形を接続して音声信号を再生する方式であり、雑音と信号との相関関数の違いを利用し、雑音レベルの低減やＳＮ比の改善を行うことができる。量子化された信号について、ＳＰＡＣ方式による雑音低減処理を行うと、ポーズの雑音が大幅に抑圧され、非常に聞きやすくなる。

非特許文献２は、音声が存在していない区間での入力を平均化して雑音のスペクトルとして保持し、音声区間中に入力された雑音を含む音声のスペクトルからこの雑音のスペクトルを差し引いて音声のスペクトルとする方法を記載している。
高杉敏男，鈴木誠史，田中良二，"自己相関関数を利用した音声処理方式（ＳＰＡＣ）の機能と基本特性"，信学論，Ｊ６２−Ａ，Ｎｏ．３，ｐｐ．１７５−１８２，１９７９年３月Ｓ．Ｆ．Ｂｏｌｌ，"ＳｕｐｐｒｅｓｓｉｏｎｏｆＡｃｏｕｓｔｉｃＮｏｉｓｅｉｎＳｐｅｅｃｈＵｓｉｎｇＳｐｅｃｔｒａｌＳｕｂｔｒａｃｔｉｏｎ"，ＩＥＥＥＴｒａｎｓ．ＡＳＳＰ−２７，Ｎｏ．２，ｐｐ．１１３−１２０，１９７９

しかしながら、非特許文献１の方法では、多くの演算を必要とする自己相関関数を求めなければいけない。また、自己相関関数を用いて音声を生成しているため、音声の周波数特性が元の音声の周波数スペクトラムの二乗になってしまい、音声に歪を生じてしまう。音声の周波数特性が二乗になる回避策としては、音声を複数の帯域に分割して、それぞれの帯域ごとに周波数特性のルート処理を予め取る手法が提案されているが、帯域に分割するための処理、ルートを取る処理に多くの演算を必要とする。

非特許文献２の方法では、周囲の雑音が定常的であることを仮定しており、定常雑音の場合、又は、雑音が小さい場合は効果があるが、比較的大きなレベルの非定常雑音の環境下では雑音の成分を適切に除去することができないという欠点がある。

また、雑音除去装置として、本来の音声を捕捉するマイクロフォンの他に、雑音成分を捕捉するためのマイクロフォンを設け、これら２本のマイクロフォンの捕捉信号から雑音を除去するものもあるが、処理量が多いものである。

そのため、少ない演算量、処理量で、雑音成分を適切に除去できる雑音除去装置、方法及びプログラムが望まれている。

第１の本発明は、雑音の混入した音声信号から雑音成分を除去する雑音除去装置において、（１）上記音声信号のスペクトルから、そのピーク位置を検出するピーク検出手段と、（２）上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得るマスク処理手段とを有することを特徴とする。

第２の本発明は、雑音の混入した音声信号から雑音成分を除去する雑音除去方法において、（０）ピーク検出手段及びマスク処理手段を有し、（１）上記ピーク検出手段は、上記音声信号のスペクトルから、そのピーク位置を検出し、（２）上記マスク処理手段は、上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得ることを特徴とする。

第３の本発明は、雑音の混入した音声信号から雑音成分を除去する雑音除去プログラムであって、コンピュータを、（１）上記音声信号のスペクトルから、そのピーク位置を検出するピーク検出手段と、（２）上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得るマスク処理手段として機能させることを特徴とする。

本発明の雑音除去装置、方法及びプログラムによれば、少ない演算量、処理量で、雑音成分を適切に除去することができる。

（Ａ）主たる実施形態
以下、本発明による雑音除去装置、方法及びプログラムの一実施形態を、図面を参照しながら説明する。この実施形態の雑音除去装置の用途は限定されるものではないが、例えば、音声認識装置の前処理装置として雑音除去装置が搭載されたり、携帯電話などのハンズフリー電話の捕捉音声の初期処理段に設けたりするものである。

（Ａ−１）実施形態の構成
図１は、実施形態の雑音除去装置の全体構成を示すブロック図であり、図２は、その各部の詳細構成を示すブロック図である。なお、図２は、各部の処理及び処理の流れを示す図面としてみることもできる。

図１において、この実施形態の雑音除去装置１は、大きくは、分析部１０、雑音除去部２０及び生成部３０を有する。これら分析部１０、雑音除去部２０及び生成部３０はそれぞれ、専用のハードウェア（例えば半導体チップ）で構成されても良く、また、プロセッサ（ＣＰＵ）を有する装置に、プロセッサに分析部１０、雑音除去部２０又は生成部３０としての機能を実行させるためのプログラムを搭載することによって実現するようにしても良い。

分析部１０は、雑音の混在したディジタル音声信号を入力し、ＦＦＴ（高速フーリエ変換）処理により周波数分析を行うものである。雑音除去部２０は、分析部１０からの出力を入力として雑音成分を除去するものである。生成部３０は、雑音除去部２０からの出力に対して逆ＦＦＴ処理して出力音声を生成するものである。

分析部１０は、詳細には、図２に示すように、窓処理部１０１及びＦＦＴ処理部１０２を有する。

分析部１０に入力されるディジタル音声信号をｘ（ｎ）とする。但し、ｎは、ｎ番目のデータ（サンプル）を表している。ディジタル音声信号ｘ（ｎ）は、例えば、マイクロフォンなどの音声入力装置から入力されたアナログ音声信号を、アナログ／ディジタル変換し、標本化周期Ｔ毎に標本化することにより得られるものである。標本化周期Ｔは、通常３１．２５マイクロ秒〜１２５マイクロ秒程度である。Ｎ個の連続するｘ（ｎ）を１つの分析単位（フレーム）として、各部での処理が行われる。ここでは、一例としてＮ＝５１２とする。処理対象分析単位に対する当該雑音除去装置１０の一連の処理が終了すると、ｘ（ｎ）のうち後半のＮ／２個のデータを前半にシフトし、新たに連続するＮ／２個のデータを入力し、後半に接続することにより、新たなＮ個の連続するｘ（ｎ）を生成し、１つの分析単位として新たな処理を行い、このような処理対象分析単位の切り替えを繰り返すようになされている。

なお、入力ディジタル音声信号はマイクロフォンが捕捉してアナログ／ディジタル変換されたものに限定されない。例えば、記録媒体などから読み出されたものであっても良く、また、他の装置から通信によって与えられたものであっても良い。

窓処理部１０１は、Ｎ個の連続するｘ（ｎ）に対し、分析精度をあげるために窓関数をかける。窓処理部１０１の出力ｂ（ｎ）は、窓関数をｗ（ｎ）とすると、（１）式で得られる。なお、窓関数ｗ（ｎ）としては、各種の窓関数を適用可能であるが、例えば、（２）式に示すようなハミング窓を適用する。窓処理は、後述するように生成部３０における分析単位の接続処理を考慮してなされる処理である。

ただし、窓関数をかけることは好ましいが、必須ではなく、窓処理部１０１を省略することができる。

ＦＦＴ処理部１０２は、窓処理部１０１からの出力ｂ（ｎ）をＮ点ＦＦＴ処理する。ＦＦＴ処理部１０２で得られるスペクトルＣ（ｍ）は（３）式で与えられる。

なお、周波数分析方法は、ＦＦＴに限定されず、ＤＦＴ（離散フーリエ変換）などの他の周波数分析方法を適用するようにしても良い。また、実施形態の雑音除去装置１が搭載される装置によっては、他の目的の処理装置における分析部構成を、この雑音除去装置１の構成として流用するようにしても良い。例えば、当該雑音除去装置１が搭載される装置がＩＰ電話の場合には、このような流用が可能である。ＩＰ電話の場合、ＩＰパケットのペイロードにはＦＦＴ出力を符号化したものを挿入するが、そのＦＦＴ出力を、上述した分析部１０の出力として流用することができる。

雑音除去部２０は、詳細には、図２に示すように、振幅特性算出処理部２０１、ピーク検出処理部２０２及びマスク処理部２０３を有する。

振幅特性算出処理部２０１は、ＦＦＴ処理部１０２からの出力Ｃ（ｍ）の振幅特性を算出するものである。ＦＦＴ処理部１０２からの出力Ｃ（ｍ）は複素数であり、振幅特性算出処理部２０１は、その出力Ｃ（ｍ）に対し、（４）式に示すように、絶対値演算、対数演算を行い、振幅特性Ｄ（ｍ）を得る。対数演算処理は、聴感上のリニアリティを考慮してなされる処理である。

雑音除去部２０の処理は、スペクトルＣ（ｍ）の性質Ｃ（ｍ）＝Ｃ^＊（Ｎ−ｍ）（ただし、１≦ｍ≦Ｎ／２−１、Ｃ^＊（Ｎ−ｍ）はＣ（Ｎ−ｍ）の共役複素数を表す）から、０≦ｍ≦Ｎ／２の範囲で行えば良い。

ピーク検出処理部２０２は、振幅特性Ｄ（ｍ）のピークを検出する。すなわち、ピーク検出処理部２０２は、振幅特性Ｄ（ｍ）がｍに対して局所的に最大になるピークポイントｍ_ｐを探索するものである。

雑音による影響を少なく、かつ、振幅特性Ｄ（ｍ）のピーク（極大値）を強調する目的で、一般的な音声信号のスペクトルのピーク付近の平均形状に近い部分比較関数Ｅ（ｍ）を用い、振幅特性Ｄ（ｍ）と部分比較関数Ｅ（ｍ）との非類似度Ｆ（ｍ）を（５）式に従って算出して、非類似度Ｆ（ｍ）が閾値を下回り（言い換えると、類似度合が大きく）、かつ、極小値を与える位置をピークポイントｍ_ｐとする。部分比較関数Ｅ（ｍ）は、ピーク検出処理部２０２が予め保持しているものである。（５）式におけるＭ１とＭ２は、部分比較関数Ｅ（ｍ）が値を持つ範囲の始めと終わりである。

マスク処理部２０３は、複数個のピークポイントｍ_ｐの中で、大きな振幅特性Ｄ（ｍ_ｍ）を与えるピークポイントｍ_ｍから順に、以下のようなマスク処理を行うものである。

マスク処理部２０３には、予め聴覚のマスキング特性を考慮して作成したマスク関数Ｍ（ｓ，ｍ_ｍ，Ｄ（ｍ_ｍ））をテーブル化して格納しておく（後述する図４参照）。マスク処理部２０３は、振幅特性Ｄ（ｍ）とマスク関数Ｍ（ｓ，ｍ_ｍ，Ｄ（ｍ_ｍ））との間に（６）式の関係を満足する、ポイントｓ（ｓは０≦ｓ≦Ｎ／２の範囲）に対して、ＦＦＴ処理部１０２の出力Ｃ（ｍ）を０に置き換える処理（マスク）を行う。マスク処理部２０３は、全てのピークポイントｍ_ｐに対して、マスク処理を実施する。

０≦ｍ≦Ｎ／２の範囲で求められた雑音除去スペクトルＧ（ｍ）に対して、Ｇ（ｍ）＝Ｇ^＊（Ｎ−ｍ）（ただし、Ｎ／２＋１≦ｍ≦Ｎ−１）によって、０≦ｍ≦Ｎ−１の範囲の雑音除去スペクトルＧ（ｍ）を求める。その結果得られた雑音除去スペクトルＧ（ｍ）を生成部３０に与える。

生成部３０は、詳細には、図２に示すように、逆ＦＦＴ処理部３０１及び接続処理部３０２を有する。

逆ＦＦＴ処理部３０１は、雑音除去スペクトルＧ（ｍ）をＮ点逆ＦＦＴ処理し、雑音除去信号ｇ（ｎ）を得るものである。なお、上述したＦＦＴ処理部１０２に代えて、ＤＦＴ処理部を適用している場合には、この逆ＦＦＴ処理部３０１も逆ＤＦＴ処理部に置き換えられる。

接続処理部３０２は、（７）式に示すように、現在の処理対象分析単位についての雑音除去信号ｇ（ｎ）の前半のＮ／２個のデータと、直前の分析単位についての雑音除去信号ｇ’（ｎ）の後半のＮ／２個のデータを加算して、出力ｙ（ｎ）を得るものである

ここで、相前後する分析単位で半数のデータ（サンプル）を重複させるように、Ｎ／２個のデータをシフトしながら、上述した処理を行うのは、波形接続を円滑に行うためであり、この手法は良く用いられている。１つの分析単位に対し、分析部１０から当該生成部３０までの上述した一連の処理に許される時間は、ＮＴ／２となる。

なお、雑音除去装置の用途によっては、生成部３０を省略したり、他の装置が有する生成部を流用したりすることができる。例えば、雑音除去装置が音声認識装置に利用される場合であれば、雑音除去スペクトルＧ（ｍ）を認識用特徴量として用いるようにして生成部３０を省略することができる。また例えば、雑音除去装置がＩＰ電話機に利用される場合であれば、ＩＰ電話機が生成部を有するので、その生成部を流用するようにしても良い。

（Ａ−２）実施形態の動作
次に、上述した構成を有する実施形態の雑音除去装置１の動作（実施形態の雑音除去方法）を、図３及び図４をも参照しながら説明する。

分析部１０に入力されたＮ個の連続するデータｘ（ｎ）に対し、窓処理部１０１によって窓処理が施され、窓処理後のデータｂ（ｎ）に対し、ＦＦＴ処理部１０２によって、Ｎ点ＦＦＴ処理が実行される。

ＦＦＴ処理部１０２で得られるスペクトルＣ（ｍ）は、雑音除去部２０に与えられる。雑音除去部２０の処理は、スペクトルＣ（ｍ）の性質Ｃ（ｍ）＝Ｃ^＊（Ｎ−ｍ）（ただし、１≦ｍ≦Ｎ／２−１、Ｃ^＊（Ｎ−ｍ）はＣ（Ｎ−ｍ）の共役複素数を表す）から、０≦ｍ≦Ｎ／２の範囲で行えば良い。

雑音除去部２０においては、振幅特性算出処理部２０１によって、スペクトルＣ（ｍ）の振幅特性が算出される。図３（ａ）は、振幅特性算出処理部２０１からの出力Ｄ（ｍ）の一例を示している。振幅特性Ｄ（ｍ）には、概ね３０〜１００個程度のピークポイントが含まれている。

次に、ピーク検出処理部２０２によって、図３（ｂ）に示すような部分比較関数Ｅ（ｍ）が利用され、振幅特性Ｄ（ｍ）のピークが検出される。すなわち、図３（ａ）に示す振幅特性Ｄ（ｍ）と図３（ｂ）に示す部分比較関数Ｅ（ｍ）との非類似度Ｆ（ｍ）が算出され、この非類似度Ｆ（ｍ）が閾値を下回って、かつ、極小値を与える位置をピークポイントｍ_ｐとして検出する。図３（ｃ）は、図３（ａ）に示す振幅特性Ｄ（ｍ）に対して図３（ｂ）に示す部分比較関数Ｅ（ｍ）を適用した場合の非類似度Ｆ（ｍ）を示しており、この非類似度Ｆ（ｍ）から、図３（ｄ）に示すようなピークポイントｍ_ｐが検出される。

マスク処理部２０３においては、まず、ピークポイントｍ_ｐの中から最も大きな振幅特性Ｄ（ｍ_ｍ）を与えるピークポイントｍ_ｍが認識され、予め作成して格納されているマスク関数Ｍ（ｓ，ｍ_ｍ，Ｄ（ｍ_ｍ））のテーブルから、認識されたピークポイントｍ_ｍについてのマスク関数Ｍ（ｓ，ｍ_ｍ，Ｄ（ｍ_ｍ））が取り出され、振幅特性Ｄ（ｍ）とマスク関数Ｍ（ｓ，ｍ_ｍ，Ｄ（ｍ_ｍ））との間に（６）式の関係を満足する、ポイントｓ（ｓは０≦ｓ≦Ｎ／２の範囲）に対して、ＦＦＴ処理部１０２の出力Ｃ（ｍ）が０に置き換えられる。

このような処理が、ピークポイントｍ_ｐの大きい方から順に、全てのピークポイントｍ_ｐに対して繰返し実行される。

図４は、マスク関数Ｍ（ｓ，ｍ_ｍ，Ｄ（ｍ_ｍ））の例を示している。実線曲線（黒菱形を連結した曲線）は、マスク関数Ｍ（ｓ，３８，１００）を示しており、破線曲線（黒四角形を連結した曲線）は、マスク関数Ｍ（ｓ，２８，１００）を示している。周波数が高いピークポイントほど、マスクし易く近傍範囲が広くなっている。

図３（ｅ）は、マスク処理部２０３から出力された雑音除去スペクトルＧ（ｍ）を示している。雑音除去スペクトルＧ（ｍ）は、振幅特性Ｄ（ｍ）と比較すると、振幅特性Ｄ（ｍ）のピーク（極大値）近傍を強調されたものとなっている。振幅特性Ｄ（ｍ）で値が小さい周波数成分は雑音成分とみなすことができ、この実施形態ではこれを除去することとした。振幅特性Ｄ（ｍ）で値が大きい周波数成分はＳＮ比が非常に良好な成分であり、雑音成分の排除を行わなくても聴感上問題とならない。また、雑音成分とみなせる周波数成分を除去しても、人間の周波数を連続的に処理する認知力が優っており、違和感を伴うことがない。この実施形態では、このような点に着目し、振幅特性Ｄ（ｍ）におけるピークポイントを基準としたマスク処理によって雑音を除去することとした。

０≦ｍ≦Ｎ／２の範囲で求められた雑音除去スペクトルＧ（ｍ）に対して、Ｇ（ｍ）＝Ｇ^＊（Ｎ−ｍ）（ただし、Ｎ／２＋１≦ｍ≦Ｎ−１）によって、０≦ｍ≦Ｎ−１の範囲の雑音除去スペクトルＧ（ｍ）を求める。

雑音除去スペクトルＧ（ｍ）は、生成部３０の逆ＦＦＴ処理部３０１によって、Ｎ点逆ＦＦＴ処理が施され、雑音除去信号ｇ（ｎ）に変換され、さらに、接続処理部３０２によって、分析単位の雑音除去信号ｇ（ｎ）が接続されて出力信号ｙ（ｎ）が得られる。

（Ａ−３）実施形態の効果
上記実施形態によれば、周波数特性上で雑音除去するようにしたので、他の方式に比較して極めて少ない処理量、演算量で雑音を除去することができる。また、マイクロフォンを２本利用するような従来装置に比較すると、構成又は処理を簡易なものとすることができる。

（Ｂ）他の実施形態
上記実施形態の説明においても、種々変形実施形態に言及したが、さらに、以下に例示するような変形実施形態を挙げることができる。

上記実施形態では、相前後する分析単位がデータの１／２ずつをオーバーラップするものを示したが、相前後する分析単位のデータが完全に切り分けられているようにしても良い。このようにした場合には、プロセッサに処理能力が低い場合や、他に処理能力を使いたい場合等であっても、雑音除去を行うことができる。なお、この場合には、窓処理を実行しない方が良い。

振幅特性算出処理部２０１における演算を、上記実施形態より簡略化する方法として、以下の２つの方法を挙げることができる。

第１は、振幅特性算出処理部２０１において、対数演算を省略して、振幅特性Ｄ（ｍ）を（８）式で算出する方法であり、上記実施形態とほぼ同様の効果を得ることができる。第２は、振幅特性算出処理部２０１において、対数演算と絶対値演算に必要な平方根処理を省略して、振幅特性Ｄ（ｍ）を（９）式で算出する方法であり、上記実施形態とほぼ同様の効果を得ることができる。ただし、いずれの方法でも、マスク関数Ｍ（ｓ，ｍ_ｍ，Ｄ（ｍ_ｍ））は、新たな振幅特性Ｄ（ｍ）に合わせて変換する必要がある。

また、上記実施形態より、ピーク検出処理部２０２の演算を簡略化する方法として、振幅特性Ｄ（ｍ）をｍ−ＫからＢ＋Ｋ（Ｋは任意の数）までの区間平均化してピークを求める方法を挙げることができる。

さらに、マスク関数Ｍ（ｓ，ｍ_ｍ，Ｄ（ｍ_ｍ））も、実施形態のようなスペクトラムの全域に有効な値を有するものを適用する代りに、（１０）式に示すような極めて簡略化されたマスク関数Ｍ（ｓ，ｍ_ｍ，Ｄ（ｍ_ｍ））を適用するようにしても良い。Ｐをピークポイントｍ_ｐの平均的な間隔に設定すると、（１０）式に示すマスク関数は、ピークポイントｍ_ｐからＰまで隔てた振幅特性でＨ（Ｈは予め定められた定数）以上減衰しているＦＦＴ処理部１０２の出力Ｃ（ｓ）をマスクする作用を持っている。

さらにまた、マスク関数Ｍ（ｓ，ｍ_ｍ，Ｄ（ｍ_ｍ））として、パラメータｓ及びｍ_ｍが同じ場合には同じ曲線のマスク関数を適用し、Ｄ（ｍ_ｍ）によって、それを上下して適用するようにしても良い。

なお、マスク処理によって置き換わる値は０に限定されない。例えば、振幅特性Ｄ（ｍ）を減衰させた値を用いても良い。

また、本発明の雑音除去装置は他の雑音除去装置と併用しても良い。例えば、本発明の雑音除去装置の前段に、２本のマイクロフォンを利用して複数話者の音声を分離する独立成分分析（ＩｎｄｅｐｅｎｄｅｎｔＣｏｍｐｏｎｅｎｔＡｎａｌｙｓｉｓ：ＩＣＡ）による音源分離装置を設けて、分離した音声信号に対し、本発明の雑音除去装置を適用して残っている雑音を除去するようにしても良い。

実施形態に係る雑音除去装置の全体構成を示すブロック図である。実施形態に係る雑音除去装置の各部の詳細構成を示すブロック図である。実施形態の各部の出力などを示す説明図である。実施形態のマスク関数の例を示す説明図である。

符号の説明

１…雑音除去装置、
１０…分析部、１０１…窓処理部、１０２…ＦＦＴ処理部、
２０…雑音除去部、２０１…振幅特性算出処理部、２０２…ピーク検出処理部、２０３…マスク処理部、
３０…生成部、３０１…逆ＦＦＴ処理部、３０２…接続処理部。

Claims

雑音の混入した音声信号から雑音成分を除去する雑音除去装置において、
上記音声信号のスペクトルから、そのピーク位置を検出するピーク検出手段と、
上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得るマスク処理手段と
を有することを特徴とする雑音除去装置。
上記音声信号が入力され、そのスペクトルを得る周波数分析手段をさらに有することを特徴とする請求項１に記載の雑音除去装置。
上記雑音除去スペクトルを、音声信号に変換する信号生成処理手段をさらに有することを特徴とする請求項１又は２に記載の雑音除去装置。
雑音の混入した音声信号から雑音成分を除去する雑音除去方法において、
ピーク検出手段及びマスク処理手段を有し、
上記ピーク検出手段は、上記音声信号のスペクトルから、そのピーク位置を検出し、
上記マスク処理手段は、上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得る
ことを特徴とする雑音除去方法。
周波数分析手段をさらに有し、この周波数分析手段が、入力された上記音声信号のスペクトルを得ることを特徴とする請求項４に記載の雑音除去方法。
信号生成処理手段をさらに有し、この信号生成処理手段が、上記雑音除去スペクトルを、音声信号に変換することを特徴とする請求項４又は５に記載の雑音除去方法。
雑音の混入した音声信号から雑音成分を除去する雑音除去プログラムであって、
コンピュータを、
上記音声信号のスペクトルから、そのピーク位置を検出するピーク検出手段と、
上記ピーク位置を変数とするマスク関数を用いて、スペクトルの値を、より小さい値に置き換えた雑音除去スペクトルを得るマスク処理手段として
機能させることを特徴とする雑音除去プログラム。