JP2009216733A

JP2009216733A - フィルタ推定装置、信号強調装置、フィルタ推定方法、信号強調方法、プログラム、記録媒体

Info

Publication number: JP2009216733A
Application number: JP2008057055A
Authority: JP
Inventors: Kimitaka Tsutsumi; 公孝堤; Takeshi Mori; 岳至森; Akitoshi Kataoka; 章俊片岡
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 2008-03-06
Filing date: 2008-03-06
Publication date: 2009-09-24

Abstract

【課題】正確に音声強調フィルタを推定する。
【解決手段】モデル目的予測係数からなる目的予測係数コードブックＡと、モデル雑音予測係数からなる雑音予測係数コードブックＤと、第１モデル目的誤差分散からなる目的誤差分散コードブックＣと、モデル雑音誤差分散からなる雑音誤差分散コードブックＧと、を備え、入力分割信号の予測係数および誤差分散を求め、入力分割信号パワースペクトルを求め、Ａ、Ｃ、Ｄ、Ｇを用いて、入力分割信号パワースペクトルと尺度距離が最も近いと推定されるパワースペクトルについての最適目的予測係数ａ^ｆ _ｐ ^ｉ＊ｍ、最適目的誤差分散ｃ_ｋ＊ｍ ^ｉ＊ｍ、最適雑音予測係数ｄ^ｆ _ｈ ^ｊ＊ｍ、最適雑音誤差分散ｇ^ｑ＊ｍ、を求め、ａ^ｆ _ｐ ^ｉ＊ｍ、ｃ_ｋ＊ｍ ^ｉ＊ｍ、から目的信号の、ｄ^ｆ _ｈ ^ｊ＊ｍ、ｇ^ｑ＊ｍから雑音信号の、パワースペクトルを求め、これらのパワースペクトルからフィルタを求める。
【選択図】図３

Description

この発明は、目的信号を強調する信号強調装置、フィルタを推定するフィルタ推定装置、フィルタ推定方法、信号強調方法、プログラム、記録媒体に関する。

図１に従来の信号強調装置１００の機能構成例を示し、図２に信号強調装置１００で用いられるフィルタ推定装置２００の機能構成例を示す。以下の説明では、入力信号としてディジタル信号を想定する。ディジタル信号は、センサ（図示せず）に入力したアナログ信号を一定の時間間隔（サンプリング周期）毎に観測することで得られる。１秒間当たりのサンプリング回数をサンプリング周波数という。原信号に雑音信号が重畳された信号を入力信号ｚ（ｔ）とする。そして、フィルタ推定装置２００を信号強調装置１００に適用し、信号強調装置１００により強調を行った後に得られる信号を目的信号ｚ＾（ｔ）とする。ｔは連続する離散時刻のインデックスである。信号強調装置１００は、分割部１０２、周波数領域変換部１０４、フィルタ演算部１０６、時間領域変換部１０８、窓掛け処理部１１２、重畳加算部１１４フィルタ推定装置２００により構成される。以下、分割部１０２、周波数領域変換部１０４、フィルタ演算部１０６、時間領域変換部１０８、窓掛け処理部１１２、重畳加算部１１４の処理を簡単に説明するが、処理の詳細は、以下の「実施例２」で説明する。

入力信号が分割部１０２に入力されると、分割部１０２は、例えば、３０ｍｓｅｃ分程度の固定長の時間区間（以下、「フレーム」という。）に対応するＬサンプルだけディジタル信号を取り出し、入力分割信号ｚ^ｆ（ｍ）を求める（ここで、Ｌはフレーム長に対応するディジタル信号のサンプル数である）。ただし、ｍはフレーム内での離散時刻のインデックス、ｆはフレーム番号のインデックス（つまり、ｆ＝１，．．．，Ｆ）とし、Ｆは、フレーム数とする。

周波数領域変換部１０４は、入力分割信号を周波数領域に変換することで、周波数領域入力分割信号Ｚ^ｆ（ｋ）を求める。ｋは離散的周波数を表すインデックスとする。

フィルタ演算部１０６は、後述するフィルタ推定装置２００で求められたフィルタＨ（ｋ）を周波数領域入力分割信号Ｚ^ｆ（ｋ）に畳み込むことで周波数領域分割目的信号Ｙ^ｆ（ｋ）を求める。

時間領域変換部１０８は、周波数領域分割目的信号Ｙ^ｆ（ｋ）を時間領域に変換することで、時間領域分割目的信号ｙ^ｆ（ｍ）を求める。

窓掛け処理部１１２は、時間領域分割目的信号ｙ^ｆ（ｍ）に例えば、ハニング窓やハミング窓などの窓関数をｗ（ｍ）をかけ、窓掛け時間領域分割目的信号ｙ_ｗ ^ｆ（ｍ）を求める。

重畳加算部１１４は、窓掛け時間領域分割目的信号ｙ_ｗ ^ｆ（ｍ）を、直前フレームの窓掛け時間領域分割目的信号ｙ_ｗ ^ｆ−１（ｍ）と、フレーム時間長の半分の時間長（Ｌ／２サンプル）づつ重ね合わせて足し合わせていくことにより、目的信号ｚ＾（ｔ）を求める（つまり、フレーム分割前の原信号を推定する。）。

次に、図２を用いて、フィルタ推定装置２００について説明する。フィルタ推定装置２００は、線形予測演算部２０２、入力信号パワースペクトル演算部２０４、探索部２０６、誤差分散演算部２０７、目的信号パワースペクトル演算部２０８、雑音信号パワースペクトル演算部２１０、フィルタ生成部２１２、第１記憶部２１４、第２記憶部２１６、により構成される。また、以下の説明では、信号は全て自己回帰モデルに従うと仮定する。自己回帰モデルに従うと仮定すると、入力分割信号、目的信号、雑音信号（式（１）中ではまとめて「信号」という。）のパワースペクトルＰ（ｋ）は以下の式で表すことができることが知られている（非特許文献１参照）。
Ｐ（ｋ）＝（信号の誤差分散）／（信号の予測係数のフーリエ級数の絶対値の２乗）（１）
誤差分散とは予測残差の分散である。

線形予測演算部２０２は、分割部１０２から得られた入力分割信号ｚ^ｆ（ｍ）に線形予測分析を行うことで、入力分割信号の予測係数α_ｐ ^ｆおよび誤差分散β^ｆを求める。ｐは線形予測係数のインデックスを示す。線形予測係数および誤差分散の計算には、レビンソンダービンアルゴリズム（非特許文献２参照）を用いれば良い。

入力信号パワースペクトル演算部２０４は、予測係数α_ｐ ^ｆおよび誤差分散β^ｆから、上記式（１）を用いて、入力分割信号のパワースペクトルＰｚ^ｆ（ｋ）（以下、「入力分割信号パワースペクトル」という。）を求める。
また、第１記憶部２１４には目的予測係数コードブックＡが記憶されており、第２記憶部２１６には雑音予測係数コードブックＤが記憶されている。

目的予測係数コードブックＡとは、目的信号の予測係数を予め学習して、生成されたものであり、以下の式で定義される。
Ａ＝｛Ａ^ｉ｝（ｉ＝１，．．．，Ｉ）
Ａ^ｉ＝｛ａ_１ ^ｉ，．．．，ａ_Ｖ ^ｉ｝
ここで、ａ_ｖ ^ｉが、予め学習された目的信号の予測係数を示す（以下、「モデル目的予測係数ａ_ｖ ^ｉ」という。）。ＩはコードブックＡ中のコードベクトルの数（以下、「エントリ数」という。）である。また、Ｖは目的信号に関する線形予測の次数である。

雑音予測係数コードブックＤとは、雑音信号の予測係数を予め学習して、生成されたものである。以下の式で定義される。
Ｄ＝｛Ｄ^ｊ｝（ｊ＝１，．．．，Ｊ）
Ｄ^ｊ＝｛ｄ_１ ^ｉ，．．．，ｄ_Ｈ ^ｉ｝
ここで、ｄ_ｈ ^ｉが雑音信号の予測係数を示し（以下、「モデル雑音予測係数ｄ_ｈ ^ｉ」という。）、Ｊは雑音予測係数コードブックＤのエントリ数であり、Ｈは雑音信号に関する線形予測係数の次数である。それぞれのコードブックの生成（学習）手法は［発明を実施するための最良の形態］で述べる。

探索部２０６は、目的予測係数コードブックＡおよび雑音予測係数コードブックＤを用いて、フレーム毎に最適目的予測係数ａ_ｖ ^ｆ＾および最適雑音予測係数ｄ^ｆ＾を求める。代表的な距離尺度として、板倉齊藤歪尺度を用いればよい。板倉齊藤歪尺度については、非特許文献２に記載されている。コードブック探索の手法および板倉齊藤歪尺度の詳細については、［発明を実施するための最良の形態］で述べる。

そして、誤差分散演算部２０７は、求められた最適目的予測係数ａ^ｆ＾および最適雑音予測係数ｄ^ｆ＾を用いて、フレーム毎に目的信号の誤差分散の推定値ｃ^ｆ＾および雑音信号の誤差分散の推定値ｇ^ｆ＾を求める。これらの推定値は、例えば、以下の式により求められる（非特許文献３参照）。

つまり、従来では、最適目的予測係数ａ_ｖ ^ｆ＾および最適雑音予測係数ｄ^ｆ＾をコードブックＡ、Ｄから探索する処理において、目的信号の誤差分散の推定値ｃ^ｆ＾および雑音信号の誤差分散の推定値ｇ^ｆ＾を解析的に求めていた。

目的信号パワースペクトル演算部２０８が、上記式（１）に基づく以下の式（３）により、ａ^ｆ＾、ｃ^ｆ＾から目的信号のパワースペクトルＰｓ（ｋ）を求める。また、雑音信号パワースペクトル演算部２１０が、上記式（１）に基づく以下の式（４）により、ｄ^ｆ＾、ｇ^ｆ＾から目的信号のパワースペクトルＰω（ｋ）を求める。
Ｐｓ^ｆ（ｋ）＝ｃ^ｆ＾／│Ｗｓ^ｆ（ｋ）│^２（３）
Ｐω^ｆ（ｋ）＝ｇ^ｆ＾／│Ｗω^ｆ（ｋ）│^２（４）
上述の式（１）のように、Ｗｓ^ｆ（ｋ）、Ｗω^ｆ（ｋ）はそれぞれ、ａ^ｆ＾、ｄ^ｆ＾のフーリエ級数である。そして、フィルタ生成部２１２は、以下の式によりフィルタを生成する。
Ｈ^ｆ（ｋ）＝Ｐｓ^ｆ（ｋ）／（Ｐｓ^ｆ（ｋ）＋Ｐω^ｆ（ｋ））（５）
フィルタ推定装置２００の構成は非特許文献３に記載されており、信号強調装置の構成の詳細は非特許文献４に記載されている。
竹村彰通、谷口正信著"統計科学のフロンティアＩ統計学の基礎Ｉ"岩波書店守谷健弘著 "音声符号化"電子情報通信学会ＳｒｉｒａｍＳｒｉｎｉｖａｓａｎ他著"ＣｏｄｅｂｏｏｋＤｒｉｖｅｎＳｈｏｒｔ−ＴｅｒｍＰｒｅｄｉｃｔｏｒＰａｒａｍｅｔｅｒＥｓｔｉｍａｔｉｏｎｆｏｒＳｐｅｅｃｈＥｎｈａｎｃｅｍｅｎｔ" ＩＥＥＥＴｒａｎｓ，ｖｏｌ．１４Ｎｏ．１，Ｊａｎｕａｒｙ２００６ｐｐ１６３−１７６Ｙ．Ｅｐｈｒａｉｍ，ｅｔａｌ，"ＳｐｅｅｃｈＥｎｈａｎｃｅｍｅｎｔｕｓｉｎｇａｍｉｎｉｍｕｍ−ｍｅａｎｓｑｕａｒｅｅｒｒｏｒｌｏｇ−ｓｐｅｃｔｒａｌａｍｐｌｉｔｕｄｅｅｓｔｉｍａｔｏｒ" ＩＥＥＥＴｒａｎｓ．Ａｃｏｎｓｔ．ＳｐｅｅｄＳｉｇｎａｌＰｒｏｃｅｓｓ．ｖｏｌ．ＡＳＳＰ−３３Ｎｏ．２，ｐｐ４４３−４４５、Ａｐｒｉｌ

従来のフィルタ推定装置２００の構成であれば、目的信号、雑音信号の予測係数のみをモデル化している。そして、目的信号の誤差分散および雑音信号の誤差分散に制約をつけずに誤差分散演算部２０７が、解析的に計算する。従って、雑音信号、目的信号のパワースペクトルを正確に推定できず、結果としてフィルタの推定を正確に行えないという問題があった。

この発明のフィルタ推定装置は、線形予測演算部と、入力信号パワースペクトル演算部と、第１記憶部と、第２記憶部と、第３記憶部と、第４記憶部と、探索部と、目的信号パワースペクトル演算部と、雑音信号パワースペクトル演算部と、フィルタ生成部と、を備える。線形予測演算部は、フレーム分割により得られた入力分割信号に線形予測分析を行うことで、予測係数および誤差分散を求める。入力信号パワースペクトル演算部は、予測係数および誤差分散から入力分割信号パワースペクトルを求める。第１記憶部は、モデル目的予測係数と第２モデル目的誤差分散からなるベクトルの集合である目的予測係数コードブックを記憶している。なお、第２モデル目的誤差分散は目的予測係数コードブックに含ませない構成とすることも出来る。第２記憶部は、モデル雑音予測係数からなるベクトルの集合である雑音予測係数コードブックを記憶している。第３記憶部は、第１モデル目的誤差分散からなるベクトルの集合である目的誤差分散コードブックを記憶している。第４記憶部は、モデル雑音誤差分散からなるベクトルの集合である雑音誤差分散コードブックを記憶している。探索部は、目的予測係数コードブック、目的誤差分散コードブック、雑音予測係数コードブック、雑音誤差分散コードブックからそれぞれ最適なコードベクトルを選択する。各コードブックから１つずつコードベクトルを選択し、例えば、以下で述べる式（２５）によりパワースペクトルの推定値を求め、当該推定値と入力分割信号パワースペクトルとの間の距離尺度、例えば板倉齊藤歪尺度を計算する。板倉齊藤歪尺度が最小となるようなコードベクトルの組み合わせを探索し、これを最適目的予測係数、最適目的誤差分散、最適雑音予測係数、最適雑音誤差分散、とする。目的信号パワースペクトル演算部は、最適目的予測係数および最適目的誤差分散から目的信号のパワースペクトルとする。雑音信号パワースペクトル演算部は、最適雑音予測係数および最適雑音誤差分散から雑音信号のパワースペクトルを求める。フィルタ生成部は、目的信号のパワースペクトルおよび雑音信号のパワースペクトルからフィルタを求める。また、目的予測係数コードブックと目的誤差分散コードブックとは、対応付けられている

この発明のフィルタ推定装置は、目的信号および雑音信号の予測係数をモデル化したコードブックに加え、目的信号の誤差分散の分布をモデル化したコードブックＣおよび雑音信号の誤差分散の分布をモデル化したコードブックＧも備えた。従って、コードブックＣ、Ｇにより、目的信号の誤差分散および雑音信号の誤差分散の推定値に制約を付けることができる。これにより、雑音信号、目的信号のパワースペクトルの推定精度が向上し、フィルタの推定性能を向上させることができる。

以下に、発明を実施するための最良の形態を示す。なお、同じ機能を持つ構成部や同じ処理を行う過程には同じ番号を付し、重複説明を省略する。

図３に実施例１のフィルタ推定装置４００の機能構成例を示し、図４に主な処理の流れを示す。また、信号強調装置１００の構成のうちフィルタ推定装置２００に代えてフィルタ推定装置４００を適用した構成（以下、「信号強調装置３００」という。）は図１と同様である。フィルタ推定装置４００の適用は信号強調処理に限られない。実施例１および実施例２では目的信号を音声信号とし、入力信号は音声信号に雑音信号が重畳した信号とし、信号強調装置３００は、当該音声信号を強調して出力するものとする。

実施例１のフィルタ推定装置４００は、線形予測演算部２０２、入力信号パワースペクトル演算部２０４、探索部４０６、目的信号パワースペクトル演算部２０８、雑音信号パワースペクトル演算部２１０、フィルタ生成部２１２、第１記憶部４１４、第２記憶部４１６、第３記憶部４２０、第２記憶部４２２、により構成される。

線形予測演算部２０２は、分割部１０２から得られた入力分割信号ｚ^ｆ（ｍ）に線形予測分析を行うことで、入力分割信号の予測係数α_ｐ ^ｆおよび誤差分散β^ｆを求める（ステップＳ２）。［背景技術］において述べたように、線形予測分析には例えば、レビンソンダービンアルゴリズムなどを用いることができる。

入力信号パワースペクトル演算部２０４は、予測係数α_ｐ ^ｆおよび誤差分散β^ｆから入力分割信号パワースペクトルＰｚ^ｆ（ｋ）を求める（ステップＳ４）。入力分割信号は自己回帰モデルに従うと仮定しているので、［背景技術］の式（１）に従い、パワースペクトルを計算できる。具体的には次式（２０）により求めることが出来る。

Ｐｚ^ｆ（ｋ）＝β^ｆ／│Ｗｚ^ｆ（ｋ）│^２（２０）
ただし、Ｗｚ^ｆ（ｋ）は予測係数α_ｐ ^ｆのフーリエ級数であり、以下の式で表すことができる。ここでＲはフーリエ変換長を表す。

Ｗｚ^ｆ（ｋ）＝Σ_ｐ＝０ ^Ｒ−１α_ｐ ^ｆｅｘｐ｛−ｊ（２πｐｋ）／Ｒ｝（２１）
探索部４０６の説明の前に、目的予測係数コードブックＡ、雑音予測係数コードブックＤ、目的誤差分散コードブックＣ、雑音推定誤差数コードブックＧの生成手法について説明し、次に、探索部４０６、目的信号パワースペクトル演算部２０８、雑音信号パワースペクトル演算部２１０、フィルタ生成部２１２、の動作を説明する。

［目的予測係数コードブックＡの生成手法］
図５に目的予測係数コードブックを生成するための目的予測係数コードブック生成装置５００の機能構成例を示す。目的予測係数コードブック生成装置５００は、分割部１０２、線形予測演算部２０２、第１変換部５０２、学習ベクトル記憶部５０４、セントロイド演算部５０６、第２変換部５０８により構成される。音声データベース５０１には、大量の学習用の音声ファイルが格納されている。分割部１０２は、音声データベース５０１からの音声ファイルに対して、フレーム分割処理を行い、フレーム分割信号ｓ^ｆ（ｍ）を求める。線形予測演算部２０２は、線形予測演算を行い、予測係数α_ｓ、ｖ ^ｆ、誤差分散β_ｓ ^ｆを求める。ここで、予測係数の次数ｖには雑音重畳音声ならびに音声は１０次、自動車の走行雑音には４次、オフィス環境下の雑音には１０次といったように信号の性質により異なる値を用いる。また、添え字「ｓ」は、目的信号を示す記号として用いる。

次に、第１変換部５０２により、予測係数α_ｓ、ｖ ^ｆからＬＳＰ係数（Line Spectral Pair）へ変換する。当該変換の手法は、例えば、チェビシェフ多項式の求解法による。チェビシェフ多項式の求解法は例えば、非特許文献２に記載されている。当該変換によりＬＳＰ係数Ｌ_ｓ、１ ^ｆ，．．．，Ｌ_ｓ、ｖ ^ｆ，．．．，Ｌ_ｓ、Ｖ ^ｆを求める。そして、誤差分散β_ｓとＬＳＰ係数を組み合わせて以下の学習ベクトルＱ_ｓ ^ｆを生成して、学習ベクトル記憶部５０４に記憶させる。
Ｑ_ｓ ^ｆ＝［Ｌ_ｓ、１ ^ｆ，．．．，Ｌ_ｓ、ｖ ^ｆ，．．．，Ｌ_ｓ、Ｖ ^ｆ、β_ｓ ^ｆ］
全ての学習用音声ファイルについて、分割部１０２、線形予測演算部２０２、第１変換部５０２、それぞれの処理を行い、生成された学習ベクトルを逐次、学習ベクトル記憶部５０４に記憶させる。そして得られたΦ個の学習ベクトルの集合｛Ｑ_ｓ ^１，．．．，Ｑ_ｓ ^Φ｝が求められる。

セントロイド演算部５０６は、学習ベクトル集合｛Ｑ_ｓ ^１，．．．，Ｑ_ｓ ^Φ｝に対して、ＬＢＧアルゴリズムを適用し、Ｉ個のセントロイド集合｛ｃ_ｓ ^１，．．．ｃ_ｓ ^Ｉ｝を得る。ＬＢＧアルゴリズムについては上記非特許文献２に記載されている。

セントロイド集合中のコードベクトルＣ^ｉのうち、ＬＳＰ係数に対応する要素を予測係数ａ_１ ^ｉ，．．．，ａ_ｖ ^ｉに変換する（変換手法は例えば、非特許文献２に記載）。添え字ｉはコードベクトルのインデックスを表す（ｉ＝１，．．．，Ｉ）。予測係数ａ_１ ^ｉ，．．．，ａ_Ｖ ^ｉとセントロイドｃ_ｓ ^ｉの誤差分散に対応する要素ｂ^ｉを合わせて、コードベクトルＡ^ｉ＝｛ａ_１ ^ｉ，．．．，ａ_ｖ ^ｉ，ｂ^ｉ｝を作成する。
セントロイドからコードベクトルへの変換を全てのセントロイドについて行い、目的予測係数コードブックＡ＝｛Ａ^１，．．．，Ａ^ｉ，．．．，Ａ^Ｉ｝を求め、第１記憶部２１４に記憶させる。以下の説明では、ａ_ｖ ^ｉ（ｖ＝１，．．．，Ｖ）をモデル目的予測係数といい、ｂ^ｉを第２モデル目的誤差分散といい、Ａ^ｉを目的予測係数コードベクトルという。

［雑音予測係数コードブックＤの生成手法］
雑音予測係数コードブックＤの生成に用いる装置は、目的予測係数コードブック生成装置５００と同様である。目的予測係数コードブックＡの生成手法と違う点は、音声データベース５０１が雑音のデータベースとなる点、および学習ベクトルとして予測係数のみを用いる点である。従って、説明を省略する。雑音予測係数コードブックＤ＝｛Ｄ^１，．．．，Ｄ^ｊ，．．．，Ｄ^Ｊ｝（ｊ＝１，．．．，Ｊ）、雑音予測係数コードベクトルＤ^ｊ＝｛ｄ_１ ^ｊ，．．．，ｄ_ｈ ^ｊ，．．．，ｄ_Ｈ ^ｊ｝（ｈ＝１，．．．，Ｈ）とする。また、モデル雑音予測係数ｄ_ｈ ^ｊをモデル雑音予測係数とする。Ｊは予め定められたエントリ数であり、Ｈは予測係数の次数である。

［目的誤差分散コードブックＣの生成手法］
図６に、目的誤差分散コードブック生成装置６００の機能構成例を示す。目的誤差分散コードブック生成装置６００は、分割部１０２、誤差分散演算部６０２、最小誤差分散判定部６０４、セントロイド演算部５０６により構成される。また、
第１記憶部４１４に記憶された目的予測係数コードブックＡを用いる。

分割部１０２は、音声データベース５０１の中の音声ファイルに対して、フレーム分割処理を行い、フレーム分割信号ｓ^ｆ（ｍ）を求める。誤差分散演算部６０２は、フレーム分割信号ｓ^ｆ（ｍ）に対して、目的予測係数コードブックＡ中のコードベクトルＡ^ｉの予測係数に対応するａ_ｖ ^ｉを用いて、次式に基づき予測誤差ε^ｉ（ｍ）を求める。
ε^ｉ（ｍ）＝Σ_ｖ＝０ ^Ｐａ_ｖ ^ｉｓ^ｆ（ｍ−ｖ）（２２）
そして、誤差分散Ω^ｉは次式で求める。

誤差分散演算部６０２は全てのｉに対して｛ｉ＝１，．．．，Ｉ｝、予測誤差ε^ｉ（ｍ）およびこれに基づく誤差分散Ω^ｉを求める。
そして、最小誤差分散判定部６０４は、Ａ^ｉと１対１対応するＩ個のバッファ（図示せず）を持つ。まず、Ω^ｉを最小とするようなＡ^ｉを選択し、Ω^ｉを対応するバッファに格納する。格納された誤差分散Ω^ｉの集合を最小誤差集合μ^ｉとする。

最小誤差集合μ^ｉを学習サンプルとして、ＬＢＧアルゴリズムを適用し、目的誤差分散コードベクトルＣ^ｉを得る。これを全てのｉについて実行し、以下に示す目的誤差分散コードブックＣを求める。
Ｃ＝｛Ｃ^１，．．．，Ｃ^ｉ，．．．，Ｃ^Ｉ｝
各目的誤差分散コードベクトルＣ^ｉは次式により定義される。
Ｃ^ｉ＝｛ｃ_１ ^ｉ，．．．，ｃ_ｋ ^ｉ，．．．，ｃ_Ｋ ^ｉ｝
ｃ_ｋ ^ｉを第１モデル目的誤差分散とし、Ｋは予め定められるエントリ数である。

［雑音誤差分散コードブックＧの生成手法］
雑音誤差分散コードブックＧを生成するための雑音誤差分散コードブック生成装置７００の機能構成例を図７に示す。雑音誤差分散コードブック生成装置７００は、分割部１０２、線形予測演算部２０２、誤差分散記憶部７０２、セントロイド演算部５０６とで構成されている。

まず、分割部１０２は、観測信号の最初の非発話区間（例えば、５秒程度の雑音信号）に対して、フレーム分割処置を行うことで、フレーム雑音信号を求める。そして、線形予測演算部２０２は、フレーム雑音信号毎に線形予測演算を行うことで、誤差分散を求める。求められた誤差分散は逐次、誤差分散記憶部に格納される。そして、全てのフレーム雑音信号について誤差分散を格納した後、全ての誤差分散に対してＬＢＧアルゴリズムを適用し、以下に示す雑音誤差分散コードブックＧを求める。
Ｇ＝ｇ^ｑ｛ｑ＝１，．．．，Ｑ｝
ただし、ｇ^ｑをモデル雑音誤差分散とし、Ｑは予め定められたエントリ数とする。

以下に、目的予測係数コードブックＡ、雑音予測係数コードブックＤ、目的誤差分散コードブックＣ、雑音誤差分散コードブックＧをまとめて示す。

目的予測係数コードブックＡ＝｛Ａ^ｉ｝（ｉ＝１，．．．，Ｉ）
目的予測係数コードベクトルＡ^ｉ＝｛ａ_１ ^ｉ，．．．，ａ_ｖ ^ｉ，．．．，ａ_Ｖ ^ｉ，ｂ^ｉ｝

目的誤差分散コードブックＣ＝｛Ｃ^ｉ｝（ｉ＝１，．．．，Ｉ）
目的誤差分散コードベクトルＣ^ｉ＝｛ｃ_１ ^ｉ，．．．，ｃ_ｋ ^ｉ，．．．，ｃ_Ｋ ^ｉ｝

雑音予測係数コードブックＤ＝｛Ｄ^ｊ｝（ｊ＝１，．．．，Ｊ）
雑音予測係数コードベクトルＤ^ｊ＝｛ｄ_１ ^ｊ，．．．，ｄ_ｈ ^ｊ，．．．，ｄ_Ｈ ^ｊ｝

雑音予測係数コードブックＧ＝｛ｇ^ｑ｝（ｑ＝１，．．．，Ｑ）

上記目的予測係数コードベクトルＡ^ｉの添え字「ｉ」と上記目的誤差分散コードベクトルＣ^ｉの添え字「ｉ」は対応している。このように、目的予測係数コードベクトルＡ^ｉと目的誤差分散コードベクトルＣ^ｉとを１対１に対応させていることが好ましい。当該対応させることで、パワースペクトルの包絡の形状と、誤差分散がとる分布の間の対応付けを行い、前後の音韻による影響や個人差などによる誤差分散の変動に対する頑健性を向上させることが出来る。これによりパワースペクトル推定精度が向上し、強調後の音声の高品質化を期待できる。

また、目的予測係数コードベクトルＡ^ｉのように、コードベクトルに予測係数のみならず、誤差分散ｂ^ｉを含ませることが好ましい。誤差分散ｂ^ｉを含ませることで、目的信号パワースペクトル演算部４０８はより正確に目的信号のパワースペクトルを求めることができる。何故なら、目的信号の予測係数と目的信号の誤差分散の間の相関をモデル化することになり、音声の特徴（例えば、母音の包絡が現れたときには誤差分散を大きめに見積もるといった制約）を目的信号のパワースペクトル推定の際の制約とすることができるからである。

次に、第１記憶部４１４、第２記憶部４１６、第３記憶部４２０、第４記憶部４２２を用いた探索部４０６の動作を説明する。探索部４０６は、第１記憶部４１４に記憶されている目的予測係数コードブックＡ、第３記憶部４２０に記憶されている目的誤差分散コードブックＣ、第２記憶部４１６に記憶されている雑音予測係数コードブックＤ、第４記憶部４２２に記憶されている雑音誤差分散コードブックＧ、入力分割信号パワースペクトルＰｚ^ｆ（ｋ）を用いて、最適目的予測係数、最適目的誤差分散、最適雑音予測係数、最適雑音誤差分散、を求める。具体的には、探索部４０６は、コードブックＡ、Ｃ、Ｄ、Ｇ、からそれぞれ最適なコードベクトルを選択する。各コードブックから１つずつコードベクトルを選択し、例えば以下で述べる式（２５）によりパワースペクトルの推定値を求め、当該推定値と入力分割信号パワースペクトルとの間の距離尺度を計算する。以下の説明では当該距離尺度を板倉齊藤歪尺度とする。探索部４０６は、コードベクトルの組み合わせを変えながら、板倉齊藤歪尺度を評価し、板倉齊藤歪尺度が最小となるようなコードベクトル（以下、「最適コードベクトル」という。）の組み合わせ（Ａ^ｉ＊ｍ、Ｄ^ｊ＊ｍ、ｃ_ｋ＊ｍ ^ｉ＊ｍ、ｇ^ｑ＊ｍ）を求める。「ｉ^＊ｍ」「ｊ^＊ｍ」「ｋ^＊ｍ」「ｑ^＊ｍ」は、最適コードベクトルのインデックスである。Ａ^ｉ＊ｍに含まれる目的予測係数を最適目的予測係数ａ^ｆ＾とし、ｃ_ｋ＊ｍ ^ｉ＊ｍに含まれる目的誤差分散を最適目的誤差分散ｃ^ｆ＾とし、Ｄ^ｊ＊ｍに含まれる雑音予測係数を最適雑音予測係数ｄ^ｆ＾とし、ｇ^ｑ＊ｍに含まれる雑音誤差分散を最適雑音誤差分散ｇ^ｆ＾として、探索部４０６は出力する（ステップＳ６）。音声のパワースペクトルの包絡形状は同じ音韻の音声の間では類似したものとなるため、コードブックなどを利用して有限個のパワースペクトルをモデル化することにより、音声全体のパワースペクトルを近似することが可能である。

板倉齊藤歪尺度は、ある２つのパワースペクトルをＰ_１、Ｐ_２とすると以下の式（２４）で定義される（従来技術２のＰ６２参照）。

探索部４０６の動作として例えば次の２つの手法が考えられる。１つは全てのコードベクトルの組み合わせについて板倉齊藤歪尺度の評価を行い最適コードベクトルの組を決定する全探索方式である。

もう１つは他のコードベクトルを固定して１つのコードベクトルのみを変化させて評価を行い、最適コードベクトルを求め、今度は別の１つのコードベクトルを変化させ、他を固定するといった処理を板倉齊藤歪尺度が収束するまで繰り返す反復方式である。以下、「全探索方式」と「反復方式」の２つの方式の詳細を説明する。

［全探索方式］
目的予測係数コードブックＡからＡ^ｉ、雑音予測係数コードブックＤからＤ^ｊ、目的誤差分散コードブックＣ中のコードベクトルＣ^ｉのうちｃ_ｋ ^ｉを選択し、雑音誤差分散Ｇからｇ^ｑを選択したとすると、推定したパワースペクトルＰ_ｉｊｋｑ（ｋ）は以下の式で定義される。

［反復方式］
反復方式は、ある一つのコードベクトルのみを変化させ、他のコードベクトルを固定して、コードベクトルの組を求める。簡略化して一例を説明すると、直前フレームの雑音信号のパワースペクトルＰ_ω ^ｆ−１を用いてＡ^ｉを求め、当該Ａ^ｉを用いてＤ^ｊを求める。そして、Ａ^ｉ、Ｄ^ｊを用いてＣ^ｉ、ｇ^ｑを求める。以下、詳細にこの一例について説明する。
（１）直前フレームの雑音信号のパワースペクトルＰ_ω ^ｆ−１を利用して、例えば以下の式によりＡ^ｉ＊ｍを求める。なお、Ｘはｄが最小になる組み合わせを選択した際のｄの値である。

（４）上記（１）から（３）を順に行い、Ｄの値が収束したときの最適コードベクトルの組み合わせ（Ａ^ｉ＊ｍ、Ｄ^ｊ＊ｍ、ｃ_ｋ＊ｍ ^ｉ＊ｍ、ｇ^ｑ＊ｍ）を求める。そして、Ａ^ｉ＊ｍおよびｃ_ｋ＊ｍ ^ｉ＊ｍは目的信号パワースペクトル演算部２０８に入力され、Ｄ^ｊ＊ｍおよびｇ^ｑ＊ｍは雑音信号パワースペクトル演算部２１０に入力される。また、板倉齊藤歪尺度の代わりにパワースペクトル間のユークリッド距離などの距離尺度を用いても、上記探索処理を行うことが出来る。

目的信号パワースペクトル演算部２０８は、Ａ^ｉ＊ｍ中の目的予測係数「ａ^ｆ _１ ^ｉ＊ｍ，．．．，ａ^ｆ _Ｖ ^ｉ＊ｍ」（以下、「最適目的予測係数」という。）および目的誤差分散ｃ_ｋ＊ｍ ^ｉ＊ｍ（以下、「最適目的誤差分散」という。）からフレーム毎に目的信号のパワースペクトルＰｓ^ｆ（ｋ）を求める（ステップＳ８）。具体的には上記式（１）に基づいて以下の式のように求める。

Ｐｓ^ｆ（ｋ）＝ｃ_ｋ＊ｍ ^ｉ＊ｍ／│Ａ^ｆ _ｓ ^ｉ＊ｍ（ｋ）│^２（３０）
ただし、Ａ^ｆ _ｓ ^ｉ＊ｍ（ｋ）は、目的予測係数ａ^ｆ _ｖ ^ｉ＊ｍ（ｖ＝１，．．．，Ｖ）のフーリエ級数とする。

一方、雑音信号パワースペクトル演算部２１０は、フレーム毎にＤ^ｉ＊ｍ中の雑音予測係数「ｄ^ｆ _１ ^ｊ＊ｍ，．．．，ｄ^ｆ _Ｈ ^ｊ＊ｍ」（以下、「最適雑音予測係数」という。）および雑音誤差分散ｇ^ｑ＊ｍ（以下、「最適雑音誤差分散」という。）から雑音信号のパワースペクトルＰω^ｆ（ｋ）を求める（ステップＳ８）。具体的には上記式（１）に基づいて以下の式のように求める。
Ｐω^ｆ（ｋ）＝ｇ^ｑ＊ｍ／│Ａ^ｆ _ω ^ｊ＊ｍ（ｋ）│^２（３１）ただし、Ａ^ｆ _ω ^ｊ＊ｍ（ｋ）は、雑音予測係数ｄ^ｆ _ｈ ^ｊ＊ｍ（ｈ＝１，．．．，Ｈ）のフーリエ級数とする。

フィルタ生成部２１２は、目的信号のパワースペクトルＰｓ^ｆ（ｋ）および雑音信号のパワースペクトルＰω^ｆ（ｋ）からフィルタＨ^ｆ（ｋ）を求める。具体的には、以下の式により求める（ステップＳ１２）。

Ｈ^ｆ（ｋ）＝（Ｐｓ^ｆ（ｋ））／（Ｐｓ^ｆ（ｋ）＋Ｐω^ｆ（ｋ））（３２）
説明の便宜上、第１〜４記憶部の４つに分けたが、物理的には１つの記憶部に４つのコードブックＡ、Ｄ、Ｃ、Ｇを混在させて記憶する構成も可能である。

このフィルタ推定装置４００は、従来から存在していた目的予測係数コードブックＡおよび雑音予測係数コードブックＤのみならず、目的誤差分散コードブックＣおよび雑音誤差分散コードブックＢを備える。Ｂ、Ｄにより誤差分散について制約を付けることが出来、結果として雑音信号のパワースペクトル、目的信号のパワースペクトルを過大推定、または過小推定することなく、正確な推定を行うことが出来る。

また、目的予測係数コードブック中の各コードベクトルは要素として、モデル目的予測係数ａ_１ ^ｉ，．．．，ａ_Ｖ ^ｉだけでなく、第２モデル目的誤差分散ｂ^ｉを含ませることが好ましい。何故なら、上述したように目的信号の予測係数と目的信号の誤差分散の間の相関をモデル化することで、音声の特徴（例えば、母音の包絡が現れたときには誤差分散を大きめに見積もるといった制約）を目的信号パワースペクトル演算部２０８による目的信号のパワースペクトル推定の際の制約とすることができ、強調後の音声の高品質化を期待できるからである。そして、式（２７）に示すように、第２モデル目的誤差分散ｂ^ｉを用いることで、探索部４０６は、より高精度な探索処理を行うことが出来るからである。第２モデル目的誤差分散ｂ^ｉを含ませない場合の探索部４０６の探索処理は、上記式（２７）中の右辺のｂ^ｉをｃ^ｉ中の何れかの要素に置き換えて計算することで可能となる。

また、上記式（２７）および式（２９）の関係からも理解されるように、目的予測係数コードベクトルＡ^ｉと目的予測誤差コードベクトルＣ^ｉとは対応付けられていることが必要である。そして、Ａ^ｉとＣ^ｉとは１対１に対応付けられていることが好ましい。Ａ^ｉとＣ^ｉを１対１に対応させることで、上述したようにパワースペクトルの包絡の形状と、誤差分散がとる分布の間の対応付けを行い、前後の音韻による影響や個人差などによる誤差分散の変動に対する頑健性を向上させることが出来る。これによりパワースペクトル推定精度が向上し、強調後の音声の高品質化を期待できる。更に、Ａ^ｉとＣ^ｉを１対１対応させることで、上記式（２７）で求まった「ｉ＊ｍ」をそのまま式（２９）に適用できる点で、計算コストを削減できる。

また、Ａ^ｉとＣ^ｉの対応付けは１対１に限定されない。Ａのエントリ数とＣのエントリ数とが異なる場合には、最尤推定などを用いてコードベクトル間の対応付けを行うことが出来る。

次にフィルタ推定装置４００を用いた信号強調装置３００について、図１を用いて簡単に説明する。また、主な処理の流れを図８に示す。

外部から入力したディジタル信号を分割部１０２に入力する。そして、分割部１０２は、入力信号のうち１フレーム分（Ｌサンプル分）ずつ取り出すことにより入力信号をフレーム分割する（ステップＳ１０２）。フレーム分割により得られた入力信号全体のフレーム数をＦとする。フレーム分割により得られた入力信号を入力分割信号ｚ^ｆ（ｍ）とする。ただし、ｍはフレーム内での離散時刻のインデックス（ｍ＝１，．．．，Ｌ）、ｆはフレーム番号のインデックス（ｆ＝１，．．．，Ｆ）とする。

図９にフレーム分割処理の概要を示す。図９に示すように、入力信号がフレーム分割される際に、各フレームは、直前のフレームとフレーム長Ｌの半分の時間長だけ重なりをもって切り出される。入力分割信号ｚ^ｆ（ｍ）は、周波数領域変換部１０４に入力される。

周波数領域変換部１０４は、入力分割信号を周波数領域に変換することで、周波数領域入力分割信号Ｚ^ｆ（ｋ）を求める（ステップＳ１０４）。周波数領域の変換は、例えば以下の式に示すフーリエ変換により行われる。

ｚ’（ｍ）＝ｚ^ｆ（ｍ）（ｍ＝１，．．．，Ｌ）（４０）
ｚ’（ｍ）＝０（ｍ＝Ｌ＋１，Ｌ＋２，．．．，Ｒ）
Ｚ^ｆ（ｋ）＝Σ_ｍ＝０ ^Ｒ−１ｚ’（ｍ）ｅｘｐ｛−ｊ（２πｍｋ）／Ｒ｝
ただし、Ｒは、フーリエ変換長であり、Ｒ＞Ｌとする。

フィルタ演算部１０６は、フィルタ推定装置４００でフィルタＨ（ｋ）が求められると（ステップＳ１０６）、当該フィルタＨ（ｋ）を周波数領域入力分割信号Ｚ^ｆ（ｋ）に畳み込むことで周波数領域分割目的信号Ｙ^ｆ（ｋ）を求める（ステップＳ１０８）。以下の式によるフィルタ演算を行うことで、周波数領域における音声強調を行う。
│Ｙ^ｆ（ｋ）│＝Ｈ（ｋ）・│Ｚ^ｆ（ｋ）│ （４１）
時間領域変換部１０８は、周波数領域分割目的信号Ｙ^ｆ（ｋ）を時間領域に変換することで、時間領域分割目的信号ｙ^ｆ（ｍ）を求める（ステップＳ１１０）。ここで、Ｙ^ｆ（ｋ）の位相成分にはＺ^ｆ（ｋ）の位相成分を与える。例えば、以下の式（４２）に示す逆フーリエ変換により行われる。なお、逆フーリエ変換により得られる信号のうち、式（４３）に示すように、最初のＬサンプルのみを取り出して、ｙ^ｆ（ｍ）とする。

ｙ^ｆ（ｍ）＝Σ_ｋ＝０ ^Ｒ−１Ｙ^ｆ（ｋ）ｅｘｐ｛ｊ（２πｍｋ）／Ｒ｝（４２）
ｙ^ｆ（ｍ）←ｙ^ｆ（ｍ’）（ｍ’＝１，．．．，Ｌ）（４３）

図１０に、窓掛け処理部１１２、重畳加算部１１４の処理の概要を示す。
図１０Ａに示すように、窓掛け処理部１１２は、時間領域分割目的信号ｙ^ｆ（ｍ）に例えば、ハニング窓やハミング窓などの窓関数をｗ（ｍ）をかけ、窓掛け時間領域分割目的信号ｙ_ｗ ^ｆ（ｍ）を求める（ステップＳ１１２）。窓関数の長さはフレーム長と同じＬである。窓関数は例えば、以下の式のように行われる。
ｙ_ｗ ^ｆ（ｍ）＝ｗ（ｍ）・ｙ^ｆ（ｍ）（４４）

図４Ｂに示すように、重畳加算部１１４は、窓掛け時間領域分割目的信号ｙ_ｗ ^ｆ（ｍ）を、直前フレームの窓掛け時間領域分割目的信号ｙ_ｗ ^ｆ（ｍ−１）と、フレーム時間長の半分の時間長（Ｌ／２サンプルづつ）重ね合わせて足し合わせていくことにより、目的信号ｚ＾（ｔ）を求める（つまり、フレーム分割前の原信号を推定する。）（ステップＳ１１４）。

フィルタ推定装置４００により推定されたフィルタを目的信号の強調に用いることで、従来と比べてより正確な目的信号（音声信号）の強調を行うことが出来る。目的信号は音声信号に限られず、フィルタ推定装置で推定されたフィルタは信号強調のためだけに用いられるものではない。

＜ハードウェア構成＞
本実施例で説明したフィルタ推定装置、信号強調装置は、ＣＰＵ（Central Processing Unit）、入力部、出力部、補助記憶装置、ＲＡＭ（Random Access Memory）、ＲＯＭ（Read Only Memory）及びバスを有している（何れも図示せず）。
ＣＰＵは、読み込まれた各種プログラムに従って様々な演算処理を実行する。補助記憶装置は、例えば、ハードディスク、ＭＯ（Magneto-Optical disc）、半導体メモリ等であり、ＲＡＭは、ＳＲＡＭ(Static Random Access Memory)、ＤＲＡＭ (Dynamic Random Access Memory)等である。また、バスは、ＣＰＵ、入力部、出力部、補助記憶装置、ＲＡＭ及びＲＯＭを通信可能に接続している。

＜ハードウェアとソフトウェアとの協働＞
本実施例のフィルタ推定装置、信号強調装置は、上述のようなハードウェアに所定のプログラムが読み込まれ、ＣＰＵがそれを実行することによって構築される。以下、このように構築される各装置の機能構成を説明する。

フィルタ推定装置、信号強調装置の入力部、出力部は、所定のプログラムが読み込まれたＣＰＵの制御のもと駆動するＬＡＮカード、モデム等の通信装置である。フィルタ推定装置４００中の線形予測演算部、入力信号パワースペクトル演算部、目的信号パワースペクトル演算部、雑音信号パワースペクトル演算部、探索部、フィルタ生成部、信号強調装置３００中の分割部、周波数領域変換部、フィルタ演算部、時間領域変換部、窓掛け処理部、重畳加算部は所定のプログラムがＣＰＵに読み込まれ、実行されることによって構築される演算部である。第１記憶部、第２記憶部、第３記憶部は上記補助記憶装置として機能する。

信号強調装置の機能構成例を示したブロック図。従来技術のフィルタ推定装置の機能構成例を示したブロック図。実施例１のフィルタ推定装置の機能構成例を示したブロック図。実施例１のフィルタ推定装置の主な処理を示したフローチャート。目的予測係数コードブック生成装置の機能構成例を示したブロック図。目的誤差分散コードブック推定装置の機能構成例を示したブロック図。雑音誤差分散コードブック推定装置の機能構成例を示したブロック図。実施例２の信号強調装置の主な処理の流れを示したフローチャート。フレーム分割処理を模式的に示した図。図１０Ａが窓掛け処理を模式的に示した図であり、図１０ｂが重畳加算を模式的に示した図である。

Claims

フレーム分割により得られた入力分割信号に線形予測分析を行うことで、予測係数および誤差分散を求める線形予測演算部と、
前記予測係数および前記誤差分散から入力分割信号パワースペクトルを求める入力信号パワースペクトル演算部と、
モデル目的予測係数からなるベクトルの集合である目的予測係数コードブックを記憶している第１記憶部と、
モデル雑音予測係数からなるベクトルの集合である雑音予測係数コードブックを記憶している第２記憶部と、
第１モデル目的誤差分散からなるベクトルの集合である目的誤差分散コードブックを記憶している第３記憶部と、
モデル雑音誤差分散からなるベクトルの集合である雑音誤差分散コードブックを記憶している第４記憶部と、
前記目的予測係数コードブック、前記目的誤差分散コードブック、前記雑音予測係数コードブック、前記雑音誤差分散コードブック、前記入力分割信号パワースペクトルを用いて、最適目的予測係数、最適目的誤差分散、最適雑音予測係数、最適雑音誤差分散、を求める探索部と、
前記最適目的予測係数および前記最適目的誤差分散から目的信号のパワースペクトルを求める目的信号パワースペクトル演算部と、
前記最適雑音予測係数および前記最適雑音誤差分散から雑音信号のパワースペクトルを求める雑音信号パワースペクトル演算部と、
前記目的信号のパワースペクトルおよび前記雑音信号のパワースペクトルからフィルタを求めるフィルタ生成部と、を備え、
前記目的予測係数コードブックと前記目的誤差分散コードブックとは、対応付けられているフィルタ推定装置。
請求項１に記載のフィルタ推定装置であって、
前記第１記憶部における前記目的予測係数コードブック中の各ベクトルは、モデル目的予測係数および第２モデル目的誤差分散からなることを特徴とするフィルタ推定装置。
請求項１または２に記載のフィルタ推定装置であって、
前記目的予測係数コードブックと前記目的誤差分散コードブックとが、１対１に対応付けられていることを特徴とするフィルタ推定装置。
入力信号をフレーム分割することで入力分割信号を求める分割部と、
前記入力分割信号を周波数領域に変換することで、周波数領域入力分割信号を求める周波数領域変換部と、
請求項１から３いずれかに記載のフィルタ推定装置と、
前記フィルタ推定装置で求められたフィルタを前記周波数領域入力分割信号に畳み込むことで周波数領域分割目的信号を求めるフィルタ演算部と、
前記周波数領域分割目的信号を時間領域に変換することで、時間領域分割目的信号を求める時間領域変換部と、
前記時間領域分割目的信号に窓関数をかける窓掛け処理部と、
前記窓関数がかけられた前記時間領域分割目的信号を重畳加算することで、目的信号を求める重畳加算部と、を備える信号強調装置。
フレーム分割により得られた入力分割信号に線形予測分析を行うことで、予測係数および誤差分散を求める過程と、
前記予測係数および前記誤差分散から入力分割信号パワースペクトルを求める過程と、
目的予測係数コードブック、目的誤差分散コードブック、雑音予測係数コードブック、雑音誤差分散コードブック、前記入力分割信号パワースペクトルを用いて、最適目的予測係数、最適目的誤差分散、最適雑音予測係数、最適雑音誤差分散、を求める過程と、
前記最適目的予測係数および前記最適目的誤差分散から目的信号のパワースペクトルを求める過程と、
前記最適雑音予測係数および前記最適雑音誤差分散から雑音信号のパワースペクトルを求める過程と、
前記目的信号のパワースペクトルおよび前記雑音信号のパワースペクトルからフィルタを求める過程と、を有し、
前記目的予測係数コードブックは、モデル目的予測係数からなるベクトルの集合であり、
前記雑音予測係数コードブックは、モデル雑音予測係数からなるベクトルの集合であり、
前記目的誤差分散コードブックは、第１モデル目的誤差分散からなるベクトルの集合であり、
前記雑音誤差分散コードブックモデルは、雑音誤差分散からなるベクトルの集合であり、
前記目的予測係数コードブックと前記目的誤差分散コードブックとは、対応付けられているフィルタ推定方法。
請求項５に記載のフィルタ推定方法であって、
前記目的予測係数コードブック中の各ベクトルは、モデル目的予測係数および第２モデル目的誤差分散からなることを特徴とするフィルタ推定方法。
請求項５または６に記載のフィルタ推定方法であって、
前記目的予測係数コードブックと前記目的誤差分散コードブックとが、１対１に対応付けられていることを特徴とするフィルタ推定方法。
入力信号をフレーム分割することで入力分割信号を求める過程と、
前記入力分割信号を周波数領域に変換することで、周波数領域入力分割信号を求める過程と、
請求項５から７いずれかに記載のフィルタ推定方法によりフィルタを推定する過程と、
前記フィルタ推定方法で求められたフィルタを前記周波数領域入力分割信号に畳み込むことで周波数領域分割目的信号を求める過程と、
前記周波数領域分割目的信号を時間領域に変換することで、時間領域分割目的信号を求める過程と、
前記時間領域分割目的信号に窓関数をかける過程と、
前記窓関数がかけられた前記時間領域分割目的信号を重畳加算することで、目的信号を求める過程と、を有する信号強調方法。
請求項１から３何れかに記載のフィルタ推定装置または、請求項４記載の信号強調装置としてコンピュータを動作させるプログラム。
請求項９記載のプログラムをコンピュータに実現させるために記録したコンピュータ読み取り可能な記録媒体。