JP2014164192A

JP2014164192A - 信号処理装置、方法及びプログラム

Info

Publication number: JP2014164192A
Application number: JP2013036366A
Authority: JP
Inventors: Katsuyuki Takahashi; 克之高橋
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2013-02-26
Filing date: 2013-02-26
Publication date: 2014-09-08

Abstract

【課題】反復ウィーナーフィルタ処理に従って雑音成分を抑圧しても、音質の自然さと、ミュージカルノイズを含む雑音の抑圧性能とがバランス良く実現できる信号処理装置を提供する。
【解決手段】信号処理装置１は、一対の入力音声信号に基づいて、第１及び第２の所定方位に死角を有する指向性特性を付与した第１及び第２の指向性信号を形成する指向性形成部１２，１３と、第１及び第２の指向性信号を用いてコヒーレンスを得るコヒーレンス計算部１４と、コヒーレンスに基づいて、ウィーナーフィルタ処理の反復回数を制御する反復回数制御部とを備える。
【選択図】図１

Description

本発明は、信号処理装置、方法及びプログラムに関し、例えば、電話機やテレビ会議装置やスマートフォンなどの音声信号（この明細書では、音声信号と音響信号の双方を含めて「音声信号」と呼んでいる）を扱う通信機や通信ソフトウェアに適用し得るものである。

取得した音声信号中に含まれる雑音成分を抑圧する手法の一つとして、ウィーナーフィルタ法が挙げられる。これは、特許文献１に記載されているように、雑音を含む音声信号のスペクトルから周波数ごとにＳＮ比を推定し、ＳＮ比に応じたゲインを入力信号スペクトルに付与することで雑音成分を抑圧する手法である（ウィーナーフィルタ係数の推定は、例えば、特許文献１の「数３」のように行う）。

ところで、ウィーナーフィルタ処理は雑音成分を抑圧する効果がある一方で、ミュージカルノイズという異音成分を発生させてしまうという課題がある。この課題への対策の一つが、非特許文献１に記載されているように、反復ウィーナーフィルタ法という手法である。これは、ウィーナーフィルタ処理後の信号から再びウィーナーフィルタ係数を推定して入力信号に付与する、という処理を数回繰り返すものである。反復ウィーナーフィルタ法は、反復することにより発生したミュージカルノイズをも含む雑音特性を推定し、雑音成分とともにミュージカルノイズも抑圧しようとしたものである。

特表２０１０−５３２８７９号公報

緒方伸哉、島村徹也著、「反復スペクトル引き算法によるミュージカルノイズの低減」、日本音響学会講演論文集、ｐｐ３８７−３８８、２００１年３月

しかし、反復ウィーナーフィルタ法は、反復を繰り返すたびに音声が歪み自然さが損なわれるという課題がある。また、ウィーナーフィルタ係数は過去の雑音特性の影響を反映しながら更新されていくので、処理開始直後は学習が不十分なために音質が悪い。一方、処理開始から十分な時間が経過すると、係数の学習も進むため高い音質改善効果が得られる。このように、処理開始直後か否かによって係数の推定精度も大きく変わる。

反復回数を少ない回数に固定した場合には、音声が歪み自然さが損なわれるという課題は生じないが、雑音特性の学習が不十分で雑音抑圧効果を十分に発揮できないという課題を生じる。逆に、反復回数を多い回数に固定した場合には、雑音特性の学習が十分で雑音抑圧効果を十分に発揮できるが、音声が歪み自然さが損なわれるという課題が生じる。そのため、最適な反復回数の設定が求められるが、非特許文献１にも記載されているように、反復回数の決定法について未だ有力な解法は見出されていない。

そのため、反復ウィーナーフィルタ法に従って雑音成分を抑圧しても、音質の自然さと、ミュージカルノイズを含む雑音の抑圧性能とがバランス良く実現できる信号処理装置、方法及びプログラムが望まれている。

第１の本発明は、入力音声信号に含まれている雑音成分を、反復ウィーナーフィルタ処理手段がウィーナーフィルタ処理を反復して繰り返すことによって抑圧して出力する信号処理装置において、（１）当該特徴量算出手段への入力音声信号から、その入力音声信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、（２）上記特徴量に基づいて、ウィーナーフィルタ処理の反復回数を制御する反復回数制御手段とを備えることを特徴とする。

第２の本発明は、入力音声信号に含まれている雑音成分を、反復ウィーナーフィルタ処理手段がウィーナーフィルタ処理を反復して繰り返すことによって抑圧して出力する信号処理方法において、特徴量算出手段が、当該特徴量算出手段への入力音声信号から、その入力音声信号における目的音声の含有量を示す特徴量を算出し、反復回数制御手段が、上記特徴量に基づいて、ウィーナーフィルタ処理の反復回数を制御することを特徴とする。

第３の本発明の信号処理プログラムは、一対の入力音声信号の一方に含まれている雑音成分をウィーナーフィルタ処理を反復して繰り返すことによって抑圧して出力する信号処理装置に搭載されたコンピュータを、（１）当該特徴量算出手段への入力音声信号から、その入力音声信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、（２）上記特徴量に基づいて、ウィーナーフィルタ処理の反復回数を制御する反復回数制御手段として機能させることを特徴とする。

本発明によれば、反復ウィーナーフィルタ処理に従って雑音成分を抑圧しても、音質の自然さと、ミュージカルノイズを含む雑音の抑圧性能とがバランス良く実現できる信号処理装置、方法及びプログラムを提供できる。

実施形態に係る信号処理装置の構成を示すブロック図である。実施形態における第１及び第２の指向性形成部からの指向性信号の性質を示す説明図である。実施形態における第１及び第２の指向性形成部による指向性の特性を示す説明図である。実施形態における反復ウィーナーフィルタ処理部の詳細構成を示すブロック図である。実施形態の反復ウィーナーフィルタ処理部における詳細動作を示すフローチャートである。

（Ａ）主たる実施形態
以下、本発明による信号処理装置、方法及びプログラムの一実施形態を、図面を参照しながら詳述する。

この実施形態の信号処理装置、方法及びプログラムは、ウィーナーフィルタ処理を反復して繰り返す反復回数を適応的に制御することを特徴としている。

（Ａ−１）実施形態に至った考え方（反復回数を適応的に制御する理由）
ところで、ウィーナーフィルタ係数は周波数ごとのＳＮ比であるので、広義には「音声の含有量」という意味を有すると言える。音声の含有量という意味を有する特徴量として、他にはコヒーレンスが挙げられる。

コヒーレンスの計算方法などについては後述するが、コヒーレンスは正面から到来する信号（目的とする音声）がどの程度入力信号中に含まれているのかを示す指標であり、コヒーレンスも、目的音声区間においてはウィーナーフィルタ係数と同様に「目的音声の含有量」を表す特徴量であるといえる。実際に、ＳＮ比とコヒーレンスは目的音声区間においては類似した挙動を有する。また、コヒーレンスは、原理的に、ウィーナーフィルタ係数のように過去の値の影響を強く受けるわけではないため、反復ウィーナーフィルタ処理の開始直後でも精度良く算出することができる。

そこで、この実施形態では、過去の値の影響を強く受ける、その時点の周波数成分ごとのウィーナーフィルタ係数を統計的に代表させた値と、コヒーレンスとの比較を通じて、反復ウィーナーフィルタ処理の学習が不十分な開始直後の期間が経過したか否かを判断し、反復ウィーナーフィルタ処理の学習が不十分な開始直後の期間が経過したと判断できたときに、反復ウィーナーフィルタ処理の反復を終了させることとした。

（Ａ−２）実施形態の構成
図１は、この実施形態に係る信号処理装置の構成を示すブロック図である。ここで、一対のマイクｍ１及びｍ２を除いた部分は、ハードウェアで構成することも可能であり、また、ＣＰＵが実行するソフトウェア（信号処理プログラム）とＣＰＵとで実現することも可能であるが、いずれの実現方法を採用した場合であっても、機能的には図１で表すことができる。

図１において、実施形態の信号処理装置１は、一対のマイクｍ１、ｍ２、ＦＦＴ部１１、第１の指向性形成部１２、第２の指向性形成部１３、コヒーレンス計算部１４、反復ウィーナーフィルタ処理部（図１では反復ＷＦ処理部と表記している）１５及びＩＦＦＴ部１６を有する。

一対のマイクｍ１、ｍ２は、所定距離（若しくは任意の距離）だけ離れて配置され、それぞれ、周囲の音声を捕捉するものである。各マイクｍ１、ｍ２で捕捉された音声信号（入力信号）は、図示しない対応するＡＤ変換器を介してデジタル信号ｓ１（ｎ）、ｓ２（ｎ）に変換されてＦＦＴ部１１に与えられる。なお、ｎはサンプルの入力順を表すインデックスであり、正の整数で表現される。本文中では、ｎが小さいほど古い入力サンプルであり、大きいほど新しい入力サンプルであるとする。

ＦＦＴ部１１は、マイクｍ１及びｍ２から入力信号系列ｓ１（ｎ）及びｓ２（ｎ）を受け取り、その入力信号ｓ１及びｓ２に高速フーリエ変換（あるいは離散フーリエ変換）を行うものである。これにより、入力信号ｓ１及びｓ２を周波数領域で表現することができる。なお、高速フーリエ変換を実施するにあたり、入力信号ｓ１（ｎ）及びｓ２（ｎ）から、所定のＮ個のサンプルからなる分析フレームＦＲＡＭＥ１（Ｋ）及びＦＲＡＭＥ２（Ｋ）を構成して適用する。入力信号ｓ１（ｎ）から分析フレームＦＲＡＭＥ１（Ｋ）を構成する例を以下の（１）式に示すが、分析フレームＦＲＡＭＥ２（Ｋ）も同様である。

なお、Ｋはフレームの順番を表すインデックスであり、正の整数で表現される。本文中では、Ｋが小さいほど古い分析フレームであり、大きいほど新しい分析フレームであるとする。また、以降の説明において、特に但し書きがない限りは、分析対象となる最新の分析フレームを表すインデックスはＫであるとする。

ＦＦＴ部１１は、分析フレームごとに高速フーリエ変換処理を施すことで、周波数領域信号Ｘ１（ｆ，Ｋ）、Ｘ２（ｆ，Ｋ）に変換し、得られた周波数領域信号Ｘ１（ｆ，Ｋ）及びＸ２（ｆ，Ｋ）をそれぞれ、第１の指向性形成部１２及び第２の指向性形成部１３に与えると共に、一方の周波数領域信号Ｘ１（ｆ，Ｋ）を反復ウィーナーフィルタ処理部１５に与える。なお、ｆは周波数を表すインデックスである。また、Ｘ１（ｆ，Ｋ）は単一の値ではなく、（２）式に示すように、複数の周波数ｆ１〜ｆｍのスペクトル成分から構成されるものである（但し、いずれかの周波数要素の一つを表す場合にも同様の表記を用いることもある）。さらに、Ｘ１（ｆ，Ｋ）は複素数であり、実部と虚部からなる。Ｘ２（ｆ，Ｋ）や後述するＢ１（ｆ，Ｋ）及びＢ２（ｆ，Ｋ）も同様である。

Ｘ１（ｆ，Ｋ）＝｛Ｘ１（ｆ１，Ｋ），Ｘ１（ｆ２，Ｋ），…，Ｘ１（ｆｍ，Ｋ）｝ …（２）
反復ウィーナーフィルタ処理部１５は、周波数領域信号Ｘ１（ｆ，Ｋ）に基づき、ウィーナーフィルタ処理を反復して繰り返し実行し、雑音成分が抑圧された信号Ｙ（ｆ，Ｋ）を得て、ＩＦＦＴ部１６に与えるものである。反復ウィーナーフィルタ処理部１５は、コヒーレンス計算部１４から与えられたコヒーレンスＣＯＨ（Ｋ）を利用した後述する反復終了条件が成立するかを確認しており、反復終了条件が成立したときにウィーナーフィルタ処理の反復を終了させて雑音成分が抑圧された信号Ｙ（ｆ，Ｋ）を出力する。

ＩＦＦＴ部１６は、雑音抑圧後信号Ｙ（ｆ，Ｋ）に対して、逆高速フーリエ変換を施して時間領域信号である出力信号ｙ（ｎ）を得るものである。

第１の指向性形成部１２、第２の指向性形成部１３及びコヒーレンス計算部１４は、反復ウィーナーフィルタ処理部１５が利用するコヒーレンスＣＯＨ（Ｋ）を得るための構成である。

第１の指向性形成部１２は、周波数領域信号Ｘ１（ｆ，Ｋ）及びＸ２（ｆ，Ｋ）から特定方向に指向性が強い信号Ｂ１（ｆ，Ｋ）を形成するものである。第２の指向性形成部１３は、周波数領域信号Ｘ１（ｆ，Ｋ）及びＸ２（ｆ，Ｋ）から特定方向（上述の特定方向とは異なる）に指向性が強い信号Ｂ２（ｆ，Ｋ）を形成するものである。特定方向に指向性が強い信号Ｂ１（ｆ，Ｋ）、Ｂ２（ｆ，Ｋ）の形成方法としては既存の方法を適用でき、例えば、（３）式を適用して右方向に指向性が強いＢ１（ｆ，Ｋ）や（４）式を適用して左方向に指向性が強いＢ２（ｆ，Ｋ）が形成できる。（３）式及び（４）式では、フレームインデックスＫは演算に関与しないので省略している。

これらの式の意味を、（３）式を例に、図２及び図３を用いて説明する。図２（Ａ）に示した方向θから音波が到来し、距離ｌだけ隔てて設置されている一対のマイクｍ１及びｍ２で捕捉されたとする。このとき、音波が一対のマイクｍ１及びｍ２に到達するまでには時間差が生じる。この到達時間差τは、音の経路差をｄとすると、ｄ＝ｌ×ｓｉｎθなので、音速をｃとすると（５）式で与えられる。

τ＝ｌ×ｓｉｎθ／ｃ …（５）
ところで、入力信号ｓ１（ｎ）にτだけ遅延を与えた信号ｓ１（ｔ−τ）は、入力信号ｓ２（ｔ）と同一の信号である。従って、両者の差をとった信号ｙｙ（ｎ）＝ｓ２（ｔ）−ｓ１（ｔ−τ）は、θ方向から到来した音が除去された信号となる。結果として、マイクロフォンアレーｍ１及びｍ２は図２（Ｂ）のような指向特性を持つようになる。

なお、以上では、時間領域での演算を記したが、周波数領域で行っても同様なことがいえる。この場合の式が、上述した（３）式及び（４）式である。今、一例として、到来方位θが±９０度であることを想定する。すなわち、第１の指向性形成部１２からの指向性信号Ｂ１（ｆ）は、図３（Ａ）に示すように右方向に強い指向性を有し、第２の指向性形成部１３からの指向性信号Ｂ２（ｆ）は、図３（Ｂ）に示すように左方向に強い指向性を有する。

コヒーレンス計算部１４は、以上のようにして得られた指向性信号Ｂ１（ｆ，Ｋ）、Ｂ２（ｆ，Ｋ）に対し、（６）式、（７）式に示す演算を施すことでコヒーレンスＣＯＨ（ｋ）を得るものである。（６）式におけるＢ２（ｆ）^＊はＢ２（ｆ）の共役複素数である。また、フレームインデックスＫは、（６）式、（７）式の演算には関与しないので、（６）式、（７）式ではフレームインデックスＫの記載を省略している。

図４は、反復ウィーナーフィルタ処理部１５の詳細構成を示すブロック図である。なお、ウィーナーフィルタ処理の反復を終了させる構成に特徴があり、その他の構成（ウィーナーフィルタ処理の実行構成や、それを反復させるための構成な）には既存のいかなる構成を適用しても良く、図４は一例として記載したものである。

図４において、反復ウィーナーフィルタ処理部１５は、入力信号・コヒーレンス受信部２１、参照信号・反復回数カウンタ初期化部２２、ＷＦ係数・平均ＷＦ係数計算部２３、平均ＷＦ係数比較・反復実施可否制御部２４、フィルタ処理部２５、反復回数カウンタ更新部２６、参照信号更新部２７及びフィルタ処理後信号送信部２８を有する。

反復ウィーナーフィルタ処理部１５においては、これらの各部２１〜２８が協働して動作することにより、後述する図５のフローチャートに示す処理を実行する。

入力信号・コヒーレンス受信部２１は、ＦＦＴ部１１から出力された周波数領域信号Ｘ１（ｆ，Ｋ）と、コヒーレンス計算部１４から出力されたコヒーレンスＣＯＨ（Ｋ）とを受け取るものである。

反復回数カウンタ・参照信号初期化部２２は、反復回数を表すカウンタ変数（以下、反復回数カウンタと呼ぶ）ｐと、各反復回数でのウィーナーフィルタ処理において入力信号となる参照信号ｒｅｆ（ｆ，Ｋ，ｐ）を初期化する。反復回数カウンタｐの初期化値は０であり、参照信号ｒｅｆ（ｆ，Ｋ，ｐ）の初期化値はＸ１（ｆ，Ｋ）である。

ＷＦ係数・平均ＷＦ係数計算部２３は、現反復回数の参照信号ｒｅｆ（ｆ，Ｋ，ｐ）に基づいて、周波数成分ごとのウィーナーフィルタ係数（ＷＦ係数）ｗｆ＿ｃｏｅｆ（ｆ，Ｋ，ｐ）を算出すると共に、さらに、周波数成分ごとのウィーナーフィルタ係数（ＷＦ係数）ｗｆ＿ｃｏｅｆ（ｆ，Ｋ，ｐ）の平均（以下、平均ウィーナーフィルタ係数と呼ぶ）ＡＶＥ＿ＷＦ＿ＣＯＥＦ（Ｋ，ｐ）を（８）式に従って算出するものである。ウィーナーフィルタ係数ｗｆ＿ｃｏｅｆ（ｆ，Ｋ，ｐ）の算出には、例えば、特許文献１に記載の算出式（特許文献１の「数３」若しくは「数４」参照）を適用する。

平均ＷＦ係数比較・反復実施可否制御部２４は、コヒーレンスＣＯＨ（Ｋ）と平均ウィーナーフィルタ係数ＡＶＥ＿ＷＦ＿ＣＯＥＦ（Ｋ，ｐ）とを比較し、平均ウィーナーフィルタ係数ＡＶＥ＿ＷＦ＿ＣＯＥＦ（Ｋ，ｐ）がコヒーレンスＣＯＨ（Ｋ）より小さいときにウィーナーフィルタ処理の反復を継続するように各部を制御し、平均ウィーナーフィルタ係数ＡＶＥ＿ＷＦ＿ＣＯＥＦ（Ｋ，ｐ）がコヒーレンスＣＯＨ（Ｋ）以上のときにウィーナーフィルタ処理の反復繰り返しを終了するように各部を制御するものである。

フィルタ処理部２５は、ウィーナーフィルタ処理の反復を継続する場合において、周波数成分ごとに、（９）式に示すように、入力された周波数領域信号Ｘ１（ｆ，Ｋ）にウィーナーフィルタ係数ｗｆ＿ｃｏｅｆ（ｆ，Ｋ，ｐ）を乗算してウィーナーフィルタ処理後信号ＷＦ＿ｏｕｔ（ｆ，Ｋ，ｐ）を得るものである。

ＷＦ＿ｏｕｔ（ｆ，Ｋ，ｐ）
＝Ｘ１（ｆ，Ｋ）×ｗｆ＿ｃｏｅｆ（ｆ，Ｋ，ｐ） …（９）
反復回数カウンタ更新部２６は、ウィーナーフィルタ処理の反復を継続する場合において、反復回数カウンタｐを１インクリメントするものである。

参照信号更新部２７は、ウィーナーフィルタ処理の反復を継続する場合において、（１０）式に示すように、直前の反復回数のウィーナーフィルタ処理後信号ＷＦ＿ｏｕｔ（ｆ，Ｋ，ｐ−１）を新たな反復回数における参照信号ｒｅｆ（ｆ，Ｋ，ｐ）とするものである。

ｒｅｆ（ｆ，Ｋ，ｐ）＝ＷＦ＿ｏｕｔ（ｆ，Ｋ，ｐ−１） …（１０）
フィルタ処理後信号送信部２８は、ウィーナーフィルタ処理の反復繰り返しを終了する場合に、その時点で得られているウィーナーフィルタ処理後信号ＷＦ＿ｏｕｔ（ｆ，Ｋ，ｐ）を、反復ウィーナーフィルタ処理後信号Ｙ（ｆ，Ｋ）としてＩＦＦＴ部１６に与えるものである。また、フィルタ処理後信号送信部２８は、フレームを規定する変数Ｋを１だけ増加させて次のフレームの処理を起動させるものである。

（Ａ−３）実施形態の動作
次に、実施形態の信号処理装置１の動作を、図面を参照しながら、全体動作、反復ウィーナーフィルタ処理部１５における詳細動作の順に説明する。

一対のマイクｍ１及びｍ２から入力された信号ｓ１（ｎ）、ｓ２（ｎ）はそれぞれ、ＦＦＴ部１１によって時間領域から周波数領域の信号Ｘ１（ｆ，Ｋ）、Ｘ２（ｆ，Ｋ）に変換された後、周波数領域信号Ｘ１（ｆ，Ｋ）は、第１の指向性形成部１２、第２の指向性形成部１３及び反復ウィーナーフィルタ処理部１５に与えられ、周波数領域信号Ｘ２（ｆ，Ｋ）は、第１の指向性形成部１２及び第２の指向性形成部１３に与えられる。

２つの周波数領域信号Ｘ１（ｆ，Ｋ）及びＸ２（ｆ，Ｋ）に基づき、第１及び第２の指向性形成部１２及び１３のそれぞれによって、所定の方位に死角を有する第１及び第２の指向性信号Ｂ１(ｆ，Ｋ)及びＢ２（ｆ，Ｋ）が生成される。そして、コヒーレンス計算部１４において、第１及び第２の指向性信号Ｂ１（ｆ，Ｋ）及びＢ２（ｆ，Ｋ）を適用して、（６）式及び（７）式の演算が実行され、コヒーレンスＣＯＨ（Ｋ）が算出され、反復ウィーナーフィルタ処理部１５に与えられる。

反復ウィーナーフィルタ処理部１５においては、周波数領域信号Ｘ１（ｆ，Ｋ）を当初の参照信号としたウィーナーフィルタ処理が、反復終了条件が成立するまで反復して繰り返し実行され、得られた反復ウィーナーフィルタ処理後信号Ｙ（ｆ，Ｋ）がＩＦＦＴ部１６に与えられる。

ＩＦＦＴ部１６においては、周波数領域信号である反復ウィーナーフィルタ処理後信号Ｙ（ｆ，Ｋ）が、逆高速フーリエ変換によって、時間領域信号ｙ（ｎ）に変換され、この時間領域信号ｙ（ｎ）が出力される。

次に、反復ウィーナーフィルタ処理部１５における詳細動作を、図５のフローチャートを参照しながら説明する。なお、図５は、あるフレームの処理を示しており、フレームごとに、図５に示す処理が繰り返される。

新たなフレームになり、新たなフレーム（現フレームＫ）の周波数領域信号Ｘ１（ｆ，Ｋ）がＦＦＴ部１１から与えられると、反復ウィーナーフィルタ処理部１５は、反復回数カウンタｐを０に、参照信号ｒｅｆ（ｆ，Ｋ，ｐ）を周波数領域信号Ｘ１（ｆ，Ｋ）に初期化する（ステップＳ１）。

次に、反復ウィーナーフィルタ処理部１５は、現反復回数の参照信号ｒｅｆ（ｆ，Ｋ，ｐ）に基づいて、周波数成分ごとのウィーナーフィルタ係数ｗｆ＿ｃｏｅｆ（ｆ，Ｋ，ｐ）を算出すると共に、さらに、算出された周波数成分ごとのウィーナーフィルタ係数ｗｆ＿ｃｏｅｆ（ｆ，Ｋ，ｐ）に基づいて、平均ウィーナーフィルタ係数ＡＶＥ＿ＷＦ＿ＣＯＥＦ（Ｋ，ｐ）を算出する（ステップＳ２）。

その後、反復ウィーナーフィルタ処理部１５は、平均ウィーナーフィルタ係数ＡＶＥ＿ＷＦ＿ＣＯＥＦ（Ｋ，ｐ）がコヒーレンス計算部１４から与えられたコヒーレンスＣＯＨ（Ｋ）より小さいか否かを判別する（ステップＳ３）。

反復ウィーナーフィルタ処理部１５は、平均ウィーナーフィルタ係数ＡＶＥ＿ＷＦ＿ＣＯＥＦ（Ｋ，ｐ）がコヒーレンスＣＯＨ（Ｋ）より小さい場合には、周波数成分ごとに、入力された周波数領域信号Ｘ１（ｆ，Ｋ）にウィーナーフィルタ係数ｗｆ＿ｃｏｅｆ（ｆ，Ｋ，ｐ）を乗算してウィーナーフィルタ処理後信号ＷＦ＿ｏｕｔ（ｆ，Ｋ，ｐ）を得（ステップＳ４）、反復回数カウンタｐを１インクリメントし（ステップＳ５）、さらに、直前の反復回数のウィーナーフィルタ処理後信号ＷＦ＿ｏｕｔ（ｆ，Ｋ，ｐ−１）を新たな反復回数における参照信号ｒｅｆ（ｆ，Ｋ，ｐ）として（ステップＳ６）、上述したステップＳ２の処理に移行する。

一方、反復ウィーナーフィルタ処理部１５は、平均ウィーナーフィルタ係数ＡＶＥ＿ＷＦ＿ＣＯＥＦ（Ｋ，ｐ）がコヒーレンスＣＯＨ（Ｋ）以上の場合には、その時点で得られているウィーナーフィルタ処理後信号ＷＦ＿ｏｕｔ（ｆ，Ｋ，ｐ）を、反復ウィーナーフィルタ処理後信号Ｙ（ｆ，Ｋ）としてＩＦＦＴ部１６に与え、また、フレームを規定する変数Ｋを１だけ増加させて次のフレームの処理を移行する（ステップＳ７）。

（Ａ−４）実施形態の効果
上記実施形態によれば、平均ウィーナーフィルタ係数がコヒーレンスに達するまで、ウィーナーフィルタ処理を反復して実行するようにしたので、音質と抑圧性能とをバランス良く実現することができる。

これにより、実施形態の信号処理装置を、テレビ会議システムや携帯電話やスマートフォンなどの通信装置に適用することで、通話音質の向上が期待できる。

（Ｂ）他の実施形態
上記実施形態では、反復処理の継続か終了かの判定には、全周波数成分について平均した値であるコヒーレンスＣＯＨ（Ｋ）や平均ウィーナーフィルタ係数ＡＶＥ＿ＷＦ＿ＣＯＥＦ（Ｋ，ｐ）を用いたものを示したが、比較に供する２種類のパラメータは、コヒーレンスＣＯＨ（Ｋ）や平均ウィーナーフィルタ係数ＡＶＥ＿ＷＦ＿ＣＯＥＦ（Ｋ，ｐ）に限定されるものではない。例えば、中央の周波数成分の値同士で比較して反復処理の継続か終了かの判定を行うようにしても良い。また例えば、全てではなく、一部の周波数成分の平均を比較して反復処理の継続か終了かの判定を行うようにしても良い。さらに、複数の周波数成分の代表値として、平均値以外の他の統計量（例えば中央値）を適用するようにしても良い。

上記実施形態では、コヒーレンスＣＯＨ（Ｋ）と平均ウィーナーフィルタ係数ＡＶＥ＿ＷＦ＿ＣＯＥＦ（Ｋ，ｐ）とを反復ごとに比較して、反復ごとに反復処理の継続か終了かの判定を行うものを示したが、反復処理の開始前に、コヒーレンスＣＯＨ（Ｋ）に応じて、反復回数を定めるようにしても良い。例えば、上記実施形態のようにして終了タイミングを定めた場合における、コヒーレンスＣＯＨ（Ｋ）の値と実反復回数との関係を、シミュレーション等によって多数得て、それらの関係を整理して、コヒーレンスの範囲と最大反復回数との関係式、若しくは、変換テーブルを予め作成しておき、コヒーレンスが算出されたときに、関係式若しくは変換テーブルを適用して反復回数（最大反復回数）を定め、その反復回数だけウィーナーフィルタ処理を反復するようにしても良い。

上記実施形態では、反復処理の継続か終了の判定に、コヒーレンスＣＯＨ（Ｋ）を用いたものを示したが、コヒーレンスＣＯＨ（Ｋ）に代えて、「入力音声信号における目的音声の含有量」という概念を持つ他の特徴量、例えば、入力信号の零交差回数や自己相関などを用いて、反復処理の継続か終了かの判定を行うようにしても良い。

上記実施形態において、周波数領域の信号で処理していた処理を、可能ならば時間領域の信号で処理するようにしても良い。

上記実施形態では、一対のマイクが捕捉した信号を直ちに処理する場合を示したが、本発明の処理対象の音声信号はこれに限定されるものではない。例えば、記録媒体から読み出した一対の音声信号を処理する場合にも、本発明を適用することができ、また、対向装置から送信されてきた一対の音声信号を処理する場合にも、本発明を適用することができる。このような変形実施形態の場合であれば、信号処理装置に入力される段階で、既に周波数領域の信号になっていても良い。

１…信号処理装置、ｍ１、ｍ２…マイク、１１…ＦＦＴ部、１２…第１の指向性形成部、１３…第２の指向性形成部、１４…コヒーレンス計算部、１５…反復ウィーナーフィルタ処理部、１６…ＩＦＦＴ部、２１…入力信号・コヒーレンス受信部、２２…参照信号・反復回数カウンタ初期化部、２３…ＷＦ係数・平均ＷＦ係数計算部、２４…平均ＷＦ係数比較・反復実施可否制御部、２５…フィルタ処理部、２６…反復回数カウンタ更新部、２７…参照信号更新部、２８…フィルタ処理後信号送信部。

Claims

入力音声信号に含まれている雑音成分を、反復ウィーナーフィルタ処理手段がウィーナーフィルタ処理を反復して繰り返すことによって抑圧して出力する信号処理装置において、
当該特徴量算出手段への入力音声信号から、その入力音声信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、
上記特徴量に基づいて、ウィーナーフィルタ処理の反復回数を制御する反復回数制御手段と
を備えることを特徴とする信号処理装置。
上記特徴量算出手段は、
当該第１の指向性形成部への一対の入力音声信号に基づいて、第１の所定方位に死角を有する指向性特性を付与した第１の指向性信号を形成する第１の指向性形成部と、
上記一対の入力音声信号に基づいて、上記第１の所定方位とは異なる第２の所定方位に死角を有する指向性特性を付与した第２の指向性信号を形成する第２の指向性形成部と、
上記第１及び第２の指向性信号を用いて、上記特徴量としてのコヒーレンスを得るコヒーレンス計算部とを備え、
上記一対の入力音声信号の一方が、雑音成分の抑圧対象の入力音声信号となっている
ことを特徴とする請求項１に記載の信号処理装置。
上記反復回数制御手段は、上記コヒーレンス計算部が計算したコヒーレンスと、周波数成分ごとのウィーナーフィルタ係数の平均値とを比較し、その比較結果に応じて、ウィーナーフィルタ処理の反復の継続又は終了を決定する
ことを特徴とする請求項２に記載の信号処理装置。
入力音声信号に含まれている雑音成分を、反復ウィーナーフィルタ処理手段がウィーナーフィルタ処理を反復して繰り返すことによって抑圧して出力する信号処理方法において、
特徴量算出手段が、当該特徴量算出手段への入力音声信号から、その入力音声信号における目的音声の含有量を示す特徴量を算出し、
反復回数制御手段が、上記特徴量に基づいて、ウィーナーフィルタ処理の反復回数を制御する
ことを特徴とする信号処理方法。
一対の入力音声信号の一方に含まれている雑音成分をウィーナーフィルタ処理を反復して繰り返すことによって抑圧して出力する信号処理装置に搭載されたコンピュータを、
当該特徴量算出手段への入力音声信号から、その入力音声信号における目的音声の含有量を示す特徴量を算出する特徴量算出手段と、
上記特徴量に基づいて、ウィーナーフィルタ処理の反復回数を制御する反復回数制御手段と
して機能させることを特徴とする信号処理プログラム。