JP2017049277A

JP2017049277A - 雑音抑圧装置、プログラム及び方法

Info

Publication number: JP2017049277A
Application number: JP2015169943A
Authority: JP
Inventors: 大藤枝; Masaru Fujieda
Original assignee: Oki Electric Industry Co Ltd
Current assignee: Oki Electric Industry Co Ltd
Priority date: 2015-08-31
Filing date: 2015-08-31
Publication date: 2017-03-09
Anticipated expiration: 2035-08-31
Also published as: JP6613728B2

Abstract

【課題】複数チャネルの入力信号について雑音抑圧処理を行う際の処理を効率的に行う装置、プログラム及び方法を提供する。【解決手段】雑音抑圧装置は、所定の単位時間ごとに複数チャネルから１つのチャネルを選択するチャネル選択手段２０１と、選択されたチャネルの入力スペクトルを用いて当該入力スペクトルに含まれる雑音成分を抑圧するための抑圧ゲインを算出する抑圧ゲイン算出手段２０２と、抑圧ゲインを用いて、複数チャネルの入力スペクトルのそれぞれについて雑音成分を抑圧する帯域別雑音抑圧手段１０２とを有する。【選択図】図２

Description

この発明は、雑音抑圧装置、プログラム及び方法に関し、例えば、共通の音響空間の異なった位置に配置された複数のマイクから入力された複数チャネルの入力信号の雑音抑圧に適用し得る。

自然環境において雑音はいたる所に存在するため、一般に実世界で音声を収録すると、観測信号には種々の発信元からの雑音が混入してしまう。それらの雑音は、人が聴くにしても音声の了解性を低下させる。また、音声認識装置や音像定位装置、音源分離装置等の音声処理装置に雑音を含む信号が入力されると、音声処理の性能（例えば音声認識率、音像の定位精度、音源分離音の音質）を低下させる。そのため、入力信号に混入した雑音成分（非目的音成分）を抑圧して音声成分（目的音成分）を強調する技術の需要は高く、これまでに様々な雑音抑圧方法（音声強調方法と呼ばれることもある）が開発されてきた。

ここで、本明細書で使用する用語を以下のように定義する。以下では、雑音抑圧装置に入力される信号を「入力信号」と呼び、当該入力信号を周波数解析した（周波数領域に変換した）ものを「入力スペクトル」と呼ぶものとする。また、以下では、入力スペクトルの各要素の絶対値をとったものを「入力振幅スペクトル」と呼び、入力スペクトルの各要素のパワー（例えば絶対値の２乗）を算出したものを「入力パワースペクトル」と呼ぶものとする。さらに、以下では、雑音抑圧装置によって雑音を抑圧されたスペクトルを「抑圧後スペクトル」と呼び、抑圧後スペクトルの各要素の絶対値をとったものを「抑圧後振幅スペクトル」と呼び、抑圧後スペクトルの各要素のパワーを算出したものを「抑圧後パワースペクトル」と呼ぶものとする。さらにまた、以下では、抑圧後スペクトルから復元された信号波形を「抑圧後信号」と呼ぶものとする。また、以下では、入力信号に含まれる雑音成分のスペクトルを、「雑音振幅スペクトル」と呼び、雑音振幅スペクトルの各要素のパワーを算出したものを「雑音パワースペクトル」と呼ぶものとする。

ところで、従来、音像定位や音源分離のような複数チャネルの入力信号を用いる多チャネル信号処理に対して、チャネルごとに雑音抑圧を行う方法には、二つの問題がある。第１の問題点は、独立に算出された抑圧ゲインを各チャネルに適用すると、チャネル間のパワーバランスが崩れ、多チャネル信号処理の性能が低下するという問題である。第２の問題点は、チャネルごとに抑圧ゲインを算出するため、チャネル数の増加に伴って処理量が増加するという問題である。

以上のような問題に対応するための従来技術として特許文献１の記載技術がある。特許文献１の記載技術では、複数チャネルの入力信号から１つの代表信号を生成し、該代表信号に基づいて算出された抑圧ゲインを各チャネルに共通に適用することで、上記の性能低下問題と処理量増加問題を解決しようとしている。特許文献１に記載された装置において、代表信号は、入力パワースペクトルの全チャネルの平均、重み付き加算、最大パワーの選択、最小パワーの選択によって生成される。特許文献１に記載された装置では、このようにして得られた代表信号に基づいて抑圧ゲインは算出される。特許文献１に記載された装置では、抑圧ゲインの算出は一度しか行われないため、チャネルごとに抑圧ゲインを算出するのに比べて処理量を削減できる。特許文献１に記載された装置では、得られた抑圧ゲインは、各チャネルに共通に適用されるので、チャネル間のパワーバランスは保たれる。

特許第５４３５２０４号公報

しかしながら、特許文献１に記載された装置では、代表信号を生成するための処理量が、チャネル数に応じてＯ（ｎ）の処理量オーダ（チャネル数に比例する量の処理）が必要である。例えば、チャネル数をＭ、入力パワースペクトルの要素数をＫとする。このとき、特許文献１に記載された装置を用いて、重み付き加算によって代表信号を得る場合、Ｍ＊Ｋ回の乗算が必要である。また、特許文献１に記載された装置において、最大パワーを選択することによって代表信号を得る場合、（Ｍ−１）＊Ｋ回の比較が必要である。

そのため、複数チャネルの入力信号について雑音抑圧処理を行う際の処理を効率的に行うことができる雑音抑圧装置、プログラム及び方法が望まれている。

第１の本発明は、複数チャネルの入力信号のそれぞれに対応する入力スペクトルから雑音を抑圧する雑音抑圧装置において、（１）所定の単位時間ごとに前記複数チャネルから１つのチャネルを選択するチャネル選択手段と、（２）選択されたチャネルの入力スペクトルを用いて当該入力スペクトルに含まれる雑音成分を抑圧するための抑圧ゲインを算出する抑圧ゲイン算出手段と、（３）前記抑圧ゲインを用いて、前記複数チャネルの入力スペクトルのそれぞれについて雑音成分を抑圧する雑音抑圧手段とを有すことを特徴とする。

第２の本発明の雑音抑圧プログラムは、複数チャネルの入力信号のそれぞれに対応する入力スペクトルから雑音を抑圧する雑音抑圧装置に搭載されたコンピュータを、（１）所定の単位時間ごとに前記複数チャネルから１つのチャネルを選択するチャネル選択手段と、（２）選択されたチャネルの入力スペクトルを用いて当該入力スペクトルに含まれる雑音成分を抑圧するための抑圧ゲインを算出する抑圧ゲイン算出手段と、（３）前記抑圧ゲインを用いて、前記複数チャネルの入力スペクトルのそれぞれについて雑音成分を抑圧する雑音抑圧手段として機能させることを特徴とする。

第３の本発明は、複数チャネルの入力信号のそれぞれに対応する入力スペクトルから雑音を抑圧する雑音抑圧方法において、（１）チャネル選択手段、抑圧ゲイン算出手段、及び雑音抑圧手段を備え、（２）前記チャネル選択手段は、所定の単位時間ごとに前記複数チャネルから１つのチャネルを選択し、（３）前記抑圧ゲイン算出手段は、選択されたチャネルの入力スペクトルを用いて当該入力スペクトルに含まれる雑音成分を抑圧するための抑圧ゲインを算出し、（４）前記雑音抑圧手段は、前記抑圧ゲインを用いて、前記複数チャネルの入力スペクトルのそれぞれについて雑音成分を抑圧することを特徴とする。

本発明によれば、複数チャネルの入力信号について雑音抑圧処理を行う際の処理を効率的に行う雑音抑圧装置を提供することができる。

第１の実施形態に係る雑音抑圧装置の機能的構成について示したブロック図である。第１の実施形態に係る帯域別抑圧手段の内部構成について示したブロック図である。第１の実施形態に係るチャネル選択手段の内部構成について示したブロック図である。第１の実施形態に係るチャネル決定手段の内部構成について示したブロック図である。第１の実施形態に係る抑圧ゲイン算出手段の内部構成について示したブロック図である。第２の実施形態に係るチャネル選択手段の内部構成について示したブロック図である。第２の実施形態に係るチャネル決定手段の内部構成について示したブロック図である。第３の実施形態に係るチャネル選択手段の内部構成について示したブロック図である。第３の実施形態に係るチャネル決定手段の内部構成について示したブロック図である。第３の実施形態に係る閾値セットのデータ構造について示した図である。第３の実施形態に係るチャネル決定手段の動作について示したフロー図である。

（Ａ）第１の実施形態
以下、本発明による雑音抑圧装置、プログラム及び方法の第１の実施形態を、図面を参照しながら詳述する。
（Ａ−１）第１の実施形態の構成
図１は、この実施形態の雑音抑圧装置１００の機能的構成を示すブロック図である。なお、図１において括弧内の符号は後述する第２及び第３の実施形態でのみ用いられる符号である。

雑音抑圧装置１００は、Ｍ個のチャネルの入力信号ｉｓ１〜ｉｓＭ（時間領域の信号）の入力を受付ける。以下では、入力信号ｉｓ１〜ｉｓＭには、それぞれチャネルを識別するためのチャネル識別子としてチャネル番号が付与されているものとする。例えば、入力信号ｉｓ１のチャネル番号は１、入力信号ｉｓ２のチャネル番号は２、…、入力信号ｉｓＭのチャネル番号はＭとなる。入力信号ｉｓ１〜ｉｓＭは、例えば、それぞれ異なる図示しないマイクで捕捉された音声信号（音響信号）である。入力信号ｉｓ１〜ｉｓＭに係る図示しないマイクは、例えば、同じ室内等の限られた範囲内に配置されているものとする。

そして、雑音抑圧装置１００は、雑音抑圧の処理後の出力として、入力信号ｉｓ１〜ｉｓのそれぞれに対応する抑圧後信号ｏｓ１〜ｏｓＭ（時間領域の信号）を出力する。なお、この実施形態では、雑音抑圧装置１００は時間領域の信号の入力を受付けて、時間領域の信号の出力を行うものとして説明するが、入出力する信号の形式は限定されないものであり、例えば、周波数領域（スペクトル）の信号入力や、周波数領域の信号出力を行う構成としてもよい。

雑音抑圧装置１００は、入力信号ｉｓ１〜ｉｓＭのそれぞれに対応する周波数解析手段１０１（１０１−１〜１０１−Ｍ）と、帯域別抑圧手段１０２と、抑圧後信号ｏｓ１〜ｏｓＭのそれぞれを出力する波形復元手段１０３（１０３−１〜１０３−Ｍ）とを有している。

雑音抑圧装置１００は、例えば、プロセッサ及びメモリを有するコンピュータ（プログラムの実施構成）にコンピュータプログラム（実施形態に係る雑音抑圧プログラム）をインストールすることにより構築してもよい。また、雑音抑圧装置１００は、一部又は全部をハードウェア（例えば、専用の半導体チップや電気回路等）を用いて実現するようにしてもよい。

周波数解析手段１０１−１〜１０１−Ｍは、それぞれ入力信号ｉｓ１〜ｉｓＭを時間領域の信号から周波数領域の信号に変換する処理を行う。以下では、入力信号ｉｓ１〜ｉｓＭを周波数領域に変換した信号（周波数解析手段１０１−１〜１０１−Ｍが出力する信号）を、それぞれ入力スペクトルＩＳ１〜ＩＳＭと表すものとする。例えば、周波数解析手段１０１−１は、入力信号ｉｓ１を周波数変換して入力スペクトルＩＳ１を生成して出力する。各周波数解析手段１０１が行う変換処理の具体的方法については限定されないものであるが、例えば高速フーリエ変換（ＦａｓｔＦｏｕｒｉｅｒＴｒａｎｓｆｏｒｍ：ＦＦＴ）やウェーブレット変換やフィルタパンク等を適用するようにしてもよい。この実施形態では、各周波数解析手段１０１は、ＦＦＴを用いた変換処理を行うものとして説明する。なお、以下では、各入力スペクトルＩＳ１〜ＩＳＭは、複素数で表されるデータであるものとして説明する。

帯域別抑圧手段１０２は、周波数領域に変換された入力スペクトルＩＳ１〜ＩＳＭについて、帯域別に雑音成分を抑圧する処理を行い、雑音成分抑圧後の信号（周波数領域の信号）として抑圧後スペクトルＯＳ１〜ＯＳＭを生成する。帯域別抑圧手段１０２は、抑圧後スペクトルＯＳ１〜ＯＳＭを、それぞれ波形復元手段１０３−１〜１０３−Ｍに供給する。帯域別抑圧手段１０２は、例えば、入力スペクトルＩＳ１について雑音抑圧する処理を行って抑圧後スペクトルＯＳ１を生成し、波形復元手段１０３−１に供給する。

波形復元手段１０３−１〜１０３−Ｍは、それぞれ帯域別抑圧手段１０２から供給された抑圧後スペクトルＯＳ１〜ＯＳＭを時間領域の信号に復元し、抑圧後信号ｏｓ１〜ｏｓＭとして出力する。例えば、波形復元手段１０３−１は、抑圧後スペクトルＯＳ１について時間領域に変換して、抑圧後信号ｏｓ１を出力する。各波形復元手段１０３は、周波数解析手段１０１−１〜１０１−Ｍと対を成す方法により各抑圧後スペクトルを時間領域の信号に変換する。例えば、周波数解析手段１０１−１〜１０１−ＭでＦＦＴを用いた周波数変換が行われている場合、波形復元手段１０３−１〜１０３−Ｍは、逆高速フーリエ変換（ＩｎｖｅｒｓｅＦＦＴ：ＩＦＦＴ）を用いて、各抑圧後スペクトルを時間領域の信号に復元する。

次に、帯域別抑圧手段１０２の内部構成について図２を用いて説明する。

図２は、帯域別抑圧手段１０２の内部構成について示したブロック図である。

図２に示すように、帯域別抑圧手段１０２は、チャネル選択手段２０１、抑圧ゲイン算出手段２０２、及び乗算手段２０３（２０３−１〜２０３−Ｍ）を有している。

帯域別抑圧手段１０２に供給された入力スペクトルＩＳ１〜ＩＳＭは、すべてチャネル選択手段２０１に供給されると共に、それぞれの乗算手段２０３−１〜２０３−Ｍにも供給される。例えば、入力スペクトルＩＳ１は、乗算手段２０３−１に供給されることになる。

チャネル選択手段２０１は、入力スペクトルＩＳ１〜ＩＳＭのうちいずれかを、所定の方式により選択して出力する処理を行う。以下では、チャネル選択手段２０１で選択された入力スペクトル（入力スペクトルＩＳ１〜ＩＳＭのうち選択されたもの）を選択入力スペクトルと呼ぶものとする。チャネル選択手段２０１は、選択入力スペクトルを、抑圧ゲイン算出手段２０２に供給する。

チャネル選択手段２０１は、所定の順序で選択入力スペクトルとするチャネル番号を切替える処理を行う。例えば、チャネル選択手段２０１は、１単位時間（例えば、抑圧ゲイン算出手段２０２の処理単位時間）ごとに、選択入力スペクトルとするチャネル番号を切替える。このとき、チャネル選択手段２０１がチャネル番号を切替える順序は限定されないものである。この実施形態では、チャネル選択手段２０１は、チャネル番号順に循環的にチャネル番号を選択（選択入力スペクトルとするチャネル番号を選択）するものとする。言い換えると、チャネル選択手段２０１は、チャネル番号順にラウンドロビンで選択入力スペクトルとするチャネル番号を選択するものとする。すなわち、この実施形態のチャネル選択手段２０１は、「１、２、…、Ｍ、１、２、…Ｍ、１、…」という順序で選択入力スペクトルとするチャネル番号を選択するものとする。

なお、チャネル選択手段２０１が、選択入力スペクトルとするチャネル番号を選択する順序のアルゴリズムについては限定されないものである。例えば、チャネル番号順に循環的に選択入力スペクトルとするチャネル番号を選択する例以外にも、後述する第２の実施形態のように予め設定された順序としたり、後述する第３の実施形態のように疑似乱数に基づく順序（ランダムな順序）で選択するようにしてもよい。

抑圧ゲイン算出手段２０２は、選択入力スペクトルに基づいて、雑音成分のスペクトルを推定して取得する。以下では、抑圧ゲイン算出手段２０２が推定した雑音スペクトルを「抑圧ゲイン」とも呼ぶものとする。抑圧ゲイン算出手段２０２が抑圧ゲインを算出する処理の詳細（詳細構成）については後述する。抑圧ゲイン算出手段２０２は、算出した抑圧ゲインを、それぞれの乗算手段２０３−１〜２０３−Ｍに供給する。

乗算手段２０３−１〜２０３−Ｍは、それぞれ入力スペクトルＩＳ１〜ＩＳＭに対して共通の抑圧ゲイン（抑圧ゲイン算出手段２０２から供給された抑圧ゲイン）を乗じる処理を行う。これにより、乗算手段２０３−１〜２０３−Ｍは、それぞれ入力スペクトルＩＳ１〜ＩＳＭに含まれる雑音成分を抑圧して抑圧後スペクトルＯＳ１〜ＯＳＭを得る。

そして、乗算手段２０３−１〜２０３−Ｍは、それぞれ抑圧後スペクトルＯＳ１〜ＯＳＭを出力する。例えば、乗算手段２０３−１は、入力スペクトルＩＳ１に抑圧ゲインを乗じて、抑圧後スペクトルＯＳ１を取得して出力する処理を行うことになる。なお、抑圧後スペクトルＯＳ１〜ＯＳＭは、それぞれ波形復元手段１０３−１〜１０３−Ｍに供給されることになる。すなわち、乗算手段２０３−１〜２０３−Ｍは、入力スペクトルＩＳ１〜ＩＳＭのそれぞれについて共通する抑圧ゲインを用いた雑音抑圧を行う雑音抑圧手段として機能することになる。

次に、チャネル選択手段２０１の内部構成について図３を用いて説明する。

図３は、チャネル選択手段２０１の内部構成について示したブロック図である。

図３に示すように、チャネル選択手段２０１は、フレーム計数手段３０１、チャネル決定手段３０２、チャネル記憶手段３０３、及び入力スペクトル選択手段３０４を有している。

フレーム計数手段３０１は、所定の単位時間（例えば、抑圧ゲイン算出手段２０２の処理単位時間）ごとに処理フレーム番号を１ずつインクリメントし、得られたフレーム番号をチャネル決定手段３０２に与える。

チャネル決定手段３０２は、与えられたフレーム番号と、チャネル記憶手段３０３から供給されたチャネル番号（１単位時間前のチャネル番号）とに基づいて、次のチャネル番号（次に、選択入力スペクトルとして選択するチャネル番号）を決定する。そして、チャネル決定手段３０２は、決定したチャネル番号を選択チャネル番号として入力スペクトル選択手段３０４に与える。チャネル決定手段３０２の詳細構成については後述する。

チャネル記憶手段３０３は、チャネル決定手段３０２から与えられたチャネル番号を記憶し、記憶していたチャネル番号を１単位時間後にチャネル決定手段３０２に与える。

入力スペクトル選択手段３０４は、チャネル決定手段３０２から与えられたチャネル番号に対応する入力スペクトルを選択入力スペクトルとして選択する。例えば、チャネル決定手段３０２から与えられたチャネル番号がｍだった場合、選択入力スペクトルはチャネルｍの入力スベクトル（入力スペクトルＩＳｍ）を選択入力スペクトルとして取り扱う。

次に、チャネル決定手段３０２の内部構成について、図４を用いて説明する。

図４は、チャネル決定手段３０２の内部構成について示したブロック図である。

図４に示すように、チャネル決定手段３０２は、チャネル計数手段４０１、定数１値供給手段４０２、及び初期チャネルスイッチ手段４０３を有している。

チャネル決定手段３０２に与えられたフレーム番号は初期チャネルスイッチ手段４０３に与えられる。また、チャネル決定手段３０２に与えられた１単位時間前のチャネル番号はチャネル計数手段４０１に与えられる。

チャネル計数手段４０１は、与えられた１単位時間前のチャネル番号を更新し、得られた暫定選択チャネル番号を初期チャネルスイッチ手段４０３に与える。チャネル計数手段４０１におけるチャネル番号の更新は、以下のように行われる。単位時間前のチャネル番号が１以上かつ（Ｍ−１）以下である場合には、チャネル計数手段４０１は、当該単位時間前のチャネル番号を１だけインクリメントした値を暫定選択チャネル番号とする。そして、チャネル計数手段４０１は、単位時間前のチャネル番号がＭである場合には、暫定選択チャネル番号を初期値の１とする。

定数１値供給手段４０２は、常に値「１」を初期チャネルスイッチ手段４０３に与える。値「１」は、チャネル番号の最初の値（初期値）である。なお、第１の実施形態では初期値を値「１」としたが、チャネル番号を表す１以上Ｍ以下の整数であればどの値を初期値として適用しても良い。

初期チャネルスイッチ手段４０３は、フレーム番号が初期フレーム番号であれば定数１値供給手段４０２から与えられた値「１」を選択チャネル番号とし、そうでなければチャネル計数手段から与えられた暫定選択チャネル番号を選択チャネル番号とする。初期フレーム番号は実装によって異なり、例えば０又は１とするようにしてもよい。また、初期動作を安定化させるために、初期チャネルスイッチ手段４０３は、フレーム番号が小さな整数値（例えば４）以下であるときに定数１値供給手段４０２から与えられた値「１」を選択チャネル番号としても良い。

次に、抑圧ゲイン算出手段２０２の内部構成について、図５を用いて説明する。

図５は、抑圧ゲイン算出手段２０２の内部構成について示したブロック図である。

この実施形態では、抑圧ゲイン算出手段２０２は、事後ＳＮＲに基づいて判定される音声区間に基づいて推定された雑音パワースペクトルを用い、更にＤｅｃｉｓｉｏｎ−Ｄｉｒｅｃｔｅｄ法によって推定した事前ＳＮＲに基づくウィナーフィルタ（ＷＦ）で抑圧ゲインを算出（推定）するものとして説明する。なお、抑圧ゲイン算出手段２０２において抑圧ゲインを算出（推定）する具体的な算出方法は限定されないものである。

例えば、抑圧ゲイン算出手段２０２は、雑音パワースペクトルの推定には重み付き雑音推定（参考文献１「ＩＥＩＣＥＴｒａｎｓ．ｏｎＦｕｎｄａｍ．，Ｖｏｌ．Ｅ８５−Ａ、Ｎｏ．７，ＰＰ．１７１０―１７１８，Ｊｕｌ．２００２」参照）や、ＭＡＰ推定に基づく方法（参考文献２「電子情報通信学会技術報告，Ｖｏｌ．１１３，Ｎｏ．５０３，ＥＡ２０１３−１２１，ＰＰ．７−１２，２０１４年３月」参照）等を用いた抑圧ゲインの算出(推定)処理を行うようにしてもよい、また、抑圧ゲイン算出手段２０２は、スペクトル減算法（参考文献３「ＩＥＥＥＴｒａｎｓ．，Ｖｏｌ．ＡＳＳＰ−２７，Ｎｏ．２，ｐｐ．１１３−１２０，Ａｐｒ．１９７９」）や、ＭＭＳＥＳＴＳＡ法（参考文献４「ＩＥＥＥＴｒａｎｓ．，Ｖｏｌ．ＡＳＳＰ−３２，Ｎｏ．６，ＰＰ．１１０９−１１２１，Ｄｅｃ．１９８４」）を用いた抑圧ゲインの算出（推定）処理を行うようにしてもよい。

図５に示すように、抑圧ゲイン算出手段２０２は、パワー算出手段５０１、雑音平滑化手段５０２、雑音記憶手段５０３、事後ＳＮＲ算出手段５０４、事後ＳＮＲ記憶手段５０５、閾値判定手段５０６、閾値供給手段５０７、事前ＳＮＲ推定手段５０８、抑圧ゲイン決定手段５０９、及び抑圧ゲイン記憶手段５１０を有している。

抑圧ゲイン算出手段２０２は、与えられた選択入力スペクトルをパワー算出手段５０１に与える。パワー算出手段５０１は、与えられた選択入力スペクトルの各要素の絶対値の２乗を要素ごとに計算し、得られた入力パワースペクトルを雑音平滑化手段５０２と事後ＳＮＲ算出手段に与える。

雑音平滑化手段５０２は、雑音記憶手段５０３から与えられる単位時間前の雑音パワースペクトルＮ’（ｋ）と閾値判定手段５０６から与えられる音声区間判定結果Ｖに基づいて以下の式（１）によって雑音パワーを推定し、得られた雑音パワースペクトルＮ（ｋ）を雑音記憶手段５０３と事後ＳＮＲ算出手段５０４に与える。以下の（１）式において、ｋ（ｋ＝０，．．．，Ｋ−１）は要素（周波数帯域）のインデックス、τは時定数、Ｘ（ｋ）は入力パワースペクトルを示している。また、以下の（１）式では、時定数τは０．８程度とすることが好適である。

雑音記憶手段５０３は、与えられた雑音パワースペクトルを記憶し、記憶していた雑音パワースペクトルを１単位時間後に雑音平滑化手段５０２に与える。

事後ＳＮＲ算出手段５０４は、要素ごとに与えられた入力パワースペクトルを与えられた雑音パワースペクトルで除し、得られた事後ＳＮＲを事後ＳＮＲ記憶手段５０５及び事前ＳＮＲ推定手段５０８に与える。

事後ＳＮＲ記憶手段５０５は、与えられた事後ＳＮＲを記憶し、記憶していた事後ＳＮＲを１単位時間後に閾値判定手段５０６及び事前ＳＮＲ推定手段５０８に与える。

閾値判定手段５０６は、事後ＳＮＲ記憶手段５０５から与えられた単位時間前の事後ＳＮＲが、閾値供給手段５０７から与えられた事後ＳＮＲの閾値（詳細については後述する）より大きければ音声区間判定結果ＶにＴｒｕｅ（真値）をセットし、そうでなければＶにＦａｌｓｅ（偽値）をセットする。そして、閾値判定手段５０６は、得られた音声区間判定結果Ｖを雑音平滑化手段５０２に与える。

閾値供給手段５０７は、事前に定められた事後ＳＮＲ閾値を閾値判定手段５０６に与える。事後ＳＮＲ閾値と比較される事後ＳＮＲは、１より大きければ入力パワーが雑音パワーより大きく、１より小さければ入力パワーが雑音パワーより小さいことを表しているが、入力パワーは単位時間ごとに細かく変化するのに対して雑音パワーはそれほど変化しない。そこで、入力パワーが雑音パワーより多少大きくても雑音平滑化手段５０２が雑音パワーを更新するようにするために、事後ＳＮＲ閾値には２．０程度の値とすることが好適である。

事前ＳＮＲ推定手段５０８は、与えられた事後ＳＮＲ、単位時間前の事後ＳＮＲ及び後述する単位時間前の抑圧ゲインに基づいて事前ＳＮＲを算出（推定）し、得られた事前ＳＮＲを抑圧ゲイン決定手段５０９に与える。事後ＳＮＲをγ（ｋ）、単位時間前の事後ＳＮＲをγ’（ｋ）、単位時間前の抑圧ゲインをＧ’（ｋ）、事前ＳＮＲをξ（ｋ）とすると、事前ＳＮＲの推定はＤｅｃｉｓｉｏｎ−Ｄｉｒｅｃｔｅｄ法と呼ばれる以下の（２）式によって行うことができる。以下の（２）式において、αは忘却係数であり、０．９９程度の値とすることが好適である。

抑圧ゲイン決定手段５０９は、事前ＳＮＲξ（ｋ）に基づいて以下の（３）式によって抑圧ゲインＧ（ｋ）を算出し、得られた抑圧ゲインを抑圧ゲイン記憶手段５１０に与える。当該抑圧ゲインは抑圧ゲイン算出手段２０２の出力として出力される。

抑圧ゲイン記憶手段５１０は、与えられた抑圧ゲインＧ（ｋ）を記憶し、記憶した抑圧ゲインを１単位時間後に事前ＳＮＲ推定手段５０８に与える。

（Ａ−２）第１の実施形態の動作
次に、以上のような構成を有する第１の実施形態の雑音抑圧装置１００の動作（この実施形態の雑音抑圧方法）について図１〜図４を用いて説明する。

周波数解析手段１０１−１〜１０１−Ｍは、それぞれ入力信号ｉｓ１〜ｉｓＭを時間領域の信号から周波数領域の信号に変換する処理を行う。

そして、帯域別抑圧手段１０２は、周波数領域に変換された入力スペクトルＩＳ１〜ＩＳＭについて、帯域別に雑音成分抑圧の処理を行い、雑音成分抑圧後の信号（周波数領域の信号）として抑圧後スペクトルＯＳ１〜ＯＳＭを生成する。

帯域別抑圧手段１０２では、チャネル選択手段２０１により、チャネル番号順に循環的に選択入力スペクトルに適用するチャネル番号が選択される。そして、抑圧ゲイン算出手段２０２では、チャネル選択手段２０１により選択された選択入力スペクトルに基づいて抑圧ゲインが生成される。そして、帯域別抑圧手段１０２では、乗算手段２０３−１〜２０３−Ｍにより、入力スペクトルＩＳ１〜ＩＳＭに対して共通の抑圧ゲイン（抑圧ゲイン算出手段２０２から供給された抑圧ゲイン）を乗じる処理が行われる。これにより、乗算手段２０３−１〜２０３−Ｍは、それぞれ入力スペクトルＩＳ１〜ＩＳＭに含まれる雑音成分を抑圧して抑圧後スペクトルＯＳ１〜ＯＳＭを出力する。

そして、波形復元手段１０３−１〜１０３−Ｍは、それぞれ帯域別抑圧手段１０２から供給された抑圧後スペクトルＯＳ１〜ＯＳＭを時間領域の信号に変換し、抑圧後信号ｏｓ１〜ｏｓＭとして出力する。

（Ａ−３）第１の実施形態の効果
第１の実施形態によれば、以下のような効果を奏することができる。

第１の実施形態の雑音抑圧装置１００では、入力信号のチャネル数が増えた場合でも、チャネル選択手段２０１で、選択入力スペクトルに適用するチャネル番号の選択処理の量は一定となる。したがって、第１の実施形態の雑音抑圧装置１００では、入力信号のチャネル数が増えた場合でも、チャネル数に応じてＯ（ｎ）のオーダとはならず、従来よりも少ない処理量で雑音抑制を行うことができる。

また、第１の実施形態の雑音抑圧装置１００では、任意の選択方法（例えば、チャネル番号順に循環的に選択する方法）で選択入力スペクトルを切替えながら抑圧ゲインを生成することで、実質的に複数チャネルの入力パワースペクトルを平均的に反映した抑圧ゲインを生成して雑音抑圧を行うことが可能となる。

以下に、雑音抑圧装置１００において、任意の選択方法（例えば、チャネル番号順に循環的に選択する方法）で選択入力スペクトルを切替えながら抑圧ゲインを生成する場合でも、雑音抑圧性能の維持が可能となることの数学的な裏付けについて説明する。

チャネル選択手段２０１において、選択入力スペクトルに適用するチャネル番号を選択する際の選択方法としては、例えば、以下の３つの選択方法が挙げられる。

第１の選択方法は、チャネル選択手段２０１が、抑圧ゲイン算出手段２０２が抑圧ゲイン算出を実行する単位時間ごとに、チャネル番号順に循環的にチャネル番号を選択する方法（上述の第１の実施形態と同様の選択方法）である。第１の選択方法では、チャネル選択手段２０１は、上述の第１の実施形態と同様に、例えば、チャネル１、チャネル２、・・・と選択していき、最後のチャネルＭが選択された次の単位時間後は再びチャネル１を選択する。

第２の選択方法は、チャネル選択手段２０１が、抑圧ゲイン算出手段２０２が抑圧ゲイン算出を実行する単位時間ごとに、予め定められた順序（例えば、予め設定されたリストに基づく順序）で、チャネル番号を選択する方法（後述する第２の実施形態と同様の選択方法）である。

第３の選択方法は、チャネル選択手段２０１が、疑似乱数に基づく順序（ランダムな順序）でチャネル番号を選択する方法（後述する第３の実施形態と同様の選択方法）である。具体的には、チャネル選択手段２０１は、疑似乱数を発生させて、事前に定めておいたチャネル数より１つだけ少ない個数の閾値と該疑似乱数とを比較し、当該疑似乱数を下回る閾値の数に対応するチャネル番号を選択するようにしてもよい。

チャネル選択手段２０１が、上述の第１〜第３の選択方法で、チャネル番号１〜Ｍ（Ｍ＝４）の選択を行った場合、その処理量オーダは、第１と第２の選択方法ではＯ（１）であり、第３の選択方法ではＯ（ｌｏｇ_２ｎ）あるから、雑音抑圧装置１００において抑圧ゲインを算出するための処理オーダもＯ（１）またはＯ（ｌｏｇ_２ｎ）となる。すなわち、この場合、雑音抑圧装置１００では入力信号のチャネル数に左右されない処理量での抑圧ゲイン算出を実現できる。

上述の第１の選択方法と第２の選択方法は、長期的（例えば、数秒以上）に見れば確率的にチャネルを選択しているのと同じであるから、上述の第３の選択方法の特別な場合と見なすことができる。そこで、以下では、上述の第３の選択方法の例を用いて、雑音抑圧装置１００において抑圧性能が維持できることの理由説明を行う。

抑圧ゲイン算出手段２０２で、抑圧ゲインを算出するためには、先に雑音パワースペクトルを推定しなければいけない。入力信号が単一チャネルの場合、一般に、時刻ｔにおける雑音パワースペクトルのｋ番目の要素（「ｋ番目の帯域」と同義）Ｎ（ｋ，ｔ）は、入力パワースペクトルの要素Ｘ（ｋ，ｔ）と雑音重み係数Ｗ（ｋ，ｔ）の積の期待値として、以下の（４）式によって推定される。以下の（４）式において、演算子Ｅ，｛｝は時刻ｔに関する期待値を意味している。

また、以下の（４）式において、雑音重み係数Ｗ（ｋ，ｔ）は、入力パワースペクトルの要素が完全に雑音なら０とし、多分に音声を含むなら１とするものとする。なお、以下の（４）式において、音声区間を検出して雑音重み係数を０又は１の離散値としても良いし、音声区聞か雑音区間か暖昧な場合には雑音重み係数を０以上１以下の実数値としても良い。
Ｎ（ｋ，ｔ）＝Ｅ_ｔ｛Ｗ（ｋ，ｔ）・Ｘ（ｋ，ｔ）｝ …（４）

そして、ここでは、複数チャネルから代表信号を生成し、該代表信号によって雑音パワースペクトルを推定する方法を定式化する。平均による代表信号の生成は重み付き加算の特別な場合であるから、ここでは、重み付き加算によって代表信号を生成する方法を適用するものとする。そして、チャネルｍの入力パワースペクトルＸ_ｍ（ｋ，ｔ）に対するチャネル重み係数をＣ_ｍとすると、雑音パワースペクトルの推定式は、以下の（５）式となる。ただし、Ｃ_ｍは以下の（６）を満たすものとする。

上述の（６）式が成り立つとすれば、チャネル重み係数Ｃ_ｍは確率分布と見なせる。そこで、ここでは、以下の（７）式を満たすようなチャネル選択因子Ｂ_ｍ（ｔ）を導入する。チャネル選択因子Ｂ_ｍ（ｔ）は、ある時刻ｔにおいて唯一つのチャネル番号のみが１となり、他のチャネル番号はすべて０となるが、１となるチャネルｍは確率分布Ｃ_ｍに従って無作為に選ばれるような因子であるものとする。このようなチャネル選択因子Ｂ_ｍ（ｔ）を導入するために、まず以下の（５）式の期待値と、チャネルに関する和の計算順序を交代して以下の（８）式のように変形する。そして、以下の（８）式の確率分布Ｃ_ｍをチャネル選択因子Ｂ_ｍ（ｔ）の期待値で書き直すと、以下の（９）式となる。チャネル選択因子Ｂ_ｍ（ｔ）は、入力パワースペクトルＸ_ｍ（ｋ，ｔ）と雑音重み係数Ｗ（ｋ，ｔ）とは独立なので、以下の（１０）式のように変形でき、最後に再び期待値とチャネルに関する和の計算順序を交代することで以下の（１１）式を得ることができる。

そうすると、上述の（５）式と以下の（１１）式の左辺が等しいので、チャネル選択因子Ｂ_ｍ（ｔ）を入力パワースペクトルＸ_ｍ（ｋ，ｔ）に乗じてチャネルに関する和を取ることは、入力パワースペクトルＸ_ｍ（ｋ，ｔ）から確率分布Ｃ_ｍに従って無作為に１つのチャネルを選択することを意味することが分かる。

従って、入力パワースペクトルＸ_ｍ（ｋ，ｔ）から確率分布Ｃ_ｍに従って無作為に１つのチャネルを選択して雑音パワースペクトルを推定することは、チャネル重み係数Ｃ_ｍに基づいた重み付き加算によって代表信号を生成して雑音パワースペクトルを推定することと同じであることが分かる。

以上のように、雑音抑圧装置１００において、上述の第１〜第３の選択方法のいずれかで選択入力スペクトルを切替えながら抑圧ゲインを生成する場合でも、雑音抑圧性能の維持が可能であることが、数学的にも裏付けられている。すなわち、雑音抑圧装置１００では、抑圧ゲインの算出するための処理量オーダがＯ（ｎ）未満に削減できることと、処理量が削減されても抑圧性能を維持できるといえる。

（Ｂ）第２の実施形態
以下、本発明による雑音抑圧装置、プログラム及び方法の第２の実施形態を、図面を参照しながら詳述する。

（Ｂ−１）第２の実施形態の構成及び動作
第２の実施形態の雑音抑圧装置１００Ａの全体構成についても上述の図１を用いて説明することができる。以下では、第２の実施形態について第１の実施形態との差異を説明する。

第１の実施形態の雑音抑圧装置１００では、上述の第１の選択方法（チャネル番号順に循環的にチャネル番号を選択する方法）で選択入力スペクトルに適用するチャネル番号を選択して抑圧ゲインを生成していた。これに対して、第２の実施形態の雑音抑圧装置１００Ａでは、上述の第２の選択方法（予め定められた順序でチャネル番号を選択する方法）で、択入力スペクトルＩＳＳに適用するチャネル番号を選択して抑圧ゲインを生成する。

図１、図２に示すように、雑音抑圧装置１００Ａでは、帯域別抑圧手段１０２（チャネル選択手段２０１）が帯域別抑圧手段１０２Ａ（チャネル選択手段２０１Ａ）に置き換えられている点で第１の実施形態と異なっている。

図６は、第２の実施形態に係るチャネル選択手段２０１Ａの内部構成について示したブロック図である。

図６に示すように、チャネル選択手段２０１Ａは、チャネル決定手段３０２がチャネル決定手段３０２Ａに置き換えられ、さらにチャネル記憶手段３０３が除外されている点で第１の実施形態と異なっている。

チャネル決定手段３０２Ａは、フレーム計数手段３０１から与えられたフレーム番号に基づいて、チャネル番号を決定し、得られたチャネル番号を選択チャネル番号として入力スペクトル選択手段３０４に与える。

図７は、第２の実施形態のチャネル決定手段３０２Ａの内部構成について示したブロック図である。

図７に示すように、チャネル決定手段３０２Ａは、チャネル順序供給手段６０１及びチャネル順序選択手段６０２を有している。

チャネル決定手段３０２Ａに与えられたフレーム番号はチャネル順序選択手段６０２に与えられる。

チャネル順序供給手段６０１は、予め設定されたチャネル番号の順序を記述したリスト（以下、「チャネル順序情報」と呼ぶ）を、チャネル順序選択手段６０２に与える。チャネル順序情報は、例えば、配列やベクトル、リスト等任意の形式ですることができるが、片方向循環リストによって定義するのが好適である。以下では、チャネル順序情報が片方向循環リストで定義されているものとする。また、チャネル順序情報の要素はチャネル番号１〜Ｍのいずれかに限定されるが、チャネル順序の要素数は任意である。ただし、チャネル順序情報に記述される要素数がＭ個未満の場合、一度も参照されないチャネルが生じてしまう。また、チャネル順序情報の要素数がちょうどＭ個の場合は、統計的には各チャネル番号の出現確率等は第１の実施形態と変わらない結果となる。したがって、チャネル順序情報に設定する要素数はＭ個より多く設定するのが好適である。例えばＭ＝４の場合、チャネル順序情報を｛２，２，２，３，３，１，４｝と定義すると、チャネル番号２が最も重要視され、次いでチャネル番号３が重要視され、チャネル番号１、４は参照するが重要視されない、という重み付けとなる。また例えば、チャネル順序情報として、上述の｛２，２，２，３，３，１，４｝の順序を変更して｛１，２，３，４，２，３，２｝と設定してもよい。

チャネル順序選択手段６０２は、フレーム番号に基づいてチャネル順序から１つのチャネルを選択して選択チャネル番号とする。チャネル順序選択手段６０２は、最初に選択するチャネル順序を初期チャネル順序として事前に定めておいて、フレーム番号が初期フレーム番号であれば該初期チャネル順序を選択チャネル番号とし、そうでなければ次のチャネル順序を選択チャネル番号とする。

フレーム計数手段３０１が供給する初期フレーム番号は実装によって異なるが、例えば０又は１とするようにしてもよい。

（Ｂ−２）第２の実施形態の効果
第２の実施形態によれば以下のような効果を奏することができる。

第２の実施形態の雑音抑圧装置１００Ａでは、第１の実施形態と同様に、入力信号のチャネル数が増えた場合でも、チャネル数に応じてＯ（ｎ）の処理量オーダとはならず、従来よりも少ない処理量で雑音抑制を行うことができる。

また、第２の実施形態の雑音抑圧装置１００Ａでは、チャネル順序情報のリストの記述内容で、チャネル番号ごとに出現確率の重み付けを行うことができる。例えば、第２の実施形態の雑音抑圧装置１００Ａでは、複数チャネルの入力パワースペクトルを、事前に定めた重要視する度合にしたがって評価しながら雑音を抑庄できる。例えば、雑音の音源の位置に最も近いマイクで捕捉された入力信号に係るチャネル番号の出現頻度が多くなるようにチャネル順序情報のリストを記述することで、より精度の高い抑圧ゲインを取得することができる。

（Ｃ）第３の実施形態
以下、本発明による雑音抑圧装置、プログラム及び方法の第３の実施形態を、図面を参照しながら詳述する。

（Ｃ−１）第３の実施形態の構成及び動作
第３の実施形態の雑音抑圧装置１００Ｂの全体構成についても上述の図１を用いて説明することができる。以下では、第３の実施形態について第３の実施形態との差異を説明する。

第１の実施形態の雑音抑圧装置１００では、上述の第１の選択方法（チャネル番号順に循環的にチャネル番号を選択する方法）で選択入力スペクトルに適用するチャネル番号を選択して抑圧ゲインを生成していた。これに対して、第３の実施形態の雑音抑圧装置１００では、上述の第３の選択方法（疑似乱数に基づく順序でチャネル番号を選択する方法）で、選択入力スペクトルに適用するチャネル番号を選択して抑圧ゲインを生成する。

図１、図２に示すように、雑音抑圧装置１００Ｂでは、帯域別抑圧手段１０２（チャネル選択手段２０１）が帯域別抑圧手段１０２Ｂ（チャネル選択手段２０１Ｂ）に置き換えられている点で第１の実施形態と異なっている。

図８は、第３の実施形態に係るチャネル選択手段２０１Ｂの内部構成について示したブロック図である。

図８に示すように、チャネル選択手段２０１Ｂは、チャネル決定手段３０２がチャネル決定手段３０２Ｂに置き換えられ、さらにフレーム計数手段３０１及びチャネル記憶手段３０３が省略されている点で第１の実施形態と異なっている。

チャネル決定手段３０２Ｂは、疑似乱数に基づいてチャネル番号を決定し、得られたチャネル番号を選択チャネル番号として入力スペクトル選択手段３０４に与える。

図９は、第３の実施形態のチャネル決定手段３０２Ｂの内部構成について示したブロック図である。

図９に示すように、チャネル決定手段３０２Ｂは、乱数生成手段７０１、閾値セット供給手段７０２、及び閾値判定手段７０３を有している。

乱数生成手段７０１は、疑似乱数ｒを生成して閾値判定手段７０３に与える。乱数生成手段７０１が、疑似乱数の生成に用いる方法は限定されないものであるが、例えば、処理量の少ない線形合同法を適用することが望ましい。また、乱数生成手段７０１において、処理量やリソースが問題とならないのであれば、例えば、より周期が長く規則性の少ないメルセンヌ・ツイスタを適用することが望ましい。

線形合同法の計算には整数値しか用いられないため、得られる素の疑似乱数は整数値（整数疑似乱数と呼ぶ）であるが、この実施形態の例では、乱数生成手段７０１は、整数疑似乱数を整数疑似乱数の最大値で除して０．０〜１．０の実数値に変換した疑似乱数ｒを出力するものとする。

閾値セット供給手段７０２は、チャネル数Ｍより１少ない（Ｍ−１）個の、０．０より大きく１．０より小さい実数値の集合を事前に定義して、定義された集合を閾値セットＲ_ｉ（ｉ＝１，…，Ｍ−１）として閾値判定手段７０３に与える。閾値セットの構成は、制限されるものではないが、配列を用いた平衡二分探索木とする（配列の要素がＲ_２ｉ＜Ｒ_ｉ＜…＜Ｒ_２ｉ＋１を満たすようにする）のが好適である（図１０）。図１０の「配列」は、添え字ｉの順に閾値が配列に格納されている様を示す。同じく「データ構造」は、閾値セットが平衡二分探索木の構造を持っている様を示す。同じく「値」は、（Ｍ−１）個の閾値が範囲０．０〜１．０の数直線上のどこに位置するかのイメージを示す。図１０では閾値が等間隔に位置しているが、閾値の値はこれに制限されるものではない。同じく「選択チャネル」は，数直線上の乱数の位置と、後述する閾値判定手段７０３によって選択される選択チャネル番号との関係を示す。

閾値判定手段７０３は、与えられた疑似乱数ｒと与えられた閾値セットＲ_ｉに基づいて定まるチャネル番号を、選択チャネル番号として設定する。選択チャネル番号ｍは、図１１に示したフローに従って選択される。図１１に従った閾値判定手段７０３の動作を説明する。はじめに、選択チャネル番号ｍにチャネル数Ｍを代入して初期化し（Ｓ１）、疑似乱数ｒに乱数生成手段７０１（図１１では関数ｒａｎｄ（）に相当）が生成した値（０．０〜１．０の実数値）を代入し（Ｓ２）、閾値セットの添え字ｉに１を代入して初期化する（Ｓ３）。疑似乱数ｒと閾値Ｒ_ｉとの比較を行い（Ｓ４）、ｒ＜Ｒ_ｉであれば選択チャネル番号ｍに添え字ｉを代入し（Ｓ５）、ｉを２倍して更新し（Ｓ６）、ｒ≧Ｒ_ｉであればｉを２倍して１を加えて更新する（Ｓ７）。そして、添え字ｉとチャネル数Ｍとの比較を行い（Ｓ８）、ｉ＜ＭであればＳ４〜Ｓ７を更新し、ｉ≧Ｍであれば処理を終了して選択チャネル番号ｍを確定する。以上の方法によれば、疑似乱数と閾値を比較する回数は、高々ｌｏｇ_２Ｍを切り上げた整数の回数、すなわち処理オーダＯ（ｌｏｇ_２ｎ）となり、特許文献１のＯ（ｎ）より少ない回数で実現できる。

したがって、第３の実施形態のチャネル決定手段３０２Ｂでは、閾値配列Ｒ_ｉの定め方（各チャネル番号に適用するレンジ）によって、どのチャネルをどの程度重要視するのか（各チャネル番号の出現率）を調整することができる。例えば、Ｒ_ｉ＝ｉ／Ｍとすれば、各チャネル番号の出現率は均等となり、各チャネル番号の出現率等は統計的には第１の実施形態と同じ結果となる。また、重要視するチャネル番号に対応するレンジを広く調整することで、第２の実施形態と同様に、統計的には重要視するチャネル番号の出現率を上げること等の調整が可能となる。

（Ｃ−２）第３の実施形態の効果
第３の実施形態によれば以下のような効果を奏することができる。

第３の実施形態の雑音抑圧装置１００Ｂでは、第１、第２の実施形態と同様に、入力信号のチャネル数が増えた場合でも、チャネル数に応じてＯ（ｎ）の処理量オーダとはならず、従来よりも少ない処理量で雑音抑制を行うことができる。第３の実施形態の雑音抑圧装置１００Ｂでは、単位時間ごとに、乱数の生成は一回、閾値判定は高々ｌｏｇ_２Ｍを切り上げた整数の回数しか実行されないため、処理量オーダは平衡二分探索木と同じＯ（ｌｏｇ_２ｎ）となる。

また、第３の実施形態では、チャネル決定手段３０２Ｂに設定する閾値配列Ｒ_ｉ（ｉ＝１，…，Ｍ−１）の内容を調整（各チャネル番号に対応するレンジを調整）することで、複数チャネルの入力パワースペクトルを事前に定めた自由度の高い重要視する度合にしたがって評価しながら雑音を抑制することができる。

第１の実施形態および第２の実施形態では、チャネルを選択する順序を一意的に定めていた。第１の実施形態では、複数チャネルを平均的に参照することしかできない。第２の実施形態では、各チャネルを重要視する度合を自由に設定するのが容易ではない。例えば、第２の実施形態において、チャネル数Ｍ＝２で、チャネル１を３０％、チャネル２を７０％重要視したい場合には、わずか２チャネルのために｛１，１，１，２，２，２，２，２，２，２｝等のような要素数が１０個以上のチャネル順序を用意しなければならない。しかしながら、第３の実施形態の雑音抑圧装置１００Ｂでは疑似乱数を発生させ、発生させた疑似乱数と事前に定めた閾値に基づいてチャネルを決定する。これにより、例えばチャネル数Ｍ＝２で重要視する度合を１３％と８７％にするというような、第２の実施形態では難しい設定も容易に実現できる。すなわち、第３の実施形態では、第２の実施形態の場合よりも各チャネル番号の出現率を容易に調整することができる。

（Ｄ）他の実施形態
本発明は、上記の各実施形態に限定されるものではなく、以下に例示するような変形実施形態も挙げることができる。

（Ｄ−１）第２及び第３の実施形態において、ユーザが、チャネル順序情報及び閾値配列Ｒ_ｉを変更（編集）可能とするようにしてもよい。

また、第２の実施形態において、重要視する度合をユーザが途中で変更可能とする場合、重要視する度合にしたがってチャネル順序を自動生成するチャネル順序自動生成手段を設けるようにしてもよい。このチャネル順序自動生成手段は、例えば、チャネル順序の最大要素数を事前に定めておいて、ユーザが指定した重要視する度合ができるだけ正しく反映されるようにチャネル順序を構成することが望ましい。

さらに、第３の実施形態において、重要視する度合をユーザが途中で変更可能とする場合、閾値配列供給手段の代わりにユーザの操作を受けて閾値配列を自動で調整する閾値配列生成手段を構成に含めることが望ましい。

（Ｄ−２）第２の実施形態及び第３の実施形態において、複数チャネルの入力パワースペクトルに応じて重要視する度合を自動で変更するチャネル重要度適応手段を構成に含めても良い。当該チャネル重要度適応手段は、例えば、各チャネルの音声パワー指標値が最大となるチャネルをより重要視するように、重要視する度合を変更する構成とするようにしてもよい。音声パワー指標値としては、例えば音声パワーの一定期間の最大値を適用することが望ましい。音声パワー指標値は、ある時刻においては選択チャネル番号のチャネルでのみ更新されるようにしてもよい。当該チャネル重要度適応手段は、例えば、１単位時間前における音声パワー指標値に忘却係数β（例えばβ＝０．９９）を乗じた値と、選択チャネル番号の入力パワースペクトルの最大要素とのうち大きい方を、新しい音声パワー指標値として更新するようにしてもよい。当該チャネル重要度適応手段は、例えば、１単位時間前における複数チャネルの音声パワー指標値のうち、最大の音声パワー指標値を記憶しておいて、選択チャネル番号の音声パワー指標値が当該最大の音声パワー指標値より大きければ該選択チャネル番号がより重要視されるように、重要視する度合を変更するようにしてもよい。このようにすることで、処理量オーダをＯ（ｌｏｇ_２ｎ）に保ちながら重要視する度合を変更することが可能となる。

１０１、１０１−１〜１０１−Ｍ…周波数解析手段、１０２…帯域別抑圧手段、１０３−１〜１０３−Ｍ…波形復元手段、２０１…チャネル選択手段、２０２…抑圧ゲイン算出手段、２０３−１〜２０３−Ｍ…乗算手段、３０１…フレーム計数手段、３０２…チャネル決定手段、３０３…チャネル記憶手段、３０４…入力スペクトル選択手段、４０１…チャネル計数手段、４０２…定数１値供給手段、４０３…初期チャネルスイッチ手段、５０１…パワー算出手段、５０２…雑音平滑化手段、５０３…雑音記憶手段、５０４…事後ＳＮＲ算出手段、５０５…事後ＳＮＲ記憶手段、５０６…閾値判定手段、５０７…閾値供給手段、５０８…事前ＳＮＲ推定手段、５０９…抑圧ゲイン決定手段、５１０…抑圧ゲイン記憶手段。

Claims

複数チャネルの入力信号のそれぞれに対応する入力スペクトルから雑音を抑圧する雑音抑圧装置において、
所定の単位時間ごとに前記複数チャネルから１つのチャネルを選択するチャネル選択手段と、
選択されたチャネルの入力スペクトルを用いて当該入力スペクトルに含まれる雑音成分を抑圧するための抑圧ゲインを算出する抑圧ゲイン算出手段と、
前記抑圧ゲインを用いて、前記複数チャネルの入力スペクトルのそれぞれについて雑音成分を抑圧する雑音抑圧手段と
を有すことを特徴とする雑音抑圧装置。
前記複数チャネルを構成するチャネルには、それぞれチャネル番号が付与されており、
前記チャネル選択手段は、前記複数チャネルからチャネル番号順に循環的にチャネル選択を行うことを特徴とする請求項１に記載の雑音抑圧装置。
前記チャネル選択手段は、前記複数チャネルからチャネルを選択する順序が記述されたチャネル順序情報に従った順序で、前記複数チャネルからいずれかのチャネルを選択することを特徴とする請求項１に記載の雑音抑圧装置。
疑似乱数を生成する疑似乱数生成手段をさらに備え、
前記チャネル選択手段は、前記疑似乱数生成手段で生成された疑似乱数に基づいて、前記複数チャネルから、いずれかのチャネルを選択することを特徴とする請求項１に記載の雑音抑圧装置。
前記複数チャネルのチャネル数より１少ない数の閾値で構成される閾値配列を保持する閾値配列手段をさらに備え、
前記チャネル選択手段は、前記疑似乱数生成手段で生成された疑似乱数と、前記閾値配列を構成する閾値との比較結果に基づいたチャネルを選択する
ことを特徴とする請求項４に記載の雑音抑圧装置。
複数チャネルの入力信号のそれぞれに対応する入力スペクトルから雑音を抑圧する雑音抑圧装置に搭載されたコンピュータを、
所定の単位時間ごとに前記複数チャネルから１つのチャネルを選択するチャネル選択手段と、
選択されたチャネルの入力スペクトルを用いて当該入力スペクトルに含まれる雑音成分を抑圧するための抑圧ゲインを算出する抑圧ゲイン算出手段と、
前記抑圧ゲインを用いて、前記複数チャネルの入力スペクトルのそれぞれについて雑音成分を抑圧する雑音抑圧手段と
して機能させることを特徴とする雑音抑圧プログラム。
複数チャネルの入力信号のそれぞれに対応する入力スペクトルから雑音を抑圧する雑音抑圧方法において、
チャネル選択手段、抑圧ゲイン算出手段、及び雑音抑圧手段を備え、
前記チャネル選択手段は、所定の単位時間ごとに前記複数チャネルから１つのチャネルを選択し、
前記抑圧ゲイン算出手段は、選択されたチャネルの入力スペクトルを用いて当該入力スペクトルに含まれる雑音成分を抑圧するための抑圧ゲインを算出し、
前記雑音抑圧手段は、前記抑圧ゲインを用いて、前記複数チャネルの入力スペクトルのそれぞれについて雑音成分を抑圧する
ことを特徴とする雑音抑圧方法。