JP2013250356A - 係数設定装置および雑音抑圧装置 - Google Patents
係数設定装置および雑音抑圧装置 Download PDFInfo
- Publication number
- JP2013250356A JP2013250356A JP2012123779A JP2012123779A JP2013250356A JP 2013250356 A JP2013250356 A JP 2013250356A JP 2012123779 A JP2012123779 A JP 2012123779A JP 2012123779 A JP2012123779 A JP 2012123779A JP 2013250356 A JP2013250356 A JP 2013250356A
- Authority
- JP
- Japan
- Prior art keywords
- coefficient
- kurtosis
- noise
- noise suppression
- forgetting factor
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Landscapes
- Soundproofing, Sound Blocking, And Sound Damping (AREA)
Abstract
【課題】ミュージカルノイズの発生を有効に抑制し得る雑音抑圧を実現する。
【解決手段】係数設定装置200は、音響信号Sx(t)の各周波数fの観測成分X(f,τ)に乗算されて音響信号Sx(t)の雑音成分を抑圧する処理係数G(f,τ)の算定にて事前SNRに適用に適用される忘却係数αを設定する。係数設定部76は、観測成分X(f,τ)の強度分布をガンマ分布で近似する確率密度関数P(x)の積分に一般化ガウス・ラゲール求積法を適用した演算式を利用して雑音成分の形状母数ηと忘却係数αとに応じたモーメントμmを算定する尖度指標算定処理により、雑音抑圧前後の尖度変化を示す尖度指標Kを算定し、尖度指標Kが目標値Ktarを下回るように忘却係数αを設定する。
【選択図】図1
【解決手段】係数設定装置200は、音響信号Sx(t)の各周波数fの観測成分X(f,τ)に乗算されて音響信号Sx(t)の雑音成分を抑圧する処理係数G(f,τ)の算定にて事前SNRに適用に適用される忘却係数αを設定する。係数設定部76は、観測成分X(f,τ)の強度分布をガンマ分布で近似する確率密度関数P(x)の積分に一般化ガウス・ラゲール求積法を適用した演算式を利用して雑音成分の形状母数ηと忘却係数αとに応じたモーメントμmを算定する尖度指標算定処理により、雑音抑圧前後の尖度変化を示す尖度指標Kを算定し、尖度指標Kが目標値Ktarを下回るように忘却係数αを設定する。
【選択図】図1
Description
本発明は、音響信号から雑音成分を抑圧する技術に関する。
周波数領域で音響信号から雑音成分を抑圧する技術が従来から提案されている。例えば非特許文献1には、音響信号から推定される雑音成分に応じて設定された処理係数(スペクトルゲイン)を音響信号の各周波数成分に乗算することで雑音成分を抑圧する技術(MMSE-STSA:Minimum Mean-Square Error Short-Time Spectral Amplitude estimator)が開示されている。処理係数は、事前SNRと事後SNRとに応じて算定される。事前SNRは、仮決定法(Decision-Directed法)を適用した演算式で忘却係数に応じて推定される。
Y. Ephraim, et al., "Speech Enhancement Using a Minimum Mean-Square Error Short-Time Spectral Amplitude Estimator", IEEE Trans. Acoust., Speech, Signal Processing, ASSP-32, 6, p.1109-1121, 1984
ところで、周波数領域の雑音抑圧技術では、雑音抑圧に起因して発生する耳障りなミュージカルノイズの発生が問題となる。非特許文献1の技術において処理係数の推定に適用される忘却係数は経験的または実験的に選定された数値であり、所望の雑音性能を維持しながら有効にミュージカルノイズを抑制するという観点からは必ずしも最適な数値ではない。以上の事情を考慮して、本発明は、ミュージカルノイズの発生を有効に抑制し得る雑音抑圧の実現を目的とする。
本発明の係数設定装置は、音響信号の各周波数の観測成分(例えばパワーや振幅)に乗算されて音響信号の雑音成分を抑圧する処理係数の算定にて事前SNRに適用される忘却係数を設定する装置であって、観測成分の強度分布をガンマ分布で近似する確率密度関数の積分に一般化ガウス・ラゲール求積法を適用した演算式(例えば数式(15))を利用して雑音成分の形状母数と忘却係数とに応じたモーメントを算定する尖度指標算定処理により、雑音抑圧前後の尖度変化を示す尖度指標を算定し、尖度指標が、目標値に対して尖度変化の抑制側の数値となる忘却係数を特定する係数設定手段を具備する。以上の構成によれば、観測成分の強度分布をガンマ分布で近似する確率密度関数の積分に一般化ガウス・ラゲール求積法を適用した演算式を利用して雑音成分の形状母数と忘却係数とに応じたモーメントを算定する尖度指標算定処理により、雑音抑圧前後の尖度変化を示す尖度指標が算定されるから、複合シンプソン法等の他の求積法を利用した場合と比較して、尖度指標の算定に必要な演算量を削減することが可能である。
なお、尖度指標が目標値に対して尖度変化の抑制側の数値となる場合とは、雑音抑圧前後で尖度変化が大きいほど尖度指標が大きい数値となる構成では、尖度指標が目標値を下回る場合を意味し、雑音抑圧前後で尖度変化が大きいほど尖度指標が小さい数値となる構成では、尖度指標が目標値を上回る場合を意味する。
本発明の好適な態様において、係数設定手段は、複数の形状母数の各々と尖度指標の複数の目標値の各々との組合せ毎に忘却係数を設定し、形状母数と尖度指標の目標値との各組合せに忘却係数を対応させた参照テーブルを生成する。以上の態様では、複数の形状母数の各々と尖度指標の複数の目標値の各々との組合せ毎に忘却係数が設定されるから、多様な形状母数や多様な目標値に対して適切な忘却係数を設定できるという利点がある。複数の形状母数の各々と複数の目標値の各々との組合せ毎に忘却係数を設定する構成では、多数の尖度指標を算定する必要があるから、尖度指標の算定に必要な演算量が削減される本発明は格別に有効である。
ところで、基本的には忘却係数が増加するほど尖度指標も増加するが、例えば忘却係数が最大値(1)に近い範囲では、忘却係数の増加に対して尖度指標が減少するという傾向が観測される。例えばMMSE-STSA法やMMSE-LSA法を適用して処理係数を算定する構成では以上の傾向が顕著である。そこで、本発明の好適な態様において、係数設定手段は、形状母数と尖度指標の目標値とのひとつの組合せについて、忘却係数の数値範囲のうち第1範囲内の忘却係数と、第1範囲とは相違する第2範囲内の忘却係数とを特定する。例えば第1範囲は、忘却係数に対して尖度指標が単調増加する範囲であり、第2範囲は、忘却係数に対して尖度指標が減少する範囲(忘却係数の最大値に近い範囲)である。以上の態様では、第1範囲内の忘却係数と第2範囲内の忘却係数とを選択的に処理係数の算定に利用することが可能である。
本発明の第1態様に係る雑音抑圧装置は、以上の各態様に係る係数設定装置が生成した参照テーブルを利用して雑音抑圧用の処理係数を算定する。すなわち、本発明の雑音抑圧装置は、音響信号の雑音成分の形状母数を推定する特性解析手段と、雑音抑圧前後の尖度変化を示す尖度指標の目標値を可変に設定する目標設定手段と、形状母数と尖度指標の目標値と忘却係数とを対応させる参照テーブルを参照して、特性解析手段が推定した形状母数と目標設定手段が設定した目標値とに対応する忘却係数を設定する第1設定手段と、第1設定手段が設定した忘却係数を事前SNRに適用して雑音成分の抑圧用の処理係数を算定する第2算定手段と、第2設定手段が算定した処理係数を音響信号の各周波数の観測成分に作用させる雑音抑圧手段とを具備し、参照テーブルは、観測成分の強度分布をガンマ分布で近似する確率密度関数の積分に一般化ガウス・ラゲール求積法を適用した演算式を利用して雑音成分の形状母数と忘却係数とに応じたモーメントを算定する尖度指標算定処理により算定される尖度指標が、目標値に対して尖度変化の抑制側の数値となるように、雑音成分の形状母数と尖度指標の目標値と忘却係数との関係を規定する。以上の構成によれば、参照テーブルの生成に必要な演算量が削減されるという利点がある。
第1態様に係る雑音抑圧装置の好適な態様において、参照テーブルは、忘却係数の数値範囲のうち第1範囲内の忘却係数が設定された第1参照テーブルと、第1範囲とは相違する第2範囲内の忘却係数が設定された第2参照テーブルとを含み、第1設定手段は、第1雑音抑圧モードでは第1参照テーブルを参照して忘却係数を設定し、第2雑音抑圧モードでは第2参照テーブルを参照して忘却係数を設定する。以上の態様では、第1範囲内の忘却係数と第2範囲内の忘却係数とを選択的に処理係数の算定に利用できるという利点がある。
本発明の第2態様に係る雑音抑圧装置は、音響信号の雑音成分の形状母数を推定する特性解析手段と、雑音抑圧前後の尖度変化を示す尖度指標の目標値を可変に設定する目標設定手段と、忘却係数を可変に設定する第1設定手段と、第1設定手段が設定した忘却係数を事前SNRに適用して雑音成分の抑圧用の処理係数を算定する第2算定手段と、第2設定手段が算定した処理係数を音響信号の各周波数の観測成分に作用させる雑音抑圧手段とを具備し、第1設定手段は、観測成分の強度分布をガンマ分布で近似する確率密度関数の積分に一般化ガウス・ラゲール求積法を適用した演算式を利用して雑音成分の形状母数と忘却係数とに応じたモーメントを算定する尖度指標算定処理により、雑音抑圧前後の尖度変化を示す尖度指標を算定し、尖度指標が、目標値に対して尖度変化の抑制側の数値となる忘却係数を設定する。以上の構成によれば、尖度指標の算定に必要な演算量を削減することが可能である。
前述の各態様に係る係数設定装置は、忘却係数の設定に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラム(ソフトウェア)との協働によっても実現される。本発明のプログラムは、音響信号の各周波数の観測成分に乗算されて音響信号の雑音成分を抑圧する処理係数の算定にて事前SNRに適用される忘却係数を設定するために、観測成分の強度分布をガンマ分布で近似する確率密度関数の積分に一般化ガウス・ラゲール求積法を適用した演算式を利用して雑音成分の形状母数と忘却係数とに応じたモーメントを算定する尖度指標算定処理により、雑音抑圧前後の尖度変化を示す尖度指標を算定し、尖度指標が、目標値に対して尖度変化の抑制側の数値となる忘却係数を特定する係数設定処理をコンピュータに実行させる。以上のプログラムによれば、本発明の係数設定装置と同様の作用および効果が実現される。
また、前述の各態様に係る雑音抑圧装置は、雑音成分の抑圧に専用されるDSPなどのハードウェア(電子回路)によって実現されるほか、CPUなどの汎用の演算処理装置とプログラム(ソフトウェア)との協働によっても実現される。本発明の第1態様に係るプログラムは、音響信号の雑音成分の形状母数を推定する特性解析処理と、雑音抑圧前後の尖度変化を示す尖度指標の目標値を可変に設定する目標設定処理と、形状母数と尖度指標の目標値と忘却係数とを対応させる参照テーブルを参照して、特性解析処理で推定した形状母数と目標設定処理で設定した目標値とに対応する忘却係数を設定する第1設定処理と、第1設定処理で設定した忘却係数を事前SNRに適用して雑音成分の抑圧用の処理係数を算定する第2算定処理と、第2設定処理で算定した処理係数を音響信号の各周波数の観測成分に作用させる雑音抑圧処理とをコンピュータに実行させる。以上のプログラムによれば、本発明の第1態様に係る雑音抑圧装置と同様の作用および効果が実現される。また、第2態様に係るプログラムは、音響信号の雑音成分の形状母数を推定する特性解析処理と、雑音抑圧前後の尖度変化を示す尖度指標の目標値を可変に設定する目標設定処理と、忘却係数を可変に設定する第1設定処理と、第1設定処理で設定した忘却係数を事前SNRに適用して雑音成分の抑圧用の処理係数を算定する第2算定処理と、第2設定処理で算定した処理係数を音響信号の各周波数の観測成分に作用させる雑音抑圧処理とをコンピュータに実行させるプログラムであって、第1設定処理では、観測成分の強度分布をガンマ分布で近似する確率密度関数の積分に一般化ガウス・ラゲール求積法を適用した演算式を利用して雑音成分の形状母数と忘却係数とに応じたモーメントを算定する尖度指標算定処理により、雑音抑圧前後の尖度変化を示す尖度指標を算定し、尖度指標が、目標値に対して尖度変化の抑制側の数値となる忘却係数を設定する。以上のプログラムによれば、本発明の第2態様に係る雑音抑圧装置と同様の作用および効果が実現される。
本発明の各態様に係るプログラムは、コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされるほか、通信網を介した配信の形態で提供されてコンピュータにインストールされる。
<第1実施形態>
図1は、本発明の第1実施形態に係る雑音抑圧装置100のブロック図である。雑音抑圧装置100には、信号供給装置12と入力装置14と放音装置16とが接続される。信号供給装置12は、音響信号Sx(t)を雑音抑圧装置100に供給する。音響信号Sx(t)は、目的音成分(例えば音声や楽音等の音響成分)と雑音成分(例えば空調設備の動作音や雑踏音等の環境音)との混合音の波形を示す時間領域の信号である(t:時間)。周囲の音響を収音して音響信号Sx(t)を生成する収音機器や、可搬型または内蔵型の記録媒体から音響信号Sx(t)を取得して雑音抑圧装置100に供給する再生装置や、通信網から音響信号Sx(t)を受信して雑音抑圧装置100に供給する通信装置が信号供給装置12として採用され得る。
図1は、本発明の第1実施形態に係る雑音抑圧装置100のブロック図である。雑音抑圧装置100には、信号供給装置12と入力装置14と放音装置16とが接続される。信号供給装置12は、音響信号Sx(t)を雑音抑圧装置100に供給する。音響信号Sx(t)は、目的音成分(例えば音声や楽音等の音響成分)と雑音成分(例えば空調設備の動作音や雑踏音等の環境音)との混合音の波形を示す時間領域の信号である(t:時間)。周囲の音響を収音して音響信号Sx(t)を生成する収音機器や、可搬型または内蔵型の記録媒体から音響信号Sx(t)を取得して雑音抑圧装置100に供給する再生装置や、通信網から音響信号Sx(t)を受信して雑音抑圧装置100に供給する通信装置が信号供給装置12として採用され得る。
雑音抑圧装置100は、信号供給装置12が供給する音響信号Sx(t)から音響信号Sy(t)を生成する信号処理装置(音響処理装置)である。音響信号Sy(t)は、音響信号Sx(t)の雑音成分を抑圧した音響(目的音成分を強調した音響)の波形を示す時間領域の信号である。放音装置16(例えばスピーカやヘッドホン)は、雑音抑圧装置100が生成した音響信号Sy(t)に応じた音波を放音する。なお、音響信号Sy(t)をデジタルからアナログに変換するD/A変換器の図示は便宜的に省略されている。入力装置14は、利用者からの指示を受付ける機器であり、例えば利用者が操作する複数の操作子を含んで構成される。
図1に示すように、雑音抑圧装置100は、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムPGM1や演算処理装置22が使用する各種のデータ(例えば参照テーブルTBL)を記憶する。半導体記録媒体や磁気記録媒体などの公知の記録媒体や複数種の記録媒体の組合せが記憶装置24として任意に採用され得る。音響信号Sx(t)を記憶装置24に記憶した構成(したがって信号供給装置12は省略される)も好適である。
演算処理装置22は、記憶装置24に格納されたプログラムPGM1を実行することで、音響信号Sx(t)から音響信号Sy(t)を生成するための複数の機能(周波数分析部32,解析処理部34,雑音抑圧部36,波形合成部38)を実現する。なお、演算処理装置22の各機能を複数の装置に分散した構成や、専用の電子回路(DSP)が一部の機能を実現する構成も採用され得る。
周波数分析部32は、周波数軸上の複数の周波数の各々に対応する音響信号Sx(t)の成分(以下「観測成分」という)X(f,τ)を時間軸上の単位区間(フレーム)毎に順次に生成する。記号fは周波数軸上の任意の周波数(周波数ビン)を意味し、記号τは時間軸上の任意の時点(単位区間)を意味する。第1実施形態の観測成分X(f,τ)は振幅で表現される。各観測成分(振幅スペクトル)X(f,τ)の算定には、短時間フーリエ変換等の公知の周波数分析が任意に採用される。
解析処理部34は、音響信号Sx(t)の雑音成分を抑圧するための各周波数fの処理係数G(f,τ)を単位区間毎に順次に算定する。処理係数G(f,τ)は、音響信号Sx(t)の観測成分X(f,τ)に対する利得(スペクトルゲイン)を意味し、雑音成分の特性に応じて0以上かつ1以下の範囲内で可変に設定される。具体的には、音響信号Sx(t)のうち雑音成分が優勢である周波数fの処理係数G(f,τ)ほど小さい数値に設定される。
雑音抑圧部36は、解析処理部34が算定した処理係数G(f,τ)を音響信号Sx(t)の観測成分X(f,τ)に作用させることで、雑音成分を抑圧した各周波数fの成分(以下「雑音抑圧成分」という)Y(f,τ)を単位区間毎に順次に生成する。具体的には、以下の数式(1)で表現される通り、雑音抑圧部36は、各単位区間の観測成分X(f,τ)とその単位区間の処理係数G(f,τ)とを乗算することで雑音抑圧成分(振幅スペクトル)Y(f,τ)を算定する。
波形合成部38は、雑音抑圧部36が単位区間毎に生成する雑音抑圧成分Y(f,τ)から時間領域の音響信号Sy(t)を生成する。具体的には、波形合成部38は、各単位区間の雑音抑圧成分Y(f,τ)を短時間逆フーリエ変換で時間領域に変換するとともに前後の単位区間について相互に連結することで音響信号Sy(t)を生成する。短時間逆フーリエ変換には例えば音響信号Sx(t)の位相スペクトルが適用される。波形合成部38が生成した音響信号Sy(t)が放音装置16に供給されて音波として放射される。
解析処理部34について以下に詳述する。図1に示すように、第1実施形態の解析処理部34は、雑音推定部42と特性解析部44と目標設定部46と第1設定部52と第2設定部54とを含んで構成される。
雑音推定部42は、音響信号Sx(t)に含まれると推定される雑音成分(以下「推定雑音成分」という)N(f,τ)を特定する。推定雑音成分N(f,τ)の推定には公知の技術が任意に採用され得る。例えば、雑音推定部42は、目的音成分が存在する目的音区間と目的音成分が存在しない雑音区間とに音響信号Sx(t)を時間軸上で区分し、雑音区間内の各単位区間の観測成分X(f,τ)を推定雑音成分N(f,τ)として特定する。したがって、推定雑音成分N(f,τ)は振幅(振幅スペクトル)で表現される。目的音区間と雑音区間との区分には公知の音声検出技術(VAD:Voice Activity Detection)が任意に採用される。
第2設定部54は、各周波数fの処理係数G(f,τ)を単位期間毎に順次に設定する。具体的には、第2設定部54は、観測成分X(f,τ)と推定雑音成分N(f,τ)とに応じた処理係数G(f,τ)を以下の数式(2)の演算で算定する。数式(2)から理解される通り、第1実施形態の処理係数G(f,τ)は、仮決定法(DD法:Decision-Directed)を適用したウィナー(Wiener)フィルタに相当する。
数式(2)の変数ξ(f,τ)は、仮決定法で推定される事前SNR(推定事前SNR)を意味し、以下の数式(3)で定義される。数式(3)の記号F[ ]は、括弧内の負数をゼロに設定するフロアリング関数を意味する。
数式(3)の記号γ(f,τ)は、事後SNR(推定事後SNR)を意味し、観測成分X(f,τ)と推定雑音成分N(f,τ)とを適用した以下の数式(4)で定義される。数式(4)の記号PN(f)は、雑音区間内の所定個の単位区間にわたる推定雑音成分N(f,τ)のパワー|N(f,τ)|2の平均値(例えば相加平均)を意味する。
数式(3)の記号αは、直前の単位区間における事後SNRγ(f,τ-1)の加重値に相当する忘却係数であり、1未満の正数(0<α<1)に設定される。以上の説明から理解されるように、第1実施形態の第2設定部54は、事前SNRξ(f,τ)および事後SNRγ(f,τ)に忘却係数αを適用(事後SNRγ(f,τ)についてはフロアリング関数F[γ(f,τ)−1]を介して適用)して処理係数G(f,τ)を算定する。
図1の特性解析部44は、推定雑音成分N(f,τ)の特性に応じた形状母数(shape parameter)ηを算定する。形状母数ηは、雑音区間内の複数の単位区間にわたる推定雑音成分N(f,τ)の度数分布(以下「強度分布」という)の形状に応じた統計量である。形状母数ηは、音響信号Sx(t)の雑音成分の特性に依存する。例えば、雑音成分のガウス性が高い(強度分布が正規分布に近い)ほど形状母数ηは大きい数値(1に近い数値)となる。
具体的には、特性解析部44は、各観測成分X(f,τ)(推定雑音成分N(f,τ))の強度分布を近似する確率密度関数P(x)の形状母数ηを算定する。第1実施形態の確率密度関数P(x)は、観測成分X(f,τ)のパワーを確率変数x(x=|X(f,τ)|2)として各観測成分X(f,τ)の強度分布をガンマ分布(一般化ガンマ分布)で近似する以下の数式(5)の分布関数である。
数式(5)の記号θは、尺度母数(scaling parameter)である。数式(5)の形状母数ηは、以下の数式(6A)および数式(6B)で定義される。特性解析部44は、雑音区間内の各観測成分X(f,τ)のパワー|X(f,τ)|2(推定雑音成分N(f,τ)のパワー|N(f,τ)|2)を確率変数xとして数式(6A)および数式(6B)の演算を実行することで形状母数ηを算定する。なお、最尤推定等の公知の方法で各観測成分X(f,τ)の形状母数ηを推定することも可能である。
ところで、雑音抑圧部36による処理後の雑音抑圧成分Y(f,τ)には、時間軸上および周波数軸上に高強度の成分(孤立点)が点在し、人工的で耳障りなミュージカルノイズとして受聴者に知覚される可能性がある。第1実施形態の目標設定部46は、雑音抑圧に起因したミュージカルノイズを抑制する度合の目標(雑音抑圧性能の目標)を可変に設定する。
雑音抑圧に起因したミュージカルノイズは非ガウス性の音響成分であるから、強度分布のガウス性の指標となる高次統計量がミュージカルノイズの発生量の定量的な指標として好適である。具体的には、強度分布(強度分布を近似する確率分布)の尖度(kurtosis)がミュージカルノイズの発生量の指標として利用され得る。雑音抑圧で強度分布の尖度が増加するほどミュージカルノイズが顕在化していると評価できる。
以上の傾向を考慮して、雑音抑圧前の観測成分X(f,τ)の強度分布の尖度κAと雑音抑圧後の雑音抑圧成分Y(f,τ)の強度分布の尖度κBとの相違の度合を示す指標(以下「尖度指標」という)Kを雑音抑圧性能の指標として利用する。第1実施形態の尖度指標Kは、以下の数式(7)で定義されるように、雑音抑圧前の尖度κAに対する雑音抑圧後の尖度κBの比(尖度比)である。
数式(7)から理解される通り、尖度指標Kが大きい(雑音抑圧後の尖度κBが雑音抑圧前の尖度κと比較して大きい)ほど雑音抑圧に起因したミュージカルノイズが多いと評価できる。図1の目標設定部46は、尖度指標Kの目標値Ktarを、入力装置14に対する利用者からの指示に応じて可変に設定する。
図1の第1設定部52は、第2設定部54が処理係数G(f,τ)の設定に適用する忘却係数α(数式(3))を、特性解析部44が算定した形状母数ηと目標設定部46が設定した尖度指標Kの目標値Ktarとに応じて設定する。忘却係数αの設定には、記憶装置24に事前に格納された参照テーブルTBLが利用される。
図2は、参照テーブルTBLの模式図である。図2に示すように、参照テーブルTBLは、形状母数ηの数値(η1,η2,……)と尖度指標Kの目標値Ktarの数値(Ktar1,Ktar2,……)との各組合せに忘却係数αの数値(α11,α12,……)を対応させたデータテーブルである。第1設定部52は、特性解析部44が算定した形状母数ηと目標設定部46が設定した目標値Ktarとに対応する忘却係数αを参照テーブルTBLから検索して第2設定部54に指示する。
参照テーブルTBL内の任意の形状母数ηと任意の目標値Ktarとに対応する忘却係数αは、その忘却係数αを適用して算定された処理係数G(f,τ)を、その形状母数ηの雑音成分を包含する音響信号Sx(t)に作用させた場合に、雑音抑圧前後の尖度指標Kがその目標値Ktarを下回るように事前に選定される。第2設定部54は、第1設定部52から指示された忘却係数αを適用した数式(2)から数式(4)の演算で処理係数G(f,τ)を算定する。以上の説明から理解されるように、目標値Ktarは尖度指標Kの許容値(雑音抑圧装置100の利用者がミュージカルノイズを許容する度合)を意味する。
<尖度指標の定式化>
以上に説明した参照テーブルTBLを作成する観点から、尖度指標Kの定式化を検討する。尖度指標Kの基礎となる尖度κは、強度分布の2次モーメントμ2と4次モーメントμ4とを適用した以下の数式(8)で定義される。
以上に説明した参照テーブルTBLを作成する観点から、尖度指標Kの定式化を検討する。尖度指標Kの基礎となる尖度κは、強度分布の2次モーメントμ2と4次モーメントμ4とを適用した以下の数式(8)で定義される。
m次モーメントμmは、以下の数式(9)で表現される。
数式(3)から理解される通り、現在(第τ番目)の単位区間の処理係数G(f,τ)に過去の単位区間の観測信号が累積的に反映されることを考慮して、数式(9)の記号y(xτ,……,xτ-T)は、第(τ−T)番目の単位区間から現在(第τ番目)の単位区間までの(T+1)個(Tは2以上の自然数)の単位区間のパワー{xτ,……,xτ-T}を加味した処理係数G(f,τ)による雑音抑圧後のパワーに相当する。数式(9)の関数P(x)は、観測成分X(f,τ)の強度分布(確率分布)をガンマ分布で近似する確率密度関数であり、前掲の数式(5)で表現される。
第1実施形態では、数式(9)のm次モーメントμmにおける確率密度関数P(x)の積分に一般化ガウス・ラゲール(Gauss-Laguerre)求積法を適用する。一般化ガウス・ラゲール求積法は、特定の代表点(分点)での関数値の加重和で定積分を近似する求積法であり、以下の数式(10)で表現される。
数式(10)の加重値wi (ρ)は、以下の数式(11)で定義される一般化ラゲール多項式Ln (ρ)(zi (ρ))がゼロとなる分点zi (ρ)に対応し、以下の数式(12)で表現される。分点zi (ρ)および加重値wi (ρ)の各数値は変数ρに対応する既定の数値であり、公知の数表から特定可能である。
いま、数式(5)の尺度母数θを便宜的に1と仮定すると、以下の数式(13)が導出される。
数式(13)の確率密度関数P(x)(一般化ガンマ分布)の形状母数ηと一般化ラゲール多項式の変数ρとを同視した場合に数式(10)の左辺と数式(13)の右辺とが相互に類似することに着目し、数式(13)の確率密度関数P(x)の積分に一般化ガウス・ラゲール求積法を適用すると、以下の数式(14)が導出される。
m次モーメントμmを表現する前掲の数式(9)に数式(14)の関係を適用すると、m次モーメントμmを近似する以下の数式(15)が導出される。数式(15)の記号iは、第τ番目の単位区間における確率変数xに対する分点の番号を意味する。
第τ番目の単位区間の確率変数xτに対応する各分点xτiは、雑音抑圧前のパワーを意味し、変数y(xτi,……,x(τ-T)i)は雑音抑圧後のパワーを意味する。したがって、処理係数G(τi)を分点xτiに作用させることで雑音抑圧後のパワーy(xτi,……,x(τ-T)i)が算定される(y(xτi,……,x(τ-T)i)=G(τi)2xτi)。
雑音成分のパワーは時刻毎に相互に独立であるが同種の確率分布に従う(独立同分布)と仮定すると、各単位区間{τ,……,τ-T}における雑音成分の強度分布は、形状母数ηが共通するガンマ分布に相当するから、(T+1)個の単位区間にわたり確率変数x(xτ,……,xτ-T)の分点{xτi,……,x(τ-T)i}は相互に共通する(xτi=x(τ-1)i=……=x(τ-T)i)。したがって、処理係数G(τi)の初期値を1として(T+1)個の単位区間の各々に対応する処理係数G(τi)を数式(2)の演算で順次に算定し、各処理係数G(τi)を分点xτiに作用させることで雑音抑圧後のパワーy(xτi,……,x(τ-T)i)が算定される。以上の説明から理解される通り、任意の形状母数ηと任意の忘却係数αとについて数式(15)の演算でm次モーメントμmを算定することが可能である。
雑音抑圧後の雑音抑圧成分Y(f,τ)の尖度κBは、数式(15)で算定される2次モーメントμ2と4次モーメントμ4とを数式(8)に適用することで形状母数ηと忘却係数αとに応じて算定される。他方、雑音抑圧前の観測成分X(f,τ)の強度分布の尖度κAは、処理係数G(τi)を1に設定(y(xτi,……,x(τ-T)i)=xτi)したときに数式(15)の演算で算定される2次モーメントμ2と4次モーメントμ4とを数式(8)に適用することで形状母数ηと忘却係数αとに応じて算定される。そして、以上の手順で算定された尖度κAと尖度κBとを数式(7)に適用することで尖度指標Kが算定される。すなわち、数式(15)のm次モーメントμmの算定を含む演算処理(以下「尖度指標算定処理」という)を実行することで、任意の形状母数ηと任意の忘却係数αとに対応する尖度指標Kを算定することが可能である。
数式(15)の各加重値wτi (η)の各数値は公知の数表から特定される定数である。また、数式(15)の係数Γ(η)は定数であり、ガンマ関数Γ( )の演算は不要である。以上のように数式(15)のm次モーメントμmの演算式では多数の係数が定数であるから、例えば複合シンプソン法やモンテカルロ法や台形公式等の求積法を採用した場合と比較して演算量が格段に低減されるという利点がある。
例えば、n1個の分点を規定した複合シンプソン法で数式(9)のm次モーメントμmを近似した場合にはn1次の近似精度が実現される。他方、一般化ガウス・ラゲール求積法でn2個の分点を規定した場合には(2×n2−1)次の近似精度が実現される。すなわち、一般化ガウス・ラゲール求積法によれば、複合シンプソン法の約半数の分点で同等の近似精度が実現される。例えば、過去の10個の単位区間を加味した場合、1個の尖度指標Kの算定に必要な時間は、複合シンプソン法では約2741秒(約45分)であるのに対し、第1実施形態の尖度指標算定処理では約0.54秒であり、両者間の演算量(所要時間)には非常に顕著な相違が確認された。
図3は、形状母数ηを相違させた複数の場合の各々について忘却係数αと尖度指標K(対数値)との関係を示すグラフである。図3の左側のグラフは、尖度指標算定処理で算定された尖度指標Kの理論値であり、図3の右側のグラフは、実験で観測された尖度指標Kの測定値である。第1実施形態の尖度指標算定処理で算定される尖度指標Kが実際の測定値に充分に近似することが図3から確認できる。また、図3から把握されるように、特定の形状母数ηのもとでは忘却係数αが大きいほど尖度指標Kが増加する(すなわちミュージカルノイズが顕在化する)という傾向がある。すなわち、雑音抑圧に起因したミュージカルノイズを低減する観点からは、忘却係数αは小さい数値であることが望ましい。
図4は、形状母数ηを相違させた複数の場合の各々について忘却係数αと雑音抑圧率Rとの関係を示すグラフである。雑音抑圧率Rは、雑音抑圧の度合を示す指標であり、雑音抑圧率Rが高いほど雑音抑圧性能が高いと評価できる。図4から理解されるように、特定の形状母数ηのもとでは忘却係数αに対して雑音抑圧率Rが単調増加するという傾向がある。すなわち、単純に雑音成分を抑圧するという観点からは、忘却係数αは大きい数値であることが望ましい。
図2に例示した参照テーブルTBLは、以上に説明した尖度指標算定処理の結果(尖度指標K)を利用して作成される。図5は、参照テーブルTBLを作成する係数設定装置200のブロック図である。係数設定装置200は、雑音抑圧装置100と同様に、演算処理装置72と記憶装置74とを具備するコンピュータシステムで実現される。記憶装置74は、演算処理装置72が実行するプログラムPGM2や演算処理装置72が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体などの公知の記録媒体や複数種の記録媒体の組合せが記憶装置74として任意に採用され得る。
演算処理装置72は、記憶装置74に格納されたプログラムPGM2を実行することで係数設定部76として機能する。係数設定部76は、雑音抑圧装置100で使用される参照テーブルTBLを生成する。すなわち、係数設定部76は、形状母数ηの各数値と尖度指標Kの目標値Ktarの各数値との組合せ毎に忘却係数αを設定する。なお、係数設定装置200の機能(係数設定部76)を雑音抑圧装置100に搭載することも可能である。
図6は、係数設定部76が参照テーブルTBLを生成する処理(係数設定処理)のフローチャートである。図6の処理を開始すると、係数設定部76は、形状母数ηを所定値(音響信号Sx(t)に想定される形状母数ηの数値)に設定し(S11)、忘却係数αを所定の候補値αCに設定する(S12)。そして、係数設定部76は、現段階の形状母数ηと忘却係数α(候補値αC)とを適用した尖度指標算定処理で尖度指標Kを算定する(S13)。
係数設定部76は、忘却係数αの全部の候補値αCについて尖度指標Kを算定したか否かを判定する(S14)。判定結果が否定である場合、係数設定部76は、忘却係数αを現段階とは別個の候補値αCに設定し(S12)、変更後の候補値αCを適用した尖度指標算定処理で尖度指標Kを算定する(S13)。すなわち、特定の形状母数ηと忘却係数αの複数の候補値αCの各々との組合せ毎に尖度指標Kが順次に算定される。
他方、忘却係数αの全部の候補値αCについて尖度指標Kを算定した場合(S14:YES)、係数設定部76は、尖度指標Kの目標値Ktarを所定値(雑音抑圧装置100に対して利用者が指定し得る数値)に設定する(S15)。係数設定部76は、複数の候補値αCのうち尖度指標Kが現段階の目標値Ktarを下回る範囲内で最大の候補値αCを、参照テーブルTBLのうち現段階の形状母数ηと現段階の目標値Ktarとに対応する忘却係数αとして選択して記憶装置74に格納する(S16)。図3および図4を参照して説明したように忘却係数αが大きいほど尖度指標Kおよび雑音抑圧率Rは増加するから、係数設定部76がステップS16で選択する候補値αCは、雑音抑圧に起因したミュージカルノイズの発生量を目標値Ktarに応じた度合に抑制するという条件のもとで雑音抑圧率Rを最大化する忘却係数αに相当する。以上に説明した通り、係数設定部76は、尖度指標Kが目標値Ktarを下回るように忘却係数αを設定する要素として機能する。
係数設定部76は、尖度指標Kの目標値Ktarの全部の数値についてステップS16の処理を実行したか否かを判定する(S17)。判定結果が否定である場合、係数設定部76は、目標値Ktarを現段階とは別個の数値に設定し(S15)、変更後の目標値Ktarに対応する忘却係数αを確定する(S16)。すなわち、尖度指標Kの目標値Ktarの数値毎に忘却係数αが設定される。
他方、目標値Ktarの全部の数値について忘却係数αを確定した場合(S17:YES)、係数設定部76は、形状母数ηの全部の数値についてステップS12からステップS17の処理を実行したか否かを判定する(S18)。判定結果が否定である場合、係数設定部76は、形状母数ηを現段階とは別個の数値に設定し(S11)、変更後の形状母数ηについて、忘却係数αの各候補値αCに対応する尖度指標Kの算定(S12〜S14)と、尖度指標Kの目標値Ktarの各数値に対応する忘却係数αの確定および記憶(S15〜S17)とを実行する。形状母数ηの全部の数値について処理を実行した場合(S18:YES)に図6の処理は終了する。したがって、形状母数ηの各数値(η1,η2,……)と尖度指標Kの目標値Ktarの各数値(Ktar1,Ktar2,……)との組合せ毎に忘却係数αを対応させた参照テーブルTBLが作成される。係数設定部76が生成した参照テーブルTBLが雑音抑圧装置100の記憶装置24に転送されて音響信号Sx(t)の雑音抑圧に利用される。
以上に説明した通り、第1実施形態では、観測成分X(f,τ)の強度分布をガンマ分布(一般化ガンマ分布)で近似する確率密度関数P(x)の積分に一般化ガウス・ラゲール求積法を適用して導出された数式(15)を含む尖度指標算定処理で尖度指標Kが算定されるから、複合シンプソン法等の他の求積法を利用した場合と比較して参照テーブルTBLの生成に必要な演算量を大幅に削減することが可能である。
<第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同等である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
本発明の第2実施形態を以下に説明する。なお、以下に例示する各形態において作用や機能が第1実施形態と同等である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
数式(16)の関数ν(f,τ)は、以下の数式(17)で定義される。
第1実施形態と同様に、事前SNRξ(f,τ)は仮決定法を適用した数式(3)で算定され、事後SNRγ(f,τ)は数式(4)で算定される。また、数式(16)の関数Iβ(φ)は、以下の数式(18)で定義されるβ次のベッセル関数である。
図7は、第2実施形態における忘却係数αと尖度指標K(対数値)との関係を示すグラフである。図7の左側のグラフは、数式(16)の処理係数G(f,τ)を適用した尖度指標算定処理で算定された理論値であり、図7の右側のグラフは実験で観測された実際の測定値である。処理係数G(f,τ)を数式(16)で算定した場合も、尖度指標算定処理で算定される尖度指標Kが実際の測定値に充分に近似することが図7から確認できる。
図7では、形状母数ηが1である場合の尖度指標Kの変化に応じて忘却係数αの数値範囲が範囲A1と範囲A2とに区分されている。範囲A1では、第1実施形態と同様に、忘却係数αが大きいほど尖度指標Kが増加する(ミュージカルノイズが顕在化する)という傾向がある。処理係数G(f,τ)としてウィナーフィルタを採用する第1実施形態では、忘却係数αの数値範囲の全域にわたり以上の傾向が観測されるが、処理係数G(f,τ)の算定にMMSE-STSA法を適用した第2実施形態では、忘却係数αが1に充分に近い範囲A2内において、忘却係数αの増加に対して尖度指標Kが減少する(すなわちミュージカルノイズが減少する)という傾向が観測される。範囲A2内で1に近い忘却係数αに対応する尖度指標Kは、範囲A1内の忘却係数αに対応する尖度指標Kを下回る。すなわち、忘却係数αを数値A1内の数値に設定した場合と比較してミュージカルノイズが低減される。
図8は、範囲A2内における忘却係数αと尖度指標Kとの関係を示すグラフである。なお、図8では、実験で観測された実測値を便宜的に図示した。図7および図8から把握できるように、尖度指標Kの変化が増加から減少に転換する忘却係数αの数値は形状母数ηに依存する。具体的には、形状母数ηが小さい(ガウス性が低い)ほど、尖度指標Kの変化が増加から減少に転換する忘却係数αの数値は増加するという傾向がある。すなわち、形状母数ηが小さいほど範囲A1と範囲A2との境界は1に近付く。
図9は、MMSE-STSA法を適用した処理係数G(f,τ)を雑音抑圧に利用した場合の忘却係数αと雑音抑圧率Rとの関係を示すグラフである。前述のように尖度指標Kは忘却係数αが範囲A2内で1に近いほど減少するが、図9から理解されるように、雑音抑圧率Rは、忘却係数αの数値範囲の全域にわたり忘却係数αに対して単調増加する。したがって、雑音抑圧性能の向上(雑音抑圧率Rの上昇および尖度指標Kの低下)という観点からすると、忘却係数αを範囲A2内で可能な限り大きい数値(ただし1未満)に設定することが望ましい。
図10は、忘却係数αとケプストラム歪Cとの関係を忘却係数αの範囲A2について図示したグラフである。図10では、第1実施形態(WF)と第2実施形態(MMSE−STSA法)と後述の第3実施形態(MMSE-LSA法)とが併記されている。ケプストラム歪Cは、雑音抑圧の前後にわたる信号波形の変化(波形歪)の度合を評価するための指標である。ケプストラム歪Cが大きいほど波形歪(音質の変化)が大きいと評価できる。図10から理解されるように、ケプストラム歪Cは忘却係数αに対して単調増加する。したがって、雑音抑圧に起因した波形歪の抑制という観点からすると、忘却係数αは小さい数値であることが望ましい。
以上の傾向を考慮して、第2実施形態の係数設定装置200は、忘却係数αが範囲A1内の数値に設定された第1参照テーブルTBL1と、忘却係数αが範囲A2内の数値に設定された第2参照テーブルTBL2とを生成する。すなわち、図6のステップS16において、係数設定部76は、忘却係数αの数値範囲を形状母数ηに応じて(すなわち形状母数ηが小さいほど範囲A1と範囲A2との境界が1に近付くように)範囲A1と範囲A2とに区分し、範囲A1および範囲A2の各々について忘却係数αを確定および記憶する。
具体的には、範囲A1内の複数の候補値αCのうち尖度指標Kが現段階の目標値Ktarを下回る候補値αCが第1参照テーブルTBL1の忘却係数αとして確定され、範囲A2内の複数の候補値αCのうち尖度指標Kが目標値Ktarを下回る候補値αCが第2参照テーブルTBL2の忘却係数αとして確定される。すなわち、第1参照テーブルTBL1内の忘却係数αは、波形歪を充分に抑制しながら雑音抑圧を実現し得る数値に設定され、第2参照テーブルTBL2内の忘却係数αは、ある程度の波形歪を許容しながら高度な雑音抑圧を実現し得る数値に設定される。なお、範囲A1および範囲A2の各忘却係数αの確定時には、雑音抑圧率Rおよびケプストラム歪Cも加味される。すなわち、雑音抑圧率Rの向上とケプストラム歪Cの低下とが高水準で平衡するように範囲A1および範囲A2の各々の忘却係数αが選定される。以上の処理が反復されることで第1参照テーブルTBL1と第2参照テーブルTBL2とが生成されて雑音抑圧装置100に転送される。
雑音抑圧装置100の利用者は、入力装置14を適宜に操作することで第1雑音抑圧モードと第2雑音抑圧モードとを選択することが可能である。第1雑音抑圧モードは、雑音抑圧性能の向上よりも波形歪の抑制を優先させる動作モードであり、第2雑音抑圧モードは、波形歪の抑制よりも雑音抑圧性能の向上を優先させる動作モード(ある程度の波形歪を許容する動作モード)である。第1設定部52は、第1雑音抑圧モードでは、記憶装置24内の第1参照テーブルTBL1から形状母数ηと目標値Ktarとに応じた忘却係数αを特定し、第2雑音抑圧モードでは、記憶装置24内の第2参照テーブルTBL2から形状母数ηと目標値Ktarとに応じた忘却係数αを特定する。
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、忘却係数αを範囲A2内で1に近い数値に設定することで、雑音抑圧率Rの上昇と尖度指標Kの低下(ミュージカルノイズの低減)とを有効に両立できるという利点もある。また、忘却係数αが範囲A1内の数値に設定された第1参照テーブルTBL1と忘却係数αが範囲A2内の数値に設定された第2参照テーブルTBL2とが生成され、波形歪の抑制を優先させる第1雑音抑圧モードと雑音抑圧精度の向上を優先させる第2雑音抑圧モードとが選択される。したがって、利用者の多様な要望に対応可能な雑音抑圧を実現することが可能である。
なお、忘却係数αを1に近付けることは、数式(15)の演算に加味される単位区間の個数を増加させる(処理係数G(f,τ)に反映させる時間的な範囲を拡張する)ことに相当する。単位区間の増加は演算量の増加に直結するから、範囲A1内で忘却係数αが1に近いほど尖度指標Kが低下する(ミュージカルノイズが低減される)とは言っても、実際の忘却係数αの数値は、係数設定装置200の演算処理装置72の演算能力のもとで現実的な演算時間で尖度指標算定処理を実行し得る範囲に制限される。
<第3実施形態>
本発明の第3実施形態の第2設定部54は、MMSE-LSA(MMSE - Log Spectral Amplitude estimator)法を適用した数式(19)の演算で処理係数G(f,τ)を算定する。
数式(19)の関数ν(f,τ)は前掲の数式(17)で定義される。第1実施形態や第2実施形態と同様に、事前SNRξ(f,τ)は仮決定法を適用した数式(3)で算定され、事後SNRγ(f,τ)は数式(4)で算定される。
本発明の第3実施形態の第2設定部54は、MMSE-LSA(MMSE - Log Spectral Amplitude estimator)法を適用した数式(19)の演算で処理係数G(f,τ)を算定する。
図11は、第3実施形態における忘却係数αと尖度指標K(対数値)との関係を示すグラフである。図11の左側のグラフは、数式(19)の処理係数G(f,τ)を適用した尖度指標算定処理で算定された理論値であり、図11の右側のグラフは実験で観測された実際の測定値である。処理係数G(f,τ)を数式(19)で算定した場合も、尖度指標算定処理で算定される尖度指標Kが実際の測定値に充分に近似することが図11から確認できる。また、MMSE-STSA法を適用した第2実施形態と同様に、忘却係数αの数値範囲は、忘却係数αに対して尖度指標Kが増加する範囲A1と、忘却係数αに対して尖度指標Kが減少する範囲A2とに区分され得る。したがって、雑音抑圧の動作モード(第1雑音抑圧モード/第2雑音抑圧モード)に応じて第1参照テーブルTBL1と第2参照テーブルTBL2とを選択的に利用する第2実施形態と同様の構成が第3実施形態でも採用され得る。
<変形例>
以上の各形態は多様に変形される。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
以上の各形態は多様に変形される。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
(1)前述の各形態では、雑音抑圧前の尖度κAに対する雑音抑圧後の尖度κBの比を尖度指標Kとして算定したが、尖度指標Kの算定方法は以上の例示に限定されない。例えば、尖度κAと尖度κBとの差分を尖度指標Kとして算定する構成や、尖度κAと尖度κBとを適用した所定の演算で尖度指標Kを算定する構成も採用され得る。また、雑音抑圧前後の尖度変化が大きいほど尖度指標Kが小さい数値となるように尖度指標Kを算定することも可能である。以上の例示から理解されるように、尖度指標Kは、雑音抑圧前後の尖度変化の指標として包括される。
(2)前述の各形態では、特性解析部44が特定した形状母数ηと目標設定部46が設定した目標値Ktarとに応じた忘却係数αを参照テーブルTBLから検索して処理係数G(f,τ)の算定に適用したが、参照テーブルTBLを参照して忘却係数αを特定する方法は以上の例示に限定されない。具体的には、参照テーブルTBL内の複数の忘却係数αの補間で所望の形状母数ηに応じた忘却係数αを算定することも可能である。例えば、特性解析部44が特定した形状母数ηを挟む各形状母数ηに対応する複数の忘却係数αを参照テーブルTBLから検索し、複数の忘却係数αを補間(例えば線形補間)することで、特性解析部44が特定した形状母数ηに対応する忘却係数αを算定する。以上の構成によれば、参照テーブルTBL内の忘却係数αの総数(参照テーブルTBLのデータ量)が削減されるという利点がある。
(3)前述の各形態では、形状母数ηの各数値と尖度指標Kの目標値Ktarの各数値とに忘却係数αを対応させた参照テーブルTBLを係数設定装置200にて事前に生成して雑音抑圧装置100に提供したが、雑音抑圧装置100の特性解析部44が算定した形状母数ηと目標設定部46が設定した目標値Ktarとに対応する忘却係数αを係数設定装置200が逐次的に算定して雑音抑圧装置100に通知する構成も採用され得る。例えば、通信網(例えばインターネット)を介して雑音抑圧装置100と通信可能な係数設定装置200(係数設定部76)が、雑音抑圧装置100から受信した形状母数ηと目標値Ktarとに対応する忘却係数αを図6のステップS12からステップS16の処理で設定して雑音抑圧装置100に送信する。雑音抑圧装置100の第2設定部54は、係数設定装置200から受信した忘却係数αに応じた処理係数G(f,τ)を単位区間毎に順次に算定する。前述の各形態によれば、尖度指標算定処理(さらには忘却係数αの設定)に必要な演算量が充分に削減されるから、以上の例示のように雑音抑圧装置100が逐次的に忘却係数αを算定する構成でも、雑音抑圧装置100が形状母数ηおよび目標値Ktarを送信してから忘却係数αを受信するまでの時間を充分に実用的な遅延量に低減することが可能である。
なお、以上の構成では、雑音抑圧装置100の特性解析部44が算定した形状母数ηを雑音抑圧装置100から係数設定装置200に送信する構成を例示したが、特性解析部44を係数設定装置200に設置する(雑音抑圧装置100からは省略する)ことも可能である。すなわち、例えば音響信号Sx(t)または観測成分X(f,τ)を雑音抑圧装置100から係数設定装置200に送信し、係数設定装置200にて音響信号Sx(t)から形状母数ηを算定して尖度指標算定処理に適用する構成も採用され得る。
(4)前述の各形態では、記憶装置24に事前に格納された参照テーブルTBLを参照して雑音翼装置の第1設定部52が忘却係数αを設定したが、特性解析部44が算定した形状母数ηと目標設定部46が設定した目標値Ktarとに対応する忘却係数αを第1設定部52が逐次的に算定することも可能である。第1設定部52は、前述の各形態の係数設定部76と同様に、特性解析部44が特定した形状母数ηと目標設定部46が設定した尖度指標Kの目標値Ktarとに対応する忘却係数αを図6のステップS12からステップS16の処理で算定して第2設定部54に指示する。以上の構成によれば、参照テーブルTBLが不要であるから、参照テーブルTBLの記憶に必要な記憶装置24の記憶容量が削減されるという利点がある。
(5)前述の各形態では、特性解析部44が音響信号Sx(t)に応じた形状母数ηを算定したが、過去に算定された形状母数ηを記憶装置24に記憶させて忘却係数αの算定に適用する構成や、過去に算定された複数の形状母数ηのうち例えば利用者が選択した形状母数ηを忘却係数αの算定に適用する構成も採用され得る。
(6)仮決定法による事前SNRの推定を利用した雑音抑圧処理は以上の例示(ウィナーフィルタ,MMSE-STSA法,MMSE-LSA法)に限定されない。例えば、仮決定法で推定された事前SNRを適用したMAP(Maximum A Posteriori(事後確率最大化))法等の雑音抑圧処理にも前述の各形態と同様に本発明を適用することが可能である。すなわち、仮決定法による事前SNRの推定を利用した任意の雑音抑圧処理に本発明は適用され得る。
100……雑音抑圧装置、12……信号供給装置、14……入力装置、16……放音装置、22……演算処理装置、24……記憶装置、32……周波数分析部、34……解析処理部、36……雑音抑圧部、38……波形合成部、42……雑音推定部、44……特性解析部、46……目標設定部、52……第1設定部、54……第2設定部、200……係数設定装置、72……演算処理装置、74……記憶装置、76……係数設定部。
Claims (5)
- 音響信号の各周波数の観測成分に乗算されて前記音響信号の雑音成分を抑圧する処理係数の算定にて事前SNRに適用される忘却係数を設定する装置であって、
前記観測成分の強度分布をガンマ分布で近似する確率密度関数の積分に一般化ガウス・ラゲール求積法を適用した演算式を利用して雑音成分の形状母数と忘却係数とに応じたモーメントを算定する尖度指標算定処理により、雑音抑圧前後の尖度変化を示す尖度指標を算定し、尖度指標が、目標値に対して尖度変化の抑制側の数値となる忘却係数を設定する係数設定手段
を具備する係数設定装置。 - 前記係数設定手段は、複数の形状母数の各々と尖度指標の複数の目標値の各々との組合せ毎に忘却係数を設定し、形状母数と尖度指標の目標値との各組合せに忘却係数を対応させた参照テーブルを生成する
請求項1の係数設定装置。 - 前記係数設定手段は、形状母数と尖度指標の目標値とのひとつの組合せについて、忘却係数の数値範囲のうち第1範囲内の忘却係数と、前記第1範囲とは相違する第2範囲内の忘却係数とを設定する
請求項1または請求項2の係数設定装置。 - 音響信号の雑音成分の形状母数を推定する特性解析手段と、
雑音抑圧前後の尖度変化を示す尖度指標の目標値を可変に設定する目標設定手段と、
形状母数と尖度指標の目標値と忘却係数とを対応させる参照テーブルを参照して、前記特性解析手段が推定した形状母数と前記目標設定手段が設定した目標値とに対応する忘却係数を設定する第1設定手段と、
前記第1設定手段が設定した忘却係数を事前SNRに適用して雑音成分の抑圧用の処理係数を算定する第2算定手段と、
前記第2設定手段が算定した処理係数を前記音響信号の各周波数の観測成分に作用させる雑音抑圧手段とを具備し、
前記参照テーブルは、観測成分の強度分布をガンマ分布で近似する確率密度関数の積分に一般化ガウス・ラゲール求積法を適用した演算式を利用して雑音成分の形状母数と忘却係数とに応じたモーメントを算定する尖度指標算定処理により算定される尖度指標が、目標値に対して尖度変化の抑制側の数値となるように、雑音成分の形状母数と尖度指標の目標値と忘却係数との関係を規定する
雑音抑圧装置。 - 音響信号の雑音成分の形状母数を推定する特性解析手段と、
雑音抑圧前後の尖度変化を示す尖度指標の目標値を可変に設定する目標設定手段と、
忘却係数を可変に設定する第1設定手段と、
前記第1設定手段が設定した忘却係数を事前SNRに適用して雑音成分の抑圧用の処理係数を算定する第2算定手段と、
前記第2設定手段が算定した処理係数を前記音響信号の各周波数の観測成分に作用させる雑音抑圧手段とを具備し、
前記第1設定手段は、前記観測成分の強度分布をガンマ分布で近似する確率密度関数の積分に一般化ガウス・ラゲール求積法を適用した演算式を利用して雑音成分の形状母数と忘却係数とに応じたモーメントを算定する尖度指標算定処理により、雑音抑圧前後の尖度変化を示す尖度指標を算定し、尖度指標が、目標値に対して尖度変化の抑制側の数値となる忘却係数を設定する
雑音抑圧装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012123779A JP2013250356A (ja) | 2012-05-30 | 2012-05-30 | 係数設定装置および雑音抑圧装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2012123779A JP2013250356A (ja) | 2012-05-30 | 2012-05-30 | 係数設定装置および雑音抑圧装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2013250356A true JP2013250356A (ja) | 2013-12-12 |
Family
ID=49849118
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2012123779A Pending JP2013250356A (ja) | 2012-05-30 | 2012-05-30 | 係数設定装置および雑音抑圧装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2013250356A (ja) |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016076237A1 (ja) * | 2014-11-10 | 2016-05-19 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
CN111179192A (zh) * | 2019-12-19 | 2020-05-19 | 南京大学 | 基于拉盖尔高斯谱的角向周期噪声消除方法及装置 |
JP7508179B2 (ja) | 2020-06-30 | 2024-07-01 | 日本無線株式会社 | ノイズ抑圧回路 |
-
2012
- 2012-05-30 JP JP2012123779A patent/JP2013250356A/ja active Pending
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016076237A1 (ja) * | 2014-11-10 | 2016-05-19 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
JPWO2016076237A1 (ja) * | 2014-11-10 | 2017-09-14 | 日本電気株式会社 | 信号処理装置、信号処理方法および信号処理プログラム |
US10746838B2 (en) | 2014-11-10 | 2020-08-18 | Nec Corporation | Signal processing apparatus, signal processing method, and signal processing program |
CN111179192A (zh) * | 2019-12-19 | 2020-05-19 | 南京大学 | 基于拉盖尔高斯谱的角向周期噪声消除方法及装置 |
JP7508179B2 (ja) | 2020-06-30 | 2024-07-01 | 日本無線株式会社 | ノイズ抑圧回路 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP6177253B2 (ja) | ハーモニシティベースの単一チャネルスピーチ品質評価 | |
KR101737824B1 (ko) | 잡음 환경의 입력신호로부터 잡음을 제거하는 방법 및 그 장치 | |
US9548064B2 (en) | Noise estimation apparatus of obtaining suitable estimated value about sub-band noise power and noise estimating method | |
JP6064566B2 (ja) | 音響処理装置 | |
JP2011145372A (ja) | 雑音抑圧装置 | |
JP5187666B2 (ja) | 雑音抑圧装置およびプログラム | |
US9418677B2 (en) | Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program | |
JP5152799B2 (ja) | 雑音抑圧装置およびプログラム | |
JP2023536104A (ja) | 機械学習を用いたノイズ削減 | |
EP2144233A2 (en) | Noise supression estimation device and noise supression device | |
JP5915281B2 (ja) | 音響処理装置 | |
JP5609157B2 (ja) | 係数設定装置および雑音抑圧装置 | |
JP5152800B2 (ja) | 雑音抑圧評価装置およびプログラム | |
US10297272B2 (en) | Signal processor | |
JP2013250356A (ja) | 係数設定装置および雑音抑圧装置 | |
JP5942388B2 (ja) | 雑音抑圧用係数設定装置、雑音抑圧装置および雑音抑圧用係数設定方法 | |
JP5633673B2 (ja) | 雑音抑圧装置およびプログラム | |
JP5728903B2 (ja) | 音響処理装置およびプログラム | |
JP2015169901A (ja) | 音響処理装置 | |
JP6361148B2 (ja) | 雑音推定装置、方法及びプログラム | |
JP6171558B2 (ja) | 音響処理装置 | |
JP6299279B2 (ja) | 音響処理装置および音響処理方法 | |
JP2017138409A (ja) | 雑音推定装置、プログラム及び方法、並びに、音声処理装置 | |
JP2015169900A (ja) | 雑音抑圧装置 | |
JP2015004959A (ja) | 音響処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A711 | Notification of change in applicant |
Free format text: JAPANESE INTERMEDIATE CODE: A711 Effective date: 20140117 |
|
A521 | Written amendment |
Free format text: JAPANESE INTERMEDIATE CODE: A821 Effective date: 20140120 |
|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |