JP5728903B2 - 音響処理装置およびプログラム - Google Patents

音響処理装置およびプログラム Download PDF

Info

Publication number
JP5728903B2
JP5728903B2 JP2010263204A JP2010263204A JP5728903B2 JP 5728903 B2 JP5728903 B2 JP 5728903B2 JP 2010263204 A JP2010263204 A JP 2010263204A JP 2010263204 A JP2010263204 A JP 2010263204A JP 5728903 B2 JP5728903 B2 JP 5728903B2
Authority
JP
Japan
Prior art keywords
suppression
noise
value
intensity
acoustic signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010263204A
Other languages
English (en)
Other versions
JP2012113190A (ja
Inventor
井上 貴之
貴之 井上
洋 猿渡
洋 猿渡
近藤 多伸
多伸 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2010263204A priority Critical patent/JP5728903B2/ja
Priority to US13/303,783 priority patent/US20120134508A1/en
Priority to EP11009360A priority patent/EP2458587A1/en
Publication of JP2012113190A publication Critical patent/JP2012113190A/ja
Application granted granted Critical
Publication of JP5728903B2 publication Critical patent/JP5728903B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L2021/02085Periodic noise
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS TECHNIQUES OR SPEECH SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING TECHNIQUES; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Speech or voice signal processing techniques to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/0208Noise filtering
    • G10L21/0216Noise filtering characterised by the method used for estimating noise
    • G10L2021/02161Number of inputs available containing the signal or the noise to be suppressed
    • G10L2021/02163Only one microphone

Landscapes

  • Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Quality & Reliability (AREA)
  • Signal Processing (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • Acoustics & Sound (AREA)
  • Multimedia (AREA)
  • Soundproofing, Sound Blocking, And Sound Damping (AREA)
  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音響信号から雑音成分を抑圧する技術に関する。
目標成分と雑音成分との混合音を収音した音響信号から雑音成分を抑圧する技術が従来から提案されている。例えば特許文献1には、雑音成分が目標成分に対して抑圧されるように生成されたスペクトルゲイン(Wiener Filter)を周波数領域で音響信号に乗算する乗算型の雑音抑圧が開示されている。
特開2004−53965号公報
ところで、周波数領域で雑音成分を抑圧する技術のもとでは、雑音成分の抑圧後の音響信号に耳障りなミュージカルノイズが発生する。雑音成分の抑圧強度が上昇するほどミュージカルノイズは顕在化する。しかし、従来の乗算型の雑音抑圧では抑圧強度とミュージカルノイズとの発生量との相関が考慮されていないから、所望の雑音抑圧率(NRR:Noise Reduction Rate)を確保しながらミュージカルノイズを効果的に抑制することは困難である。以上の事情を考慮して、本発明は、乗算型の雑音抑圧において雑音成分の抑圧強度を適切に設定することを目的とする。
以上の課題を解決するために本発明が採用する手段を説明する。なお、本発明の理解を容易にするために、以下の説明では、本発明の要素と後述の実施形態の要素との対応を括弧書で付記するが、本発明の範囲を実施形態の例示に限定する趣旨ではない。
本発明の第1態様の音響処理装置は、音響信号の各周波数成分に乗算される周波数毎の係数値で構成されて音響信号の雑音成分を抑圧する抑圧係数列(例えば抑圧係数列G(τ))を生成する装置であって、音響信号の強度分布の形状に応じた雑音特性値(例えば形状母数α)を算定する特性値算定手段(例えば特性値算定部46)と、雑音成分の抑圧強度(例えば抑圧強度β)を雑音特性値に応じて可変に設定する強度設定手段(例えば強度設定部48)と、音響信号と抑圧強度とに応じて抑圧係数列を生成する係数列生成手段(例えば係数列生成部44)とを具備する。以上の構成においては、音響信号の強度分布の形状を示す雑音特性値に応じて乗算型の雑音抑圧の抑圧強度が可変に設定されるから、様々な特性の音響信号にとって適切な雑音抑圧を実現可能な抑圧係数列を生成できるという利点がある。
例えば、強度設定手段は、係数列生成手段が生成する抑圧係数列を音響信号の雑音抑圧に適用した場合の雑音抑圧率が目標値(例えば目標値Rtar)を上回り、音響信号の強度分布の尖度が雑音抑圧の前後で変化する度合を示す尖度指標が許容値(例えば許容値κtar)を下回るように、抑圧強度を設定する。以上の態様によれば、雑音抑圧性能(雑音抑圧率R)の向上とミュージカルノイズの低減とを高い水準で両立し得る抑圧係数列を生成することが可能である。
第1態様の好適例に係る音響処理装置は、雑音抑圧率の目標値と尖度指標の許容値とを可変に設定する条件指定手段(例えば条件指定部60)を具備する。例えば、条件指定手段は、利用者からの指示に応じて目標値および許容値を可変に設定する。以上の態様によれば、抑圧係数列を適用した雑音抑圧性能(雑音抑圧率)や雑音抑圧に起因したミュージカルノイズの低減の度合を可変に設定できるという利点がある。
本発明の第2態様の音響処理装置は、音響信号の雑音成分を推定する雑音推定手段(例えば雑音推定部42)と、音響信号の各周波数成分に乗算される周波数毎の係数値で構成されて音響信号の雑音成分を抑圧する抑圧係数列(例えば抑圧係数列G(τ))を生成する係数列生成手段(例えば係数列生成部44)とを具備し、係数列生成手段は、抑圧係数列の各周波数fに対応する係数値g(f)を、音響信号の当該周波数fでの振幅|X(f)|と、抑圧強度β(固定値または可変値)と、雑音推定手段が推定した雑音成分の当該周波数fでの推定振幅|N(f)|とを含む以下の数式(A)で算定する。ただし、記号Et[ ]は時間平均を意味し、信号指数ξおよびゲイン指数ηは正数である。
g(f)={|X(f)|ξ/(|X(f)|ξ+β・Et[|N(f)|ξ])}η ……(A)
第2態様の音響処理装置によれば、信号指数ξとゲイン指数ηとが相異なる数値(正数)に設定され得るから、信号指数ξおよびゲイン指数ηを適宜に選定することで、雑音抑圧性能の向上とミュージカルノイズの低減とを高い水準で両立させることが可能である。
なお、第1態様の音響処理装置の特性値算定手段と強度設定手段とを第2態様の音響処理装置に追加した構成も好適である。特性値算定手段は音響信号の雑音特性値を算定し、強度設定手段は数式(A)の抑圧強度βを雑音特性値に応じて可変に設定する。係数列生成手段は、強度設定手段が設定した抑圧強度βを適用した数式(A)の演算で抑圧係数列の各係数値g(f)を算定する。以上の構成によれば、第1態様の音響処理装置と同様の効果が実現される。
数式(A)の信号指数ξおよびゲイン指数ηが小さいほど尖度指標の低減と雑音抑圧率の向上とが高い水準で両立されるという傾向がある。そこで、第2態様の好適例では、信号指数ξおよびゲイン指数ηの少なくとも一方が小さい数値(例えば1未満の数値)に設定される。例えば、信号指数ξを1未満の正数(更に好適には0.5以下の数値)に設定するとともにゲイン指数ηを信号指数ξとは異なる数値に設定した構成が好適である。また、信号指数ξおよびゲイン指数ηの少なくとも一方を、音響処理装置(演算処理装置)の演算能力の範囲内で最小の数値に設定した構成も好適である。
また、第2態様の好適例に係る音響処理装置は、数式(A)の信号指数ξおよびゲイン指数ηの少なくとも一方を可変に設定する指数設定手段(例えば指数設定部62)を具備する。以上の態様によれば、雑音抑圧性能の向上とミュージカルノイズの低減とが高い水準で両立されるように(例えば、雑音抑圧率Rが目標値Rtarを上回るとともに尖度指標κが許容値κtarを下回るように)、信号指数ξおよびゲイン指数ηを種々の条件(例えば音響処理装置の演算能力等)に応じて調整できるという利点がある。
以上の各態様に係る音響処理装置は、抑圧係数列の生成に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラム(ソフトウェア)との協働によっても実現される。
第1態様のプログラムは、音響信号の各周波数成分に乗算される周波数毎の係数値で構成されて音響信号の雑音成分を抑圧する抑圧係数列を生成するために、音響信号の強度分布の形状に応じた雑音特性値を算定する特性値算定処理と、雑音成分の抑圧強度を雑音特性値に応じて可変に設定する強度設定処理と、音響信号と抑圧強度とに応じて抑圧係数列を生成する係数列生成処理とをコンピュータに実行させる。以上のプログラムによれば、本発明の第1態様の音響処理装置と同様の作用および効果が実現される。
第2態様のプログラムは、音響信号の雑音成分を推定する雑音推定処理と、音響信号の各周波数成分に乗算される周波数毎の係数値で構成されて音響信号の雑音成分を抑圧する抑圧係数列を前述の数式(A)で算定する係数列生成処理とをコンピュータに実行させる。以上のプログラムによれば、本発明の第2態様の音響処理装置と同様の作用および効果が実現される。
第1態様または第2態様のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
第1実施形態に係る音響処理装置のブロック図である。 変数テーブルの模式図である。 雑音抑圧率と尖度指標との関係を乗算型の雑音抑圧と減算型の雑音抑圧とについて示すグラフである。 雑音抑圧率と尖度指標との関係を信号指数とゲイン指数とを相違させた複数の場合について示すグラフである。 雑音抑圧解析装置のブロック図である。 変数解析部の動作のフローチャートである。 第2実施形態の音響処理装置のブロック図である。 第2実施形態の第2処理部の動作のフローチャートである。 第3実施形態の音響処理装置のブロック図である。 第4実施形態の音響処理装置のブロック図である。
<A:第1実施形態>
<音響処理装置>
図1は、第1実施形態の音響処理装置100のブロック図である。音響処理装置100には信号供給装置12と放音装置14とが接続される。信号供給装置12は、音響信号Sx(t)を音響処理装置100に供給する。音響信号Sx(t)は、以下の数式(1)で表現されるように、目的音成分(例えば音声や楽音等の音響成分)s(t)と雑音成分n(t)との混合音の波形を示す時間領域信号(t:時間)である。
Figure 0005728903
周囲の音響を収音して音響信号Sx(t)を生成する収音機器や、可搬型または内蔵型の記録媒体から音響信号Sx(t)を取得して音響処理装置100に供給する再生装置や、通信網から音響信号Sx(t)を受信して音響処理装置100に供給する通信装置が信号供給装置12として採用され得る。
音響処理装置100は、信号供給装置12から供給される音響信号Sx(t)の雑音成分n(t)を抑圧(目的音成分s(t)を強調)した音響信号Sy(t)を生成する雑音抑圧装置である。放音装置14(例えばスピーカやヘッドホン)は、音響処理装置100が生成した音響信号Sy(t)に応じた音波を再生する。なお、音響信号Sy(t)をデジタルからアナログに変換するD/A変換器の図示は便宜的に省略されている。
図1に示すように、音響処理装置100は、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムPG1や演算処理装置22が使用する各種の情報(例えば後述の変数テーブルTBL)を記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置24として任意に採用され得る。音響信号Sx(t)を記憶装置24に記憶した構成(したがって信号供給装置12は省略される)も好適である。
演算処理装置22は、記憶装置24に格納されたプログラムPG1を実行することで、音響信号Sx(t)から音響信号Sy(t)を生成するための複数の機能(周波数分析部32,解析処理部34,雑音抑圧部36,波形合成部38)を実現する。なお、演算処理装置22の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が各機能を実現する構成も採用され得る。
周波数分析部32は、音響信号Sx(t)の周波数スペクトルQx(τ)を時間軸上の単位区間(フレーム)毎に順次に生成する。記号τは単位区間の番号を意味する。周波数スペクトルQx(τ)は、相異なる周波数(周波数帯域)fに対応する複数の周波数成分X(f,τ)で表現される複素スペクトルである。周波数スペクトルQx(τ)の生成には、例えば短時間フーリエ変換等の公知の周波数分析が任意に採用され得る。
解析処理部34は、音響信号Sx(t)の雑音成分n(t)を抑圧するための抑圧係数列G(τ)を単位区間毎に順次に生成する。抑圧係数列G(τ)は、相異なる周波数fに対応する複数の係数値g(f,τ)の系列である。係数値g(f,τ)は、音響信号Sx(t)の周波数成分X(f,τ)に対する利得(スペクトルゲイン)を意味し、雑音成分n(t)の特性に応じて0以上かつ1以下の範囲内で可変に設定される。具体的には、音響信号Sx(t)のうち雑音成分n(t)の強度が大きい周波数fの係数値g(f,τ)ほど小さい数値に設定される。
図1の雑音抑圧部36は、解析処理部34が生成した抑圧係数列G(τ)を音響信号Sx(t)の周波数スペクトルQx(τ)に作用させる(典型的には乗算する)ことで音響信号Sy(t)の周波数スペクトルQy(τ)を単位区間毎に順次に生成する。具体的には、以下の数式(2)で表現されるように、各単位区間の周波数スペクトルQx(τ)の周波数成分X(f,τ)とその単位区間の抑圧係数列G(τ)の係数値g(f,τ)との乗算で周波数スペクトルQy(τ)の各周波数成分Y(f,τ)が算定される。したがって、音響信号Sx(t)の雑音成分n(t)を抑圧した周波数スペクトルQy(τ)が生成される。
Figure 0005728903
波形合成部38は、雑音抑圧部36が単位区間毎に生成した周波数スペクトルQy(τ)から時間領域の音響信号Sy(t)を生成する。具体的には、波形合成部38は、各単位区間の周波数スペクトルQy(τ)を逆フーリエ変換で時間領域に変換するとともに前後の単位区間について相互に連結することで音響信号Sy(t)を生成する。波形合成部38が生成した音響信号Sy(t)が放音装置14に供給されて音波として再生される。
<解析処理部34>
解析処理部34について以下に詳述する。解析処理部34は、図1に示すように、雑音推定部42と係数列生成部44と特性値算定部46と強度設定部48とを含んで構成される。
雑音推定部42は、音響信号Sx(t)に含まれる雑音成分n(t)の各周波数スペクトルQn(τ)(周波数f毎の周波数成分N(f,τ)で規定される複素スペクトル)を推定する。雑音成分n(t)の推定には公知の技術が任意に採用され得る。具体的には、雑音推定部42は、目的音成分s(t)が存在する目的音区間と目的音成分s(t)が存在しない雑音区間とに音響信号Sx(t)を区分し、雑音区間内の各単位区間の周波数スペクトルQx(τ)を雑音成分n(t)の周波数スペクトルQn(τ)として特定する(N(f,τ)=X(f,τ))。目的音区間と雑音区間との区分には公知の音声検出技術(VAD:Voice Activity Detection)が任意に採用される。
係数列生成部44は、抑圧係数列G(τ)を単位区間毎に順次に生成する。具体的には、係数列生成部44は、音響信号Sx(t)の振幅|X(f,τ)|と雑音成分n(t)の振幅|N(f,τ)|(すなわち雑音区間内の振幅|X(f,τ)|)とを含む以下の数式(3)の演算で抑圧係数列G(τ)の各係数値g(f,τ)を算定する。
Figure 0005728903
数式(3)の記号Et[ ]は、期待値の演算(例えば雑音区間内の複数の単位区間にわたる時間平均)を意味する。記号ξは、振幅|X(f,τ)|および振幅|N(f,τ)|に対する冪指数(以下「信号指数」という)ξを意味し、記号ηは、振幅|X(f,τ)|および振幅|N(f,τ)|に応じた基礎値b(f,τ)(b(f,τ)=|X(f,τ) |ξ/(|X(f,τ)|ξ+βEt[|N(f,τ)|ξ]))に対する冪指数(以下「ゲイン指数」という)を意味する。信号指数ξおよびゲイン指数ηは所定の正数である。すなわち、数式(3)の係数値g(f,τ)で構成される抑圧係数列G(τ)は、信号指数ξおよびゲイン指数ηを一般化したウィーナフィルタ(Wiener Filter)に相当する。
数式(3)から理解されるように、雑音成分n(t)の振幅|N(f,τ)|を固定した場合には、変数βが大きいほど係数値g(f,τ)は小さい数値(雑音抑圧部36の演算で音響信号Sx(t)の周波数成分X(f,τ)を抑圧する数値)に設定される。すなわち、数式(3)の変数βは、抑圧係数列G(τ)を利用した雑音抑圧の度合(以下では「抑圧強度」という)に相当する。図1の特性値算定部46および強度設定部48は、抑圧強度βを可変に設定する。
特性値算定部46は、音響信号Sx(t)の雑音成分n(t)の特性に応じた形状母数(shape parameter)αを雑音成分n(t)の周波数スペクトルQn(τ)から算定する。形状母数αは、雑音区間内の複数の単位区間にわたる音響信号Sx(t)のパワー|X(f,τ)|2(すなわち雑音成分n(t)のパワー|N(f,τ)|2)の度数分布(以下「強度分布」という)の形状に応じた統計量である。形状母数αは、雑音成分n(t)の特性(種類)に応じて変化する。例えば、雑音成分n(t)のガウス性が高いほど形状母数αは大きい数値となる。
第1実施形態の特性値算定部46は、音響信号Sx(t)の強度分布を近似する確率分布D1の形状母数αを算定する。音響信号Sx(t)(雑音成分n(t))の強度分布を近似する確率分布D1としては例えばガンマ分布が好適である。ガンマ分布は、音響信号Sx(t)のパワーx(x=|X(f,τ)|2)を確率変数とする数式(4)の確率密度関数P(x)で表現される。
Figure 0005728903
数式(4)の形状母数αは以下の数式(5A)および数式(5B)で定義され、数式(4)の尺度母数(scaling parameter)θは以下の数式(5C)で定義される。また、数式(4)の記号Γ(α)は、以下の数式(6)で定義されるガンマ関数を意味する。特性値算定部46は、雑音区間内の音響信号Sx(t)のパワー|X(f,τ)|2(すなわち雑音成分n(t)のパワー|N(f,τ)|2)を確率変数xとして数式(5A)および数式(5B)の演算を実行することで形状母数αを算定する。
Figure 0005728903
Figure 0005728903
図1の強度設定部48は、係数列生成部44が抑圧係数列G(τ)の生成に適用する抑圧強度βを、特性値算定部46が算定した形状母数αに応じて可変に設定する。抑圧強度βの設定には、記憶装置24に格納された変数テーブルTBLが利用される。
図2は、変数テーブルTBLの模式図である。図2に示すように、変数テーブルTBLは、形状母数αの各数値(α1,α2,……)と抑圧強度βの各数値(β1,β2,……)とを対応させたデータテーブルである。強度設定部48は、特性値算定部46が算定した形状母数αに対応する抑圧強度βを変数テーブルTBLから検索して係数列生成部44に指示する。係数列生成部44は、前述の通り、強度設定部48から指示された抑圧強度βを適用した数式(3)の演算で抑圧係数列G(τ)の各係数値g(f,τ)を算定する。以上の説明から理解されるように、抑圧強度βは、音響信号Sx(t)(具体的には雑音成分n(t))の特性に応じて可変に制御される。
数式(2)の雑音抑圧で生成される周波数スペクトルQy(τ)には、高強度の成分(孤立点)が時間軸上および周波数軸上に点在し、人工的で耳障りなミュージカルノイズとして知覚される可能性がある。抑圧強度βが大きいほどミュージカルノイズは顕在化する。他方、抑圧強度βが大きいほど雑音抑圧率(雑音抑圧性能)は向上する。以上の傾向を考慮して、変数テーブルTBLにて各形状母数αに対応する抑圧強度βは、雑音抑圧率の向上とミュージカルノイズの低減とが高い水準で両立するように解析的に設定される。
<雑音抑圧の作用の解析>
以上の条件を満たす変数テーブルTBLを作成するためには、雑音抑圧率とミュージカルノイズの発生量とを定量的に評価する必要がある。そこで、以下では、数式(2)の抑圧処理の作用を解析することで、雑音抑圧率とミュージカルノイズの発生量とを定式化する。
確率変数x(x=|X(f,τ)|2)の確率密度関数P(x)で表現される前述の確率分布D1が数式(2)の雑音抑圧で確率分布D2に変化する過程に着目する。確率分布D2は、雑音抑圧後の周波数成分Y(f,τ)のパワーy(y=|Y(f,τ)|2)を確率変数とする確率密度関数P(y)で表現される。確率変数xから確率変数yへの写像q(y=q(x))を想定すると、雑音抑圧後の確率密度関数P(y)は以下の数式(7)で表現される。
Figure 0005728903
数式(7)の記号|J|は、以下の数式(8)で定義されるヤコビアンを意味する。
Figure 0005728903
他方、数式(3)を数式(2)に代入すると以下の数式(9)が導出される。
Figure 0005728903
数式(9)の両辺を2乗すると以下の数式(10)が導出される。なお、数式(10)の導出では、周波数成分X(f,τ)の位相角を便宜的に無視した。
Figure 0005728903
数式(10)の期待値Et[|N(f,τ)|ξ]は、以下の数式(11)で表現される。数式(11)については、例えば、T.Inoue, et al., "Theoretical analysis of musical noise in generalized spectral subtraction: why should not use power/amplitude subtraction ?", Proc. EUSIPCO2010, p.994-998, 2010に記述されている。
Figure 0005728903
また、確率変数xは周波数成分X(f,τ)のパワー|X(f,τ)|2に相当し(|X(f,τ)|=x1/2)、確率変数yは周波数成分Y(f,τ)のパワー|Y(f,τ)|2に相当する(|Y(f,τ)|=y1/2)。したがって、確率変数yを表現する以下の数式(12)が数式(10)から導出される。
Figure 0005728903
数式(12)は単調関数であるから、逆関数(x=f(y))が存在する。そして、変数xおよび変数yは何れも正数(x>0,y>0)であるから、数式(8)のヤコビアン|J|は以下の数式(13)で表現される。
Figure 0005728903
したがって、数式(7)の確率密度関数P(y)は、数式(4)および数式(13)の関係を利用して以下の数式(14)で表現される。
Figure 0005728903
<確率密度関数P(y)のm次モーメントμm>
数式(14)の確率密度関数P(y)の原点回りのm次モーメントμmを検討する。m次モーメントμmは、以下の数式(15)で表現される。
Figure 0005728903
数式(15)の変数f(y)/θを変数tに置換すると、以下の数式(16)および数式(17)が導出される。
Figure 0005728903
Figure 0005728903
数式(17)を数式(12)に代入することで以下の数式(18)が導出される。
Figure 0005728903
数式(16)から数式(18)を数式(15)に代入することで、確率密度関数P(y)のm次モーメントμmを表現する以下の数式(19)が導出される。数式(19)の関数M(α,β,m,ξ,η)は、数式(20)で定義される。
Figure 0005728903
Figure 0005728903
<ミュージカルノイズの発生量>
雑音抑圧に起因したミュージカルノイズが非ガウス性の音響成分であることを考慮し、強度分布のガウス性の指標となる高次統計量をミュージカルノイズの発生量の定量的な指標として利用する。具体的には、強度分布(強度分布を近似する確率分布)の尖度(kurtosis)がミュージカルノイズの発生量の指標として好適である。すなわち、雑音抑圧の前後にわたる尖度の変化が大きいほどミュージカルノイズが顕在化すると評価できる。そこで、以下の説明では、雑音抑圧の前後で強度分布の尖度が変化する度合を示す尖度指標κをミュージカルノイズの発生量の指標として利用する。
具体的には、尖度指標κは、雑音抑圧前の尖度KAに対する雑音抑圧後の尖度KBの相対比(κ=KB/KA)である。すなわち、尖度指標κが大きいほど雑音抑圧後のミュージカルノイズが多いと評価できる。尖度指標κとミュージカルノイズとの相関については、上村益永ほか4名/「スペクトル減算法におけるミュージカルノイズ発生量と対数カートシス比の関連」/電子情報通信学会技術研究報告 応用音響/電子情報通信学会/108(143) p.43-48/2008年7月11日に詳述されている。なお、尖度KAおよび尖度KBの各々の対数値の相対比や尖度KAと尖度KBとの差分を尖度指標κとした構成も好適である。
強度分布の尖度Kは、2次モーメントμ2の自乗に対する4次モーメントμ4の相対比(μ4/μ22)として定義されるから、数式(19)のm次モーメントμmを利用して以下の数式(21)で表現される。
Figure 0005728903
数式(21)は、抑圧強度βの雑音抑圧の実行後における強度分布の尖度KBを意味する。他方、雑音抑圧前の強度分布の尖度KAは、数式(21)において抑圧強度βをゼロとした場合の尖度K(Γ(α)・M(α,0,4,ξ,η)/M2(α,0,2,ξ,η))に相当する。したがって、尖度KAと尖度KBとの相対比である尖度指標κは以下の数式(22)で表現される。
Figure 0005728903
<雑音抑圧率>
次に、数式(2)の雑音抑圧性能の指標となる雑音抑圧率R(NRR:Noise Reduction Rate)を検討する。雑音抑圧率Rは、雑音抑圧後のSN(Signal to Noise)比と雑音抑圧前のSN比との差分として以下の数式(23)で定義される。
Figure 0005728903
数式(23)の記号sは目的音成分s(n)のパワーを意味し、記号nは雑音成分n(t)のパワーを意味する。また、添字INは雑音抑圧の実行前を意味し、添字OUTは雑音抑圧の実行後を意味する。すなわち、数式(23)の分母が雑音抑圧前のSN比に相当し、数式(23)の分子が雑音抑圧後のSN比に相当する。
雑音抑圧による雑音成分n(t)の抑圧量が目的音成分s(t)の抑圧量と比較して充分に大きいと仮定すると、雑音抑圧の前後の目的音成分s(t)の変化を近似的に無視できる(Et[sOUT]=Et[sIN])から、数式(23)は以下の数式(24)に近似される。
Figure 0005728903
数式(24)のうち雑音抑圧後の雑音成分n(t)のパワーの期待値(平均値)Et[nOUT]は、数式(19)で変数mを1に設定した1次モーメントμ1に相当する。また、雑音抑圧前の雑音成分n(t)のパワーの期待値Et[nIN]は、抑圧強度βをゼロに設定した場合の確率密度関数P(y)の1次モーメントμ1に相当する。したがって、数式(24)は以下の数式(25)に変形される。
Figure 0005728903
<尖度指標κと雑音抑圧率Rとの関係>
図3は、数式(22)の尖度指標κと数式(25)の雑音抑圧率Rとの関係を示すグラフ(実線)である。数式(3)の抑圧係数列G(τ)の信号指数ξを変化させた複数の場合(ξ=2.0,1.0,0.5,0.2)の各々について尖度指標κと雑音抑圧率Rとの関係が図3には図示されている。数式(3)のゲイン指数ηは信号指数ξの逆数(η=1/ξ)に設定した。また、図3には、数式(2)の乗算型の雑音抑圧との比較のために、以下の数式(26A)および数式(26B)で表現される減算型の雑音抑圧(spectral subtraction)を実行した場合の尖度指標κと雑音抑圧率Rとの関係(破線)が、数式(26A)の冪指数ξを変化させた複数の場合の各々(ξ=2.0,1.0,0.5,0.2)について併記されている。なお、乗算型および減算型の何れの雑音抑圧についても、形状母数αが1である雑音(ガウシアンノイズ)が音響信号Sx(t)として想定されている。
Figure 0005728903
乗算型および減算型の雑音抑圧にて同等の雑音抑圧率Rが達成されるように数式(3)の抑圧強度βや数式(26A)の減算係数φを選定した場合、乗算型の雑音抑圧のほうが減算型の雑音抑圧よりも尖度指標κを小さい数値に抑制できるという傾向が図3から把握される。すなわち、雑音抑圧率Rの向上とミュージカルノイズの低減との両立という観点からすると、乗算型の雑音抑圧は減算型の雑音抑圧と比較して有利である。
図4は、乗算型の雑音抑圧に適用される数式(3)の信号指数ξおよびゲイン指数ηを変化させた複数の場合について尖度指標κと雑音抑圧率Rとの関係を示すグラフである。信号指数ξの数値毎(ξ=2.0,1.0,0.5)に、ゲイン指数ηを変化させた複数の場合(η=2.0/ξ,1.0/ξ,0.5/ξ)の各々について尖度指標κと雑音抑圧率Rとの関係が図4には図示されている。信号指数ξとゲイン指数ηとの数値の組合せは以下の通りである。
(1) 実線(ξ=2.0):|X(f,τ)|および|N(f,τ)|の2.0乗(パワードメイン)
○(η=1.0):基礎値b(f,τ)の1.0乗(パワードメインを維持)
×(η=0.5):基礎値b(f,τ)の0.5乗(振幅ドメインに変換)
△(η=0.25):基礎値b(f,τ)の0.25乗(ルートドメインに変換)
(2) 鎖線(ξ=1.0):|X(f,τ)|および|N(f,τ)|の1.0乗(振幅ドメイン)
○(η=2.0):基礎値b(f,τ)の2.0乗(パワードメインに変換)
×(η=1.0):基礎値b(f,τ)の1.0乗(振幅ドメインを維持)
△(η=0.5):基礎値b(f,τ)の0.5乗(ルートドメインに変換)
(3) 破線(ξ=0.5):|X(f,τ)|および|N(f,τ)|の0.5乗(ルートドメイン)
○(η=4.0):基礎値b(f,τ)の4.0乗(パワードメインに変換)
×(η=2.0):基礎値b(f,τ)の2.0乗(振幅ドメインに変換)
△(η=1.0):基礎値b(f,τ)の1.0乗(ルートドメインを維持)
図3および図4から把握されるように、信号指数ξが小さいほど、尖度指標κの低減(ミュージカルノイズの抑制)と雑音抑圧率R(雑音抑圧性能)の向上とが高い水準で両立する。また、信号指数ξが同等ならば、ゲイン指数ηが小さいほど尖度指標κの低減と雑音抑圧率Rの向上とが高い水準で両立するという傾向が図4から把握される。例えば、図4に例示された9通りの組合せのなかでは、信号指数ξを0.5に設定するとともにゲイン指数ηを1.0に設定した場合(破線と“△”との組合せ)に、尖度指標κの低減と雑音抑圧率R(雑音抑圧性能)の向上との両立の効果は最大となる。
以上の傾向を考慮して、数式(3)に適用される信号指数ξおよびゲイン指数ηは小さい数値(例えば1未満の正数)に設定される。例えば、信号指数ξは1未満の数値に設定され、ゲイン指数ηは信号指数ξとは相違する数値に設定される。信号指数ξは、更に好適には0.5以下の数値(例えば0.2)に設定される。演算性能(精度)の観点からすると、信号指数ξおよびゲイン指数ηの少なくとも一方は、演算処理装置22が数式(3)の係数値g(f,τ)を所定の精度のもとで演算可能な範囲内(例えば、演算処理装置22が演算可能な浮動小数点のもとでアンダーフローを回避して有意な数値が得られる限度内)で最小の数値に設定される。雑音抑圧率Rおよび尖度指標κの解析の結果は以上の通りである。
<変数テーブルTBLの作成>
図2の変数テーブルTBLは、以上の解析の結果(数式(22)および数式(25))を利用して作成される。図5は、変数テーブルTBLを作成する雑音抑圧解析装置200のブロック図である。雑音抑圧解析装置200は、音響処理装置100と同様に、演算処理装置72と記憶装置74とを具備するコンピュータシステムで実現される。演算処理装置72は、記憶装置74が記憶するプログラムPG2の実行で変数解析部76として機能する。変数解析部76は、音響処理装置100で使用される変数テーブルTBLを作成する。なお、音響処理装置100の演算処理装置22が変数解析部76として機能する構成も採用され得る。
図6は、変数解析部76の動作のフローチャートである。図6の動作は、例えば雑音抑圧解析装置200に対する利用者からの指示(変数テーブルTBLの作成の指示)を契機として実行される。概略的には、形状母数αが数値αselである音響信号Sx(t)の雑音抑圧に最適な抑圧強度βを決定する処理(S10〜S16)が、形状母数αとして想定される複数の数値αselの各々について順次に実行される。
図6の処理を開始すると、変数解析部76は、形状母数αに想定される複数の数値の何れか(以下「選択値」という)αselを選択する(S10)。選択値αselは、処理S10毎に順次に更新される。例えば、選択値αselは、音響信号Sx(t)の形状母数αに想定される数値範囲内(例えば3≦αsel≦101)で所定の刻み幅(例えば2)ずつ変化させた各数値に設定される。
変数解析部76は、抑圧強度βの候補値βcを設定する(S11)。候補値βcは、処理S11毎に順次に更新される。例えば、候補値βcは、所定の範囲Ac(例えば1≦βc≦3の範囲)内で所定の刻み幅δc(例えばδc=0.1)ずつ変化させた各数値に設定される。
変数解析部76は、処理S10で選択した選択値αselを形状母数αとし、処理S11で設定した候補値βcを抑圧強度βとした数式(22)の演算で尖度指標κを算定する(S12)。また、変数解析部76は、選択値αselを形状母数αとして候補値βcを抑圧強度βとした数式(25)の演算で雑音抑圧率Rを算定する(S13)。数式(22)や数式(25)の信号指数ξおよびゲイン指数ηは、例えば変数テーブルTBLの使用が想定される音響処理装置100の演算能力に応じた数値)に設定される。
変数解析部76は、抑圧強度βに想定される全部の候補値βcについて尖度指標κおよび雑音抑圧率Rを算定したか否かを判定する(S14)。処理S14の判定の結果が否定である場合、変数解析部76は、候補値βcを更新(S11)するとともに更新後の候補値βcについて尖度指標κの算定(S12)と雑音抑圧率Rの算定(S13)とを実行する。すなわち、範囲Ac内の候補値βc毎に尖度指標κと雑音抑圧率Rとが算定される。
他方、全部の候補値βcについて尖度指標κおよび雑音抑圧率Rの算定が完了した場合(S14:YES)、変数解析部76は、範囲Ac内の複数の候補値βcのうち、現段階の選択値αselを形状母数αとする音響信号Sx(t)の雑音抑圧に最適な候補値βcを、候補値βc毎の尖度指標κおよび雑音抑圧率Rに応じて選択する(S15)。具体的には、変数解析部76は、尖度指標κが所定の許容値κtarを下回るという条件(κ<κtar)と雑音抑圧率Rが目標値Rtarを上回るという条件(R>Rtar)との双方を満たす候補値βcを選択する。複数の候補値βcが条件を満たす場合、変数解析部76は、尖度指標κが最小となる候補値βcまたは雑音抑圧率Rが最大となる候補値βcを選択する。なお、許容値κtarおよび目標値Rtarは、音響処理装置100の用途や仕様(例えばミュージカルノイズの低減や雑音抑圧性能が要求される程度)に応じて事前に設定される。
変数解析部76は、現段階の選択値αselを形状母数αとし、処理S15で選択した候補値βcを抑圧強度βとして相互に対応させたうえで記憶装置74に格納する(S16)。そして、変数解析部76は、全部の選択値αselについて抑圧強度βを確定したか否かを判定する(S17)。処理S17の判定の結果が否定である場合、変数解析部76は、選択値αselを更新(S10)したうえで更新後の選択値αselについて抑圧強度βの選定(S11〜S16)を実行する。他方、形状母数αに想定される全部の選択値αselについて抑圧強度βを確定すると(S17:YES)、変数解析部76は図6の処理を終了する。図6の処理が終了した時点では、形状母数αの複数の数値の各々(選択値αsel)に抑圧強度βを対応させた図2の変数テーブルTBLが記憶装置74に生成される。
変数解析部76が生成した変数テーブルTBLが音響処理装置100の記憶装置24に転送されて音響信号Sx(t)の雑音抑圧に適用される。以上の説明から理解されるように、強度設定部48が形状母数αに応じて変数テーブルTBLから選択した抑圧強度βを適用することで、雑音抑圧率Rが目標値Rtarを上回るとともに尖度指標κが許容値κtarを下回る雑音抑圧が実現される。すなわち、雑音抑圧率Rの向上とミュージカルノイズの低減とを高い水準で両立することが可能である。
<B:第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各態様において作用や機能が第1実施形態と同等である要素については、以上の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
図7は、第2実施形態の音響処理装置100のブロック図である。図7に示すように、第2実施形態の音響処理装置100の強度設定部48は、第1処理部51と第2処理部52とを含んで構成される。第1処理部51は、第1実施形態の強度設定部48と同様に、特性値算定部46が算定した形状母数αに対応する抑圧強度βT(第1実施形態の抑圧強度β)を変数テーブルTBLから特定する。第2処理部52は、第1処理部51が特定した抑圧強度βTを利用して確定的な抑圧強度βを設定する。第2処理部52が設定した抑圧強度βが係数列生成部44による抑圧係数列G(τ)の生成(数式(3))に適用される。
図8は、第2処理部52の動作のフローチャートである。図8の処理は、第1処理部51による抑圧強度βTの特定を契機として実行される。図8の処理を開始すると、第2処理部52は、抑圧強度βの候補値βdを設定する(S20)。候補値βdは、処理S20毎に順次に更新される。具体的には、候補値βdは、第1処理部51が特定した抑圧強度βTを含む所定の範囲Ad内で所定の刻み幅δdずつ変化させた各数値に設定される。範囲Adは、例えば抑圧強度βTを中心とする所定幅の範囲に設定される。候補値βdの範囲Adは、変数テーブルTBLの作成時に図6の処理S11で設定される候補値βcの範囲Acと比較して狭く、候補値βdの刻み幅δdは、処理S11で設定される候補値βcの刻み幅δcと比較して小さい(例えばδd=δc/4)。
第2処理部52は、特性値算定部46が算定した形状母数αと処理S20で設定した候補値βd(数式(22)の抑圧強度β)とを適用した数式(22)の演算で尖度指標κを算定する(S21)。同様に、第2処理部52は、形状母数αと候補値βdとを適用した数式(25)の演算で雑音抑圧率Rを算定する(S22)。そして、第2処理部52は、範囲Ad内の全部の候補値βdについて尖度指標κおよび雑音抑圧率Rを算定したか否かを判定する(S23)。処理S23の判定の結果が否定である場合、第2処理部52は、候補値βdを更新する(S20)とともに更新後の候補値βdについて尖度指標κの算定(S21)と雑音抑圧率Rの算定(S22)とを実行する。すなわち、範囲Ad内の候補値βd毎に尖度指標κと雑音抑圧率Rとが算定される。
全部の候補値βdについて尖度指標κおよび雑音抑圧率Rを算定すると(S23:YES)、第2処理部52は、複数の候補値βdのうち尖度指標κと雑音抑圧率Rとが最適値となる候補値βdを確定的な抑圧強度βとして選択する(S24)。例えば、第2処理部52は、尖度指標κおよび雑音抑圧率Rを要素とするベクトルVと許容値κtarおよび目標値Rtarを要素とするベクトルVtarとの類似度λ(例えば距離や内積)を候補値βd毎に算定し、類似度λが最大となるベクトルVに対応する候補値βdを抑圧強度βとして確定する。すなわち、形状母数αの音響信号Sx(t)に対する雑音抑圧において尖度指標κの低下(ミュージカルノイズの低減)と雑音抑圧率Rの向上とを高い水準で両立させ得る抑圧強度βが決定される。
第2実施形態においても第1実施形態と同様の効果が実現される。また、第2実施形態では、変数テーブルTBLから特定された抑圧強度βTを含む範囲Ad内の複数の候補値βdのうち尖度指標κおよび雑音抑圧率Rが最適となる候補値βdが確定的な抑圧強度βとして抑圧係数列G(τ)の生成に適用される。そして、第2処理部52が設定する候補値βdの刻み幅δdは、変数テーブルTBLの作成時の抑圧強度βの候補値βcの刻み幅δcと比較して小さい。したがって、変数テーブルTBL内の抑圧強度βが係数列生成部44に指示される第1実施形態と比較すると、抑圧強度βを更に最適な数値に設定することが可能である。すなわち、効果的な雑音抑圧とミュージカルノイズの低減との両立という効果は格別に顕著となる。
<C:第3実施形態>
図9は、第3実施形態の音響処理装置100のブロック図である。図9に示すように、利用者からの指示を受付ける入力装置16が音響処理装置100に接続される。また、第3実施形態の解析処理部34は、第1実施形態と同様の要素に加えて条件指定部60を具備する。条件指定部60は、尖度指標κの許容値κtarと雑音抑圧率Rの目標値Rtarとを可変に設定する。例えば、条件指定部60は、入力装置16に対する利用者からの指示に応じて許容値κtarおよび目標値Rtarを設定する。
図9に示すように、記憶装置24は、複数の変数テーブルTBLを記憶する。変数テーブルTBLの生成時に適用される許容値κtarと目標値Rtarとの各数値の組合せは変数テーブルTBL毎に相違する。すなわち、許容値κtarおよび目標値Rtarの各数値の組合せ毎に雑音抑圧解析装置200(変数解析部76)が図6の処理を実行することで各変数テーブルTBLが生成される。
強度設定部48は、記憶装置24に記憶された複数の変数テーブルTBLのうち条件指定部60が指定した許容値κtarおよび目標値Rtarの組合せに対応する変数テーブルTBLを選択し、その変数テーブルTBLのうち特性値算定部46が算定した形状母数αに対応する抑圧強度βを検索して係数列生成部44に指示する。
すなわち、雑音抑圧部36が雑音抑圧を実行した場合の尖度指標κが、条件指定部60により指定された許容値κtarを下回り、かつ、雑音抑圧部36が雑音抑圧を実行した場合の雑音抑圧率Rが、条件指定部60により指定された目標値Rtarを上回るように、雑音抑圧の抑圧強度βが選定される。例えば、条件指定部60が指定する許容値κtarが小さいほど雑音抑圧後の音響信号Sy(t)のミュージカルノイズが低減され、条件指定部60が指定する目標値Rtarが大きいほど雑音成分n(t)の抑圧が強化される。以上の説明から理解されるように、条件指定部60は、音響信号Sx(t)に対する雑音抑圧に要求される条件を指定する要素として機能する。
第3実施形態においても第1実施形態と同様の効果が実現される。また、第3実施形態では、条件指定部60が指定する許容値κtarおよび目標値Rtarに応じて抑圧強度βが可変に設定されるから、雑音抑圧性能やミュージカルノイズの低減の度合を音響処理装置100の用途や利用者の要求に応じて調整できるという利点がある。なお、許容値κtarや目標値Rtarに応じて抑圧強度βを可変に設定する第3実施形態の構成は第2実施形態にも同様に適用され得る。
<D:第4実施形態>
図10は、第4実施形態の音響処理装置100のブロック図である。第4実施形態の音響処理装置100は、第3実施形態(図9)の条件指定部60を指数設定部62に置換した構成である。指数設定部62は、数式(3)の信号指数ξおよびゲイン指数ηを可変に設定する。具体的には、指数設定部62は、入力装置16に対する操作に応じて信号指数ξおよびゲイン指数ηを設定する。例えば、利用者は、演算処理装置22の演算能力に応じた信号指数ξおよびゲイン指数ηを入力装置16から指示する。なお、演算処理装置22の演算能力等に応じて指数設定部62が自動的に信号指数ξおよびゲイン指数ηを設定する構成(すなわち利用者からの指示を必要としない構成)も採用され得る。前述の通り、信号指数ξおよびゲイン指数ηは、例えば演算処理装置22の演算能力の範囲内で1未満の数値に設定され、更に好適には0.5以下の数値(例えば0.2)に設定される。
記憶装置24は、複数の変数テーブルTBLを記憶する。変数テーブルTBLの生成時に数式(22)や数式(25)の演算に適用される信号指数ξおよびゲイン指数ηの各数値の組合せが変数テーブルTBL毎に相違する。強度設定部48は、記憶装置24に記憶された複数の変数テーブルTBLのうち指数設定部62が指定した信号指数ξおよびゲイン指数ηに対応する変数テーブルTBLを選択し、その変数テーブルTBLのうち特性値算定部46が算定した形状母数αに対応する抑圧強度βを検索して係数列生成部44に指示する。したがって、指数設定部62が指定した信号指数ξおよびゲイン指数ηを数式(3)に適用した数式(2)の雑音抑圧にとって最適な抑圧強度β(すなわち、雑音抑圧率Rが目標値Rtarを上回るとともに尖度指標κが許容値κtarを下回るような抑圧強度β)が抑圧係数列G(τ)の生成に適用される。
第4実施形態においても第1実施形態と同様の効果が実現される。また、第4実施形態では、指数設定部62が指定する信号指数ξおよびゲイン指数ηに応じて抑圧強度βが可変に設定されるから、例えば演算処理装置22の演算能力の限度内で、効果的な雑音抑圧とミュージカルノイズの低減とを高い水準で両立し得る好適な抑圧強度βを選択できるという利点がある。なお、信号指数ξおよびゲイン指数ηに応じて抑圧強度βを可変に設定する第4実施形態の構成は、第2実施形態や第3実施形態にも同様に採用され得る。
<E:変形例>
以上の各形態は多様に変形される。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
(1)変形例1
以上の形態では、音響信号Sx(t)の強度分布を近似する確率密度関数P(x)の形状母数αを雑音成分n(t)の特性の指標(雑音特性値)として例示したが、雑音特性値は形状母数に限定されない。例えば、音響信号Sx(t)の強度分布から直接に(すなわち近似を必要とせずに)算定される統計量(例えば尖度等の高次統計量)や、音響信号Sx(t)の振幅|X(f,τ)|の度数分布に応じた統計量(例えば振幅|X(f,τ)|の度数分布を近似する確率密度関数の形状母数)も雑音特性値として利用され得る。すなわち、雑音特性値は、音響信号Sx(t)の特性(特に雑音成分n(t)の特性)に応じて変化する数値(典型的には強度分布の形状に応じた数値)として包括される。
(2)変形例2
以上の各形態では、抑圧強度βの設定に変数テーブルTBLを利用したが、変数テーブルTBLの利用は省略され得る。例えば、強度設定部48が数式(22)や数式(25)の演算を実行することで形状母数αに応じた最適な抑圧強度βを算定する構成も採用される。具体的には、強度設定部48が、抑圧強度βを所定の範囲内で順次に変化させながら形状母数αを適用した数式(22)および数式(25)の演算で尖度指標κおよび雑音抑圧率Rを算定し、第2実施形態と同様に、尖度指標κおよび雑音抑圧率Rが最適な組合せとなる抑圧強度βを係数列生成部44に指示する。以上の構成によれば、記憶装置24に必要な容量が削減されるという利点がある。他方、変数テーブルTBLを利用する構成によれば、抑圧強度βを演算で算定する構成と比較して強度設定部48の処理の負荷が軽減されるという利点がある。
(3)変形例3
以上の各形態では、抑圧係数列G(τ)を単位区間毎に生成したが、抑圧係数列G(τ)の生成の周期は適宜に変更される。例えば、相前後する単位区間にて音響信号Sx(t)の特性が近似するという傾向を考慮すると、相連続する複数の単位区間を周期として抑圧係数列G(τ)を順次に生成し、周期毎の抑圧係数列G(τ)を当該周期内の各単位区間の音響信号Sx(t)に対して共通に適用する構成も採用され得る。また、以上の各形態では、単位区間毎の抑圧係数列G(τ)をその単位区間の音響信号Sx(t)に適用したが、抑圧係数列G(τ)の生成に使用される音響信号Sx(t)の単位区間とその抑圧係数列G(τ)を適用する単位区間とを相違させた構成も採用され得る。例えば、音響信号Sx(t)の各単位区間から生成した抑圧係数列G(τ)を、その単位区間の後方(例えば直後)の単位区間に適用する構成が採用される。
(4)変形例4
以上の各形態では、音響処理装置100と雑音抑圧解析装置200とを別体の装置として例示したが、雑音抑圧解析装置200の機能(変数テーブルTBLを生成する変数解析部76)を音響処理装置100に搭載した構成も採用され得る。
(5)変形例5
以上の各形態では、尖度指標κおよび雑音抑圧率Rの双方が所定の条件を満たす(κ<κtar,R>Rtar)ように抑圧強度βを設定したが、尖度指標κおよび雑音抑圧率Rの片方のみが条件を満たすように抑圧強度βを設定する構成も採用される。
100……音響処理装置、200……雑音抑圧解析装置、12……信号供給装置、14……放音装置、16……入力装置、22,72……演算処理装置、24,74……記憶装置、32……周波数分析部、34……解析処理部、36……雑音抑圧部、38……波形合成部、42……雑音推定部、44……係数列生成部、46……特性値算定部、48……強度設定部、51……第1処理部、52……第2処理部、60……条件指定部、62……指数設定部、76……変数解析部。

Claims (6)

  1. 音響信号の各周波数成分に乗算される周波数毎の係数値で構成されて前記音響信号の雑音成分を抑圧する抑圧係数列を生成する音響処理装置であって、
    前記音響信号の強度分布の形状に応じた雑音特性値を算定する特性値算定手段と、
    前記雑音成分の抑圧強度を前記雑音特性値に応じて可変に設定する強度設定手段と、
    前記音響信号と前記抑圧強度とに応じて前記抑圧係数列を生成する係数列生成手段と
    雑音抑圧率の目標値と、音響信号の強度分布の尖度が雑音抑圧の前後で変化する度合を示す尖度指標の許容値とを可変に設定する条件指定手段とを具備し、
    前記強度設定手段は、前記係数列生成手段が生成する前記抑圧係数列を前記音響信号の雑音抑圧に適用した場合の雑音抑圧率が前記目標値を上回るとともに尖度指標が前記許容値を下回るように、前記抑圧強度を設定する
    音響処理装置。
  2. 前記抑圧係数列はウィーナフィルタである
    請求項1の音響処理装置。
  3. 前記係数列生成手段は、前記抑圧係数列の各周波数fに対応する係数値g(f)を、音響信号の当該周波数fでの振幅|X(f)|と、前記強度設定手段が設定した抑圧強度βと、前記音響信号の雑音成分の当該周波数fでの推定振幅|N(f)|とを含む以下の数式で算定し、
    g(f)={|X(f)|ξ/(|X(f)|ξ+β・Et[|N(f)|ξ])}η
    (ただし、記号Et[ ]は時間平均を意味し、信号指数ξおよびゲイン指数ηは正数である)
    前記信号指数ξおよびゲイン指数ηを可変に設定する指数設定手段を具備する
    請求項2の音響処理装置。
  4. 前記指数設定手段は、前記信号指数ξを1未満の正数に設定可能であり、前記ゲイン指数ηを前記信号指数ξとは異なる数値に設定可能である
    請求項3の音響処理装置。
  5. 前記強度設定手段は、
    前記特性値算定手段が算定した雑音特性値に対応する抑圧強度を変数テーブルから特定する第1処理手段と、
    前記第1処理手段が特定した抑圧強度を含む所定の範囲内の複数の候補値の各々について、前記特性値算定手段が算定した雑音特性値と当該候補値とを適用した演算で尖度指標と雑音抑圧率とを算定し、前記複数の候補値のうち前記尖度指標および前記雑音抑圧率が最適値となる候補値を確定的な抑圧強度として選択する第2処理手段とを含む
    請求項1から請求項4の何れかの音響処理装置。
  6. 音響信号の各周波数成分に乗算される周波数毎の係数値で構成されて前記音響信号の雑音成分を抑圧する抑圧係数列を生成するために、コンピュータに、
    前記音響信号の強度分布の形状に応じた雑音特性値を算定する特性値算定処理と、
    前記雑音成分の抑圧強度を前記雑音特性値に応じて可変に設定する強度設定処理と、
    前記音響信号と前記抑圧強度とに応じて前記抑圧係数列を生成する係数列生成処理と、
    雑音抑圧率の目標値と、音響信号の強度分布の尖度が雑音抑圧の前後で変化する度合を示す尖度指標の許容値とを可変に設定する条件指定処理と
    を実行させるプログラムであって、
    前記強度設定処理では、前記係数列生成処理で生成する前記抑圧係数列を前記音響信号の雑音抑圧に適用した場合の雑音抑圧率が前記目標値を上回るとともに尖度指標が前記許容値を下回るように、前記抑圧強度を設定する
    プログラム。
JP2010263204A 2010-11-26 2010-11-26 音響処理装置およびプログラム Expired - Fee Related JP5728903B2 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
JP2010263204A JP5728903B2 (ja) 2010-11-26 2010-11-26 音響処理装置およびプログラム
US13/303,783 US20120134508A1 (en) 2010-11-26 2011-11-23 Audio Processing Apparatus
EP11009360A EP2458587A1 (en) 2010-11-26 2011-11-25 Audio processing apparatus

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010263204A JP5728903B2 (ja) 2010-11-26 2010-11-26 音響処理装置およびプログラム

Publications (2)

Publication Number Publication Date
JP2012113190A JP2012113190A (ja) 2012-06-14
JP5728903B2 true JP5728903B2 (ja) 2015-06-03

Family

ID=45092103

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010263204A Expired - Fee Related JP5728903B2 (ja) 2010-11-26 2010-11-26 音響処理装置およびプログラム

Country Status (3)

Country Link
US (1) US20120134508A1 (ja)
EP (1) EP2458587A1 (ja)
JP (1) JP5728903B2 (ja)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5982864B2 (ja) * 2012-02-23 2016-08-31 ヤマハ株式会社 オーディオアンプ
EP2858068A4 (en) * 2012-05-31 2016-02-24 Toyota Motor Co Ltd SOUND SOUND DETECTION DEVICE, NOISE GENERATION EQUIPMENT, NOISE REDUCTION APPARATUS, APPARATUS FOR ESTIMATING SOUND SOURCE DEVICE, DEVICE FOR RECOGNIZING A DEACTIVATIVE VEHICLE, AND NOISE REDUCTION METHOD
WO2014027419A1 (ja) * 2012-08-17 2014-02-20 Toa株式会社 雑音除去装置
EP2747081A1 (en) * 2012-12-18 2014-06-25 Oticon A/s An audio processing device comprising artifact reduction

Family Cites Families (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6088668A (en) * 1998-06-22 2000-07-11 D.S.P.C. Technologies Ltd. Noise suppressor having weighted gain smoothing
JP4003566B2 (ja) 2002-07-19 2007-11-07 株式会社豊田中央研究所 音声認識装置
JP4423300B2 (ja) * 2004-10-28 2010-03-03 富士通株式会社 雑音抑圧装置
US20100008520A1 (en) * 2008-07-09 2010-01-14 Yamaha Corporation Noise Suppression Estimation Device and Noise Suppression Device
JP5152800B2 (ja) * 2008-07-09 2013-02-27 国立大学法人 奈良先端科学技術大学院大学 雑音抑圧評価装置およびプログラム
JP5152799B2 (ja) * 2008-07-09 2013-02-27 国立大学法人 奈良先端科学技術大学院大学 雑音抑圧装置およびプログラム
JP5187666B2 (ja) * 2009-01-07 2013-04-24 国立大学法人 奈良先端科学技術大学院大学 雑音抑圧装置およびプログラム
JP5376635B2 (ja) * 2009-01-07 2013-12-25 国立大学法人 奈良先端科学技術大学院大学 雑音抑圧処理選択装置,雑音抑圧装置およびプログラム
JP2010220087A (ja) * 2009-03-18 2010-09-30 Yamaha Corp 音響処理装置およびプログラム
JP5207479B2 (ja) * 2009-05-19 2013-06-12 国立大学法人 奈良先端科学技術大学院大学 雑音抑圧装置およびプログラム
JP5633673B2 (ja) * 2010-05-31 2014-12-03 ヤマハ株式会社 雑音抑圧装置およびプログラム

Also Published As

Publication number Publication date
JP2012113190A (ja) 2012-06-14
EP2458587A1 (en) 2012-05-30
US20120134508A1 (en) 2012-05-31

Similar Documents

Publication Publication Date Title
JP5641186B2 (ja) 雑音抑圧装置およびプログラム
CN103067322B (zh) 评估单通道音频信号中的音频帧的语音质量的方法
JP4630980B2 (ja) 音高推定装置、音高推定方法およびプログラム
JP5187666B2 (ja) 雑音抑圧装置およびプログラム
JP5728903B2 (ja) 音響処理装置およびプログラム
US20140123836A1 (en) Musical composition processing system for processing musical composition for energy level and related methods
JP2008257049A (ja) 雑音抑圧装置およびプログラム
JP5152799B2 (ja) 雑音抑圧装置およびプログラム
JP5633673B2 (ja) 雑音抑圧装置およびプログラム
JP5609157B2 (ja) 係数設定装置および雑音抑圧装置
JP5152800B2 (ja) 雑音抑圧評価装置およびプログラム
JP5942388B2 (ja) 雑音抑圧用係数設定装置、雑音抑圧装置および雑音抑圧用係数設定方法
JP4953068B2 (ja) 和音判別装置、和音判別方法およびプログラム
JP5772723B2 (ja) 音響処理装置および分離マスク生成装置
JP2013170936A (ja) 音源位置判定装置、音源位置判定方法、プログラム
JP2013250356A (ja) 係数設定装置および雑音抑圧装置
JP2006178333A (ja) 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体
JP2002175099A (ja) 雑音抑制方法および雑音抑制装置
JP4630983B2 (ja) 音高推定装置、音高推定方法およびプログラム
JP4630982B2 (ja) 音高推定装置、音高推定方法およびプログラム
JP4630979B2 (ja) 音高推定装置、音高推定方法およびプログラム
JP2013182161A (ja) 音響処理装置およびプログラム
JP2014228697A (ja) 音響処理装置
JP2015169900A (ja) 雑音抑圧装置
JP6064561B2 (ja) 拍情報推定装置

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20131122

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20140117

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20140120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20140819

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20140826

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20150310

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20150323

LAPS Cancellation because of no payment of annual fees