JP6191238B2 - 音響処理装置および音響処理方法 - Google Patents

音響処理装置および音響処理方法 Download PDF

Info

Publication number
JP6191238B2
JP6191238B2 JP2013108126A JP2013108126A JP6191238B2 JP 6191238 B2 JP6191238 B2 JP 6191238B2 JP 2013108126 A JP2013108126 A JP 2013108126A JP 2013108126 A JP2013108126 A JP 2013108126A JP 6191238 B2 JP6191238 B2 JP 6191238B2
Authority
JP
Japan
Prior art keywords
coefficient
acoustic signal
index value
moving average
reverberation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013108126A
Other languages
English (en)
Other versions
JP2014228696A (ja
Inventor
近藤 多伸
多伸 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2013108126A priority Critical patent/JP6191238B2/ja
Publication of JP2014228696A publication Critical patent/JP2014228696A/ja
Application granted granted Critical
Publication of JP6191238B2 publication Critical patent/JP6191238B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

本発明は、音響信号を処理する技術に関し、特に、音響信号に含まれる残響成分を調整する技術に関する。
音響信号に含まれる残響成分を抑圧する技術が従来から提案されている。例えば特許文献1には、音響信号に含まれる残響成分を推定する予測フィルタ係数の確率モデルを利用することで残響成分の予測フィルタ係数を推定し、推定後の予測フィルタを利用して残響成分を抑圧する技術が開示されている。また、非特許文献1には、発音源から収音点までの伝達関数の逆フィルタを推定し、推定後の逆フィルタを音響信号に適用することで残響成分を抑圧する技術が開示されている。
特開2009−212599号公報
K. Furuya, et al."Robust speech dereverberation using multichannel blind deconvolution with spectral subtraction",IEEE Transantions on Audio, Speech, and Language Processing, vol. 15, no. 5, p.1579-1591, 2007
しかし、特許文献1の予測フィルタ係数や非特許文献1の逆フィルタの高精度な推定には膨大な演算が必要であるという問題がある。以上の事情を考慮して、本発明は、簡便な処理で音響信号の残響成分を調整(抑圧または強調)することを目的とする。
以上の課題を解決するために、本発明の音響処理装置は、残響時間に応じた第1移動平均係数(例えば平滑化係数α1,係数ζ1(ζ1n),平均個数M1)を算定する係数算定手段と、係数算定手段が算定した第1移動平均係数を適用した音響信号の強度の移動平均で第1指標値(例えば指標値R1(k,m))を算定する指標算定手段と、音響信号の残響成分を調整するための調整値を、指標算定手段が算定した第1指標値と、当該第1指標値を上回る追従性で音響信号の強度に追従する第2指標値(例えば指標値R2(k,m))とに応じて算定する調整値算定手段とを具備する。例えば、調整値算定手段は、第1指標値を分母に包含するとともに第2指標値を分子に包含する演算により調整値を算定する。以上の構成では、音響信号の強度の移動平均で調整値が算定されるから、簡便な処理で音響信号の残響成分を調整することが可能である。また、残響時間に応じて第1移動平均係数が可変に算定されるから、音響信号の残響成分を高精度に抑圧可能な調整値を算定できるという利点もある。
本発明の好適な態様において、係数算定手段は、残響時間と、音響信号のうち強度が算定される各単位期間の時間差(例えば時間差TS)とに応じて、第1移動平均係数を算定する。以上の態様では、残響時間と各単位期間の時間差とに応じて第1移動平均係数が算定されるから、各単位期間の時間差が変更された場合でも、音響信号の残響成分を高精度に抑圧可能な調整値を算定できる利点がある。
本発明の好適な態様において、指標算定手段は、第1移動平均係数を適用した音響信号の強度の移動平均で第1指標値を算定するとともに、第1移動平均係数とは相違する第2移動平均係数(例えば平滑化係数α2,係数ζ2(ζ2n),平均個数M2)を適用した音響信号の強度の移動平均で第2指標値を算定し、係数算定手段は、第1移動平均係数に対応する第1調整成分(例えば調整成分G1(ω))と第2移動平均係数に対応する第2調整成分(例えば調整成分G2(ω))とを含む調整値のうちの第1調整成分が、音響信号に付与された残響効果の振幅-周波数特性の逆特性に近似するように、第1移動平均係数を算定する。以上の構成では、調整値の第1調整成分が残響効果の振幅-周波数特性の逆特性に近似するように第1移動平均係数が算定されるから、音響信号の残響成分を高精度に抑圧可能な調整値を算定できるという効果は格別に顕著である。
ただし、第1調整成分が残響成分の振幅-周波数特性の逆特性に近似するという条件だけでは、変調周波数の高域側の音響成分が過剰に強調される可能性がある。以上の事情を考慮すると、第2調整成分が、第1調整成分と音響信号に付与された残響効果の振幅-周波数特性との積の逆特性に近似するように、第2移動平均係数を算定する構成が好適である。以上の構成によれば、第1調整成分の振幅-周波数特性に起因した高域側の過剰な強調が抑制されるから、音響信号の残響成分を高精度に抑圧可能な調整値を算定できるという効果は格別に顕著である。なお、残響成分の振幅-周波数特性は、例えば変調伝達関数(例えば変調伝達関数Ψ(ω))で近似的に表現される。
以上の各態様に係る音響処理装置は、音響信号の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)等の汎用の演算処理装置とプログラムとの協働によっても実現される。コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、例えば、本発明のプログラムは、通信網を介した配信の形態で提供されてコンピュータにインストールされ得る。
本発明の好適な態様に係る音響処理装置の構成図である。 解析処理部の構成図である。 各指標値と調整値との関係の説明図である。 変調伝達関数のグラフである。 調整成分G1(ω)の振幅-周波数特性である。 調整成分G1(ω)と変調伝達関数Ψ(ω)との積の振幅-周波数特性である。 調整成分G2(ω)の振幅-周波数特性である。 調整値G(ω)と変調伝達関数Ψ(ω)との積の振幅-周波数特性である。 演算処理装置の動作のフローチャートである。 変形例における音響処理装置の部分的な構成図である。
図1は、本発明の好適な実施形態に係る音響処理装置100の構成図である。図1に示すように、音響処理装置100には信号供給装置12と放音装置14とが接続される。信号供給装置12は、音響信号xを音響処理装置100に供給する。音響信号xは、発音源から放射された音響に対して音響空間内で反射または散乱した残響成分(初期反射成分および後期残響成分)を付加した音響の時間波形を示すサンプル系列である。例えば、収録音や合成音等の既存の音響に対して事後的に残響効果を付与した音響信号xや、残響効果がある音響空間(例えば音響ホール等)内で実際に収録された音響の音響信号xが好適に利用される。周囲の音響を収音して音響信号xを生成する収音装置や、可搬型または内蔵型の記録媒体から音響信号xを取得して音響処理装置100に供給する再生装置や、通信網から音響信号xを受信して音響処理装置100に供給する通信装置が信号供給装置12として採用され得る。
音響処理装置100は、音響信号xの残響成分(後期残響成分)を抑圧した時間領域の音響信号yを生成する残響抑圧装置である。放音装置14(例えばスピーカやヘッドホン)は、音響処理装置100が生成した音響信号yに応じた音波を再生する。なお、音響信号yをデジタルからアナログに変換するD/A変換器や音響信号yを増幅する増幅器等の図示は便宜的に省略した。
図1に示すように、音響処理装置100は、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムや演算処理装置22が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体や複数種の記録媒体の組合せが記憶装置24として任意に採用され得る。音響信号xを記憶装置24に記憶した構成(したがって信号供給装置12は省略される)も好適である。
演算処理装置22は、記憶装置24に記憶されたプログラムを実行することで、音響信号xから音響信号yを生成するための複数の機能(周波数分析部32,残響調整部34,波形生成部36,変数設定部42,解析処理部44)を実現する。なお、演算処理装置22の各機能を複数の装置に分散した構成や、専用の電子回路(例えばDSP)が演算処理装置22の一部の機能を実現する構成も採用され得る。
周波数分析部32は、音響信号xを構成する複数の周波数成分(周波数スペクトル)X(k,m)を時間軸上の単位期間(フレーム)毎に順次に生成する。記号kは、周波数軸上に離散的に設定された複数の周波数(帯域)のうち任意の1個の周波数を指定する変数であり、記号mは、時間軸上の任意の1個の単位期間(時間軸上の特定の時点)を指定する変数である。時間軸上で相前後する各単位期間の時間差(フレームシフト)TSは単位期間の時間長を下回る。したがって、相前後する各単位期間は時間軸上で相互に重複する。各周波数成分X(k,m)の算定には、短時間フーリエ変換等の公知の周波数解析が任意に採用され得る。
変数設定部42は、音響信号xの処理に適用される各変数の数値を設定する。具体的には、本実施形態の変数設定部42は、周波数分析部32による各周波数成分X(k,m)の生成(短時間フーリエ変換)に適用される各単位期間の時間差TSと、音響信号xの残響成分に想定される残響時間(例えば音響信号xが発音および収録された音響空間の残響時間)TRとを可変に設定する。具体的には、変数設定部42は、例えば入力装置(図示略)に対する利用者からの指示に応じて時間差TSを設定する。
また、変数設定部42は、例えば入力装置に対する利用者からの指示(残響時間TRの指定)に応じて残響時間TRを設定する。なお、音響空間内の音響の収音で音響信号xを生成する収音装置を信号供給装置12として採用した構成では、所定の測定用信号を音響空間内に放音したときに収録される音響信号xを解析することで変数設定部42が残響時間TRを実測することも可能である。残響時間TRの測定には、例えばインパルス積分法(Schroeder法)やマルチステップ線形予測等の公知の残響解析技術が任意に採用され得る。また、周波数が時間的に連続に変化する時間伸長信号(TSP:Time Stretched Pulse)が測定用信号として好適である。
解析処理部44は、音響信号xの各周波数成分X(k,m)に応じた調整値G(k,m)を各周波数成分X(k,m)について単位期間毎に算定する。本実施形態の調整値G(k,m)は、音響信号xの残響成分を抑圧するための変数である。概略的には、第m番目の単位期間の音響信号xのうち第k番目の周波数成分X(k,m)において残響成分が優勢であるほど調整値G(k,m)は小さい数値に設定されるという傾向がある。
残響調整部34は、解析処理部44が算定した各調整値G(k,m)を音響信号xに作用させる。具体的には、残響調整部34は、各周波数成分X(k,m)について算定された調整値G(k,m)を当該周波数成分X(k,m)に乗算することで音響信号yの各周波数成分(周波数スペクトル)Y(k,m)を算定する(Y(k,m)=G(k,m)・X(k,m))。以上の説明から理解される通り、調整値G(k,m)は、音響信号xの周波数成分X(k,m)に対するゲイン(スペクトルゲイン)に相当する。
波形生成部36は、残響調整部34が算定する各周波数成分Y(k,m)から時間領域の音響信号yを生成する。すなわち、波形生成部36は、各周波数成分Y(k,m)を単位期間毎に短時間逆フーリエ変換で時間領域の信号に変換し、相前後する各単位期間の信号を相互に重複させた状態で加算することで音響信号yを生成する。波形生成部36が生成した音響信号yが放音装置14に供給されて音波として再生される。
図2は、解析処理部44の構成図である。図2に例示される通り、解析処理部44は、係数算定部52と指標算定部54と調整値算定部56とを含んで構成される。指標算定部54は、音響信号xの各周波数成分X(k,m)に応じた指標値R1(k,m)および指標値R2(k,m)を単位期間毎に順次に算定する。本実施形態の指標算定部54は、音響信号xの各周波数成分X(k,m)の強度(パワー)|X(k,m)|2の時系列を平滑化することで各周波数の指標値R1(k,m)および指標値R2(k,m)を算定する。具体的には、以下の数式(1A)および数式(1B)で表現される通り、音響信号xの強度|X(k,m)|2の指数移動平均が指標値R1(k,m)および指標値R2(k,m)として算定される。
Figure 0006191238
記号αi(i=1,2)は、指数移動平均の平滑化係数(すなわち、強度|X(k,m)|2の平滑化の時定数を規定する係数)であり、1未満の正数に設定される。平滑化係数αiは、過去の指標値Ri(k,m-1)に対する最新(現在)の強度|X(k,m)|2の加重値に相当する。
図2の係数算定部52は、平滑化係数α1および平滑化係数α2を設定する。平滑化係数α2は、平滑化係数α1を上回る数値に設定される(α2>α1)。したがって、指標値R1(k,m)における強度|X(k,m)|2の平滑化の時定数τ1は、指標値R2(k,m)における強度|X(k,m)|2の平滑化の時定数τ2を上回る(τ1>τ2)。係数算定部52が各平滑化係数αiを算定する具体的な動作については後述する。指標算定部54は、係数算定部52が設定した各平滑化係数αiを適用した音響信号xの強度|X(k,m)|2の指数移動平均を指標値R1(k,m)および指標値R2(k,m)として算定する。
図3の部分(B)には、音響信号xの1個の周波数の周波数成分X(k,m)から算定される指標値R1(k,m)および指標値R2(k,m)の時間変化が例示されている。図3の部分(A)のように強度|X(k,m)|2が指数減衰する室内インパルス応答(RIR:Room Impulse Response)を音響信号xとして音響処理装置100に供給した場合の指標値R1(k,m)および指標値R2(k,m)が図3の部分(B)には図示されている。
図3の部分(B)から理解される通り、指標値R1(k,m)および指標値R2(k,m)は、音響信号xの強度|X(k,m)|2に追従して経時的に変化する。ただし、前述の通り、指標値R1(k,m)の時定数τ1は指標値R2(k,m)の時定数τ2を上回るから、指標値R1(k,m)は、指標値R2(k,m)と比較して低い追従性で音響信号xの強度|X(k,m)|2の変動に追従する。具体的には、図3の部分(B)から把握される通り、室内インパルス応答の開始の時点t0の直後の区間では、指標値R2(k,m)が指標値R1(k,m)を上回る変化率で急峻に増加する。そして、指標値R1(k,m)および指標値R2(k,m)は、時間軸上の相異なる時点で極大値に到達し、指標値R2(k,m)は指標値R1(k,m)を上回る変化率で減少する。
以上のように指標値R1(k,m)と指標値R2(k,m)とは相異なる変化率で変化するから、指標値R1(k,m)と指標値R2(k,m)との大小は時間軸上の特定の時点txで反転する。すなわち、時点t0から時点txまでの区間SAでは指標値R2(k,m)が指標値R1(k,m)を上回り、時点tx以降の区間SBでは指標値R1(k,m)が指標値R2(k,m)を上回る。区間SAは、室内インパルス応答のうち直接音および初期反射成分が存在する区間に相当し、区間SBは、室内インパルス応答のうち後期残響成分が存在する区間に相当する。
図2の調整値算定部56は、指標算定部54が算定した指標値R1(k,m)と指標値R2(k,m)とに応じた調整値G(k,m)を各周波数について単位期間毎に算定する。具体的には、調整値算定部56は、以下の数式(2)で表現される通り、指標値R1(k,m)に対する指標値R2(k,m)の相対比を調整値G(k,m)として算定する。ただし、指標値R1(k,m)に対する指標値R2(k,m)の相対比が数値1を上回る場合には、調整値G(k,m)は数値1(調整値G(k,m)の上限値)に設定される。なお、調整値G(k,m)の上限値は任意であり、例えば数値1を下回る所定の正数(例えば0.9)にも設定され得る。
Figure 0006191238
指標値R1(k,m)と指標値R2(k,m)とが図3の部分(B)のように変化する場合の調整値G(k,m)の時間変化が図3の部分(C)に例示されている。図3の部分(C)から理解される通り、指標値R2(k,m)が指標値R1(k,m)を上回る区間SA(直接音および初期反射成分が存在する区間)では調整値G(k,m)は最大値1に設定され、指標値R1(k,m)が指標値R2(k,m)を上回る区間SB(後期残響成分が存在する区間)では調整値G(k,m)は経時的に減少する。したがって、指標算定部54が算定した調整値G(k,m)を残響調整部34が音響信号xに作用させることで、音響信号xの残響成分を抑圧した音響信号yが生成される。以上に説明した通り、本実施形態では、音響信号xの強度|X(k,m)|2に相異なる時定数で追従する指標値R1(k,m)および指標値R2(k,m)に応じて調整値G(k,m)が算定されるから、特許文献1や非特許文献1の技術と比較して簡便に音響信号xの残響成分を抑圧できるという利点がある。
係数算定部52による平滑化係数αiの設定について以下に詳述する。以下の説明では、数式(3)で表現される通り、数式(1A)および数式(1B)の係数{1−αi}を便宜的に係数(忘却係数)ζiに置換する。
Figure 0006191238
数式(3)をZ変換すると以下の数式(4)が導出される。
Figure 0006191238

数式(4)から以下の数式(5)が導出される。
Figure 0006191238
数式(5)で表現される指標値R1[z]および指標値R2[z]を前掲の数式(2)に適用することで、調整値G[z]を表現する以下の数式(6)が導出される。
Figure 0006191238
数式(6)から理解される通り、調整値G[z]は、係数ζ1に対応する数式(7A)の調整成分G1[z]と、係数ζ2に対応する数式(7B)の調整成分G2[z]とに分解される(G[z]=G1[z]・G2[z])。
Figure 0006191238
ところで、音響信号xに付与された残響効果の振幅-周波数特性は、変調角周波数ωと残響時間TRとを変数とする数式(8)の変調伝達関数Ψ(ω)で近似される。なお、数式(8)の変調伝達関数Ψ(ω)については、例えば、M. Unoki, et. al., "An improved method based on the MTF concept for restoring the power envelope from a reverberant signal", Acoustical science and technology 25(4), p. 232-242にも詳述されている。
Figure 0006191238
図4は、残響時間TRを相違させた複数の場合(TR=0.1,0.3,0.5,1,2[sec])について変調周波数f(ω=2πf)と変調伝達関数Ψ(ω)との関係を併記したグラフである。図4から理解される通り、変調周波数f(変調角周波数ω)の高域側ほど変調伝達関数Ψ(ω)の数値は減少し、残響時間TRが長いほど高域側での変調伝達関数Ψ(ω)の減少が顕著である、という概略的な傾向がある。
以上に説明した変調伝達関数Ψ(ω)と調整値G[z]との対比を検討する観点から、数式(7A)および数式(7B)に変調角周波数ωを導入すると、以下の数式(9A)および数式(9B)が導出される。数式(9A)および数式(9B)の記号jは虚数単位を意味し、記号TSは、前述の通り、時間軸上で相前後する各単位期間の時間差(フレームシフト)に相当する。
Figure 0006191238
本実施形態の係数算定部52は、調整値G(k,m)の作用で音響信号xの残響成分が有効に抑圧されるように平滑化係数α1(係数ζ1)および平滑化係数α2(係数ζ2)を算定する。具体的には、調整値G(k,m)の作用が残響成分の振幅-周波数特性の逆特性(変調伝達関数Ψ(ω)の逆特性)に近似するように平滑化係数α1および平滑化係数α2が算定される。係数ζ1および係数ζ2の具体的な算定方法を以下に詳述する。
<平滑化係数α1(係数ζ1)の算定>
数式(9A)の調整成分G1(ω)の振幅-周波数特性は、以下の数式(10)で表現される。
Figure 0006191238
数式(10)の右辺の余弦項(cosωTS)をTaylor展開することで、以下の数式(11)が導出される。
Figure 0006191238
数式(8)の変調伝達関数Ψ(ω)で表現される残響効果を音響信号x(周波数成分X(k,m))に対する調整成分G1(ω)の作用で抑圧するためには、調整成分G1(ω)の振幅-周波数特性が変調伝達関数Ψ(ω)の逆特性に近似する必要がある(|G(ω)|・Ψ(ω)=1)。数式(11)の総和項(Σ)を便宜的に無視したうえで、数式(8)の変調伝達関数Ψ(ω)と数式(11)の調整成分G1(ω)との類似性に着目すると、以下の数式(12)が成立する場合に、調整成分G1(ω)の振幅-周波数特性が変調伝達関数Ψ(ω)の逆特性に近似すると理解できる。
Figure 0006191238
数式(12)は、係数ζ1の2次方程式である。数式(12)に2次方程式の解の公式を適用すると、残響時間TRと時間差TSとに応じて係数ζ1を算定する以下の数式(13)が導出される。なお、数式(13)の導出(2次方程式の求解)では、係数ζ1の値域(ζ1<1)を考慮して解の符号を採択した。
Figure 0006191238
本実施形態の係数算定部52は、変数設定部42が設定した時間差TSおよび残響時間TRを数式(13)に適用することで時間差TSおよび残響時間TRに応じた係数ζ1を算定し、当該係数ζ1に応じた平滑化係数α1(α1=1−ζ1)を算定する。
<平滑化係数α2(係数ζ2)の算定>
図5は、数式(13)で算定された係数ζ1を数式(9A)に適用することで算定される調整成分G1(ω)の振幅-周波数特性である。図5および後掲の図6から図8では、残響時間TRを相違させた複数の場合(TR=0.3,0.8,1.2)について周波数特性が併記されている。図5から理解される通り、変調周波数f(変調角周波数ω)の高域側ほど調整成分G1(ω)の数値は増加し(高域通過特性)、残響時間TRが長いほど高域側での調整成分G1(ω)の増加が顕著である、という傾向がある。
図6は、図5の調整成分G1(ω)と変調伝達関数Ψ(ω)との積{|G1(ω)|Ψ(ω)}の振幅-周波数特性である。図6から理解される通り、変調周波数f(変調角周波数ω)の高域側ほど調整成分G1(ω)と変調伝達関数Ψ(ω)との積{|G1(ω)|Ψ(ω)}は増加するという傾向がある。したがって、調整成分G1(ω)を調整値G(k,m)として音響信号xの周波数成分X(k,m)に作用させた場合、音響信号yでは、変調周波数fの高域側の音響成分が過剰に強調される可能性がある。以上の事情を考慮して、本実施形態では、変調周波数fの高域側ほど積{|G1(ω)|Ψ(ω)}が増加するという以上の傾向が抑制されるように調整成分G2(k,m)の係数ζ2(平滑化係数α2)を算定する。
具体的には、本実施形態の係数算定部52は、調整成分G1(ω)と変調伝達関数Ψ(ω)との積{|G1(ω)|Ψ(ω)}の逆特性に調整成分G2(ω)の振幅-周波数特性が近似するように係数ζ2(平滑化係数α2)を算定する。係数ζ2の算定には公知の技術が任意に採用され得るが、例えば以下に例示される通り、自己回帰(AR:Auto-Regressive)モデルを規定する自己回帰係数の算定に利用されるYule-Walker法が好適である。
具体的には、係数算定部52は、数式(13)で算定した係数ζ1を数式(9A)に適用することで算定される調整成分G1(ω)と数式(8)の変調伝達関数Ψ(ω)との積{|G1(ω)|Ψ(ω)}の逆特性(1/{|G1(ω)|Ψ(ω)})のパワースペクトルを逆フーリエ変換することで自己相関関数を算定し(Wiener-Khinchinの定理)、自己相関関数を適用したYule-Walker方程式(正規方程式)から自己回帰係数を算定する。Yule-Walker方程式の解法としてはDurbinの再帰法(Levinson-Durbinアルゴリズム)が好適に利用される。
調整成分G1(ω)と変調伝達関数Ψ(ω)との積{|G1(ω)|Ψ(ω)}の逆特性は、以下の数式(14)で表現されるIIR(Infinite Impulse Response)フィルタで近似され、以上に説明したYule-Walker法で算定される自己回帰係数は、数式(14)のIIRフィルタの係数a1に相当する。
Figure 0006191238

数式(7B)で表現される調整成分G2[z]と数式(14)のIIRフィルタとの類似性に着目すると、数式(14)の係数a1(Yule-Walker法で算定された自己回帰係数)が調整成分G2[z]の係数ζ2に対応する(a1=−ζ2)と理解できる。なお、数式(7B)の分子の係数{1−ζ2}は、形式的な係数(ゲイン項)であり振幅-周波数特性の本質的な傾向には関与しないから便宜的に無視することが可能である。また、IIRフィルタの係数a1は負数であるから、数式(7B)の係数ζ2の値域(ζ2>0)とも整合する。
以上の説明から理解される通り、係数算定部52は、調整成分G1(ω)と変調伝達関数Ψ(ω)との積{|G1(ω)|Ψ(ω)}の逆特性に近似する周波数特性のフィルタ(IIRフィルタ)の係数a1に応じて調整成分G2(k,m)の係数ζ2を算定し、当該係数ζ2に応じた平滑化係数α2(α2=1−ζ2)を算定する。
図7は、以上の手順で算定された係数ζ2を数式(9B)に適用することで算定される調整成分G2(ω)の振幅-周波数特性である。図7から理解される通り、調整成分G2(ω)の振幅-周波数特性には、調整成分G1(ω)の振幅-周波数特性とは逆に、変調周波数fの高域側ほど調整成分G2(ω)の数値が減少し(低域通過特性)、残響時間TRが長いほど高域側での調整成分G2(ω)の減少が顕著である、という傾向がある。
図8は、以上の手順で算定された係数ζ1および係数ζ2を数式(9A)および数式(9B)に適用することで算定される調整値G(ω)と数式(8)の変調伝達関数Ψ(ω)との積{|G(ω)|Ψ(ω)}の振幅-周波数特性である。図6と図8とを対比すると、係数算定部52が算定した係数ζ2に応じた調整成分G2(ω)を加味することで、調整成分G1(ω)と変調伝達関数Ψ(ω)との積{|G1(ω)|Ψ(ω)}が変調周波数fの高域側ほど増加する(高域側が過剰に強調される)という図6の傾向が抑制されることが理解できる。
図9は、記憶装置24に記憶されたプログラムに従って演算処理装置22が実行する残響調整処理のフローチャートである。入力装置(図示略)に対する利用者からの指示(残響調整処理の開始指示)を契機として残響調整処理が開始される。残響調整処理を開始すると、変数設定部42は、各単位期間の時間差TSと残響時間TRとを設定する(S1)。解析処理部44の係数算定部52は、変数設定部42が設定した時間差TSおよび残響時間TRに応じて平滑化係数α1(係数ζ1)と平滑化係数α2(係数ζ2)とを算定する(S2)。
以上の手順で各変数が設定されると、単位期間毎に以下のステップS3からステップS7の処理が実行される。まず、周波数分析部32は、変数設定部42が設定した時間差TSに応じて時間軸上に画定された単位期間について音響信号xの各周波数の周波数成分X(k,m)を算定する(S3)。そして、解析処理部44の指標算定部54は、係数算定部52が算定した平滑化係数α1および平滑化係数α2と周波数分析部32が算定した周波数成分X(k,m)とを適用した数式(1A)および数式(1B)の演算で指標値R1(k,m)および指標値R2(k,m)を算定する(S4)。調整値算定部56は、指標算定部54が算定した指標値R1(k,m)および指標値R2(k,m)を適用した数式(2)の演算で各周波数の調整値G(k,m)を算定する(S5)。
残響調整部34は、指標算定部54がステップS5で算定した調整値G(k,m)を音響信号xの各周波数成分X(k,m)に作用させることで周波数成分Y(k,m)を算定する(S6)。波形生成部36は、残響調整部34が算定した各周波数成分Y(k,m)から単位期間の音響信号yを生成する(S7)。音響信号xの全部の単位期間について以上の処理(S3〜S7)が反復される(S8:NO)ことで、音響信号xの残響成分を抑圧した音響信号yが生成される。
以上に説明した通り、本実施形態では、残響時間TRおよび時間差TSに応じて平滑化係数α1(係数ζ1)および平滑化係数α2(係数ζ2)が算定されるから、平滑化係数α1および平滑化係数α2を、残響時間TRや時間差TSに依存しない所定値に固定した構成と比較して、音響信号xの残響成分を高精度に調整可能な調整値G(k,m)を算定できるという利点がある。
また、調整成分G1(k,m)の作用が残響成分の振幅-周波数特性(変調伝達関数Ψ(ω))の逆特性に近似するように係数ζ1が算定されるから、音響信号xの残響成分は有効に調整される。しかも、調整成分G1(ω)と残響効果の振幅-周波数特性(変調伝達関数Ψ(ω))との積{|G1(ω)|Ψ(ω)}の逆特性に調整成分G2(ω)の振幅-周波数特性が近似するように係数ζ2が算定されるから、調整成分G1(ω)と変調伝達関数Ψ(ω)との積{|G1(ω)|Ψ(ω)において変調周波数fの高域側が強調される傾向は抑制される。したがって、音響信号xの残響成分を調整値G(k,m)で高精度に調整できるという効果は格別に顕著である。
<変形例>
以上に例示した形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
(1)平滑化係数α1(係数ζ1)および平滑化係数α2(係数ζ2)の算定方法は前述の例示に限定されない。例えば、前述の形態では係数ζ2の算定に自己回帰モデルを利用したが、以下に例示される通り、自己回帰移動平均(ARMA:Auto-Regressive Moving Average)モデルを利用して係数ζ1と係数ζ2とを算定することも可能である。前述の形態では、係数ζ1と係数ζ2とを段階的に算定したが、自己回帰移動平均モデルを利用した構成によれば、係数ζ1と係数ζ2とを一括的に算定することが可能である。
以下の数式(15)の左辺で表現される1次の自己回帰移動平均モデルの伝達関数は、数式(15)の右辺のように変形される。
Figure 0006191238
数式(6)で表現される調整値G[z]と数式(15)の変形後の自己回帰移動平均モデルとの類似性に着目すると、自己回帰移動平均モデルの各係数(a1,b0,b1)と係数ζ1およびζ2との間に以下の数式(16)の対応があると理解できる。
Figure 0006191238

なお、数式(16)の記号σは、変数の自由度を補償するための便宜的な係数を意味する。数式(16)から以下の数式(17)が導出される。
Figure 0006191238
係数算定部52は、残響成分の振幅-周波数特性の逆特性(数式(8)の変調伝達関数Ψ(ω)の逆特性)に近似するように自己回帰移動平均モデルの各係数(a1,b0,b1)を算定する。そして、係数算定部52は、自己回帰移動平均モデルの各係数を数式(17)に適用することで係数ζ1と係数ζ2と係数σとを算定し、係数ζ1に応じた平滑化係数α1と係数ζ2に応じた平滑化係数α2とを算定する。自己回帰移動平均モデルの各係数(a1,b0,b1)の算定には、修正型Yule-Walker(MYW:Modified Yule-Walker)法が好適に利用される。以上の説明から理解される通り、自己回帰移動平均モデルを利用することで、係数ζ1(平滑化係数α1)と係数ζ2(平滑化係数α2)とを一括的に算定することが可能である。
他方、指標算定部54は、係数算定部52が算定した平滑化係数α1および平滑化係数α2に応じた指標値R1(k,m)および指標値R2(k,m)を算定し、調整値算定部56は、係数σを含む以下の数式(18)の演算で調整値G(k,m)を算定する。
Figure 0006191238
なお、以上の説明では1次の自己回帰移動平均モデルを例示したが、同様の構成を、以下に例示する通り、高次の自己回帰移動平均モデルまで拡張ないし一般化することも可能である。以下の数式(19)の左辺で表現されるN次の自己回帰移動平均モデルの伝達関数は、数式(19)の右辺のように変形される。
Figure 0006191238
また、調整値G[z]についても以下の数式(20)のように高次に拡張される。
Figure 0006191238
数式(20)の調整値G[z]と数式(19)の変形後の自己回帰移動平均モデルとの類似性に着目すると、係数ζ1nと係数ζ2nと係数σとを算定するための以下の数式(21)が導出される。
Figure 0006191238
係数算定部52は、例えば前述の修正型Yule-Walker法を利用して、残響成分の振幅-周波数特性の逆特性に近似するように自己回帰移動平均モデルの各係数(an,b0,bn)を算定し、各係数を数式(21)に適用することで係数ζ1nと係数ζ2nと係数σとを算定する。指標算定部54は、係数算定部52が算定した係数ζ1nを以下の数式(22A)に適用することで指標値R1(k,m)を算定し、係数ζ2nを以下の数式(22B)に適用することで指標値R2(k,m)を算定する。調整値算定部56は、係数算定部52が算定した係数σと指標算定部54が算定した指標値R1(k,m)および指標値R2(k,m)とを前掲の数式(18)に適用することで調整値G(k,m)を算定する。
Figure 0006191238
以上の例示から理解される通り、調整値G(k,m)の作用が残響成分の振幅-周波数特性の逆特性(変調伝達関数Ψ(ω)の逆特性)に近似するように、音響信号xの強度|X(k,m)|2の平滑化に適用される係数(ζ1,ζ2,ζ1n,ζ2n)を算定する構成が好適であり、残響成分の振幅-周波数特性の逆特性を表現する時系列モデルの種類(FIR型/IIR型)や時系列モデルの各係数の算定方法は任意である。
(2)前述の形態における周波数分析部32と残響調整部34と波形生成部36とは、音響信号xを時間領域で処理する図10の要素(周波数分析部62,残響調整部64,波形生成部66)に置換され得る。なお、解析処理部44の構成および動作は前述の形態と同様である。変数設定部42は、前述の形態と同様に残響時間TRを設定するほか、音響信号xのサンプリング周期を時間差TSとして指定する。
周波数分析部62は、帯域分割部622と包絡抽出部624とを含んで構成される。帯域分割部622は、信号供給装置12から供給される音響信号xを、相異なる周波数帯域に対応する複数の帯域成分x(k)(x(1),x(2),……)に時間領域で分解する。例えば、通過帯域が相違する複数の帯域通過フィルタで構成されるフィルタバンクが帯域分割部622として利用される。包絡抽出部624は、複数の帯域成分x(k)の各々を包絡成分xE(k)と残余成分xR(k)とに分解する。包絡成分xE(k)は、帯域成分x(k)の時間波形の包絡線に相当する成分であり、残余成分xR(k)は、帯域成分x(k)から包絡成分xE(k)を除外した成分である。包絡成分xE(k)の抽出には、例えばヒルベルト変換等の公知の信号処理技術が任意に採用される。
残響調整部64は、周波数分析部62(包絡抽出部624)が生成した各包絡成分xE(k)に、解析処理部44が生成した調整値G(k,m)を作用させる。具体的には、残響調整部64は、包絡成分xE(k)に調整値G(k,m)を乗算することで包絡成分yE(k)を生成する。包絡成分xE(k)の時間軸上の各サンプルには、解析処理部44が当該サンプルの時点について算定した調整値G(k,m)が乗算される。
波形生成部66は、第1合成部662と第2合成部664とを含んで構成される。第1合成部662は、残響調整部64が各周波数帯域について生成した包絡成分yE(k)と、当該周波数帯域の残余成分xR(k)とを合成(例えば乗算や加算)することで帯域成分y(k)を生成する。以上の説明から理解される通り、帯域成分y(k)は、帯域成分x(k)から残響成分を抑圧した音響成分である。第2合成部664は、第1合成部662が生成した複数の帯域成分y(k)を合成(例えば加算)することで音響信号yを生成する。図10の構成でも、前述の形態と同様の効果が実現される。
(3)前述の形態では、音響信号xの強度|X(k,m)|2の移動平均を指標値R2(k,m)として算定したが、強度|X(k,m)|2を指標値R2(k,m)として利用することも可能である。すなわち、指標値R2(k,m)の算定について強度|X(k,m)|2の移動平均は省略され得る。したがって、係数算定部52による係数ζ2の算定も省略され得る。以上の説明から理解される通り、指標値R2(k,m)は、指標値R1(k,m)と比較して高い追従性で音響信号xの時間変化に追従する数値として包括される。
(4)前述の各形態では、音響信号xの強度|X(k,m)|2の指数移動平均を指標値R1(k,m)および指標値R2(k,m)として算定したが、指標値R1(k,m)および指標値R2(k,m)の算定方法は適宜に変更される。例えば、音響信号xの強度|X(k,m)|2の単純移動平均(あるいは加重移動平均)を指標値R1(k,m)および指標値R2(k,m)として算定することも可能である。
具体的には、指標算定部54は、M1個の単位期間にわたる強度|X(k,m)|2の単純移動平均を指標値R1(k,m)として算定し、M2個の単位期間にわたる強度|X(k,m)|2の単純移動平均を指標値R2(k,m)として算定する。平均個数M1は、前述の指数移動平均に適用される平滑化係数α1に対応し、平均個数M2は、指数移動平均に適用される平滑化係数α2に対応する。すなわち、平均個数M1が平均個数M2を上回る数値に設定されることで、前述の形態と同様に、指標値R1(k,m)は、指標値R2(k,m)と比較して低い追従性で音響信号xの強度|X(k,m)|2の変動に追従する。以上の説明から理解される通り、指数移動平均に適用される平滑化係数(α1,α2)や係数(ζ1,ζ2)に加えて単純移動平均の平均個数(M1,M2)も、移動平均に適用される移動平均係数の概念に包含される。
(5)前述の形態では、音響信号xの残響成分を抑圧する調整値G(k,m)を例示したが、音響信号xの残響成分を強調(抽出)する場合にも本発明は適用される。例えば、数式(2)で算定される調整値G(k,m)を所定値(例えば1)から減算した調整値{1−G(k,m)}を音響信号xに作用させれば、残響成分を強調した音響信号yを生成することが可能である。以上の説明から理解される通り、調整値算定部56は、音響信号xの残響成分を調整(抑圧または強調)するための調整値を算定する要素として包括される。
(6)指標値R1(k,m)および指標値R2(k,m)に応じて調整値G(k,m)を算定する方法は前述の例示に限定されない。例えば、指標値R1(k,m)および指標値R2(k,m)を変数とする所定の演算により調整値G(k,m)を算定する構成も採用される。以上の説明から理解される通り、調整値算定部56は、音響信号xの残響成分を調整(抑圧または強調)するための調整値G(k,m)を指標値R1(k,m)および指標値R2(k,m)に応じて算定する要素として包括される。
(7)前述の形態では、変数設定部42が各単位期間の時間差TSと残響時間TRとを可変に設定したが、残響時間TRおよび時間差TSの一方を所定値に固定することも可能である。したがって、係数算定部52は、残響時間TRおよび時間差TSの少なくとも一方に応じて係数ζ1および係数ζ2を算定する要素として表現される。例えば既知の残響時間TRを適用する構成では残響時間TRの算定が省略されるから、演算能力が低い情報処理装置(例えば携帯機器)でも音響処理装置100を実現することが可能である。なお、残響時間TRは、音響空間の気温等の要因にも依存するが、音響空間の音響特性に基本的には依存するから、ひとつの音響空間については、1回の演算で算定された残響時間TRを複数回にわたり継続的に適用することが可能である。なお、相異なる音響空間について事前に測定された複数の残響時間TRのうち音響信号xが収録された場所(例えば音響処理装置100が使用される場所)に対応する残響時間TRを選択して平滑化係数α1の算定に適用することも可能である。
(8)前述の各形態では、音響信号xの強度(パワー)|X(k,m)|2の時系列を平滑化することで指標値R1(k,m)および指標値R2(k,m)を算定したが、指標算定部54による平滑化の対象はパワー(振幅の2乗ドメイン)に限定されない。例えば、音響信号xの振幅|X(k,m)|や振幅|X(k,m)|の4乗|X(k,m)|4を音響信号xの強度として指標値R1(k,m)および指標値R2(k,m)を算定することも可能である。また、音響信号xの振幅|X(k,m)|や振幅|X(k,m)|の4乗|X(k,m)|4に残響調整部34が調整値G(k,m)を作用させる構成も採用され得る。
(9)携帯電話機等の端末装置と通信するサーバ装置(典型的にはウェブサーバ)で音響処理装置100を実現することも可能である。例えば、音響処理装置100は、端末装置から受信した音響信号xから音響信号yを生成して端末装置に送信する。なお、音響信号xの各周波数成分X(k,m)が端末装置から送信される構成(例えば端末装置が周波数分析部32を具備する構成)では音響処理装置100から周波数分析部32が省略され、残響成分の調整後の各周波数成分Y(k,m)を音響処理装置100から端末装置に送信する構成(例えば端末装置が波形生成部36を具備する構成)では音響処理装置100から波形生成部36が省略される。また、端末装置が残響調整部34を具備する構成では、音響処理装置100から残響調整部34が省略され、解析処理部44が生成した調整値G(k,m)が音響処理装置100から端末装置に提供される。
(10)音響空間内での反射や散乱に起因した狭義の残響成分に加えて、例えば楽器の演奏音等の響き成分(共鳴成分)も残響成分に含意される。具体的には、ピアノ等の鍵盤楽器の響板による共鳴成分やバイオリン等の弦楽器の共鳴成分(胴鳴り,箱鳴り)の調整にも本発明を適用することが可能である。すなわち、本発明の残響成分は、経時的に減衰する成分(減衰成分)を意味する。
100……音響処理装置、12……信号供給装置、14……放音装置、22……演算処理装置、24……記憶装置、32,62……周波数分析部、34,64……残響調整部、36,66……波形生成部、42……変数設定部、44……解析処理部、52……係数算定部、54……指標算定部、56……調整値算定部。

Claims (6)

  1. 残響時間に応じた第1移動平均係数を算定する係数算定手段と、
    前記係数算定手段が算定した第1移動平均係数を適用した音響信号の強度の移動平均で第1指標値を算定する指標算定手段と、
    前記音響信号の残響成分を調整するための調整値を、前記指標算定手段が算定した第1指標値と、当該第1指標値を上回る追従性で前記音響信号の強度に追従する第2指標値とに応じて算定する調整値算定手段と
    を具備する音響処理装置。
  2. 前記係数算定手段は、前記残響時間と、前記音響信号のうち前記強度が算定される各単位期間の時間差とに応じて、前記第1移動平均係数を算定する
    請求項1の音響処理装置。
  3. 前記指標算定手段は、前記第1移動平均係数を適用した前記音響信号の強度の移動平均で前記第1指標値を算定するとともに、前記第1移動平均係数とは相違する第2移動平均係数を適用した前記音響信号の強度の移動平均で前記第2指標値を算定し、
    前記係数算定手段は、前記第1移動平均係数に対応する第1調整成分と前記第2移動平均係数に対応する第2調整成分とを含む前記調整値のうちの前記第1調整成分が、前記音響信号に付与された残響効果の振幅-周波数特性の逆特性に近似するように、前記第1移動平均係数を算定する
    請求項1または請求項2の音響処理装置。
  4. 前記係数算定手段は、前記第2調整成分が、前記第1調整成分と前記音響信号に付与された残響効果の振幅-周波数特性との積の逆特性に近似するように、前記第2移動平均係数を算定する
    請求項3の音響処理装置。
  5. 前記調整値算定手段は、前記第1指標値を分母に包含するとともに前記第2指標値を分子に包含する演算により前記調整値を算定する
    請求項1から請求項4の何れかの音響処理装置。
  6. コンピュータが、
    残響時間に応じた第1移動平均係数を算定し、
    前記算定した第1移動平均係数を適用した音響信号の強度の移動平均で第1指標値を算定し、
    前記音響信号の残響成分を調整するための調整値を、前記算定した第1指標値と、当該第1指標値を上回る追従性で前記音響信号の強度に追従する第2指標値とに応じて算定する
    音響処理方法。
JP2013108126A 2013-05-22 2013-05-22 音響処理装置および音響処理方法 Expired - Fee Related JP6191238B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013108126A JP6191238B2 (ja) 2013-05-22 2013-05-22 音響処理装置および音響処理方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013108126A JP6191238B2 (ja) 2013-05-22 2013-05-22 音響処理装置および音響処理方法

Publications (2)

Publication Number Publication Date
JP2014228696A JP2014228696A (ja) 2014-12-08
JP6191238B2 true JP6191238B2 (ja) 2017-09-06

Family

ID=52128591

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013108126A Expired - Fee Related JP6191238B2 (ja) 2013-05-22 2013-05-22 音響処理装置および音響処理方法

Country Status (1)

Country Link
JP (1) JP6191238B2 (ja)

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6671667B1 (en) * 2000-03-28 2003-12-30 Tellabs Operations, Inc. Speech presence measurement detection techniques
JP4407541B2 (ja) * 2004-04-28 2010-02-03 ソニー株式会社 測定装置、測定方法、プログラム
JP2009094802A (ja) * 2007-10-09 2009-04-30 Renesas Technology Corp 通信装置
JP2009128559A (ja) * 2007-11-22 2009-06-11 Casio Comput Co Ltd 残響効果付加装置

Also Published As

Publication number Publication date
JP2014228696A (ja) 2014-12-08

Similar Documents

Publication Publication Date Title
JP5641186B2 (ja) 雑音抑圧装置およびプログラム
JP6019969B2 (ja) 音響処理装置
JP6177253B2 (ja) ハーモニシティベースの単一チャネルスピーチ品質評価
JP5606234B2 (ja) 音響装置
EP2178082A1 (en) Cyclic signal processing method, cyclic signal conversion method, cyclic signal processing device, and cyclic signal analysis method
JP2017503388A5 (ja)
JP5187666B2 (ja) 雑音抑圧装置およびプログラム
JP5152799B2 (ja) 雑音抑圧装置およびプログラム
JP5915281B2 (ja) 音響処理装置
JP6171558B2 (ja) 音響処理装置
JP5609157B2 (ja) 係数設定装置および雑音抑圧装置
JP5942388B2 (ja) 雑音抑圧用係数設定装置、雑音抑圧装置および雑音抑圧用係数設定方法
JP5152800B2 (ja) 雑音抑圧評価装置およびプログラム
JP6191238B2 (ja) 音響処理装置および音響処理方法
JP5772723B2 (ja) 音響処理装置および分離マスク生成装置
JP6299279B2 (ja) 音響処理装置および音響処理方法
JP2011248290A (ja) 雑音抑圧装置
US11763828B2 (en) Frequency band expansion device, frequency band expansion method, and storage medium storing frequency band expansion program
JP2015169901A (ja) 音響処理装置
JP2014052585A (ja) 音響処理装置
JP2006178333A (ja) 近接音分離収音方法、近接音分離収音装置、近接音分離収音プログラム、記録媒体
JP2005062096A (ja) 話者位置検出方法、装置、プログラム、および記録媒体
JP6790659B2 (ja) 音響処理装置および音響処理方法
JP2014230085A (ja) 音響処理装置
JP6036141B2 (ja) 音響処理装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150410

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160322

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170509

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170621

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170711

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170724

R151 Written notification of patent or utility model registration

Ref document number: 6191238

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees