JP6171558B2 - 音響処理装置 - Google Patents

音響処理装置 Download PDF

Info

Publication number
JP6171558B2
JP6171558B2 JP2013108150A JP2013108150A JP6171558B2 JP 6171558 B2 JP6171558 B2 JP 6171558B2 JP 2013108150 A JP2013108150 A JP 2013108150A JP 2013108150 A JP2013108150 A JP 2013108150A JP 6171558 B2 JP6171558 B2 JP 6171558B2
Authority
JP
Japan
Prior art keywords
coefficient
index value
acoustic signal
value
reverberation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2013108150A
Other languages
English (en)
Other versions
JP2014228697A (ja
Inventor
健登 大谷
健登 大谷
一哉 武田
一哉 武田
近藤 多伸
多伸 近藤
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2013108150A priority Critical patent/JP6171558B2/ja
Publication of JP2014228697A publication Critical patent/JP2014228697A/ja
Application granted granted Critical
Publication of JP6171558B2 publication Critical patent/JP6171558B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Circuit For Audible Band Transducer (AREA)

Description

本発明は、音響信号を処理する技術に関し、特に、音響信号に含まれる残響成分を調整する技術に関する。
音響信号に含まれる残響成分を抑圧する技術が従来から提案されている。例えば特許文献1には、音響信号に含まれる残響成分を推定する予測フィルタ係数の確率モデルを利用することで残響成分の予測フィルタ係数を推定し、推定後の予測フィルタを利用して残響成分を抑圧する技術が開示されている。また、非特許文献1には、発音源から収音点までの伝達関数の逆フィルタを推定し、推定後の逆フィルタを音響信号に適用することで残響成分を抑圧する技術が開示されている。
特開2009−212599号公報
K. Furuya, et al."Robust speech dereverberation using multichannel blind deconvolution with spectral subtraction",IEEE Transantions on Audio, Speech, and Language Processing, vol. 15, no. 5, p.1579-1591, 2007
しかし、特許文献1の予測フィルタ係数や非特許文献1の逆フィルタの高精度な推定には膨大な演算が必要であるという問題がある。以上の事情を考慮して、本発明は、簡便な処理で音響信号の残響成分を調整(抑圧または強調)することを目的とする。
以上の課題を解決するために、本発明の音響処理装置は、第1移動平均係数を算定する係数算定手段と、係数算定手段が算定した第1移動平均係数(例えば平滑化係数α1)を適用した音響信号の強度の移動平均で第1指標値(例えば指標値R1(k,m))を算定するとともに、第1指標値と比較して高い追従性で音響信号の強度の時間変化に追従する第2指標値(例えば指標値R2(k,m))を算定する指標算定手段と、音響信号の残響成分を調整(抑圧または強調)するための調整値(例えば調整値G(k,m))を第1指標値と第2指標値とに応じて算定する調整値算定手段とを具備し、係数算定手段は、音響信号に付与された残響効果の振幅-周波数特性の逆特性に調整値が近似するように第1移動平均係数を算定する。例えば、調整値算定手段は、第1指標値を分母に包含するとともに第2指標値を分子に包含する演算により調整値を算定する。以上の構成では、音響信号の強度の移動平均で調整値が算定されるから、簡便な処理で音響信号の残響成分を調整することが可能である。また、残響効果の振幅-周波数特性を表現する変調伝達関数の逆特性に調整値が近似するように第1移動平均係数が算定されるから、音響信号の残響成分を高精度に抑圧可能な調整値を算定できるという利点もある。なお、残響効果の振幅-周波数特性は、例えば変調伝達関数(例えば変調伝達関数Ψ(ω))で近似的に表現される。
本発明の好適な態様において、係数算定手段は、調整値と変調伝達関数の逆特性との誤差を示す誤差関数(例えば誤差関数E(ζ1))が最小となる第1移動平均係数を勾配法(例えば最急降下法)により算定する。以上の構成によれば、誤差関数が最小となる第1移動平均係数が勾配法で算定されるから、処理負荷が小さい簡便な演算処理で第1移動平均係数を算定できるという利点がある。なお、所定の第2移動平均係数(例えば平滑化係数α2)を適用した音響信号の強度の移動平均で指標算定手段が第2指標値を算定する構成によれば、第2移動平均係数を可変値とした構成と比較して指標算定手段の処理負荷が軽減されるという利点がある。
以上の各態様に係る音響処理装置は、音響信号の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)等の汎用の演算処理装置とプログラムとの協働によっても実現される。コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、例えば、本発明のプログラムは、通信網を介した配信の形態で提供されてコンピュータにインストールされ得る。
本発明の好適な態様に係る音響処理装置の構成図である。 解析処理部の構成図である。 各指標値と調整値との関係の説明図である。 変調伝達関数のグラフである。 演算処理装置の動作のフローチャートである。 変形例における音響処理装置の部分的な構成図である。
図1は、本発明の好適な実施形態に係る音響処理装置100の構成図である。図1に示すように、音響処理装置100には信号供給装置12と放音装置14とが接続される。信号供給装置12は、音響信号xを音響処理装置100に供給する。音響信号xは、発音源から放射された音響に対して音響空間内で反射または散乱した残響成分(初期反射成分および後期残響成分)を付加した音響の時間波形を示すサンプル系列である。例えば、収録音や合成音等の既存の音響に対して事後的に残響効果を付与した音響信号xや、残響効果がある音響空間(例えば音響ホール等)内で実際に収録された音響の音響信号xが好適に利用される。周囲の音響を収音して音響信号xを生成する収音装置や、可搬型または内蔵型の記録媒体から音響信号xを取得して音響処理装置100に供給する再生装置や、通信網から音響信号xを受信して音響処理装置100に供給する通信装置が信号供給装置12として採用され得る。
音響処理装置100は、音響信号xの残響成分(後期残響成分)を抑圧した時間領域の音響信号yを生成する残響抑圧装置である。放音装置14(例えばスピーカやヘッドホン)は、音響処理装置100が生成した音響信号yに応じた音波を再生する。なお、音響信号yをデジタルからアナログに変換するD/A変換器や音響信号yを増幅する増幅器等の図示は便宜的に省略した。
図1に示すように、音響処理装置100は、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムや演算処理装置22が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体や複数種の記録媒体の組合せが記憶装置24として任意に採用され得る。音響信号xを記憶装置24に記憶した構成(したがって信号供給装置12は省略される)も好適である。
演算処理装置22は、記憶装置24に記憶されたプログラムを実行することで、音響信号xから音響信号yを生成するための複数の機能(周波数分析部32,残響調整部34,波形生成部36,変数設定部42,解析処理部44)を実現する。なお、演算処理装置22の各機能を複数の装置に分散した構成や、専用の電子回路(例えばDSP)が演算処理装置22の一部の機能を実現する構成も採用され得る。
周波数分析部32は、音響信号xを構成する複数の周波数成分X(k,m)を時間軸上の単位期間(フレーム)毎に順次に生成する。記号kは、周波数軸上に離散的に設定された複数の周波数(帯域)のうち任意の1個の周波数を指定する変数であり、記号mは、時間軸上の任意の1個の単位期間(時間軸上の特定の時点)を指定する変数である。時間軸上で相前後する各単位期間の時間差(フレームシフト)TSは単位期間の時間長を下回る。したがって、相前後する各単位期間は時間軸上で相互に重複する。各周波数成分X(k,m)(周波数スペクトル)の算定には、短時間フーリエ変換等の公知の周波数解析が任意に採用され得る。
変数設定部42は、音響信号xの処理に適用される各変数の数値を設定する。具体的には、本実施形態の変数設定部42は、周波数分析部32による各周波数成分X(k,m)の生成(短時間フーリエ変換)に適用される各単位期間の時間差TSと、音響信号xの残響成分に想定される残響時間(例えば音響信号xが発音および収録された音響空間の残響時間)TRとを可変に設定する。具体的には、変数設定部42は、例えば入力装置(図示略)に対する利用者からの指示に応じて時間差TSを設定する。
また、変数設定部42は、例えば入力装置に対する利用者からの指示(残響時間TRの指定)に応じて残響時間TRを設定する。なお、音響空間内の音響の収音で音響信号xを生成する収音装置を信号供給装置12として採用した構成では、所定の測定用信号を音響空間内に放音したときに収録される音響信号xを解析することで変数設定部42が残響時間TRを実測することも可能である。残響時間TRの測定には、例えばインパルス積分法(Schroeder法)やマルチステップ線形予測等の公知の残響解析技術が任意に採用され得る。また、周波数が時間的に連続に変化する時間伸長信号(TSP:Time Stretched Pulse)が測定用信号として好適である。
解析処理部44は、音響信号xの各周波数成分X(k,m)に応じた調整値G(k,m)を各周波数成分X(k,m)について単位期間毎に算定する。本実施形態の調整値G(k,m)は、音響信号xの残響成分を抑圧するための変数である。概略的には、第m番目の単位期間の音響信号xのうち第k番目の周波数成分X(k,m)において残響成分が優勢であるほど調整値G(k,m)は小さい数値に設定されるという傾向がある。
残響調整部34は、解析処理部44が算定した各調整値G(k,m)を音響信号xに作用させる。具体的には、残響調整部34は、各周波数成分X(k,m)について算定された調整値G(k,m)を当該周波数成分X(k,m)に乗算することで音響信号yの各周波数成分(周波数スペクトル)Y(k,m)を算定する(Y(k,m)=G(k,m)・X(k,m))。以上の説明から理解される通り、調整値G(k,m)は、音響信号xの周波数成分X(k,m)に対するゲイン(スペクトルゲイン)に相当する。
波形生成部36は、残響調整部34が算定する各周波数成分Y(k,m)から時間領域の音響信号yを生成する。すなわち、波形生成部36は、各周波数成分Y(k,m)を単位期間毎に短時間逆フーリエ変換で時間領域の信号に変換し、相前後する各単位期間の信号を相互に重複させた状態で加算することで音響信号yを生成する。波形生成部36が生成した音響信号yが放音装置14に供給されて音波として再生される。
図2は、解析処理部44の構成図である。図2に例示される通り、解析処理部44は、係数算定部52と指標算定部54と調整値算定部56とを含んで構成される。指標算定部54は、音響信号xの各周波数成分X(k,m)に応じた指標値R1(k,m)および指標値R2(k,m)を単位期間毎に順次に算定する。本実施形態の指標算定部54は、音響信号xの各周波数成分X(k,m)の強度(パワー)|X(k,m)|2の時系列を平滑化することで各周波数の指標値R1(k,m)および指標値R2(k,m)を算定する。具体的には、以下の数式(1A)および数式(1B)で表現される通り、音響信号xの強度|X(k,m)|2の指数移動平均が指標値R1(k,m)および指標値R2(k,m)として算定される。
Figure 0006171558
記号αi(i=1,2)は、指数移動平均の平滑化係数(すなわち、強度|X(k,m)|2の平滑化の時定数を規定する係数)であり、1未満の正数に設定される。平滑化係数αiは、過去の指標値Ri(k,m-1)に対する最新(現在)の強度|X(k,m)|2の加重値に相当する。
図2の係数算定部52は、平滑化係数α1および平滑化係数α2を設定する。平滑化係数α2は、平滑化係数α1を上回る数値に設定される(α2>α1)。したがって、指標値R1(k,m)における強度|X(k,m)|2の平滑化の時定数τ1は、指標値R2(k,m)における強度|X(k,m)|2の平滑化の時定数τ2を上回る(τ1>τ2)。係数算定部52が各平滑化係数αiを算定する具体的な動作については後述する。指標算定部54は、係数算定部52が設定した各平滑化係数αiを適用した音響信号xの強度|X(k,m)|2の指数移動平均を指標値R1(k,m)および指標値R2(k,m)として算定する。
図3の部分(B)には、音響信号xの1個の周波数の周波数成分X(k,m)から算定される指標値R1(k,m)および指標値R2(k,m)の時間変化が例示されている。図3の部分(A)のように強度|X(k,m)|2が指数減衰する室内インパルス応答(RIR:Room Impulse Response)を音響信号xとして音響処理装置100に供給した場合の指標値R1(k,m)および指標値R2(k,m)が図3の部分(B)には図示されている。
図3の部分(B)から理解される通り、指標値R1(k,m)および指標値R2(k,m)は、音響信号xの強度|X(k,m)|2に追従して経時的に変化する。ただし、前述の通り、指標値R1(k,m)の時定数τ1は指標値R2(k,m)の時定数τ2を上回るから、指標値R1(k,m)は、指標値R2(k,m)と比較して低い追従性で音響信号xの強度|X(k,m)|2の変動に追従する。具体的には、図3の部分(B)から把握される通り、室内インパルス応答の開始の時点t0の直後の区間では、指標値R2(k,m)が指標値R1(k,m)を上回る変化率で急峻に増加する。そして、指標値R1(k,m)および指標値R2(k,m)は、時間軸上の相異なる時点で極大値に到達し、指標値R2(k,m)は指標値R1(k,m)を上回る変化率で減少する。
以上のように指標値R1(k,m)と指標値R2(k,m)とは相異なる変化率で変化するから、指標値R1(k,m)と指標値R2(k,m)との大小は時間軸上の特定の時点txで反転する。すなわち、時点t0から時点txまでの区間SAでは指標値R2(k,m)が指標値R1(k,m)を上回り、時点tx以降の区間SBでは指標値R1(k,m)が指標値R2(k,m)を上回る。区間SAは、室内インパルス応答のうち直接音および初期反射音が存在する区間に相当し、区間SBは、室内インパルス応答のうち後部残響音が存在する区間に相当する。
図2の調整値算定部56は、指標算定部54が算定した指標値R1(k,m)と指標値R2(k,m)とに応じた調整値G(k,m)を各周波数について単位期間毎に算定する。具体的には、調整値算定部56は、以下の数式(2)で表現される通り、指標値R1(k,m)に対する指標値R2(k,m)の相対比を調整値G(k,m)として算定する。ただし、指標値R1(k,m)に対する指標値R2(k,m)の相対比が数値1を上回る場合には、調整値G(k,m)は数値1(調整値G(k,m)の上限値)に設定される。なお、調整値G(k,m)の上限値は任意であり、例えば数値1を下回る所定の正数(例えば0.9)にも設定され得る。
Figure 0006171558
指標値R1(k,m)と指標値R2(k,m)とが図3の部分(B)のように変化する場合の調整値G(k,m)の時間変化が図3の部分(C)に例示されている。図3の部分(C)から理解される通り、指標値R2(k,m)が指標値R1(k,m)を上回る区間SA(直接音および初期反射音が存在する区間)では調整値G(k,m)は最大値1に設定され、指標値R1(k,m)が指標値R2(k,m)を上回る区間SB(後部残響音が存在する区間)では調整値G(k,m)は経時的に減少する。したがって、指標算定部54が算定した調整値G(k,m)を残響調整部34が音響信号xに作用させることで、音響信号xの残響成分を抑圧した音響信号yが生成される。以上に説明した通り、本実施形態では、音響信号xの強度|X(k,m)|2に相異なる時定数で追従する指標値R1(k,m)および指標値R2(k,m)に応じて調整値G(k,m)が算定されるから、特許文献1や非特許文献1の技術と比較して簡便に音響信号xの残響成分を抑圧できるという利点がある。
係数算定部52による平滑化係数αiの設定について以下に詳述する。以下の説明では、数式(3)で表現される通り、数式(1A)および数式(1B)の係数{1−αi}を便宜的に係数(忘却係数)ζiに置換する。
Figure 0006171558
数式(3)は、Z変換により以下の数式(4)のARMA(Auto Regressive Moving Average)型モデルに変形される。
Figure 0006171558

数式(4)から以下の数式(5)が導出される。
Figure 0006171558
数式(5)で表現される指標値R1[z]および指標値R2[z]を前掲の数式(2)に適用することで、調整値G[z]を表現する以下の数式(6)が導出される。
Figure 0006171558
数式(6)から理解される通り、調整値G[z]は、係数ζ1に対応する数式(7A)の調整成分G1[z]と、係数ζ2に対応する数式(7B)の調整成分G2[z]とに分解される(G[z]=G1[z]・G2[z])。
Figure 0006171558
ところで、音響信号xに付与された残響効果の振幅-周波数特性は、変調角周波数ωと残響時間TRとを変数とする数式(8)の変調伝達関数Ψ(ω)で近似される。なお、数式(8)の変調伝達関数Ψ(ω)については、例えば、M. Unoki, et. al., "An improved method based on the MTF concept for restoring the power envelope from a reverberant signal", Acoustical science and technology 25(4), p. 232-242にも詳述されている。
Figure 0006171558
図4は、残響時間TRを相違させた複数の場合(TR=0.1,0.3,0.5,1,2[sec])について変調周波数f(ω=2πf)と変調伝達関数Ψ(ω)との関係を併記したグラフである。図4から理解される通り、変調周波数f(変調角周波数ω)の高域側ほど変調伝達関数Ψ(ω)の数値は減少し、残響時間TRが長いほど高域側での変調伝達関数Ψ(ω)の減少が顕著である、という概略的な傾向がある。
以上に説明した変調伝達関数Ψ(ω)と調整値G[z]との対比を検討する観点から、数式(7A)および数式(7B)に変調角周波数ωを導入すると、以下の数式(9A)および数式(9B)が導出される。数式(9A)および数式(9B)の記号jは虚数単位を意味し、記号TSは、前述の通り、時間軸上で相前後する各単位期間の時間差(フレームシフト)に相当する。
Figure 0006171558
本実施形態では、指標値R2(k,m)に対応する係数ζ2を、経験的または実験的に選定された所定値に固定する。したがって、数式(9B)の調整成分G2(ω)は所定値に固定される。他方、数式(9A)から理解される通り、調整成分G11,ω)は、変調角周波数ωおよび係数ζ1の関数として表現される。本実施形態の係数算定部52は、音響信号xの残響成分が有効に抑圧されるように係数ζ1を可変に算定する。
数式(8)の変調伝達関数Ψ(ω)で表現される残響効果を音響信号x(周波数成分X(k,m))に対する調整値G(k,m)の乗算で抑圧するためには、調整値G(k,m)が変調伝達関数Ψ(ω)の逆特性に近似する必要がある(|G(ω)|・Ψ(ω)=1)。以上の観点から、調整値G(k,m)と変調伝達関数Ψ(ω)の逆特性との相違(誤差)を評価するための数式(10)の誤差関数E(ζ1)を導入する。
Figure 0006171558

すなわち、数式(10)の誤差関数E(ζ1)は、調整値G(ω)(G(ω)=G11,ω)・G2(ω))および変調伝達関数Ψ(ω)の積と数値1との自乗誤差を変調角周波数ωの全範囲にわたり積算する関数である。したがって、調整値G(ω)の作用が変調伝達関数Ψ(ω)の逆特性に近似する(|G(ω)|・Ψ(ω)が1に近付く)ほど誤差関数E(ζ1)は小さい数値となる。本実施形態の係数算定部52は、誤差関数E(ζ1)が最小となる(すなわち調整値G(ω)が変調伝達関数Ψ(ω)の逆特性に近似する)ように係数ζ1(平滑化係数α1)を算定する。
係数ζ1の最適値の探索には、係数ζ1に対する誤差関数E(ζ1)の勾配(1階微分)g(ζ1)を利用する勾配法が好適である。具体的には、本実施形態の係数算定部52は、誤差関数E(ζ1)の勾配g(ζ1)に着目して誤差関数E(ζ1)の最小値を探索する最急降下法(steepest descent method)を利用して係数ζ1を算定する。
誤差関数E(ζ1)の勾配g(ζ1)は以下の数式(11)で表現される。
Figure 0006171558
係数算定部52は、数式(11)で表現される勾配g(ζ1)を適用した最急降下法により最適な係数ζ1を算定する。具体的には、係数算定部52は、係数ζ1を更新する数式(12)の更新演算を複数回にわたり反復する。数式(12)は、暫定的な係数ζ1 (p)を演算する第p回目の更新演算である。
Figure 0006171558

数式(12)の係数βは所定の正数(ゼロに近い正数)に設定される。数式(12)から理解される通り、係数算定部52は、直前(第(p-1)回目)の更新演算で算定された係数ζ1 (p-1)と当該係数ζ1 (p-1)を適用した数式(11)の勾配g(ζ1 (p-1))とから最新の係数ζ1 (p)を算定する。なお、第1回目の更新演算に適用される係数ζ1 (0)は所定の初期値に設定される。数式(12)の勾配g(ζ1 (p-1))を規定する変調伝達関数Ψ(ω)(数式(8))の算定には、変数設定部42が設定した残響時間TRが適用される。
係数算定部52は、所定の収束条件が成立した時点の係数ζ1 (p)を確定的な係数ζ1として採択する。収束条件は任意であるが、例えば、更新前の係数ζ1 (p-1)と更新後の係数ζ1 (p)との差分値|ζ1 (p-1)−ζ1 (p)|が所定の閾値を下回る場合に収束条件が成立したと判定する構成や、更新演算の反復回数が所定値に到達した場合に収束条件が成立したと判定する構成が好適である。
係数算定部52は、以上の処理で算定した係数ζ1に応じた平滑化係数α1(α1=1−ζ1)と、事前に設定された所定の係数ζ2に応じた平滑化係数α2(α2=1−ζ2)とを算定する。指標算定部54は、係数算定部52が算定した平滑化係数α1を適用した数式(1A)の演算で指標値R1(k,m)を算定し、平滑化係数α2を適用した数式(1B)の演算で指標値R2(k,m)を算定する。
図5は、記憶装置24に記憶されたプログラムに従って演算処理装置22が実行する残響調整処理のフローチャートである。入力装置(図示略)に対する利用者からの指示(残響調整処理の開始指示)を契機として残響調整処理が開始される。残響調整処理を開始すると、変数設定部42は、各単位期間の時間差TSと残響時間TRとを設定し(S1)、解析処理部44の係数算定部52は、変数設定部42が設定した時間差TSおよび残響時間TRに応じた平滑化係数α1および平滑化係数α2を設定する(S2)。
以上の手順で各変数が設定されると、単位期間毎に以下のステップS3からステップS7の処理が実行される。まず、周波数分析部32は、音響信号xの各周波数の周波数成分X(k,m)を算定する(S3)。そして、解析処理部44の指標算定部54は、係数算定部52が算定した平滑化係数α1および平滑化係数α2と周波数分析部32が算定した周波数成分X(k,m)とを適用した数式(1A)および数式(1B)の演算で指標値R1(k,m)および指標値R2(k,m)を算定する(S4)。調整値算定部56は、指標算定部54が算定した指標値R1(k,m)および指標値R2(k,m)を適用した数式(2)の演算で各周波数の調整値G(k,m)を算定する(S5)。
残響調整部34は、指標算定部54がステップS5で算定した調整値G(k,m)を音響信号xの各周波数成分X(k,m)に作用させることで周波数成分Y(k,m)を算定する(S6)。波形生成部36は、残響調整部34が算定した各周波数成分Y(k,m)から単位期間の音響信号yを生成する(S7)。音響信号xの全部の単位期間について以上の処理(S3〜S7)が反復される(S8:NO)ことで、音響信号xの残響成分を抑圧した音響信号yが生成される。
以上に説明した通り、本実施形態では、調整値G(k,m)の作用が変調伝達関数Ψ(ω)の逆特性に近似する(誤差関数E(ζ1)が最小化される)ように指標値R1(k,m)の算定用の平滑化係数α1が設定されるから、音響信号xの残響成分を高精度に抑圧可能な調整値G(k,m)を算定できるという利点がある。本実施形態では特に、誤差関数E(ζ1)が最小となる係数ζ1が勾配法(最急降下法)により算定されるから、処理負荷が小さい簡便な演算処理で適切な平滑化係数α1を算定することが可能である。
<変形例>
以上に例示した形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
(1)前述の形態における周波数分析部32と残響調整部34と波形生成部36とは、音響信号xを時間領域で処理する図6の要素(周波数分析部62,残響調整部64,波形生成部66)に置換され得る。なお、解析処理部44の構成および動作は前述の形態と同様である。変数設定部42は、前述の形態と同様に残響時間TRを設定するほか、音響信号xのサンプリング周期を時間差TSとして指定する。
周波数分析部62は、帯域分割部622と包絡抽出部624とを含んで構成される。帯域分割部622は、信号供給装置12から供給される音響信号xを、相異なる周波数帯域に対応する複数の帯域成分x(k)(x(1),x(2),……)に時間領域で分解する。例えば、通過帯域が相違する複数の帯域通過フィルタで構成されるフィルタバンクが帯域分割部622として利用される。包絡抽出部624は、複数の帯域成分x(k)の各々を包絡成分xE(k)と残余成分xR(k)とに分解する。包絡成分xE(k)は、帯域成分x(k)の時間波形の包絡線に相当する成分であり、残余成分xR(k)は、帯域成分x(k)から包絡成分xE(k)を除外した成分である。包絡成分xE(k)の抽出には、例えばヒルベルト変換等の公知の信号処理技術が任意に採用される。
残響調整部64は、周波数分析部62(包絡抽出部624)が生成した各包絡成分xE(k)に、解析処理部44が生成した調整値G(k,m)を作用させる。具体的には、残響調整部64は、包絡成分xE(k)に調整値G(k,m)を乗算することで包絡成分yE(k)を生成する。包絡成分xE(k)の時間軸上の各サンプルには、解析処理部44が当該サンプルの時点について算定した調整値G(k,m)が乗算される。
波形生成部66は、第1合成部662と第2合成部664とを含んで構成される。第1合成部662は、残響調整部64が各周波数帯域について生成した包絡成分yE(k)と、当該周波数帯域の残余成分xR(k)とを合成(例えば乗算や加算)することで帯域成分y(k)を生成する。以上の説明から理解される通り、帯域成分y(k)は、帯域成分x(k)から残響成分を抑圧した音響成分である。第2合成部664は、第1合成部662が生成した複数の帯域成分y(k)を合成(例えば加算)することで音響信号yを生成する。図6の構成でも、前述の形態と同様の効果が実現される。
(2)前述の形態では、音響信号xの強度|X(k,m)|2の移動平均を指標値R2(k,m)として算定したが、強度|X(k,m)|2を指標値R2(k,m)として利用することも可能である。すなわち、指標値R2(k,m)の算定について強度|X(k,m)|2の移動平均は省略され得る。以上の説明から理解される通り、指標値R2(k,m)は、指標値R1(k,m)と比較して高い追従性で音響信号xの時間変化に追従する数値として包括される。
(3)前述の形態では、音響信号xの強度|X(k,m)|2の指数移動平均を指標値R1(k,m)および指標値R2(k,m)として算定したが、指標値R1(k,m)および指標値R2(k,m)の算定方法は適宜に変更される。例えば、音響信号xの強度|X(k,m)|2の単純移動平均(あるいは加重移動平均)を指標値R1(k,m)および指標値R2(k,m)として算定することも可能である。
具体的には、指標算定部54は、M1個の単位期間にわたる強度|X(k,m)|2の単純移動平均を指標値R1(k,m)として算定し、M2個の単位期間にわたる強度|X(k,m)|2の単純移動平均を指標値R2(k,m)として算定する。平均個数M1は、前述の指数移動平均に適用される平滑化係数α1に対応し、平均個数M2は、指数移動平均に適用される平滑化係数α2に対応する。すなわち、平均個数M1が平均個数M2を上回る数値に設定されることで、前述の形態と同様に、指標値R1(k,m)は、指標値R2(k,m)と比較して低い追従性で音響信号xの強度|X(k,m)|2の変動に追従する。以上の説明から理解される通り、指数移動平均に適用される平滑化係数(α1,α2)や係数(ζ1,ζ2)に加えて単純移動平均の平均個数(M1,M2)も、移動平均に適用される移動平均係数の概念に包含される。
(4)前述の形態では、音響信号xの残響成分を抑圧する調整値G(k,m)を例示したが、音響信号xの残響成分を強調(抽出)する場合にも本発明は適用される。例えば、数式(2)で算定される調整値G(k,m)を所定値(例えば1)から減算した調整値{1−G(k,m)}を音響信号xに作用させれば、残響成分を強調した音響信号yを生成することが可能である。以上の説明から理解される通り、調整値算定部56は、音響信号xの残響成分を調整(抑圧または強調)するための調整値を算定する要素として包括される。
(5)指標値R1(k,m)および指標値R2(k,m)に応じて調整値G(k,m)を算定する方法は前述の例示に限定されない。例えば、指標値R1(k,m)および指標値R2(k,m)を変数とする所定の演算により調整値G(k,m)を算定する構成も採用される。以上の説明から理解される通り、調整値算定部56は、音響信号xの残響成分を調整(抑圧または強調)するための調整値G(k,m)を指標値R1(k,m)および指標値R2(k,m)に応じて算定する要素として包括される。
(6)前述の形態では、変数設定部42が各単位期間の時間差TSと残響時間TRとを可変に設定したが、事前に設定された時間差TSと残響時間TRとを適用することも可能である。すなわち、変数設定部42は省略され得る。例えば、既知の残響時間TRを適用する構成では残響時間TRの算定が省略されるから、演算能力が低い情報処理装置(例えば携帯機器)でも音響処理装置100を実現することが可能である。なお、残響時間TRは、音響空間の気温等の要因にも依存するが、音響空間の音響特性に基本的には依存するから、ひとつの音響空間については、1回の演算で算定された残響時間TRを複数回にわたり継続的に適用することが可能である。なお、相異なる音響空間について事前に測定された複数の残響時間TRのうち音響信号xが収録された場所(例えば音響処理装置100が使用される場所)に対応する残響時間TRを選択して平滑化係数α1の算定に適用することも可能である。
(7)前述の形態では、音響信号xの強度(パワー)|X(k,m)|2の時系列を平滑化することで指標値R1(k,m)および指標値R2(k,m)を算定したが、指標算定部54による平滑化の対象はパワー(振幅の2乗ドメイン)に限定されない。例えば、音響信号xの振幅|X(k,m)|や振幅|X(k,m)|の4乗|X(k,m)|4を音響信号xの強度として指標値R1(k,m)および指標値R2(k,m)を算定することも可能である。また、音響信号xの振幅|X(k,m)|や振幅|X(k,m)|の4乗|X(k,m)|4に残響調整部34が調整値G(k,m)を作用させる構成も採用され得る。
(8)前述の形態における係数ζ2は固定値であるから、係数算定部52が係数ζ2から平滑化係数α2を算定する処理は省略され得る。他方、係数算定部52が平滑化係数α2を可変に設定することも可能である。例えば、前述の勾配法(最急降下法)で算定された係数ζ1を適用した所定の演算で係数ζ2および平滑化係数α2を算定する構成が好適である。
(9)携帯電話機等の端末装置と通信するサーバ装置(典型的にはウェブサーバ)で音響処理装置100を実現することも可能である。例えば、音響処理装置100は、端末装置から受信した音響信号xから音響信号yを生成して端末装置に送信する。なお、音響信号xの各周波数成分X(k,m)が端末装置から送信される構成(例えば端末装置が周波数分析部32を具備する構成)では音響処理装置100から周波数分析部32が省略され、残響成分の調整後の各周波数成分Y(k,m)を音響処理装置100から端末装置に送信する構成(例えば端末装置が波形生成部36を具備する構成)では音響処理装置100から波形生成部36が省略される。また、端末装置が残響調整部34を具備する構成では、音響処理装置100から残響調整部34が省略され、解析処理部44が生成した調整値G(k,m)が音響処理装置100から端末装置に提供される。
(10)音響空間内での反射や散乱に起因した狭義の残響成分に加えて、例えば楽器の演奏音等の響き成分(共鳴成分)も残響成分に含意される。具体的には、ピアノ等の鍵盤楽器の響板による共鳴成分やバイオリン等の弦楽器の共鳴成分(胴鳴り,箱鳴り)の調整にも本発明を適用することが可能である。すなわち、本発明の残響成分は、経時的に減衰する成分(減衰成分)を意味する。
100……音響処理装置、12……信号供給装置、14……放音装置、22……演算処理装置、24……記憶装置、32,62……周波数分析部、34,64……残響調整部、36,66……波形生成部、42……変数設定部、44……解析処理部、52……係数算定部、54……指標算定部、56……調整値算定部。

Claims (5)

  1. 第1移動平均係数を算定する係数算定手段と、
    前記係数算定手段が算定した第1移動平均係数を適用した音響信号の強度の移動平均で第1指標値を算定するとともに、前記第1指標値と比較して高い追従性で前記音響信号の強度の時間変化に追従する第2指標値を算定する指標算定手段と、
    前記音響信号の残響成分を調整するための調整値を前記第1指標値と前記第2指標値とに応じて算定する調整値算定手段とを具備し、
    前記係数算定手段は、前記音響信号に付与された残響効果の振幅-周波数特性の逆特性に前記調整値が近似するように前記第1移動平均係数を算定する
    音響処理装置。
  2. 前記係数算定手段は、前記調整値と前記振幅-周波数特性の逆特性との誤差を示す誤差関数が最小となる前記第1移動平均係数を勾配法により算定する
    請求項1の音響処理装置。
  3. 前記係数算定手段は、前記誤差関数が最小となる前記第1移動平均係数を最急降下法により算定する
    請求項2の音響処理装置。
  4. 前記調整値算定手段は、前記第1指標値を分母に包含するとともに前記第2指標値を分子に包含する演算により前記調整値を算定する
    請求項1から請求項3の何れかの音響処理装置。
  5. 前記指標算定手段は、所定の第2移動平均係数を適用した前記音響信号の強度の移動平均で第2指標値を算定する
    請求項1から請求項4の何れかの音響処理装置。
JP2013108150A 2013-05-22 2013-05-22 音響処理装置 Expired - Fee Related JP6171558B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013108150A JP6171558B2 (ja) 2013-05-22 2013-05-22 音響処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013108150A JP6171558B2 (ja) 2013-05-22 2013-05-22 音響処理装置

Publications (2)

Publication Number Publication Date
JP2014228697A JP2014228697A (ja) 2014-12-08
JP6171558B2 true JP6171558B2 (ja) 2017-08-02

Family

ID=52128592

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013108150A Expired - Fee Related JP6171558B2 (ja) 2013-05-22 2013-05-22 音響処理装置

Country Status (1)

Country Link
JP (1) JP6171558B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108962275B (zh) * 2018-08-01 2021-06-15 电信科学技术研究院有限公司 一种音乐噪声抑制方法及装置
CN115424636B (zh) * 2022-11-04 2023-02-03 广州声博士声学技术有限公司 一种基于语音传输指数的音质测量方法及装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4345208B2 (ja) * 2000-08-25 2009-10-14 沖電気工業株式会社 反響及び雑音除去装置
JP4107613B2 (ja) * 2006-09-04 2008-06-25 インターナショナル・ビジネス・マシーンズ・コーポレーション 残響除去における低コストのフィルタ係数決定法
BRPI0806471A2 (pt) * 2007-01-12 2011-09-27 Univ Texas técnicas de separação de baixo fluxo de interface

Also Published As

Publication number Publication date
JP2014228697A (ja) 2014-12-08

Similar Documents

Publication Publication Date Title
US9161126B2 (en) Systems and methods for protecting a speaker
JP6177253B2 (ja) ハーモニシティベースの単一チャネルスピーチ品質評価
JP6019969B2 (ja) 音響処理装置
JP5606234B2 (ja) 音響装置
US9173027B2 (en) Systems and methods for protecting a speaker
KR20070036777A (ko) 오디오 신호 반향 억제
JP6064566B2 (ja) 音響処理装置
JP5187666B2 (ja) 雑音抑圧装置およびプログラム
JP6171558B2 (ja) 音響処理装置
JP5454330B2 (ja) 音響処理装置
JP2004078021A (ja) 収音方法、収音装置、および収音プログラム
JP5633673B2 (ja) 雑音抑圧装置およびプログラム
JP5609157B2 (ja) 係数設定装置および雑音抑圧装置
JP5152800B2 (ja) 雑音抑圧評価装置およびプログラム
JP6299279B2 (ja) 音響処理装置および音響処理方法
JP5772723B2 (ja) 音響処理装置および分離マスク生成装置
JP2015169901A (ja) 音響処理装置
JP6191238B2 (ja) 音響処理装置および音響処理方法
JP2013250356A (ja) 係数設定装置および雑音抑圧装置
JP2014230085A (ja) 音響処理装置
JP6036141B2 (ja) 音響処理装置
JP6790659B2 (ja) 音響処理装置および音響処理方法
JP2014052585A (ja) 音響処理装置
JP2015004959A (ja) 音響処理装置
JP2015169900A (ja) 雑音抑圧装置

Legal Events

Date Code Title Description
RD04 Notification of resignation of power of attorney

Free format text: JAPANESE INTERMEDIATE CODE: A7424

Effective date: 20150410

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160520

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20160525

A711 Notification of change in applicant

Free format text: JAPANESE INTERMEDIATE CODE: A711

Effective date: 20161110

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A821

Effective date: 20161110

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20170524

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170606

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170619

R151 Written notification of patent or utility model registration

Ref document number: 6171558

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151

LAPS Cancellation because of no payment of annual fees