JP2015004959A - 音響処理装置 - Google Patents
音響処理装置 Download PDFInfo
- Publication number
- JP2015004959A JP2015004959A JP2014084657A JP2014084657A JP2015004959A JP 2015004959 A JP2015004959 A JP 2015004959A JP 2014084657 A JP2014084657 A JP 2014084657A JP 2014084657 A JP2014084657 A JP 2014084657A JP 2015004959 A JP2015004959 A JP 2015004959A
- Authority
- JP
- Japan
- Prior art keywords
- value
- index value
- acoustic signal
- adjustment
- index
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Abstract
【課題】簡便な処理で音響信号の残響成分を調整する。【解決手段】指標算定部52は、音響信号の強度の移動平均で指標値RA(k,m)と指標値RB(k,m)とを算定する。指標値RB(k,m)は、指標値RA(k,m)を上回る追従性で音響信号の強度に追従する。調整値算定部54は、音響信号の残響成分を抑圧するための調整値G(k,m)を算定する。具体的には、調整値算定部54は、指標値RA(k,m)と指標値RB(k,m)とを分母に包含するとともに指標値RB(k,m)を分子に包含する演算式を利用して調整値G(k,m)を算定する。【選択図】図2
Description
本発明は、音響信号を処理する技術に関し、特に、音響信号に含まれる残響成分を調整する技術に関する。
音響信号に含まれる残響成分を抑圧する技術が従来から提案されている。例えば特許文献1には、音響信号に含まれる残響成分を推定する予測フィルタ係数の確率モデルを利用することで残響成分の予測フィルタ係数を推定し、推定後の予測フィルタを利用して残響成分を抑圧する技術が開示されている。また、非特許文献1には、発音源から収音点までの伝達関数の逆フィルタを推定し、推定後の逆フィルタを音響信号に適用することで残響成分を抑圧する技術が開示されている。
K. Furuya, et al."Robust speech dereverberation using multichannel blind deconvolution with spectral subtraction",IEEE Transantions on Audio, Speech, and Language Processing, vol. 15, no. 5, p.1579-1591, 2007
しかし、特許文献1の予測フィルタ係数や非特許文献1の逆フィルタの高精度な推定には膨大な演算が必要であるという問題がある。以上の事情を考慮して、本発明は、簡便な処理で音響信号の残響成分を調整(抑圧または強調)することを目的とする。
以上の課題を解決するために、本発明の音響処理装置は、音響信号の強度の移動平均で第1指標値(例えば指標値RA(k,m))を算定する指標算定手段と、音響信号の残響成分を調整するための調整値を算定する手段であって、第1指標値と第1指標値を上回る追従性で音響信号の強度に追従する第2指標値(例えば指標値RB(k,m))とを分母に包含し、第1指標値を上回る追従性で音響信号の強度に追従する第3指標値(例えば指標値RC(k,m))を分子に包含する演算式を利用して調整値を算定する調整値算定手段とを具備する。以上の構成では、音響信号の強度の移動平均で調整値が算定されるから、簡便な処理で音響信号の残響成分を調整することが可能である。また、第1指標値を上回る追従性で音響信号の強度に追従する第2指標値を分母に含む演算で調整値が算定されるから、音響信号の残響時間が長い場合でも残響成分を高精度に調整できるという利点がある。
本発明の好適な態様において、第2指標値と第3指標値とは共通する。以上の態様では、第2指標値と第3指標値とが共通するから、第2指標値と第3指標値とを個別に算定する構成と比較して処理負荷が軽減されるという利点がある。ただし、第2指標値と第3指標値とを個別に算定する構成も採用され得る。
本発明の好適な態様に係る音響処理装置は、加重係数を設定する係数設定手段を具備し、調整値算定手段は、第1指標値と、係数設定手段が設定した加重係数を乗算した第2指標値との加算を分母に包含する演算式を利用して調整値を算定する。以上の態様では、加重係数が第2指標値に乗算されるから、演算式の分母における第2指標値の効果を加重係数に応じて調整することが可能である。例えば、残響時間に対して単調増加するように加重係数を算定する構成(例えば第2実施形態)や、前記第1指標値を分母に包含するとともに前記第2指標値または前記第3指標値を分子に包含する演算式の演算結果に応じて前記加重係数を設定する構成(例えば第7実施形態)によれば、残響時間が長い場合でも残響成分を高精度に抑圧できるという前述の作用が強調される。
本発明の好適な態様において、調整値算定手段は、第1指標値と第2指標値とを分母に包含するとともに第3指標値を分子に包含する演算で基礎値を順次に算定し、基礎値が第1値(例えば1)を上回る数値に変動した場合に、以降の各基礎値を当該数値に応じて低減することで調整値を算定する。以上の態様では、基礎値が第1値を上回る場合に以降の各基礎値が低減されるから、音響信号の音響の発音が開始された直後の残響成分(例えば初期反射成分)も高精度に抑圧できるという利点がある。また、基礎値が第1値未満の第2値(例えば閾値QTH)を下回ると、調整値の低減を終了する構成によれば、音響信号の強度の過剰な抑圧を防止することが可能である。なお、以上の態様の具体例は、例えば第3実施形態として後述される。
本発明の好適な態様において、調整値算定手段は、第1指標値と第2指標値との加算を分母に包含するとともに第3指標値を分子に包含する演算で算定される第1基礎値と、第1指標値に対する第3指標値の相対比である第2基礎値との加重和を調整値として算定する。以上の態様では、第1基礎値と第2基礎値との加重和が調整値として算定されるから、第1基礎値のみに応じて調整値を算定する構成と比較して残響成分の高精度な調整が期待される。また、音響信号に対する調整値の作用が、音響信号に付与された残響効果の振幅-周波数特性の逆特性に近似するように、第1基礎値および第2基礎値の各々の加重値を算定する構成によれば、残響成分の高精度な調整という効果は格別に顕著である。なお、振幅-周波数特性は、例えば変調伝達関数(例えば変調伝達関数Ψ(ω))で近似的に表現される。以上の態様の具体例は、例えば第4実施形態として後述される。
残響成分を調整する従来の技術では、残響時間が長い場合に残響成分(特に目的成分の発生から充分な時間が経過した段階の残響成分)の調整精度が低下するという問題がある。以上の事情を考慮して、本発明の他の態様に係る音響処理装置は、音響信号の残響成分の強度を推定する残響推定手段と、音響信号の残響成分を調整するための調整値を算定する手段であって、音響信号の強度と残響推定手段が推定した残響成分の強度とを分母に包含するとともに音響信号の強度を分子に包含する演算式を利用して調整値を算定する調整値算定手段とを具備する。以上の態様では、音響信号の強度に加えて残響成分の強度を分母に包含する演算式を利用して調整値が算定されるから、残響時間が長い場合でも音響信号の残響成分を高精度に調整できるという利点がある。なお、以上の態様の具体例は、例えば第6実施形態として後述される。
以上の各態様に係る音響処理装置は、音響信号の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)等の汎用の演算処理装置とプログラムとの協働によっても実現される。コンピュータが読取可能な記録媒体に格納された形態で提供されてコンピュータにインストールされ得る。記録媒体は、例えば非一過性(non-transitory)の記録媒体であり、CD-ROM等の光学式記録媒体(光ディスク)が好例であるが、半導体記録媒体や磁気記録媒体等の公知の任意の形式の記録媒体を包含し得る。また、例えば、本発明のプログラムは、通信網を介した配信の形態で提供されてコンピュータにインストールされ得る。
<第1実施形態>
図1は、本発明の第1実施形態に係る音響処理装置100の構成図である。図1に例示される通り、音響処理装置100には信号供給装置12と放音装置14とが接続される。信号供給装置12は、音響信号xを音響処理装置100に供給する。音響信号xは、発音源から放射された音響に対して音響空間内で反射または散乱した残響成分(初期反射成分および後期残響成分)を付加した音響の時間波形を示すサンプル系列である。例えば、収録音や合成音等の既存の音響に対して事後的に残響効果を付与した音響信号xや、残響効果がある音響空間(例えば音響ホール等)内で実際に収録された音響の音響信号xが好適に利用される。周囲の音響を収音して音響信号xを生成する収音装置や、可搬型または内蔵型の記録媒体から音響信号xを取得して音響処理装置100に供給する再生装置や、通信網から音響信号xを受信して音響処理装置100に供給する通信装置が信号供給装置12として採用され得る。
図1は、本発明の第1実施形態に係る音響処理装置100の構成図である。図1に例示される通り、音響処理装置100には信号供給装置12と放音装置14とが接続される。信号供給装置12は、音響信号xを音響処理装置100に供給する。音響信号xは、発音源から放射された音響に対して音響空間内で反射または散乱した残響成分(初期反射成分および後期残響成分)を付加した音響の時間波形を示すサンプル系列である。例えば、収録音や合成音等の既存の音響に対して事後的に残響効果を付与した音響信号xや、残響効果がある音響空間(例えば音響ホール等)内で実際に収録された音響の音響信号xが好適に利用される。周囲の音響を収音して音響信号xを生成する収音装置や、可搬型または内蔵型の記録媒体から音響信号xを取得して音響処理装置100に供給する再生装置や、通信網から音響信号xを受信して音響処理装置100に供給する通信装置が信号供給装置12として採用され得る。
第1実施形態の音響処理装置100は、音響信号xの残響成分(後期残響成分)を抑圧した時間領域の音響信号yを生成する残響抑圧装置である。放音装置14(例えばスピーカやヘッドホン)は、音響処理装置100が生成した音響信号yに応じた音波を再生する。なお、音響信号yをデジタルからアナログに変換するD/A変換器や音響信号yを増幅する増幅器等の図示は便宜的に省略した。
図1に例示される通り、音響処理装置100は、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムや演算処理装置22が使用する各種のデータを記憶する。半導体記録媒体や磁気記録媒体等の公知の記録媒体または複数種の記録媒体の組合せが記憶装置24として任意に採用され得る。音響信号xを記憶装置24に記憶した構成(したがって信号供給装置12は省略される)も好適である。
演算処理装置22は、記憶装置24に記憶されたプログラムを実行することで、音響信号xから音響信号yを生成するための複数の機能(周波数分析部32,残響調整部34,波形生成部36,解析処理部42)を実現する。なお、演算処理装置22の各機能を複数の装置に分散した構成や、専用の電子回路(例えばDSP)が演算処理装置22の一部の機能を実現する構成も採用され得る。
周波数分析部32は、音響信号xを構成する複数の周波数成分(周波数スペクトル)X(k,m)を時間軸上の単位期間(フレーム)毎に順次に生成する。記号kは、周波数軸上に離散的に設定された複数の周波数(帯域)のうち任意の1個の周波数を指定する変数であり、記号mは、時間軸上の任意の1個の単位期間(時間軸上の特定の時点)を指定する変数である。各周波数成分X(k,m)の算定には、短時間フーリエ変換等の公知の周波数解析が任意に採用され得る。
解析処理部42は、音響信号xの各周波数成分X(k,m)に応じた調整値G(k,m)を各周波数成分X(k,m)について単位期間毎に算定する。第1実施形態の調整値G(k,m)は、音響信号xの残響成分を抑圧するための変数である。概略的には、第m番目の単位期間の音響信号xのうち周波数軸上の第k番目の周波数成分X(k,m)において残響成分が優勢であるほど調整値G(k,m)は小さい数値に設定されるという傾向がある。
図1の残響調整部34は、解析処理部42が算定した各調整値G(k,m)を音響信号xに作用させる。具体的には、残響調整部34は、各周波数成分X(k,m)について算定された調整値G(k,m)を当該周波数成分X(k,m)に乗算することで音響信号yの各周波数成分(周波数スペクトル)Y(k,m)を算定する(Y(k,m)=G(k,m)・X(k,m))。以上の説明から理解される通り、調整値G(k,m)は、音響信号xの周波数成分X(k,m)に対するゲイン(スペクトルゲイン)に相当する。
波形生成部36は、残響調整部34が算定する各周波数成分Y(k,m)から時間領域の音響信号yを生成する。すなわち、波形生成部36は、各周波数成分Y(k,m)を単位期間毎に短時間逆フーリエ変換で時間領域の信号に変換し、相前後する各単位期間の信号を相互に重複させた状態で加算することで音響信号yを生成する。波形生成部36が生成した音響信号yが放音装置14に供給されて音波として再生される。
図2は、解析処理部42の構成図である。図2に例示される通り、解析処理部42は、指標算定部52と調整値算定部54とを含んで構成される。指標算定部52は、音響信号xの各周波数成分X(k,m)に応じた指標値RA(k,m)および指標値RB(k,m)を単位期間毎に順次に算定する。第1実施形態の指標算定部52は、音響信号xの各周波数成分X(k,m)の強度P(k,m)の時系列を平滑化することで各周波数の指標値RA(k,m)および指標値RB(k,m)を算定する。強度P(k,m)は、例えば周波数成分X(k,m)のパワー|X(k,m)|2である。具体的には、以下の数式(1A)および数式(1B)で表現される通り、音響信号xの強度P(k,m)の指数移動平均が指標値RA(k,m)および指標値RB(k,m)として算定される。
数式(1A)の記号αAおよび数式(1B)の記号αBは、指数移動平均の平滑化係数(すなわち、強度P(k,m)の平滑化の時定数を規定する係数)であり、1未満の正数に設定される。平滑化係数αAは、過去の指標値RA(k,m-1)に対する最新(現在)の強度P(k,m)の加重値に相当し、平滑化係数αBは、過去の指標値RB(k,m-1)に対する最新(現在)の強度P(k,m)の加重値に相当する。指標値RB(k,m)の平滑化係数αBは、指標値RA(k,m)の平滑化係数αAを上回る(αB>αA)。したがって、指標値RA(k,m)における強度P(k,m)の平滑化の時定数τAは、指標値RB(k,m)における強度P(k,m)の平滑化の時定数τBを上回る(τA>τB)。
図3の部分(B)には、音響信号xの1個の周波数の周波数成分X(k,m)から算定される指標値RA(k,m)および指標値RB(k,m)の時間変化が例示されている。図3の部分(A)のように強度P(k,m)が指数減衰する室内インパルス応答(RIR:Room Impulse Response)を音響信号xとして音響処理装置100に供給した場合の指標値RA(k,m)および指標値RB(k,m)が図3の部分(B)には図示されている。
図3の部分(B)から理解される通り、指標値RA(k,m)および指標値RB(k,m)は、音響信号xの強度P(k,m)に追従して経時的に変動する。ただし、前述の通り、指標値RA(k,m)の時定数τAは指標値RB(k,m)の時定数τBを上回るから、指標値RB(k,m)は、指標値RA(k,m)と比較して高い追従性で音響信号xの強度P(k,m)の時間変化に追従する。具体的には、図3の部分(B)から把握される通り、室内インパルス応答の開始の時点t0の直後の区間では、指標値RB(k,m)が指標値RA(k,m)を上回る変化率で急峻に増加する。そして、指標値RA(k,m)および指標値RB(k,m)は、時間軸上の相異なる時点で極大値に到達し、指標値RB(k,m)は指標値RA(k,m)を上回る変化率で減少する。
以上のように指標値RA(k,m)と指標値RB(k,m)とは相異なる変化率で変化するから、指標値RA(k,m)と指標値RB(k,m)との大小は時間軸上の特定の時点txで反転する。すなわち、時点t0から時点txまでの区間SAでは指標値RB(k,m)が指標値RA(k,m)を上回り、時点tx以降の区間SBでは指標値RA(k,m)が指標値RB(k,m)を上回る。区間SAは、室内インパルス応答のうち直接音(目的成分)および初期反射音が存在する区間に相当し、区間SBは、室内インパルス応答のうち後期残響成分が存在する区間に相当する。
図2の調整値算定部54は、指標算定部52が算定した指標値RA(k,m)と指標値RB(k,m)とに応じた調整値G(k,m)を各周波数について単位期間毎に算定する。第1実施形態の調整値G(k,m)の具体例の説明に先立ち、指標値RA(k,m)に対する指標値RB(k,m)の相対比RB(k,m)/RA(k,m)を調整値G(k,m)として利用する場合を第1実施形態の対比例として説明する。なお、相対比RB(k,m)/RA(k,m)が1を上回る場合、調整値G(k,m)は1に設定される。
指標値RA(k,m)と指標値RB(k,m)とが図3の部分(B)のように変動する場合、対比例の調整値G(k,m)は図3の部分(C)の例示のように経時的に変動する。図3の部分(C)から理解される通り、指標値RB(k,m)が指標値RA(k,m)を上回る区間SA(直接音および初期反射音が存在する区間)では調整値G(k,m)は最大値1に設定され、指標値RA(k,m)が指標値RB(k,m)を上回る区間SB(後期残響成分が存在する区間)では調整値G(k,m)は経時的に減少する。したがって、対比例の調整値G(k,m)を音響信号xの各周波数成分X(k,m)に乗算することで、音響信号xの残響成分を抑圧した音響信号yを生成することが可能である。
ところで、音響信号xの残響時間が比較的に短い場合には指標値RB(k,m)が短時間で急峻に減少するから、対比例の調整値G(k,m)は迅速に充分に小さい数値に減少する。したがって、対比例でも音響信号xの残響成分を抑圧することが可能である。しかし、音響信号xの残響時間が比較的に長い場合には指標値RB(k,m)が長時間にわたり大きい数値に維持されるから、音響信号xの残響成分を有効に抑圧し得る充分に小さい数値まで調整値G(k,m)が減少するには長時間が必要である。したがって、対比例では、音響信号xの残響時間が長い場合に残響成分の抑圧精度が低下する可能性がある。
以上の事情を考慮して、第1実施形態の調整値算定部54は、以下の数式(2)で表現される基礎値Q(k,m)を調整値G(k,m)として算定する。
数式(2)から理解される通り、指標値RA(k,m)と指標値RB(k,m)との加算に対する指標値RB(k,m)の相対比である基礎値Q(k,m)が調整値G(k,m)として算定される(G(k,m)=Q(k,m))。すなわち、調整値算定部54は、指標値RA(k,m)と指標値RB(k,m)との双方を分母に包含するとともに指標値RB(k,m)を分子に包含する数式(2)を利用して調整値G(k,m)を算定する。指標値RA(k,m)および指標値RB(k,m)は非負値であるから、調整値G(k,m)(基礎値Q(k,m))は1以下の範囲内で変動する。
前述の通り、音響信号xの残響時間が比較的に長い場合には指標値RB(k,m)が長時間にわたり大きい数値に維持されるから、数式(2)の分母の指標値RB(k,m)は、残響時間が長い場合に、調整値G(k,m)(基礎値Q(k,m))を減少させるように作用する。したがって、数式(2)で算定される基礎値Q(k,m)を調整値G(k,m)として音響信号xの各周波数成分X(k,m)に作用させることで、残響時間が長い場合でも音響信号xの残響成分を高精度に抑圧することが可能である。
なお、音響信号xのうち残響成分以外の目的成分が優勢な区間(例えば直接音や初期反射音が存在する区間SA)では、指標値RB(k,m)が指標値RA(k,m)と比較して充分に大きい(RB(k,m)≫RA(k,m))から、数式(2)で算定される調整値G(k,m)は1(最大値)に近い数値となる。したがって、数式(2)の分母の指標値RB(k,m)の作用で調整値G(k,m)が減少するとは言え、調整値G(k,m)が過度に小さい数値に抑制されること(音響信号xの目的成分が過剰に抑圧されること)は防止される。すなわち、音響信号xの残響成分を高精度に抑圧することが可能である。
図4は、記憶装置24に記憶されたプログラムに従って演算処理装置22が実行する残響調整処理のフローチャートである。入力装置(図示略)に対する利用者からの指示(残響調整処理の開始指示)を契機として図4の残響調整処理が開始される。残響調整処理を開始すると、演算処理装置22は、単位期間毎に以下のステップS1からステップS5の処理を実行する。まず、周波数分析部32は、音響信号xの各周波数の周波数成分X(k,m)を算定する(S1)。
解析処理部42の指標算定部52は、周波数分析部32が算定した各周波数成分X(k,m)を適用した数式(1A)および数式(1B)の演算で指標値RA(k,m)および指標値RB(k,m)を算定する(S2)。調整値算定部54は、指標算定部52が算定した指標値RA(k,m)および指標値RB(k,m)を適用した数式(2)の演算で各周波数の調整値G(k,m)を算定する(S3)。
残響調整部34は、調整値算定部54がステップS3で算定した調整値G(k,m)を音響信号xの各周波数成分X(k,m)に作用させることで周波数成分Y(k,m)を算定する(S4)。波形生成部36は、残響調整部34が算定した各周波数成分Y(k,m)から単位期間の音響信号yを生成する(S5)。音響信号xの全部の単位期間について以上の処理(S1〜S5)が反復される(S6:NO)ことで、音響信号xの残響成分を抑圧した音響信号yが生成される。
以上に説明した通り、第1実施形態では、音響信号xの強度P(k,m)の移動平均である指標値RA(k,m)および指標値RB(k,m)に応じて調整値G(k,m)が算定されるから、特許文献1や非特許文献1の技術と比較して簡便に音響信号xの残響成分を抑圧できるという利点がある。
<第2実施形態>
本発明の第2実施形態を以下に説明する。なお、以下に例示する各構成において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
本発明の第2実施形態を以下に説明する。なお、以下に例示する各構成において作用や機能が第1実施形態と同様である要素については、第1実施形態の説明で参照した符号を流用して各々の詳細な説明を適宜に省略する。
図5は、第2実施形態における音響処理装置100の構成図である。図5に例示される通り、第2実施形態の演算処理装置22は、第1実施形態と同様の要素(周波数分析部32,残響調整部34,波形生成部36,解析処理部42)に加えて係数設定部44として機能する。係数設定部44は、調整値算定部54が調整値G(k,m)の算定に適用する係数(以下「加重係数」という)ηを設定する。加重係数ηは正数に設定される。
数式(3)から理解される通り、例えば加重係数ηが1を下回る場合、基礎値Q(k,m)は1以上の数値となり得る。そこで、調整値算定部54は、数式(3)で算定した基礎値Q(k,m)を利用した数式(4)の演算で調整値G(k,m)を算定する。
すなわち、調整値G(k,m)は、1を上限値として基礎値Q(k,m)に設定される。以上に説明した通り、第2実施形態においても指標値RA(k,m)および指標値RB(k,m)に応じて調整値G(k,m)が算定されるから、第1実施形態と同様に、音響信号xの残響成分を簡便に抑圧することが可能である。なお、数式(4)では調整値G(k,m)の上限値を1としたが、調整値G(k,m)の上限値は任意の数値に設定され得る。例えば、いわゆる桁溢れを防止する観点から、1を下回る正数(例えば0.99)を調整値G(k,m)の上限値とすることも可能である。
数式(3)から理解される通り、第2実施形態の調整値算定部54は、指標値RA(k,m)と、加重係数ηを乗算した指標値RB(k,m)との加算を分母に包含する数式(3)を利用して調整値G(k,m)を算定する。したがって、加重係数ηが大きいほど調整値G(k,m)は小さい数値に設定される。すなわち、数式(3)の分母の指標値RB(k,m)が調整値G(k,m)を減少させる作用は、当該指標値RB(k,m)に乗算される加重係数ηが大きいほど強調される。
図5の係数設定部44は、音響信号xの残響成分に想定される残響時間(例えば音響信号xが発音および収録された音響空間の残響時間)TRに応じて加重係数ηを可変に設定する。具体的には、係数設定部44は、例えば入力装置(図示略)に対する利用者からの指示(残響時間TRの指定)に応じて残響時間TRを設定し、残響時間TRに応じた加重係数ηを設定する。
第2実施形態の係数設定部44は、残響時間TRに対して単調増加するように加重係数ηを設定する。すなわち、残響時間TRが長いほど加重係数ηは大きい数値に設定される。例えば、係数設定部44は、以下の数式(5)の演算で残響時間TRに応じた加重係数ηを算定する。
数式(5)の係数aは所定の正数に設定され、係数bは所定値に設定される。以上の説明から理解される通り、残響時間TRが長い(加重係数ηが大きい)ほど、数式(3)の分母の指標値RB(k,m)が調整値G(k,m)を減少させる作用は強調される。したがって、第2実施形態では、残響時間が長い場合でも音響信号xの残響成分を高精度に抑圧できるという前述の効果は格別に顕著である。
なお、残響時間TRに応じた加重係数ηを算定する演算は数式(5)に限定されない。例えば、以下の数式(6-1)〜(6-3)の演算で係数設定部44が加重係数ηを算定することも可能である。以下の各数式における係数aおよび係数bは所定値に設定される。
数式(6-1)の加重係数ηは、残響時間TRのγ次関数として表現され、冪指数γは所定の整数(奇偶は不問)に設定される。数式(6-2)の加重係数ηは、残響時間TRの指数関数として表現され、数式(6-3)の加重係数ηは、残響時間TRの対数関数として表現される。数式(6-3)では、変数{aTR+b}が1以上となるように各係数を選定することで加重係数ηを正数の範囲内で設定することが可能である。なお、加重係数ηを、残響時間TRに依存しない所定値に設定することも可能である。
また、前述の説明では、利用者が残響時間TRを指示する場合を例示したが、音響空間内の音響の収音で音響信号xを生成する収音装置を信号供給装置12として採用した構成では、所定の測定用信号を音響空間内に放音したときに収録される音響信号xを解析することで係数設定部44が残響時間TRを実測することも可能である。残響時間TRの測定には、例えばインパルス積分法(Schroeder法)やマルチステップ線形予測等の公知の残響解析技術が任意に採用され得る。また、周波数が時間的に連続に変化する時間伸長信号(TSP:Time Stretched Pulse)が測定用信号として好適である。
<第3実施形態>
前掲の数式(3)の基礎値Q(k,m)が1を上回る区間では調整値G(k,m)が1に維持されるから、周波数成分X(k,m)の残響成分(特に初期反射音)は抑圧されず、結果的に抑圧効果が不足する可能性がある。以上の事情を考慮して、第3実施形態では、基礎値Q(k,m)が1を上回る場合に当該基礎値Q(k,m)を低減(正規化)することで、調整値G(k,m)が1に制限される時間を短縮する。
前掲の数式(3)の基礎値Q(k,m)が1を上回る区間では調整値G(k,m)が1に維持されるから、周波数成分X(k,m)の残響成分(特に初期反射音)は抑圧されず、結果的に抑圧効果が不足する可能性がある。以上の事情を考慮して、第3実施形態では、基礎値Q(k,m)が1を上回る場合に当該基礎値Q(k,m)を低減(正規化)することで、調整値G(k,m)が1に制限される時間を短縮する。
図6は、第3実施形態の調整値算定部54が調整値G(k,m)を算定する処理のフローチャートである。前掲の図4のステップS3で図6の処理が実行される。したがって、音響信号xの単位期間毎に図6の処理が実行されて、当該単位期間の調整値G(k,m)が周波数毎に算定される。なお、第1回目の図6の処理が実行される直前に、基礎値Q(k,m)の調整に適用される変数(以下「正規化係数」という)GNが初期値1に設定される。
図6の処理を開始すると、調整値算定部54は、前掲の数式(3)の演算で今回の単位期間の基礎値Q(k,m)を算定する(S31)。そして、調整値算定部54は、今回の単位期間の基礎値Q(k,m)が1を上回るか否かを判定する(S32)。基礎値Q(k,m)が1を上回る場合(S32:YES)、調整値算定部54は、現段階の正規化係数GNが1であるか否かを判定する(S33)。基礎値Q(k,m)の調整中には正規化係数GNは1を上回る数値に設定される。したがって、ステップS33の判定は、基礎値Q(k,m)の正規化を実行している最中であるか否かの判定に相当する。
正規化係数GNが1である場合(S33:YES)、調整値算定部54は、正規化係数GNを、今回の基礎値Q(k,m)(Q(k,m)>1)に更新する(S34)。すなわち、以降の各単位期間の基礎値Q(k,m)を正規化するための数値に正規化係数GNが設定される。他方、基礎値Q(k,m)が1以下である場合(S32:NO)や正規化係数GNが1である場合(S33:NO)には、正規化係数GNの更新(S34)は実行されない。
図7は、調整前の基礎値Q(k,m)(実線)と調整後の基礎値Q(k,m)(破線)との関係を例示するグラフである。図7から理解される通り、単位期間毎に順次に算定される複数の基礎値Q(k,m)のうち最初に1を上回る数値に到達した時点t1の基礎値Q(k,m)が(S32:YES,S33:YES)、以降の各単位期間の基礎値Q(k,m)を低減(正規化)するための正規化係数GNとして利用される。
調整値算定部54は、ステップS31で算定した今回の基礎値Q(k,m)が所定の閾値QTHを下回るか否かを判定する(S35)。基礎値Q(k,m)が閾値QTHを下回る場合(S35:YES)、調整値算定部54は、正規化係数GNを1に初期化する(S36)。他方、基礎値Q(k,m)が閾値QTH以上である場合(S35:NO)、正規化係数GNの初期化(S36)は実行されない。
調整値算定部54は、今回の基礎値Q(k,m)を正規化係数GNで除算する(S37)。したがって、図7からも理解される通り、正規化係数GNが初期値1に設定された状態(例えば基礎値Q(k,m)が1を上回る以前の状態や基礎値Q(k,m)が閾値QTHを下回る数値に低下した直後の状態)では、ステップS37の調整の前後で基礎値Q(k,m)は変化しない。他方、正規化係数GNが1を上回る数値に設定されている場合、ステップS37の調整後の基礎値Q(k,m)は、調整前の基礎値Q(k,m)を下回る数値に調整される。すなわち、図7から理解される通り、基礎値Q(k,m)が最初に1を上回る数値に増加した時点t1から基礎値Q(k,m)が閾値QTHを下回る時点t2までの期間では、数式(3)の演算で算定された基礎値Q(k,m)が低減される。調整値算定部54は、ステップS37の実行後の基礎値Q(k,m)について数式(4)の演算を実行することで調整値G(k,m)を算定する(S38)。図7では調整値G(k,m)が鎖線で図示されている。
第3実施形態においても第1実施形態や第2実施形態と同様の効果が実現される。また、第3実施形態では、基礎値Q(k,m)が1を上回る場合に当該基礎値Q(k,m)が低減されるから、音響信号xのうち目的成分の直後の残響成分(初期反射音)も高精度に抑圧できるという利点がある。
<第4実施形態>
第4実施形態の調整値算定部54は、以下の数式(7)の演算で調整値G(k,m)を算定する。
数式(7)から理解される通り、調整値算定部54は、基礎値C(k,m)と基礎値Q(k,m)との加重和を調整値G(k,m)として算定する。基礎値C(k,m)は、以下の数式(8)で表現される通り、指標値RA(k,m)に対する指標値RB(k,m)の相対比であり、前掲の対比例の調整値G(k,m)に相当する。基礎値Q(k,m)の算定には、例えば第1実施形態の数式(2)や第2実施形態の数式(3)が適用される。
基礎値C(k,m)および基礎値Q(k,m)の各々の算定には共通の指標値RA(k,m)および指標値RB(k,m)が適用される。ただし、基礎値C(k,m)と基礎値Q(k,m)とで指標値RA(k,m)の平滑化係数αAや指標値RB(k,m)の平滑化係数αBを相違させることも可能である。
第4実施形態の調整値算定部54は、以下の数式(7)の演算で調整値G(k,m)を算定する。
基礎値C(k,m)の加重値w1と基礎値Q(k,m)の加重値w2とは所定値に設定される。加重値w1および加重値w2の設定方法は任意であるが、調整値G(k,m)の作用で音響信号xの残響成分が有効に抑圧されるように加重値w1および加重値w2を算定する以下の方法が好適である。
音響信号xに付与された残響効果の振幅-周波数特性は、変調角周波数ωと残響時間TRとを変数とする数式(9)の変調伝達関数Ψ(ω)で近似される。なお、数式(9)の変調伝達関数Ψ(ω)については、例えば、M. Unoki, et. al., "An improved method based on the MTF concept for restoring the power envelope from a reverberant signal", Acoustical science and technology 25(4), p. 232-242にも詳述されている。
数式(9)の変調伝達関数Ψ(ω)で表現される残響効果を音響信号x(周波数成分X(k,m))に対する調整値G(k,m)の乗算で抑圧するためには、調整値G(k,m)が変調伝達関数Ψ(ω)の逆特性に近似する必要がある。以上の観点から、調整値G(k,m)と変調伝達関数Ψ(ω)の逆特性との相違(誤差)を評価するための数式(10)の誤差関数E(w)を導入する。誤差関数E(w)は、加重値w1および加重値w2の関数である。なお、数式(10)では、変調角周波数ωを変数とする変調伝達関数Ψ(ω)と対比するために、基礎値C(k,m)および基礎値Q(k,m)にも変調角周波数ωを導入した。
数式(10)から理解される通り、誤差関数E(w)は、調整値G(k,m)および変調伝達関数Ψ(ω)の積と1との自乗誤差を変調角周波数ωの全範囲にわたり積算する関数である。したがって、調整値G(ω)の作用が変調伝達関数Ψ(ω)の逆特性(すなわち残響効果の振幅-周波数特性の逆特性)に近似するほど誤差関数E(w)は小さい数値となる。第4実施形態の調整値算定部54は、誤差関数E(w)が最小となるように加重値w1および加重値w2を算定する。具体的には、加重値w1および加重値w2による誤差関数E(w)の偏微分をゼロと仮定することで導出される2元1次の連立方程式から加重値w1および加重値w2が算定される。
第4実施形態においても第1実施形態と同様の効果が実現される。また、第4実施形態では、基礎値C(k,m)と基礎値Q(k,m)との加重和が調整値G(k,m)として算定されるから、基礎値Q(k,m)のみに応じて調整値G(k,m)を設定する構成と比較して、多様な音響特性の残響成分を高精度に抑圧できるという効果が実現される。また、第4実施形態では特に、調整値G(k,m)の作用が残響効果の振幅-周波数特性(変調伝達関数Ψ(ω))の逆特性に近似するように基礎値C(k,m)の加重値w1と基礎値Q(k,m)の加重値w2とが設定されるから、残響成分の抑圧精度が向上するという効果は格別に顕著である。
なお、誤差関数E(w)の内容は適宜に変更される。例えば、前掲の数式(10)では、調整値G(k,m)の作用が変調伝達関数Ψ(ω)の逆特性に近似するという条件を評価するための誤差関数E(w)を例示したが、加重値w1と加重値w2との総和が1になるという条件(以下「第1拘束条件」という)を追加した以下の数式(11)の誤差関数E1(w)を利用することも可能である。
数式(11)の係数λ1は所定の正数である。加重値w1と加重値w2との総和が1に近付くほど数式(11)の誤差関数E1(w)の右辺の第2項は小さい数値となる。すなわち、数式(11)の右辺の第2項が第1拘束条件に相当する。調整値算定部54は、誤差関数E1(w)が最小となるように加重値w1および加重値w2を算定する。以上の構成では、加重値w1と加重値w2との総和が1になるという第1拘束条件のもとで加重値w1および加重値w2が算定されるから、例えば基礎値C(k,m)と基礎値Q(k,m)との双方が最大値1に設定されたような場合でも音響信号xと音響信号yとの音量差を抑制する(入出力の関係を維持する)ことが可能である。すなわち、音響信号yの音量が過剰に増大(ひいては発散)する事態や、音響信号yの音量が過剰に低減されて再生音を聴取できない事態等が防止され、結果的に音響信号yを安定的に生成できるという利点がある。
また、加重値w1および加重値w2の各々の絶対値が抑制されるという条件(以下「第2拘束条件」という)を追加した以下の数式(12)の誤差関数E2(w)を利用することも可能である。
数式(12)の係数λ2は所定の正数である。各加重値wnの自乗wn2の総和が小さいほど数式(12)の誤差関数E2(w)の右辺の第2項は小さい数値となる。すなわち、数式(12)の右辺の第2項が第2拘束条件に相当する。調整値算定部54は、誤差関数E2(w)が最小となるように加重値w1および加重値w2を算定する。以上の構成によれば、加重値w1および加重値w2の一方が他方と比較して過度に大きい数値となる事態を防止できる。なお、第1拘束条件および第2拘束条件の双方を加味して加重値w1および加重値w2を算定することも可能である。
基礎値Q(k,m)を、N個の基礎値Q1(k,m)〜QN(k,m)の加重和として算定することも可能である。各基礎値Qn(k,m)(n=1〜N)は、平滑化係数αA(n)を適用した強度P(k,m)の指数移動平均で算定された指標値RA(k,m)_nと、平滑化係数αB(n)(αB(n)>αA(n))を適用した強度P(k,m)の指数移動平均で算定された指標値RB(k,m)_nとを数式(2)または数式(3)に適用することで算定される。平滑化係数αA(n)および平滑化係数αB(n)の一方または双方は基礎値Qn(k,m)毎に相違する。数式(7)の基礎値C(k,m)についても同様に、N個の基礎値C1(k,m)〜CN(k,m)の加重和として算定され得る。各基礎値Qn(k,m)の加重値や各基礎値Cn(k,m)の加重値は、前掲の数式(10)の誤差関数E(w)と同様に、調整値G(k,m)の作用が残響効果の振幅-周波数特性(変調伝達関数Ψ(ω))の逆特性に近似するように選定される。
<第5実施形態>
以上の各形態ではモノラルの音響信号xを想定した。第5実施形態の音響信号xは、左チャネルの音響信号xLと右チャネルの音響信号xRとで構成されるステレオ信号である。解析処理部42は、音響信号xLと音響信号xRとを時間領域または周波数領域で加算した音響信号の各周波数成分X(k,m)を前述の各形態と同様に解析することで各周波数の調整値G(k,m)を単位期間毎に算定する。周波数分析部32は、音響信号xLの各周波数成分XL(k,m)と音響信号xRの各周波数成分XR(k,m)とを単位期間毎に算定する。残響調整部34は、周波数成分XL(k,m)に調整値G(k,m)を作用させて周波数成分YL(k,m)を生成するとともに周波数成分XR(k,m)に調整値G(k,m)を作用させて周波数成分YR(k,m)を生成する。波形生成部36は、周波数成分YL(k,m)から時間領域の音響信号yLを生成するとともに周波数成分YR(k,m)から時間領域の音響信号yRを生成する。すなわち、音響信号xLおよび音響信号xRの残響成分を抑圧したステレオ形式の音響信号y(yL,yR)が生成される。第5実施形態においても第1実施形態と同様の効果が実現される。
以上の各形態ではモノラルの音響信号xを想定した。第5実施形態の音響信号xは、左チャネルの音響信号xLと右チャネルの音響信号xRとで構成されるステレオ信号である。解析処理部42は、音響信号xLと音響信号xRとを時間領域または周波数領域で加算した音響信号の各周波数成分X(k,m)を前述の各形態と同様に解析することで各周波数の調整値G(k,m)を単位期間毎に算定する。周波数分析部32は、音響信号xLの各周波数成分XL(k,m)と音響信号xRの各周波数成分XR(k,m)とを単位期間毎に算定する。残響調整部34は、周波数成分XL(k,m)に調整値G(k,m)を作用させて周波数成分YL(k,m)を生成するとともに周波数成分XR(k,m)に調整値G(k,m)を作用させて周波数成分YR(k,m)を生成する。波形生成部36は、周波数成分YL(k,m)から時間領域の音響信号yLを生成するとともに周波数成分YR(k,m)から時間領域の音響信号yRを生成する。すなわち、音響信号xLおよび音響信号xRの残響成分を抑圧したステレオ形式の音響信号y(yL,yR)が生成される。第5実施形態においても第1実施形態と同様の効果が実現される。
なお、複数のチャネルで構成される音響信号xの残響成分を抑圧する具体的な構成および方法は以上の例示に限定されない。例えば、周波数成分XL(k,m)および周波数成分XR(k,m)の最大値を周波数成分X(k,m)として選択したうえで調整値G(k,m)の算定等を実行することも可能である。また、前掲の数式(1A)および数式(1B)に代えて、以下に例示する各演算で指標値Ri(k,m)(i=A,B)を算定することも可能である。
以下の数式(13)で表現される通り、音響信号xLの周波数成分XL(k,m)と音響信号xRの周波数成分XR(k,m)との相互相関の指数移動平均を指標値Ri(k,m)として算定することが可能である。数式(13)の記号*は複素共役を意味する。
以下の数式(14)で表現される通り、音響信号xLの各周波数の強度PL(k,m)(例えばパワー|XL(k,m)|2)と音響信号xRの各周波数の強度PR(k,m)(例えばパワー|XR(k,m)|2)との平均値(単純平均)の指数移動平均を指標値Ri(k,m)として算定することが可能である。
以下の数式(15)で表現される通り、音響信号xLの周波数成分XL(k,m)の自己相関と音響信号xRの周波数成分XR(k,m)の自己相関との乗算値の指数移動平均を指標値Ri(k,m)として算定することが可能である。
以上の例示から理解される通り、指標値RA(k,m)および指標値RB(k,m)は、音響信号xの強度に追従して時間的に変動する数値として包括的に表現され、音響信号xの振幅|X(k,m)|の任意乗の次元(単位)で表現される物理量の移動平均が典型例として例示される。
なお、以上の説明では、左右2チャネルの音響信号xを例示したが、3チャネル以上の音響信号xを処理することも可能である。例えば、5チャネル(C,L,R,Ls,Rs)の音響信号xを想定する。中央チャネル(C)の音響信号xCから解析処理部42が算定した調整値G(k,m)を残響調整部34は音響信号xCに作用させる。左前方チャネル(L)の音響信号xLと右前方チャネル(R)の音響信号xRとに応じたモノラルの音響信号から解析処理部42が算定した調整値G(k,m)を残響調整部34は音響信号xLと音響信号xRとに作用させる。また、左後方チャネル(Ls)の音響信号xLsと右後方チャネル(Rs)の音響信号xRsとに応じたモノラルの音響信号から解析処理部42が算定した調整値G(k,m)を残響調整部34は音響信号xLsと音響信号xRsとに作用させる。なお、各チャネルの組合わせは任意である。例えば左前方チャネル(L)の音響信号xLと左後方チャネル(Ls)の音響信号xLsとから調整値G(k,m)を算定する構成や、右前方チャネル(R)の音響信号xRと右後方チャネル(Rs)の音響信号xRsとから調整値G(k,m)を算定する構成も採用される。
<第6実施形態>
第6実施形態の音響処理装置100は、第1実施形態の解析処理部42を図8の解析処理部70に置換した構成である。解析処理部70は、第1実施形態の解析処理部42と同様に、各周波数の調整値G(k,m)を単位期間毎に算定する要素であり、図8に例示される通り、残響推定部72と調整値算定部74とを含んで構成される。
第6実施形態の音響処理装置100は、第1実施形態の解析処理部42を図8の解析処理部70に置換した構成である。解析処理部70は、第1実施形態の解析処理部42と同様に、各周波数の調整値G(k,m)を単位期間毎に算定する要素であり、図8に例示される通り、残響推定部72と調整値算定部74とを含んで構成される。
残響推定部72は、音響信号x(各周波数成分X(k,m))の残響成分Vr(k,m)を推定する。具体的には、残響推定部72は、音響信号xの後期残響成分を近似する以下の数式(18)の演算で、各周波数の残響成分Vr(k,m)を単位期間毎に算定する。なお、残響成分を近似する数式(18)については、K. Lebart, et. al., "A New Method Based on Spectral Subtraction for Speech Dereberberation", Acta Acustica, Vol. 87 (2001) p.359-366にも詳述されている。
数式(18)の記号Tdは、単位期間の個数(したがって自然数)で表現された遅延量を意味する。遅延量Tdは、例えば利用者からの指示に応じて可変に設定される。例えば、遅延量Tdは、利用者が任意に指定した時間Tを各単位期間の時間差(フレームシフト)Tsで除算した結果を整数化した数値(Td=round(T/Ts))に設定される。例えば音響信号xのサンプリング周波数が8kHzや16kHzである場合、遅延量Tdは単位期間の2個分から3個分程度の数値に設定される。また、数式(18)の時間Txは、例えば利用者が指定した時間Tに応じて設定される。具体的には、時間Tに応じた遅延量Tdと各単位期間の時間差Tsとの積が数式(18)の時間Txとして好適である(Tx=Td・Ts)。記号Δは、以下の数式(19)で表現される通り、残響時間TRに応じた変数である。
また、数式(18)の記号Vx(k,m)は、音響信号xのパワー|X(k,m)|2の移動平均(以下の例示では指数移動平均)であり、以下の数式(20)で定義される。数式(20)の記号β1は、指数移動平均の平滑化係数であり、例えば0.9程度の数値(1未満の正数)に設定される。
第6実施形態の調整値算定部74は、以下の数式(21)の演算で各周波数の調整値G(k,m)を単位期間毎に算定する。
数式(21)は、ウィナーフィルタ(Wiener Filter)の理論を利用したフィルタ(Quasi- Wiener Filter)であり、音響信号xに作用することで残響成分Vr(k,m)を抑圧する。以上の説明から理解される通り、第6実施形態の調整値算定部74は、音響信号xの強度(以上の例示では振幅|X(k,m)|)と音響信号xから推定される残響成分Vr(k,m)とを分母に包含するとともに音響信号xの強度を分子に包含する演算式(数式(21))を利用して調整値G(k,m)を算定する。調整値算定部74が数式(21)の演算で生成した調整値G(k,m)を、残響調整部34は、第1実施形態と同様に音響信号x(各周波数成分X(k,m))に作用させる。
数式(21)の残響成分Vr(k,m)は、数式(18)および数式(19)から理解される通り、残響時間TRの関数である。具体的には、残響時間TRが長いほど残響成分Vr(k,m)は長時間にわたり大きい数値に維持される。すなわち、数式(21)の残響成分Vr(k,m)は、第1実施形態の指標値RB(k,m)と同様に、残響時間TRが長い場合に調整値G(k,m)を減少させるように作用する。したがって、第6実施形態によれば、第1実施形態と同様に、残響時間が長い場合でも音響信号xの残響成分を高精度に抑圧できるという利点がある。
なお、第6実施形態の調整値G(k,m)は、事後SN比σpos(σpos=(|X(k,m)|2/Vr(k,m))−1)を利用して以下の数式(22)のように変形され得る。なお、事後SN比σposの利用については、数式(18)の説明で参照した文献(Lebart)にも開示されている。
数式(22)の事後SN比σposは、以下の数式(23)で表現される通り、事前SN比σpriで近似的に表現される。
数式(23)の記号β2は、1未満の正数に設定される。数式(23)の記号max[0, ]は、括弧内の数値を非負値に制限する演算を意味する。
以上の近似を数式(22)に適用すると、事前SN比σpriに応じて調整値G(k,m)を算定するための以下の数式(24)が導出される。したがって、調整値算定部74は、数式(21)に代えて数式(24)の演算で調整値G(k,m)を算定することも可能である。
なお、以上の説明では、ウィナーフィルタの理論を残響成分Vr(k,m)の抑圧に適用した場合を例示したが、事前SN比σpriを利用したウィナーフィルタの理論を、MMSE-STSA法やMMSE対数振幅法等の公知の雑音抑圧技術に拡張することで、音響信号xから残響成分Vr(k,m)を抑圧することも可能である。
<第7実施形態>
第2実施形態の係数設定部44は、調整値G(k,m)の算定に適用する加重係数ηを、残響時間TRに応じて可変に設定する構成としたが、第7実施形態の係数設定部44は、指標値RA(k,m)および指標値RB(k,m)に応じて加重係数ηを可変に設定する。なお、第7実施形態においても第2実施形態と同様にモノラルの音響信号xを想定した。
第2実施形態の係数設定部44は、調整値G(k,m)の算定に適用する加重係数ηを、残響時間TRに応じて可変に設定する構成としたが、第7実施形態の係数設定部44は、指標値RA(k,m)および指標値RB(k,m)に応じて加重係数ηを可変に設定する。なお、第7実施形態においても第2実施形態と同様にモノラルの音響信号xを想定した。
図9は、第7実施形態における音響処理装置100の構成図である。図9に例示される通り、第7実施形態の音響処理装置100は、第2実施形態と同様の要素を包含する。第7実施形態の解析処理部42は、第2実施形態と同様に、指標算定部52と調整値算定部54とを含んで構成される。指標算定部52は、数式(1A)の演算により指標値RA(k,m)を算定するとともに数式(1B)の演算により指標値RB(k,m)を算定する。調整値算定部54は、係数設定部44が設定した加重係数ηを適用した数式(3)および数式(4)の演算で調整値G(k,m)を算定する。
第7実施形態の係数設定部44は、指標算定部52が算定した指標値RA(k,m)および指標値RB(k,m)を数式(25)に適用して変数g(k,m)を算定し、変数g(k,m)に応じた加重係数ηを設定する。変数g(k,m)は、指標値RA(k,m)に対する指標値RB(k,m)の相対比であって、前述の対比例における調整値G(k,m)に相当する。
図10は、変数g(k,m)と加重係数ηとの関係を例示するグラフである。係数設定部44は変数g(k,m)を関数W(g(k,m))に適用することで加重係数ηを設定する(η=W(g(k,m)))。関数W(g(k,m))は、図10に例示される非線形関数である。図10から理解される通り、加重係数ηは、変数g(k,m)が0以上かつ1未満の場合は変数g(k,m)に連動して増加(単調増加)する一方、変数g(k,m)が負数または1以上である場合には0に設定される。図10に示されるように、変数g(k,m)が0に近接するとき(音響信号xの残響時間が比較的短い場合)、加重係数ηは小さい数値に設定されるから、調整値G(k,m)は大きい数値に設定される。他方、変数g(k,m)が1に近接するとき(音響信号xの残響時間が比較的に長い場合)、加重係数ηは大きい数値(所定の正数aに近い数値)に設定されるから、調整値G(k,m)は小さい数値に設定される。
図11は、加重係数ηを適用して算定された調整値G(k,m)の時間変化と残響時間との関係を例示するグラフである。前述の対比例における調整値G(k,m)(G(k,m)=RB(k,m)/RA(k,m))の時間変化が鎖線で併記されている。図11の部分(A)は、音響信号xの残響時間が比較的に短い場合を例示し、図11の部分(B)は、音響信号xの残響時間が比較的に長い場合を例示する。前述の各形態と同様に、図11における区間SAは、直接音および初期反射音が存在する区間に相当し、区間SBは後期残響成分が存在する区間に相当する。
音響信号xの残響時間が比較的に長い場合には、指標値RB(k,m)は長時間にわたり大きい数値に維持されて、変数g(k,m)は1に近い数値に維持される。加重係数ηは、変数g(k,m)の値が1に近接するときには、比較的大きい数値に設定される。その結果、調整値G(k,m)は長時間にわたって小さい数値に設定される。図11(B)を参照して調整値G(k,m)と対比例とを比較すると、時点tx以降では、調整値G(k,m)は対比例に対して充分に低減されていることが判る。以上の構成によれば、音響信号xの残響時間が比較的に長い場合でも、調整値G(k,m)を有効に抑制することができる。
以上に説明した通り、第7実施形態では、音響信号xの残響時間が長い場合には、係数算定部44によって加重係数ηが大きい数値に設定されるから、第2実施形態と同様に、音響信号xの残響成分を高精度に抑圧するように調整値G(変数g(k,m))を設定することが可能である。第7実施形態の構成によれば、第2実施形態と比較して、残響時間TRの推定が不要であることから残響時間TRの誤差に影響されずに残響成分を抑圧できるという効果を奏する。
<変形例>
以上に例示した各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
以上に例示した各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
(1)前述の各形態における周波数分析部32と残響調整部34と波形生成部36とは、音響信号xを時間領域で処理する図12の要素(周波数分析部62,残響調整部64,波形生成部66)に置換され得る。なお、解析処理部42の構成および動作は第1実施形態と同様である。
周波数分析部62は、帯域分割部622と包絡抽出部624とを含んで構成される。帯域分割部622は、信号供給装置12から供給される音響信号xを、相異なる周波数帯域に対応する複数の帯域成分x(k)(x(1),x(2),……)に時間領域で分解する。例えば、通過帯域が相違する複数の帯域通過フィルタで構成されるフィルタバンクが帯域分割部622として利用される。包絡抽出部624は、複数の帯域成分x(k)の各々を包絡成分xE(k)と残余成分xR(k)とに分解する。包絡成分xE(k)は、帯域成分x(k)の時間波形の包絡線に相当する成分であり、残余成分xR(k)は、帯域成分x(k)から包絡成分xE(k)を除外した成分である。包絡成分xE(k)の抽出には、例えばヒルベルト変換等の公知の信号処理技術が任意に採用される。
残響調整部64は、周波数分析部62(包絡抽出部624)が生成した各包絡成分xE(k)に、解析処理部42が生成した調整値G(k,m)を作用させる。具体的には、残響調整部64は、包絡成分xE(k)に調整値G(k,m)を乗算することで包絡成分yE(k)を生成する。包絡成分xE(k)の時間軸上の各サンプルには、解析処理部42が当該サンプルの時点について算定した調整値G(k,m)が乗算される。
波形生成部66は、第1合成部662と第2合成部664とを含んで構成される。第1合成部662は、残響調整部64が各周波数帯域について生成した包絡成分yE(k)と、当該周波数帯域の残余成分xR(k)とを合成(例えば乗算や加算)することで帯域成分y(k)を生成する。以上の説明から理解される通り、帯域成分y(k)は、帯域成分x(k)から残響成分を抑圧した音響成分である。第2合成部664は、第1合成部662が生成した複数の帯域成分y(k)を合成(例えば加算)することで音響信号yを生成する。図12の構成でも、前述の形態と同様の効果が実現される。
(2)第1実施形態では、前掲の数式(2)の基礎値Q(k,m)を調整値G(k,m)として利用したが、数式(2)の基礎値を利用した以下の数式(26)の演算で調整値G(k,m)を算定することも可能である。
数式(26)の係数νは数値1を上回る所定値に設定される。数式(26)から理解される通り、調整値G(k,m)は、数値1を上限値として係数νと基礎値Q(k,m)との乗算値に設定される。数式(2)の基礎値Q(k,m)を調整値G(k,m)として利用する構成では、調整値G(k,m)が1には殆ど到達しないから、音響信号yの強度が音響信号xと比較して不足する可能性がある。他方、数式(26)で調整値G(k,m)を算定する構成では、調整値G(k,m)が1に設定される頻度が充分に確保されるから、音響信号xと音響信号yとの強度差を低減することが可能である。
(3)音響信号xの目的成分の発音開始から相当の時間が経過して強度P(k,m)が充分に減衰した区間(以下「後期減衰区間」という)では、指標値RA(k,m)または指標値RB(k,m)が変動することで基礎値Q(k,m)(調整値G(k,m))が不安定となり、音響信号yの音量が揺動して再生音の音質が低下する可能性がある。以上の傾向を考慮すると、後期減衰区間にて音響信号yの音量の変動を抑制する構成が好適である。
具体的には以下の数式(27)で表現される通り、調整値算定部54は、指標値RA(k,m)が所定の閾値RTHを下回る場合(すなわち後期減衰区間内である場合)に、調整値G(k,m)を、基礎値Q(k,m)とは無関係の所定値Gminに固定し、指標値RA(k,m)が閾値RTHを上回る場合に基礎値Q(k,m)を調整値G(k,m)として採択する。以上の構成では、指標値RA(k,m)が閾値RTHを下回る後期減衰区間内において調整値G(k,m)が所定値Gminに維持されるから、後期減衰区間内で調整値G(k,m)の変動に起因した音響信号yの音量の変動を抑制することが可能である。
なお、数式(27)では、指標値RA(k,m)が閾値RTHを下回る場合に調整値G(k,m)を所定値Gminに設定したが、指標値RA(k,m)が閾値RTHを下回るという条件に加えて、基礎値Q(k,m)が所定の閾値を上回る数値に変動した場合(すなわち調整値G(k,m)が不安定に変動し得る場合)に調整値G(k,m)を所定値Gminに設定することも可能である。すなわち、指標値RA(k,m)が閾値RTHを下回る場合でも、基礎値Q(k,m)が安定している場合には基礎値Q(k,m)が調整値G(k,m)として採択される。また、以上の説明では、後期減衰区間の内外の判定に指標値RA(k,m)を利用したが、指標値RA(k,m)を上回る追従性で音響信号xの強度P(k,m)に追従する指標値(例えば強度P(k,m)の移動平均)が閾値RTHを下回るか否かに応じて後期減衰区間の内外を判定することも可能である。
(4)前述の各形態では、音響信号xのパワー|X(k,m)|2を強度P(k,m)として平滑化することで指標値RA(k,m)および指標値RB(k,m)を算定したが、指標算定部52による平滑化の対象はパワー|X(k,m)|2に限定されない。例えば、音響信号xの振幅|X(k,m)|や振幅|X(k,m)|の4乗|X(k,m)|4を音響信号xの強度P(k,m)として指標値RA(k,m)および指標値RB(k,m)を算定することも可能である。すなわち、指標値Ri(k,m)は、任意の冪指数ρを適用した以下の数式(28)でも表現され得る。また、第6実施形態で例示した数式(20)についても同様に、音響信号xの振幅|X(k,m)|の冪指数(音響信号xの強度の次元)は任意である。
(5)前述の各形態では、音響信号xの強度P(k,m)の指数移動平均を指標値RA(k,m)および指標値RB(k,m)として算定したが、指標値RA(k,m)および指標値RB(k,m)の算定方法は適宜に変更される。例えば、音響信号xの強度P(k,m)の単純移動平均(あるいは加重移動平均)を指標値RA(k,m)および指標値RB(k,m)として算定することも可能である。
具体的には、指標算定部52は、MA個の単位期間にわたる強度P(k,m)の単純移動平均を指標値RA(k,m)として算定し、MB個の単位期間にわたる強度P(k,m)の単純移動平均を指標値RB(k,m)として算定する。平均個数MAは、前述の指数移動平均に適用される平滑化係数αAに対応し、平均個数MBは、指数移動平均に適用される平滑化係数αBに対応する。すなわち、平均個数MAが平均個数MBを上回る数値に設定されることで、前述の形態と同様に、指標値RA(k,m)は、指標値RB(k,m)と比較して低い追従性で音響信号xの強度P(k,m)の変動に追従する。以上の説明から理解される通り、指数移動平均に適用される平滑化係数(αA,αB)に加えて単純移動平均の平均個数(MA,MB)も、移動平均に適用される移動平均係数の概念に包含される。
(6)前述の各形態では、基礎値Q(k,m)の演算式(数式(2))の分母および分子の双方に共通の指標値RB(k,m)が包含される場合を例示したが、以下の数式(29)で基礎値Q(k,m)(調整値G(k,m))を算定することも可能である。数式(3)も同様に変形され得る。
数式(29)の指標値RC(k,m)は、例えば、平滑化係数αCを適用した音響信号xの強度P(k,m)の指数移動平均である。すなわち、調整値算定部54は、指標値RA(k,m)と指標値RB(k,m)とを分母に包含するとともに指標値RC(k,m)を分子に包含する演算式を利用して調整値G(k,m)を算定する。指標値RB(k,m)および指標値RC(k,m)の各々は、指標値RA(k,m)を上回る追従性で音響信号xの強度P(k,m)に追従する(例えばαB>αA,αC>αA)。すなわち、指標値RA(k,m)の平滑化の時定数τAは、指標値RB(k,m)の平滑化の時定数τBおよび指標値RC(k,m)の平滑化の時定数τCを上回る。時定数τBと時定数τCとの大小(平滑化係数αBと平滑化係数αCとの大小)は不問である。
前述の第1実施形態から第5実施形態は、数式(29)の指標値RB(k,m)と指標値RC(k,m)とを共通させた構成に相当する(RB(k,m)=RC(k,m))。他方、指標値RB(k,m)と指標値RC(k,m)とを個別に算定する(平滑化係数αBと平滑化係数αCとを相違させる)ことも可能である。前述の各形態のように指標値RB(k,m)と指標値RC(k,m)とを共通させた構成によれば、指標値RB(k,m)と指標値RC(k,m)とを個別に算定する構成と比較して指標算定部52の処理負荷が軽減されるという利点がある。なお、第7実施形態において、RB(k,m)/RA(k,m)(第2指標値/第1指標値)の代わりに、RC(k,m)/RA(k,m)(第3指標値/第1指標値)を変数g(k,m)として当該変数g(k,m)に応じて加重係数ηを算定することも可能である。
(7)前述の各形態では、音響信号xの強度P(k,m)の移動平均を指標値RB(k,m)として算定したが、音響信号xの強度P(k,m)を指標値RB(k,m)として利用することも可能である。すなわち、指標値RB(k,m)の算定について強度P(k,m)の移動平均は省略され得る。同様に、数式(29)の指標値RC(k,m)として音響信号xの強度P(k,m)を利用することも可能である。以上の説明から理解される通り、指標値RB(k,m)および指標値RC(k,m)は、指標値RA(k,m)を上回る追従性で音響信号xの強度P(k,m)の時間変化に追従する数値として包括的に表現される。
(8)基礎値Q(k,m)(調整値G(k,m))の算定方法は前掲の数式(2)や数式(3)に限定されない。任意の冪指数κを適用して数式(2)や数式(3)の右辺を冪乗することで基礎値Q(k,m)を算定することも可能である。具体的には、数式(2)を変形(一般化)した以下の数式(30A)や数式(3)を変形した以下の数式(30B)が利用され得る。
(9)前述の各形態では、音響信号xの残響成分を抑圧する調整値G(k,m)を例示したが、音響信号xの残響成分を強調(抽出)する場合にも本発明は適用される。例えば、基礎値Q(k,m)を所定値(例えば1)から減算することで調整値G(k,m)(G(k,m)=1−Q(k,m))を算定する構成では、残響成分を強調した音響信号yを生成することが可能である。以上の説明から理解される通り、調整値算定部54は、音響信号xの残響成分を調整(抑圧または強調)するための調整値を算定する要素として包括される。
(10)第2実施形態および第7実施形態では、加重係数ηを分母に包含する数式(3)の基礎値Q(k,m)を利用した数式(4)の演算で調整値G(k,m)を算定したが、加重係数ηを適用した調整値G(k,m)の算定方法は以上の例示に限定されない。例えば、以下の数式(31)に例示される通り、分母に加えて分子にも加重係数ηを含む演算により基礎値Q(k,m)を算定することも可能である。数式(31)の基礎値Q(k,m)を適用した調整値G(k,m)の算定には前掲の数式(4)が第2実施形態と同様に利用される。加重係数ηの算定には、第2実施形態(数式(5),(6-1)〜(6-3))や第7実施形態(η=W(g(k,m)))と同様の方法が適用される。以上の構成においても、残響時間が長い場合に残響成分を高精度に抑圧できるという前述の作用が強調される。
(11)音響信号xの残響成分を抑圧する前述の各形態を、公知の音声強調技術やエコー除去技術と併用することも可能である。例えば、音声強調技術やエコー除去技術を利用した処理後の音響信号xを対象として、前述の各形態に例示した残響成分の抑圧が実行される。残響成分の抑圧後の音響信号yは、例えば音声認識や話者認識等の各種の音響処理の対象としても好適である。
(12)携帯電話機等の端末装置と通信するサーバ装置(典型的にはウェブサーバ)で音響処理装置100を実現することも可能である。例えば、音響処理装置100は、端末装置から受信した音響信号xから音響信号yを生成して端末装置に送信する。なお、音響信号xの各周波数成分X(k,m)が端末装置から送信される構成(例えば端末装置が周波数分析部32を具備する構成)では音響処理装置100から周波数分析部32が省略され、残響成分の調整後の各周波数成分Y(k,m)を音響処理装置100から端末装置に送信する構成(例えば端末装置が波形生成部36を具備する構成)では音響処理装置100から波形生成部36が省略される。また、端末装置が残響調整部34を具備する構成では、音響処理装置100から残響調整部34が省略され、解析処理部42が生成した調整値G(k,m)が音響処理装置100から端末装置に提供される。以上の説明から理解される通り、本発明は、音響信号xの残響成分を調整するための調整値G(k,m)を算定する装置としても実現され得る。
(13)音響空間内での反射や散乱に起因した狭義の残響成分に加えて、例えば楽器の演奏音等の響き成分(共鳴成分)も残響成分に含意される。具体的には、ピアノ等の鍵盤楽器の響板による共鳴成分やバイオリン等の弦楽器の共鳴成分(胴鳴り,箱鳴り)の調整にも本発明を適用することが可能である。すなわち、本発明の残響成分は、経時的に減衰する成分(減衰成分)を意味する。
100……音響処理装置、12……信号供給装置、14……放音装置、22……演算処理装置、24……記憶装置、32,62……周波数分析部、34,64……残響調整部、36,66……波形生成部、42,70……解析処理部、44……係数設定部、52……指標算定部、54,74……調整値算定部、72……残響推定部。
Claims (6)
- 音響信号の強度の移動平均で第1指標値を算定する指標算定手段と、
前記音響信号の残響成分を調整するための調整値を算定する手段であって、前記第1指標値と前記第1指標値を上回る追従性で前記音響信号の強度に追従する第2指標値とを分母に包含し、前記第1指標値を上回る追従性で前記音響信号の強度に追従する第3指標値を分子に包含する演算式を利用して前記調整値を算定する調整値算定手段と
を具備する音響処理装置。 - 前記第2指標値と前記第3指標値とは共通する
請求項1の音響処理装置。 - 加重係数を設定する係数設定手段を具備し、
前記調整値算定手段は、前記第1指標値と、前記係数設定手段が設定した加重係数を乗算した前記第2指標値との加算を分母に包含する前記演算式を利用して前記調整値を算定する
請求項1または請求項2の音響処理装置。 - 前記係数設定手段は、前記第1指標値を分母に包含し、前記第2指標値または前記第3指標値を分子に包含する演算式の演算結果に応じて前記加重係数を設定する
請求項3の音響処理装置。 - 前記調整値算定手段は、前記第1指標値と前記第2指標値とを分母に包含するとともに前記第3指標値を分子に包含する演算で基礎値を順次に算定し、前記基礎値が第1値を上回る数値に変動した場合に、以降の各基礎値を当該数値に応じて低減することで前記調整値を算定する
請求項1から請求項4の何れかの音響処理装置。 - 前記調整値算定手段は、前記第1指標値と前記第2指標値との加算を分母に包含するとともに前記第3指標値を分子に包含する演算で算定される第1基礎値と、前記第1指標値に対する前記第3指標値の相対比である第2基礎値との加重和を前記調整値として算定する
請求項1から請求項5の何れかの音響処理装置。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2014084657A JP2015004959A (ja) | 2013-05-22 | 2014-04-16 | 音響処理装置 |
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2013108176 | 2013-05-22 | ||
JP2013108176 | 2013-05-22 | ||
JP2014084657A JP2015004959A (ja) | 2013-05-22 | 2014-04-16 | 音響処理装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2015004959A true JP2015004959A (ja) | 2015-01-08 |
Family
ID=52300868
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2014084657A Pending JP2015004959A (ja) | 2013-05-22 | 2014-04-16 | 音響処理装置 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2015004959A (ja) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022527527A (ja) * | 2019-09-23 | 2022-06-02 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 音声データの処理方法並びにその、装置、電子機器及びコンピュータプログラム |
-
2014
- 2014-04-16 JP JP2014084657A patent/JP2015004959A/ja active Pending
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2022527527A (ja) * | 2019-09-23 | 2022-06-02 | ▲騰▼▲訊▼科技(深▲セン▼)有限公司 | 音声データの処理方法並びにその、装置、電子機器及びコンピュータプログラム |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
JP5641186B2 (ja) | 雑音抑圧装置およびプログラム | |
CA2827326C (en) | Apparatus and method for determining a measure for a perceived level of reverberation, audio processor and method for processing a signal | |
JP6019969B2 (ja) | 音響処理装置 | |
KR101149591B1 (ko) | 오디오 신호 반향 억제 | |
US10242692B2 (en) | Audio coherence enhancement by controlling time variant weighting factors for decorrelated signals | |
JP6064566B2 (ja) | 音響処理装置 | |
US9418677B2 (en) | Noise suppressing device, noise suppressing method, and a non-transitory computer-readable recording medium storing noise suppressing program | |
JP5915281B2 (ja) | 音響処理装置 | |
US9065409B2 (en) | Method and arrangement for processing of audio signals | |
JP2010220087A (ja) | 音響処理装置およびプログラム | |
JP5942388B2 (ja) | 雑音抑圧用係数設定装置、雑音抑圧装置および雑音抑圧用係数設定方法 | |
JP5609157B2 (ja) | 係数設定装置および雑音抑圧装置 | |
JP2015004959A (ja) | 音響処理装置 | |
JP6171558B2 (ja) | 音響処理装置 | |
JP2015169901A (ja) | 音響処理装置 | |
JP5316127B2 (ja) | 音処理装置およびプログラム | |
CN105453594B (zh) | 自动音色控制 | |
JP2013250356A (ja) | 係数設定装置および雑音抑圧装置 | |
US11308975B2 (en) | Mixing device, mixing method, and non-transitory computer-readable recording medium | |
JP6036141B2 (ja) | 音響処理装置 | |
JP6191238B2 (ja) | 音響処理装置および音響処理方法 | |
JP2014052585A (ja) | 音響処理装置 | |
JP2014230085A (ja) | 音響処理装置 | |
JP6531418B2 (ja) | 信号処理装置 | |
JP2014010279A (ja) | 雑音抑圧装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD04 | Notification of resignation of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7424 Effective date: 20150410 |