JP5463924B2 - 音響処理装置 - Google Patents

音響処理装置 Download PDF

Info

Publication number
JP5463924B2
JP5463924B2 JP2010006435A JP2010006435A JP5463924B2 JP 5463924 B2 JP5463924 B2 JP 5463924B2 JP 2010006435 A JP2010006435 A JP 2010006435A JP 2010006435 A JP2010006435 A JP 2010006435A JP 5463924 B2 JP5463924 B2 JP 5463924B2
Authority
JP
Japan
Prior art keywords
component
processing
localization
acoustic signal
coefficient sequence
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP2010006435A
Other languages
English (en)
Other versions
JP2011146949A (ja
Inventor
誠 山田
多伸 近藤
誠一 橋本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yamaha Corp
Original Assignee
Yamaha Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yamaha Corp filed Critical Yamaha Corp
Priority to JP2010006435A priority Critical patent/JP5463924B2/ja
Publication of JP2011146949A publication Critical patent/JP2011146949A/ja
Application granted granted Critical
Publication of JP5463924B2 publication Critical patent/JP5463924B2/ja
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Stereophonic System (AREA)

Description

本発明は、ステレオ形式の音響信号のうち目的の位置(方向)に音像が定位する成分(例えば、右チャネルおよび左チャネルの各々の信号に含まれる成分である。以下では「定位成分」という)を強調または抑圧する技術に関する。
CD等の記録媒体に収録された音響信号から所定の定位成分を抑圧する技術が従来から提案されている。例えば特許文献1には、ステレオ形式の音響信号の一方から他方を減算(逆相加算)することで、音像が中央方向に定位する成分(典型的には歌唱音)を抑圧する技術が開示されている。
特開2007−079413号公報
しかし、特許文献1の技術では、所定の成分の抑圧後の音響信号がモノラル形式になるという問題がある。同様の問題は、定位成分を強調する場合にも発生し得る。以上の事情を考慮して、本発明は、定位成分を強調または抑圧したステレオ形式の音響信号を生成することを目的とする。
以上の課題を解決するために、本発明の音響処理装置は、周波数毎の係数値で構成される処理係数列をステレオ形式の第1音響信号および第2音響信号から生成する複数の単位処理手段と、複数の単位処理手段の各々が生成した処理係数列の各係数値を第1音響信号および第2音響信号の各々の各周波数成分に作用させる信号処理手段と、単位処理手段毎に定位変数を設定する変数設定手段とを具備し、複数の単位処理手段の各々は、当該単位処理手段の定位変数に応じた比率で第1音響信号および第2音響信号の一方から他方を減算することで、当該定位変数に対応する位置の定位成分を抑圧した差成分を生成する差成分生成手段と、定位変数に対応する位置の定位成分を強調または抑圧するための処理係数列を、第1音響信号および第2音響信号の和成分と差成分生成手段が生成した差成分とから生成する係数列生成手段とを含む。以上の構成においては、第1音響信号と第2音響信号との和成分および差成分から生成された処理係数列を第1音響信号および第2音響信号の各々の各周波数成分に作用させるから、定位成分が強調または抑圧されたステレオ形式の音響信号を生成することが可能である。また、複数の単位処理手段が定位変数に応じて生成した処理係数列が第1音響信号および第2音響信号に作用するから、音像の位置が相違する複数の定位成分を強調または抑圧できるという利点もある。
本発明の好適な態様において、係数列生成手段は、和成分および差成分の一方のスペクトルから他方のスペクトルを減算した結果に応じて処理係数列を生成する。以上の態様においては、和成分および差成分の一方のスペクトルから他方のスペクトルを減算することで定位成分を高精度に強調または抑圧したスペクトルが生成されるから、定位成分を有効に強調または抑圧し得る処理係数列を生成できるという利点がある。
本発明の好適な態様において、複数の単位処理手段の各々における係数列生成手段は、定位成分の強調および抑圧の一方に対応する第1処理係数列を和成分および差成分から生成する第1生成手段と、定位成分の強調および抑圧の他方に対応する第2処理係数列を、第1処理係数列の各係数値を所定値から減算することで生成する第2生成手段とを含む。以上の態様においては、各定位成分の強調用および抑圧用の処理係数列を生成することが可能である。また、和成分および差成分を利用して生成された第1処理係数列の各係数値を所定値から減算することで第2処理係数列が生成されるから、第1処理係数列および第2処理係数列の双方を和成分および差成分から直接的に生成する場合と比較して、係数列生成手段による処理の負荷が軽減されるという利点がある。
本発明の好適な態様に係る音響処理装置は、定位成分毎に加重値を可変に設定する加重値設定手段を具備し、信号処理手段は、各単位処理手段が生成した処理係数列を、当該単位処理手段に対応する加重値のもとで第1音響信号および第2音響信号の各々に作用させる。以上の態様においては、定位成分毎に加重値を可変に設定することで、各定位成分の強調/抑圧の程度を定位成分毎に制御することが可能である。
以上の各態様に係る音響処理装置は、音響信号の処理に専用されるDSP(Digital Signal Processor)などのハードウェア(電子回路)によって実現されるほか、CPU(Central Processing Unit)などの汎用の演算処理装置とプログラム(ソフトウェア)との協働によっても実現される。本発明のプログラムは、周波数毎の係数値で構成される処理係数列をステレオ形式の第1音響信号および第2音響信号から生成する複数の単位処理と、複数の単位処理の各々が生成した処理係数列の各係数値を第1音響信号および第2音響信号の各々の各周波数成分に作用させる信号処理と、単位処理毎に定位変数を設定する変数設定処理とをコンピュータに実行させるプログラムであって、複数の単位処理の各々は、当該単位処理の定位変数に応じた比率で第1音響信号および第2音響信号の一方から他方を減算することで、当該定位変数に対応する位置の定位成分を抑圧した差成分を生成する差成分生成処理と、定位変数に対応する位置の定位成分を強調または抑圧するための処理係数列を、第1音響信号および第2音響信号の和成分と差成分生成処理が生成した差成分とから生成する係数列生成処理とを含む。以上のプログラムによれば、本発明の音響処理装置と同様の作用および効果が実現される。本発明のプログラムは、コンピュータが読取可能な記録媒体に格納された形態で利用者に提供されてコンピュータにインストールされるほか、通信網を介した配信の形態でサーバ装置から提供されてコンピュータにインストールされる。
第1実施形態に係る音響処理装置のブロック図である。 係数設定部のブロック図である。 単位処理部のブロック図である。 第2実施形態に係る音響処理装置のブロック図である。 加重値の設定画面の模式図である。 変形例に係る係数設定部のブロック図である。
<A:第1実施形態>
図1は、本発明の第1実施形態に係る音響処理装置100のブロック図である。音響処理装置100には信号供給装置12と放音装置14と入力装置16とが接続される。信号供給装置12は、音響(音声や楽音)の波形を表す時間領域の音響信号SIN(SIN_L,SIN_R)を音響処理装置100に供給する。左チャネルの音響信号SIN_Lおよび右チャネルの音響信号SIN_Rは、音響を発生する複数の音源の音像が相異なる位置に定位する(すなわち、音響の振幅や位相が各音源の位置に応じて相違する)ように収音または加工されたステレオ形式の信号である。周囲の音響を収音して音響信号SINを生成する収音機器(ステレオマイク)や、可搬型または内蔵型の記録媒体から音響信号SINを取得して音響処理装置100に出力する再生装置や、通信網から音響信号SINを受信して音響処理装置100に出力する通信装置が信号供給装置12として採用され得る。
音響処理装置100は、信号供給装置12が供給する音響信号SINから音響信号SOUT(SOUT_L,SOUT_R)を生成する。左チャネルの音響信号SOUT_Lおよび右チャネルの音響信号SOUT_Rは、音響信号SINが表す音響のうち目的の位置に音像が定位する定位成分を強調または抑圧したステレオ形式の信号である。放音装置14(例えばステレオスピーカやステレオヘッドホン)は、音響処理装置100が生成した音響信号SOUT(SOUT_L,SOUT_R)に応じた音波を放射する。
入力装置16は、音響処理装置100に対する指示を利用者が入力するための機器(例えばマウスやキーボード)である。利用者は、入力装置16を適宜に操作することで、定位成分の位置(方向)と定位成分の強調/抑圧の何れかの処理とを音響処理装置100に対して任意に指示することが可能である。
図1に示すように、音響処理装置100は、演算処理装置22と記憶装置24とを具備するコンピュータシステムで実現される。記憶装置24は、演算処理装置22が実行するプログラムPGや演算処理装置22が使用するデータを記憶する。半導体記録媒体や磁気記録媒体などの公知の記録媒体や複数種の記録媒体の組合せが記憶装置24として任意に採用される。音響信号SIN(SIN_L,SIN_R)を記憶装置24に記憶した構成(したがって信号供給装置12は省略され得る)も好適である。
演算処理装置22は、記憶装置24に格納されたプログラムPGを実行することで、音響信号SINから音響信号SOUTを生成するための複数の機能(変数設定部32,周波数分析部34,係数設定部36,信号処理部38,波形合成部40)を実現する。なお、演算処理装置22の各機能を複数の集積回路に分散した構成や、専用の電子回路(DSP)が各機能を実現する構成も採用され得る。
変数設定部32は、相異なる定位成分に対応するN個(Nは2以上の自然数)の定位変数α1〜αNを可変に設定する。定位変数αn(n=1〜N)は、音響処理装置100による強調/抑圧の対象となるN種類の定位成分のうち第n番目の定位成分の音像の位置(方向)を指定する変数である。本形態の変数設定部32は、入力装置16に対する利用者からの指示に応じて定位変数αn(0≦αn≦1)を可変に設定する。例えば、定位変数αnが0.5(中央値)である場合には中央(正面)方向が指示される。また、定位変数αnが1に近いほど右寄りの方向が指示され、定位変数αnが0に近いほど左寄りの方向が指示される。利用者は、放音装置14からの再生音を聴取しながら随時に入力装置16の操作で定位変数αnを変更することが可能である。
周波数分析部34は、音響信号SIN_Lの周波数スペクトル(複素スペクトル)LAと音響信号SIN_Rの周波数スペクトル(複素スペクトル)RAとを時間軸上の単位区間(フレーム)毎に順次に生成する。周波数スペクトルLAは、K個の周波数(周波数帯域)f1〜fKの各々に対応する周波数成分LAk(e)の系列(LA1(e)〜LAK(e))である(k=1〜K)。記号jは虚数単位を意味する。同様に、周波数スペクトルRAは、周波数f1〜fKの各々に対応する周波数成分RAk(e)の系列(RA1(e)〜RAK(e))である。周波数スペクトルLAおよび周波数スペクトルRAの生成には、短時間フーリエ変換などの公知の周波数分析が任意に採用され得る。なお、通過帯域が相異なるK個の帯域通過フィルタで構成されるフィルタバンクも周波数分析部34として採用され得る。
図1の係数設定部36は、N個の処理係数列Ge_1〜Ge_NとN個の処理係数列Gs_1〜Gs_Nとを並列に生成する。処理係数列Ge_nは、音響信号SIN(SIN_L,SIN_R)のうち定位変数αnに応じた位置の定位成分を強調(enhance)するための数値列である。他方、処理係数列Gs_nは、音響信号SIN(SIN_L,SIN_R)のうち定位変数αnに応じた位置の定位成分を抑圧(suppress)するための数値列である。処理係数列Ge_nは、周波数f1〜fKの各々に対応する係数値Ge[k]_nの系列(Ge[1]_n〜Ge[K]_n)であり、処理係数列Gs_nは、周波数f1〜fKの各々に対応する係数値Gs[k]_nの系列(Gs[1]_n〜Gs[K]_n)である。
図2は、係数設定部36のブロック図である。図2に示すように、係数設定部36は、相異なる定位成分(定位変数αn)に対応するN個の単位処理部U[1]〜U[N]を含んで構成される。単位処理部U[1]〜U[N]には周波数スペクトルLAおよび周波数スペクトルRAが共通に供給され、各単位処理部U[n]には変数設定部32から定位変数αnが指示される。単位処理部U[n]は、周波数スペクトルLAと周波数スペクトルRAと定位変数αnとを利用して単位区間毎に順次に処理係数列Ge_n(係数値Ge[1]_n〜Ge[K]_n)および処理係数列Gs_n(Gs[1]_n〜Gs[K]_n)を生成する。
係数値Ge[k]_nおよび係数値Gs[k]_nは、音響信号SIN_Lの周波数成分LAk(e)や音響信号SIN_Rの周波数成分RAk(e)に対するゲイン(スペクトルゲイン)に相当し、音響信号SIN(SIN_L,SIN_R)の特性に応じて0以上かつ1以下の範囲内で可変に設定される(0≦Ge[k]_n≦1,0≦Gs[k]_n≦1)。具体的には、定位成分の強調用の処理係数列Ge_nの係数値Ge[1]_n〜Ge[K]_nは、第n番目の定位成分のパワー(振幅)が大きい周波数fkの係数値Ge[k]_nほど1に近い数値に設定される。他方、定位成分の抑圧用の処理係数列Gs_nの係数値Gs[1]_n〜Gs[K]_nは、第n番目の定位成分のパワーが大きい周波数fkの係数値Gs[k]_nほど0に近い数値に設定される。
図1の信号処理部38は、係数設定部36が生成した処理係数列Ge_1〜Ge_Nまたは処理係数列Gs_1〜Gs_Nを周波数スペクトルLAおよび周波数スペクトルRAの各々に個別に作用させる(典型的には乗算する)ことで周波数スペクトルLBと周波数スペクトルRBとを単位区間毎に順次に生成する。周波数スペクトルLBは、周波数f1〜fKの各々に対応する周波数成分LBk(e)の系列(LB1(e)〜LBK(e))であり、周波数スペクトルRBは、周波数f1〜fKの各々に対応する周波数成分RBk(e)の系列(RB1(e)〜RBK(e))である。各単位区間の周波数スペクトルLAおよび周波数スペクトルRAには、その単位区間について係数設定部36が生成した処理係数列Ge_1〜Ge_Nまたは処理係数列Gs1〜Gs_Nが乗算される。
入力装置16に対して利用者から定位成分の強調が指示された場合、信号処理部38は、以下の数式(1a)および数式(1b)に示すように、周波数スペクトルLAおよび周波数スペクトルRAに対する処理係数列Ge_1〜Ge_Nの乗算で周波数スペクトルLBおよび周波数スペクトルRBを生成する。すなわち、数式(1a)に示すように、周波数スペクトルLBの各周波数fkの周波数成分LBk(e)は、その周波数fkの周波数成分LAk(e)と、N個の処理係数列Ge_1〜Ge_Nの各々における周波数fkの係数値Ge[k]_n(Ge[k]_1〜Ge[k]_N)との乗算値に設定される。同様に、周波数スペクトルRBの各周波数fkの周波数成分RBk(e)は、その周波数fkの周波数成分RAk(e)とN個の係数値Ge[k]_1〜Ge[k]_Nとの乗算値に設定される(数式(1b))。したがって、音響信号SIN(SIN_L,SIN_R)のうち音像の位置が相異なるN種類の定位成分を強調した周波数スペクトルLBおよび周波数スペクトルRBが生成される。
Figure 0005463924
他方、入力装置16に対して利用者から定位成分の抑圧が指示された場合、信号処理部38は、以下の数式(2a)および数式(2b)に示すように、周波数スペクトルLBおよび周波数スペクトルRBの生成に定位成分の抑圧用の処理係数列Gs_1〜Gs_Nを適用する。すなわち、周波数スペクトルLAの各周波数成分LAk(e)と周波数fkのN個の係数値Gs[k]_1〜Gs[k]_Nとの乗算で周波数スペクトルLBの各周波数成分LBk(e)を算定し(数式(2a))、周波数スペクトルRAの各周波数成分RAk(e)と周波数fkのN個の係数値Gs[k]_1〜Gs[k]_Nとの乗算で周波数スペクトルRBの各周波数成分RBk(e)を算定する(数式(2b))。したがって、音響信号SIN(SIN_L,SIN_R)のうち音像の位置が相異なるN種類の定位成分を抑圧した周波数スペクトルLBおよび周波数スペクトルRBが生成される。
Figure 0005463924
図1の波形合成部40は、信号処理部38による処理後の周波数スペクトルLBおよび周波数スペクトルRBからステレオ形式の音響信号SOUT_Lおよび音響信号SOUT_Rを生成する。具体的には、波形合成部40は、単位区間毎の周波数スペクトルLBを逆フーリエ変換で時間領域の信号に変換するとともに前後の単位区間について相互に連結することで音響信号SOUT_Lを生成する。同様に、波形合成部40は、各周波数スペクトルRBから音響信号SOUT_Rを生成する。波形合成部40が生成した音響信号SOUT(SOUT_L,SOUT_R)が放音装置14に供給されて音波として再生される。
次に、単位処理部U[1]〜U[N]の詳細を説明する。図3には、1個の単位処理部U[n]が代表的に図示されている。図3に示すように、単位処理部U[n]は、和成分生成部52と差成分生成部54と係数列生成部60とを含んで構成される。和成分生成部52は、音響信号SIN_Lの周波数成分LA1(e)〜LAK(e)と音響信号SIN_Rの周波数成分RA1(e)〜RAK(e)との加算で単位区間毎に順次に和成分(複素スペクトル)Mを生成する。和成分Mは、周波数f1〜fKの各々に対応する周波数成分Mk(e)の系列(M1(e)〜MK(e))である。数式(3)に示すように、和成分Mの周波数fkの周波数成分Mk(e)は、その周波数fkの周波数成分LAk(e)と周波数成分RAk(e)との加算値(複素数)である。したがって、和成分Mは、全部の音源からの音響を混合したモノラル形式の信号に相当する。数式(3)から理解されるように、単位処理部U[1]〜U[N]の各々で生成される和成分Mは共通する(すなわち、定位変数αnに依存しない)。なお、周波数成分LAk(e)と周波数成分RAk(e)との加重和や平均を和成分Mとして算定する構成も採用され得る。
Figure 0005463924
図3の差成分生成部54は、音響信号SIN_Lの周波数成分LA1(e)〜LAK(e)と音響信号SIN_Rの周波数成分RA1(e)〜RAK(e)との間の減算で単位区間毎に順次に差成分(複素スペクトル)Snを生成する。差成分Snは、周波数f1〜fKの各々に対応する周波数成分Sk(e)_nの系列(S1(e)_n〜SK(e)_n)である。単位処理部U[n]の差成分生成部54は、変数設定部32から指示される定位変数αnを利用した数式(4)の演算(加重減算)で周波数成分S1(e)_n〜SK(e)_nを算定する。
Figure 0005463924
数式(4)から理解されるように、定位変数αnに応じた可変の比率(重み値)にて周波数成分LAk(e)から周波数成分RAk(e)を減算(逆相加算)することで差成分Snの各周波数成分Sk(e)_nが生成される。したがって、差成分Snは、音響信号SIN(SIN_L,SIN_R)のうち定位変数αnに応じた位置(方向)の定位成分を他の成分に対して相対的に抑圧した信号(すなわち、第n番目の定位成分以外の成分を相対的に強調した信号)となる。例えば、定位変数αnが0.5(中央値)である場合には、中央方向の定位成分(すなわち、振幅および位相が略同等の成分)を抑圧した差成分Snが生成される。また、定位変数αnが0.5を上回るほど、中央方向に対して右寄りの定位成分が差成分Snでは抑圧され、定位変数αnが0.5を下回るほど、中央方向に対して左寄りの定位成分が差成分Snでは抑圧される。
数式(4)の記号max(αn,1−αn)は、定位変数αnまたは変数(1−αn)のうちの最大値を意味する。定位変数αnは1以下の数値に設定されるから、数式(4)の分子の演算のみでは周波数成分Sk(e)_nのパワー(振幅)が不足する可能性がある。数式(4)のように最大値max(αn,1−αn)で除算するのは、周波数成分Sk(e)_nのパワーを周波数成分LAk(e)や周波数成分RAk(e)と同等に維持するためである。
図3の係数列生成部60は、和成分生成部52が生成した和成分Mと差成分生成部54が生成した差成分Snとを利用して第n番目の定位成分の強調用の処理係数列Ge_n(Ge[1]_n〜Ge[K]_n)と抑圧用の処理係数列Gs_n(Gs[1]_n〜Gs[K]_n)とを生成する。図3に示すように、係数列生成部60は、処理係数列Ge_nを生成する第1生成部62と、処理係数列Gs_nを生成する第2生成部64とを含んで構成される。
第1生成部62は、以下の数式(5)の演算で処理係数列Ge_nの各係数値Ge[k]_nを算定する。
Figure 0005463924
数式(5)の記号Pn[k]は、第n番目の定位成分を強調したパワースペクトルPnのうち周波数fkでのパワーを意味する。パワーPn[k]は、例えば以下の数式(6a)および数式(6b)で算定される。
Figure 0005463924
数式(6a)から理解されるように、周波数成分Mk(e)のパワー|Mk(e)|が周波数成分Sk(e)_nのパワー|Sk(e)_n|を上回る周波数fkでのパワーPn[k]は、和成分Mのパワー|Mk(e)|から差成分Snのパワー|Sk(e)_n|を減算した数値に設定される。すなわち、パワースペクトルPnは、和成分Mのパワースペクトルと差成分Snのパワースペクトルとの間の減算(スペクトル減算)で生成される。他方、パワー|Mk(e)|がパワー|Sk(e)_n|以下となる周波数fkでのパワーPn[k]は、和成分Mのパワー|Mk(e)|と所定の係数(フロアリング係数)βとの乗算値に設定される。以上の説明から理解されるように、数式(6a)および数式(6b)の演算は、和成分Mを信号成分(目的音)と仮定するとともに差成分Snを雑音成分と仮定した場合に雑音成分を抑圧するためのスペクトル減算(SS:Spectral Subtraction)に相当する。
周波数成分Sk(e)_nは第n番目の定位成分を抑圧した成分であるから、数式(6a)および数式(6b)で算定されるパワーPn[1]〜Pn[K]の系列は、音響信号SIN(SIN_L,SIN_R)の第n番目の定位成分を強調した成分のパワースペクトルPnとなる。したがって、数式(5)の分母は、第n番目の定位成分を強調した成分の振幅に相当する。なお、数式(5)にて振幅(Pn[k])1/2を周波数成分Mk(e)の振幅|Mk(e)|で除算するのは、係数値Ge[k]_nを1以下の数値(0≦Ge[k]_n≦1)に正規化するためである。
以上の説明から理解されるように、第1生成部62が生成する処理係数列Ge_nの係数値Ge[1]_n〜Ge[K]_nは、定位変数αnに応じた位置の定位成分のパワー(振幅)が大きい周波数fkの係数値Ge[k]_nほど1に近い数値となり、定位成分のパワーが小さい周波数fkの係数値Ge[k]_nほど0に近い数値となる。したがって、周波数スペクトルLAおよび周波数スペクトルRAの各々に信号処理部38が処理係数列Ge_1〜Ge_Nを乗算することで、前述の通り、音像の位置が相異なるN種類の定位成分を強調したステレオ形式の音響信号SOUT(SOUT_L,SOUT_R)が生成される。
単位処理部U[n]の第2生成部64は、第1生成部62が生成した処理係数列Ge_nを利用して定位成分の抑圧用の処理係数列Gs_n(係数値Gs[1]_n〜Gs[K]_n)を生成する。具体的には、第2生成部64は、数式(7)に示すように、処理係数列Ge_nの各係数値Ge[k]_nを所定値(本形態では1)から減算することで処理係数列Gs_nの各係数値Gs[k]_nを算定する。
Figure 0005463924
数式(7)から理解されるように、第2生成部64が生成する処理係数列Gs_nの係数値Gs[1]_n〜Gs[K]_nは、定位変数αnに応じた位置の定位成分のパワー(振幅)が大きい周波数fkの係数値Gs[k]_nほど0に近い数値となり、定位成分のパワーが小さい周波数fkの係数値Gs[k]_nほど1に近い数値となる。したがって、周波数スペクトルLAおよび周波数スペクトルRAの各々に信号処理部38が処理係数列Gs_1〜Gs_Nを乗算することで、前述の通り、音像の位置が相異なるN種類の定位成分を抑圧したステレオ形式の音響信号SOUT(SOUT_L,SOUT_R)が生成される。
以上に説明したように、第1実施形態では、音響信号SIN_L(周波数スペクトルLA)および音響信号SIN_R(周波数スペクトルRA)の各々に対して個別に処理係数列Ge_nまたはGs_nが乗算されるから、定位成分を強調または抑圧した音響信号SOUT(SOUT_L,SOUT_R)をステレオ形式のまま生成することが可能である。また、相異なる定位成分に対応するN個の処理係数列Ge_1〜Ge_Nまたは処理係数列Gs_1〜Gs_Nが利用されるから、音像の位置が相異なるN種類の定位成分を強調または抑圧できるという利点もある。
ところで、特許第3670562号公報には、ステレオ信号のチャネル間の振幅比に応じた減衰係数gi(k)と位相差に応じた減衰係数gp(k)との何れかを選択して各チャネルの音響信号に乗算する構成が開示されている。しかし、以上の技術では、振幅比に応じた減衰係数gi(k)と位相差に応じた減衰係数gp(k)とが択一的に適用されるから、振幅および位相の双方がチャネル間で相違する場合には、定位成分の適切な強調または抑圧が困難であるという問題がある。他方、第1実施形態においては、音響信号SIN_L(周波数スペクトルLA)および音響信号SIN_R(周波数スペクトルRA)から複素スペクトルとして算定された和成分Mおよび差成分Snが処理係数列Ge_nおよび処理係数列Gs_nの生成に利用されるから、音響信号SIN_Lと音響信号SIN_Rとの間の振幅差および位相差の双方を反映した処理係数列Ge_nおよび処理係数列Gs_nが生成される。したがって、音響信号SIN_Lと音響信号SIN_Rとの間で振幅および位相の一方のみが相違する場合に加えて、振幅および位相の双方が相違する場合にも、定位成分を有効に強調または抑圧できるという格別の効果が実現される。
<B:第2実施形態>
本発明の第2実施形態を説明する。なお、以下の各例示において作用や機能が第1実施形態と同等である要素については、第1実施形態と同様の符号を付して各々の詳細な説明を適宜に省略する。
図4は、第2実施形態の音響処理装置のブロック図である。図4に示すように、第2実施形態の音響処理装置100は、加重値設定部42を第1実施形態に追加した構成である。加重値設定部42は、N種類の定位成分(定位変数α1〜αN)の各々について加重値γn(γ1〜γN)を可変に設定する。本形態の加重値設定部42は、入力装置16に対する利用者からの指示に応じて加重値γn(0≦γn≦1)を可変に設定する。利用者は、放音装置14からの再生音を聴取しながら随時に入力装置16の操作で加重値γnを変更することが可能である。
利用者による加重値γ1〜γNの指定には、例えば、表示装置(図示略)に表示される図5の設定画面が利用される。設定画面は、各定位変数αnに対応するN種類の定位成分(横軸)の各々と加重値γn(縦軸)との関係を示すグラフを含んで構成される。加重値設定部42は、入力装置16に対する操作(例えば設定画面のグラフの各点を移動させる操作)のたびに、各定位成分の加重値γnの変更とグラフの更新とを実行する。設定画面のグラフの横軸は、強調/抑圧の対象となる定位成分の位置(方向)に相当するから、利用者は、各位置の定位成分の強調/抑圧の程度(加重値γn)を直感的に把握しながら各加重値γnを設定できるという利点がある。
図4の信号処理部38は、各単位処理部U[n]が生成した処理係数列Ge_nまたは処理係数列Gs_nを、加重値設定部42が設定した加重値γnのもとで音響信号SIN_Lおよび音響信号SIN_Rの各々に作用させる。
例えば、入力装置16に対して利用者から各定位成分の強調が指示された場合、信号処理部38は、以下の数式(1c)および数式(1d)に示すように、各処理係数列Ge_n(係数値Ge[k]_n)のγn乗を周波数スペクトルLAおよび周波数スペクトルRAの各々に乗算することで周波数スペクトルLBおよび周波数スペクトルRBを生成する。
Figure 0005463924
入力装置16に対して利用者から各定位成分の抑圧が指示された場合も同様であり、信号処理部38は、以下の数式(2c)および数式(2d)に示すように、各処理係数列Gs_n(係数値Gs[k]_n)のγn乗の乗算で周波数スペクトルLBおよび周波数スペクトルRBを生成する。
Figure 0005463924
以上の説明から理解されるように、第2実施形態によれば、第n番目の定位成分の強調または抑圧の程度を加重値γnに応じて可変に制御することが可能である。なお、加重値γ1〜γNが0に設定された場合には周波数スペクトルLAおよび周波数スペクトルRAがそのまま周波数スペクトルLBおよび周波数スペクトルRBとして出力される。
<C:変形例>
以上の各形態は多様に変形され得る。具体的な変形の態様を以下に例示する。以下の例示から任意に選択された2以上の態様は適宜に併合され得る。
(1)変形例1
以上の各形態では、数式(4)から理解されるように、音響信号SIN_L(周波数成分LAk(e))と音響信号SIN_R(周波数成分RAk(e))との振幅の比率が定位変数αnに応じて線形に変化するように差成分Snを算定したが、以下の各態様にて例示するように、和成分Mおよび差成分Snの算定の方法や定位変数αnとの関係は適宜に変更される。
<第1態様>
音響信号SIN_Lのパワー|LAk(e)|および音響信号SIN_Rのパワー|RAk(e)|から和成分Mおよび差成分Snを算定する構成が採用され得る。具体的には、和成分生成部52は、以下の数式(8a)の演算で和成分M(周波数成分M1(e)〜MK(e)で構成される複素スペクトル)を生成し、差成分生成部54は、以下の数式(8b)の演算で差成分Sn(周波数成分S1(e)_n〜SK(e)_nで構成される複素スペクトル)を生成する。数式(8a)および数式(8b)における記号ejLは音響信号SIN_Lの位相スペクトルを意味し、記号ejRは音響信号SIN_Rの位相スペクトルを意味する。数式(8b)から理解されるように、差成分Snにおいては、音響信号SIN_Lおよび音響信号SIN_Rの各々のパワーの比率が定位変数αnに応じて線形に変化する。
Figure 0005463924
以上の方法で和成分Mおよび差成分Sが生成されると、係数列生成部60の第1生成部62は、定位成分を強調したパワースペクトルPn(パワーPn[k])を以下の数式(9a)および数式(9b)の演算で生成し、パワースペクトルPnを利用した数式(10)の演算で処理係数列Ge_nの各係数値Ge[k]_nを算定する。第2生成部64が処理係数列Ge_nから処理係数列Gs_nを生成する方法は第1実施形態(数式(7))と同様である。以上の構成でも第1実施形態と同様の効果が実現される。
Figure 0005463924
<第2態様>
定位成分の位置(方向)を定位変数αnの関数f(αn)に応じて制御する構成が採用され得る。具体的には、和成分生成部52は、以下の数式(11a)の演算で和成分M(周波数成分M1(e)〜MK(e))を生成し、差成分生成部54は、以下の数式(11b)の演算で差成分Sn(周波数成分S1(e)_n〜SK(e)_n)を生成する。したがって、差成分Snにおける音響信号SIN_Lおよび音響信号SIN_Rの各々の振幅の比率が定位変数αnの関数f(αn)に応じて変化する。係数列生成部60は、第1実施形態と同様の方法(数式(5),数式(6a),数式(6b),数式(7))で、数式(11a)の和成分Mと数式(11b)の差成分Snとから処理係数列Ge_nおよび処理係数列Gs_nを算定する。
Figure 0005463924
なお、数式(6a)では和成分Mのパワー|Mk(e)|と差成分Snのパワー|Sk(e)_n|との差分をパワーPn[k]として算定したが、以下の数式(6c)に示すように、和成分Mの振幅|Mk(e)|と差成分Snの振幅|Sk(e)_n|との差分を振幅Pn[k]として算定する構成も採用され得る。数式(6c)で振幅Pn[k]を算定する構成では、第1生成部62が数式(5a)の演算で処理係数列Ge_nの係数値Ge[k]_nを算定する。
Figure 0005463924
(2)変形例2
以上の各形態では、パワースペクトルの減算(数式(6a),数式(9a))や振幅スペクトルの減算(数式(6c))で処理係数列Ge_nを算定したが、処理係数列Ge_nを算定する方法は任意である。例えば、和成分Mに含まれる定位成分を信号成分と仮定するとともに差成分Snを雑音成分と仮定すると、和成分Mおよび差成分Snを利用した処理係数列Ge_nの生成には、雑音成分(差成分S)を抑圧して信号成分(定位成分)を強調するための数値列(処理係数列Ge_n)を生成する公知の音声強調の技術を同様に適用することが可能である。
処理係数列Ge_nの生成に適用され得る技術としては、ウィナーフィルタ(Wiener filter)を利用した音声強調や、MMSE-STSA法またはMAP(maximum a posteriori estimation)推定法を利用した音声強調の技術が例示され得る。MMSE-STSA法については、Y. Ephraim and D. Malah, "Speech enhancement using a minimum mean-square error short-time spectral amplitude estimator", IEEE ASSP, vol.ASSP-32, no.6, p.1109-1121, Dec. 1984に開示され、MAP推定法については、T. Lotter and P. Vary, "Speech enhancement by MAP spectral amplitude estimation using a Super-Gaussian speech model", EURASIP Journal on Applied Signal Processing, vol.2005, no,7, p.1110-1126, July 2005に開示されている。
(3)変形例3
以上の各形態では、処理係数列Ge_nを利用した演算(数式(7))で処理係数列Gs_nを生成したが、係数列生成部60が処理係数列Ge_nの生成と同様の方法で和成分Mおよび差成分Snから直接的に処理係数列Gs_nを生成する構成も採用され得る。具体的には、処理係数列Ge_nの生成について以上の例示した各数式における和成分Mと差成分Snとを相互に置換すれば、定位成分の抑圧用の処理係数列Gs_nを生成することが可能である。
ただし、処理係数列Ge_nを利用して処理係数列Gs_nを算定する第1実施形態の構成によれば、和成分Mや差成分Snから直接的に処理係数列Gs_nを算定する処理が不要である。したがって、係数列生成部60による処理の負荷が軽減されるという利点がある。なお、和成分Mおよび差成分Snから直接的に処理係数列Gs_nを生成し、処理係数列Gs_nの各係数値Gs[k]_nを数式(7)と同様に所定値(例えば1)から減算することで処理係数列Ge_n(係数値Ge[k]_n)を生成する構成も採用され得る。
(4)変形例4
以上の各形態では、処理係数列G_n(Ge_n,Gs_n)を単位区間毎に生成したが、処理係数列G_nの生成の周期は任意である。例えば、所定個の単位区間の集合を周期として係数列生成部60が順次に生成した処理係数列G_nを、信号処理部38が当該周期内の複数の単位区間について適用する構成も採用され得る。また、以上の各形態では、各単位区間について生成された処理係数列G_nをその単位区間の周波数スペクトル(LA,RA)の処理に適用したが、各単位区間の処理係数列G_nをその単位区間の経過後の各単位区間の周波数スペクトル(LA,RA)の処理に適用する構成も採用され得る。
(5)変形例5
以上の各形態では、処理係数列G_n(Ge_n,Gs_n)を音響信号SINの周波数スペクトル(LA,RA)に乗算したが、信号処理部38による処理の内容は適宜に変更される。例えば周波数成分LAk(e)および周波数成分RAk(e)から処理係数列G_n(Ge_n,Gs_n)を減算することで音響信号SOUT(SOUT_L,SOUT_R)を生成する構成が採用され得る。以上の構成における強調用の処理係数列Ge_nは、第1実施形態の処理係数列Ge_nとは逆に、定位成分のパワーが大きい周波数fkの係数値Ge[k]_nほど0に近い数値に設定される。抑圧用の処理係数列Gs_nについても同様であり、第1実施形態の処理係数列Gs_nとは逆に、定位成分のパワーが大きい周波数fkの係数値Gs[k]_nほど1に近い数値に設定される。
(6)変形例6
所定の周波数帯域内の成分に限定して定位成分の強調/抑圧を実行する構成も好適である。例えば、音響信号SINのうち人間の音声のパワーが集中する周波数帯域(例えば100kHz〜8kHz)についてのみ以上の各形態の処理が実行される(他の帯域については処理せずに再生する)。
(7)変形例7
以上の各形態においては定位成分の強調用の処理係数列Ge_1〜Ge_Nおよび抑圧用の処理係数列Gs_1〜Gs_Nの双方を係数設定部36が生成したが、各単位処理部U[n]が処理係数列Ge_nおよび処理係数列Gs_nの一方のみを生成する構成も採用され得る。したがって、例えば、以上の各形態の第2生成部64は省略され得る。
(8)変形例8
以上の各形態における係数β(数式(6b),数式(9b))を、例えば入力装置16に対する利用者からの指示に応じて可変に設定する構成も好適である。係数βが小さい(0に近い)ほど定位成分の抑圧の度合が強化されるとともに定位成分の強調の度合が低下する。なお、係数βが大きい場合には、抑圧用の処理係数列Gs_nのうち定位成分以外の大部分の周波数fkの係数値Gs[k]_nが充分に小さい数値となるから、音響信号SOUT(SOUT_L,SOUT_R)の音量が不足する可能性がある。そこで、係数βを大きい数値に設定して定位成分の抑圧を実行する場合、音響信号SOUTの音量を増加させる構成が好適である。同様に、係数βが小さい場合には、強調用の処理係数列Ge_nの大部分の周波数fkの係数値Ge[k]_nが充分に小さい数値となり得るから、係数βを小さい数値に設定して定位成分の強調を実行する場合、音響信号SOUTの音量を増加させる構成が好適に採用される。
(9)変形例9
以上の各形態では、単位処理部U[n]毎に和成分生成部52を配置したが、各単位処理部U[n]から和成分生成部52を省略し、図6に示すように、ひとつの和成分生成部52が生成した和成分MをN個の単位処理部U[1]〜U[N]の各々の係数列生成部60が処理する構成(すなわち、N個の単位処理部U[1]〜U[N]が1個の和成分生成部52を共用する構成)も採用され得る。図6の構成によれば、第1実施形態の構成と比較して係数設定部36の構成が簡素化されるという利点がある。
100……音響処理装置、12……信号供給装置、14……放音装置、16……入力装置、22……演算処理装置、24……記憶装置、32……変数設定部、34……周波数分析部、36……係数設定部、U[1]〜U[N]……単位処理部、38……信号処理部、40……波形合成部、42……加重値設定部、52……和成分生成部、54……差成分生成部、60……係数列生成部、62……第1生成部、64……第2生成部。

Claims (4)

  1. 周波数毎の係数値で構成される処理係数列をステレオ形式の第1音響信号および第2音響信号から生成する複数の単位処理手段と、
    前記複数の単位処理手段の各々が生成した処理係数列の各係数値を前記第1音響信号および前記第2音響信号の各々の各周波数成分に作用させる信号処理手段と、
    前記単位処理手段毎に定位変数を設定する変数設定手段とを具備し、
    前記複数の単位処理手段の各々は、
    当該単位処理手段の前記定位変数に応じた比率で前記第1音響信号および前記第2音響信号の一方から他方を減算することで、当該定位変数に対応する位置の定位成分を抑圧した差成分を生成する差成分生成手段と、
    前記定位変数に対応する位置の定位成分を強調または抑圧するための前記処理係数列を、前記第1音響信号および前記第2音響信号の和成分と前記差成分生成手段が生成した前記差成分とから生成する係数列生成手段とを含む
    音響処理装置。
  2. 前記複数の単位処理手段の各々における前記係数列生成手段は、
    前記和成分および前記差成分の一方のスペクトルから他方のスペクトルを減算した結果に応じて前記処理係数列を生成する
    請求項1の音響処理装置。
  3. 前記複数の単位処理手段の各々における前記係数列生成手段は、
    前記定位成分の強調および抑圧の一方に対応する第1処理係数列を前記和成分および前記差成分から生成する第1生成手段と、
    前記定位成分の強調および抑圧の他方に対応する第2処理係数列を、前記第1処理係数列の各係数値を所定値から減算することで生成する第2生成手段とを含む
    請求項1または請求項2の音響処理装置。
  4. 前記定位成分毎に加重値を可変に設定する加重値設定手段を具備し、
    前記信号処理手段は、前記各単位処理手段が生成した処理係数列を、当該単位処理手段に対応する加重値のもとで前記第1音響信号および前記第2音響信号の各々に作用させる
    請求項1から請求項3の何れかの音響処理装置。
JP2010006435A 2010-01-15 2010-01-15 音響処理装置 Expired - Fee Related JP5463924B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2010006435A JP5463924B2 (ja) 2010-01-15 2010-01-15 音響処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2010006435A JP5463924B2 (ja) 2010-01-15 2010-01-15 音響処理装置

Publications (2)

Publication Number Publication Date
JP2011146949A JP2011146949A (ja) 2011-07-28
JP5463924B2 true JP5463924B2 (ja) 2014-04-09

Family

ID=44461408

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2010006435A Expired - Fee Related JP5463924B2 (ja) 2010-01-15 2010-01-15 音響処理装置

Country Status (1)

Country Link
JP (1) JP5463924B2 (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7016029B2 (ja) 2018-04-27 2022-02-04 パナソニックIpマネジメント株式会社 床材

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4866774A (en) * 1988-11-02 1989-09-12 Hughes Aircraft Company Stero enhancement and directivity servo
JP2001069597A (ja) * 1999-06-22 2001-03-16 Yamaha Corp 音声処理方法及び装置
JP2001236084A (ja) * 2000-02-21 2001-08-31 Yamaha Corp 音響信号処理装置及びそれに用いられる信号分離装置
JP2002044793A (ja) * 2000-07-25 2002-02-08 Yamaha Corp 音響信号処理方法及び装置
JP3670562B2 (ja) * 2000-09-05 2005-07-13 日本電信電話株式会社 ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体
JP2006100869A (ja) * 2004-09-28 2006-04-13 Sony Corp 音声信号処理装置および音声信号処理方法
JP5298649B2 (ja) * 2008-01-07 2013-09-25 株式会社コルグ 音楽装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7016029B2 (ja) 2018-04-27 2022-02-04 パナソニックIpマネジメント株式会社 床材

Also Published As

Publication number Publication date
JP2011146949A (ja) 2011-07-28

Similar Documents

Publication Publication Date Title
JP5641186B2 (ja) 雑音抑圧装置およびプログラム
JP3670562B2 (ja) ステレオ音響信号処理方法及び装置並びにステレオ音響信号処理プログラムを記録した記録媒体
JP6377249B2 (ja) オーディオ信号の強化のための装置と方法及び音響強化システム
JP6019969B2 (ja) 音響処理装置
JP5018193B2 (ja) 雑音抑圧装置およびプログラム
JP2003274492A (ja) ステレオ音響信号処理方法、ステレオ音響信号処理装置、ステレオ音響信号処理プログラム
JP5187666B2 (ja) 雑音抑圧装置およびプログラム
JP5034734B2 (ja) 音処理装置およびプログラム
JP5034735B2 (ja) 音処理装置およびプログラム
JP5454330B2 (ja) 音響処理装置
JP5915281B2 (ja) 音響処理装置
JP3755739B2 (ja) ステレオ音響信号処理方法及び装置並びにプログラム及び記録媒体
JP2008072600A (ja) 音響信号処理装置、音響信号処理プログラム、音響信号処理方法
JP5463924B2 (ja) 音響処理装置
JP5609157B2 (ja) 係数設定装置および雑音抑圧装置
JP5641187B2 (ja) 音響処理装置
JP5454157B2 (ja) 音響処理装置
JP5316127B2 (ja) 音処理装置およびプログラム
JP5321171B2 (ja) 音処理装置およびプログラム
JP2015169901A (ja) 音響処理装置
JP5494085B2 (ja) 音響処理装置
JP2014102318A (ja) 雑音除去装置、雑音除去方法、及びプログラム
JP6774912B2 (ja) 音像生成装置
JP2018049228A (ja) 音響処理装置および音響処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20121120

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20131213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20131224

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20140106

R150 Certificate of patent or registration of utility model

Ref document number: 5463924

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees