JP6512767B2 - 音響処理装置および方法、並びにプログラム - Google Patents

音響処理装置および方法、並びにプログラム Download PDF

Info

Publication number
JP6512767B2
JP6512767B2 JP2014163041A JP2014163041A JP6512767B2 JP 6512767 B2 JP6512767 B2 JP 6512767B2 JP 2014163041 A JP2014163041 A JP 2014163041A JP 2014163041 A JP2014163041 A JP 2014163041A JP 6512767 B2 JP6512767 B2 JP 6512767B2
Authority
JP
Japan
Prior art keywords
signal
sound
output
sound source
speakers
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2014163041A
Other languages
English (en)
Other versions
JP2016039568A5 (ja
JP2016039568A (ja
Inventor
船越 正伸
正伸 船越
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2014163041A priority Critical patent/JP6512767B2/ja
Publication of JP2016039568A publication Critical patent/JP2016039568A/ja
Publication of JP2016039568A5 publication Critical patent/JP2016039568A5/ja
Application granted granted Critical
Publication of JP6512767B2 publication Critical patent/JP6512767B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は音響信号を編集・再生するための音響処理装置および方法に関する。
ダミーヘッドマイクロフォンで録音した2ch信号や、あるいは、モノラル音源信号に対して、音源方向の両耳の頭部伝達関数(Head-Related Transfer Function:HRTF)を各々畳み込んだ2ch信号をバイノーラル信号と呼ぶ。立体音響再生技術では、バイノーラル信号を再生することにより、人間が両耳で音を聴いている状態を再現し、臨場感のある立体的な音場を再現する。このような立体音響再生技術には、再生機器としてヘッドフォンを用いるバイノーラル再生技術と、スピーカーを用いるトランスオーラル再生技術がある。
このうち、バイノーラル再生では、前方の音像が頭内に定位してしまう問題がある。トランスオーラル再生では、この問題は解決されるが、聴取者の両耳に別々の信号を届けるために、再生に用いる複数のスピーカーと両耳間の伝達関数の影響を排除する処理が必要となる。特に、複数スピーカーの出力信号が耳への伝達経路において混じり、クロストークが生じることによる影響が強い。したがって、上記伝達関数の影響を排除する処理とは、このようなクロストークをキャンセルする処理となるため、この処理をクロストークキャンセルと呼んでいる。クロストークキャンセルを行うシステムは、キャンセルが正しく働く位置、いわゆる、スイートスポットが狭いという問題がある。そこで、従来技術では、クロストークキャンセルを行わない実音源(スピーカー)による信号と、立体音響信号とを混合して再生する試みがなされている。
例えば、特許文献1に開示されている技術では、5チャンネルサラウンド再生装置の左右のフロントスピーカーとサラウンドスピーカーの間に音像を定位させる場合に、6チャンネル以上の原音に基づいて、これらの間に定位すべき音像の角度を検出する。そして、検出された音像の角度に基づいて、フロントとサラウンドに振り分ける信号の音量レベルを決定するとともに、音像に対してHRTFを畳み込んで、音像の角度側のフロントとサラウンド信号に加算する。
また、特許文献2に開示される技術では、左右サラウンドチャンネル信号にスピーカー方向のHRTFを重畳し、さらにクロストークキャンセル処理を行いフロント左右チャンネルに加算する。センター信号はレベル調整した上でフロント左右チャンネルに均等に加算する。以上により5チャンネルサラウンド信号を2チャンネル信号に変換する。
また、モノラル音源信号の音像を任意の方向に定位させる音像位置の編集を行うパンニング編集システムが存在する。パンニング編集システムでは、GUIによって、ユーザーが音像を定位させる位置あるいは時間軌跡を指定し、それに基づいて音源信号に施す処理を決定、実行する。このようなパンニング編集システムにおいて、2チャンネルステレオ信号におけるパンニング編集を行う場合は、左右のチャンネルに割り当てる信号の振幅を変化させることにより、左右のスピーカー間に生じるファンタム音像の位置を制御する。また、立体音響再生方式では、音像方向に応じた両耳のHRTFを左右信号に各々重畳することにより、任意位置に立体音像を生成する。
特許第4949706号公報 特開平11−113098号公報
トランスオーラル再生では、前方に再現されるべき音像を後方に感じてしまう、あるいは、後方に再現されるべき音像を前方に感じてしまうといった、音像の前後混同が生じやすいという課題がある。この要因として、水平面上の二つのスピーカーによる立体音響再生方式において、正面や後方の音像を再生するときは、ともに左右の差がない信号を再生することになるため、前後の区別が分からなくなるということが考えられる。
特許文献1に開示の技術では、5チャンネルサラウンド方式における実音源による音像定位を基本として、側方音源の定位を強調するためにHRTFを重畳した信号を用いている。よって、前方の音像の問題は生じないが、側方音源に対して厳密なクロストークキャンセルは行っていないため、明確な立体音像は再生できない。また、後方への音像定位が困難である。また、特許文献2に開示の技術は、サラウンドチャンネルを仮想的に再生するものであり、立体音響として決まった方向の音像しか提示できず、任意方向に音像提示ができない。
本発明は上述した課題に鑑みてなされたものであり、任意の音源方向における音像の定位の明確さを改善する音響編集装置およびその制御方法を提供することを目的とする。
上記の目的を達成するための本発明の一態様による音響処理装置は、以下の構成を有する。すなわち、
音響信号を取得する取得手段と、
前記取得手段により取得される音響信号に基づくステレオ信号を生成する第1生成手段と、
前記取得手段により取得される音響信号に基づくバイノーラル信号を生成する第2生成手段と、
音を再生する複数のスピーカーの配置に関連して設定される複数の方向に基づいて、3以上の方向範囲を設定する設定手段であって、前記複数のスピーカーのうちの2つのスピーカーに関連付けられる2方向の間に含まれる第1方向範囲と、前記2つのスピーカーの何れかに関連付けられる方向を含む第2方向範囲と、前記第1方向範囲及び前記第2方向範囲を含まない第3方向範囲とを有する前記3以上の方向範囲を設定する設定手段と、
前記第1生成手段により生成されるステレオ信号と前記第2生成手段により生成されるバイノーラル信号との少なくとも何れかを含む出力信号を出力する出力手段であって、前記取得手段により取得される音響信号に対応する音源方向が前記設定手段により設定される前記3以上の方向範囲の何れに含まれるかに基づいて前記バイノーラル信号前記ステレオ信号それぞれ大きさが決定された前記出力信号を出力する出力手段とを有する
本発明によれば、任意の音源方向における音像の定位の明確さを改善することができる。
第1実施形態の音響編集装置の一構成例を示すブロック図。 第1実施形態の音響編集装置による音源定位処理を示すフローチャート。 第1実施形態の想定されたスピーカー配置の模式図。 第1実施形態の音響編集装置において出力されるステレオ信号とバイノーラル信号の出力レベル比と音源方向の関係を示す図。 第1実施形態の音響再生装置の一構成例を示すブロック図。 第2実施形態の音響編集装置の構成例を示すブロック図。 第2実施形態の音響編集装置による音源定位処理を示すフローチャート。 第2実施形態の想定されたスピーカー配置の模式図。 第2実施形態による音響編集装置において出力されるステレオ信号とバイノーラル信号の後方信号の出力レベル比と音源方向の関係を示す図。 第2実施形態の音響再生装置の一構成例を示すブロック図である。 一般的なクロストークキャンセル装置の構成例を示すブロック図。 スピーカーの配置角度5度におけるクロストークキャンセルフィルタの周波数特性を示す図。
以下、添付の図面を参照して、本発明の好適な実施形態のいくつかを説明する。
<第1実施形態>
図1は本実施形態の音響処理装置の一例である音響編集装置の構成例を示すブロック図である。図1において、フレーム分割部1は、入力される音源信号を処理単位であるフレーム長で逐次分割して、フレーム信号として出力する。ステレオパンニング部2は、音像位置制御部3によって送信される制御信号に応じて、フレーム信号に対してステレオパンニング処理を行い、ステレオ信号を出力する。音像位置制御部3は、入力される音源位置(音源方向)に従って各種制御信号を生成し、ステレオパンニング部2、バイノーラル信号生成部5、レベル変換部6、7に送信する。HRTFデータベース4は、種々の音源方向に対する両耳の頭部伝達関数HRTF(Head-Related Transfer Function:HRTF)に関する情報を格納する。HRTFデータベース4は、音像位置制御部3の要求に応じて、適宜HRTFに関する情報を音像位置制御部3に出力する。
バイノーラル信号生成部5は、音像位置制御部3により制御信号とともに送信されるHRTFを、音源信号に畳み込むことによって、入力される音源信号をバイノーラル信号に変換、出力する。レベル変換部6、7は、各々の入力信号を音像位置制御部3が送信するレベル制御信号に従ってレベル変換を行って出力する。音像位置制御部3は、これらのレベル変換部に送信するレベル制御信号を適宜制御することによって、ステレオ信号とバイノーラル信号の出力レベル比を制御し、クロスフェード処理を行う。
以下、上述のような構成を備えた本実施形態の音響編集装置による、入力される音源方向に応じてステレオ信号とバイノーラル信号を編集する一連の動作について説明する。図2は、本実施形態による音響編集装置による音源定位処理を示すフローチャートである。
S1において、フレーム分割部1は、入力されるモノラルの音源信号から処理単位フレーム長の信号(フレーム信号)を切り出す。本実施形態において、フレーム長は予め定められており、フレーム分割部1内部のRAMに格納されている。フレーム長に切り出された音源信号(フレーム信号)は、ステレオパンニング部2と、バイノーラル信号生成部5に送信される。S2において、音像位置制御部3は音源方向χを取得する。なお、本実施形態においては、説明の便宜のため、音源方向は水平面における角度とし、聴取者正面方向を0°、左を負値、右を正値として±180°の範囲で表現する。
S3において、音像位置制御部3は、S2で取得した音源方向χが、予め定められたスピーカー配置角度近傍かどうかを判定する。図3は、本実施形態における想定されたスピーカー配置の模式図である。本実施形態の音響編集装置が想定している再生用のスピーカーは2個であり、聴取者の前方に左右対称の角度で設置されているものとする。図3に示すように、本実施形態では、このスピーカーの設置角(スピーカー配置角度)を±θ(θ>0)とし、その近傍の範囲の角度を±α(θ>α>0)とする。すなわち、音源方向χが、−θ−αから−θ+αまでの範囲にある場合、もしくは、θ−αからθ+αの範囲にある場合、音像位置制御部3は音源方向がスピーカー配置角度近傍であると判定する。なお、スピーカー配置角度θと近傍角αは予め音像位置制御部3に内蔵されるRAMに格納されている。この判定の結果、音源方向がスピーカー配置角度近傍である場合には処理はS4へ、配置角度近傍ではない場合には処理はS9へ進む。
S4において、音像位置制御部3は、音源方向χとスピーカー配置角度θに基づき、ステレオパンニングの際の、左右のチャンネルに対する音響信号の振幅ゲインを算出する。例えば、音像位置制御部3は、サイン則に基づき、左右チャンネルの振幅ゲインg、gを次式に従って算出する。算出された振幅ゲインは、制御信号としてステレオパンニング部2へ送信される。
Figure 0006512767
S5において、ステレオパンニング部2は、S1で切り出された音源信号とS4で決定された振幅ゲインを用いてステレオパンニングを行い、ステレオ信号を得る。たとえば、ステレオパンニング部2は、音源信号と振幅ゲインの積をとることで左右チャンネルの信号、すなわちステレオ信号を生成する。ステレオパンニングにより得られたステレオ信号はレベル変換部6へ送信される。
S6において、音像位置制御部3は、S2で取得した音源方向χをキーとしてHRTFデータベース4を検索し、音源方向χに対応する両耳のHRTFを取得する。取得されたHRTFは、制御信号として音源位置制御部3からバイノーラル信号生成部5へ送信される。S7において、バイノーラル信号生成部5は、S1で切り出された音源信号に対して、S6で受信した両耳のHRTFを左右別々に畳み込む事により、バイノーラル信号を生成する。生成されたバイノーラル信号はレベル変換部7へ送信される。
S8において、音像位置制御部3は、S2で取得した音源方向χに従って、ステレオ信号の出力レベル比とバイノーラル信号の出力レベル比を算出する。本実施形態において、スピーカー配置角度θ近傍では、音源方向χがより側方にあるほど、ステレオ信号のレベルを減少させるとともに、バイノーラル信号のレベルを増加させる。このようなクロスフェード処理を行うことによって、音源方向χの移動によって生じるステレオ信号からバイノーラル信号への切り替えを、聴感上で違和感を生じることなく実施できる。たとえば、スピーカー配置角度θの近傍(θ−α)から(θ+α)の間に音像方向χが位置する場合、ステレオ信号のレベル比lとバイノーラル信号のレベル比lは次式によって計算することができる。
Figure 0006512767
同様に、音像方向χがθの近傍−(θ+α)から−(θ−α)の間に位置する場合、lとlは次式によって計算することができる。
Figure 0006512767
以上のようにして計算されたステレオ信号レベル比lは、制御信号としてレベル変換部6へ送信される。同様に、以上のようにして計算されたバイノーラル信号レベル比lは、制御信号としてレベル変換部7へ送信される。S8の処理を終えると、処理はS16へ進む。
一方、S3の判定において音源方向χがスピーカー配置角度近傍ではない場合、S9に処理が進む。S9において、音像位置制御部3は、音源方向χがスピーカー配置間隔以内、すなわち、−θ+αからθ−αまでの範囲にあるかどうかを判定する。この判定の結果、音源方向がスピーカー配置間隔以内の場合は、S10へ処理が進み、そうでない場合は、S13へ処理が進む。
まず、音源方向χがスピーカー配置間隔以内にある場合の処理において、S10、S11は、S4、S5と同じ処理であるので説明を省略する。S12において、音像位置制御部3は、レベル変換部6に対して出力レベル比を1とする制御信号(ステレオ信号レベル比l)を送信し、かつ、レベル変換部7に対して出力レベル比(バイノーラル信号レベル比l)を0とする制御信号を送信する。これにより、本構成の音響編集装置からはステレオ信号のみが出力されることになる。S12の処理を終えると、処理はS16へ進む。
一方、音源方向χがスピーカー配置間隔外にある場合の処理において、S13、S14は、S6、S7と同じ処理であるので説明を省略する。S15において、音像位置制御部3は、レベル変換部6に対して出力レベル比(ステレオ信号レベル比l)を0とする制御信号を送信し、かつ、レベル変換部7に対して出力レベル比(バイノーラル信号レベル比l)を1とする制御信号を送信する。これにより、本構成の音響編集装置からはバイノーラル信号のみが出力されることになる。S15の処理を終えると、処理はS16へ進む。
S16において、レベル変換部6、7は、S8、もしくはS12、もしくはS15において、音像位置制御部3から送信された信号レベル比に応じて、ステレオ信号とバイノーラル信号の出力レベルを各々変換して出力する。この処理は、ステレオ信号とバイノーラル信号の各信号の振幅とステレオ信号レベル比l、バイノーラル信号レベル比lとの積を各々算出するものである。S17において、フレーム分割部1において入力信号の受信が終了したかどうかが判定される。この判定の結果、入力信号が終了していない場合、処理はS2へ戻り、上述した処理が繰り返される。他方、入力信号が終了したと判定された場合は、音響編集処理を終了する。
図4は、音源方向χと、ステレオ信号、バイノーラル信号の出力レベル比の関係を示している。上述したように、S8,S12,S15で音像位置制御部3により生成された制御信号(出力レベル比)に応じて、S16でステレオ信号とバイノーラル信号の出力レベルが制御される。これにより、図4に示されるように、音源方向χに応じて、ステレオ信号とバイノーラル信号の出力レベル比が制御される。すなわち、聴取者の正面を0°とし、スピーカー配置角度を±θ°とした場合に、
・音源方向が0°を含む±θ°の間(スピーカー配置角度の内側)にある場合は、ステレオ信号の信号レベル比をバイノーラル信号の信号レベル比より高く設定し、
・音源方向が0°を含まない±θ°の間(スピーカー配置角度の外側)にある場合は、バイノーラル信号の信号レベル比をステレオ信号の信号レベル比よりも高く設定している。特に、本実施形態では、
・前記スピーカー配置角度の内側の音源方向では前記ステレオ信号の信号レベル比を1に、前記バイノーラル信号の信号レベル比を0に決定し、
・前記スピーカー配置角度の外側の音源方向では前記バイノーラル信号の信号レベル比を1に、前記ステレオ信号の信号レベル比を0に決定している。
これにより、スピーカー配置角度の内側ではステレオ信号が優勢になるため、前方の音像がより明瞭になる。
また、ステレオ信号とバイノーラル信号が切り替わるスピーカー配置角度近傍では、クロスフェード処理が行われる。すなわち、音源方向がスピーカー配置角度を含む所定範囲(θ±α、−θ±α)にある間は、ステレオ信号とバイノーラル信号の信号レベル比が音源方向に応じて徐々に変化するように決定される。そのため、視聴者に違和感を与えずに、ステレオ信号とバイノーラル信号の切り換えが行われる。
図5は、本実施形態による音響編集装置によって作成した音響信号を再生するための、音響処理装置の一例としての音響再生装置の一構成例を示すブロック図である。音響再生装置は、上述した音響編集装置により一つのモノラル音源信号から生成されたステレオ信号とバイノーラル信号を入力し、スピーカー34を駆動する信号を生成する。
図5において、レベル調整部31は、クロストークキャンセル部32から送信される制御信号に応じて、入力されるステレオ信号のレベルを調整して出力する。クロストークキャンセル部32は、入力されるスピーカー配置角度に応じて、2つのスピーカー34から聴取者イの両耳までの伝達経路によって生じるクロストークを除去するフィルタを生成する。そして、生成されたフィルタを逐次入力されるバイノーラル信号に畳み込むことによりクロストークキャンセル処理を実行する。また、クロストークキャンセル処理によって生じるレベル減衰量を計算し、レベル調整部31に送信する。なお、クロストークキャンセル処理の詳細については図11を用いて後述する。
加算部33は、入力される複数の音響信号を逐次単純に加算して出力する。スピーカー34は、入力される音響信号を適宜増幅して音に変換して出力する。なお、聴取者イは本実施形態の構成要素ではなく、説明の便宜上、聴取者のイメージを模式的に示している。
以下、図11を用いて一般的なクロストークキャンセル処理について説明する。図11は、使用するスピーカーが2個の場合、つまり、2チャンネル再生環境における一般的なクロストークキャンセル処理を説明するための模式図である。2チャンネル再生環境では、左右二つのスピーカーと、聴取者の両耳の間に、合わせて4つの音響伝達経路ができるとして考えることができる。図11に示すように、左スピーカーから左耳の伝達関数をHLL、左スピーカーから右耳への伝達関数をHLR、右スピーカーから左耳への伝達関数をHRL、右スピーカーから右耳への伝達関数をHRRとする。クロストークキャンセル処理を行わずに、直接再生した場合、入力信号(Lin,Rin)と聴取者の両耳に届く聴取信号(Lear,Rear)との間には次の(4)式の関係が成立する。
Figure 0006512767
ここで、(5)式のAを、伝達関数行列とする。
Figure 0006512767
クロストークキャンセル処理は、聴取信号を入力信号と同一にする処理であるので、クロストークキャンセル部32のフィルタX〜Xにより再生環境による伝達関数行列Aの逆行列Xを設計すればよい。
Figure 0006512767
式(4)にこの逆行列Xを左から掛けると、入力信号と聴取信号が次式のように同一になる。
Figure 0006512767
よって、図11に示すクロストークキャンセル部32における各フィルタX,X,X,Xを(6)式の伝達関数を満たすように設計することで、クロストークキャンセル処理を正確に行うことができる。
このようにして設計したクロストークキャンセルフィルタの典型的な特性を、図12に示す。図12は、2つのスピーカーが聴取者正面に対して左右5度の方向にある場合にトランスオーラル再生を行う場合の、2チャンネルクロストークキャンセルフィルタの周波数特性である。クロストークキャンセルフィルタは複数のスピーカー間の干渉を補正するフィルタであるため、図示したように高域に強いピークが現れる。図12の例では、10kHz近傍にピークが生じている。2チャンネルトランスオーラル再生の場合、このピークが生じる周波数は、2つのスピーカーから各耳までの経路差で決定される。よって、スピーカーの配置角度に応じて経路差が変化するため、クロストークキャンセルフィルタもスピーカーの配置角度に応じて設計する必要が生じる。
また、クロストークキャンセルフィルタの特性は、干渉を補正するピークを除く全体の特性が、低周波数域から高周波数域にかけて減衰する特性になる。よって、バイノーラル信号においては、フィルタを畳み込むことにより聴感上のレベル減衰が生じる。よって、バイノーラル信号とステレオ信号のレベルバランスを、実行されたクロストークキャンセル処理の特性に応じて、加算部33において加算される前のステレオ信号の信号レベルを調整する必要がある。なお、上述のように、クロストークキャンセル信号の特性はスピーカー配置角度に応じて決定されるので、レベル調整部31はスピーカー配置角度に応じてステレオ信号のレベルを適宜調整するようにしてもよい。
図5の構成による音響再生装置に、本実施形態の音響編集装置(図1)によって作成したステレオ信号とバイノーラル信号を入力すると、バイノーラル信号に対してはクロストークキャンセル部32によりスピーカー配置角度に応じた適切なクロストークキャンセル処理が行われる。同時に、ステレオ信号には、レベル調整部31により、クロストークキャンセル処理によって減衰するバイノーラル信号のレベルと同等のレベルとなるように調整が行われる。これらバイノーラル信号とステレオ信号を加算して出力することにより、音源位置が移動してステレオ信号とバイノーラル信号の切り替えが生じても聴感上で違和感を生じないように再生することができる。
以上説明したように、本実施形態によれば、トランスオーラル再生において前後混同しやすい前方の音源に対しては、前方の二つのスピーカーによって直接再生する通常のステレオ信号を生成する。そして、それ以外の方向については、バイノーラル信号を生成する。このようにすることにより、前後混同の発生を抑制しつつ、あらゆる任意の方向に明確な音像を定位させることができる音響信号を生成することができる。また、スピーカー配置方向の近傍に位置する音源に対しては、クロスフェード処理を行うことによって、音源を移動させる場合に、再生信号が切り替わっても聴感上の違和感を生じない音響信号を生成することができる。
さらに、本実施形態の音響編集装置によって編集した音響信号を専用の再生部によって再生することにより、再生信号の切り替えによって生じるレベルの変化を抑制しつつ、前後混同を生じさせずにあらゆる任意の方向に音像が定位する立体音響再生を行うことができる。
なお、本実施形態では、ステレオパンニング手法としてサイン則を用いる例を説明したが、これに限られるものではない。たとえば、線形則や平方根則、タンジェント則などのその他のステレオパンニング手法を用いても、本発明の主旨に影響することはなく、同様の効果を得ることができる。また、本実施形態では音響編集装置の出力と音響再生装置の入力間については特に明示していないが、音響編集装置と音響再生装置の入出力を直結すれば、もちろん同様の効果が得られる。さらに、音響編集装置の出力を一旦外部記憶装置等に記憶し、再生時に記憶装置から読み込んで音響再生装置に入力する場合においても、ステレオ信号とバイノーラル信号の同期をとることによって、同様の効果を得ることができる。
また、本実施形態ではスピーカー配置角度θが予め定められている場合について説明したが、任意のスピーカー配置角度をユーザー指定により音像位置制御部3に入力するようにしてもよい。この場合、図2のS2において、音像位置制御部3は、音源方向を取得して内部RAMに格納するとともに、スピーカー配置角度も取得して内部RAMに格納する。これにより、スピーカー配置角度θを任意に変えた場合にも、本発明を適用して同様の効果を得ることができる。なお、音像位置制御部3に入力するスピーカー配置角度と、音響再生装置(図5)に入力されるスピーカー配置角度は同じ値とする。
また、本実施形態では水平面の音源方向に対する動作を説明したが、本発明は三次元空間における方向に対しても有効であり、俯角を含めた三次元の方向に拡張して実施することもできる。例えば、聴取者の耳の高さに俯角0°の水平面を設定し、水平面におけるスピーカー配置角度±θの正面水平方向に対して、俯角±15°を閾値として設定する。そして、その間の俯角方向では前方スピーカーによるステレオ再生を行い、その外側の俯角方向に対してはバイノーラル再生を行うとしてもよい。その他、主旨逸脱することのない範囲において本発明を他の構成で実施することが可能である。
<第2実施形態>
第1実施形態では、聴取者の前方に2つのスピーカーを配置する場合について説明した。第2実施形態においては、聴取者の後方にもスピーカーを配置する場合について説明する。図6は、第2実施形態における音響編集装置の構成例を示すブロック図である。図6に示される構成において、第1実施形態の構成(図1)と同様の構成については同一の参照番号を付してある。
図6において、音像位置制御部21は、入力される音源方向とスピーカー配置角度に応じて、パンニング制御を含む各種制御信号を生成し、ステレオパンニング部2、バイノーラル信号生成部5、レベル変換部6、7、22に送信する。レベル変換部22は、音像位置制御部21が送信するレベル制御信号に従って、入力される音響信号のレベルを適宜制御し、聴取者の後方に出力するための後方信号を出力する後方信号出力部として機能する。音像位置制御部21は、レベル変換部6、7、22に送信するレベル制御信号を適宜制御することにより、ステレオ信号とバイノーラル信号の出力レベル比や、後方信号とバイノーラル信号の出力レベル比を制御し、クロスフェード処理を行う。
以下、図示の構成において、入力される音源方向とスピーカー配置角度に応じてステレオ信号、バイノーラル信号、後方信号を編集する一連の動作をフローに従って説明する。
図7は、第2実施形態による音響編集装置による音源定位処理を示すフローチャートである。なお、図7において、S1からS15までの処理とS17の処理は、第1実施形態(図2)と同様の処理である。S101において、音像位置制御部21は、スピーカー配置角度を取得する。なお、第1実施形態で説明したように、スピーカー配置角度が予め決められている場合は、この処理は省略可能である。
S201において、音像位置制御部21は、音源方向χが聴取者の真後ろから左右θの角度範囲内にあるかどうかを判定する。図8は、第2実施形態における想定されたスピーカー配置の模式図である。第2実施形態の音響編集装置が想定している再生用のスピーカーは3個であり、聴取者の前方に左右対称の角度θに2個と、聴取者の真後ろに1個設置されているものとする。トランスオーラル再生において後方の音像に対する前後混同が生じる角度は、前方に設置したスピーカーの配置角度に依存する。よって、後方についても前方のスピーカー配置角度θと同じ範囲において、後方スピーカーから直接音源を再生することにより、後方音像をトランスオーラル再生によって生成する際に生じる前後混同を避けることができる。
S201における判定の結果、音源方向χが聴取者の真後ろを中心とする左右θの角度範囲内(音源方向が180°を挟んで±(180°−θ)の範囲内)にある場合は、処理はS202へ進む。そうでない場合は、S3へ進む。S202、S203は、各々図2のS6、S7と同様の処理である。S204において、音像位置制御部21は、S2で取得した音源方向χに従って、後方信号の出力レベル比とバイノーラル信号の出力レベル比を算出する。第2実施形態において、音源方向が聴取者の真後ろ、つまり、180°にある場合は、後方信号のみを出力し、音源方向χが±(180°−θ)に近づくほど、後方信号のレベルを減少させるとともに、バイノーラル信号のレベルを増加させる。このようなクロスフェード処理を行うことによって、音源方向χの移動によって生じる後方信号からバイノーラル信号への切り替えを、聴感上で違和感を生じることなく実施できる。
例えば、180°−θから180°の間に音像方向χが位置する場合、後方信号のレベル比lとバイノーラル信号のレベル比lは次式によって計算することができる。
Figure 0006512767
同様に、音像方向χが−180°から−(180°−θ)の間に位置する場合、lrとlは次式によって計算することができる。
Figure 0006512767
次に、S205において、レベル変換部6、7、21は、S8、S12、S15、もしくはS204でレベル変換部6、7、21に送信された信号レベル比に応じて、ステレオ信号、バイノーラル信号、後方信号の出力レベルを各々変換して出力する。この処理は、ステレオ信号、バイノーラル信号、後方信号の各信号の振幅とl、l、lとの積を各々算出することによって実行される。
図9は、音源方向χと、ステレオ信号、バイノーラル信号、後方信号の出力レベル比の関係を示している。S8,S12,S15、S204の制御信号に応じてステレオ信号、バイノーラル信号、後方信号の出力レベルを制御することにより、図9に示すように、音源方向χに応じてこれらの信号の出力レベル比が制御される。ステレオ信号とバイノーラル信号が切り替わる前方スピーカー配置角度近傍では、クロスフェード処理が行われる。また、後方信号とバイノーラル信号が切り替わる180°近傍でも、クロスフェード処理が行われる。S206において、レベル変換部6、7、22は、S8、S12、S15もしくはS204において音像位置制御部21から送信された信号レベル比に応じて、ステレオ信号、バイノーラル信号、後方信号の出力レベルを各々変換して出力する。
図10は、第2実施形態による音響編集装置によって作成した音響信号を再生するための音響再生装置の構成例を示すブロック図である。図10に示される構成において、第1実施形態(図5)と同様の構成には、同一の参照番号を付してある。レベル調整部35は、クロストークキャンセル部32から送信される制御信号に従って、入力された後方信号のレベルを適宜制御して出力する。これにより、クロストークキャンセル処理が行われたバイノーラル信号と後方信号のレベルを一致させることができるので、バイノーラル信号と後方信号の切り替えを聴感上の違和感を生じることなく実施することができる。
以上説明したように、上記各実施形態によれば、トランスオーラル再生において前後混同しやすい前方の音源に対しては、前方スピーカーで直接再生するステレオ信号を生成する。さらに、同じく前後混同しやすい後方の音源に対しては、後方スピーカーで再生する信号を生成する。そして、それ以外の方向の音源についてはバイノーラル信号を生成することにより、前後混同の発生を抑制しつつ、あらゆる任意の方向に明確な音像を定位させることができる音響信号を生成することができる。また、後方の音源に対して、後方信号とバイノーラル信号のクロスフェード処理を行うことによって、音源の移動に伴い再生信号が切り替わっても聴感上の違和感を生じない音響信号を生成することができる。
さらに、第2実施形態によれば、音響編集装置によって編集した音響信号を後方スピーカーを含む音響再生装置によって再生することにより、後方信号とクロストークキャンセル信号の切り替えによって生じるレベルの変化を抑制できる。それにより、前後混同を生じさせずにあらゆる任意の方向に音像が定位する立体音響再生を行うことができる。
なお、本実施形態では後方のスピーカーを一個配置するものとしたが、後方に複数のスピーカーを設置する場合でも同様な処理が可能である。さらに、後方に配置された複数のスピーカーにおけるステレオ処理を加えることによって、直接音源による音像定位をさらに明確にすることができる。また、本実施形態では、クロスフェード手法として単純な線形則を用いて説明したが、対数側などのその他のクロスフェード手法を用いても、本発明の主旨に影響することはなく、同様の効果を得ることができる。
また、本発明の手法を一般的な5.1chサラウンド配置の再生システムにおいて摘要することで、5.1chサラウンド配置では難しい側方と後方の音像を強調することも可能である。例えば、側方や後方に音源定位させる場合に、センタースピーカーとしてダイポールステレオスピーカーを配置し、立体音響信号を生成して5.1ch信号とともに再生することで、スピーカーを配置しない側方や後方の音像をより明確に定位させることができる。
その他、主旨逸脱することのない範囲において本発明を他の構成で実施することが可能である。たとえば、図1、図5、図6、図10、図11に示した各部は、それぞれ専用のハードウエアで構成されてもよいし、その一部あるいは全てが、メモリに格納された所定のプログラムを実行するコンピュータにより実現されてもよい。すなわち、本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、ネットワーク又は各種記憶媒体を介してシステム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。
1:フレーム分割部、2:ステレオパンニング部、3:音像位置制御部、4:HRTFデータベース、5:バイノーラル信号生成部、6,7:レベル変換部、31:レベル調整部、32:クロストークキャンセル部、33:加算部、34:スピーカー

Claims (20)

  1. 音響信号を取得する取得手段と、
    前記取得手段により取得される音響信号に基づくステレオ信号を生成する第1生成手段と、
    前記取得手段により取得される音響信号に基づくバイノーラル信号を生成する第2生成手段と、
    音を再生する複数のスピーカーの配置に関連して設定される複数の方向に基づいて、3以上の方向範囲を設定する設定手段であって、前記複数のスピーカーのうちの2つのスピーカーに関連付けられる2方向の間に含まれる第1方向範囲と、前記2つのスピーカーの何れかに関連付けられる方向を含む第2方向範囲と、前記第1方向範囲及び前記第2方向範囲を含まない第3方向範囲とを有する前記3以上の方向範囲を設定する設定手段と、
    前記第1生成手段により生成されるステレオ信号と前記第2生成手段により生成されるバイノーラル信号との少なくとも何れかを含む出力信号を出力する出力手段であって、前記取得手段により取得される音響信号に対応する音源方向が前記設定手段により設定される前記3以上の方向範囲の何れに含まれるかに基づいて前記バイノーラル信号と前記ステレオ信号それぞれの大きさが決定された前記出力信号を出力する出力手段とを有することを特徴とする音響処理装置。
  2. 前記第1生成手段は、前記取得手段により取得される音響信号に対して前記音源方向に応じたパンニング処理を行うことで前記ステレオ信号を生成し、
    前記第2生成手段は、前記取得手段により取得される音響信号に対して前記音源方向に応じた頭部伝達関数を適用することで前記バイノーラル信号を生成することを特徴とする請求項1に記載の音響処理装置。
  3. 前記出力手段は、前記音源方向が前記第2方向範囲に含まれる場合であり且つ前記複数のスピーカーの配置に関する基準方向と前記音源方向との差が閾値未満である場合には、前記音源方向が前記第2方向範囲に含まれる場合であり且つ当該差が前記閾値以上である場合よりも、前記バイノーラル信号に対する前記ステレオ信号の比率が大きい出力信号を出力することを特徴とする請求項1又は2に記載の音響処理装置。
  4. 前記基準方向は、前記2つのスピーカーに関連付けられる2方向の中心方向であることを特徴とする請求項3に記載の音響処理装置。
  5. 前記基準方向と前記音源方向との差が前記閾値未満である場合とは、前記音源方向が前記2つのスピーカーに関連付けられる2方向の間の方向となる場合であることを特徴とする請求項4に記載の音響処理装置。
  6. 前記2つのスピーカーに関連付けられる2方向は、ユーザによる入力に応じて指定される方向であることを特徴とする請求項4に記載の音響処理装置。
  7. 前記基準方向は、前記複数のスピーカーにより再生される音を聴く聴取者の正面方向として規定されることを特徴とする請求項3に記載の音響処理装置。
  8. 前記出力手段は、
    前記音源方向が前記第1方向範囲に含まれる場合には、前記ステレオ信号を含み且つ前記バイノーラル信号を含まない出力信号を出力し、
    前記音源方向が前記第3方向範囲に含まれる場合には、前記ステレオ信号を含まず且つ前記バイノーラル信号を含む出力信号を出力することを特徴とする請求項3乃至7の何れか1項に記載の音響処理装置。
  9. 前記出力手段は、前記音源方向が前記第2方向範囲に含まれる場合には、前記音源方向が前記基準方向に近いほど前記バイノーラル信号に対する前記ステレオ信号の比率が大きい出力信号を出力することを特徴とする請求項8に記載の音響処理装置。
  10. 前記取得手段により取得される音響信号に基づくモノラル信号を生成する第3生成手段を有し、
    前記設定手段により設定される前記3以上の方向範囲は、前記2つのスピーカーとは別のスピーカーに関連付けられる方向を含む第4方向範囲を有し、
    前記出力手段は、前記音源方向が前記第4方向範囲に含まれる場合には、前記第3生成手段により生成されるモノラル信号を含む出力信号を出力することを特徴とする請求項3乃至7のいずれか1項に記載の音響処理装置。
  11. 前記別のスピーカーに関連付けられる方向は、前記基準方向の略反対方向であることを特徴とする請求項10に記載の音響処理装置。
  12. 前記出力手段は、
    前記音源方向が前記第1乃至第3方向範囲の何れかに含まれる場合には、前記モノラル信号を含まない出力信号を出力し、
    前記音源方向が前記第4方向範囲に含まれる場合であり且つ前記別のスピーカーに関連付けられる方向と前記音源方向との差が第2閾値未満である場合には、前記モノラル信号を含み且つ前記バイノーラル信号を含まない出力信号を出力することを特徴とする請求項10又は11に記載の音響処理装置。
  13. 前記出力手段は、前記音源方向が前記第4方向範囲に含まれる場合であり且つ前記別のスピーカーに関連付けられる方向と前記音源方向との差が前記第2閾値以上である場合には、前記音源方向が前記別のスピーカーに関連付けられる方向に近いほど前記バイノーラル信号に対する前記モノラル信号の比率が大きい出力信号を出力することを特徴とする請求項12に記載の音響処理装置。
  14. 前記出力手段は、前記出力信号としての前記バイノーラル信号と前記ステレオ信号とを別々に出力することを特徴とする請求項1乃至9の何れか1項に記載の音響処理装置。
  15. 前記設定手段により設定される前記3以上の方向範囲は、前記2つのスピーカーのうち前記第2方向範囲に対応するスピーカーとは異なるスピーカーに関連付けられる方向を含む第5方向範囲を有することを特徴とする請求項1乃至14の何れか1項に記載の音響処理装置。
  16. 同一の音響信号に基づいて生成されるモノラル信号とバイノーラル信号とを含む入力信号を受け付ける受付手段と、
    前記受付手段により受け付けられる入力信号に含まれるバイノーラル信号に対するクロストークキャンセル処理を、スピーカーの配置に関する情報に基づいて行う処理手段と、
    前記受付手段により受け付けられる入力信号に含まれるモノラル信号の信号レベルを、前記処理手段によるクロストークキャンセル処理の特性に応じて調整する調整手段と、
    記処理手段によりクロストークキャンセル処理されたバイノーラル信号に基づいて複数のチャンネルの信号を生成する生成手段と、
    前記生成手段により生成される信号を、前記複数のチャンネルに対応する複数のスピーカーを駆動するための信号として出力し、且つ、前記調整手段により調整されたモノラル信号を、前記複数のスピーカーとは異なるスピーカーを駆動するための信号として出力する出力手段とを有することを特徴とする音響処理装置。
  17. 前記受付手段は、同一の音響信号に基づいて生成されるモノラル信号とステレオ信号とバイノーラル信号とを含む入力信号を受け付け、
    前記調整手段は、前記受付手段により受け付けられる入力信号に含まれるステレオ信号の信号レベルを、前記処理手段によるクロストークキャンセル処理の特性に応じて調整し、
    前記生成手段は、前記調整手段により調整されたステレオ信号と前記処理手段によりクロストークキャンセル処理されたバイノーラル信号とをチャンネルごとに合成することで、前記複数のチャンネルの信号を生成することを特徴とする請求項16に記載の音響処理装置。
  18. 音響信号を取得する取得工程と、
    音を再生する複数のスピーカーの配置に関連して設定される複数の方向に基づいて、3以上の方向範囲を設定する設定工程であって、前記複数のスピーカーのうちの2つのスピーカーに関連付けられる2方向の間に含まれる第1方向範囲と、前記2つのスピーカーの何れかに関連付けられる方向を含む第2方向範囲と、前記第1方向範囲及び前記第2方向範囲を含まない第3方向範囲とを有する前記3以上の方向範囲を設定する設定工程と、
    前記取得工程において取得される音響信号に対応する音源方向が前記第1方向範囲に含まれる場合には、前記複数のスピーカーを駆動するための信号として前記音響信号に基づいて生成されるステレオ信号を出力し、前記音源方向が前記第3方向範囲に含まれる場合には、前記複数のスピーカーを駆動するための信号として前記音響信号に基づいて生成されるバイノーラル信号を出力し、前記音源方向が前記第2方向範囲に含まれる場合には、前記音響信号に基づいて生成されるステレオ信号とバイノーラル信号との両方を含む信号を、前記複数のスピーカーを駆動するための信号として出力する出力工程とを有することを特徴とする音響処理方法。
  19. 前記設定工程において設定される前記3以上の方向範囲は、前記2つのスピーカーのうち前記第2方向範囲に対応するスピーカーとは異なるスピーカーに関連付けられる方向を含む第4方向範囲を有し、
    前記出力工程においては、前記音源方向が前記第4方向範囲に含まれる場合には、前記音響信号に基づいて生成されるステレオ信号とバイノーラル信号との両方を含む信号を、前記複数のスピーカーを駆動するための信号として出力することを特徴とする請求項18に記載の音響処理方法。
  20. コンピュータを請求項1乃至17のいずれか1項に記載の音響処理装置の各手段として機能させるためのプログラム。
JP2014163041A 2014-08-08 2014-08-08 音響処理装置および方法、並びにプログラム Active JP6512767B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014163041A JP6512767B2 (ja) 2014-08-08 2014-08-08 音響処理装置および方法、並びにプログラム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014163041A JP6512767B2 (ja) 2014-08-08 2014-08-08 音響処理装置および方法、並びにプログラム

Publications (3)

Publication Number Publication Date
JP2016039568A JP2016039568A (ja) 2016-03-22
JP2016039568A5 JP2016039568A5 (ja) 2017-09-14
JP6512767B2 true JP6512767B2 (ja) 2019-05-15

Family

ID=55530305

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014163041A Active JP6512767B2 (ja) 2014-08-08 2014-08-08 音響処理装置および方法、並びにプログラム

Country Status (1)

Country Link
JP (1) JP6512767B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EP3726859A4 (en) 2017-12-12 2021-04-14 Sony Corporation SIGNAL PROCESSING DEVICE AND METHOD, AND PROGRAM
GB2592610A (en) * 2020-03-03 2021-09-08 Nokia Technologies Oy Apparatus, methods and computer programs for enabling reproduction of spatial audio signals

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03270400A (ja) * 1990-03-19 1991-12-02 Roland Corp 音像定位装置
JPH06245300A (ja) * 1992-12-21 1994-09-02 Victor Co Of Japan Ltd 音像定位制御装置
JP4101452B2 (ja) * 2000-10-30 2008-06-18 日本放送協会 多チャンネル音声回路
JP2003284196A (ja) * 2002-03-20 2003-10-03 Sony Corp 音像定位信号処理装置および音像定位信号処理方法
US8139797B2 (en) * 2002-12-03 2012-03-20 Bose Corporation Directional electroacoustical transducing
JP2008502200A (ja) * 2004-06-04 2008-01-24 サムスン エレクトロニクス カンパニー リミテッド ワイドステレオ再生方法及びその装置
JP4949706B2 (ja) * 2006-03-17 2012-06-13 公立大学法人会津大学 音像定位装置及び音像定位方法
JP6102179B2 (ja) * 2012-08-23 2017-03-29 ソニー株式会社 音声処理装置および方法、並びにプログラム

Also Published As

Publication number Publication date
JP2016039568A (ja) 2016-03-22

Similar Documents

Publication Publication Date Title
AU2018200684B2 (en) Method and apparatus for rendering acoustic signal, and computer-readable recording medium
KR100608024B1 (ko) 다중 채널 오디오 입력 신호를 2채널 출력으로 재생하기위한 장치 및 방법과 이를 수행하기 위한 프로그램이기록된 기록매체
EP1680941B1 (en) Multi-channel audio surround sound from front located loudspeakers
US7813933B2 (en) Method and apparatus for multichannel upmixing and downmixing
KR100608025B1 (ko) 2채널 헤드폰용 입체 음향 생성 방법 및 장치
KR101567461B1 (ko) 다채널 사운드 신호 생성 장치
KR100677629B1 (ko) 다채널 음향 신호에 대한 2채널 입체 음향 생성 방법 및장치
JP4914124B2 (ja) 音像制御装置及び音像制御方法
US9607622B2 (en) Audio-signal processing device, audio-signal processing method, program, and recording medium
KR20070066820A (ko) 청취 위치를 고려한 2채널 입체음향 재생 방법 및 장치
KR20130128396A (ko) 스테레오 영상 확대 시스템
US20110038485A1 (en) Nonlinear filter for separation of center sounds in stereophonic audio
JP5118267B2 (ja) 音声信号再生装置、音声信号再生方法
KR20130080819A (ko) 다채널 음향 신호의 정위 방법 및 장치
JP4949706B2 (ja) 音像定位装置及び音像定位方法
EP1617707A2 (en) Sound reproducing apparatus and method for providing virtual sound source
JP2009171144A (ja) 信号処理装置、信号処理方法、プログラム
JP5505395B2 (ja) 音響処理装置
US11388539B2 (en) Method and device for audio signal processing for binaural virtualization
US20200059750A1 (en) Sound spatialization method
JP6512767B2 (ja) 音響処理装置および方法、並びにプログラム
Baskind et al. Binaural and transaural spatialization techniques in multichannel 5.1 production
JP2004023486A (ja) ヘッドホンによる再生音聴取における音像頭外定位方法、及び、そのための装置
JP2015170926A (ja) 音響再生装置、音響再生方法
JP6212348B2 (ja) アップミックス装置、音響再生装置、音響増幅装置、及びプログラム

Legal Events

Date Code Title Description
A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170804

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20170804

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20180511

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20180521

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20180719

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20181019

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20181213

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190311

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190409

R151 Written notification of patent or utility model registration

Ref document number: 6512767

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151