JP6179194B2 - 音源管理装置、音源管理方法、および音源管理システム - Google Patents

音源管理装置、音源管理方法、および音源管理システム Download PDF

Info

Publication number
JP6179194B2
JP6179194B2 JP2013114904A JP2013114904A JP6179194B2 JP 6179194 B2 JP6179194 B2 JP 6179194B2 JP 2013114904 A JP2013114904 A JP 2013114904A JP 2013114904 A JP2013114904 A JP 2013114904A JP 6179194 B2 JP6179194 B2 JP 6179194B2
Authority
JP
Japan
Prior art keywords
sound
sound source
user
virtual
virtual speaker
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2013114904A
Other languages
English (en)
Other versions
JP2014236259A (ja
Inventor
桂樹 岡林
桂樹 岡林
拓郎 大谷
拓郎 大谷
洋平 関
洋平 関
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP2013114904A priority Critical patent/JP6179194B2/ja
Publication of JP2014236259A publication Critical patent/JP2014236259A/ja
Application granted granted Critical
Publication of JP6179194B2 publication Critical patent/JP6179194B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Stereophonic System (AREA)
  • Reverberation, Karaoke And Other Acoustics (AREA)

Description

本発明は、音源管理装置、音源管理方法、および音源管理システムに関する。
たとえば、ヘッドフォン再生などで、音の広がり感を出すために、頭部伝達関数(HRTF:Head−Related Transfer Function)を用いて、仮想音像定位を実現する仮想音像定位技術が知られている。
頭部伝達関数を用意するためには、仮想音像を定位させたい位置にスピーカを設置し、このスピーカから受聴者の外耳道入口まで頭部伝達関数を測定する。この頭部伝達関数は、フィルタを定義するが、そのフィルタを頭部伝達関数フィルタと呼ぶことにする。仮想音像を定位させたい位置に設置したスピーカは、頭部伝達関数を測定するときのみ用いられ、再生の際には、設置されない。再生には、入力信号を再生するための複数のスピーカのみが用いられる。ヘッドフォンの場合は、左右の2つのスピーカである。入力信号を頭部伝達関数フィルタを通すことにより、ヘッドフォンの2つのスピーカ間に仮想音像を定位させる。
しかし、仮想音像定位技術では、音源数に比例して処理量が増加してしまうことがあり、その解決方法として、仮想スピーカ方式が提案されている。仮想スピーカ方式とは、複数の音源を、方向が異なる仮想的に配置した仮想スピーカと呼ばれるスピーカに配分することで、音像定位を可能とする。また、音像の定位を強調するための処理をするために、音源それぞれに残響処理や頭部伝達関数畳み込み処理を施す技術が知られている。この技術では、仮想音像を定位させたい位置に設置したスピーカを用いて測定した頭部伝達関数フィルタを入力信号に畳み込んで再生することにより、仮想音像の定位精度を向上させることができる。このように仮想スピーカ方式では、仮想スピーカの数に比例するHRTF畳み込み処理を行うことで、音源数によらず仮想スピーカの数に比例する処理量だけで、音像定位を可能とする。
音像定位を実現する技術として、マルチチャンネル入力信号から音場の重心の方位と大きさを算出し、この算出した重心の方位と大きさに応じて重み係数を決定し、この決定した重み係数に基づいて仮想音像生成処理を行う技術が知られている。たとえば、ユーザの位置を中心として異なる半径の同心円で区切られる領域を想定し、重心の大きさがどの領域に位置するかによって、重心の大きさに関する重み係数を決定して、その重み係数を仮想音像を作る信号に掛けることによって、音像定位を可能とする。
また、予め位置を定めた複数の仮想スピーカと、音高とを対応させて、出力させたい音高には、その音高に対応した仮想スピーカの位置と実スピーカ位置との距離に応じた遅延や減衰を乗算して、仮想スピーカから出力することにより、実際のサイズよりも大きな音場の広がりを可能にする電子楽器が知られている。
さらに、ユーザと音像との距離を算出し、その距離に応じた係数に基づいてローパスフィルタを制御することによって、音像を定位させて立体的な音響効果を提供する立体音響処理装置が知られている。
特開2011−211312号公報 特開平8−50479号公報 特開平10−70796号公報
飯田他「方向知覚メカニズムに基づいたHRTFの物理評価指標」日本音響学会講演論文集pp.505−508(2008年9月)
しかしながら、頭部伝達関数を使って音像を定位させて立体的な音響効果を提供する立体音響処理装置、特に、サーバ−クライアント型の分散型の処理システムでは、音の距離感を表現しようとすると、仮想スピーカの数が多くなり、サーバ−クライアント間の通信量が増大してしまうという問題がある。また、一般に音の距離感を表現しようとするとき、アナウンスなどの特殊音源の定位のさせ方が知られていないという問題がある。
また、音の距離感を距離に応じたローパスフィルタを使って表現する手法も知られているが、この手法では、音源毎に頭部伝達関数を適用するため、音源数が増えるごとに処理量が増大してしまうという問題がある。特にモバイル端末など非力なプロセッサしか持たないコンピュータで立体音響の処理をすることが難しいという問題がある。
よって、一つの側面として、本発明は、音像定位システムにおいて、通信容量を増大させることなく、距離感の表現などの音の種類の特徴を付与することができる音源管理装置、音源管理方法、および音源管理システムを提供することを目的とする。
音の種類ごとに距離感を表現可能な音源管理装置が提供される。音源管理装置は、複数の音源から出力される音の各々を、ユーザの位置および姿勢に応じて、前記ユーザに対して異なる複数の方向および前記ユーザからの異なる複数の距離に仮想的に配置した複数の仮想スピーカに割り当てるゾーン集約部と、前記複数の前記仮想スピーカに割り当てられた前記音源から出力される前記音について、前記ユーザから前記仮想スピーカまでの距離が長くなればなるほど低いカットオフ周波数で高周波領域を減衰させる処理を施し、前記複数の前記仮想スピーカの各々に対して処理音を生成する音処理部と、前記複数の前記仮想スピーカの各々に対して生成された前記処理音について、前記複数の前記仮想スピーカのうち前記複数の方向のそれぞれの方向において前記複数の距離に仮想的に配置された前記仮想スピーカに対する前記処理音を集約してそれぞれの方向に対する複数の集約された処理音を生成する仮想スピーカ集約部と、前記ユーザの前記位置および前記姿勢に依存する頭部伝達関数を前記複数の集約された処理音に作用させることによって、前記ユーザに提供する複数のチャンネルの出力音を生成するクライアントに対して、前記複数の集約された処理音を送信する送信部と、を含むことを特徴とする。
音像定位システムにおいて、通信容量を増大させることなく、距離感の表現などの音の種類の特徴を付与することができる。
仮想スピーカ方式の概略を説明する図である。 仮想スピーカ方式を採用する音源管理システムの概略を説明する図である。 仮想スピーカ方式の原理の説明に用いられる図である。 仮想スピーカ方式を採用し音の距離感を表現可能な音源管理システムのサーバにおける処理を説明する図である。 頭部伝達関数における特徴的なピークを示す図である。 正中面における図5のピークの変化を示す図である。 距離に依存するカットオフ周波数の例について説明する図である。 距離によって変化する音量のゲインの例について説明する図である。 実施形態の音源管理システムのサーバの機能ブロック図の例である。 実施形態の音源管理システムのクライアントの機能ブロック図の例である。 各音源の配置例を示す図である。 ある時刻における音源テーブルの例を示す図である。 別の時刻における音源テーブルの例を示す図である。 仮想スピーカテーブルの例を示す図である。 音源管理装置の構成の例を示す図である。 音源管理方法の処理の流れの例を示すフローチャートである。 仮想スピーカテーブル更新処理における処理の流れの例を示すフローチャートである。 仮想スピーカレンダリング処理における処理の流れの例を示すフローチャートである。
以下、図面を参照しながら、一実施形態の音源管理システムおよび音源管理方法について説明する。
<全般的説明>
図1〜7Bを参照して、仮想スピーカ方式の概略および一実施形態の音源管理システムおよび音源管理方法について全般的な説明を行う。図1〜2では仮想スピーカ方式の概略を説明し、図3〜7Bでは、音の距離感を表現可能な一実施形態の音源管理システムおよび音源管理方法について説明する。一実施形態の音源管理システムおよび音源管理方法は、仮想スピーカ方式を用いつつ、処理量の増大を抑制しながら、音の距離感やアナウンスなどの特殊音源の効果も表現することができる音源定位システムおよび方法である。
図1は、仮想スピーカ方式の概略を説明する図である。
図1では、仮想スピーカ方式を用いる音源管理システムのユーザOを中心をする円上に複数の仮想スピーカ102、104、106、108、110、112、114、116が配置されている。仮想スピーカ102はユーザOから見て方向D0の位置に配置されている。この方向D0の向きを0度と定義する。仮想スピーカ104、106、108、110、112、114、116はそれぞれ、ユーザOから見て方向D1、D2、D3、D4、D5、D6、D7の方向に配置されている。方向D1、D2、D3、D4、D5、D6、D7は、方向D0と、時計回り方向に45度、90度、135度、180度、225度、270度、315度回転した方向である。
仮想スピーカ方式では、一般に、複数の音源から出力される音をある固定数の仮想スピーカに配分し、ユーザOの頭部姿勢と連動して、各仮想スピーカの音に頭部伝達関数(HRTF:Head−Related Transfer Function)を畳み込み、音像を定位させ、ユーザOに提示する。
このような仮想スピーカ方式を用いる音源管理システムは、たとえば美術館や展示会の会場などで、ユーザはヘッドフォンを装着し、そのヘッドフォンからは展示物の方向から音が聞こえるようにするために用いることができる。このような場所で仮想スピーカ方式を用いる音源管理システムを用いることによって、臨場感を失わずに、その場所にいるシステムのユーザに情報をクリアに伝達することができる。
図1において音源Pnは、2つの仮想スピーカ104、106に近い位置に配置されている。図1で音源Pnは、ユーザOから見て45度+αの方向に位置している。
仮想スピーカ方式では、音源位置と仮想スピーカの位置の距離に応じて、各仮想スピーカへの配分ゲインの重み付けを行う。たとえば、音源Pnからの距離が近い仮想スピーカほど、大きな配分ゲインが重み付けされても良い。
図1の例では、仮想スピーカ104、106に付与される音の重みをそれぞれ、W1、W2(0≦W1、W2≦1)とすると、
としても良い。
図1では、音源Pnから出力される音を2つの仮想スピーカに配分したが、任意の数の仮想スピーカに割り当てることができる。
音源数が増加しても、残響処理、HRTF畳み込み処理量は増えない。仮想スピーカの数だけで処理を済ますことができる。また、残響処理とHRTF畳み込み処理をする箇所を分割して処理することが可能である。
図2は、仮想スピーカ方式を採用する音源管理システムの概略を説明する図である。
図2に示されている音源管理システムは、サーバ200とクライアント300を含んでいる。サーバ200は音源管理装置200とも呼ばれる。クライアント300はたとえば、モバイル端末であり得る。クライアント300にはセンサ群が接続され、センサ群で計測されたクライアント300に付属のヘッドフォンを装着しているユーザの位置、姿勢に関する情報は、クライアント300の位置・姿勢推定部306に入力される。ここでは、ユーザは左右2チャンネルのヘッドフォンを装着するとしたが、一般のnチャンネル音響システムであっても良い。
サーバ200は、音源データ202、仮想スピーカ集約部204、残響付加部206を含んでいる。音源データ202は、たとえば複数の音源から出力される音に関する情報が格納されている。音源データ202に格納されている音に関する情報は、仮想スピーカ集約部204に送られ、固定数の仮想スピーカに割り当てられる。
このとき仮想スピーカ集約部204は、クライアント300の位置・姿勢推定部306に入力されるユーザの位置、姿勢に関する情報を参照しても良い。ユーザの位置、姿勢が変化することによって、ある音源から出力される音の仮想スピーカへの割り当て方が変化する。
このように音源から出力される音を、ある固定数の仮想スピーカに割り当てることによって、処理量、通信量の爆発を防ぐことができる。仮想スピーカ集約部204で仮想スピーカの数のチャンネルに集約された音に関する情報は、残響付加部206で残響の処理が施される。一般に、残響付加をすることで音像の定位感や音の広がり感が増すという効果を奏する。
残響付加部206で残響を付加する処理が行われた音に関する情報は、ストリーム通信によって、クライアント300に送られる。残響付加部206から出力される音に関する情報のチャンネル数は、仮想スピーカの数に等しい。
クライアント300は、HRTF畳込み部302、ミキシング部304、および前述のように位置・姿勢推定部306を含んでいる。
サーバ200の残響付加部206から送られた音に関する情報には、HRTF畳込み部302で、クライアント300の位置・姿勢推定部306に入力されるユーザの位置、姿勢に関する情報を参照して入力された音像の定位角度に対応するHRTFが畳み込まれる。つまり、各仮想スピーカに対応するチャンネルの音に関する情報に、仮想スピーカの方向に対応するHRTFが畳み込まれる。ミキシング部304では、HRTF畳込み部302の出力を、右耳に対応する右チャンネルと左耳に対応する左チャンネルの出力にミキシングする。ミキシング部304で左右2チャンネルにミキシングされた音に関する情報は、ミキシング部304からユーザが装着しているヘッドフォンに出力される。
図3は、音の距離感を表現可能な仮想スピーカ方式の原理の説明に用いられる図である。
図3には、先に述べた仮想スピーカ方式を用いる音源管理システムにおいて、
(a)ユーザの周囲の空間を、リスナーと音源との距離によって区分される同心円状に複数のゾーンに分け、
(b)音源の種類によってゾーンを分ける
(c)それぞれのゾーン別にフィルタ処理や仮想スピーカへの配分を変える、
(d)最後に同じ方向の仮想スピーカ同士をミキシングし、クライアントに伝送する、
ことによって距離感を表現するシステムの概略が示されている。
図3では、ユーザOを中心とする空間は、ユーザOとの距離が長い順に、同心円状のゾーンZ3〜Z5に分けられている。ユーザOとの距離が一番短いゾーンZ5は「近距離ゾーン」、次に距離が短いゾーンZ4は「中距離ゾーン」、ユーザOとの距離が一番長いゾーンZ3は、「長距離ゾーン」と呼ぶことがある。図3では、距離に依存して、「近距離ゾーン」、「中距離ゾーン」、「長距離ゾーン」の3つのゾーンが存在するが、3つでなくても任意の数で構わない。長距離ソーンの外には、アナウンス音のゾーンZ2、指示音のゾーンZ1が存在する。ここで、アナウンス音とは、たとえば、会場全体に流れる案内であり得る。迷子の知らせ、遺失物の案内から、火災など緊急時の避難誘導案内などであり得る。一般に、アナウンス音は、たとえば天井のある展示会場など閉じた空間では、スピーカの特性上、低域が減衰する。指示音は、たとえば、耳元でささやかれているような音である。
図3では仮想スピーカは、ユーザOから見て8つの方向、すなわち方向D0〜D7の方向に配置されている。この方向D0〜D7は図1に示されている方向と同一である。また仮想スピーカは、各方向には、ユーザOからの距離によって区分されるゾーンごとに配置されている。
たとえば、方向D1では、ゾーンZ1には仮想スピーカ402aが、ゾーンZ2には仮想スピーカ404aが、ゾーンZ3には仮想スピーカ406aが、ゾーンZ4には仮想スピーカ408aが、ゾーンZ5には仮想スピーカ410aが配置されている。また、方向D2では、ゾーンZ1には仮想スピーカ402bが、ゾーンZ2には仮想スピーカ404bが、ゾーンZ3には仮想スピーカ406bが、ゾーンZ4には仮想スピーカ408bが、ゾーンZ5には仮想スピーカ410bが配置されている。同様に、方向D7では、ゾーンZ1には仮想スピーカ402hが、ゾーンZ5には仮想スピーカ410hが配置されている。
音の距離感を表現可能な仮想スピーカ方式では、音源から出力された音を、図3に示されているような各方向の各ゾーンに配置された仮想スピーカに配分し、その後同じ方向同士の音に関する情報をミキシングし、図1に示されているような各方向に1つ配置される仮想スピーカに集約する。
図4は仮想スピーカ方式を採用し音の距離感を表現可能な音源管理システムのサーバにおける処理を説明する図である。
図4に示されているように、音の距離感を表現可能な音源管理システムのサーバ500は、音源データ格納部502、第1仮想スピーカ集約部504、音処理部506、第2仮想スピーカ集約部508を含んでいる。このサーバ500は、図2に示されているサーバ200の代替として使用され、クライアント300に接続される。サーバ500は音源管理装置500とも呼ばれる。第1仮想スピーカ集約部504、第2仮想スピーカ集約部508は、クライアント300の位置・姿勢推定部306に入力されるユーザの位置、姿勢に関する情報を参照し得る。
音源データ格納部502には、音源から出力された音に関する情報や、ユーザと音源の相対的位置関係に関する情報などが格納されている。これらの情報をまとめて音源データを呼ぶ。音源データの例は、後述する図10Aや図10Bに示されている。
第1仮想スピーカ集約部504は、音源から出力された音を、各ゾーンに配置された仮想スピーカに分配する。
第2仮想スピーカ集約部508は、各ゾーンに配置された仮想スピーカに分配された音に関する情報を、各方向に1つ配置される仮想スピーカに集約する。
音処理部506では、
(C1)距離感を表現するために仮想スピーカからの出力される通常音の高周波成分を距離に依存するカットオフ周波数を用いてカットする、距離に依存して音の大きさ(音量)を減衰させる、反響処理を行う、
(C2)アナウンス音は全体に分配した上で、仮想スピーカからの出力音の低周波成分をカットする、反響処理を行う、
(C3)指示音は、アナウンス音同様に全体に分配した上で反響処理を行わない、
という処理を行う。これらの処理は全て行う必要はなく、必要に応じて、その一部を行っても良い。すなわち、音処理部506では、入力された音に関する情報に対して、必要に応じて、フィルタ処理、反響処理を行う。
ここで人の聴覚特性について簡単に説明する。
図5は、頭部伝達関数における特徴的なピークを示す図、図6は正中面における図5のピークの変化を示す図である。図6は、図5の角度依存性を示している。図5および図6は、非特許文献1から引用したものである。
人は、周波数20Hzから20kHzまでの音を聴くことができるといわれている。すなわち、人の聴覚の周波数特性は20Hz〜20kHzである。
図5から分かるように、前後上下の正中面知覚は、図5に示されている頭部伝達関数の周波数特性における第1ノッチN1と第2ノッチN2が深く関与している。第1ノッチN1は、6.2kHz〜9.6kHz、第2ノッチN2は8.2kHz〜12.4kHzに分布している。
また、図6から分かるように、たとえば、人の前方定位には約12kHzまでの周波数が重要であり、この周波数領域の音を減衰させないようにフィルタ係数を定める必要がある。
ここで、音処理部506で行われる処理について簡単に説明する。
音処理部506では、アナウンス音、指示音以外の音については、距離感を表現するために、距離に依存するカットオフ周波数を有するフィルタを用いて高周波領域を減衰させる。
フィルタは、ユーザOと音源の距離が大きいほど高域が減衰するように設定される。またフィルタの設定では、正中面の定位に重要な第1ノッチN1と第2ノッチN2をつぶさないようにする。そのために音処理部506では、第2ノッチN2の周波数の最大値(12kHz)と可聴域の最大値(20kHz)の間で仮想スピーカのゾーン数と等しい数のカットオフ周波数を決定する。
図7Aは、距離に依存するカットオフ周波数の例について説明する図である。
カットオフ周波数は音圧が低周波領域より−3dBとなる周波数で定義する。図7Aでは、図3の近距離ゾーンZ5に対するカットオフ周波数は18.5kHz、中距離ゾーンZ4に対するカットオフ周波数は15.5kHz、長距離ゾーンZ3に対するカットオフ周波数は13kHzである例が示されている。
このように音処理部506で、仮想スピーカからの出力音の高周波成分を距離に依存するカットオフ周波数を用いてカットすることによって、定位感を損なわずに、距離感を表現することができる。
また、アナウンス音については、たとえば1kHz以下の低周波成分をカットしても良い。または、5kHz、10kHzなど1kHzより高いカットオフ周波数を用いてもよいし、0.5kHzなど1kHzより低いカットオフ周波数を用いてもよい。アナウンス音の低周波成分をカットする目的は、本来アナウンス音は、天井スピーカなど小径で低音が出ないスピーカから発せられることが多いため、低周波成分をカットすることにより、より現実に近い音になるからである。
一般に音は、音源からの距離が長くなればなるほど、大きさが減衰する。物理的には音の減衰は距離の2乗に反比例する。音の減衰に関する人の感度は物理特性よりも鈍い。従って、各距離の音量のゲインを距離に反比例するように設定する。たとえば、ゲインをG、音源からの距離をd、調整用ゲインをaとして、
とする。
図7Bは距離によって変化する音量のゲインの例について説明する図である。
図7Bに示されているように、距離に反比例するゲインを用いて、音量を減衰させる。
このように音の距離感を表現可能な音源管理システムは、仮想スピーカを多重化し音源の特徴(カテゴリ)毎に音を集約することを特徴とする。音の種類、ユーザからの距離など音源の特徴毎にゾーンに分け、適合するゾーンへ音源から出力された音を集約する。仮想スピーカに対して集約された音に対して、音の種類、ユーザからの距離など音源の特徴を強調する演算を行い、最終的には方向が一致するゾーン同志をミキシングして、各方向に1つの仮想スピーカを生成する。生成された仮想スピーカの音に関する情報はクライアント300にストリーム通信される。端末に送るストリームの数はサーバ200を用いた場合と変わらないため、通信量を増大させることなく、たとえば、距離感の表現など各音源への特徴付けが実現可能となる。
<音源管理システム>
図8A〜図12を参照して、音源管理システムについて説明する。
以下では、サーバ−クライアント型の仮想スピーカ方式による音像定位システムであって、ユーザの周囲の空間を同心円状に複数のゾーンに分け、ゾーン毎に仮想スピーカを配分し、音源の種類(カテゴリ)によってゾーンを対応付けるように構成し、ユーザからの距離は、仮想スピーカ音にローパスフィルタ処理および増幅器により大きさの増減を行う事で表現するとともに、アナウンス音や指示音は無定位で分配し、最後に同じ方向の仮想スピーカ同士をミキシングし、クライアント端末に伝送するシステムが開示される。
音源管理システムは、サーバ600およびクライアント700を含む。
音源管理システムのサーバ600は、ユーザの位置と音源の関係が変化する毎に仮想スピーカテーブルを更新しながら動作する。更新された仮想スピーカテーブルからカテゴリ分けされた各ゾーンの仮想スピーカへのレンダリングが行われる。距離ゾーンに関しては、音源管理テーブルには距離ゾーンを総称する記号Zdが書いてあり、ユーザ位置と音源位置の関係が変化する毎に、あらかじめ設定された、近距離判定、中距離判定の閾値を参照して、それぞれのゾーン、すなわち近距離ゾーンZn、中距離ゾーンZm、長距離ゾーンZfを決定する。各ゾーンの仮想スピーカへのレンダリングを行った後に各ゾーンを一組の仮想スピーカにミキシングし送信部よりストリーム通信する。各処理は音声フレーム単位で行われる。
音源管理システムのクライアント700では、ストリーム通信により送られてきた各仮想スピーカ毎音声フレームに対して、ユーザ姿勢に応じて各仮想スピーカの方向を確定しHRTFをそれぞれ適用することにより各仮想スピーカをユーザの周囲に音像定位させる。これらの処理を連続的に動作させることにより、ユーザの位置や頭部姿勢に即座に連動することが可能になる。
図8Aは、実施形態の音源管理システムのサーバ600の機能ブロック図の例である。サーバ600は、音源データ格納部602、ゾーン集約部604、フィルタ処理部606、反響処理部608、仮想スピーカ集約部610、およびストリーム送信部612を含む。サーバ600は音源管理装置600とも呼ばれる。
図8Bは、実施形態の音源管理システムのクライアント700の機能ブロック図の例である。クライアント700は、ユーザOに装着されるヘッドフォンまたはイヤホンと、ユーザOの位置や向きを測定するセンサを含むヘッドセット714を含んでいる。また、クライアント700は、ユーザ情報送信部702、頭部姿勢位置測定部704、ストリーム受診部706、hrtf適用処理部708、hrtf格納部710、ミキシング処理部712を含む。
音源データ格納部602は、図4のサーバ500の音源データ502と同一または類似の構成を有している。音源データ602は、たとえば複数の音源から出力される音に関する情報や、音源のユーザOとの相対位置に関する情報を含む。各音源は、各音源から出力される音を仮想スピーカに割り当てるためや、距離感を表現するためのフィルタ処理の際のカットオフ周波数、ゲインを決定するために、仮想スピーカとの相対位置が決められている。音源と仮想スピーカとの相対位置を決定するためには、ユーザOの位置、向きに関する情報が必要である。これらの情報は、クライアント700のヘッドセット714に含まれるセンサによって取得され、クライアント700のユーザ情報送信部702から送られたものを用いても良い。クライアント700のユーザ情報送信部702から送られたユーザOの位置、向きに関する情報は、不図示のユーザ情報受信部で受信され、音源データ格納部602に格納されても良い。ユーザOの位置、向きに関する情報は、「位置情報」と呼ばれることもある。
図9は、各音源の配置例を示す図である。
本例では、図9に示されているように、ユーザOがいる空間は、ユーザOからの近距離判定距離R1だけ離れた位置に設定される距離小の境界B1と、ユーザOからの中距離判定距離R2だけ離れた位置に設定される距離中の境界B2によって区分けされている。距離小の境界B1よりユーザに近い領域には、音源S1、S5が配置されている。図9に示されているように、音源S1は、ユーザOのほぼ正面方向、ユーザOの正面から時計回り方向に約15度の方向に配置されており、音源S5はユーザOの正面から時計回り方向に約270度の方向に配置されている。音源S2とS8は、距離小の境界B1と距離中の境界B2の間に配置されている。音源S2は、ユーザOの正面から時計回り方向に約90度の方向に配置されている。音源S8は、ユーザOの正面から時計回り方向に約335度の方向に配置されている。音源S3、S7は、ユーザOから見て距離中の境界B2より遠い位置に配置されている。音源S3は、ユーザOの正面から時計回り方向に約10度の方向に配置されている。音源S7は、ユーザOの正面から時計回り方向に約120度の方向に配置されている。
図10Aは、ある時刻t=T1における音源テーブルの例を示す図であり、図10Bは別の時刻t=T2における音源テーブルの例を示す図である。
図10A、10Bに示されているように、音源データ格納部602に格納される音源テーブルは、音源の音源番号、配置されている場所のゾーン、音源の位置座標を含んでいる。これらの音源に関する情報が変更されたか否かに関する情報は、「音源更新情報」とも呼ばれる。図10A、10Bで位置は、(x、y、z)の3次元座標で表される。ここで、x−y平面は、音源が配置されている空間の底面と水平な平面で、たとえば、x軸の正の方向を図1のD2方向と並行な方向、y軸の正の方向を図1のD0方向と平行な方向としても良い。z軸は、x−y平面の法線方向に平行な方向であっても良い。図10A、10Bにおいて、近距離ゾーンはZn、中距離ゾーンはZm、長距離ゾーンはZfで表されている。記号Zdは、距離ゾーンを総称する記号である。
図10A、10Bでは、音源の位置は音源が配置されている空間に付与されている座標であり、ユーザOに対する相対座標ではない。たとえば、音源S1の座標は(5.6、2.3、1.5)であり、これは図10Aに示されている時刻t=T1の場合でも、図10Bに示されている時刻t=T2の場合でも変わらない。しかし、ユーザOは同じ場所にとどまってはいないので、音源テーブルは時々刻々とアップデートされる。たとえば、時刻t=T1で音源S1には、距離ゾーンを総称する記号Zdが付与されている。しかし、時刻t=T2で音源S1は、ユーザOに対して近距離ゾーンZnに属している。
音源データ格納部602は、格納している音源テーブルに含まれる情報が更新されたた否かに関する情報である音源更新情報を定期的、または連続的にチェックし、音源更新情報に変更があると、処理を開始しても良い。また、音源データ格納部602は、ユーザの位置に関する情報、すなわち「位置情報」をチェックし、位置情報に変更があると、処理を開始しても良い。
ゾーン集約部604は、図4のサーバ500の第1仮想スピーカ集約部504と同一または類似の構成を有している。ゾーン集約部604は、複数の音源から出力された音のそれぞれを、各ゾーンに配置された仮想スピーカに分配、レンダリングする。このようにゾーン集約部604は、複数の音源から出力される音の各々を、ユーザの位置および姿勢に応じて、ユーザに対して異なる複数の方向および前記ユーザからの異なる複数の距離に仮想的に配置した複数の仮想スピーカに割り当てる。音の種類は、無指向性のアナウンス音、ユーザに対して直接音として提供される指示音、ならびにアナウンス音および指示音以外の通常音を含み得る。
フィルタ処理部606は、距離感を表現するために仮想スピーカからの出力音の高周波成分を距離に依存するカットオフ周波数を用いてカットする処理(上記(C1))と、距離に依存して音の大きさ(音量)を減衰させることによって表現することや、アナウンス音を全体に分配した上で、仮想スピーカからの出力音の低周波成分をカットする処理(上記(C2))や、指示音を全体に分配する処理(上記(C3))を行う。適用されるフィルタの周波数特性は、たとえば、図7Aに示されているように、距離に依存するカットオフ周波数を用いて、高周波成分をカットする。このような処理を行うために、フィルタ処理部606は、複数の仮想スピーカの各々に割り当てられた音源から出力される通常音の、ユーザから複数の仮想スピーカの各々までの距離に依存するカットオフ周波数より高い周波数を有する高周波数成分を減衰させるローパスフィルタを含んでいてもよい。ここで、カットオフ周波数は、頭部伝達関数の周波数特性において前方定位に必要な周波数を避けて設定され得る。
また、音の大きさを減衰させる処理では図7Bに示されているように、距離に応じたゲインを用いても良い。音の大きさを減衰させる処理を行うために、フィルタ処理部606は増幅器を含んでいても良い。増幅器は、複数の仮想スピーカの各々に割り当てられた音源から出力される通常音を、ユーザから複数の仮想スピーカの各々までの距離に依存するゲインを有しても良い。
反響処置部608は、閉じた空間で発せられる指示音以外の音に対して、オリジナルの音の時間をずらしたディレイ音をオリジナルの音に重ねるなどによって、反響の効果を付与する。
フィルタ処理部606と反響処置部608は組み合わされて音処理部614を構成する。音処理部614は、図4のサーバ500の音処理部506と同一または類似の機能を有する。音処理部614は、複数の仮想スピーカに割り当てられた音源から出力される通常音について、ユーザから仮想スピーカまでの距離が長くなればなるほど低いカットオフ周波数で高周波領域を減衰させる処理を施し、複数の仮想スピーカの各々に対して処理音を生成する。音の種類は、無指向性のアナウンス音、ユーザに対して直接音として提供される指示音、ならびにアナウンス音および指示音それ以外の通常音を含む。音の処理としては、上述のように、通常音に対して、ユーザから複数の仮想スピーカの各々までの距離に依存するカットオフ周波数より高い周波数を有する高周波数成分を減衰させたり、音の大きさを減衰させたり、アナウンス音は全体に分配した上で、仮想スピーカからの出力音の低周波成分をカットしたりすることを含む。また、通常音およびアナウンス音に対しては、反響処理を行っても良い。反響処理とは、閉じた空間で発せられる指示音以外の音に対して、オリジナルの音の時間をずらしたディレイ音をオリジナルの音に重ねるなどによって、反響の効果を付与する処理であり得る。
仮想スピーカ集約部610は、図4のサーバ500の第2仮想スピーカ集約部508と同一または類似の構成を有している。仮想スピーカ集約部610は、各ゾーンに配置された仮想スピーカに分配された音に関する情報を、各方向に1つ配置される仮想スピーカに集約する。すなわち仮想スピーカ集約部610は、複数の仮想スピーカの各々に対して生成された処理音について、複数の仮想スピーカのうち複数の方向のそれぞれの方向において複数の距離に仮想的に配置された仮想スピーカに対する処理音を集約してそれぞれの方向に対する複数の集約された処理音を生成する。
図11は、仮想スピーカ集約部610の処理の結果として得られる仮想スピーカテーブルの例を示す図である。
仮想スピーカテーブルは、図1に示されているように、各方向に1つ配置される仮想スピーカに集約される音源に関する情報が含まれている。
図11では、仮想スピーカの角度ごとに、近距離ゾーン、中距離ゾーン、長距離ゾーン、アナウンスゾーン、指示音ゾーンが設定され、ゾーンごとに、属する音源の音源番号と配分されるゲインが示されている。
たとえば、図11では、ユーザOの正面方向、すなわち仮想スピーカ角度=0度の方向には、アナウンスゾーン(Za)に音源番号S6の音源と、指示音ゾーン(Zw)に音源番号S4の音源が存在する。そして、音源番号S6の音源に配分されるゲインも、音源番号S4の音源に配分されるゲインも、0.125であることが示されている。
また、音源番号S3の音源は中距離ゾーンZmに配置され、ユーザOから見てD1方向、すなわち仮想スピーカ角度=45度の方向の仮想スピーカと、ユーザOから見てD2方向、すなわち仮想スピーカ角度=90度の方向の仮想スピーカにそれぞれ、配分ゲインが0.1と0.9で配分されることが示されている。
ストリーム送信部612は、仮想スピーカ集約部610で各方向に1つ配置される仮想スピーカ向けに集約された音の情報を含むストリームを、クライアント700に向けて送信する。ストリーム送信部612は、集約された処理音に、ユーザの位置および姿勢に依存する頭部伝達関数を作用させることによって、ユーザに提供する複数のチャンネルの出力音を生成するクライアントに複数の集約された処理音を送信する。ストリーム送信部612は単に送信部612として参照されることがある。
クライアント700では、集約された処理音に、ユーザの位置および姿勢に依存する頭部伝達関数を作用させることによって、ユーザに提供する複数のチャンネルの出力音を生成する。複数のチャンネルとは、左右の2チャンネルであり得る。
クライアント700のストリーム受信部706では、サーバ600のストリーム送信部612から送られたストリームを受信する。
ユーザに装着されたヘッドセット714のセンサで取得されたユーザOの位置、向きに関する情報は、頭部姿勢位置計測部704に送られ、数値化される。数値化されたユーザOの位置、向きに関する情報は、クライアント700のユーザ情報送信部702からサーバ600に向けて送信され得る。
ストリーム受信部706で受信された、方向ごと、たとえば図1の方向D0〜D7のそれぞれの方向に対する音の情報は、hrtf適用処理部708に送られ、各仮想スピーカに対応する音に関する情報に、仮想スピーカの方向に対応するHRTFが畳み込まれる。
hrtf適用処理部708は、図2のクライアント300のHRTF畳込み部302と同一または類似の構成を有している。
ミキシング処理部712は、図2のクライアント300のミキシング部304と同一または類似の構成を有している。ミキシング処理部712では、hrtf適用処理部708の出力を、右耳に対応する右チャンネルと左耳に対応する左チャンネルの出力にミキシングする。
このように構成された仮想スピーカ方式を用いた立体音響再生システム(音源管理システム)では、処理量の増大を最小にしながら、音の距離感やアナウンスなどの特殊音源の効果も表現することができる。
このように音の距離感を表現可能な音源管理システムは、仮想スピーカを多重化し音源の特徴(カテゴリ)毎に音を集約することを特徴とする。音の種類、ユーザからの距離など音源の特徴毎にゾーンに分け、適合するゾーンへ音源から出力された音を集約する。仮想スピーカに対して集約された音に対して、音の種類、ユーザからの距離など音源の特徴を強調する演算を行い、最終的には方向が一致するゾーン同志をミキシングして、各方向に1つの仮想スピーカを生成する。生成された仮想スピーカの音に関する情報はクライアント700にストリーム通信される。このように上述の音源管理システムは、音源の数が増えても、通信量を増大させることなく、各音源への特徴付けが実現可能となる。
図12は、実施形態の音源管理装置600の構成の例を示す図である。音源管理装置600は、汎用コンピュータ800として実現され得る。
このコンピュータ800は、MPU802、ROM804、RAM806、ハードディスク装置808、入力装置810、表示装置812、インタフェース装置814、及び記録媒体駆動装置816を備えている。なお、これらの構成要素はバスライン820を介して接続されており、MPU802の管理の下で各種のデータを相互に授受することができる。
MPU(Micro Processing Unit)802は、このコンピュータ800全体の動作を制御する演算処理装置であり、コンピュータ800の制御処理部として機能する。
ROM(Read Only Memory)804は、所定の基本制御プログラムが予め記録されている読み出し専用半導体メモリである。MPU802は、この基本制御プログラムをコンピュータ800の起動時に読み出して実行することにより、このコンピュータ800の各構成要素の動作制御が可能になる。
RAM(Random Access Memory)806は、MPU802が各種の制御プログラムを実行する際に、必要に応じて作業用記憶領域として使用する、随時書き込み読み出し可能な半導体メモリである。
ハードディスク装置808は、MPU802によって実行される各種の制御プログラムや各種のデータを記憶しておく記憶装置である。MPU802は、ハードディスク装置208に記憶されている所定の制御プログラムを読み出して実行することにより、後述する各種の制御処理を行えるようになる。
入力装置810は、例えばマウス装置やキーボード装置であり、音源管理装置600のユーザにより操作されると、その操作内容に対応付けられている各種情報の入力を取得し、取得した入力情報をMPU802に送付する。
表示装置812は例えば液晶ディスプレイであり、MPU802から送付される表示データに応じて各種のテキストや画像を表示する。
インタフェース装置814は、このコンピュータ800に接続される各種機器との間での各種情報の授受の管理を行う。
記録媒体駆動装置816は、可搬型記録媒体818に記録されている各種の制御プログラムやデータの読み出しを行う装置である。MPU802は、可搬型記録媒体818に記録されている所定の制御プログラムを、記録媒体駆動装置816を介して読み出して実行することによって、後述する各種の制御処理を行うようにすることもできる。なお、可搬型記録媒体818としては、例えばUSB(Universal Serial Bus)規格のコネクタが備えられているフラッシュメモリ、CD−ROM(Compact Disc Read Only Memory)、DVD−ROM(Digital Versatile Disc Read Only Memory)などがある。
このようなコンピュータ800を用いて音源管理装置600(サーバ600)を構成するには、例えば、上述の各処理部における処理をMPU202に行わせるための制御プログラムを作成する。作成された制御プログラムはハードディスク装置808若しくは可搬型記録媒体218に予め格納しておく。そして、MPU802に所定の指示を与えてこの制御プログラムを読み出させて実行させる。こうすることで、音源管理装置600が備えている機能がMPU802により提供される。
<音源管理方法の処理>
図13〜15を参照しながら、音源管理方法の処理について説明する。
また、音源管理装置600(サーバ600)が図12に示されているような汎用コンピュータ800である場合には、下記の説明は、そのような処理を行う制御プログラムを定義する。すなわち、以下では、下記に説明する処理を汎用コンピュータに行わせる制御プログラムの説明でもある。
図13は、音源管理方法の処理の流れの例を示すフローチャートである。
処理が開始されると、S102で音源管理システムの音源管理装置600(サーバ600)の音源データ格納部602は、音源テーブルの位置情報、音源変更情報をチェックする。本ステップの処理が終了すると、処理はS104に進む。
S104で音源管理システムの音源管理装置600の音源データ格納部602は、位置情報、音源変更情報に更新があるかを判定する。もし、この判定の結果が”yes”、すなわち位置情報、音源変更情報に更新がある場合には、S106に進む。また、この判定の結果が”no”、すなわち位置情報、音源変更情報に更新がない場合には、S108に進む。
S106で音源管理装置600のゾーン集約部604は、仮想スピーカテーブル更新処理を行う。
仮想スピーカテーブル更新処理について、図14を参照しながら説明する。
図14は、仮想スピーカテーブル更新処理における処理の流れの例を示すフローチャートである。
処理が開始されると、S202で音源管理装置600のゾーン集約部604は、音源データ格納部602に格納されている音源テーブルを読み込む。そして、音源テーブルを表すインデックスのリセットも行う。本ステップの処理が終了すると、処理はS204に進む。
S204で音源管理装置600のゾーン集約部604は、音源テーブルのインデックスを1つ進める。本ステップの処理が終了すると、処理はS206に進む。
S206で音源管理装置600のゾーン集約部604は、ユーザの位置(ユーザ位置)と音源の位置(音源位置)から距離ゾーンの振り分けを行う。たとえば、音源管理装置600のゾーン集約部604は、図10A、10Bに例が示されている音源テーブルを参照して、現在のインデックスで指定される音源からの出力音を適切な配分ゲインで距離ゾーンに振り分ける。配分ゲインは、たとえば上記[数1]のように決定しても良いし、別の方法で決定しても良い。本ステップの処理が終了すると、処理はS208に進む。
S208で音源管理装置600のゾーン集約部604は、音源データ格納部602に格納されている仮想スピーカテーブルの更新をする。本ステップの処理が終了すると、処理はS208に進む。
S210で音源管理装置600のゾーン集約部604は、音源を示すインデックスについて、最後のインデックスかどうかを判定する。もし、この判定の結果が”yes”、すなわち現在のインデックスが最後のインデックスである場合には、仮想スピーカテーブル更新処理を終了する。また、この判定の結果が”no”、すなわち現在のインデックスが最後のインデックスでない場合には、S204に進む。
図13に戻り、S106での音源管理装置600のゾーン集約部604による仮想スピーカテーブル更新処理が終了すると、S108に進む。
S108で音源管理装置600の音源管理装置600の音処理部614と仮想スピーカ主役部612は、仮想スピーカレンダリング処理を行う。
仮想スピーカレンダリング処理について、図15を参照しながら説明する。
図15は、仮想スピーカレンダリング処理における処理の流れの例を示すフローチャートである。
仮想スピーカレンダリング処理が開始されると、S302で音源管理装置600の音処理部614は、サンプルカウンタリセットを行う。すなわち、サンプルカウンタをsampleとすると、sample=0とする。本ステップの処理が終了すると、処理はS304に進む。
S304で音源管理装置600の音処理部614は、仮想スピーカインデックスのリセットを行う。すなわち、仮想スピーカインデックスをvspnとすると、vspn=0とする。本ステップの処理が終了すると、処理はS306に進む。
S306で音源管理装置600の音処理部614は、音源データ格納部602に格納されている、現在のvspnの値が示す仮想スピーカテーブルの情報を参照する。本ステップの処理が終了すると、処理はS308に進む。
S308で音源管理装置600の音処理部614は、仮想スピーカテーブルの情報に従ってレンダリングをする。
より具体的には、音処理部614のフィルタ処理部606は、
(C4)距離感を表現するために仮想スピーカからの出力音の高周波成分を距離に依存するカットオフ周波数を用いてカットすることと、距離に依存して音の大きさ(音量)を減衰させる、
(C5)アナウンス音について、仮想スピーカからの出力音の低周波成分をカットする、
という処理を行う。(C4)の処理では、空間をユーザからの距離に依存して3つのゾーン、すなわち、近距離ゾーン、中距離ゾーン、長距離ゾーンに分割し、近距離ゾーンに対するカットオフ周波数は18.5kHz、中距離ゾーンに対するカットオフ周波数は15.5kHz、長距離ゾーンに対するカットオフ周波数は13kHzとしても良い。
アナウンス音については、たとえば1kHz以下の低周波成分をカットしても良い。または、5kHz、10kHzなど1kHzより高いカットオフ周波数を用いてもよいし、0.5kHzなど1kHzより低いカットオフ周波数を用いてもよい。
また、音処理部614の反響処理部608は、
(C6)閉じた空間で発せられる指示音以外の音に対して、オリジナルの音の時間をずらしたディレイ音をオリジナルの音に重ねるなどによって、反響の効果を付与する。
という反響処理を行う。
このようにS308で音源管理装置600の音処理部614は、仮想スピーカに対して集約された音に対して、音の種類、ユーザからの距離など音源の特徴を強調する演算を行う。このように処理することによって、音源の数が増加しても、通信量は増加しない。
S308の処理が終了すると、処理はS310に進む。
S310で音源管理装置600の音処理部614は、vspnの値の更新を行う。たとえば、vspnの値を1だけ増加させる。本ステップの処理が終了すると、処理はS312に進む。
S312で音源管理装置600の音処理部614は、全ての仮想スピーカを処理したかを判定する。もし、この判定の結果が”yes”、すなわち全ての仮想スピーカを処理した場合には、S314に進む。また、この判定の結果が”no”、すなわち全ての仮想スピーカを処理していない場合には、S306に戻る。
S314で音源管理装置600の音処理部614は、sampleの値の更新を行う。たとえば、sampleの値を1だけ増加させる。本ステップの処理が終了すると、処理はS316に進む。
S316で音源管理装置600の仮想スピーカ集約部612は、フレームサイズを超えたかを判定する。もし、この判定の結果が”yes”、すなわち、フレームサイズを超えた場合には、仮想スピーカレンダリング処理を終了する。また、この判定の結果が”no”、すなわちフレームサイズを超えていない場合には、S304に戻る。
図13に戻って、音源管理装置600の音処理部614によるS108の仮想スピーカレンダリング処理が終了すると、S110に進む。
S110で音源管理装置600のストリーム送信部612は、1フレーム分ストリーム送信をする。本ステップの処理が終了すると、処理はS112に進む。
S112で音源管理装置600のストリーム送信部612は、クライアントから配信停止指示があるか否かを判定する。もし、この判定の結果が”yes”、すなわち、クライアントから配信停止指示がある場合には、処理を終了する。また、この判定の結果が”no”、すなわちクライアントから配信停止指示がない場合には、S102に戻る。
このような処理によって、音源の数が増えても、通信量を増大させることなく、各音源への特徴付けが実現可能となる。
以上の実施形態に関し、さらに以下の付記を開示する。
(付記1)
複数の音源から出力される音の各々を、ユーザの位置および姿勢に応じて、前記ユーザに対して異なる複数の方向および前記ユーザからの異なる複数の距離に仮想的に配置した複数の仮想スピーカに割り当てるゾーン集約部と、
前記複数の前記仮想スピーカに割り当てられた前記音源から出力される前記音について、前記ユーザから前記仮想スピーカまでの距離が長くなればなるほど低いカットオフ周波数で高周波領域を減衰させる処理を施し、前記複数の前記仮想スピーカの各々に対して処理音を生成する音処理部と、
前記複数の前記仮想スピーカの各々に対して生成された前記処理音について、前記複数の前記仮想スピーカのうち前記複数の方向のそれぞれの方向において前記複数の距離に仮想的に配置された前記仮想スピーカに対する前記処理音を集約してそれぞれの方向に対する複数の集約された処理音を生成する仮想スピーカ集約部と、
前記ユーザの前記位置および前記姿勢に依存する頭部伝達関数を前記複数の集約された処理音に作用させることによって、前記ユーザに提供する複数のチャンネルの出力音を生成するクライアントに対して、前記複数の集約された処理音を送信する送信部、
を含む音源管理装置。
(付記2)
前記音処理部は、前記カットオフ周波数を、頭部伝達関数の周波数特性において前方定位に必要な周波数を避けて設定する付記1に記載の音源管理装置。
(付記3)
前記音処理部は、前記複数の前記仮想スピーカの各々に割り当てられた前記音源から出力される前記音を、前記ユーザから前記前記複数の前記仮想スピーカの各々までの距離に依存するゲインを有する増幅器を含む、付記1または2に記載の音源管理装置。
(付記4)
前記音処理部は、前記複数の前記仮想スピーカの各々に割り当てられた前記音源から出力されるアナウンス音の、所定の周波数より低い低周波数成分を減衰させるローパスフィルタを含む、付記1乃至3のいずれか一項に記載の音源管理装置。
(付記5)
前記音処理部は、前記音および前記アナウンス音に対して、入力された音であるオリジナル音に対して時間をずらして得られるディレイ音を前記オリジナルの音に重ねる、付記1乃至4のいずれか一項に記載の音源管理装置。
(付記6)
前記音処理部は、前記音および前記アナウンス音以外の指示音に対して、入力された音であるオリジナル音に対して時間をずらして得られるディレイ音が含まれる場合、前記ディレイ音を除去する、付記1乃至5のいずれか一項に記載の音源管理装置。
(付記7)
複数の音源から出力される音の各々を、ユーザの位置および姿勢に応じて、前記ユーザに対して異なる複数の方向および前記ユーザからの異なる複数の距離に仮想的に配置した複数の仮想スピーカに割り当てることと、
前記複数の前記仮想スピーカに割り当てられた前記音源から出力される前記音について、前記ユーザから前記仮想スピーカまでの距離が長くなればなるほど低いカットオフ周波数で高周波領域を減衰させる処理を施し、前記複数の前記仮想スピーカの各々に対して処理音を生成することと、
前記複数の前記仮想スピーカの各々に対して生成された前記処理音について、前記複数の前記仮想スピーカのうち前記複数の方向のそれぞれの方向において前記複数の距離に仮想的に配置された前記仮想スピーカに対する前記処理音を集約してそれぞれの方向に対する複数の集約された処理音を生成することとと、
前記集約された処理音に、前記ユーザの前記位置および前記姿勢に依存する頭部伝達関数を作用させることによって、前記ユーザに提供する複数のチャンネルの出力音を生成するクライアントに前記複数の集約された処理音を送信することと、
を含む音源管理方法。
(付記8)
サーバとクライアントを含む音源管理システムであって、
前記サーバは、
複数の音源から出力される音の各々を、ユーザの位置および姿勢に応じて、前記ユーザに対して異なる複数の方向および前記ユーザからの異なる複数の距離に仮想的に配置した複数の仮想スピーカに割り当てるゾーン集約部と、
前記複数の前記仮想スピーカに割り当てられた前記音源から出力される前記音について、前記ユーザから前記仮想スピーカまでの距離が長くなればなるほど低いカットオフ周波数で高周波領域を減衰させる処理を施し、前記複数の前記仮想スピーカの各々に対して処理音を生成する音処理部と、
前記複数の前記仮想スピーカの各々に対して生成された前記処理音について、前記複数の前記仮想スピーカのうち前記複数の方向のそれぞれの方向において前記複数の距離に仮想的に配置された前記仮想スピーカに対する前記処理音を集約してそれぞれの方向に対する複数の集約された処理音を生成する仮想スピーカ集約部と、
前記クライアントに前記複数の集約された処理音を送信する送信部、、
を含み、
前記クライアントは、
前記ユーザの位置および前記姿勢を測定するセンサと、
前記集約された処理音に、前記ユーザの前記位置および前記姿勢に応じて頭部伝達関数を畳み込み、前記ユーザから見て所定の方向に対する畳み込み音を生成する頭部伝達関数適用部と、
前記畳み込み音を用いて前記ユーザに提供する出力音を生成するミキシング処理部と、
を含む音源管理システム。
600 音源管理装置
602 音源データ格納部
604 ゾーン集約部
606 フィルタ処理部
608 反響処理部
610 仮想スピーカ集約部
612 ストリーム送信部
614 音処理部
700 クライアント
702 ユーザ情報送信部
704 頭部姿勢位置計測部
706 ストリーム受信部
708 頭部伝達関数(hrtf)適用処理部
710 頭部伝達関数(hrtf)格納部
712 ミキシング処理部
714 ヘッドセット

Claims (8)

  1. 複数の音源から出力される音の各々を、ユーザの位置および姿勢に応じて、前記ユーザに対して異なる複数の方向および前記ユーザからの異なる複数の距離に仮想的に配置した複数の仮想スピーカに割り当てるゾーン集約部と、
    前記複数の前記仮想スピーカに割り当てられた前記音源から出力される前記音について、前記ユーザから前記仮想スピーカまでの距離が長くなればなるほど低いカットオフ周波数で高周波領域を減衰させる処理を施し、前記複数の前記仮想スピーカの各々に対して処理音を生成する音処理部と、
    前記複数の前記仮想スピーカの各々に対して生成された前記処理音について、前記複数の前記仮想スピーカのうち前記複数の方向のそれぞれの方向において前記複数の距離に仮想的に配置された前記仮想スピーカに対する前記処理音を集約してそれぞれの方向に対する複数の集約された処理音を生成する仮想スピーカ集約部と、
    前記ユーザの前記位置および前記姿勢に依存する頭部伝達関数を前記複数の集約された処理音に作用させることによって、前記ユーザに提供する複数のチャンネルの出力音を生成するクライアントに対して、前記複数の集約された処理音を送信する送信部、
    を含む音源管理装置。
  2. 前記音処理部は、前記カットオフ周波数を、頭部伝達関数の周波数特性において前方定位に必要な周波数を避けて設定する請求項1に記載の音源管理装置。
  3. 前記音処理部は、前記複数の前記仮想スピーカの各々に割り当てられた前記音源から出力される前記音を、前記ユーザから前記複数の前記仮想スピーカの各々までの距離に依存するゲインを有する増幅器を含む、請求項1または2に記載の音源管理装置。
  4. 前記音処理部は、前記複数の前記仮想スピーカの各々に割り当てられた前記音源から出力されるアナウンス音の、所定の周波数より低い低周波数成分を減衰させるローパスフィルタを含む、請求項1乃至3のいずれか一項に記載の音源管理装置。
  5. 前記音処理部は、前記複数の前記仮想スピーカの各々に割り当てられた前記音源から出力される前記音および前記複数の前記仮想スピーカの各々に割り当てられた前記音源から出力されるアナウンス音に対して、入力された音であるオリジナル音に対して時間をずらして得られるディレイ音を前記オリジナルの音に重ねる、請求項1乃至4のいずれか一項に記載の音源管理装置。
  6. 前記音処理部は、指示音に対して、入力された音であるオリジナル音に対して時間をずらして得られるディレイ音が含まれる場合、前記ディレイ音を除去する、請求項1乃至5のいずれか一項に記載の音源管理装置。
  7. 複数の音源から出力される音の各々を、ユーザの位置および姿勢に応じて、前記ユーザに対して異なる複数の方向および前記ユーザからの異なる複数の距離に仮想的に配置した複数の仮想スピーカに割り当てることと、
    前記複数の前記仮想スピーカに割り当てられた前記音源から出力される前記音について、前記ユーザから前記仮想スピーカまでの距離が長くなればなるほど低いカットオフ周波数で高周波領域を減衰させる処理を施し、前記複数の前記仮想スピーカの各々に対して処理音を生成することと、
    前記複数の前記仮想スピーカの各々に対して生成された前記処理音について、前記複数の前記仮想スピーカのうち前記複数の方向のそれぞれの方向において前記複数の距離に仮想的に配置された前記仮想スピーカに対する前記処理音を集約してそれぞれの方向に対する複数の集約された処理音を生成すること
    前記集約された処理音に、前記ユーザの前記位置および前記姿勢に依存する頭部伝達関数を作用させることによって、前記ユーザに提供する複数のチャンネルの出力音を生成するクライアントに前記複数の集約された処理音を送信することと、
    を含む音源管理方法。
  8. サーバとクライアントを含む音源管理システムであって、
    前記サーバは、
    複数の音源から出力される音の各々を、ユーザの位置および姿勢に応じて、前記ユーザに対して異なる複数の方向および前記ユーザからの異なる複数の距離に仮想的に配置した複数の仮想スピーカに割り当てるゾーン集約部と、
    前記複数の前記仮想スピーカに割り当てられた前記音源から出力される前記音について、前記ユーザから前記仮想スピーカまでの距離が長くなればなるほど低いカットオフ周波数で高周波領域を減衰させる処理を施し、前記複数の前記仮想スピーカの各々に対して処理音を生成する音処理部と、
    前記複数の前記仮想スピーカの各々に対して生成された前記処理音について、前記複数の前記仮想スピーカのうち前記複数の方向のそれぞれの方向において前記複数の距離に仮想的に配置された前記仮想スピーカに対する前記処理音を集約してそれぞれの方向に対する複数の集約された処理音を生成する仮想スピーカ集約部と、
    前記クライアントに前記複数の集約された処理音を送信する送信部、
    を含み、
    前記クライアントは、
    前記ユーザの位置および前記姿勢を測定するセンサと、
    前記集約された処理音に、前記ユーザの前記位置および前記姿勢に応じて頭部伝達関数を畳み込み、前記ユーザから見て所定の方向に対する畳み込み音を生成する頭部伝達関数適用部と、
    前記畳み込み音を用いて前記ユーザに提供する出力音を生成するミキシング処理部と、
    を含む音源管理システム。
JP2013114904A 2013-05-31 2013-05-31 音源管理装置、音源管理方法、および音源管理システム Active JP6179194B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2013114904A JP6179194B2 (ja) 2013-05-31 2013-05-31 音源管理装置、音源管理方法、および音源管理システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2013114904A JP6179194B2 (ja) 2013-05-31 2013-05-31 音源管理装置、音源管理方法、および音源管理システム

Publications (2)

Publication Number Publication Date
JP2014236259A JP2014236259A (ja) 2014-12-15
JP6179194B2 true JP6179194B2 (ja) 2017-08-16

Family

ID=52138695

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2013114904A Active JP6179194B2 (ja) 2013-05-31 2013-05-31 音源管理装置、音源管理方法、および音源管理システム

Country Status (1)

Country Link
JP (1) JP6179194B2 (ja)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113362864B (zh) * 2021-06-16 2022-08-02 北京字节跳动网络技术有限公司 音频信号处理的方法、装置、存储介质及电子设备
JP2023148359A (ja) 2022-03-30 2023-10-13 株式会社ジェイテクト 情報提供システム、情報提供方法、および、情報提供プログラム
WO2023199813A1 (ja) * 2022-04-14 2023-10-19 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカ 音響処理方法、プログラム、及び音響処理システム

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH0946800A (ja) * 1995-07-28 1997-02-14 Sanyo Electric Co Ltd 音像制御装置
JP4124702B2 (ja) * 2003-06-11 2008-07-23 日本放送協会 立体音響信号符号化装置、立体音響信号符号化方法および立体音響信号符号化プログラム
JP2007228526A (ja) * 2006-02-27 2007-09-06 Mitsubishi Electric Corp 音像定位装置

Also Published As

Publication number Publication date
JP2014236259A (ja) 2014-12-15

Similar Documents

Publication Publication Date Title
EP3412039B1 (en) Augmented reality headphone environment rendering
JP2022167932A (ja) 没入型オーディオ再生システム
EP3229498B1 (en) Audio signal processing apparatus and method for binaural rendering
Shilling et al. Virtual auditory displays
US10341799B2 (en) Impedance matching filters and equalization for headphone surround rendering
EP2503800A1 (en) Spatially constant surround sound
TW200816854A (en) Method and apparatus for creating a multi-dimensional communication space for use in a binaural audio system
EP3225039B1 (en) System and method for producing head-externalized 3d audio through headphones
CN108391199B (zh) 基于个性化反射声阈值的虚拟声像合成方法、介质和终端
US11221821B2 (en) Audio scene processing
JP6179194B2 (ja) 音源管理装置、音源管理方法、および音源管理システム
CN106465032B (zh) 操控输入音频信号的装置和方法
US20170325046A1 (en) Method for Processing Sound Signal and Terminal Device
CN109327794B (zh) 3d音效处理方法及相关产品
US9794717B2 (en) Audio signal processing apparatus and audio signal processing method
WO2021261385A1 (ja) 音響再生装置、ノイズキャンセリングヘッドフォン装置、音響再生方法、音響処理プログラム
JP2011199707A (ja) 音声データ再生装置及び音声データ再生方法
AU2019268093B2 (en) Communication device with position-dependent spatial source generation, communication system, and related method
Steffens et al. Auditory orientation and distance estimation of sighted humans using virtual echolocation with artificial and self-generated sounds
US20230403528A1 (en) A method and system for real-time implementation of time-varying head-related transfer functions
WO2024014389A1 (ja) 音響信号処理方法、コンピュータプログラム、及び、音響信号処理装置
US20210112356A1 (en) Method and device for processing audio signals using 2-channel stereo speaker
WO2024084998A1 (ja) 音響処理装置及び音響処理方法
Wersényi Evaluation of Bone Conduction and Active-Noise-Cancellation Headsets Based on Listening Tests in a Virtual Environment
WO2024084999A1 (ja) 音響処理装置及び音響処理方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160310

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161216

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161227

A521 Written amendment

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170125

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170620

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170703

R150 Certificate of patent or registration of utility model

Ref document number: 6179194

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150