WO2024111646A1

WO2024111646A1 - 立体音響生成装置、立体音響再生装置、立体音響生成方法、立体音響生成プログラム、および、記録媒体

Info

Publication number: WO2024111646A1
Application number: PCT/JP2023/042057
Authority: WO
Inventors: 由季菜稲田; 史奈小見山
Original assignee: Ｔｏｐｐａｎホールディングス株式会社
Priority date: 2022-11-25
Filing date: 2023-11-22
Publication date: 2024-05-30

Abstract

立体音響システムを構成する立体音響生成装置は、入力装置を通じたユーザからの指示に従って、当該指示に対応する動きの軌跡を示すオブジェクトを仮想空間内に配置する。立体音響生成装置はさらに、選択された音声について、上記オブジェクトに沿って移動するように音声の発信位置を設定した立体音響データを生成する。

Description

立体音響生成装置、立体音響再生装置、立体音響生成方法、立体音響生成プログラム、および、記録媒体

　本開示は、立体音響生成装置、立体音響再生装置、立体音響生成方法、立体音響生成プログラム、および、記録媒体に関する。

　立体音響システムは、ユーザに対して、音の方向、距離、拡がり等を三次元的に認識させるように音声を再生する。例えば、特許文献１に記載のシステムは、ゲームのプレイヤであるユーザを囲むように配置された複数のスピーカーを備え、ユーザの操作キャラクターの動きに応じて各スピーカーの出力を制御することで、立体的な音場を形成する。

特開２０２２－３４１６０号公報

　ところで、音声データの作成や編集のための従来のソフトウェアは、一方の軸を時間軸とする二次元平面に波形等で表された音声に対し、所望の操作を加えるように構成されている。これに対し、立体音響のデータは、音の発信位置等の三次元の情報を含むように生成する必要があるため、二次元平面を用いた表現によっては直感的な操作によるデータの生成が困難であるという問題が生じている。

　上記課題を解決するための立体音響生成装置、立体音響再生装置、立体音響生成方法、立体音響生成プログラム、および、記録媒体の各態様を記載する。
　［態様１］入力装置を通じた第１ユーザからの指示に従って、オブジェクトを仮想空間内に配置する描画管理部と、選択された音声について、前記オブジェクトの位置と一致するように前記音声の発信位置を設定した立体音響データを生成するデータ生成部と、を備える立体音響生成装置。

　上記構成によれば、三次元空間におけるオブジェクトの配置に基づいて、音声の発信位置を三次元的に規定できるため、直感的な動作によって立体音響を作成することができる。

　［態様２］前記描画管理部は、前記オブジェクトとして、前記第１ユーザからの前記指示に対応する動きの軌跡を示すオブジェクトを前記仮想空間内に配置し、前記データ生成部は、前記オブジェクトに沿って移動するように前記音声の前記発信位置を設定することにより、前記立体音響データを生成する、［態様１］に記載の立体音響生成装置。
　上記構成によれば、三次元空間で線や点等を描くことにより、音声の発信位置を三次元的に規定できるため、直感的な動作によって立体音響を作成することができる。

　［態様３］前記描画管理部が配置する前記オブジェクトには、線状のオブジェクトが含まれる［態様２］に記載の立体音響生成装置。
　上記構成によれば、より直感的な動作で、音声の発信位置の移動態様を規定することができる。

　［態様４］前記立体音響データは、前記音声の再生速度を規定する情報を含み、前記データ生成部は、前記音声の再生速度を、前記動きの速度に対応する速度に設定して、前記立体音響データを生成する、［態様２］または［態様３］に記載の立体音響生成装置。
　上記構成によれば、上記軌跡を描くための動きの速度に応じて音声の再生速度が設定されるため、直感的な動作によって再生速度を規定できる。

　［態様５］前記データ生成部は、複数の音声の各々について、前記音声ごとの前記オブジェクトに沿って移動するように各音声の発信位置を設定し、前記複数の音声が重ねて出力されるように構成された前記立体音響データを生成する、［態様２］～［態様４］のいずれか１つに記載の立体音響生成装置。
　上記構成によれば、複数の音声がそれぞれの発信位置から発せられ、かつ発信位置が変化するという複雑な立体音響を、直感的な動作によって容易に作成することができる。

　［態様６］前記立体音響データに基づいて、設定された前記発信位置に応じた音量での前記音声の再生を、出力装置が有する音声出力部に指示する再生制御部をさらに備える、［態様１］～［態様５］のいずれか１つに記載の立体音響生成装置。
　上記構成によれば、作成した立体音響の確認が容易であり、ユーザの利便性が高められる。

　［態様７］前記立体音響データに基づき再生されている前記音声の発信位置を前記オブジェクト上に示した前記仮想空間の画像を、前記出力装置が有する表示部に表示させる、［態様６］に記載の立体音響生成装置。
　上記構成によれば、発信位置の変化を視覚的に把握できるため、作成した立体音響をより直感的に捉えることができる。

　［態様８］［態様１］～［態様７］のいずれか１つに記載の立体音響生成装置によって生成された前記立体音響データを用いて、音声の再生を制御する立体音響再生装置であって、第２ユーザが実在する空間である現実空間での前記第２ユーザの位置を取得するとともに、前記現実空間の位置と前記仮想空間の位置とを対応付ける位置管理部と、前記仮想空間での前記音声の前記発信位置に対応する前記現実空間の位置が対応発信位置であり、前記対応発信位置と前記第２ユーザの位置との関係に応じた音量での前記音声の再生を、出力装置が有する音声出力部に指示する再生制御部と、を備える立体音響再生装置。

　上記構成によれば、現実空間でのユーザの位置に応じた音量で音声が再生されるため、ユーザのいる環境と音声の再生状況とが結びついた印象がユーザに与えられる。それゆえ、ユーザの臨場感が高められる。

　［態様９］再生対象の音声の切り換えの条件が設定されており、前記条件が成立したとき、前記再生制御部は、再生する音声の切り替えを前記音声出力部に指示する、［態様８］に記載の立体音響再生装置。
　上記構成によれば、立体音響による多様な演出が可能であり、ユーザの臨場感および興趣が高められる。

　［態様１０］前記条件は、前記現実空間での前記第２ユーザの位置に関する条件を含む、［態様９］に記載の立体音響再生装置。
　上記構成によれば、現実空間とユーザとの空間的な関わりが音声に反映されることから、ユーザの臨場感がより高められる。

　［態様１１］前記条件は、前記現実空間での特定の位置と前記第２ユーザの位置との関係に関する条件を含む、［態様１０］に記載の立体音響再生装置。
　上記構成によれば、上記空間的な関わりとより関連の深い演出が可能である。

　［態様１２］前記再生制御部は、前記条件が成立したとき、第１の音声から第２の音声への再生の切り替えを前記音声出力部に指示し、前記第２の音声は、前記立体音響データを用いて再生される音声であり、前記現実空間での前記特定の位置は、前記第２の音声についての前記対応発信位置である、［態様１１］に記載の立体音響再生装置。
　上記構成によれば、現実空間とユーザとの空間的な関わりに立体音響を効果的に関連付けた演出が可能である。したがって、ユーザの臨場感や興趣が高められる。

　［態様１３］１または複数のコンピュータが、入力装置を通じた第１ユーザからの指示に従って、オブジェクトを仮想空間内に配置することと、選択された音声について、前記オブジェクトの位置と一致するように前記音声の発信位置を設定した立体音響データを生成することと、を実行する立体音響生成方法。

　上記方法によれば、三次元空間におけるオブジェクトの配置に基づいて、音声の発信位置を三次元的に規定できるため、直感的な動作によって立体音響を作成することができる。

　［態様１４］１または複数のコンピュータに、入力装置を通じた第１ユーザからの指示に従って、オブジェクトを仮想空間内に配置することと、選択された音声について、前記オブジェクトの位置と一致するように前記音声の発信位置を設定した立体音響データを生成することと、を実行させる立体音響生成プログラム。
　［態様１５］［態様１４］に記載の立体音響生成プログラムを記録したコンピュータ読み取り可能な記録媒体。

　本開示によれば、ユーザが直感的な動作によって立体音響を作成することができる。

一実施形態の立体音響システムの全体構成を示す図。一実施形態における立体音響生成装置の制御装置の機能的構成を示す図。一実施形態における立体音響生成装置の制御装置のハードウェア構成の一例を示す図。一実施形態における立体音響生成装置の処理の手順を示す図。一実施形態の立体音響生成装置が表示する画面の一例を示す図。一実施形態の立体音響生成装置の処理内容を模式的に示す図。一実施形態における立体音響再生装置の制御装置の機能的構成を示す図。一実施形態における立体音響再生装置の制御装置のハードウェア構成の一例を示す図。一実施形態における立体音響再生装置の処理の手順を示す図。一実施形態の立体音響再生装置が表示する画面の一例を示す図。一実施形態における立体音響再生装置の処理の手順を示す図。

　図面を参照して、立体音響システムの一実施形態を説明する。
　［立体音響システムの全体構成］
　図１を参照して、立体音響システムの全体構成を説明する。図１に示すように、立体音響システム１００は、立体音響生成装置１０と立体音響再生装置５０とを備えている。立体音響生成装置１０は、立体音響データを生成する装置であり、立体音響再生装置５０は、立体音響データに基づいて音声を再生する装置である。立体音響データは、音声情報と位置情報とを少なくとも含む。音声情報は、音の高低および長短の変化の流れを示す情報であり、言い換えれば、楽曲や自然音等の音楽のデータである。位置情報は、音声情報が示す音声についての、三次元空間での発信源の位置を示す情報である。なお、立体音響生成装置１０のユーザと、立体音響再生装置５０のユーザとは、同一の人物であってもよいし、異なる人物であってもよい。

　立体音響生成装置１０は、制御装置２０と、入力装置３０と、出力装置４０とを備えている。入力装置３０は、ユーザの動作による指示の入力を受け付けて、入力に応じた信号を制御装置２０に送る。ユーザの動作には、ボタンの押下等の入力装置３０に対する操作、および、身振りや手振りといった身体の動きが含まれる。出力装置４０は、表示部および音声出力部を含み、制御装置２０からのデータや信号を受けて、表示部に画像を表示し、音声出力部から音声を出力する。制御装置２０は、仮想空間を生成して出力装置４０の表示部に表示させ、入力装置３０から受けた仮想空間に対するユーザの指示に基づいて、立体音響データを生成する。

　制御装置２０、入力装置３０、および、出力装置４０は、一体に組み付けられていてもよいし、これらの装置の構成部の少なくとも一部が他の構成部と分離して配置されていてもよい。制御装置２０と、入力装置３０および出力装置４０の構成部とは、有線または無線で接続されていてもよい。制御装置２０と、入力装置３０および出力装置４０の構成部との間での信号やデータの授受には、インターネット等のネットワークを介した通信や、Ｂｌｕｅｔｏｏｔｈ（登録商標）等の近距離無線通信が用いられてもよい。この場合、各装置２０，３０，４０は、利用する通信方式に応じた通信機能を有していればよい。

　また、立体音響生成装置１０は、ユーザの位置や姿勢を検出する位置検出装置を備えていてもよい。位置検出装置は、検出された位置や姿勢に応じた信号を制御装置２０に送る。

　例えば、制御装置２０と出力装置４０とが一体となった例は、ＶＲ（Ｖｉｒｔｕａｌ　Ｒｅａｌｉｔｙ）用のヘッドマウントディスプレイである。この場合、ヘッドマウントディスプレイに付属するコントローラーが入力装置３０であり、立体音響生成装置１０は、上記位置検出装置も備えている。位置検出装置は、慣性センサ、赤外線等の射出装置とその受光装置、カメラ等のヘッドトラッキングのための装置を含む。入力装置３０は、ユーザの動作として、入力装置３０に対する操作に加えて、身振りや手振り等の身体の動きを検出可能に構成されており、慣性センサ、赤外線等の射出装置とその受光装置、カメラ等のモーションキャプチャのための装置を含む。なお、入力装置３０が位置検出装置の少なくとも一部を兼ねていてもよい。

　また例えば、立体音響生成装置１０は、制御装置２０、入力装置３０、および、出力装置４０が一体となったヘッドマウントディスプレイであってもよい。この場合、立体音響生成装置１０は、ヘッドマウントディスプレイとは別体のコントローラーを備えていなくてよい。例えば、入力装置３０が、ヘッドマウントディスプレイを装着したユーザの視線を検出することにより、ヘッドマウントディスプレイが備える出力装置４０に表示されたメニュー領域や仮想空間のオブジェクトが選択される。また例えば、入力装置３０が、ユーザの手や指の動きを検出することにより、メニュー領域や仮想空間のオブジェクトの変形や移動が行われる。こうした入力装置３０は、ヘッドマウントディスプレイに設けられたカメラを含んでいればよい。

　その他、制御装置２０は、サーバ、パーソナルコンピュータ、スマートフォン等であってもよい。制御装置２０がサーバであれば、ユーザごとの入力装置３０および出力装置４０を用いて、複数のユーザの各々による立体音響データの生成を並行して実施することができる。また、入力装置３０は、マウス、キーボード、タッチパネル等であってもよいし、出力装置４０の表示部は、液晶パネル等の表示パネルを含んでいればよく、出力装置４０の音声出力部は、スピーカー、イヤホン、ヘッドホン等であればよい。

　立体音響再生装置５０は、制御装置６０と、位置検出装置７０と、入力装置８０と、出力装置９０とを備えている。位置検出装置７０は、現実空間でのユーザの位置および向きを検出し、検出された位置および向きに応じた信号を制御装置６０に送る。例えば、位置検出装置７０は、ユーザに携帯または装着され、ユーザの位置および向きとして、位置検出装置７０の位置および向きを検出する。あるいは、位置検出装置７０は、立体音響が再生される施設の天井等、ユーザの上方に取り付けられて、ユーザの位置および向きを検出してもよい。

　入力装置８０は、ユーザの動作による指示の入力を受け付けて、入力に応じた信号を制御装置６０に送る。出力装置９０は、表示部および音声出力部を含み、制御装置６０からのデータや信号を受けて、表示部に画像を表示し、音声出力部から音声を出力する。具体的には、表示部では、現実空間の像と制御装置６０からのデータに基づく画像とが重ねられる。現実空間の像は、表示部を透過した像であってもよいし、立体音響再生装置５０が備える撮影部による撮影像であってもよく、ユーザの周囲の現実空間の像であればよい。
　制御装置６０は、現実空間でのユーザの位置および向きに基づいて、立体音響データの再生を出力装置９０に指示する。

　制御装置６０、位置検出装置７０、入力装置８０、および、出力装置９０は、一体に組み付けられていてもよいし、これらの装置の構成部の少なくとも一部が他の構成部と分離して配置されていてもよい。制御装置６０と、位置検出装置７０、入力装置８０、および、出力装置９０の構成部とは、有線または無線で接続されていてもよい。制御装置６０と、位置検出装置７０、入力装置８０、および、出力装置９０の構成部との間での信号やデータの授受には、インターネット等のネットワークを介した通信や、Ｂｌｕｅｔｏｏｔｈ（登録商標）等の近距離無線通信が用いられてもよい。この場合、各装置６０，７０，８０，９０は、利用する通信方式に応じた通信機能を有していればよい。

　例えば、制御装置６０、位置検出装置７０、入力装置８０、および、出力装置９０が一体となった例は、スマートフォンやタブレット端末である。位置検出装置７０は、慣性センサや、赤外線等の射出装置とその受光装置を含み、入力装置８０は、タッチパネルを含む。出力装置９０の表示部は、液晶パネル等の表示パネルを含んでいればよく、出力装置９０の音声出力部は、スピーカー、イヤホン、ヘッドホン等であればよい。

　その他、制御装置６０は、サーバであってもよい。制御装置６０がサーバであれば、ユーザごとの位置検出装置７０、入力装置８０、および、出力装置９０を用いて、複数のユーザの各々による立体音響データの再生を並行して実施することができる。また、制御装置６０と位置検出装置７０と出力装置９０とは、これらが一体となったＡＲ（Ａｕｇｍｅｎｔｅｄ　Ｒｅａｌｉｔｙ）やＭＲ（Ｍｉｘｅｄ　Ｒｅａｌｉｔｙ）用のヘッドマウントディスプレイであってもよく、さらに、入力装置８０もヘッドマウントディスプレイを構成していてもよいし、入力装置８０はコントローラーであってもよい。また、位置検出装置７０がユーザから離れた位置に設置される場合、位置検出装置７０は、赤外線等の射出装置とその受光装置や、カメラ等のヘッドトラッキングのための装置を含んでいればよい。

　立体音響生成装置１０と立体音響再生装置５０とは、インターネット等のネットワークを介して、相互にデータの送信および受信が可能であってもよい。そして、立体音響生成装置１０が、生成した立体音響データを、立体音響再生装置５０に送信してもよい。

　［立体音響生成装置の構成］
　立体音響生成装置１０について、制御装置２０の詳細な構成を説明する。本実施形態では、制御装置２０によって生成された仮想的な三次元空間である仮想空間ＶＳにて、ユーザは、立体音響を構成する音声の発信位置を、線で描くことにより規定する。

　まず、図２を参照して、制御装置２０の機能的構成を説明する。図２に示すように、制御装置２０は、制御部２１と記憶部２２とを備えている。また、制御装置２０が、入力装置３０や出力装置４０と通信を行う場合には、制御装置２０は、通信部２３を備えている。通信部２３は、通信先の装置との接続およびデータの送受信等、制御装置２０と入力装置３０または出力装置４０との通信処理を行う。

　制御部２１は、記憶部２２に格納された立体音響生成プログラムを実行することにより、仮想空間管理部２１ａ、描画管理部２１ｂ、データ生成部２１ｃ、および、再生制御部２１ｄとして機能する。

　仮想空間管理部２１ａは、仮想空間ＶＳを生成する。仮想空間ＶＳは、オブジェクトが何も配置されていない空間であってもよいし、作成対象の立体音響のテーマに応じた構造物や自然物等のオブジェクトが配置された空間であってもよい。仮想空間管理部２１ａは、仮想空間ＶＳ内の視点から見た仮想空間ＶＳの画像の表示を、出力装置４０の表示部に指示する。

　また、仮想空間管理部２１ａは、仮想空間ＶＳ内に線を描く際に用いられるオブジェクトである描画用オブジェクトの配置を管理する。描画用オブジェクトには、線を描くために動かされる操作オブジェクトや、操作オブジェクトの移動範囲を広げるために用いられる移動補助オブジェクトが含まれる。
　また、仮想空間管理部２１ａは、音声の選択や生成された立体音響データの再生を指示するためのメニュー領域の表示を管理する。

　描画管理部２１ｂは、入力装置３０を通じたユーザからの指示に従って、仮想空間ＶＳに線を描く。言い換えれば、描画管理部２１ｂは、ユーザから指示された位置に、線状のオブジェクトを生成する。この線状のオブジェクトが軌跡線ＴＬである。そして、描画管理部２１ｂは、仮想空間ＶＳにおける軌跡線ＴＬの位置と、ユーザの動作が反映された軌跡線ＴＬの描画速度とを記録する。

　データ生成部２１ｃは、選択された音声である対象音声のデータと、軌跡線ＴＬの位置および描画速度とに基づいて、立体音響データを生成する。詳細には、データ生成部２１ｃは、軌跡線ＴＬに沿って移動するように対象音声の発信位置を設定するとともに、対象音声の再生速度を描画速度に応じた速度に設定し、これらの設定を示す情報を含む立体音響データを生成する。これにより、対象音声の発信位置が、軌跡線ＴＬの座標と一致した三次元座標に設定される。

　対象音声は、言い換えれば、発信位置の規定対象の音声である。データ生成部２１ｃによって生成される立体音響データは、音声情報および位置情報に加えて、音声の再生速度を示す再生速度情報を含む。

　再生制御部２１ｄは、データ生成部２１ｃが生成した立体音響データの再生を制御する。詳細には、再生制御部２１ｄは、立体音響データの示す音声が、設定された発信位置に応じた音量、および、設定された速度で再生されるように、当該音声の再生を出力装置４０に指示する。

　記憶部２２は、制御部２１による処理の実行に必要な各種のプログラムやデータを記憶している。記憶部２２は、こうしたプログラムの例として、立体音響生成プログラムを記憶している。また、記憶部２２は、こうしたデータの例として、仮想空間データ２２ａ、および、音声データ２２ｂを記憶している。

　仮想空間データ２２ａは、仮想空間ＶＳの生成に必要なデータ、例えば、空間に対して設定される三次元直交座標系の情報、空間に配置されるオブジェクトの位置情報や描画のための情報を含む。

　音声データ２２ｂは、対象音声として選択可能な音声のデータである。音声データ２２ｂは、上述した音声情報に対応する情報を含み、音声データ２２ｂが示す音声には、発信位置は設定されていない。一例では、海をテーマとする立体音響が作成対象であるとき、音声データ２２ｂには、波の音を示す音声、カモメの鳴き声や羽ばたきの音声、クジラの鳴き声や移動音の音声等が含まれてもよい。
　なお、記憶部２２には、データ生成部２１ｃによって生成された立体音響データも記憶される。

　続いて、上記機能を有する制御装置２０の物理的な構成、すなわちハードウェア構成を説明する。制御装置２０は、コンピュータ装置であり、ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＭＰＵ（Ｍｉｃｒｏ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）、ＧＰＵ（Ｇｒａｐｈｉｃｓ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）等の演算装置である電子回路、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）、レジスタードメモリ、アンバッファードメモリ等のメモリ、および、ＳＳＤ（Ｓｏｌｉｄ　Ｓｔａｔｅ　Ｄｒｉｖｅ）、ＨＤＤ（Ｈａｒｄ　Ｄｉｓｋ　Ｄｒｉｖｅ）等のストレージを備える。演算装置は、ストレージからオペレーティングシステムや各種プログラムをメモリにロードし、メモリから取り出した命令を実行する。制御装置２０は、ＡＳＩＣ（Ａｐｐｌｉｃａｔｉｏｎ　Ｓｐｅｃｉｆｉｃ　Ｉｎｔｅｇｒａｔｅｄ　Ｃｉｒｃｕｉｔ）、ＦＰＧＡ（Ｆｉｅｌｄ　Ｐｒｏｇｒａｍｍａｂｌｅ　Ｇａｔｅ　Ａｒｒａｙ）等の集積回路を備えてもよい。

　また、制御装置２０が通信部２３を備える場合、制御装置２０は、通信インターフェースを備えている。通信インターフェースは、ハードウェア、ソフトウェア、または、これらの組み合わせとして実装されている。

　図３は、制御装置２０のハードウェア構成の一例を示す。制御装置２０は、ＣＰＵ２０１、通信装置２０２、ＲＯＭ２０３、ＲＡＭ２０４、および、ストレージ２０５を備えている。ＣＰＵ２０１と、通信装置２０２、ＲＯＭ２０３、ＲＡＭ２０４、および、ストレージ２０５の各々とは、バス２０６を介して接続されており、これにより、バス２０６を通じてデータや信号が伝送される。上記構成においては、ＣＰＵ２０１、ＲＯＭ２０３、および、ＲＡＭ２０４が制御部２１に対応し、ストレージ２０５が記憶部２２に対応し、通信装置２０２が通信部２３に対応する。

　なお、制御装置２０は、自身が実行する全ての処理についてソフトウェア処理を行うものに限られない。上述のように、制御装置２０は、自身が実行する処理の少なくとも一部についてハードウェア処理を行う専用のハードウェア回路（例えば特定用途向け集積回路：ＡＳＩＣ）を備えてもよい。すなわち、制御装置２０は、１）コンピュータプログラム（ソフトウェア）に従って動作する１つ以上のプロセッサ、２）各種処理のうち少なくとも一部の処理を実行する１つ以上の専用のハードウェア回路、あるいは３）それらの組み合わせ、を含む回路（ｃｉｒｃｕｉｔｒｙ）として構成し得る。プロセッサは、ＣＰＵ等の演算装置ならびに、ＲＡＭおよびＲＯＭ等のメモリを含み、メモリは、処理を演算装置に実行させるように構成されたプログラムコードまたは指令を格納している。メモリすなわちコンピュータ可読媒体は、汎用または専用のコンピュータでアクセスできるあらゆる利用可能な媒体を含む。

　また、制御装置２０の機能は、複数の情報処理装置によって実現されてもよい。１つの情報処理装置は単体のコンピュータ装置である。すなわち、制御装置２０は、１または複数の情報処理装置から構成されていればよい。

　［立体音響生成装置の動作］
　図４～図６を参照して、立体音響生成装置１０の動作を説明する。図４は、立体音響生成装置１０による処理の流れを示す。

　図４に示すように、立体音響生成装置１０の利用が開始されると、制御装置２０の指示に基づいて、初期視点から見た仮想空間ＶＳの画像が、出力装置４０の表示部に表示される（ステップＳ１０）。初期視点は、予め設定された仮想空間ＶＳ内の視点であってもよいし、立体音響生成装置１０がユーザの位置や姿勢を検出可能に構成されている場合には、ユーザの位置や姿勢に応じて仮想空間ＶＳ内に初期視点が設定されてもよい。

　視点は、入力装置３０を通じたユーザからの指示に従って、あるいは、立体音響生成装置１０が検出したユーザの位置や姿勢の変化に応じて、初期視点から変更可能である。制御装置２０は、上記指示あるいはユーザの位置や姿勢の変化に対応するように視点を移動させ、視点の移動が表示部の表示に反映されるように、出力装置４０の表示を制御する。

　続いて、ユーザの指示に基づき、対象音声が選択される（ステップＳ１１）。例えば、入力装置３０に対する所定の操作により、制御装置２０は、メニュー領域を出力装置４０の表示部に表示させ、さらに、メニュー領域にて音声の選択を示す領域が選択されることにより、制御装置２０は、選択可能な音声が示された音声選択領域Ａ１を出力装置４０の表示部に表示させる。図５は、音声選択領域Ａ１の一例を示す。入力装置３０を通じて、ユーザによって音声選択領域Ａ１のなかで所望の音声が選択されることにより、選択された音声が対象音声に設定される。

　対象音声が選択されると、制御装置２０が仮想空間ＶＳに操作オブジェクトを配置する（ステップＳ１２）。これにより、操作オブジェクトが出力装置４０の表示部の表示に反映される。操作オブジェクトは、例えば円や球のように、掴むことが可能な形状および大きさを有し、仮想空間ＶＳ内のユーザの視点の付近に配置される。操作オブジェクトは、文字等により対象音声を示す外観を有していてもよい。

　入力装置３０を通じたユーザからの指示に従って、制御装置２０は、操作オブジェクトを移動させ、操作オブジェクトの移動の軌跡に対応する位置に、軌跡線ＴＬを生成する（ステップＳ１３）。これにより、操作オブジェクトの移動および軌跡線ＴＬの生成が出力装置４０の表示部の表示に反映される。

　具体的には、ユーザは、操作オブジェクトを掴むなどして、操作オブジェクトを所望の始点に配置し、始点から所望の軌道を通って所望の終点まで操作オブジェクトを移動させる。その結果、操作オブジェクトが通った位置に軌跡線ＴＬが形成される。

　図６は、立体音響生成装置１０がヘッドマウントディスプレイとそのコントローラーに具体化され、ユーザの手の動きによって、操作オブジェクトの移動が指示される場合について、軌跡線ＴＬの生成態様を模式的に示す。図６においては、理解を容易にするために、仮想空間ＶＳに設定される視点の位置にユーザＵｒを配置し、仮想空間ＶＳを外側から見ている。

　図６に示すように、仮想空間ＶＳにおいて、操作オブジェクトＯＤが通った位置に、軌跡線ＴＬが形成される。出力装置４０の表示部には、上記視点から見た仮想空間ＶＳの画像が表示され、ユーザの動きに応じて視点が動くように、表示部に表示される仮想空間ＶＳの範囲が変わる。ユーザが、操作オブジェクトＯＤを掴むように入力装置３０であるコントローラーを操作し、さらに、手を動かすことによってコントローラーを移動させると、手の動き、すなわちコントローラーの動きが反映されるように、操作オブジェクトＯＤが移動する。そして、操作オブジェクトＯＤが通った位置に、操作オブジェクトＯＤの移動速度に応じた速度で、軌跡線ＴＬが描かれる。

　例えば、ユーザＵｒを囲むように軌跡線ＴＬを形成することも可能であるし、動植物等の輪郭の絵や模様を構成するように軌跡線ＴＬを形成することも可能である。手が届かない上方等の領域へ操作オブジェクトＯＤを移動させるために、移動補助オブジェクトが用いられてもよい。例えば、移動補助オブジェクトは棒状であり、移動補助オブジェクトの先端部に操作オブジェクトＯＤが支持される。移動補助オブジェクトを掴んで移動させることにより、操作オブジェクトＯＤを掴んで移動させるよりも広い範囲に操作オブジェクトＯＤを移動させることができる。

　図４に戻り、軌跡線ＴＬが生成されると、制御装置２０は、軌跡線ＴＬに沿って対象音声の発信位置を設定するとともに、対象音声の再生速度を軌跡線ＴＬの描画速度に応じた速度に設定することにより、立体音響データを生成する（ステップＳ１４）。すなわち、制御装置２０は、軌跡線ＴＬの始点から終点に向けて、時間の経過とともに対象音声の発信位置が移動するように設定する。発信位置の移動速度は、軌跡線ＴＬの描画速度に対応する速度であることが好ましい。また、制御装置２０は、軌跡線ＴＬの描画速度が速い位置では、対象音声の再生速度が速くなり、軌跡線ＴＬの描画速度が遅い位置では、対象音声の再生速度が遅くなるように、対象音声の発信位置に対応付けて再生速度を設定する。言い換えれば、軌跡線ＴＬの位置と描画速度が、対象音声の発信位置と再生速度に対応するように、再生速度が設定される。

　これにより、立体音響データが生成される。本実施形態の立体音響生成装置１０によれば、ユーザは、三次元空間で線を描くことにより、音声の発信位置を三次元的に規定できるため、直感的な動作によって立体音響を作成することができる。また、再生速度についても、描画速度の変更という直感的な動作によって規定できる。

　なお、図４に示したフローにおいて、ステップＳ１０，Ｓ１２の処理は、仮想空間管理部２１ａとしての処理であり、ステップＳ１１，Ｓ１３の処理は、描画管理部２１ｂとしての処理であり、ステップＳ１４の処理は、データ生成部２１ｃとしての処理である。

　生成された立体音響データに基づく音声をユーザが確認したい場合には、メニュー領域にて音声の再生を示す領域が選択されることにより、立体音響生成装置１０にて立体音響データを用いて音声が再生される。詳細には、制御装置２０は、立体音響データが含む音声情報の示す音声が、位置情報が示す発信位置に応じた音量、および、再生速度情報が示す速度で再生されるように、出力装置４０に指示する。この処理は、再生制御部２１ｄとしての処理である。

　例えば、仮想空間ＶＳでの発信位置とユーザの位置、すなわちユーザの視点とが近いほど、音量が大きくされる。あるいは、発信位置とユーザの位置との距離が所定距離以上である場合に、音声が減衰される。あるいは、発信位置とユーザの位置との距離が所定距離以上である場合に、音声が消音される。また、ユーザの視点に対する発信位置の方向に応じて、発信位置の方から音声が聞こえるように、音声出力部を構成する左右のイヤホンや複数のスピーカーの各々から出力される音声の音量が制御される。

　こうした音量の制御は、ユーザに対する音声出力部の位置を考慮して行われればよい。また、仮想空間ＶＳでのユーザの位置が変化した場合には、ユーザの位置から発信位置までの距離や方向の変化に応じて、音量が変更される。

　立体音響データに基づく音声の再生中には、制御装置２０は、仮想空間ＶＳにて、音声の発信位置を示すマークを、発信位置の移動に伴って軌跡線ＴＬ上を移動させることが好ましい。言い換えれば、制御装置２０は、音声の発信位置を軌跡線ＴＬ上に示した仮想空間ＶＳの画像を、出力装置４０の表示部に表示させる。これにより、ユーザは、音声の再生中に、発信位置の変化を視覚的に把握できるため、作成した立体音響をより直感的に捉えることができる。

　図４のステップＳ１１～ステップＳ１４の処理が繰り返されることにより、複数の対象音声の各々について、対象音声ごとの軌跡線ＴＬに従った発信位置および再生速度が設定され、これらの対象音声が重ねて出力されるように構成された立体音響データが生成される。この立体音響データが再生されると、各音声が、音声ごとの軌跡線ＴＬの始点から終点に向かって発信位置が変化するように、音声ごとの軌跡線ＴＬの描画速度に沿った再生速度で、再生される。
　これにより、複数の音声がそれぞれの発信位置から発せられ、かつ発信位置が変化するという複雑な立体音響も、直感的な動作によって容易に作成することができる。

　例えば、海をテーマとする立体音響が作成対象であるとき、ユーザが、カモメの音声を選択して、ユーザの上方を囲むように軌跡線ＴＬを描き、波の音声を選択して、ユーザの横を通るように軌跡線ＴＬを描き、クジラの音を選択して、ユーザの足元を囲むように軌跡線ＴＬを描いたとする。これにより生成された立体音響データを再生すると、ユーザの上空をカモメが旋回し、ユーザの横を波が通り、ユーザの足元をクジラが泳ぐかのように、音声がユーザに聞こえる。
　このように、本実施形態の立体音響生成装置１０によれば、直感的な動作によって、多様で自由度の高い立体音響の作成が可能である。

　［変形例］　
　上述した立体音響生成装置１０の構成および動作は下記のように変更されてもよい。

　・ユーザの動作に応じて仮想空間ＶＳ内に生成されるオブジェクトは、ひとつながりの線状に限らず、点状、面状、途切れつつ延びる線である破線状等であってもよい。面状のオブジェクトは、例えば、複数の点の集合、あるいは、線で塗りつぶされた領域を示すオブジェクトとも捉えられる。要は、入力装置３０を通じたユーザからの指示に従って、当該指示に対応する動きの軌跡を示すオブジェクトが仮想空間ＶＳ内に配置されればよい。そして、オブジェクトの存在位置が、対象音声の発信位置とされればよい。

　例えば、対象音声が雨の音である場合に、ユーザが雨を表現して複数の点を描くように動作すると、この動作によって指示された位置に、複数の点状のオブジェクトが配置される。そして、対象音声の発信位置が、この複数の点状のオブジェクトに沿って移動するように設定される。これにより、雨の音の発信位置が、点の描かれた順に、複数の点上を移動する立体音響が生成される。

　また例えば、破線状のオブジェクトに沿って対象音声の発信位置が設定された場合には、立体音響データの再生によって、破線に沿って発信位置が変化しつつ、破線の途切れている部分では音声が途切れるように、音声が再生される。

　・対象音声の発信位置は、オブジェクトに沿って移動するように設定されていれば、描画された順に移動しなくてもよい。例えば、オブジェクトが線状の軌跡線ＴＬである場合には、軌跡線ＴＬの描かれた終点から始点に向かって移動するように、すなわち、描画の進行とは逆方向に、発信位置が設定されてもよい。また例えば、オブジェクトが面状である場合には、ユーザに対して面の奥から手前に向かって移動するように発信位置が設定されてもよい。このように、描画の進行とは異なるように発信位置の移動が設定される場合には、描画後、すなわちオブジェクトの生成後に、入力装置３０を通じたユーザからの指示によって、発信位置の移動態様が設定可能であればよい。

　なお、描画の進行に沿って発信位置が設定されれば、より直感的に立体音響の作成が可能である一方、描画の進行とは異なるように発信位置が設定可能であれば、発信位置の移動態様についての自由度が高められ、立体音響にてより多様な表現も可能である。

　・上記軌跡を示すオブジェクトの生成後に、入力装置３０を通じたユーザからの指示によって、オブジェクトの拡大や縮小といった大きさの変更、および、仮想空間ＶＳ内でのオブジェクト全体の位置の移動の少なくとも一方が可能であってもよい。これにより、対象音声の発信位置が位置する仮想空間ＶＳ内の領域の変更が可能である。こうした構成によれば、一般的な画像の編集と同様に、立体音響の編集が直感的にかつ容易に可能である。

　・立体音響データにて、音声の発信位置および再生速度以外の要素が設定可能であってもよい。例えば、音声の指向性が設定可能であってもよい。具体的には、音声が発信位置から全方向に発信されるか、例えばユーザに近づく方向やユーザから離れる方向等の特定の方向に発信されるか等が設定可能であってもよい。こうした音声の指向性を規定する情報は、指向性情報として立体音響データに含まれる。

　・再生速度の基準とされる速度、すなわち、描画速度として記録されている速度は、オブジェクトの生成後に変更可能であってもよい。あるいは、再生速度は、オブジェクトの生成後に変更可能であってもよいし、オブジェクトの描画速度に関わらず任意に設定可能であってもよい。

　・オブジェクトと対応付けられて発信位置の移動が設定される対象音声が、オブジェクトの生成後に変更可能であってもよい。例えば、対象音声の音色や音の質感が変更可能であってもよい。具体例としては、対象音声が雨の音である場合に、「サーサー」といった弱い雨を示す音声から、「ザーザー」といった強い雨を示す音声に、対象音声が変更可能とされる。また、他の具体例としては、対象音声が足音である場合に、「トントン」といった普通の靴音を示す音声から、「カンカン」といった金属系の乾いた靴音を示す音声に、対象音声が変更可能とされる。このように、対象音声の音色や音の質感の変更によって、対象音声が表現する事象の質感を変更することもできる。

　こうした構成によれば、作成した立体音響を試聴した後に、ユーザのイメージに合うように、音色や音の質感を変えることも可能であり、立体音響を直感的にかつ容易に編集可能である。

　・対象音声に応じて、オブジェクトの外観が変更されてもよい。例えば、対象音声の音の高低が、オブジェクトの色で表現されてもよい。具体的には、対象音声が高い音である場合、オブジェクトが暖色系の色とされ、対象音声が低い音である場合、オブジェクトが寒色系の色とされる。また例えば、対象音声に反響等の効果が付されている場合、オブジェクトが効果に応じた外観とされてもよい。具体的には、軌跡線ＴＬの太さや質感によって、対象音声に付されている効果が表現されてもよい。また、こうしたオブジェクトの外観は、１つのオブジェクトの中で変化してもよい。なお、対象音声の効果はオブジェクトの生成後に設定可能であってもよい。

　・立体音響データにて、発信位置に応じた残響効果が音声に付されてもよい。すなわち、仮想空間ＶＳの構造および発信位置に基づき、仮想空間ＶＳ内での反響を加味して、残響効果が設定される。

　・仮想空間ＶＳは、店舗やイベント会場等のように、現実空間と同様にユーザが活動可能な空間であってもよい。そして、ユーザは、こうした仮想空間ＶＳ内の構造物や装飾の周囲に音を配置するように、立体音響を作成してもよい。また、仮想空間ＶＳは、既存の仮想空間のデータや、空間の図面データの取り込みに基づき生成されてもよい。

　・立体音響データの再生に際して、音声の発信位置を示すマークとして、音声に応じた外観のオブジェクトが用いられてもよい。例えば、星形のような装飾的な形状のオブジェクトが用いられてもよいし、音声がカモメの鳴き声である場合にはカモメの形状のオブジェクトが用いられてもよい。

　・上記軌跡を示すオブジェクトの付近に、軌跡の識別情報が表示されてもよい。識別情報の一例は、ファイル名である。識別情報の表示は、仮想空間ＶＳ内に配置されてもよいし、出力装置４０における表示画像に含められてもよい。こうした構成によれば、複数の対象音声の各々について軌跡線ＴＬ等の上記軌跡を示すオブジェクトが生成された場合に、どの対象音声に対応する軌跡かの識別が容易である。

　・立体音響データは、発信位置が規定されない、すなわち、ユーザの位置に関わらず所定の音量で出力される音声を示す情報を含んでいてもよく、こうした音声は、立体音響データの再生時にＢＧＭとして機能してもよい。

　・立体音響データが、発信位置の規定された複数の音声が重ねて出力されるように構成されている場合、各音声の再生開始時間や再生終了時間が音声ごとに任意に設定可能であってもよい。こうした音声ごとの再生の時間軸に関わる調整は、一方の軸を時間軸とする二次元平面を用いて実施可能であってもよい。当該二次元平面は、出力装置４０において、仮想空間ＶＳと共に表示されてもよいし、仮想空間ＶＳとは別に表示されてもよい。

　［立体音響再生装置の構成］
　立体音響再生装置５０について、制御装置６０の詳細な構成を説明する。立体音響再生装置５０は、例えばイベント等において、現実空間にいるユーザに、立体音響によって演出される特定の場面、すなわちシーンを提供するために用いられる。

　まず、図７を参照して、制御装置６０の機能的構成を説明する。図７に示すように、制御装置６０は、制御部６１と記憶部６２とを備えている。また、制御装置６０が、位置検出装置７０や入力装置８０や出力装置９０と通信を行う場合には、制御装置６０は、通信部６３を備えている。通信部６３は、通信先の装置との接続およびデータの送受信等、制御装置６０と、位置検出装置７０、入力装置８０、または、出力装置９０との通信処理を行う。

　制御部６１は、記憶部２２に格納された立体音響再生プログラムを実行することにより、位置管理部６１ａおよび再生制御部６１ｂとして機能する。
　位置管理部６１ａは、位置検出装置７０からの信号に基づいて、ユーザが実際に存在する三次元空間である現実空間ＲＳでの、ユーザの位置および向きを取得する。現実空間ＲＳでのユーザの位置および向きは、現実空間ＲＳの基準位置に対する相対的な位置および向きであればよい。

　例えば、位置検出装置７０がＬｉＤＡＲ（Ｌｉｇｈｔ　Ｄｅｔｅｃｔｉｏｎ　Ａｎｄ　Ｒａｎｇｉｎｇ）等の光を利用したセンサ技術を用いることにより、現実空間ＲＳにおける構造物の配置が三次元的に記録され、各構造物と位置検出装置７０との距離の検出に基づいて、ユーザの位置および向きが算出される。

　また、位置管理部６１ａは、現実空間ＲＳと音響空間ＡＳとを対応付ける。音響空間ＡＳは、記憶部６２に格納された立体音響データ６２ａにて音声の発信位置が規定されている仮想的な三次元空間である。立体音響データ６２ａが立体音響生成装置１０によって生成されたデータである場合、音響空間ＡＳは、仮想空間ＶＳと一致する。

　再生制御部６１ｂは、立体音響データ６２ａを用いて、位置管理部６１ａが取得したユーザの位置および向きに応じて、音声の再生を出力装置９０の音声出力部に指示する。すなわち、再生制御部６１ｂは、現実空間ＲＳと音響空間ＡＳとの対応付けに基づいて、音響空間ＡＳでの音声の発信位置に対応する現実空間ＲＳの位置とユーザとの位置関係に応じて、音量を制御する。

　また、再生制御部６１ｂは、シーンの切り換えのトリガーとして予め設定されているユーザの位置等の条件が成立したとき、再生される音声の切り替えを出力装置９０の音声出力部に指示する。

　記憶部６２は、制御部６１による処理の実行に必要な各種のプログラムやデータを記憶している。記憶部６２は、こうしたプログラムの例として、立体音響再生プログラムを記憶している。また、記憶部６２は、こうしたデータの例として、上記立体音響データ６２ａを記憶している。

　立体音響データ６２ａは、音声情報と位置情報とを少なくとも含む。音声情報は、上述のように、音の高低および長短の変化の流れを示す情報であり、位置情報は、音声情報が示す音声の発信位置を、音響空間ＡＳにて規定した情報である。立体音響データ６２ａは、立体音響生成装置１０によって生成されたデータであってもよいし、立体音響生成装置１０とは異なる装置によって生成されたデータであってもよい。

　続いて、上記機能を有する制御装置６０の物理的な構成、すなわちハードウェア構成を説明する。制御装置６０は、コンピュータ装置であり、ＣＰＵ、ＭＰＵ、ＧＰＵ等の演算装置である電子回路、ＲＯＭ、ＲＡＭ、レジスタードメモリ、アンバッファードメモリ等のメモリ、および、ＳＳＤ、ＨＤＤ等のストレージを備える。演算装置は、ストレージからオペレーティングシステムや各種プログラムをメモリにロードし、メモリから取り出した命令を実行する。制御装置６０は、ＡＳＩＣ、ＦＰＧＡ等の集積回路を備えてもよい。

　また、制御装置６０が通信部６３を備える場合、制御装置６０は、通信インターフェースを備えている。通信インターフェースは、ハードウェア、ソフトウェア、または、これらの組み合わせとして実装されている。

　図８は、制御装置６０のハードウェア構成の一例を示す。制御装置６０は、ＣＰＵ６０１、通信装置６０２、ＲＯＭ６０３、ＲＡＭ６０４、および、ストレージ６０５を備えている。ＣＰＵ６０１と、通信装置６０２、ＲＯＭ６０３、ＲＡＭ６０４、および、ストレージ６０５の各々とは、バス６０６を介して接続されており、これにより、バス６０６を通じてデータや信号が伝送される。上記構成においては、ＣＰＵ６０１、ＲＯＭ６０３、および、ＲＡＭ６０４が制御部６１に対応し、ストレージ６０５が記憶部６２に対応し、通信装置６０２が通信部６３に対応する。

　なお、制御装置６０は、自身が実行する全ての処理についてソフトウェア処理を行うものに限られない。上述のように、制御装置６０は、自身が実行する処理の少なくとも一部についてハードウェア処理を行う専用のハードウェア回路（例えば特定用途向け集積回路：ＡＳＩＣ）を備えてもよい。すなわち、制御装置６０は、１）コンピュータプログラム（ソフトウェア）に従って動作する１つ以上のプロセッサ、２）各種処理のうち少なくとも一部の処理を実行する１つ以上の専用のハードウェア回路、あるいは３）それらの組み合わせ、を含む回路（ｃｉｒｃｕｉｔｒｙ）として構成し得る。プロセッサは、ＣＰＵ等の演算装置ならびに、ＲＡＭおよびＲＯＭ等のメモリを含み、メモリは、処理を演算装置に実行させるように構成されたプログラムコードまたは指令を格納している。メモリすなわちコンピュータ可読媒体は、汎用または専用のコンピュータでアクセスできるあらゆる利用可能な媒体を含む。

　また、制御装置６０の機能は、複数の情報処理装置によって実現されてもよい。１つの情報処理装置は単体のコンピュータ装置である。すなわち、制御装置６０は、１または複数の情報処理装置から構成されていればよい。

　［立体音響再生装置の動作］
　図９～図１１を参照して、立体音響再生装置５０の動作を説明する。図９は、立体音響再生装置５０による処理の流れを示す。

　図９に示すように、立体音響再生装置５０の利用が開始されると、制御装置６０が、現実空間ＲＳと音響空間ＡＳとの対応付けを実施する（ステップＳ２０）。
　図１０は、一例として、立体音響再生装置５０がスマートフォンである場合を示す。例えば、図１０に示すように、制御装置６０の指示に基づき、出力装置９０の表示部に、現実空間ＲＳにおけるユーザの周囲の像に重ねて、基準位置を定めるためのマークＭ１が表示される。入力装置８０に対して、設定を指示する領域の選択等の所定の操作が行われることにより、現実空間ＲＳの像のなかでマークＭ１と重ねられた位置が、現実空間ＲＳの基準位置に設定され、マークＭ１の向きに対応する方向が現実空間ＲＳの基準方向に設定される。現実空間ＲＳにおける位置および方向は、現実空間ＲＳにて予め三次元的に記録された構造物の配置等に基づき特定される。そして、現実空間ＲＳの基準位置および基準方向が、音響空間ＡＳにて予め定められている基準位置および基準方向と一致するように、現実空間ＲＳの位置および方向と音響空間ＡＳの位置および方向とが対応付けられる。

　なお、現実空間ＲＳと音響空間ＡＳとの三次元的な対応付けが可能であれば、その方法は上記とは異なってもよい。例えば、現実空間ＲＳにおけるユーザの位置および向きが、現実空間ＲＳの基準位置および基準方向とされて、音響空間ＡＳの基準位置および基準方向と対応付けられてもよい。こうした構成においては、表示部を利用した現実空間ＲＳの基準位置および基準方向の設定は実施されなくてよく、出力装置９０は表示部を含んでいなくてもよいし、さらに、立体音響再生装置５０は入力装置８０を備えていなくてもよい。また、位置検出装置７０は、ユーザとは離れた位置に設置されて、ユーザの位置および向きを検出してもよい。この場合、出力装置９０の音声出力部は、ユーザに装着あるいは携帯されてもよいし、ユーザから離れた場所に配置されてもよい。

　また、現実空間ＲＳでの特定の方向が基準方向として予め設定されていてもよい。例えば、大型のディスプレイ等である表示装置が配置され、この表示装置に、立体音響によって演出されるシーンに関連する映像が表示される場合、ユーザに対する表示装置の方向が基準方向とされてもよい。ユーザに対する表示装置の方向は、マーカーやセンサを利用して特定される。こうした構成によれば、立体音響と、基準方向に合わせた映像等である立体音響以外の要素とを組み合わせた演出が可能であるため、ユーザの臨場感や興趣がより高められる。

　続いて、入力装置８０に対して再生を指示する所定の操作が行われること等、再生のための所定の条件が満たされると、制御装置６０からの指示に基づき、立体音響データ６２ａに基づく音声が出力装置９０の音声出力部によって再生される（ステップＳ２１）。再生可能な立体音響データ６２ａが複数ある場合には、再生対象の立体音響が、現実空間ＲＳと音響空間ＡＳとの対応付けの前もしくは後に選択されてもよい。

　詳細には、制御装置６０は、立体音響データ６２ａが含む音声情報によって規定される音声が、音響空間ＡＳにて規定されている発信位置に対応する現実空間ＲＳの位置である対応発信位置と、現実空間ＲＳでのユーザの位置とに応じた音量で再生されるように、出力装置９０に指示する。音響空間ＡＳでの音声の発信位置は、立体音響データ６２ａが含む位置情報によって規定されている。

　例えば、対応発信位置とユーザの位置とが近いほど、音量が大きくされる。あるいは、対応発信位置とユーザの位置との距離が所定距離以上である場合に、音声が減衰される。あるいは、対応発信位置とユーザの位置との距離が所定距離以上である場合に、音声が消音される。また、ユーザの位置および向きに対する対応発信位置の方向に応じて、対応発信位置の方から音声が聞こえるように、音声出力部を構成する左右のイヤホンや複数のスピーカーの各々から出力される音声の音量が制御される。

　こうした音量の制御は、ユーザに対する音声出力部の位置を考慮して行われればよい。また、現実空間ＲＳでのユーザの位置や向きが変化した場合には、ユーザの位置から対応発信位置までの距離や方向の変化に応じて、音量が変更される。

　また、立体音響データ６２ａに、再生速度を示す再生速度情報のように、音声および位置以外の要素を規定する情報が含まれている場合には、こうした要素についても、再生状況に反映される。

　このように、現実空間ＲＳでのユーザの位置や向きに応じて立体音響を構成する音声が再生されることから、ユーザのいる環境と音声とが結びついた印象がユーザに与えられるため、ユーザの臨場感が高められる。
　なお、図９に示したフローにおいて、ステップＳ２０の処理は、位置管理部６１ａとしての処理であり、ステップＳ２１の処理は、再生制御部６１ｂとしての処理である。

　続いて、トリガーによってシーンが切り換えられる形態について説明する。例として、再生される音声の切り換えにより、第１シーンから第２シーンへとシーンが切り換えられる場合について説明する。例えば、第１シーンは、海上のシーンであり、カモメの音や波の音といった音声が再生される。そして、第２シーンは、海中のシーンであり、飛び込み音や海中の水の流れといった音声が再生される。

　図１１に示す立体音響再生装置５０による処理の流れのうち、ステップＳ２０およびステップＳ２１の処理は、図９に示した処理と同じである。ステップＳ２１の処理によって、第１シーンに対応する立体音響の音声が再生される。

　第１シーンの音声の再生開始後、制御装置６０は、シーンの切り替えのトリガーとして設定されている条件である切替条件が成立したかを判断する（ステップＳ２２）。切換条件が成立していない場合には（ステップＳ２２で否定判定）、制御装置６０は、切替条件の成立まで待機する。待機中は、第１シーンに対応する音声の再生が継続される。

　切替条件は、例えば、現実空間ＲＳでのユーザの位置に関する条件を含んでいてもよい。さらに、上記ユーザの位置に関する条件は、現実空間ＲＳでの特定の位置とユーザの位置との関係に関する条件であってもよいし、上記特定の位置は、第２シーンの音声についての上記対応発信位置であってもよい。

　例えば、ユーザが、第１シーンの音声の再生開始時の位置から所定距離だけ移動したことが切替条件とされてもよい。この場合、この条件は、現実空間ＲＳでのユーザの位置に関する条件である。また例えば、現実空間ＲＳの基準位置から所定範囲内もしくは所定範囲外にユーザが移動したことが切替条件とされてもよい。この場合、現実空間ＲＳの基準位置は、上記特定の位置に対応する。また例えば、第２シーンの音声の音響空間ＡＳでの発信位置に対応する現実空間ＲＳでの位置から所定範囲内にユーザが移動したことが切替条件とされてもよい。この場合、この条件は、対応発信位置とユーザの位置との関係に関する条件である。

　また、立体音響再生装置５０が検出可能な要素であれば、ユーザの位置以外の要素が、切替条件とされてもよい。例えば、ユーザの身振りや手振りが、切替条件とされてもよいし、制御装置６０がサーバであって複数のユーザによる立体音響の再生が並行されている場合、複数のユーザが所定の身振りや手振りを行うことが、切替条件とされてもよい。

　切替条件が成立したと判断される場合（ステップＳ２２で肯定判定）、制御装置６０は、第１シーンの音声から第２シーンの音声への再生の切り替えを、出力装置９０の音声出力部に指示する（ステップＳ２３）。これにより、第１シーンに替えて第２シーンに対応する立体音響の音声が再生される。すなわち、立体音響データ６２ａが含む音声情報および位置情報に基づいて、現実空間ＲＳでのユーザの位置や向きに応じた音量で音声が再生される。

　上記構成によれば、例えば、カモメの音や波の音が再生されている海上のシーンから、ユーザが移動して特定の位置に近づくと、飛び込み音に続けて海中の水の流れが再生される海中のシーンに切り替わるというように、物語のような演出が可能である。

　以上のように、シーンの切り替えが行われることで、立体音響によるより多様な演出が可能であり、ユーザの臨場感および興趣が高められる。特に、切替条件が、現実空間ＲＳでのユーザの位置に関する条件を含む場合、ユーザの移動に合わせてシーンが切り換えられるため、現実空間ＲＳとユーザとの空間的な関わりが音声に反映されることから、ユーザの臨場感がより高められる。

　なお、上記では、２つのシーンが切り換えられる例を説明したが、３つ以上のシーンが、それぞれの切替条件の成立を契機に、順に切り替えられてもよい。また、切り替えられる複数のシーンの音声には、立体音響ではない音声、すなわち、発信位置が規定されておらず、ユーザの位置に関わらず所定の音量で出力される音声が含まれてもよい。要は、複数のシーンの少なくとも１つが、立体音響データ６２ａを用いた音声の再生を伴えばよい。

　［変形例］　
　上述した立体音響再生装置５０の構成および動作は下記のように変更されてもよい。
　・出力装置９０の表示部に仮想空間が表示されている状態で、立体音響データ６２ａを用いた音声が再生されてもよい。仮想空間は、例えば、店舗やイベント会場等のように、現実空間と同様にユーザが活動可能な空間である。この場合、制御装置６０は、現実空間ＲＳと音響空間ＡＳとの対応付けに代えて、仮想空間と音響空間ＡＳとの位置および方向を対応付け、音響空間ＡＳにて規定されている音声の発信位置に対応する仮想空間の位置と、仮想空間内でのユーザの位置とに応じた音量で音声が再生されるように、再生を制御する。こうした構成においては、表示部は、制御装置２０からのデータに基づく画像を表示すればよく、現実空間の像を視認可能とする必要はない。表示部に表示される仮想空間は、既存の仮想空間のデータや、空間の図面データの取り込みに基づき生成されてもよい。

　以上説明したように、上記実施形態によれば、以下の効果が得られる。
　（１）立体音響生成装置１０にて、仮想空間ＶＳ内に描かれた軌跡を示すオブジェクトに沿って移動するように、音声の発信位置が設定される。したがって、三次元空間で線や点等を描くことにより、音声の発信位置を三次元的に規定できるため、直感的な動作によって立体音響を作成することができる。

　また、上記オブジェクトが線状であれば、より直感的な動作で、音声の発信位置の移動態様を規定することができる。
　（２）描画速度、すなわち、上記軌跡を描くための動きの速度に応じて音声の再生速度が設定されるため、直感的な動作によって再生速度を規定できる。

　（３）立体音響データが、音声ごとのオブジェクトに沿って発信位置が設定された複数の音声が重ねて出力されるように構成される形態であれば、複数の音声がそれぞれの発信位置から発せられ、かつ発信位置が変化するという複雑な立体音響を、直感的な動作によって容易に作成することができる。

　（４）立体音響生成装置１０にて、生成された立体音響データを用いた音声の再生が可能であるため、作成した立体音響の確認が容易であり、ユーザの利便性が高められる。
　（５）立体音響生成装置１０にて、立体音響データに基づき再生されている音声の発信位置が、オブジェクト上に示される形態であれば、ユーザは、発信位置の変化を視覚的に把握できるため、作成した立体音響をより直感的に捉えることができる。

　（６）立体音響再生装置５０にて、現実空間ＲＳと音響空間ＡＳとが対応付けられ、音響空間ＡＳでの音声の発信位置に対応する現実空間ＲＳの位置と、ユーザの位置との関係に応じた音量で、音声が再生される。したがって、ユーザのいる環境と音声とが結びついた印象がユーザに与えられるため、ユーザの臨場感が高められる。

　（７）立体音響再生装置５０にて、所定の条件が成立したとき、再生する音声が切り換えられるため、立体音響によるより多様な演出が可能であり、ユーザの臨場感および興趣が高められる。

　（８）音声の切り換え、すなわちシーンの切り替えの条件が、現実空間ＲＳでのユーザの位置に関する条件を含む場合、ユーザの移動に合わせてシーンが切り換えられるため、現実空間ＲＳとユーザとの空間的な関わりが音声に反映されることから、ユーザの臨場感がより高められる。

　特に、上記条件が、現実空間ＲＳでの特定の位置とユーザの位置との関係に関する条件であれば、上記空間的な関わりとより関連の深い演出が可能であり、上記特定の位置が、音響空間ＡＳでの音声の発信位置に対応する現実空間ＲＳの位置であれば、現実空間ＲＳと立体音響とを効果的に関連付けた演出が可能である。したがって、ユーザの臨場感や興趣が高められる。

　［付記］
　上記各実施形態および変形例から把握できる技術的思想について以下に記載する。
　（Ａ）立体音響生成装置と立体音響再生装置とを備える立体音響システムであって、
　前記立体音響生成装置は、
　入力装置を通じた第１ユーザからの指示に従って、当該指示に対応する動きの軌跡を示すオブジェクトを仮想空間内に配置する描画管理部と、
　選択された音声について、前記オブジェクトに沿って移動するように前記音声の発信位置を設定した立体音響データを生成するデータ生成部と、を備え、
　前記立体音響再生装置は、
　第２ユーザが実在する空間である現実空間での前記第２ユーザの位置を取得するとともに、前記現実空間の位置と前記仮想空間の位置とを対応付ける位置管理部と、
　前記立体音響データを用いた音声の再生を制御する再生制御部であって、前記仮想空間での前記音声の発信位置に対応する前記現実空間の位置が対応発信位置であり、前記対応発信位置と前記第２ユーザの位置との関係に応じた音量での前記音声の再生を、出力装置が有する音声出力部に指示する再生制御部と、を備える
　立体音響システム。

　上記構成によれば、立体音響生成装置を用いることで、三次元空間で線を描くことにより、音声の発信位置を三次元的に規定できるため、第１ユーザは、直感的な動作によって立体音響を作成することができる。そして、立体音響再生装置を用いることで、第２ユーザのいる環境と音声とが結びついた印象が第２ユーザに与えられるため、第２ユーザの臨場感が高められる。

　（Ｂ）音声情報と、前記音声情報が示す音声の発信位置を、仮想的な三次元空間である音響空間にて規定した位置情報とを含む立体音響データを用いて、前記音声の再生を制御する立体音響再生装置であって、
　ユーザが実在する空間である現実空間での前記ユーザの位置を取得するとともに、前記現実空間の位置と前記音響空間の位置とを対応付ける位置管理部と、
　前記音響空間での前記音声の発信位置に対応する前記現実空間の位置が対応発信位置であり、前記対応発信位置と前記ユーザの位置との関係に応じた音量での前記音声の再生を、出力装置が有する音声出力部に指示する再生制御部と、を備える
　立体音響再生装置。

　１０…立体音響生成装置
　２０…制御装置
　３０…入力装置
　４０…出力装置
　５０…立体音響再生装置
　６０…制御装置
　７０…位置検出装置
　８０…入力装置
　９０…出力装置
　１００…立体音響システム

Claims

　入力装置を通じた第１ユーザからの指示に従って、オブジェクトを仮想空間内に配置する描画管理部と、
　選択された音声について、前記オブジェクトの位置と一致するように前記音声の発信位置を設定した立体音響データを生成するデータ生成部と、を備える
　立体音響生成装置。
　前記描画管理部は、前記オブジェクトとして、前記第１ユーザからの前記指示に対応する動きの軌跡を示すオブジェクトを前記仮想空間内に配置し、
　前記データ生成部は、前記オブジェクトに沿って移動するように前記音声の前記発信位置を設定することにより、前記立体音響データを生成する
　請求項１に記載の立体音響生成装置。
　前記描画管理部が配置する前記オブジェクトには、線状のオブジェクトが含まれる
　請求項２に記載の立体音響生成装置。
　前記立体音響データは、前記音声の再生速度を規定する情報を含み、
　前記データ生成部は、前記音声の再生速度を、前記動きの速度に対応する速度に設定して、前記立体音響データを生成する
　請求項２に記載の立体音響生成装置。
　前記データ生成部は、複数の音声の各々について、前記音声ごとの前記オブジェクトに沿って移動するように各音声の発信位置を設定し、前記複数の音声が重ねて出力されるように構成された前記立体音響データを生成する
　請求項２に記載の立体音響生成装置。
　前記立体音響データに基づいて、設定された前記発信位置に応じた音量での前記音声の再生を、出力装置が有する音声出力部に指示する再生制御部をさらに備える
　請求項２に記載の立体音響生成装置。
　前記立体音響データに基づき再生されている前記音声の前記発信位置を前記オブジェクト上に示した前記仮想空間の画像を、前記出力装置が有する表示部に表示させる
　請求項６に記載の立体音響生成装置。
　請求項１に記載の立体音響生成装置によって生成された前記立体音響データを用いて、音声の再生を制御する立体音響再生装置であって、
　第２ユーザが実在する空間である現実空間での前記第２ユーザの位置を取得するとともに、前記現実空間の位置と前記仮想空間の位置とを対応付ける位置管理部と、
　前記仮想空間での前記音声の前記発信位置に対応する前記現実空間の位置が対応発信位置であり、前記対応発信位置と前記第２ユーザの位置との関係に応じた音量での前記音声の再生を、出力装置が有する音声出力部に指示する再生制御部と、を備える
　立体音響再生装置。
　再生対象の音声の切り換えの条件が設定されており、前記条件が成立したとき、前記再生制御部は、再生する音声の切り替えを前記音声出力部に指示する
　請求項８に記載の立体音響再生装置。
　前記条件は、前記現実空間での前記第２ユーザの位置に関する条件を含む
　請求項９に記載の立体音響再生装置。
　前記条件は、前記現実空間での特定の位置と前記第２ユーザの位置との関係に関する条件を含む
　請求項１０に記載の立体音響再生装置。
　前記再生制御部は、前記条件が成立したとき、第１の音声から第２の音声への再生の切り替えを前記音声出力部に指示し、
　前記第２の音声は、前記立体音響データを用いて再生される音声であり、
　前記現実空間での前記特定の位置は、前記第２の音声についての前記対応発信位置である
　請求項１１に記載の立体音響再生装置。
　１または複数のコンピュータが、
　入力装置を通じた第１ユーザからの指示に従って、オブジェクトを仮想空間内に配置することと、
　選択された音声について、前記オブジェクトの位置と一致するように前記音声の発信位置を設定した立体音響データを生成することと、を実行する
　立体音響生成方法。
　１または複数のコンピュータに、
　入力装置を通じた第１ユーザからの指示に従って、オブジェクトを仮想空間内に配置することと、
　選択された音声について、前記オブジェクトの位置と一致するように前記音声の発信位置を設定した立体音響データを生成することと、を実行させる
　立体音響生成プログラム。
　請求項１４に記載の立体音響生成プログラムを記録したコンピュータ読み取り可能な記録媒体。