JP6856566B2

JP6856566B2 - 仮想空間を提供するための方法、および当該方法をコンピュータに実行させるためのプログラム、および当該プログラムを実行するための情報処理装置

Info

Publication number: JP6856566B2
Application number: JP2018031364A
Authority: JP
Inventors: 一晃澤木
Original assignee: Colopl Inc
Current assignee: Colopl Inc
Priority date: 2018-02-23
Filing date: 2018-02-23
Publication date: 2021-04-07
Anticipated expiration: 2037-05-11
Also published as: JP2018190390A; JP2021101358A

Description

この開示は、仮想空間における撮影処理に関し、より特定的には、撮影タイミングを制御する技術に関する。

ヘッドマウントデバイス（ＨＭＤ：Head-Mounted Device）を用いて仮想空間（仮想現実空間）を提供する技術が知られている。また、仮想空間におけるユーザの体験を豊かにする様々な技術が提案されている。

例えば、特開２００３−１４１５６３号公報（特許文献１）は、「対象者の頭部を正面と側面の２方向から撮影した撮影情報から、個人特定に必要な顔特徴点を抽出し、該顔特徴点に基づいて、頭部骨格、鼻、口、眉、目といった各顔部品の３次元構造を復元し、これら各顔部品を一体化して、顔３次元形状を復元」し、仮想空間での自分の分身（アバター）を構成する技術を開示している。

また、非特許文献１は、仮想空間の配置されるアバターを仮想的なカメラによって撮影する技術を開示している。

特開２００３−１４１５６３号公報

"Ｏｃｕｌｕｓ、ＶＲ自撮り棒とアバターのデモを披露"、［online］、［平成２９年４月１０日検索］、インターネット〈URL：http://jp.techcrunch.com/2016/04/14/20160413vr-selfie-stick/〉

従来、ユーザは、仮想空間に展開される景色やオブジェクトを撮影する際に、コントローラを操作するなどの能動的な行動を行なう必要があった。しかしながら、これらの行動を行なっている間に、撮影タイミングを逃してしまう場合があった。そのため、より簡易な方法で仮想空間における撮影を実現するための技術が必要とされている。

また、仮想空間上でユーザ同士がコミュニケーションを図る技術が提案されている。これに伴い、仮想空間上におけるユーザ間のコミュニケーションを促進する技術が必要とされている。

本開示は、上記のような問題を解決するためになされたものであって、ある局面における目的は、ユーザの仮想空間における体験をより豊かにすることができる技術を提供することである。

ある実施形態に従うと、ヘッドマウントデバイスによって仮想空間を提供するためにコンピュータで実行される方法が提供される。この方法は、仮想空間を定義するステップと、ヘッドマウントデバイスのユーザの発話に対応する第１音声信号を受け付けるステップ
と、第１音声信号をトリガとして仮想空間による撮影を実行するステップとを備える。

開示された技術的特徴の上記および他の目的、特徴、局面および利点は、添付の図面と関連して理解されるこの発明に関する次の詳細な説明から明らかとなるであろう。

ＨＭＤシステムの構成の概略を示す図である。ある局面に従うコンピュータのハードウェア構成の一例を表すブロック図である。ある実施形態に従うＨＭＤに設定されるｕｖｗ視野座標系を概念的に表す図である。ある実施形態に従う仮想空間を表現する一態様を概念的に表す図である。ある実施形態に従うＨＭＤを装着するユーザの頭部を上から表した模式図である。仮想空間において視認領域をＸ方向から見たＹＺ断面を表す図である。仮想空間において視認領域をＹ方向から見たＸＺ断面を表す図である。ある実施の形態に従うコントローラの概略構成を表す図である。ある実施形態に従うコンピュータをモジュール構成として表わすブロック図である。ＨＭＤシステムが実行する処理を表わすフローチャートである。ネットワークにおいて、複数のＨＭＤのそれぞれが、複数のユーザのそれぞれに仮想空間を提供する状況を表す模式図である。図１１Ａにおいてユーザ１９０Ａが視認する視界画像１１１０を表す図である。サーバのハードウェア構成およびモジュール構成の一例を示す。コンピュータ２００Ａのユーザ１９０Ａとコンピュータ２００Ｂのユーザ１９０Ｂとが仮想空間を介して通信する処理を表すフローチャートである。仮想空間における撮影処理について説明するための図である。図１４の自動カメラが撮影した画像を表す図である。コンピュータにおける自動撮影処理を表すフローチャートである。他の局面における自動カメラの移動制御を説明するための図である。アバターオブジェクトを考慮した自動カメラ制御モジュールによる撮影処理を説明するための図である。図１８の自動カメラにより生成された画像を表す図である。複数のユーザが同じ対象物を見ている場合の自動カメラ制御モジュール２３５Ａの処理を説明するための図（その１）である。図２０の自動カメラにより生成された画像を表す図である。複数のユーザが同じ対象物を見ている場合の自動カメラ制御モジュールの処理を説明するための図（その２）である。図２２の自動カメラにより生成された画像を表す図である。ユーザ間のコミュニケーションを促進するためにコンピュータによって実行される自動撮影処理を表すフローチャートである。他の局面に従うユーザ間のコミュニケーションを促進するための自動撮影処理を表すフローチャートである。ある実施形態に従う撮影画像ＤＢのデータ構造の一例を表す図である。

以下、この技術的思想の実施形態について図面を参照しながら詳細に説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。なお、以下で説明される各実施形態は、適宜選択的に組み合わされてもよい。

［ＨＭＤシステムの構成］
図１を参照して、ＨＭＤ（Head-Mounted Device）システム１００の構成について説明する。図１は、ＨＭＤシステム１００の構成の概略を示す。ＨＭＤシステム１００は、家庭用のシステムとしてあるいは業務用のシステムとして提供される。

ＨＭＤシステム１００は、ＨＭＤ（Head-Mounted Device）セット１０５Ａ，１０５Ｂ，１０５Ｃ，１０５Ｄと、ネットワーク１９とサーバ１５０とを含む。ＨＭＤセット１０５Ａ，１０５Ｂ，１０５Ｃ，１０５Ｄの各々は、ネットワーク１９を介してサーバ１５０と通信可能に構成される。以下、ＨＭＤセット１０５Ａ，１０５Ｂ，１０５Ｃ，１０５Ｄを総称して、ＨＭＤセット１０５とも言う。なお、ＨＭＤシステム１００を構成するＨＭＤセット１０５の数は、４つに限られず、３つ以下でも、５つ以上でもよい。ＨＭＤセット１０５は、ＨＭＤ１１０と、ＨＭＤセンサ１２０と、コントローラ１６０と、コンピュータ２００とを備える。ＨＭＤ１１０は、モニタ１１２と、スピーカ１１８と、マイク１１９と、注視センサ１４０とを含む。コントローラ１６０は、モーションセンサ１３０を含む。

ある局面において、コンピュータ２００は、インターネットその他のネットワーク１９に接続可能であり、ネットワーク１９に接続されているサーバ１５０その他のコンピュータ（例えば、他のＨＭＤセット１０５のコンピュータ）と通信可能である。別の局面において、ＨＭＤ１１０は、ＨＭＤセンサ１２０の代わりに、またはＨＭＤ１２０に加えてセンサ１１４を含み得る。

ＨＭＤ１１０は、ユーザ１９０の頭部に装着され、仮想空間をユーザ１９０に提供する。より具体的には、ＨＭＤ１１０は、右目用の画像および左目用の画像をモニタ１１２にそれぞれ表示する。ユーザ１９０の各目がそれぞれの画像を視認すると、ユーザ１９０は、両目の視差に基づき当該画像を３次元の画像として認識し得る。ＨＭＤ１１０は、モニタを備える所謂ヘッドマウントディスプレイと、スマートフォンその他のモニタを有する端末を装着可能なヘッドマウント機器のいずれをも含み得る。

モニタ１１２は、例えば、非透過型の表示装置として実現される。ある局面において、モニタ１１２は、ユーザ１９０の両目の前方に位置するようにＨＭＤ１１０の本体に配置されている。したがって、ユーザ１９０は、モニタ１１２に表示される３次元画像を視認すると、仮想空間に没入することができる。ある実施形態において、仮想空間は、例えば、背景、ユーザ１９０が操作可能なオブジェクト、ユーザ１９０が選択可能なメニューの画像を含む。ある実施形態において、モニタ１１２は、所謂スマートフォンその他の情報表示端末が備える液晶モニタまたは有機ＥＬ（Electro Luminescence）モニタとして実現され得る。

他の局面において、モニタ１１２は、透過型の表示装置として実現され得る。この場合、ＨＭＤ１１０は、図１に示されるようにユーザ１９０の目を覆う密閉型ではなく、メガネ型のような開放型であり得る。透過型のモニタ１１２は、その透過率を調整することにより、一時的に非透過型の表示装置として機能し得る。また、モニタ１１２は、仮想空間を構成する画像の一部と、現実空間とを同時に表示する構成を含んでいてもよい。例えば、モニタ１１２は、ＨＭＤ１１０に搭載されたカメラで撮影した現実空間の画像を表示してもよいし、一部の透過率を高く設定することにより現実空間を視認可能にしてもよい。

ある局面において、モニタ１１２は、右目用の画像を表示するためのサブモニタと、左目用の画像を表示するためのサブモニタとを含み得る。別の局面において、モニタ１１２は、右目用の画像と左目用の画像とを一体として表示する構成であってもよい。この場合、モニタ１１２は、高速シャッタを含む。高速シャッタは、画像がいずれか一方の目にのみ認識されるように、右目用の画像と左目用の画像とを交互に表示可能に作動する。

ある局面において、ＨＭＤ１１０は、複数の光源（図示しない）を含む。各光源は例えば、赤外線を発するＬＥＤ（Light Emitting Diode）により実現される。ＨＭＤセンサ１２０は、ＨＭＤ１１０の動きを検出するためのポジショントラッキング機能を有する。ある局面において、ＨＭＤセンサ１２０は、ＨＭＤ１１０が発する複数の赤外線を読み取り、現実空間内におけるＨＭＤ１１０の位置および傾きを検出する。

なお、別の局面において、ＨＭＤセンサ１２０は、カメラにより実現されてもよい。この場合、ＨＭＤセンサ１２０は、カメラから出力されるＨＭＤ１１０の画像情報を用いて、画像解析処理を実行することにより、ＨＭＤ１１０の位置および傾きを検出することができる。

別の局面において、ＨＭＤ１１０は、位置検出器として、ＨＭＤセンサ１２０の代わりにセンサ１１４を備えてもよい。ＨＭＤ１１０は、センサ１１４を用いて、ＨＭＤ１１０自身の位置および傾きを検出し得る。例えば、センサ１１４が角速度センサ、地磁気センサ、加速度センサ、あるいはジャイロセンサである場合、ＨＭＤ１１０は、ＨＭＤセンサ１２０の代わりに、これらの各センサのいずれかを用いて、自身の位置および傾きを検出し得る。一例として、センサ１１４が角速度センサである場合、角速度センサは、現実空間におけるＨＭＤ１１０の３軸周りの角速度を経時的に検出する。ＨＭＤ１１０は、ＨＭＤ１１０の３軸周りの角度の各々の時間的変化を算出し、さらに、角度の時間的変化に基づいて、ＨＭＤ１１０の傾きを算出する。

スピーカ１１８は、音声信号を音声に変換してユーザ１９０に出力する。マイク１１９は、ユーザ１９０の発話を音声信号に変換してコンピュータ２００に出力する。なお、他の局面において、ＨＭＤ１１０は、スピーカ１１８に替えてイヤホンを含み得る。

注視センサ１４０は、ユーザ１９０の右目および左目の視線が向けられる方向（視線）を検出する。当該方向の検出は、例えば、公知のアイトラッキング機能によって実現される。注視センサ１４０は、当該アイトラッキング機能を有するセンサにより実現される。ある局面において、注視センサ１４０は、右目用のセンサおよび左目用のセンサを含むことが好ましい。注視センサ１４０は、例えば、ユーザ１９０の右目および左目に赤外光を照射するとともに、照射光に対する角膜および虹彩からの反射光を受けることにより各眼球の回転角を検出するセンサであってもよい。注視センサ１４０は、検出した各回転角に基づいて、ユーザ１９０の視線を検知することができる。

サーバ１５０は、コンピュータ２００にプログラムを送信し得る。別の局面において、サーバ１５０は、他のユーザによって使用される他のＨＭＤセット１０５を構成するコンピュータ２００と通信し得る。例えば、アミューズメント施設において、複数のユーザが参加型のゲームを行なう場合、各コンピュータ２００は、各ユーザの動作に基づく信号を他のコンピュータ２００と通信して、同じ仮想空間において複数のユーザが共通のゲームを楽しむことを可能にする。

コントローラ１６０は、有線または無線によりコンピュータ２００に接続されている。コントローラ１６０は、ユーザ１９０からコンピュータ２００への命令の入力を受け付ける。ある局面において、コントローラ１６０は、ユーザ１９０によって把持可能に構成される。また、コントローラ１６０は、コンピュータ２００から送信される信号に基づいて、振動、音、光のうちの少なくともいずれかを出力するように構成されてもよい。コントローラ１６０は、ユーザ１９０から、仮想空間に配置されるオブジェクトの位置や動きを制御するための操作を受け付ける。

モーションセンサ１３０は、ある局面において、ユーザの手に取り付けられて、ユーザの手の動きを検出する。例えば、モーションセンサ１３０は、手の回転速度、回転数等を検出する。検出された信号は、コンピュータ２００に送られる。ある局面において、モーションセンサ１３０は、コントローラ１６０に設けられている。ある実施形態において、現実空間における安全のため、コントローラ１６０は、手袋型のようにユーザ１９０の手に装着されることにより容易に飛んで行かないものに装着されるのが望ましい。別の局面において、ユーザ１９０に装着されないセンサがユーザ１９０の手の動きを検出してもよい。例えば、ユーザ１９０を撮影するカメラの信号が、ユーザ１９０の動作を表わす信号として、コンピュータ２００に入力されてもよい。モーションセンサ１３０とコンピュータ２００とは、一例として、無線により互いに接続される。無線の場合、通信形態は特に限られず、例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）その他の公知の通信手法が用いられる。

［ハードウェア構成］
図２を参照して、本実施形態に係るコンピュータ２００について説明する。図２は、ある局面に従うコンピュータ２００のハードウェア構成の一例を表すブロック図である。コンピュータ２００は、主たる構成要素として、プロセッサ１０と、メモリ１１と、ストレージ１２と、入出力インターフェイス１３と、通信インターフェイス１４とを備える。各構成要素は、それぞれ、バス１５に接続されている。

プロセッサ１０は、コンピュータ２００に与えられる信号に基づいて、あるいは、予め定められた条件が成立したことに基づいて、メモリ１１またはストレージ１２に格納されているプログラムに含まれる一連の命令を実行する。ある局面において、プロセッサ１０は、ＣＰＵ（Central Processing Unit）、ＭＰＵ（Micro Processor Unit）、ＦＰＧＡ（Field-Programmable Gate Array）その他のデバイスとして実現される。

メモリ１１は、プログラムおよびデータを一時的に保存する。プログラムは、例えば、ストレージ１２からロードされる。データは、コンピュータ２００に入力されたデータと、プロセッサ１０によって生成されたデータとを含む。ある局面において、メモリ１１は、ＲＡＭ（Random Access Memory）その他の揮発メモリとして実現される。

ストレージ１２は、プログラムおよびデータを永続的に保持する。ストレージ１２は、例えば、ＲＯＭ（Read-Only Memory）、ハードディスク装置、フラッシュメモリ、その他の不揮発記憶装置として実現される。ストレージ１２に格納されるプログラムは、ＨＭＤシステム１００において仮想空間を提供するためのプログラム、シミュレーションプログラム、ゲームプログラム、ユーザ認証プログラム、他のコンピュータ２００との通信を実現するためのプログラムを含む。ストレージ１２に格納されるデータは、仮想空間を規定するためのデータおよびオブジェクト等を含む。

なお、別の局面において、ストレージ１２は、メモリカードのように着脱可能な記憶装置として実現されてもよい。さらに別の局面において、コンピュータ２００に内蔵されたストレージ１２の代わりに、外部の記憶装置に保存されているプログラムおよびデータを使用する構成が使用されてもよい。このような構成によれば、例えば、アミューズメント施設のように複数のＨＭＤシステム１００が使用される場面において、プログラムやデータの更新を一括して行なうことが可能になる。

ある実施形態において、入出力インターフェイス１３は、ＨＭＤ１１０、ＨＭＤセンサ１２０およびモーションセンサ１３０との間で信号を通信する。ある局面において、ＨＭＤ１１０に含まれるスピーカ１１８，およびマイク１１９は、ＨＭＤ１１０の入出力インターフェイス１３を介してコンピュータ２００との通信を行ない得る。ある局面において、入出力インターフェイス１３は、ＵＳＢ（Universal Serial Bus）、ＤＶＩ（Digital Visual Interface）、ＨＤＭＩ（登録商標）（High-Definition Multimedia Interface）その他の端子を用いて実現される。なお、入出力インターフェイス１３は上述のものに限られない。

ある実施形態において、入出力インターフェイス１３は、さらに、コントローラ１６０と通信し得る。例えば、入出力インターフェイス１３は、コントローラ１６０およびモーションセンサ１３０から出力された信号の入力を受ける。別の局面において、入出力インターフェイス１３は、プロセッサ１０から出力された命令を、コントローラ１６０に送る。当該命令は、振動、音声出力、発光等をコントローラ１６０に指示する。コントローラ１６０は、当該命令を受信すると、その命令に応じて、振動、音声出力または発光のいずれかを実行する。

通信インターフェイス１４は、ネットワーク１９に接続されて、ネットワーク１９に接続されている他のコンピュータ（例えば、サーバ１５０）と通信する。ある局面において、通信インターフェイス１４は、例えば、ＬＡＮ（Local Area Network）その他の有線通信インターフェイス、あるいは、ＷｉＦｉ（Wireless Fidelity）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＮＦＣ（Near Field Communication）その他の無線通信インターフェイスとして実現される。なお、通信インターフェイス１４は上述のものに限られない。

ある局面において、プロセッサ１０は、ストレージ１２にアクセスし、ストレージ１２に格納されている１つ以上のプログラムをメモリ１１にロードし、当該プログラムに含まれる一連の命令を実行する。当該１つ以上のプログラムは、コンピュータ２００のオペレーティングシステム、仮想空間を提供するためのアプリケーションプログラム、仮想空間で実行可能なゲームソフトウェア等を含み得る。プロセッサ１０は、入出力インターフェイス１３を介して、仮想空間を提供するための信号をＨＭＤ１１０に送る。ＨＭＤ１１０は、その信号に基づいてモニタ１１２に映像を表示する。

なお、図２に示される例では、コンピュータ２００は、ＨＭＤ１１０の外部に設けられる構成が示されているが、別の局面において、コンピュータ２００は、ＨＭＤ１１０に内蔵されてもよい。一例として、モニタ１１２を含む携帯型の情報通信端末（例えば、スマートフォン）がコンピュータ２００として機能してもよい。

また、コンピュータ２００は、複数のＨＭＤ１１０に共通して用いられる構成であってもよい。このような構成によれば、例えば、複数のユーザに同一の仮想空間を提供することもできるので、各ユーザは同一の仮想空間で他のユーザと同一のアプリケーションを楽しむことができる。

ある実施形態において、ＨＭＤシステム１００では、グローバル座標系が予め設定されている。グローバル座標系は、現実空間における鉛直方向、鉛直方向に直交する水平方向、並びに、鉛直方向および水平方向の双方に直交する前後方向にそれぞれ平行な、３つの基準方向（軸）を有する。本実施形態では、グローバル座標系は視点座標系の一つである。そこで、グローバル座標系における水平方向、鉛直方向（上下方向）、および前後方向は、それぞれ、ｘ軸、ｙ軸、ｚ軸と規定される。より具体的には、グローバル座標系において、ｘ軸は現実空間の水平方向に平行である。ｙ軸は、現実空間の鉛直方向に平行である。ｚ軸は現実空間の前後方向に平行である。

ある局面において、ＨＭＤセンサ１２０は、赤外線センサを含む。赤外線センサが、ＨＭＤ１１０の各光源から発せられた赤外線をそれぞれ検出すると、ＨＭＤ１１０の存在を検出する。ＨＭＤセンサ１２０は、さらに、各光源の位置（グローバル座標系における各座標値）に基づいて、ＨＭＤ１１０を装着したユーザ１９０の動きに応じた、現実空間内におけるＨＭＤ１１０の位置および傾きを検出する。より詳しくは、ＨＭＤセンサ１２０は、経時的に検出された各値を用いて、ＨＭＤ１１０の位置および傾きの時間的変化を検出できる。

ある局面において、ＨＭＤセンサ１２０は、赤外線センサからの出力に基づいて取得される赤外線の光強度および複数の点間の相対的な位置関係（例えば、各点間の距離など）に基づいて、ＨＭＤ１１０の現実空間内における位置を、ＨＭＤセンサ１２０に対する相対位置として特定し得る。また、プロセッサ１０は、特定された相対位置に基づいて、現実空間内（グローバル座標系）におけるＨＭＤ１１０のｕｖｗ視野座標系の原点を決定し得る。

グローバル座標系は現実空間の座標系と平行である。したがって、ＨＭＤセンサ１２０によって検出されたＨＭＤ１１０の各傾きは、グローバル座標系におけるＨＭＤ１１０の３軸周りの各傾きに相当する。ＨＭＤセンサ１２０は、グローバル座標系におけるＨＭＤ１１０の傾きに基づき、ｕｖｗ視野座標系をＨＭＤ１１０に設定する。ＨＭＤ１１０に設定されるｕｖｗ視野座標系は、ＨＭＤ１１０を装着したユーザ１９０が仮想空間において物体を見る際の視点座標系に対応する。

［ｕｖｗ視野座標系］
図３を参照して、ｕｖｗ視野座標系について説明する。図３は、ある実施形態に従うＨＭＤ１１０に設定されるｕｖｗ視野座標系を概念的に表す。ＨＭＤセンサ１２０は、ＨＭＤ１１０の起動時に、グローバル座標系におけるＨＭＤ１１０の位置および傾きを検出する。プロセッサ１０は、検出された値に基づいて、ｕｖｗ視野座標系をＨＭＤ１１０に設定する。

図３に示されるように、ＨＭＤ１１０は、ＨＭＤ１１０を装着したユーザ１９０の頭部を中心（原点）とした３次元のｕｖｗ視野座標系を設定する。より具体的には、ＨＭＤ１１０は、グローバル座標系を規定する水平方向、鉛直方向、および前後方向（ｘ軸、ｙ軸、ｚ軸）を、グローバル座標系内においてＨＭＤ１１０の各軸周りの傾きだけ各軸周りにそれぞれ傾けることによって新たに得られる３つの方向を、ＨＭＤ１１０におけるｕｖｗ視野座標系のピッチ方向（ｕ軸）、ヨー方向（ｖ軸）、およびロール方向（ｗ軸）として設定する。

ある局面において、ＨＭＤ１１０を装着したユーザ１９０が直立し、かつ、正面を視認している場合、プロセッサ１０は、グローバル座標系に平行なｕｖｗ視野座標系をＨＭＤ１１０に設定する。この場合、グローバル座標系における水平方向（ｘ軸）、鉛直方向（ｙ軸）、および前後方向（ｚ軸）は、ＨＭＤ１１０におけるｕｖｗ視野座標系のピッチ方向（ｕ軸）、ヨー方向（ｖ軸）、およびロール方向（ｗ軸）に一致する。

ｕｖｗ視野座標系がＨＭＤ１１０に設定された後、ＨＭＤセンサ１２０は、ＨＭＤ１１０の動きに基づいて、設定されたｕｖｗ視野座標系におけるＨＭＤ１１０の傾き（傾きの変化量）を検出できる。この場合、ＨＭＤセンサ１２０は、ＨＭＤ１１０の傾きとして、ｕｖｗ視野座標系におけるＨＭＤ１１０のピッチ角（θｕ）、ヨー角（θｖ）、およびロール角（θｗ）をそれぞれ検出する。ピッチ角（θｕ）は、ｕｖｗ視野座標系におけるピッチ方向周りのＨＭＤ１１０の傾き角度を表す。ヨー角（θｖ）は、ｕｖｗ視野座標系におけるヨー方向周りのＨＭＤ１１０の傾き角度を表す。ロール角（θｗ）は、ｕｖｗ視野座標系におけるロール方向周りのＨＭＤ１１０の傾き角度を表す。

ＨＭＤセンサ１２０は、検出されたＨＭＤ１１０の傾き角度に基づいて、ＨＭＤ１１０が動いた後のＨＭＤ１１０におけるｕｖｗ視野座標系を、ＨＭＤ１１０に設定する。ＨＭＤ１１０と、ＨＭＤ１１０のｕｖｗ視野座標系との関係は、ＨＭＤ１１０の位置および傾きに関わらず、常に一定である。ＨＭＤ１１０の位置および傾きが変わると、当該位置および傾きの変化に連動して、グローバル座標系におけるＨＭＤ１１０のｕｖｗ視野座標系の位置および傾きが変化する。

［仮想空間］
図４を参照して、仮想空間についてさらに説明する。図４は、ある実施形態に従う仮想空間２を表現する一態様を概念的に表す。仮想空間２は、中心２１の３６０度方向の全体を覆う全天球状の構造を有する。図４では、説明を複雑にしないために、仮想空間２のうちの上半分の天球が例示されている。

コンピュータ２００は、パノラマ画像２２を用いて仮想空間２を構成する。より具体的には、仮想空間２では各メッシュが規定される。各メッシュの位置は、仮想空間２に規定されるＸＹＺ座標系における座標値として予め規定されている。コンピュータ２００は、パノラマ画像２２を構成する各部分画像を、対応する各メッシュにそれぞれ展開する。これにより、ユーザ１９０は、仮想空間２に展開されるパノラマ画像２２を視認できる。仮想空間２を構成するパノラマ画像は、静止画像のみならず、動画像を含み得る。また、パノラマ画像は、３６０度全方位にわたり画像が展開される全天球画像を含み得る。

ある局面において、仮想空間２に展開されるパノラマ画像２２は、パノラマカメラ（例えば、全天球カメラ）が現実空間を撮影した画像であり得る。他の局面において、パノラマ画像２２は、複数のカメラが現実空間を撮影した画像を合成することにより生成された画像であり得る。

ある局面において、仮想空間２では、中心２１を原点とするＸＹＺ座標系が規定される。ＸＹＺ座標系は、例えば、グローバル座標系に平行である。ＸＹＺ座標系は視点座標系の一種であるため、ＸＹＺ座標系における水平方向、鉛直方向（上下方向）、および前後方向は、それぞれＸ軸、Ｙ軸、Ｚ軸として規定される。したがって、ＸＹＺ座標系のＸ軸（水平方向）がグローバル座標系のｘ軸と平行であり、ＸＹＺ座標系のＹ軸（鉛直方向）がグローバル座標系のｙ軸と平行であり、ＸＹＺ座標系のＺ軸（前後方向）がグローバル座標系のｚ軸と平行である。

ＨＭＤ１１０の起動時、すなわちＨＭＤ１１０の初期状態において、仮想カメラ１が、仮想空間２の中心２１に配置され得る。ある局面において、プロセッサ１０は、仮想カメラ１が撮影する画像をＨＭＤ１１０のモニタ１１２に表示する。仮想カメラ１は、現実空間におけるＨＭＤ１１０の動きに連動して、仮想空間２を同様に移動する。これにより、現実空間におけるＨＭＤ１１０の位置および向きの変化が、仮想空間２において同様に再現され得る。

仮想カメラ１には、ＨＭＤ１１０の場合と同様に、ｕｖｗ視野座標系が規定される。仮想空間２における仮想カメラのｕｖｗ視野座標系は、現実空間（グローバル座標系）におけるＨＭＤ１１０のｕｖｗ視野座標系に連動するように規定されている。したがって、ＨＭＤ１１０の傾きが変化すると、それに応じて、仮想カメラ１の傾きも変化する。また、仮想カメラ１は、ＨＭＤ１１０を装着したユーザ１９０の現実空間における移動に連動して、仮想空間２において移動することもできる。

コンピュータ２００のプロセッサ１０は、仮想カメラ１の配置位置と、基準視線５とに基づいて、仮想空間２における視認領域２３を規定する。視認領域２３は、仮想空間２に展開されるパノラマ画像２２のうち、ＨＭＤ１１０を装着したユーザが視認する領域に対応する。ある局面において、基準視線５は、現実空間におけるＨＭＤ１１０の傾き方向（ｗ方向）に一致する。

注視センサ１４０によって検出されるユーザ１９０の視線は、ユーザ１９０が物体を視認する際の視点座標系における方向である。ＨＭＤ１１０のｕｖｗ視野座標系は、ユーザ１９０がモニタ１１２を視認する際の視点座標系に等しい。また、仮想カメラ１のｕｖｗ視野座標系は、ＨＭＤ１１０のｕｖｗ視野座標系に連動している。したがって、ある局面に従うＨＭＤシステム１００は、注視センサ１４０によって検出されたユーザ１９０の視線を、仮想カメラ１のｕｖｗ視野座標系におけるユーザの視線とみなすことができる。

［ユーザの視線］
図５を参照して、ユーザの視線の決定について説明する。図５は、ある実施形態に従うＨＭＤ１１０を装着するユーザ１９０の頭部を上から表した模式図である。

ある局面において、注視センサ１４０は、ユーザ１９０の右目および左目の各視線を検出する。ある局面において、ユーザ１９０が近くを見ている場合、注視センサ１４０は、視線Ｒ１およびＬ１を検出する。別の局面において、ユーザ１９０が遠くを見ている場合、注視センサ１４０は、視線Ｒ２およびＬ２を検出する。この場合、ロール方向ｗに対して視線Ｒ２およびＬ２が成す角度は、ロール方向ｗに対して視線Ｒ１およびＬ１が成す角度よりも小さい。注視センサ１４０は、検出結果をコンピュータ２００に送信する。

コンピュータ２００が、視線の検出結果として、視線Ｒ１およびＬ１の検出値を注視センサ１４０から受信した場合には、その検出値に基づいて、視線Ｒ１およびＬ１の交点である注視点Ｎ１を特定する。一方、コンピュータ２００は、視線Ｒ２およびＬ２の検出値を注視センサ１４０から受信した場合には、視線Ｒ２およびＬ２の交点を注視点として特定する。コンピュータ２００は、特定した注視点Ｎ１の位置に基づき、ユーザ１９０の視線Ｎ０を特定する。コンピュータ２００は、例えば、ユーザ１９０の右目Ｒと左目Ｌとを結ぶ直線の中点と、注視点Ｎ１とを通る直線の延びる方向を、視線Ｎ０として検出する。視線Ｎ０は、ユーザ１９０が両目により実際に視線を向けている方向である。また、視線Ｎ０は、視認領域２３に対してユーザ１９０が実際に視線を向けている方向に相当する。

また、別の局面において、ＨＭＤシステム１００は、テレビジョン放送受信チューナを備えてもよい。このような構成によれば、ＨＭＤシステム１００は、仮想空間２においてテレビ番組を表示することができる。

さらに別の局面において、ＨＭＤシステム１００は、インターネットに接続するための通信回路、あるいは、電話回線に接続するための通話機能を備えていてもよい。

［視界領域］
図６および図７を参照して、視認領域２３について説明する。図６は、仮想空間２において視認領域２３をＸ方向から見たＹＺ断面を表す。図７は、仮想空間２において視認領域２３をＹ方向から見たＸＺ断面を表す。

図６に示されるように、ＹＺ断面における視認領域２３は、領域２４を含む。領域２４は、仮想カメラ１の配置位置と基準視線５と仮想空間２のＹＺ断面とによって定義される。プロセッサ１０は、仮想空間おける基準視線５を中心として極角αを含む範囲を、領域２４として規定する。

図７に示されるように、ＸＺ断面における視認領域２３は、領域２５を含む。領域２５は、仮想カメラ１の配置位置と基準視線５と仮想空間２のＸＺ断面とによって定義される。プロセッサ１０は、仮想空間２における基準視線５を中心とした方位角βを含む範囲を、領域２５として規定する。極角αおよびβは、仮想カメラ１の配置位置と仮想カメラ１の向きとに応じて定まる。

ある局面において、ＨＭＤシステム１００は、コンピュータ２００からの信号に基づいて、視界画像２６をモニタ１１２に表示させることにより、ユーザ１９０に仮想空間における視界を提供する。視界画像２６は、パノラマ画像２２のうち視認領域２３に対応する部分の画像である。換言すれば、視界画像２６は、パノラマ画像２２の一部であり得る。ユーザ１９０が、頭に装着したＨＭＤ１１０を動かすと、その動きに連動して仮想カメラ１も動く。その結果、仮想空間２における視認領域２３の位置が変化する。これにより、モニタ１１２に表示される視界画像２６は、パノラマ画像２２のうち、仮想空間２においてユーザ１９０が向いた方向の視認領域２３に重畳する画像（すなわち、パノラマ画像２２の一部）に更新される。ユーザ１９０は、仮想空間２における所望の方向を視認することができる。

このように、仮想カメラ１の向き（傾き）は仮想空間２における基準視線５に相当し、仮想カメラ１が配置される位置は、仮想空間２におけるユーザ１９０の視点に相当する。したがって、仮想カメラ１を移動（配置位置を変える動作、向きを変える動作を含む）させることにより、モニタ１１２に表示される画像が更新され、ユーザ１９０の視界が移動される。

ユーザ１９０は、ＨＭＤ１１０を装着している間、現実世界を視認することなく、仮想空間２に展開されるパノラマ画像２２の一部を視認する。そのため、ＨＭＤシステム１００は、仮想空間２への高い没入感覚をユーザに与えることができる。

ある局面において、プロセッサ１０は、ＨＭＤ１１０を装着したユーザ１９０の現実空間における移動に連動して、仮想空間２において仮想カメラ１を移動し得る。この場合、プロセッサ１０は、仮想空間２における仮想カメラ１の位置および向きに基づいて、ＨＭＤ１１０のモニタ１１２に投影される画像領域（すなわち、仮想空間２における視認領域２３）を特定する。

ある実施形態に従うと、仮想カメラ１は、２つの仮想カメラ、すなわち、右目用の画像を提供するための仮想カメラと、左目用の画像を提供するための仮想カメラとを含み得る。また、ユーザ１９０が３次元の仮想空間２を認識できるように、適切な視差が、２つの仮想カメラに設定される。本実施形態においては、仮想カメラ１が２つの仮想カメラを含み、２つの仮想カメラのロール方向が合成されることによって生成されるロール方向（ｗ）がＨＭＤ１１０のロール方向（ｗ）に適合されるように構成されているものとして、本開示に係る技術思想を例示する。

［コントローラ］
図８を参照して、コントローラ１６０の一例について説明する。図８は、ある実施の形態に従うコントローラ１６０の概略構成を表す図である。図８に示されるように、ある局面において、コントローラ１６０は、右コントローラ８００と左コントローラとを含み得る。右コントローラ８００は、ユーザ１９０の右手で操作される。左コントローラは、ユーザ１９０の左手で操作される。ある局面において、右コントローラ８００と左コントローラとは、別個の装置として対称に構成される。したがって、ユーザ１９０は、右コントローラ８００を把持した右手と、左コントローラを把持した左手とをそれぞれ自由に動かすことができる。別の局面において、コントローラ１６０は両手の操作を受け付ける一体型のコントローラであってもよい。以下、右コントローラ８００について説明する。

右コントローラ８００は、グリップ３０と、フレーム３１と、天面３２とを備える。グリップ３０は、ユーザ１９０の右手によって把持されるように構成されている。例えば、グリップ３０は、ユーザ１９０の右手の掌と３本の指（中指、薬指、小指）とによって保持され得る。

グリップ３０は、ボタン３３，３４と、モーションセンサ１３０とを含む。ボタン３３は、グリップ３０の側面に配置され、右手の中指による操作を受け付ける。ボタン３４は、グリップ３０の前面に配置され、右手の人差し指による操作を受け付ける。ある局面において、ボタン３３，３４は、トリガ式のボタンとして構成される。モーションセンサ１３０は、グリップ３０の筐体に内蔵されている。なお、ユーザ１９０の動作がカメラその他の装置によってユーザ１９０の周りから検出可能である場合には、グリップ３０は、モーションセンサ１３０を備えなくてもよい。

フレーム３１は、その円周方向に沿って配置された複数の赤外線ＬＥＤ３５を含む。赤外線ＬＥＤ３５は、コントローラ１６０を使用するプログラムの実行中に、当該プログラムの進行に合わせて赤外線を発光する。赤外線ＬＥＤ３５から発せられた赤外線は、右コントローラ８００と左コントローラ（図示しない）との各位置や姿勢（傾き、向き）を検出するために使用され得る。図８に示される例では、二列に配置された赤外線ＬＥＤ３５が示されているが、配列の数は図８に示されるものに限られない。一列あるいは３列以上の配列が使用されてもよい。

天面３２は、ボタン３６，３７と、アナログスティック３８とを備える。ボタン３６，３７は、プッシュ式ボタンとして構成される。ボタン３６，３７は、ユーザ１９０の右手の親指による操作を受け付ける。アナログスティック３８は、ある局面において、初期位置（ニュートラルの位置）から３６０度任意の方向への操作を受け付ける。当該操作は、例えば、仮想空間２に配置されるオブジェクトを移動するための操作を含む。

ある局面において、右コントローラ８００および左コントローラは、赤外線ＬＥＤ３５その他の部材を駆動するための電池を含む。電池は、充電式、ボタン型、乾電池型等を含むが、これらに限定されない。別の局面において、右コントローラ８００と左コントローラは、例えば、コンピュータ２００のＵＳＢインターフェイスに接続され得る。この場合、右コントローラ８００および左コントローラは、電池を必要としない。

［ＨＭＤの制御装置］
図９を参照して、ＨＭＤ１１０の制御装置について説明する。ある実施形態において、制御装置は周知の構成を有するコンピュータ２００によって実現される。図９は、ある実施形態に従うコンピュータ２００をモジュール構成として表わすブロック図である。

図９に示されるように、コンピュータ２００は、表示制御モジュール２２０と、仮想空間制御モジュール２３０と、メモリモジュール２４０と、通信制御モジュール２５０とを備える。表示制御モジュール２２０は、サブモジュールとして、仮想カメラ制御モジュール２２１と、視界領域決定モジュール２２２と、視界画像生成モジュール２２３と、基準視線特定モジュール２２４とを含む。仮想空間制御モジュール２３０は、サブモジュールとして、仮想空間定義モジュール２３１と、仮想オブジェクト生成モジュール２３２と、操作オブジェクト制御モジュール２３３と、アバター制御モジュール２３４と、自動カメラ制御モジュール２３５を含む。

ある実施形態において、表示制御モジュール２２０と仮想空間制御モジュール２３０とは、プロセッサ１０によって実現される。別の実施形態において、複数のプロセッサ１０が表示制御モジュール２２０と仮想空間制御モジュール２３０として作動してもよい。メモリモジュール２４０は、メモリ１１またはストレージ１２によって実現される。通信制御モジュール２５０は、通信インターフェイス１４によって実現される。

ある局面において、表示制御モジュール２２０は、ＨＭＤ１１０のモニタ１１２における画像表示を制御する。

仮想カメラ制御モジュール２２１は、仮想空間２に仮想カメラ１を配置する。また、仮想カメラ制御モジュール２２１は、仮想空間２における仮想カメラ１の配置位置と、仮想カメラ１の傾き（向き）を制御する。視界領域決定モジュール２２２は、仮想カメラ１の傾きと、仮想カメラ１の配置位置に応じて、視認領域２３を規定する。視界画像生成モジュール２２３は、決定された視認領域２３に基づいて、モニタ１１２に表示される視界画像２６を生成する。

基準視線特定モジュール２２４は、ＨＭＤセンサ１２０の出力に基づいてＨＭＤ１１０の傾き方向（ｗ方向）を検知する。仮想カメラ制御モジュール２２１は、基準視線特定モジュール２２４によって検知されるＨＭＤ１１０の傾き方向に基づいて、仮想カメラ１の傾きを制御する。他の局面において、基準視線特定モジュール２２４は、ＨＭＤ１１０の傾きおよび注視センサ１４０からの信号に基づいて、ユーザ１９０の視線を特定し得る。

自動カメラ制御モジュール２３５は、後述する自動カメラ１４００を仮想空間２に配置する。自動カメラ１４００は、仮想空間２を撮影可能に構成される。より具体的には、自動カメラ１４００は、仮想空間２を構成するパノラマ画像２２の一部およびアバターオブジェクトその他のオブジェクトを撮影する。ある局面において、自動カメラ１４００は、ユーザ１９０の操作に依らず、撮影条件を満たした時に自動的に撮影を実行するように構成される。

仮想空間制御モジュール２３０は、ユーザ１９０に提供される仮想空間２を制御する。仮想空間定義モジュール２３１は、仮想空間２を定義する。より具体的には、仮想空間定義モジュール２３１は、仮想空間２の大きさや形等を定義して、仮想空間２を生成する。

仮想オブジェクト生成モジュール２３２は、仮想空間２に配置されるオブジェクトを生成する。オブジェクトは、例えば、ゲームのストーリーの進行に従って配置される森、山その他を含む風景、動物等を含み得る。

操作オブジェクト制御モジュール２３３は、仮想空間２においてユーザ１９０の操作を受け付けるための操作オブジェクトを仮想空間２に配置する。ユーザは、操作オブジェクトを操作することにより、例えば、仮想空間２に配置されるオブジェクトを操作する。ある局面において、操作オブジェクト制御モジュール２３３は、モーションセンサ１３０の出力に基づいて操作オブジェクトを制御する。ある局面において、操作オブジェクトは、例えば、ＨＭＤ１１０を装着したユーザ１９０の手に相当する手オブジェクト等を含み得る。一例として、コンピュータ２００は、手オブジェクトと他のオブジェクトとが接触したことに応じて他のオブジェクトに対する操作を受け付ける。

アバター制御モジュール２３４は、ネットワークを介して接続される他のコンピュータ２００のユーザのアバターオブジェクトを仮想空間２に配置するためのデータを生成する。また、ある局面において、アバター制御モジュール２３４は、ユーザ１９０のアバターオブジェクトを仮想空間２に配置するためのデータを生成する。ある局面において、アバター制御モジュール２３４は、ユーザ１９０の画像に基づいて、ユーザ１９０を模したアバターオブジェクトを生成する。他の局面において、アバター制御モジュール２３４は、複数種類のアバターオブジェクト（例えば、動物を模したオブジェクトや、デフォルメされた人のオブジェクト）の中からユーザ１９０による選択を受け付けたアバターオブジェクトを仮想空間２に配置するためのデータを生成する。

アバター制御モジュール２３４は、ＨＭＤセンサ１２０が検出するＨＭＤ１１０の動きをアバターオブジェクトに反映する。例えば、アバター制御モジュール２３４は、ＨＭＤ１１０が傾いたことを検知して、アバターオブジェクトを傾けて配置するためのデータを生成する。また、ある局面において、アバター制御モジュール２３４は、モーションセンサ１３０の出力に基づいてコントローラ１６０の動きをアバターオブジェクトに反映する。

メモリモジュール２４０は、コンピュータ２００が仮想空間２をユーザ１９０に提供するために使用されるデータを保持している。ある局面において、メモリモジュール２４０は、空間情報２４１と、オブジェクト情報２４２と、ユーザ情報２４３と、撮影画像ＤＢ２４４とを保持している。

空間情報２４１は、仮想空間２を提供するために規定された１つ以上のテンプレートを保持している。

オブジェクト情報２４２は、仮想空間２において展開されるパノラマ画像２２、仮想空間２に配置されるオブジェクト、およびオブジェクトを仮想空間２に配置するための情報（たとえば、位置情報）を保持している。

ユーザ情報２４３は、ＨＭＤシステム１００の制御装置としてコンピュータ２００を機能させるためのプログラム、オブジェクト情報２４２に保持される各コンテンツを使用するアプリケーションプログラム等を保持している。ユーザ情報２４３は、ユーザ１９０を識別するためのユーザＩＤ（例えば、コンピュータ２００に設定されるＩＰ（Internet Protocol）アドレス、ＭＡＣ（Media Access Control）アドレス）などを含み得る。

撮影画像ＤＢ２４４は、自動カメラ制御モジュール２３５によって生成された画像（撮影画像）を管理する。

メモリモジュール２４０に格納されているデータおよびプログラムは、ＨＭＤ１１０のユーザ１９０によって入力される。あるいは、プロセッサ１０が、当該コンテンツを提供する事業者が運営するコンピュータ（例えば、サーバ１５０）からプログラムあるいはデータをダウンロードして、ダウンロードされたプログラムあるいはデータをメモリモジュール２４０に格納する。

通信制御モジュール２５０は、ネットワーク１９を介して、サーバ１５０その他の情報通信装置と通信し得る。

ある局面において、表示制御モジュール２２０および仮想空間制御モジュール２３０は、例えば、ユニティテクノロジーズ社によって提供されるＵｎｉｔｙ（登録商標）を用いて実現され得る。別の局面において、表示制御モジュール２２０および仮想空間制御モジュール２３０は、各処理を実現する回路素子の組み合わせとしても実現され得る。

コンピュータ２００における処理は、ハードウェアと、プロセッサ１０により実行されるソフトウェアとによって実現される。このようなソフトウェアは、ハードディスクその他のメモリモジュール２４０に予め格納されている場合がある。また、ソフトウェアは、ＣＤ−ＲＯＭその他のコンピュータ読み取り可能な不揮発性のデータ記録媒体に格納されて、プログラム製品として流通している場合もある。あるいは、当該ソフトウェアは、インターネットその他のネットワークに接続されている情報提供事業者によってダウンロード可能なプログラム製品として提供される場合もある。このようなソフトウェアは、光ディスク駆動装置その他のデータ読取装置によってデータ記録媒体から読み取られて、あるいは、通信制御モジュール２５０を介してサーバ１５０その他のコンピュータからダウンロードされた後、記憶モジュールに一旦格納される。そのソフトウェアは、プロセッサ１０によって記憶モジュールから読み出され、実行可能なプログラムの形式でＲＡＭに格納される。プロセッサ１０は、そのプログラムを実行する。

［コンピュータ２００の制御構造］
図１０を参照して、本実施形態に係るコンピュータ２００の制御構造について説明する。図１０は、ＨＭＤシステム１００が実行する処理を表わすフローチャートである。

ステップＳ１００５において、コンピュータ２００のプロセッサ１０は、仮想空間定義モジュール２３１として、仮想空間２を定義する。

ステップＳ１０１０において、プロセッサ１０は、パノラマ画像２２を用いて仮想空間２を構成する。

ステップＳ１０２０において、プロセッサ１０は、仮想カメラ１を仮想空間２に配置する。このとき、プロセッサ１０は、メモリのワーク領域において、仮想カメラ１を仮想空間２において予め規定された中心２１に配置し得る。

ステップＳ１０３０にて、プロセッサ１０は、視界画像生成モジュール２２３として、初期の視界画像２６（パノラマ画像２２の一部）を表示するための視界画像データを生成する。生成された視界画像データは、視界画像生成モジュール２２３を介して通信制御モジュール２５０によってＨＭＤ１１０に送信される。

ステップＳ１０３２にて、ＨＭＤ１１０のモニタ１１２は、コンピュータ２００から受信した信号に基づいて、視界画像２６を表示する。これにより、ＨＭＤ１１０を装着したユーザ１９０は、仮想空間２を認識する。

ステップＳ１０３４にて、ＨＭＤセンサ１２０は、ＨＭＤ１１０が出力する複数の赤外線光に基づいて、ＨＭＤ１１０の位置および傾き（ユーザ１９０の動き）を検知する。検知結果は、動き検知データとして、コンピュータ２００に送信される。

ステップＳ１０４０にて、プロセッサ１０は、ＨＭＤセンサ１２０から入力された動き検知データに基づいて、仮想カメラ１の位置および傾きを変更する。これにより、仮想カメラ１の位置および傾き（仮想カメラ１の基準視線５）は、ユーザ１９０の頭の動きに連動して更新される。視界領域決定モジュール２２２は、変更後の仮想カメラ１の位置および傾きに応じて視認領域２３を規定する。

ステップＳ１０５０において、プロセッサ１０は、視界画像生成モジュール２２３として、傾きを変更された仮想カメラ１が撮影する視界画像２６を表示するための視界画像データを生成し、生成した視界画像データをＨＭＤ１１０に出力する。

ステップＳ１０５２において、ＨＭＤ１１０のモニタ１１２は、受信した視界画像データに基づいて、更新後の視界画像を表示する。これにより、仮想空間２におけるユーザ１９０の視界が更新される。

ステップＳ１０５６において、コントローラ１６０は、現実空間におけるユーザ１９０の操作を検出する。例えば、ある局面において、コントローラ１６０は、ユーザ１９０によってアナログスティック３８が前方に倒されたことを検出する。コントローラ１６０は、検出内容を示す検出信号をコンピュータ２００に送信する。

ステップＳ１０６０において、プロセッサ１０は、仮想カメラ制御モジュール２２１として、検出信号に従い、仮想カメラ１を移動させる。これにより、仮想カメラ１が撮影する視界画像２６（すなわち、パノラマ画像２２の一部）が更新される。

ステップＳ１０７０において、プロセッサ１０は、視界画像生成モジュール２２３として、移動後の仮想カメラ１が撮影する視界画像２６を表示するための視界画像データを生成し、生成した視界画像データをＨＭＤ１１０に出力する。

ステップＳ１０７２において、ＨＭＤ１１０のモニタ１１２は、受信した視界画像データに基づいて、更新後の視界画像を表示する。これにより、仮想空間２におけるユーザの視界が更新される。

［アバターオブジェクト］
図１１Ａおよび図１１Ｂを参照して、本実施形態に従うアバターオブジェクトについて説明する。以下、ＨＭＤセット１０５Ａのユーザをユーザ１９０Ａ、ＨＭＤセット１０５Ｂのユーザをユーザ１９０Ｂ、ＨＭＤセット１０５Ｃのユーザをユーザ１９０Ｃ、ＨＭＤセット１０５Ｄのユーザをユーザ１９０Ｄと定義する。また、ＨＭＤセット１０５Ａに関する各構成要素の参照符号に記号Ａが付され、ＨＭＤセット１０５Ｂに関する各構成要素の参照符号に記号Ｂが付され、ＨＭＤセット１０５Ｃに関する各構成要素の参照符号に記号Ｃが付され、ＨＭＤセット１０５Ｄに関する各構成要素の参照符号に記号Ｄが付される。例えば、ＨＭＤ１１０Ａは、ＨＭＤセット１０５Ａに含まれる。

図１１Ａは、ネットワークにおいて、複数のＨＭＤ１１０のそれぞれが、複数のユーザのそれぞれに仮想空間を提供する状況を表す模式図である。図１１Ａを参照して、コンピュータ２００Ａ〜２００Ｄのそれぞれは、ＨＭＤ１１０Ａ〜１１０Ｄのそれぞれを介して、ユーザ１９０Ａ〜１９０Ｄのそれぞれに、仮想空間２Ａ〜２Ｄのそれぞれを提供する。図１１Ａに示される例において、仮想空間２Ａに含まれる内容（例えば、パノラマ画像２２Ａ）と仮想空間２Ｂに含まれる内容（例えば、パノラマ画像２２Ｂ）とは同じである。換言すれば、コンピュータ２００Ａとコンピュータ２００Ｂとは同じ仮想空間を共有していることになる。仮想空間２Ａおよび仮想空間２Ｂには、ユーザ１９０Ａのアバターオブジェクト１１００Ａと、ユーザ１９０Ｂのアバターオブジェクト１１００Ｂとが存在する。なお、仮想空間２Ａにおけるアバターオブジェクト１１００Ａおよび仮想空間２Ｂにおけるアバターオブジェクト１１００ＢがそれぞれＨＭＤを装着しているが、これは説明を分かりやすくするためのものであって、実際にはこれらのオブジェクトはＨＭＤを装着していない。

ある局面において、仮想カメラ制御モジュール２２１Ａは、ユーザ１９０Ａの視界画像２６Ａを撮影する仮想カメラ１Ａを、アバターオブジェクト１１００Ａの目の位置に配置し得る。

図１１Ｂは、図１１Ａにおいてユーザ１９０Ａが視認する視界画像１１１０を表す。視界画像１１１０は、ＨＭＤ１１０Ａのモニタ１１２Ａに表示される画像である。この視界画像１１１０は、仮想カメラ１Ａが撮影する画像である。図１１Ａにおいて、仮想空間２Ａには、現実空間における市街風景のパノラマ画像２２が展開されているものとする。また、視界画像１１１０には、ユーザ１９０Ｂのアバターオブジェクト１１００Ｂが表示されている。なお、特に図示はしていないが、ユーザ１９０Ｂの視界画像にも同様に、市街風景とユーザ１９０Ａのアバターオブジェクト１１００Ａとが表示されている。

図１１Ｂの状態において、ユーザ１９０Ａはユーザ１９０Ｂと対話によるコミュニケーションを図ることができる。より具体的には、マイク１１９Ａにより取得されたユーザ１９０Ａの音声は、サーバ１５０を介してユーザ１９０ＢのＨＭＤ１１０Ｂに送信され、ＨＭＤ１１０Ｂに設けられたスピーカ１１８Ｂから出力される。また、ユーザ１９０Ｂの音声は、サーバ１５０を介してユーザ１９０ＡのＨＭＤ１１０Ａに送信され、ＨＭＤ１１０Ａに設けられたスピーカ１１８Ａから出力される。

上記の通り、ユーザ１９０Ｂの動作（ＨＭＤ１１０Ｂの動き、コントローラ１６０Ｂの動作）は、アバター制御モジュール２３４によりアバターオブジェクト１１００Ｂに反映される。これにより、ユーザ１９０Ａは、ユーザ１９０Ｂの動作を、アバターオブジェクト１１００Ｂを通じて認識できる。

このように、ユーザ１９０Ａおよびユーザ１９０Ｂは、仮想空間上で同じパノラマ画像２２を共有しながらコミュニケーションを図ることができる。このパノラマ画像２２は、例えば、映画、ライブ映像、観光名所の画像および、ユーザが過去に撮影した画像などを含み得る。

［サーバ１５０の制御構造］
図１２は、サーバ１５０のハードウェア構成およびモジュール構成の一例を示す。ある実施形態において、サーバ１５０は、主たる構成要素として通信インターフェイス１２１０と、プロセッサ１２２０と、ストレージ１２３０とを備える。

通信インターフェイス１２１０は、コンピュータ２００など外部の通信機器と信号を送受信するための変復調処理などを行なう無線通信用の通信モジュールとして機能する。通信インターフェイス１２１０は、チューナ、高周波回路等により実現される。

プロセッサ１２２０は、サーバ１５０の動作を制御する。プロセッサ１２２０は、ストレージ１２３０に格納される各種の制御プログラムを実行することにより、送受信部１２２２、サーバ処理部１２２４、およびマッチング部１２２６として機能する。

送受信部１２２２は、各コンピュータ２００と各種情報を送受信する。例えば、送受信部１２２２は、各コンピュータ２００が仮想空間２を定義するための情報、仮想空間２に展開されるパノラマ画像２２、ユーザの音声などを各コンピュータ２００に送信する。

サーバ処理部１２２４は、複数のユーザが同じ仮想空間２を共有するための処理を行なう。例えば、サーバ処理部１２２４は、コンピュータ２００から受信した情報に基づいて、後述するアバターオブジェクト情報１２３４を更新する。

マッチング部１２２６は、複数のユーザを関連付けるための一連の処理を行なう。マッチング部１２２６は、例えば、複数のユーザが仮想空間を共有するための入力操作を行った場合に、これらのユーザのユーザＩＤを互いに関連付ける処理などを行なう。

ストレージ１２３０は、仮想空間指定情報１２３２と、アバターオブジェクト情報１２３４と、ユーザ情報１２３６と、パノラマ画像ＤＢ（データベース）１２３８と、撮影画像ＤＢ１２３９とを保持する。

仮想空間指定情報１２３２は、コンピュータ２００の仮想空間定義モジュール２３１が仮想空間２を定義するために用いられる情報である。例えば、仮想空間指定情報１２３２は、仮想空間２の大きさおよび形状を指定する情報を含む。他の局面において、仮想空間指定情報１２３２は、コンピュータ２００が空間情報２４１として保持する１つ以上のテンプレートの識別情報を含み得る。

アバターオブジェクト情報１２３４は、位置情報１２３４１と視線情報１２３４２とを含む。位置情報１２３４１は、仮想空間２における各アバターオブジェクトの位置（座標）を表す。視線情報１２３４２は、仮想空間２における各アバターオブジェクトの傾きを表す。アバターオブジェクトの傾きは、仮想カメラ１の傾き（基準視線５）である。以下、アバターオブジェクトの傾きを「アバターオブジェクトの視線方向」とも称する。アバターオブジェクト情報１２３４は、コンピュータ２００から入力される情報に基づいて随時更新され得る。

ユーザ情報１２３６は、コンピュータ２００のユーザ１９０についての情報である。ユーザ情報１２３６は、例えば、複数のユーザ１９０を互いに識別するユーザＩＤを含む。

パノラマ画像ＤＢ１２３８は、コンピュータ２００が仮想空間２に展開するためのパノラマ画像２２を複数保持する。撮影画像ＤＢ１２３９は、各コンピュータ２００の撮影画像ＤＢ２４４に保持される情報を含む。

［仮想空間を介した通信処理］
図１３は、コンピュータ２００Ａのユーザ１９０Ａとコンピュータ２００Ｂのユーザ１９０Ｂとが仮想空間を介して通信する処理を表すフローチャートである。

ステップＳ１３０２において、コンピュータ２００Ａのプロセッサ１０Ａは、サーバ１５０に対して、仮想空間２Ａに展開するパノラマ画像２２を指定する。ステップＳ１３０４において、コンピュータ２００Ｂのプロセッサ１０Ｂは、サーバ１５０に対して、仮想空間２Ｂに展開するパノラマ画像２２を指定する。ステップＳ１３０２およびＳ１３０４において、コンピュータ２００Ａおよび２００Ｂは、互いに仮想空間２を共有するための指示を併せてサーバ１５０に出力し得る。

ステップＳ１３０６において、サーバ１５０のプロセッサ１２２０は、送受信部１２２２として、指定されたパノラマ画像２２と、当該パノラマ画像２２に応じた仮想空間指定情報１２３２をコンピュータ２００Ａおよび２００Ｂに送信する。プロセッサ１２２０はさらに、マッチング部１２２６として、ユーザ１９０Ａおよび１９０Ｂが同じ仮想空間を共有するものとして、彼らのユーザＩＤを互いに関連付け得る。

ステップＳ１３０８において、プロセッサ１０Ａは、仮想空間定義モジュール２３１Ａとして、受信した仮想空間指定情報１２３２に基づいて、仮想空間２Ａを定義する。ステップＳ１３１０において、プロセッサ１０Ａは、受信したパノラマ画像２２を仮想空間２Ａに展開する。

ステップＳ１３１２において、プロセッサ１０Ｂは、仮想空間定義モジュール２３１Ｂとして、受信した仮想空間指定情報１２３２に基づいて、仮想空間２Ｂを定義する。ステップＳ１３１４において、プロセッサ１０Ｂは、受信したパノラマ画像２２を仮想空間２Ｂに展開する。

ステップＳ１３１６において、プロセッサ１０Ａは、アバター制御モジュール２３４Ａとして、ユーザ１９０Ａ自身のアバターオブジェクト１１００Ａ（図１３では「自アバターオブジェクト」と表記）を仮想空間２Ａに配置する。プロセッサ１０Ａはさらに、アバターオブジェクト１１００Ａの情報（例えば、モデリングのためのデータ、位置情報など）をサーバ１５０に送信する。

ステップＳ１３１８において、プロセッサ１２２０は、受信したアバターオブジェクト１１００Ａの情報をストレージ１２３０（アバターオブジェクト情報１２３４）に保存する。プロセッサ１２２０はさらに、アバターオブジェクト１１００Ａの情報を、コンピュータ２００Ａと通信を行なうコンピュータ２００Ｂに送信する。

ステップＳ１３２０において、プロセッサ１０Ｂは、アバター制御モジュール２３４Ｂとして、受信したアバターオブジェクト１１００Ａの情報に基づいて、仮想空間２Ｂにアバターオブジェクト１１００Ａを配置する。

ステップＳ１３２２〜Ｓ１３２６において、ステップＳ１３１６〜Ｓ１３２０と同様に、仮想空間２Ａおよび２Ｂにアバターオブジェクト１１００Ｂ（図１３では「他アバターオブジェクト」と表記）が生成され、ストレージ１２３０にアバターオブジェクト１１００Ｂの情報が保存される。

ステップＳ１３３０において、プロセッサ１０Ａは、視界画像生成モジュール２２３として、仮想カメラ１Ａが撮影する視界画像（パノラマ画像２２の一部）２６Ａを、ＨＭＤ１１０Ａのモニタ１１２Ａに表示する。これにより、ユーザ１９０Ａは、仮想空間２Ａを視認する。このとき、仮想カメラ制御モジュール２２１Ａは、仮想カメラ１Ａを、アバターオブジェクト１１００Ａの目の位置に配置し得る。

ステップＳ１３３４において、プロセッサ１０Ｂも、プロセッサ１０Ａと同様に仮想カメラ１Ｂが撮影する視界画像２６Ｂをモニタ１１２Ｂに表示する。

ステップＳ１３３６において、プロセッサ１０Ａは、ユーザ１９０Ａの動きを検知する。一例として、プロセッサ１０Ａは、ＨＭＤセンサ１２０の出力に基づいてＨＭＤ１１０Ａの位置および傾きを検知する。

ステップＳ１３３８において、プロセッサ１０Ａは、アバター制御モジュール２３４Ａとして、ユーザ１９０Ａの動きを表す検知結果をアバターオブジェクト１１００Ａに反映する。具体的には、プロセッサ１０Ａは、検知したＨＭＤ１１０Ａの位置に基づいてアバターオブジェクト１１００Ａの位置を更新し、検知した１１０Ａの傾きに基づいて、アバターオブジェクト１１００Ａの傾き（視線方向）を更新する。プロセッサ１０Ａはさらに、検知結果をサーバ１５０に送信する。

ステップＳ１３４０およびＳ１３４２において、プロセッサ１０Ｂは、プロセッサ１０Ａと同様に、ユーザ１９０Ｂの動きを表す検知結果をアバターオブジェクト１１００Ｂに反映する。ステップＳ１３４２において、プロセッサ１０Ｂはさらに、検知結果をサーバ１５０に送信する。

ステップＳ１３４４において、プロセッサ１２２０は、サーバ処理部１２２４として、アバターオブジェクト情報１２３４を更新する。より具体的には、プロセッサ１２２０は、コンピュータ２００Ａから受信した検知結果に基づいてアバターオブジェクト１１００Ａに対応する位置情報１２３４１および視線情報１２３４２を更新する。プロセッサ１２２０はさらに、コンピュータ２００Ｂから受信した検知結果に基づいてアバターオブジェクト１１００Ｂに対応する位置情報１２３４１および視線情報１２３４２を更新する。

ステップＳ１３４４において、プロセッサ１２２０はさらに、送受信部１２２２として、アバターオブジェクト１１００Ａに対応する位置情報１２３４１および視線情報１２３４２をコンピュータ２００Ｂに送信する。また、プロセッサ１２２０は、アバターオブジェクト１１００Ｂに対応する位置情報１２３４１および視線情報１２３４２をコンピュータ２００Ａに送信する。

ステップＳ１３４６において、プロセッサ１０Ａは、アバター制御モジュール２３４Ａとして、受信した情報をアバターオブジェクト１１００Ｂに反映する。ステップＳ１３４８において、プロセッサ１０Ｂは、アバター制御モジュール２３４Ｂとして、受信した情報をアバターオブジェクト１１００Ａに反映する。

ステップＳ１３５０において、プロセッサ１０Ａは、仮想カメラ１Ａが撮影する視界画像を、モニタ１１２Ａに表示する。これにより、ユーザ１９０Ａが視認する視界画像が更新される。その後、プロセッサ１０Ａは、処理をステップＳ１３３６に戻す。

ステップＳ１３５２において、プロセッサ１０Ｂは、プロセッサ１０Ａと同様に、仮想カメラ１Ｂが撮影する視界画像をモニタ１１２Ｂに表示する。これにより、ユーザ１９０Ｂが視認する視界画像が更新される。その後、プロセッサ１０Ｂは、処理をステップＳ１３４０に戻す。

ある実施形態において、繰り返し実行されるステップＳ１３３６〜Ｓ１３５２の処理は、１／６０秒または１／３０秒の間隔で実行され得る。

また、他の局面において、上記の繰り返し実行される処理は、ユーザ１９０Ａおよび１９０Ｂの音声信号を送受信する処理などの仮想空間２におけるユーザ同士のコミュニケーションを促進する処理を含み得る。

上記の例において、ステップＳ１３１６およびステップＳ１３２２において、コンピュータ２００は、当該コンピュータ２００のユーザ自身のアバターオブジェクト１１００を仮想空間２に配置するように構成されていた。他の局面において、これらの処理は省略され得る。仮想空間２において相手のアバターオブジェクトさえ配置されていれば、相手とのコミュニケーションを図ることができるためである。

［自動撮影］
図１４は、仮想空間２Ａにおける撮影処理について説明するための図である。図１５は、図１４の自動カメラ１４００が撮影した画像１５００を表す。図１４を参照して、仮想空間２Ａには、ユーザ１９０Ａに対応するアバターオブジェクト１１００Ａと、ユーザ１９０Ｂに対応するアバターオブジェクト１１００Ｂと、自動カメラ１４００とが配置されている。

自動カメラ制御モジュール２３５Ａは、自動カメラ１４００を仮想空間２Ａに配置する。自動カメラ１４００は、仮想空間２Ａを撮影可能に構成される。自動カメラ１４００によって撮影された画像は、ストレージ１２Ａに保存される。

自動カメラ制御モジュール２３５Ａは、マイク１１９Ａが取得するユーザ１９０Ａの発話に対応する音声信号をトリガとして、自動カメラ１４００による撮影を実行する。ある局面において、自動カメラ制御モジュール２３５Ａは、予め定められた第１レベル（例えば、７０ｄＢ）以上の音声信号を取得した場合に、自動カメラ１４００による撮影を実行する。

ある局面において、自動カメラ制御モジュール２３５Ａは、アバターオブジェクト１１００Ａの位置情報（仮想空間２Ａにおける座標）に基づいて、アバターオブジェクト１１００Ａの少なくとも一部を撮影するように自動カメラ１４００を配置する。

一例として、自動カメラ制御モジュール２３５Ａは、自動カメラ１４００の撮影方向がアバターオブジェクト１１００Ａの位置を貫くように自動カメラ１４００を配置する。当該構成によれば、自動カメラ１４００の画角の中心にアバターオブジェクト１１００Ａが写る。

他の局面において、自動カメラ制御モジュール２３５Ａは、アバターオブジェクト１１００Ａの位置情報および視線方向に基づいて、アバターオブジェクト１１００Ａの顔を撮影するように自動カメラ１４００を配置する。アバターオブジェクト１１００Ａの視線方向は、仮想カメラ制御モジュール２２１Ａが設定する仮想カメラ１Ａの傾きに対応する。

図１４に示される例を用いて上記処理を説明する。アバターオブジェクト１１００Ａは仮想空間２Ａの（Ｘ，Ｙ，Ｚ）＝（０，０，５０）に配置されている。また、アバターオブジェクト１１００Ａの視線方向１４１０は−Ｚ方向に設定されている。自動カメラ制御モジュール２３５Ａは、この配置位置と、アバターオブジェクト１１００Ａのモデリング情報とから、アバターオブジェクト１１００Ａの顔が（Ｘ，Ｙ，Ｚ）＝（０，５０，５０）に位置することを特定する。自動カメラ制御モジュール２３５Ａは、アバターオブジェクト１１００Ａの顔の位置から視線方向１４１０に所定距離（例えば、８０ｐｉｘｅｌ）離れた位置（０，５０，−３０）に自動カメラ１４００を配置する。自動カメラ制御モジュール２３５Ａはさらに、自動カメラ１４００の向き（撮影方向）を視線方向１４１０とは反対方向（Ｚ方向）に設定する。当該構成によれば、自動カメラ１４００は、図１５に示される画像１５００のように、アバターオブジェクト１１００Ａの顔を撮影できる。

プロセッサ１０Ａは、自動カメラ１４００によって生成された画像１５００を撮影画像ＤＢ２４４Ａに保存する。その際、プロセッサ１０Ａは、画像と所定情報とを関連付けて保存する。所定情報は、撮影時に仮想空間２Ａに展開されているパノラマ画像２２を識別するパノラマ画像ＩＤ、自動カメラ１４００の撮影方向と仮想空間２Ａの天球とが交わる撮影画像位置、および撮影時のユーザ１９０Ａの視点位置を含み得る。ある局面において、視点位置は、基準視線５Ａ（仮想カメラ１Ａの向き）と仮想空間２Ａの天球とが交わる位置であり得る。他の局面において、視点位置は、注視センサ１４０Ａによって検出されるユーザ１９０Ａの視線と仮想空間２Ａの天球が交わる位置であり得る。

また、パノラマ画像２２が動画像である場合、所定情報は、パノラマ画像２２における撮影がなされたタイミングを表す再生情報を含み得る。ある局面において、プロセッサ１０Ａは、撮影画像ＤＢ２４４に保存する情報をユーザ１９０ＡのユーザＩＤとともにサーバ１５０に送信する。サーバ１５０は、受信した情報を撮影画像ＤＢ１２３９に保存する。

ある局面において、自動カメラ制御モジュール２３５Ａは、ユーザ１９０Ａが視認できない透明な自動カメラ１４００を配置する。仮に、ユーザ１９０Ａが自動カメラ１４００を視認できた場合、自動カメラ１４００によってアバターオブジェクト１１００Ｂが隠れるなどして、ユーザ１９０Ｂとのコミュニケーションに集中できない場合があるためである。

［自動撮影の制御構造］
図１６は、コンピュータ２００Ａにおける自動撮影処理を表すフローチャートである。

ステップＳ１６１０において、プロセッサ１０Ａは、サーバ１５０から受信した仮想空間指定情報１２３２に基づいて、仮想空間２Ａを定義する。

ステップＳ１６１５において、プロセッサ１０Ａは、アバター制御モジュール２３４Ａとして、仮想空間２Ａにユーザ１９０Ａに対応するアバターオブジェクト１１００Ａを配置する。プロセッサ１０Ａはさらに、コンピュータ２００Ｂから受信した情報に基づいて、ユーザ１９０Ｂに対応するアバターオブジェクト１１００Ｂを配置する。

ステップＳ１６２０において、プロセッサ１０Ａは、自動カメラ制御モジュール２３５Ａとして、自動カメラ１４００を仮想空間２Ａに配置する。

ステップＳ１６２５において、プロセッサ１０Ａは、アバター制御モジュール２３４Ａとして、アバターオブジェクト１１００Ａおよび１１００Ｂの位置情報を更新する。ステップＳ１６３０において、プロセッサ１０Ａは、アバター制御モジュール２３４Ａとして、アバターオブジェクト１１００Ａおよび１１００Ｂの視線方向（傾き）を更新する。これらの処理は図１３のステップＳ１３３８およびステップＳ１３４６の処理に対応する。

ステップＳ１６３５において、プロセッサ１０Ａは、アバターオブジェクト１１００Ａの位置情報および視線方向に基づいて、自動カメラ１４００を配置する。より具体的には、プロセッサ１０Ａは、自動カメラ１４００の画角内にアバターオブジェクト１１００Ａの少なくとも一部（例えば顔）が含まれるように自動カメラ１４００を移動させる。

ステップＳ１６４０において、プロセッサ１０Ａは、マイク１１９Ａから音声信号の入力を受け付ける。プロセッサ１０Ａはさらに、コンピュータ２００Ｂからマイク１１９Ｂによって取得された音声信号の入力を受け付ける。

ステップＳ１６４５において、プロセッサ１０Ａは、ユーザ１９０Ａの発話に対応する音声信号が予め定められた第１レベル（例えば、７０ｄＢ）以上であるか否かを判断する。プロセッサ１０Ａは、音声信号が第１レベル以上であると判断した場合（ステップＳ１６４５でＹＥＳ）、処理をステップＳ１６５０に進める。そうでない場合（ステップＳ１６４５でＮＯ）、プロセッサ１０は処理をステップＳ１６２５に戻す。

ステップＳ１６５０において、プロセッサ１０Ａは、ユーザ１９０Ａの発話に対応する音声信号から文字列を抽出する。一例として、プロセッサ１０Ａは、音声信号の先頭から所定時間単位（たとえば、１０ｍｓｅｃ単位）で区切られる波形データと、ストレージ１２Ａに格納される音響モデル（不図示）とを照合して、文字列を抽出する。音響モデルは、母音や子音などの音素ごとの特徴量を表す。一例として、プロセッサ１０Ａは、隠れマルコフモデルに基づき、音声信号と音響モデルとを照合する。

ステップＳ１６５５において、プロセッサ１０Ａは、抽出した文字列に予め定められた文字列が含まれているか否かを判断する。一例として、予め定められた文字列は、「すごい」、「おぉ」、「えぇ〜」などの複数の感嘆詞を含む。

プロセッサ１０Ａは、抽出した文字列に予め定められた文字列が含まれていると判断した場合（ステップＳ１６５５でＹＥＳ）、処理をステップＳ１６６０に進め、自動カメラ１４００による撮影を実行する。プロセッサ１０Ａは、撮影により生成された画像をストレージ１２Ａに保存する。そうでない場合（ステップＳ１６５５でＮＯ）、プロセッサ１０Ａは、処理をステップＳ１６２５に戻す。

上記によれば、コンピュータ２００Ａは、ユーザ１９０Ａによる撮影操作（例えば、コントローラ１６０Ａによる操作）をトリガとするのではなく、ユーザ１９０Ａの音声をトリガとして自動的に仮想空間２Ａを撮影する。そのため、コンピュータ２００Ａは、撮影タイミング（例えば、ユーザ１９０Ａが驚きの声を発した時）に適切に撮影を行ない得る。

また、コンピュータ２００Ａは、ユーザ１９０Ａが撮影操作に伴う面倒を感じることを抑制し得る。加えて、コンピュータ２００Ａは、音声をトリガとするため、ユーザ１９０Ａのポージング（すなわち、アバターオブジェクト１１００Ａのポージング）の自由度を高め得る。以上より、ある実施形態に従うＨＭＤシステム１００は、ユーザの仮想空間における体験をより豊かにし得る。

上記の例では、コンピュータ２００Ａは、音声信号から文字列を抽出して、当該文字列が予め定められた文字列を含む場合に、自動カメラ１４００による撮影を実行するように構成されている。他の局面において、コンピュータ２００Ａは、入力された音声信号からユーザ１９０Ａの感情を推定し、推定された感情に基づいて撮影を実行するように構成されてもよい。例えば、コンピュータ２００Ａは、音声信号から文字列を抽出して、当該文字列から感情を推定する。このような処理は、例えば、メタデータ社が提供する「感情解析ＡＰＩ」により実現され得る。他の局面において、コンピュータ２００Ａは、音声信号の波形から感情を推定する。このような処理は、例えば、ＡＧＩ社が提供する「ＳＴＥｍｏｔｉｏｎＳＤＫ」により実現され得る。一例として、コンピュータ２００Ａは、音声信号に基づくユーザ１９０Ａの感情が肯定的な感情（例えば、喜び、嬉しい）に分類される場合に、自動カメラ１４００による撮影を実行するように構成されてもよい。

ある局面において、ＨＭＤセット１０５Ａは、ユーザ１９０Ａの顔を撮影するためのカメラ（例えば赤外線カメラ）をさらに有する。プロセッサ１０Ａは、当該カメラの出力に基づいてユーザ１９０Ａの表情をアバターオブジェクトに反映し得る。このような制御は、公知のフェイストラッキング技術により実現され得る。係る場合、上記の実施形態に従うコンピュータ２００Ａは、ユーザ１９０Ａの感情が高ぶった瞬間のユーザ１９０Ａの表情を反映したアバターオブジェクト１１００Ａを撮影し得る。

［自動カメラ１４００の移動制御］
図１７は、他の局面における自動カメラ１４００の移動制御を説明するための図である。自動カメラ制御モジュール２３５Ａは、アバターオブジェクト１１００Ａの位置を基準に予め定められたパターンで自動カメラ１４００を移動させ得る。

例えば、自動カメラ制御モジュール２３５Ａは、アバターオブジェクト１１００Ａの位置（顔の位置）を中心とする円軌道１７１０で自動カメラ１４００を移動させ得る。このとき、自動カメラ制御モジュール２３５Ａは、自動カメラ１４００の画角内にアバターオブジェクト１１００Ａの少なくとも一部（例えば顔）が含まれるように、自動カメラ１４００の移動を制御し得る。より具体的には、自動カメラ制御モジュール２３５Ａは、自動カメラ１４００の撮影方向がアバターオブジェクト１１００の位置を貫くように自動カメラ１４００の移動を制御し得る。

上記によれば、自動カメラ１４００は、アバターオブジェクト１１００Ａを様々な角度から撮影できる。

他の例として、自動カメラ制御モジュール２３５Ａは、視線方向１４１０上のある点を中心として、視線方向１４１０と直交する面上に形成される円軌道１７２０で自動カメラ１４００を移動させ得る。このとき、自動カメラ制御モジュール２３５Ａは、自動カメラ１４００の画角内にアバターオブジェクト１１００Ａの少なくとも一部（例えば顔）が含まれるように、自動カメラ１４００の移動を制御し得る。

上記によれば、自動カメラ１４００は、アバターオブジェクト１１００Ａの顔を様々な角度から撮影できる。

［コミュニケーションを促進する処理］
上記の例において、プロセッサ１０Ａは、仮想空間２Ａに配置される他のアバターオブジェクト１１００Ｂおよびユーザ１９０Ｂの発話を考慮せずに自動カメラ１４００による撮影を実行するように構成されている。以下では、他のアバターオブジェクト１１００Ｂまたはユーザ１９０Ｂの発話を考慮した、ユーザ間のコミュニケーションを促進するための処理について説明する。

（アバターオブジェクト同士が向かい合っている場合）
図１８は、アバターオブジェクト１１００Ｂを考慮した自動カメラ制御モジュール２３５Ａによる撮影処理を説明するための図である。図１９は、図１８の自動カメラ１４００により生成された画像１９００を表す。

図１８を参照して、仮想空間２Ａに、アバターオブジェクト１１００Ａとアバターオブジェクト１１００Ｂとが間隔Ｄだけ離れた状態で配置されている。自動カメラ制御モジュール２３５Ａは、少なくともユーザ１９０Ａに対応する音声信号をトリガとして自動カメラ１４００による撮影を実行する。ある局面において、自動カメラ制御モジュール２３５Ａは、ユーザ１９０Ａに対応する音声信号が第１レベル以上である場合に自動カメラ１４００による撮影を実行する。

他の局面において、自動カメラ制御モジュール２３５Ａは、ユーザ１９０Ａに対応する音声信号およびユーザ１９０Ｂに対応する音声信号をトリガとして撮影を実行する。一例として自動カメラ制御モジュール２３５Ａは、両者各々に対応する音声信号が予め定められた第２レベル以上である場合に、撮影を実行する。なお、第２レベルは、上記の第１レベルよりも低く設定され得る。その理由は、第１レベルは対応するユーザの感嘆を検出するための設定であり、第２レベルは対応する両者のコミュニケーション（会話）を検出するための設定であるためである。

なお、さらに他の局面において、自動カメラ制御モジュール２３５Ａは、両者（ユーザ１９０Ａおよび１９０Ｂ）各々に対応する音声信号が第１レベル以上である場合に撮影を実行するように構成されてもよい。係る場合、両者が同じタイミングで興味を示した場合に撮影が実行される。そのため、両者は、当該撮影の被写体に興味を示す可能性が高く、当該撮影により生成された画像によりコミュニケーションを活性化し得る。

他の局面において、自動カメラ制御モジュール２３５Ａは、間隔Ｄが所定間隔（例えば、１００ｐｉｘｅｌ）未満である場合に自動カメラ１４００による撮影を実行する。具体的には、自動カメラ制御モジュール２３５Ａは、アバターオブジェクト１１００Ａの位置と、アバターオブジェクト１１００Ｂの位置とに基づいて、これらの間隔Ｄを算出する。なお、他の局面において、自動カメラ制御モジュール２３５Ａは、アバターオブジェクト１１００Ａの所定部位（例えば顔）の位置と、アバターオブジェクト１１００Ｂの所定部位の位置とに基づいて間隔Ｄを算出してもよい。これにより、ユーザ１９０Ａおよび１９０Ｂがコミュニケーションしている可能性がより高まる。

さらに他の局面において、自動カメラ制御モジュール２３５Ａは、アバターオブジェクト１１００Ａおよび１１００Ｂが互いに向かい合っている場合に自動カメラ１４００による撮影を実行し得る。

自動カメラ制御モジュール２３５Ａは、アバターオブジェクト１１００Ａの視線方向１４１０と、アバターオブジェクト１１００Ｂの視線方向１８１０とを特定する（図１３のステップＳ１３３８およびＳ１３４６）。一例として、自動カメラ制御モジュール２３５Ａは、これらの視線方向がＸＺ平面上において成す角度が略１８０度（例えば、１７０〜１９０度）である場合に、アバターオブジェクト１１００Ａおよび１１００Ｂが互いに向かい合っていると判断する。

自動カメラ制御モジュール２３５Ａは、上記の条件を満たしたと判断した場合、自動カメラ１４００の撮影方向を、視線方向１４１０および１８１０が互いに向かい方向に直交する方向に設定する。ある局面において、自動カメラ制御モジュール２３５Ａは、自動カメラ１４００の撮影方向を視線方向１４１０に直交する方向に設定する。

このとき、自動カメラ制御モジュール２３５Ａは、アバターオブジェクト１１００Ａおよび１１００Ｂの位置情報に基づいて、これらアバターオブジェクトの各々の少なくとも一部が自動カメラ１４００の画角に収まるように自動カメラ１４００を配置する。一例として、自動カメラ制御モジュール２３５Ａは、アバターオブジェクト１１００Ａおよび１１００Ｂの顔が自動カメラ１４００の画角に含まれるように自動カメラ１４００を配置する。

上記によれば、コンピュータ２００Ａは、図１９に示されるように、アバターオブジェクト１１００Ａおよび１１００Ｂを含む画像１９００を生成できる。ユーザ１９０Ａは、画像１９００を話題にして、仮想空間２Ａ上でのユーザ１９０Ｂとのコミュニケーションを促進し得る。他の局面において、コンピュータ２００Ａは、画像１９００をコンピュータ２００Ｂに送信する。ユーザ１９０Ａおよび１９０Ｂは、仮想空間上でこの画像１５００を一緒に閲覧しながらコミュニケーションを図る。その結果、ユーザ間のコミュニケーションがさらに促進され得る。

（複数のユーザが同じ対象物を見ている場合−その１）
図２０は、複数のユーザが同じ対象物を見ている場合の自動カメラ制御モジュール２３５Ａの処理を説明するための図（その１）である。図２１は、図２０の自動カメラ１４００により生成された画像２１００を表す。

仮想空間２Ａおよび２Ｂには、同じパノラマ画像２２が展開されている。そのため、ユーザ１９０Ａおよび１９０Ｂは、同じ対象物（パノラマ画像２２の一部）を見ながらコミュニケーションし得る。係る場合、図２０に示されるように、アバターオブジェクト１１００Ａの視線方向１４１０と、アバターオブジェクト１１００Ｂの視線方向１８１０とが略同じ箇所（パノラマ画像２２の一部）に向けられる。

ある局面において、自動カメラ制御モジュール２３５Ａは、視線方向１４１０が仮想空間２Ａの天球を貫く位置と、視線方向１８１０が仮想空間２Ａの天球を貫く位置との間隔が、予め定められた間隔未満である場合に、ユーザ１９０Ａおよび１９０Ｂが同じ対象物を見ていると判断する。自動カメラ制御モジュール２３５Ａは、これらの間隔が予め定められた間隔未満である場合に、自動カメラ１４００により撮影を行なう。以下、視線方向１４１０が仮想空間２Ａの天球を貫く位置を「視点１４１０」とも称する。また、視線方向１８１０が仮想空間２Ａの天球を貫く位置を「視点１８１０」とも称する。なお、自動カメラ制御モジュール２３５Ａは、アバターオブジェクト同士の間隔Ｄが所定間隔未満である条件さらに満たした場合に、撮影を実行するように構成されてもよい。また、自動カメラ制御モジュール２３５Ａは、少なくともユーザ１９０Ａに対応する音声信号に関する条件をさらに満たした場合に、撮影を実行するように構成されてもよい。

自動カメラ制御モジュール２３５Ａは、上記条件を満たしたことに応じて、アバターオブジェクト１１００Ａおよび１１００Ｂの位置と、視線方向１４１０および１８１０とに基づいて自動カメラ１４００を配置する。

一例として、自動カメラ制御モジュール２３５Ａは、視点１４１０および１８１０の中間点２０１０（座標値）と、アバターオブジェクト１１００Ａおよび１１００Ｂの位置の中間点２０２０（座標値）とを算出する。自動カメラ制御モジュール２３５Ａは、中間点２０１０と中間点２０２０とを結ぶ線分上に自動カメラ１４００を配置する。このとき、自動カメラ制御モジュール２３５Ａは、自動カメラ１４００の画角内にアバターオブジェクト１１００Ａおよび１１００Ｂの各々の少なくとも一部が含まれるように自動カメラ１４００を配置する。一例として、自動カメラ１４００は、中間点２０２０が画角の中心となるように配置される。

上記によれば、コンピュータ２００Ａは、図２１に示されるように、アバターオブジェクト１１００Ａおよび１１００Ｂが正面を向いた画像２１００を生成できる。

この場合、プロセッサ１０Ａは、画像２１００を撮影画像ＤＢ２４４Ａに保存する際に、被写体であるアバターオブジェクト１１００Ｂのユーザ１９０ＢのユーザＩＤを併せて保存し得る。

なお、他の局面において、自動カメラ制御モジュール２３５Ａは、ユーザ１９０Ａおよび１９０Ｂが見ている対象物を撮影するように自動カメラ１４００を配置しても良い。一例として、自動カメラ制御モジュール２３５Ａは、中間点２０１０が画角の中心となるように自動カメラ１４００を配置する。当該構成によれば、コンピュータ２００Ａは、ユーザ１９０Ａおよび１９０Ｂが興味のある対象物を撮影できる。その結果、ユーザ１９０Ａは、生成された画像を話題として、ユーザ１９０Ｂとのコミュニケーションをより促進し得る。

しかしながら、上記の制御では、自動カメラ１４００の画角にアバターオブジェクト１１００Ａおよび１１００Ｂの後ろ姿は含まれ得るが、これらの顔は含まれない。そこで、以下にこのような課題を解決可能な処理について説明する。

（複数のユーザが同じ対象物を見ている場合−その２）
図２２は、複数のユーザが同じ対象物を見ている場合の自動カメラ制御モジュール２３５Ａの処理を説明するための図（その２）である。図２３は、図２２の自動カメラ１４００により生成された画像２３００を表す。

自動カメラ制御モジュール２３５Ａは、視点１４１０および１８１０の間隔が予め定められた間隔未満であると判断した場合に、画角に中間点２０１０並びにアバターオブジェクト１１００Ａおよび１１００Ｂが含まれるように、自動カメラ１４００を配置する。一例として、自動カメラ制御モジュール２３５Ａは、中間点２０１０と中間点２０２０とを結ぶ直線上に自動カメラ１４００を配置する。

仮に上記の状態で自動カメラ１４００がアバターオブジェクト１１００Ａおよび１１００Ｂを撮影すると、生成された画像に含まれるこれらのアバターオブジェクトは、後を向いてしまう。そこで、自動カメラ制御モジュール２３５Ａは、自動カメラ１４００により撮影される画像に含まれるアバターオブジェクト１１００Ａおよび１１００Ｂの各々の視線方向（頭の向き）を、自動カメラ１４００の位置に向ける。具体的には、自動カメラ制御モジュール２３５Ａは、アバターオブジェクト１１００Ａおよび１１００Ｂの各々のモデリングデータに基づいて、カメラ目線のアバターオブジェクトの画像を生成する。

上記によれば、コンピュータ２００Ａは、図２３に示されるように、正面を向いたアバターオブジェクト１１００Ａおよび１１００Ｂ、並びに、ユーザ１９０Ａおよび１９０Ｂが興味のある対象物（図２３の例では東京タワー（登録商標）２３１０）を含む画像２３００を生成できる。その結果、ユーザ１９０Ａは、生成された画像を話題として、ユーザ１９０Ｂとのコミュニケーションをより促進し得る。

ある局面において、公知のフェイストラッキング技術によりユーザ１９０Ａ，１９０Ｂの表情がアバターオブジェクト１１００Ａ，１１００Ｂにそれぞれ反映され得る。係る場合、自動カメラ制御モジュール２３５Ａは、カメラ目線のアバターオブジェクトの画像を生成する際に、撮影タイミングにおけるユーザ１９０Ａ，１９０Ｂの表情をアバターオブジェクト１１００Ａ，１１００Ｂに反映した画像を生成し得る。

［自動撮影の制御構造］
図２４は、ユーザ間のコミュニケーションを促進するためにコンピュータ２００Ａによって実行される自動撮影処理を表すフローチャートである。なお、図２４に示される処理のうち前述の処理と同じ処理については同じ符号を付している。そのため、その処理についての説明は繰り返さない。

ステップＳ２４１０において、プロセッサ１０Ａは、アバターオブジェクト１１００Ａおよび１１００Ｂの位置情報に基づいて、自動カメラ１４００を配置する。より具体的には、プロセッサ１０Ａは、自動カメラ１４００の画角内にアバターオブジェクト１１００Ａおよび１１００Ｂの各々の少なくとも一部（例えば顔）が含まれるように自動カメラ１４００を移動させる。

ステップＳ２４２０において、プロセッサ１０Ａは、アバターオブジェクト１１００Ａおよび１１００Ｂの間隔Ｄが予め定められた間隔未満であるか否かを判断する。プロセッサ１０Ａは、間隔Ｄが予め定められた間隔未満であると判断した場合（ステップＳ２４２０でＹＥＳ）、処理をステップＳ１６４５に進める。そうでない場合（ステップＳ２４２０でＮＯ）、プロセッサ１０Ａは処理をステップＳ１６２５に戻す。

上記によれば、コンピュータ２００Ａは、ユーザ１９０Ｂとのコミュニケーションを促進するための画像を、ユーザ１９０Ａに提供できる。

図２４に示される処理において、コンピュータ２００Ａは、ユーザ１９０Ａに対応する音声信号にのみ基づいて撮影を実行するように構成されている（図２４のステップＳ１６４５）。しかしながら、ユーザ１９０Ａがユーザ１９０Ｂに一方的に話しかけている場合もあり得る。そこで、他の局面において、コンピュータ２００Ａは、両者の音声が交互に入力された時に、両者がコミュニケーションをしていると判断し、撮影を実行するように構成される。

図２５は、他の局面に従うユーザ間のコミュニケーションを促進するための自動撮影処理を表すフローチャートである。なお、図２５に示される処理のうち前述の処理と同じ処理については同じ符号を付している。そのため、その処理についての説明は繰り返さない。

ステップＳ２４２０において、プロセッサ１０Ａは、アバターオブジェクト１１００Ａおよび１１００Ｂの間隔Ｄが予め定められた間隔未満であると判断した場合、処理をステップＳ２５１０に進める。

ステップＳ２５１０において、プロセッサ１０Ａは、ユーザ１９０Ａおよび１９０Ｂの一方に対応する予め定められた第２レベル以上の音声信号の入力を受け付けてから、所定時間内に他方に対応する第２レベル以上の音声信号の入力を受け付けたか否かを判断する。この所定時間は、例えば２秒間に設定される。

プロセッサ１０Ａは、第２レベル以上の一方の音声信号の入力を受け付けてから所定時間内に第２レベル以上の他方の音声信号の入力を受け付けたと判断した場合（ステップＳ２５１０でＹＥＳ）、処理をステップＳ１６６０に進め撮影を行なう。そうでない場合（ステップＳ２５１０でＮＯ）、プロセッサ１０Ａは処理をステップＳ１６２５に戻す。

上記によれば、コンピュータ２００Ａは、ユーザ１９０Ａと１９０Ｂとが会話している可能性が高い時に撮影を実行できる。

［撮影画像の管理］
図２６は、ある実施形態に従う撮影画像ＤＢ１２３９のデータ構造の一例を表す。図２６に示される例において、撮影画像ＤＢ１２３９は、撮影画像と、ユーザＩＤと、パノラマ画像ＩＤと、撮影画像位置と、視点位置と、撮影タイミングとを互いに関連付けて保持する。これらのデータは各コンピュータ２００から受信した情報である。

ユーザＩＤは、撮影画像を生成したコンピュータ２００のユーザ１９０を識別する。パノラマ画像ＩＤは、撮影時に仮想空間２に展開されているパノラマ画像２２を識別する。撮影画像位置は、自動カメラの撮影方向と仮想空間２の天球とが交わる位置を表す。換言すれば、撮影画像位置は、撮影画像に含まれるパノラマ画像２２の中央位置を表す。視点位置は、仮想カメラ１の撮影方向と仮想空間２の天球とが交わる位置を表す。撮影タイミングは、仮想空間２に展開されているパノラマ画像２２が動画像である場合に、パノラマ画像２２における撮影が行なわれたタイミングを特定する。

撮影画像ＤＢ１２３９は、撮影画像が複数のアバターオブジェクトを含む場合に、これらのアバターオブジェクトの各々に対応するユーザＩＤを併せて保持し得る。

各コンピュータ２００は、ユーザ１９０の発話に基づいて撮影画像を生成する。この処理は、各コンピュータ２００がユーザ１９０の発話に基づいてユーザ１９０の感情が動いたと推定されるタイミングで、撮影画像を生成する処理とも言える。そのため、サーバ１５０の管理者は、撮影画像ＤＢ１２３９に基づいて、ユーザ１９０の関心の対象を把握できる。

ある局面において、サーバ１５０のプロセッサ１２２０は、パノラマ画像２２のうち視点位置の周辺画像に含まれる物体（コンテンツ）を公知の機械学習法により特定し、特定結果を撮影画像ＤＢ１２３９に保存し得る。一例として、プロセッサ１２２０は、ＳｅｌｅｃｔｉｖｅＳｅａｒｃｈ法を用いて周辺画像に含まれる物体を囲むバウンディングボックスを特定する。プロセッサ１２２０は、バウンディングボックスにより切り取られた画像からＣＮＮ（Convolutional Neural Network）により導出される特徴量を算出する。プロセッサ１２２０は、算出した特徴量と、複数のＳＶＭ（Support Vector Machine）に従う識別器とを用いて、バウンディングボックスに含まれる物体を特定する。

上記によれば、サーバ１５０の管理者は、ユーザ１９０の関心の対象（物体）を容易に理解し得る。また、サーバ１５０のプロセッサ１２２０は、特定した物体に基づいて、ユーザ１９０が関心を示すであろう広告を配信する処理、およびユーザ１９０が関心を示すであろうパノラマ画像２２を推奨する処理を行なうように構成されてもよい。

［構成］
以上に開示された技術的特徴は、以下のように要約され得る。

（構成１）ある実施形態に従うと、ＨＭＤ１１０によって仮想空間２を提供するためにコンピュータ２００で実行される方法が提供される。この方法は、仮想空間２を定義するステップ（Ｓ１６１０）と、ＨＭＤ１１０のユーザ１９０の発話に対応する第１音声信号を受け付けるステップ（Ｓ１６４０）と、第１音声信号をトリガとして仮想空間２による撮影を実行するステップ（Ｓ１６６０）とを備える。

（構成２）（構成１）に従う方法は、ユーザ１９０に対応するアバターオブジェクト９００Ａを仮想空間２に配置するステップ（Ｓ１６１５）をさらに備える。撮影を実行することは、アバターオブジェクト９００Ａの位置情報に基づいて、アバターオブジェクト９００Ａの少なくとも一部を撮影すること（Ｓ１６３５）を含む。

（構成３）（構成２）において、撮影を実行することは、アバターオブジェクト９００Ａの視線方向とアバターオブジェクト９００Ａの位置情報とに基づいて、アバターオブジェクト９００Ａの少なくとも一部を撮影すること（Ｓ１６３５）を含む。

（構成４）（構成２）または（構成３）において、撮影を実行するステップは、アバターオブジェクト９００Ａの位置を基準に予め定められたパターンで移動する自動カメラを仮想空間２に配置すること（図１７）と、自動カメラにより撮影を実行することとを含む。

（構成５）（構成１）〜（構成４）のいずれかにおいて、撮影を実行するステップは、第１音声信号が予め定められた第１レベル以上である場合（Ｓ１６４５でＹＥＳ）に撮影を実行することを含む。

（構成６）（構成１）〜（構成５）のいずれかにおいて、撮影を実行するステップは、第１音声信号から文字列を抽出すること（Ｓ１６５０）と、抽出された文字列が予め定められた文字列を含む場合（Ｓ１６５５でＹＥＳ）に撮影を実行することとを含む。

（構成７）（構成１）〜（構成６）のいずれかに従う方法は、ユーザ１９０Ａに対応するアバターオブジェクト９００Ａを仮想空間２に配置するステップ（Ｓ１６１５）と、コンピュータ２００Ａと通信可能な他のコンピュータ２００Ｂのユーザ１９０Ｂに対応するアバターオブジェクト９００Ｂを仮想空間２に配置するステップ（Ｓ１６１５）とをさらに備える。撮影を実行することは、第１およびアバターオブジェクト９００Ｂの位置情報に基づいて、アバターオブジェクト９００Ａおよび９００Ｂの各々の少なくとも一部を撮影すること（Ｓ２４１０）を含む。

（構成８）（構成７）に従う方法は、アバターオブジェクト９００Ａとアバターオブジェクト９００Ｂとの間隔Ｄを算出するステップ（Ｓ２４２０）をさらに備える。撮影を実行することは、算出された間隔Ｄが予め定められた間隔未満である場合（Ｓ２４２０でＹＥＳ）に撮影を実行することを含む。

（構成９）（構成８）において、撮影を実行することは、アバターオブジェクト９００Ａおよび９００Ｂが互いに向かい合う場合（図１８）に、当該向かい合う方向に直交する方向から撮影を実行することを含む。

（構成１０）（構成１）〜（構成９）のいずれかに従う方法は、コンピュータ２００Ａと通信可能な他のコンピュータ２００Ｂのユーザ１９０Ｂの発話に対応する第２音声信号を受け付けるステップ（Ｓ１６４０）をさらに備える。撮影を実行することは、第１および第２音声信号をトリガ（Ｓ２５１０）として撮影することを含む。

（構成１１）（構成１０）において、撮影を実行することは、第２レベル以上の第１および第２音声信号のうち一方の音声信号を受け付けてから、第２レベル以上の他方の音声信号を受け付けるまでの時間が予め定められた時間未満である場合（Ｓ２５１０でＹＥＳ）に撮影を実行することを含む。

今回開示された実施形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。

１仮想カメラ、２仮想空間、５基準視線、１０，１２２０プロセッサ、１１メモリ、１２，１２３０ストレージ、１３入出力インターフェイス、１４，１２１０通信インターフェイス、２２パノラマ画像、２３視認領域、２６，１１１０視界画像、１００ＨＭＤシステム、１０５ＨＭＤセット、１１２モニタ、１１４センサ、１１８スピーカ、１１９マイク、１２０ＨＭＤセンサ１３０モーションセンサ、１４０注視センサ、１５０サーバ、１６０コントローラ、１９０ユーザ、２００コンピュータ、２２０表示制御モジュール、２２１仮想カメラ制御モジュール、２２２視界領域決定モジュール、２２３視界画像生成モジュール、２２４基準視線特定モジュール、２３０仮想空間制御モジュール、２３１仮想空間定義モジュール、２３２仮想オブジェクト生成モジュール、２３３操作オブジェクト制御モジュール、２３４アバター制御モジュール、２３５自動カメラ制御モジュール、２４０メモリモジュール、２４１空間情報、２４２オブジェクト情報、２４３，１２３６ユーザ情報、２５０通信制御モジュール、８００右コントローラ、１１００アバターオブジェクト、１２２２送受信部、１２２４サーバ処理部、１２２６マッチング部、１２３２仮想空間指定情報、１２３４アバターオブジェクト情報、１４００自動カメラ、１４１０，１８１０視線方向、１５００，１９００，２１００，２３００画像、１７１０，１７２０円軌道、１２３４１位置情報、１２３４２視線情報。

Claims

ヘッドマウントデバイスによって仮想空間を提供するためにコンピュータで実行される方法であって、
仮想空間を定義するステップと、
ユーザに対応する第１アバターオブジェクトを前記仮想空間に配置するステップと、
前記ヘッドマウントデバイスの前記ユーザの発話に対応する第１音声信号を受け付けるステップと、
前記第１アバターオブジェクトの位置を基準に予め定められたパターンで移動するカメラオブジェクトを前記仮想空間に配置し、前記第１音声信号をトリガとして前記仮想空間において前記カメラオブジェクトを用いて撮影を実行するステップとを備え、
前記撮影を実行するステップにおいて、前記第１アバターオブジェクトの位置情報に基づいて、前記第１アバターオブジェクトの少なくとも一部を撮影する、方法。
前記撮影を実行することは、前記第１アバターオブジェクトの視線方向と前記第１アバターオブジェクトの位置情報とに基づいて、前記第１アバターオブジェクトの少なくとも一部を撮影することを含む、請求項１に記載の方法。
記撮影を実行するステップは、前記第１音声信号が予め定められた第１レベル以上である場合に撮影を実行することを含む、請求項１または２に記載の方法。
前記撮影を実行するステップは、
前記第１音声信号から文字列を抽出することと、
前記抽出された文字列が予め定められた文字列を含む場合に撮影を実行することとを含む、請求項１から３のいずれか１項に記載の方法。
前記ユーザに対応する第１アバターオブジェクトを前記仮想空間に配置するステップと、
前記コンピュータと通信可能な他のコンピュータのユーザに対応する第２アバターオブジェクトを前記仮想空間に配置するステップとをさらに備え、
前記撮影を実行することは、前記第１および第２アバターオブジェクトの位置情報に基づいて、前記第１および第２アバターオブジェクトの各々の少なくとも一部を撮影することを含む、請求項１から４のいずれか１項に記載の方法。
前記第１アバターオブジェクトと前記第２アバターオブジェクトとの間隔を算出するステップをさらに備え、
前記撮影を実行することは、前記算出された間隔が予め定められた間隔未満である場合に撮影を実行することを含む、請求項５に記載の方法。
前記撮影を実行することは、前記第１および第２アバターオブジェクトが互いに向かい合う場合に、当該向かい合う方向に直交する方向から撮影を実行することを含む、請求項６に記載の方法。
前記コンピュータと通信可能な他のコンピュータのユーザの発話に対応する第２音声信号を受け付けるステップをさらに備え、
前記撮影を実行することは、前記第１および第２音声信号をトリガとして撮影することを含む、請求項１から７のいずれか１項に記載の方法。
前記撮影を実行することは、第２レベル以上の前記第１および第２音声信号のうち一方の音声信号を受け付けてから、第２レベル以上の他方の音声信号を受け付けるまでの時間が予め定められた時間未満である場合に撮影を実行することを含む、請求項８に記載の方法。
請求項１から９のいずれか１項に記載の方法をコンピュータに実現させるためのプログラム。
請求項１０に記載のプログラムを格納したメモリと、
前記プログラムを実行するためのプロセッサとを備える、情報処理装置。