JP7295045B2

JP7295045B2 - プログラム、コンピュータが実行する方法及びコンピュータ

Info

Publication number: JP7295045B2
Application number: JP2020005257A
Authority: JP
Inventors: 一晃澤木
Original assignee: Colopl Inc
Current assignee: Colopl Inc
Priority date: 2020-01-16
Filing date: 2020-01-16
Publication date: 2023-06-20
Anticipated expiration: 2040-01-16
Also published as: WO2021145243A1; JP2021114036A

Description

本発明は、プログラム、コンピュータが実行する方法及びコンピュータに関する。

従来、共有する１つの仮想空間を介して、複数のユーザが通信する技術が知られている（例えば、特許文献１参照。）。仮想空間上には各ユーザのアバターが配置され、アバターを介してユーザ同士がチャットすることができる。ユーザが装着するヘッドマウントデバイスによってユーザの顔の動きを検出することで、検出した顔の動きをアバターに反映することも可能である。ユーザは、アバターの顔の動きによってチャット相手の顔の表情を認識でき、仮想空間上での対話をあたかも現実での対話であるかのように体験することができる。

特許第６２９８５６１号公報

時間が経過すると、アバターの顔は崩れてくることがある。原因としては、ヘッドマウントデバイスのずれやユーザが手で触れたときの顔の変形等が、アバターの顔に反映されてしまうことが挙げられる。このようなアバターの顔の崩れは、顔を標準化するキャリブレーションを実行することにより、修正することができる。

通常、チャット中のユーザのヘッドマウントデバイスに表示されるのは、ユーザの視点からの視界画像である。このような１人称視点の視界画像には、チャット相手のアバターは含まれるが、ユーザ自身のアバターは含まれない。ユーザは、自身のアバターの顔が崩れているかどうかを視界画像から判断できないため、チャット相手から顔の崩れを指摘されたときに、キャリブレーションの実行を指示する操作を逐一行わなければならなかった。

本発明は、ユーザの操作がなくとも、アバターの顔のキャリブレーションを適切なタイミングで行うことを目的とする。

ある実施形態によれば、仮想空間を定義するステップと、前記仮想空間上に、第１ユーザに関連付けられた第１アバターを配置するステップと、前記第１ユーザの顔の表情を検出するステップと、前記第１ユーザの顔の表情に応じて、前記第１アバターの顔の表情を制御するステップと、前記第１アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップと、をコンピュータに実行させるためのプログラムが提供される。

本開示によれば、ユーザの操作がなくとも、アバターの顔のキャリブレーションを適切なタイミングで行うことができる。

ある実施の形態に従うＨＭＤシステムの構成の概略を表す図である。ある実施の形態に従うコンピュータのハードウェア構成の一例を表すブロック図である。ある実施の形態に従うＨＭＤに設定されるｕｖｗ視野座標系を概念的に表す図である。ある実施の形態に従う仮想空間を表現する一態様を概念的に表す図である。ある実施の形態に従うＨＭＤを装着するユーザの頭部を上から表した図である。仮想空間において視界領域をＸ方向から見たＹＺ断面を表す図である。仮想空間において視界領域をＹ方向から見たＸＺ断面を表す図である。ある実施の形態に従うコントローラの概略構成を表す図である。ある実施の形態に従うユーザの右手に対して規定されるヨー、ロール、ピッチの各方向の一例を示す図である。ある実施の形態に従うサーバのハードウェア構成の一例を表すブロック図である。ある実施の形態に従うコンピュータをモジュール構成として表すブロック図である。ある実施の形態に従うＨＭＤセットにおいて実行される処理の一部を表すシーケンスチャートである。ネットワークにおいて、各ＨＭＤがユーザに仮想空間を提供する状況を表す模式図である。図１２（Ａ）におけるユーザ５Ａの視界画像を示す図である。ある実施の形態に従うＨＭＤシステムにおいて実行する処理を示すシーケンス図である。ある実施の形態に従うコンピュータのモジュールの詳細構成を表すブロック図である。ユーザの顔画像から口を検出する処理を説明する図である。顔器官検出モジュールが口の形状を検出する処理を説明する図（その１）である。顔器官検出モジュールが口の形状を検出する処理を説明する図（その２）である。フェイストラッキングデータの構造の一例を示す図である。ある実施の形態に従うコンピュータにより実行される処理を示すフローチャートである。他のコンピュータと共有される仮想空間を示す図である。メニューを含む視界画像の一例を示す図である。他のコンピュータのユーザのアバターを含む視界画像の一例を示す図である。キャリブレーション前後のアバターを含む視界画像の一例を示す図である。

以下、この技術的思想の実施の形態について図面を参照しながら詳細に説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。本開示において示される１以上の実施形態において、各実施形態が含む要素を互いに組み合わせることができ、かつ、当該組み合わせられた結果物も本開示が示す実施形態の一部をなすものとする。

［ＨＭＤシステムの構成］
図１を参照して、ＨＭＤ（Head-Mounted Device）システム１００の構成について説明する。図１は、本実施の形態に従うＨＭＤシステム１００の構成の概略を表す図である。ＨＭＤシステム１００は、家庭用のシステムとしてあるいは業務用のシステムとして提供される。

ＨＭＤシステム１００は、サーバ６００と、ＨＭＤセット１１０Ａ，１１０Ｂ，１１０Ｃ，１１０Ｄと、外部機器７００と、ネットワーク２とを含む。ＨＭＤセット１１０Ａ，１１０Ｂ，１１０Ｃ，１１０Ｄの各々は、ネットワーク２を介してサーバ６００や外部機器７００と通信可能に構成される。以下、ＨＭＤセット１１０Ａ，１１０Ｂ，１１０Ｃ，１１０Ｄを総称して、ＨＭＤセット１１０とも言う。ＨＭＤシステム１００を構成するＨＭＤセット１１０の数は、４つに限られず、３つ以下でも、５つ以上でもよい。ＨＭＤセット１１０は、ＨＭＤ１２０と、コンピュータ２００と、ＨＭＤセンサ４１０と、ディスプレイ４３０と、コントローラ３００とを備える。ＨＭＤ１２０は、モニタ１３０と、注視センサ１４０と、第１カメラ１５０と、第２カメラ１６０と、マイク１７０と、スピーカ１８０とを含む。コントローラ３００は、モーションセンサ４２０を含み得る。

ある局面において、コンピュータ２００は、インターネットその他のネットワーク２に接続可能であり、ネットワーク２に接続されているサーバ６００その他のコンピュータと通信可能である。その他のコンピュータとしては、例えば、他のＨＭＤセット１１０のコンピュータや外部機器７００が挙げられる。別の局面において、ＨＭＤ１２０は、ＨＭＤセンサ４１０の代わりに、センサ１９０を含み得る。

ＨＭＤ１２０は、ユーザ５の頭部に装着され、動作中に仮想空間をユーザ５に提供し得る。より具体的には、ＨＭＤ１２０は、右目用の画像および左目用の画像をモニタ１３０にそれぞれ表示する。ユーザ５の各目がそれぞれの画像を視認すると、ユーザ５は、両目の視差に基づき当該画像を３次元画像として認識し得る。ＨＭＤ１２０は、モニタを備える所謂ヘッドマウントディスプレイと、スマートフォンその他のモニタを有する端末を装着可能なヘッドマウント機器のいずれをも含み得る。

モニタ１３０は、例えば、非透過型の表示装置として実現される。ある局面において、モニタ１３０は、ユーザ５の両目の前方に位置するようにＨＭＤ１２０の本体に配置されている。したがって、ユーザ５は、モニタ１３０に表示される３次元画像を視認すると、仮想空間に没入することができる。ある局面において、仮想空間は、例えば、背景、ユーザ５が操作可能なオブジェクト、ユーザ５が選択可能なメニューの画像を含む。ある局面において、モニタ１３０は、所謂スマートフォンその他の情報表示端末が備える液晶モニタまたは有機ＥＬ（Electro Luminescence）モニタとして実現され得る。

別の局面において、モニタ１３０は、透過型の表示装置として実現され得る。この場合、ＨＭＤ１２０は、図１に示されるようにユーザ５の目を覆う密閉型ではなく、メガネ型のような開放型であり得る。透過型のモニタ１３０は、その透過率を調整することにより、一時的に非透過型の表示装置として構成可能であってもよい。モニタ１３０は、仮想空間を構成する画像の一部と、現実空間とを同時に表示する構成を含んでいてもよい。例えば、モニタ１３０は、ＨＭＤ１２０に搭載されたカメラで撮影した現実空間の画像を表示してもよいし、一部の透過率を高く設定することにより現実空間を視認可能にしてもよい。

ある局面において、モニタ１３０は、右目用の画像を表示するためのサブモニタと、左目用の画像を表示するためのサブモニタとを含み得る。別の局面において、モニタ１３０は、右目用の画像と左目用の画像とを一体として表示する構成であってもよい。この場合、モニタ１３０は、高速シャッタを含む。高速シャッタは、画像がいずれか一方の目にのみ認識されるように、右目用の画像と左目用の画像とを交互に表示可能に作動する。

ある局面において、ＨＭＤ１２０は、図示せぬ複数の光源を含む。各光源は例えば、赤外線を発するＬＥＤ（Light Emitting Diode）により実現される。ＨＭＤセンサ４１０は、ＨＭＤ１２０の動きを検出するためのポジショントラッキング機能を有する。より具体的には、ＨＭＤセンサ４１０は、ＨＭＤ１２０が発する複数の赤外線を読み取り、現実空間内におけるＨＭＤ１２０の位置および傾きを検出する。

別の局面において、ＨＭＤセンサ４１０は、カメラにより実現されてもよい。この場合、ＨＭＤセンサ４１０は、カメラから出力されるＨＭＤ１２０の画像情報を用いて、画像解析処理を実行することにより、ＨＭＤ１２０の位置および傾きを検出することができる。

別の局面において、ＨＭＤ１２０は、位置検出器として、ＨＭＤセンサ４１０の代わりに、あるいはＨＭＤセンサ４１０に加えてセンサ１９０を備えてもよい。ＨＭＤ１２０は、センサ１９０を用いて、ＨＭＤ１２０自身の位置および傾きを検出し得る。例えば、センサ１９０が角速度センサ、地磁気センサ、あるいは加速度センサである場合、ＨＭＤ１２０は、ＨＭＤセンサ４１０の代わりに、これらの各センサのいずれかを用いて、自身の位置および傾きを検出し得る。一例として、センサ１９０が角速度センサである場合、角速度センサは、現実空間におけるＨＭＤ１２０の３軸周りの角速度を経時的に検出する。ＨＭＤ１２０は、各角速度に基づいて、ＨＭＤ１２０の３軸周りの角度の時間的変化を算出し、さらに、角度の時間的変化に基づいて、ＨＭＤ１２０の傾きを算出する。

注視センサ１４０は、ユーザ５の右目および左目の視線が向けられる方向を検出する。つまり、注視センサ１４０は、ユーザ５の視線を検出する。視線の方向の検出は、例えば、公知のアイトラッキング機能によって実現される。注視センサ１４０は、当該アイトラッキング機能を有するセンサにより実現される。ある局面において、注視センサ１４０は、右目用のセンサおよび左目用のセンサを含むことが好ましい。注視センサ１４０は、例えば、ユーザ５の右目および左目に赤外光を照射するとともに、照射光に対する角膜および虹彩からの反射光を受けることにより各眼球の回転角を検出するセンサであってもよい。注視センサ１４０は、検出した各回転角に基づいて、ユーザ５の視線を検知することができる。

第１カメラ１５０は、ユーザ５の顔の下部を撮影する。より具体的には、第１カメラ１５０は、ユーザ５の鼻および口などを撮影する。第２カメラ１６０は、ユーザ５の目および眉などを撮影する。ＨＭＤ１２０のユーザ５側の筐体をＨＭＤ１２０の内側、ＨＭＤ１２０のユーザ５とは逆側の筐体をＨＭＤ１２０の外側と定義する。ある局面において、第１カメラ１５０は、ＨＭＤ１２０の外側に配置され、第２カメラ１６０は、ＨＭＤ１２０の内側に配置され得る。第１カメラ１５０および第２カメラ１６０が生成した画像は、コンピュータ２００に入力される。別の局面において、第１カメラ１５０と第２カメラ１６０とを１台のカメラとして実現し、この１台のカメラでユーザ５の顔を撮影するようにしてもよい。

マイク１７０は、ユーザ５の発話を音声信号（電気信号）に変換してコンピュータ２００に出力する。スピーカ１８０は、音声信号を音声に変換してユーザ５に出力する。別の局面において、ＨＭＤ１２０は、スピーカ１８０に替えてイヤホンを含み得る。

コントローラ３００は、有線または無線によりコンピュータ２００に接続されている。コントローラ３００は、ユーザ５からコンピュータ２００への命令の入力を受け付ける。ある局面において、コントローラ３００は、ユーザ５によって把持可能に構成される。別の局面において、コントローラ３００は、ユーザ５の身体あるいは衣類の一部に装着可能に構成される。さらに別の局面において、コントローラ３００は、コンピュータ２００から送信される信号に基づいて、振動、音、光のうちの少なくともいずれかを出力するように構成されてもよい。さらに別の局面において、コントローラ３００は、ユーザ５から、仮想空間に配置されるオブジェクトの位置や動きを制御するための操作を受け付ける。

ある局面において、コントローラ３００は、複数の光源を含む。各光源は例えば、赤外線を発するＬＥＤにより実現される。ＨＭＤセンサ４１０は、ポジショントラッキング機能を有する。この場合、ＨＭＤセンサ４１０は、コントローラ３００が発する複数の赤外線を読み取り、現実空間内におけるコントローラ３００の位置および傾きを検出する。別の局面において、ＨＭＤセンサ４１０は、カメラにより実現されてもよい。この場合、ＨＭＤセンサ４１０は、カメラから出力されるコントローラ３００の画像情報を用いて、画像解析処理を実行することにより、コントローラ３００の位置および傾きを検出することができる。

モーションセンサ４２０は、ある局面において、ユーザ５の手に取り付けられて、ユーザ５の手の動きを検出する。例えば、モーションセンサ４２０は、手の回転速度、回転数等を検出する。検出された信号は、コンピュータ２００に送られる。モーションセンサ４２０は、例えば、コントローラ３００に設けられている。ある局面において、モーションセンサ４２０は、例えば、ユーザ５に把持可能に構成されたコントローラ３００に設けられている。別の局面において、現実空間における安全のため、コントローラ３００は、手袋型のようにユーザ５の手に装着されることにより容易に飛んで行かないものに装着される。さらに別の局面において、ユーザ５に装着されないセンサがユーザ５の手の動きを検出してもよい。例えば、ユーザ５を撮影するカメラの信号が、ユーザ５の動作を表す信号として、コンピュータ２００に入力されてもよい。モーションセンサ４２０とコンピュータ２００とは、一例として、無線により互いに接続される。無線の場合、通信形態は特に限られず、例えば、Ｂｌｕｅｔｏｏｔｈ（登録商標）その他の公知の通信手法が用いられる。

ディスプレイ４３０は、モニタ１３０に表示されている画像と同様の画像を表示する。これにより、ＨＭＤ１２０を装着しているユーザ５以外のユーザにも当該ユーザ５と同様の画像を視聴させることができる。ディスプレイ４３０に表示される画像は、３次元画像である必要はなく、右目用の画像や左目用の画像であってもよい。ディスプレイ４３０としては、例えば、液晶ディスプレイや有機ＥＬモニタなどが挙げられる。

サーバ６００は、コンピュータ２００にプログラムを送信し得る。別の局面において、サーバ６００は、他のユーザによって使用されるＨＭＤ１２０に仮想現実を提供するための他のコンピュータ２００と通信し得る。例えば、アミューズメント施設において、複数のユーザが参加型のゲームを行う場合、各コンピュータ２００は、各ユーザの動作に基づく信号をサーバ６００を介して他のコンピュータ２００と通信して、同じ仮想空間において複数のユーザが共通のゲームを楽しむことを可能にする。各コンピュータ２００は、各ユーザの動作に基づく信号をサーバ６００を介さずに他のコンピュータ２００と通信するようにしてもよい。

外部機器７００は、コンピュータ２００と通信可能な機器であればどのような機器であってもよい。外部機器７００は、例えば、ネットワーク２を介してコンピュータ２００と通信可能な機器であってもよいし、近距離無線通信や有線接続によりコンピュータ２００と直接通信可能な機器であってもよい。外部機器７００としては、例えば、スマートデバイス、ＰＣ（Personal Computer）、およびコンピュータ２００の周辺機器などが挙げられるが、これらに限定されるものではない。

［コンピュータのハードウェア構成］
図２を参照して、本実施の形態に係るコンピュータ２００について説明する。図２は、本実施の形態に従うコンピュータ２００のハードウェア構成の一例を表すブロック図である。コンピュータ２００は、主たる構成要素として、プロセッサ２１０と、メモリ２２０と、ストレージ２３０と、入出力インターフェイス２４０と、通信インターフェイス２５０とを備える。各構成要素は、それぞれ、バス２６０に接続されている。

プロセッサ２１０は、コンピュータ２００に与えられる信号に基づいて、あるいは、予め定められた条件が成立したことに基づいて、メモリ２２０またはストレージ２３０に格納されているプログラムに含まれる一連の命令を実行する。ある局面において、プロセッサ２１０は、ＣＰＵ（Central Processing Unit）、ＧＰＵ（Graphics Processing Unit）、ＭＰＵ（Micro Processor Unit）、ＦＰＧＡ（Field-Programmable Gate Array）その他のデバイスとして実現される。

メモリ２２０は、プログラムおよびデータを一時的に保存する。プログラムは、例えば、ストレージ２３０からロードされる。データは、コンピュータ２００に入力されたデータと、プロセッサ２１０によって生成されたデータとを含む。ある局面において、メモリ２２０は、ＲＡＭ（Random Access Memory）その他の揮発メモリとして実現される。

ストレージ２３０は、プログラムおよびデータを永続的に保持する。ストレージ２３０は、例えば、ＲＯＭ（Read-Only Memory）、ハードディスク装置、フラッシュメモリ、その他の不揮発記憶装置として実現される。ストレージ２３０に格納されるプログラムは、ＨＭＤシステム１００において仮想空間を提供するためのプログラム、シミュレーションプログラム、ゲームプログラム、ユーザ認証プログラム、他のコンピュータ２００との通信を実現するためのプログラムを含む。ストレージ２３０に格納されるデータは、仮想空間を規定するためのデータおよびオブジェクト等を含む。

別の局面において、ストレージ２３０は、メモリカードのように着脱可能な記憶装置として実現されてもよい。さらに別の局面において、コンピュータ２００に内蔵されたストレージ２３０の代わりに、外部の記憶装置に保存されているプログラムおよびデータを使用する構成が使用されてもよい。このような構成によれば、例えば、アミューズメント施設のように複数のＨＭＤシステム１００が使用される場面において、プログラムやデータの更新を一括して行うことが可能になる。

入出力インターフェイス２４０は、ＨＭＤ１２０、ＨＭＤセンサ４１０、モーションセンサ４２０およびディスプレイ４３０との間で信号を通信する。ＨＭＤ１２０に含まれるモニタ１３０，注視センサ１４０，第１カメラ１５０，第２カメラ１６０，マイク１７０およびスピーカ１８０は、ＨＭＤ１２０の入出力インターフェイス２４０を介してコンピュータ２００との通信を行ない得る。ある局面において、入出力インターフェイス２４０は、ＵＳＢ（Universal Serial Bus）、ＤＶＩ（Digital Visual Interface）、ＨＤＭＩ（登録商標）（High-Definition Multimedia Interface）その他の端子を用いて実現される。入出力インターフェイス２４０は上述のものに限られない。

ある局面において、入出力インターフェイス２４０は、さらに、コントローラ３００と通信し得る。例えば、入出力インターフェイス２４０は、コントローラ３００およびモーションセンサ４２０から出力された信号の入力を受ける。別の局面において、入出力インターフェイス２４０は、プロセッサ２１０から出力された命令を、コントローラ３００に送る。当該命令は、振動、音声出力、発光等をコントローラ３００に指示する。コントローラ３００は、当該命令を受信すると、その命令に応じて、振動、音声出力または発光のいずれかを実行する。

通信インターフェイス２５０は、ネットワーク２に接続されて、ネットワーク２に接続されている他のコンピュータ（例えば、サーバ６００）と通信する。ある局面において、通信インターフェイス２５０は、例えば、ＬＡＮ（Local Area Network）その他の有線通信インターフェイス、あるいは、ＷｉＦｉ（Wireless Fidelity）、Ｂｌｕｅｔｏｏｔｈ（登録商標）、ＮＦＣ（Near Field Communication）その他の無線通信インターフェイスとして実現される。通信インターフェイス２５０は上述のものに限られない。

ある局面において、プロセッサ２１０は、ストレージ２３０にアクセスし、ストレージ２３０に格納されている１つ以上のプログラムをメモリ２２０にロードし、当該プログラムに含まれる一連の命令を実行する。当該１つ以上のプログラムは、コンピュータ２００のオペレーティングシステム、仮想空間を提供するためのアプリケーションプログラム、仮想空間で実行可能なゲームソフトウェア等を含み得る。プロセッサ２１０は、入出力インターフェイス２４０を介して、仮想空間を提供するための信号をＨＭＤ１２０に送る。ＨＭＤ１２０は、その信号に基づいてモニタ１３０に映像を表示する。

図２に示される例では、コンピュータ２００は、ＨＭＤ１２０の外部に設けられる構成が示されているが、別の局面において、コンピュータ２００は、ＨＭＤ１２０に内蔵されてもよい。一例として、モニタ１３０を含む携帯型の情報通信端末（例えば、スマートフォン）がコンピュータ２００として機能してもよい。

コンピュータ２００は、複数のＨＭＤ１２０に共通して用いられる構成であってもよい。このような構成によれば、例えば、複数のユーザに同一の仮想空間を提供することもできるので、各ユーザは同一の仮想空間で他のユーザと同一のアプリケーションを楽しむことができる。

ある実施の形態において、ＨＭＤシステム１００では、現実空間における座標系である実座標系が予め設定されている。実座標系は、現実空間における鉛直方向、鉛直方向に直交する水平方向、並びに、鉛直方向および水平方向の双方に直交する前後方向にそれぞれ平行な、３つの基準方向（軸）を有する。実座標系における水平方向、鉛直方向（上下方向）、および前後方向は、それぞれ、ｘ軸、ｙ軸、ｚ軸と規定される。より具体的には、実座標系において、ｘ軸は現実空間の水平方向に平行である。ｙ軸は、現実空間の鉛直方向に平行である。ｚ軸は現実空間の前後方向に平行である。

ある局面において、ＨＭＤセンサ４１０は、赤外線センサを含む。赤外線センサが、ＨＭＤ１２０の各光源から発せられた赤外線をそれぞれ検出すると、ＨＭＤ１２０の存在を検出する。ＨＭＤセンサ４１０は、さらに、各点の値（実座標系における各座標値）に基づいて、ＨＭＤ１２０を装着したユーザ５の動きに応じた、現実空間内におけるＨＭＤ１２０の位置および傾き（向き）を検出する。より詳しくは、ＨＭＤセンサ４１０は、経時的に検出された各値を用いて、ＨＭＤ１２０の位置および傾きの時間的変化を検出できる。

ＨＭＤセンサ４１０によって検出されたＨＭＤ１２０の各傾きは、実座標系におけるＨＭＤ１２０の３軸周りの各傾きに相当する。ＨＭＤセンサ４１０は、実座標系におけるＨＭＤ１２０の傾きに基づき、ｕｖｗ視野座標系をＨＭＤ１２０に設定する。ＨＭＤ１２０に設定されるｕｖｗ視野座標系は、ＨＭＤ１２０を装着したユーザ５が仮想空間において物体を見る際の視点座標系に対応する。

［ｕｖｗ視野座標系］
図３を参照して、ｕｖｗ視野座標系について説明する。図３は、ある実施の形態に従うＨＭＤ１２０に設定されるｕｖｗ視野座標系を概念的に表す図である。ＨＭＤセンサ４１０は、ＨＭＤ１２０の起動時に、実座標系におけるＨＭＤ１２０の位置および傾きを検出する。プロセッサ２１０は、検出された値に基づいて、ｕｖｗ視野座標系をＨＭＤ１２０に設定する。

図３に示されるように、ＨＭＤ１２０は、ＨＭＤ１２０を装着したユーザ５の頭部を中心（原点）とした３次元のｕｖｗ視野座標系を設定する。より具体的には、ＨＭＤ１２０は、実座標系を規定する水平方向、鉛直方向、および前後方向（ｘ軸、ｙ軸、ｚ軸）を、実座標系内においてＨＭＤ１２０の各軸周りの傾きだけ各軸周りにそれぞれ傾けることによって新たに得られる３つの方向を、ＨＭＤ１２０におけるｕｖｗ視野座標系のピッチ軸（ｕ軸）、ヨー軸（ｖ軸）、およびロール軸（ｗ軸）として設定する。

ある局面において、ＨＭＤ１２０を装着したユーザ５が直立し、かつ、正面を視認している場合、プロセッサ２１０は、実座標系に平行なｕｖｗ視野座標系をＨＭＤ１２０に設定する。この場合、実座標系における水平方向（ｘ軸）、鉛直方向（ｙ軸）、および前後方向（ｚ軸）は、ＨＭＤ１２０におけるｕｖｗ視野座標系のピッチ軸（ｕ軸）、ヨー軸（ｖ軸）、およびロール軸（ｗ軸）に一致する。

ｕｖｗ視野座標系がＨＭＤ１２０に設定された後、ＨＭＤセンサ４１０は、ＨＭＤ１２０の動きに基づいて、設定されたｕｖｗ視野座標系におけるＨＭＤ１２０の傾きを検出できる。この場合、ＨＭＤセンサ４１０は、ＨＭＤ１２０の傾きとして、ｕｖｗ視野座標系におけるＨＭＤ１２０のピッチ角（θｕ）、ヨー角（θｖ）、およびロール角（θｗ）をそれぞれ検出する。ピッチ角（θｕ）は、ｕｖｗ視野座標系におけるピッチ軸周りのＨＭＤ１２０の傾き角度を表す。ヨー角（θｖ）は、ｕｖｗ視野座標系におけるヨー軸周りのＨＭＤ１２０の傾き角度を表す。ロール角（θｗ）は、ｕｖｗ視野座標系におけるロール軸周りのＨＭＤ１２０の傾き角度を表す。

ＨＭＤセンサ４１０は、検出されたＨＭＤ１２０の傾きに基づいて、ＨＭＤ１２０が動いた後のＨＭＤ１２０におけるｕｖｗ視野座標系を、ＨＭＤ１２０に設定する。ＨＭＤ１２０と、ＨＭＤ１２０のｕｖｗ視野座標系との関係は、ＨＭＤ１２０の位置および傾きに関わらず、常に一定である。ＨＭＤ１２０の位置および傾きが変わると、当該位置および傾きの変化に連動して、実座標系におけるＨＭＤ１２０のｕｖｗ視野座標系の位置および傾きが変化する。

ある局面において、ＨＭＤセンサ４１０は、赤外線センサからの出力に基づいて取得される赤外線の光強度および複数の点間の相対的な位置関係（例えば、各点間の距離など）に基づいて、ＨＭＤ１２０の現実空間内における位置を、ＨＭＤセンサ４１０に対する相対位置として特定してもよい。プロセッサ２１０は、特定された相対位置に基づいて、現実空間内（実座標系）におけるＨＭＤ１２０のｕｖｗ視野座標系の原点を決定してもよい。

［仮想空間］
図４を参照して、仮想空間についてさらに説明する。図４は、ある実施の形態に従う仮想空間１１を表現する一態様を概念的に表す図である。仮想空間１１は、中心１２の３６０度方向の全体を覆う全天球状の構造を有する。図４では、説明を複雑にしないために、仮想空間１１のうちの上半分の天球が例示されている。仮想空間１１では各メッシュが規定される。各メッシュの位置は、仮想空間１１に規定されるグローバル座標系であるＸＹＺ座標系における座標値として予め規定されている。コンピュータ２００は、仮想空間１１に展開可能なパノラマ画像１３（静止画、動画等）を構成する各部分画像を、仮想空間１１において対応する各メッシュにそれぞれ対応付ける。

ある局面において、仮想空間１１では、中心１２を原点とするＸＹＺ座標系が規定される。ＸＹＺ座標系は、例えば、実座標系に平行である。ＸＹＺ座標系における水平方向、鉛直方向（上下方向）、および前後方向は、それぞれＸ軸、Ｙ軸、Ｚ軸として規定される。したがって、ＸＹＺ座標系のＸ軸（水平方向）が実座標系のｘ軸と平行であり、ＸＹＺ座標系のＹ軸（鉛直方向）が実座標系のｙ軸と平行であり、ＸＹＺ座標系のＺ軸（前後方向）が実座標系のｚ軸と平行である。

ＨＭＤ１２０の起動時、すなわちＨＭＤ１２０の初期状態において、仮想カメラ１４が、仮想空間１１の中心１２に配置される。ある局面において、プロセッサ２１０は、仮想カメラ１４が撮影する画像をＨＭＤ１２０のモニタ１３０に表示する。仮想カメラ１４は、現実空間におけるＨＭＤ１２０の動きに連動して、仮想空間１１を同様に移動する。これにより、現実空間におけるＨＭＤ１２０の位置および傾きの変化が、仮想空間１１において同様に再現され得る。

仮想カメラ１４には、ＨＭＤ１２０の場合と同様に、ｕｖｗ視野座標系が規定される。仮想空間１１における仮想カメラ１４のｕｖｗ視野座標系は、現実空間（実座標系）におけるＨＭＤ１２０のｕｖｗ視野座標系に連動するように規定されている。したがって、ＨＭＤ１２０の傾きが変化すると、それに応じて、仮想カメラ１４の傾きも変化する。仮想カメラ１４は、ＨＭＤ１２０を装着したユーザ５の現実空間における移動に連動して、仮想空間１１において移動することもできる。

コンピュータ２００のプロセッサ２１０は、仮想カメラ１４の位置と傾き（基準視線１６）とに基づいて、仮想空間１１における視界領域１５を規定する。視界領域１５は、仮想空間１１のうち、ＨＭＤ１２０を装着したユーザ５が視認する領域に対応する。つまり、仮想カメラ１４の位置は、仮想空間１１におけるユーザ５の視点と言える。

注視センサ１４０によって検出されるユーザ５の視線は、ユーザ５が物体を視認する際の視点座標系における方向である。ＨＭＤ１２０のｕｖｗ視野座標系は、ユーザ５がモニタ１３０を視認する際の視点座標系に等しい。仮想カメラ１４のｕｖｗ視野座標系は、ＨＭＤ１２０のｕｖｗ視野座標系に連動している。したがって、ある局面に従うＨＭＤシステム１００は、注視センサ１４０によって検出されたユーザ５の視線を、仮想カメラ１４のｕｖｗ視野座標系におけるユーザ５の視線とみなすことができる。

［ユーザの視線］
図５を参照して、ユーザ５の視線の決定について説明する。図５は、ある実施の形態に従うＨＭＤ１２０を装着するユーザ５の頭部を上から表した図である。

ある局面において、注視センサ１４０は、ユーザ５の右目および左目の各視線を検出する。ある局面において、ユーザ５が近くを見ている場合、注視センサ１４０は、視線Ｒ１およびＬ１を検出する。別の局面において、ユーザ５が遠くを見ている場合、注視センサ１４０は、視線Ｒ２およびＬ２を検出する。この場合、ロール軸ｗに対して視線Ｒ２およびＬ２が成す角度は、ロール軸ｗに対して視線Ｒ１およびＬ１が成す角度よりも小さい。注視センサ１４０は、検出結果をコンピュータ２００に送信する。

コンピュータ２００が、視線の検出結果として、視線Ｒ１およびＬ１の検出値を注視センサ１４０から受信した場合には、その検出値に基づいて、視線Ｒ１およびＬ１の交点である注視点Ｎ１を特定する。一方、コンピュータ２００は、視線Ｒ２およびＬ２の検出値を注視センサ１４０から受信した場合には、視線Ｒ２およびＬ２の交点を注視点として特定する。コンピュータ２００は、特定した注視点Ｎ１の位置に基づき、ユーザ５の視線Ｎ０を特定する。コンピュータ２００は、例えば、ユーザ５の右目Ｒと左目Ｌとを結ぶ直線の中点と、注視点Ｎ１とを通る直線の延びる方向を、視線Ｎ０として検出する。視線Ｎ０は、ユーザ５が両目により実際に視線を向けている方向である。視線Ｎ０は、視界領域１５に対してユーザ５が実際に視線を向けている方向に相当する。

別の局面において、ＨＭＤシステム１００は、テレビジョン放送受信チューナを備えてもよい。このような構成によれば、ＨＭＤシステム１００は、仮想空間１１においてテレビ番組を表示することができる。

さらに別の局面において、ＨＭＤシステム１００は、インターネットに接続するための通信回路、あるいは、電話回線に接続するための通話機能を備えていてもよい。

［視界領域］
図６および図７を参照して、視界領域１５について説明する。図６は、仮想空間１１において視界領域１５をＸ方向から見たＹＺ断面を表す図である。図７は、仮想空間１１において視界領域１５をＹ方向から見たＸＺ断面を表す図である。

図６に示されるように、ＹＺ断面における視界領域１５は、領域１８を含む。領域１８は、仮想カメラ１４の位置と基準視線１６と仮想空間１１のＹＺ断面とによって定義される。プロセッサ２１０は、仮想空間における基準視線１６を中心として極角αを含む範囲を、領域１８として規定する。

図７に示されるように、ＸＺ断面における視界領域１５は、領域１９を含む。領域１９は、仮想カメラ１４の位置と基準視線１６と仮想空間１１のＸＺ断面とによって定義される。プロセッサ２１０は、仮想空間１１における基準視線１６を中心とした方位角βを含む範囲を、領域１９として規定する。極角αおよびβは、仮想カメラ１４の位置と仮想カメラ１４の傾き（向き）とに応じて定まる。

ある局面において、ＨＭＤシステム１００は、コンピュータ２００からの信号に基づいて、視界画像１７をモニタ１３０に表示させることにより、ユーザ５に仮想空間１１における視界を提供する。視界画像１７は、パノラマ画像１３のうち視界領域１５に対応する部分に相当する画像である。ユーザ５が、頭に装着したＨＭＤ１２０を動かすと、その動きに連動して仮想カメラ１４も動く。その結果、仮想空間１１における視界領域１５の位置が変化する。これにより、モニタ１３０に表示される視界画像１７は、パノラマ画像１３のうち、仮想空間１１においてユーザ５が向いた方向の視界領域１５に重畳する画像に更新される。ユーザ５は、仮想空間１１における所望の方向を視認することができる。

このように、仮想カメラ１４の傾きは仮想空間１１におけるユーザ５の視線（基準視線１６）に相当し、仮想カメラ１４が配置される位置は、仮想空間１１におけるユーザ５の視点に相当する。したがって、仮想カメラ１４の位置または傾きを変更することにより、モニタ１３０に表示される画像が更新され、ユーザ５の視界が移動される。

ユーザ５は、ＨＭＤ１２０を装着している間、現実世界を視認することなく、仮想空間１１に展開されるパノラマ画像１３のみを視認できる。そのため、ＨＭＤシステム１００は、仮想空間１１への高い没入感覚をユーザ５に与えることができる。

ある局面において、プロセッサ２１０は、ＨＭＤ１２０を装着したユーザ５の現実空間における移動に連動して、仮想空間１１において仮想カメラ１４を移動し得る。この場合、プロセッサ２１０は、仮想空間１１における仮想カメラ１４の位置および傾きに基づいて、ＨＭＤ１２０のモニタ１３０に投影される画像領域（視界領域１５）を特定する。

ある局面において、仮想カメラ１４は、２つの仮想カメラ、すなわち、右目用の画像を提供するための仮想カメラと、左目用の画像を提供するための仮想カメラとを含み得る。ユーザ５が３次元の仮想空間１１を認識できるように、適切な視差が、２つの仮想カメラに設定される。別の局面において、仮想カメラ１４を１つの仮想カメラにより実現してもよい。この場合、１つの仮想カメラにより得られた画像から、右目用の画像と左目用の画像とを生成するようにしてもよい。本実施の形態においては、仮想カメラ１４が２つの仮想カメラを含み、２つの仮想カメラのロール軸が合成されることによって生成されるロール軸（ｗ）がＨＭＤ１２０のロール軸（ｗ）に適合されるように構成されているものとして、本開示に係る技術思想を例示する。

［コントローラ］
図８を参照して、コントローラ３００の一例について説明する。図８は、ある実施の形態に従うコントローラ３００の概略構成を表す図である。

図８に示されるように、ある局面において、コントローラ３００は、右コントローラ３００Ｒと図示せぬ左コントローラとを含み得る。右コントローラ３００Ｒは、ユーザ５の右手で操作される。左コントローラは、ユーザ５の左手で操作される。ある局面において、右コントローラ３００Ｒと左コントローラとは、別個の装置として対称に構成される。したがって、ユーザ５は、右コントローラ３００Ｒを把持した右手と、左コントローラを把持した左手とをそれぞれ自由に動かすことができる。別の局面において、コントローラ３００は両手の操作を受け付ける一体型のコントローラであってもよい。以下、右コントローラ３００Ｒについて説明する。

右コントローラ３００Ｒは、グリップ３１０と、フレーム３２０と、天面３３０とを備える。グリップ３１０は、ユーザ５の右手によって把持されるように構成されている。たとえば、グリップ３１０は、ユーザ５の右手の掌と３本の指（中指、薬指、小指）とによって保持され得る。

グリップ３１０は、ボタン３４０，３５０と、モーションセンサ４２０とを含む。ボタン３４０は、グリップ３１０の側面に配置され、右手の中指による操作を受け付ける。ボタン３５０は、グリップ３１０の前面に配置され、右手の人差し指による操作を受け付ける。ある局面において、ボタン３４０，３５０は、トリガー式のボタンとして構成される。モーションセンサ４２０は、グリップ３１０の筐体に内蔵されている。ユーザ５の動作がカメラその他の装置によってユーザ５の周りから検出可能である場合には、グリップ３１０は、モーションセンサ４２０を備えなくてもよい。

フレーム３２０は、その円周方向に沿って配置された複数の赤外線ＬＥＤ３６０を含む。赤外線ＬＥＤ３６０は、コントローラ３００を使用するプログラムの実行中に、当該プログラムの進行に合わせて赤外線を発光する。赤外線ＬＥＤ３６０から発せられた赤外線は、右コントローラ３００Ｒと左コントローラとの各位置や姿勢（傾き、向き）を検出するために使用され得る。図８に示される例では、二列に配置された赤外線ＬＥＤ３６０が示されているが、配列の数は図８に示されるものに限られない。一列あるいは３列以上の配列が使用されてもよい。

天面３３０は、ボタン３７０，３８０と、アナログスティック３９０とを備える。ボタン３７０，３８０は、プッシュ式ボタンとして構成される。ボタン３７０，３８０は、ユーザ５の右手の親指による操作を受け付ける。アナログスティック３９０は、ある局面において、初期位置（ニュートラルの位置）から３６０度任意の方向への操作を受け付ける。当該操作は、たとえば、仮想空間１１に配置されるオブジェクトを移動するための操作を含む。

ある局面において、右コントローラ３００Ｒおよび左コントローラは、赤外線ＬＥＤ３６０その他の部材を駆動するための電池を含む。電池は、充電式、ボタン型、乾電池型などを含むが、これらに限定されない。別の局面において、右コントローラ３００Ｒと左コントローラは、たとえば、コンピュータ２００のＵＳＢインターフェースに接続され得る。この場合、右コントローラ３００Ｒおよび左コントローラは、電池を必要としない。

図８の状態（Ａ）および状態（Ｂ）に示されるように、例えば、ユーザ５の右手に対して、ヨー、ロール、ピッチの各方向が規定される。ユーザ５が親指と人差し指とを伸ばした場合に、親指の伸びる方向がヨー方向、人差し指の伸びる方向がロール方向、ヨー方向の軸およびロール方向の軸によって規定される平面に垂直な方向がピッチ方向として規定される。

［サーバのハードウェア構成］
図９を参照して、本実施の形態に係るサーバ６００について説明する。図９は、ある実施の形態に従うサーバ６００のハードウェア構成の一例を表すブロック図である。サーバ６００は、主たる構成要素として、プロセッサ６１０と、メモリ６２０と、ストレージ６３０と、入出力インターフェイス６４０と、通信インターフェイス６５０とを備える。各構成要素は、それぞれ、バス６６０に接続されている。

プロセッサ６１０は、サーバ６００に与えられる信号に基づいて、あるいは、予め定められた条件が成立したことに基づいて、メモリ６２０またはストレージ６３０に格納されているプログラムに含まれる一連の命令を実行する。ある局面において、プロセッサ６１０は、ＣＰＵ、ＧＰＵ、ＭＰＵ、ＦＰＧＡその他のデバイスとして実現される。

メモリ６２０は、プログラムおよびデータを一時的に保存する。プログラムは、例えば、ストレージ６３０からロードされる。データは、サーバ６００に入力されたデータと、プロセッサ６１０によって生成されたデータとを含む。ある局面において、メモリ６２０は、ＲＡＭその他の揮発メモリとして実現される。

ストレージ６３０は、プログラムおよびデータを永続的に保持する。ストレージ６３０は、例えば、ＲＯＭ、ハードディスク装置、フラッシュメモリ、その他の不揮発記憶装置として実現される。ストレージ６３０に格納されるプログラムは、ＨＭＤシステム１００において仮想空間を提供するためのプログラム、シミュレーションプログラム、ゲームプログラム、ユーザ認証プログラム、コンピュータ２００との通信を実現するためのプログラムを含んでもよい。ストレージ６３０に格納されるデータは、仮想空間を規定するためのデータおよびオブジェクト等を含んでもよい。

別の局面において、ストレージ６３０は、メモリカードのように着脱可能な記憶装置として実現されてもよい。さらに別の局面において、サーバ６００に内蔵されたストレージ６３０の代わりに、外部の記憶装置に保存されているプログラムおよびデータを使用する構成が使用されてもよい。このような構成によれば、例えば、アミューズメント施設のように複数のＨＭＤシステム１００が使用される場面において、プログラムやデータの更新を一括して行うことが可能になる。

入出力インターフェイス６４０は、入出力機器との間で信号を通信する。ある局面において、入出力インターフェイス６４０は、ＵＳＢ、ＤＶＩ、ＨＤＭＩその他の端子を用いて実現される。入出力インターフェイス６４０は上述のものに限られない。

通信インターフェイス６５０は、ネットワーク２に接続されて、ネットワーク２に接続されているコンピュータ２００と通信する。ある局面において、通信インターフェイス６５０は、例えば、ＬＡＮその他の有線通信インターフェイス、あるいは、ＷｉＦｉ、Ｂｌｕｅｔｏｏｔｈ、ＮＦＣその他の無線通信インターフェイスとして実現される。通信インターフェイス６５０は上述のものに限られない。

ある局面において、プロセッサ６１０は、ストレージ６３０にアクセスし、ストレージ６３０に格納されている１つ以上のプログラムをメモリ６２０にロードし、当該プログラムに含まれる一連の命令を実行する。当該１つ以上のプログラムは、サーバ６００のオペレーティングシステム、仮想空間を提供するためのアプリケーションプログラム、仮想空間で実行可能なゲームソフトウェア等を含み得る。プロセッサ６１０は、入出力インターフェイス６４０を介して、仮想空間を提供するための信号をコンピュータ２００に送ってもよい。

［ＨＭＤの制御装置］
図１０を参照して、ＨＭＤ１２０の制御装置について説明する。ある実施の形態において、制御装置は周知の構成を有するコンピュータ２００によって実現される。図１０は、ある実施の形態に従うコンピュータ２００をモジュール構成として表すブロック図である。

図１０に示されるように、コンピュータ２００は、コントロールモジュール５１０と、レンダリングモジュール５２０と、メモリモジュール５３０と、通信制御モジュール５４０とを備える。ある局面において、コントロールモジュール５１０とレンダリングモジュール５２０とは、プロセッサ２１０によって実現される。別の局面において、複数のプロセッサ２１０がコントロールモジュール５１０とレンダリングモジュール５２０として作動してもよい。メモリモジュール５３０は、メモリ２２０またはストレージ２３０によって実現される。通信制御モジュール５４０は、通信インターフェイス２５０によって実現される。

コントロールモジュール５１０は、ユーザ５に提供される仮想空間１１を制御する。コントロールモジュール５１０は、仮想空間１１を表す仮想空間データを用いて、ＨＭＤシステム１００における仮想空間１１を規定する。仮想空間データは、例えば、メモリモジュール５３０に記憶されている。コントロールモジュール５１０が、仮想空間データを生成したり、サーバ６００などから仮想空間データを取得するようにしたりしてもよい。

コントロールモジュール５１０は、オブジェクトを表すオブジェクトデータを用いて、仮想空間１１にオブジェクトを配置する。オブジェクトデータは、例えば、メモリモジュール５３０に記憶されている。コントロールモジュール５１０が、オブジェクトデータを生成したり、サーバ６００などからオブジェクトデータを取得するようにしたりしてもよい。オブジェクトは、例えば、ユーザ５の分身であるアバターオブジェクト、キャラクタオブジェクト、コントローラ３００によって操作される仮想手などの操作オブジェクト、ゲームのストーリーの進行に従って配置される森、山その他を含む風景、街並み、動物等を含み得る。

コントロールモジュール５１０は、ネットワーク２を介して接続される他のコンピュータ２００のユーザ５のアバターオブジェクトを仮想空間１１に配置する。ある局面において、コントロールモジュール５１０は、ユーザ５のアバターオブジェクトを仮想空間１１に配置する。ある局面において、コントロールモジュール５１０は、ユーザ５を含む画像に基づいて、ユーザ５を模したアバターオブジェクトを仮想空間１１に配置する。別の局面において、コントロールモジュール５１０は、複数種類のアバターオブジェクト（例えば、動物を模したオブジェクトや、デフォルメされた人のオブジェクト）の中からユーザ５による選択を受け付けたアバターオブジェクトを仮想空間１１に配置する。

コントロールモジュール５１０は、ＨＭＤセンサ４１０の出力に基づいてＨＭＤ１２０の傾きを特定する。別の局面において、コントロールモジュール５１０は、モーションセンサとして機能するセンサ１９０の出力に基づいてＨＭＤ１２０の傾きを特定する。コントロールモジュール５１０は、第１カメラ１５０および第２カメラ１６０が生成するユーザ５の顔の画像から、ユーザ５の顔を構成する器官（例えば、口，目，眉）を検出する。コントロールモジュール５１０は、検出した各器官の動き（形状）を検出する。

コントロールモジュール５１０は、注視センサ１４０からの信号に基づいて、ユーザ５の仮想空間１１における視線を検出する。コントロールモジュール５１０は、検出したユーザ５の視線と仮想空間１１の天球とが交わる視点位置（ＸＹＺ座標系における座標値）を検出する。より具体的には、コントロールモジュール５１０は、ｕｖｗ座標系で規定されるユーザ５の視線と、仮想カメラ１４の位置および傾きとに基づいて、視点位置を検出する。コントロールモジュール５１０は、検出した視点位置をサーバ６００に送信する。別の局面において、コントロールモジュール５１０は、ユーザ５の視線を表す視線情報をサーバ６００に送信するように構成されてもよい。係る場合、サーバ６００が受信した視線情報に基づいて視点位置を算出し得る。

コントロールモジュール５１０は、ＨＭＤセンサ４１０が検出するＨＭＤ１２０の動きをアバターオブジェクトに反映する。例えば、コントロールモジュール５１０は、ＨＭＤ１２０が傾いたことを検知して、アバターオブジェクトを傾けて配置する。コントロールモジュール５１０は、検出した顔器官の動作を、仮想空間１１に配置されるアバターオブジェクトの顔に反映させる。コントロールモジュール５１０は、サーバ６００から他のユーザ５の視線情報を受信し、当該他のユーザ５のアバターオブジェクトの視線に反映させる。ある局面において、コントロールモジュール５１０は、コントローラ３００の動きをアバターオブジェクトや操作オブジェクトに反映する。この場合、コントローラ３００は、コントローラ３００の動きを検知するためのモーションセンサ、加速度センサ、または複数の発光素子（例えば、赤外線ＬＥＤ）などを備える。

コントロールモジュール５１０は、仮想空間１１においてユーザ５の操作を受け付けるための操作オブジェクトを仮想空間１１に配置する。ユーザ５は、操作オブジェクトを操作することにより、例えば、仮想空間１１に配置されるオブジェクトを操作する。ある局面において、操作オブジェクトは、例えば、ユーザ５の手に相当する仮想手である手オブジェクト等を含み得る。ある局面において、コントロールモジュール５１０は、モーションセンサ４２０の出力に基づいて現実空間におけるユーザ５の手の動きに連動するように仮想空間１１において手オブジェクトを動かす。ある局面において、操作オブジェクトは、アバターオブジェクトの手の部分に相当し得る。

コントロールモジュール５１０は、仮想空間１１に配置されるオブジェクトのそれぞれが、他のオブジェクトと衝突した場合に、当該衝突を検出する。コントロールモジュール５１０は、例えば、あるオブジェクトのコリジョンエリアと、別のオブジェクトのコリジョンエリアとが触れたタイミングを検出することができ、当該検出がされたときに、予め定められた処理を行う。コントロールモジュール５１０は、オブジェクトとオブジェクトとが触れている状態から離れたタイミングを検出することができ、当該検出がされたときに、予め定められた処理を行う。コントロールモジュール５１０は、オブジェクトとオブジェクトとが触れている状態であることを検出することができる。例えば、コントロールモジュール５１０は、操作オブジェクトと、他のオブジェクトとが触れたときに、これら操作オブジェクトと他のオブジェクトとが触れたことを検出して、予め定められた処理を行う。

ある局面において、コントロールモジュール５１０は、ＨＭＤ１２０のモニタ１３０における画像表示を制御する。例えば、コントロールモジュール５１０は、仮想空間１１に仮想カメラ１４を配置する。コントロールモジュール５１０は、仮想空間１１における仮想カメラ１４の位置と、仮想カメラ１４の傾き（向き）を制御する。コントロールモジュール５１０は、ＨＭＤ１２０を装着したユーザ５の頭の傾きと、仮想カメラ１４の位置に応じて、視界領域１５を規定する。レンダリングモジュール５２０は、決定された視界領域１５に基づいて、モニタ１３０に表示される視界画像１７を生成する。レンダリングモジュール５２０により生成された視界画像１７は、通信制御モジュール５４０によってＨＭＤ１２０に出力される。

コントロールモジュール５１０は、ＨＭＤ１２０から、ユーザ５のマイク１７０を用いた発話を検出すると、当該発話に対応する音声データの送信対象のコンピュータ２００を特定する。音声データは、コントロールモジュール５１０によって特定されたコンピュータ２００に送信される。コントロールモジュール５１０は、ネットワーク２を介して他のユーザのコンピュータ２００から音声データを受信すると、当該音声データに対応する音声（発話）をスピーカ１８０から出力する。

メモリモジュール５３０は、コンピュータ２００が仮想空間１１をユーザ５に提供するために使用されるデータを保持している。ある局面において、メモリモジュール５３０は、空間情報と、オブジェクト情報と、ユーザ情報とを保持している。

空間情報は、仮想空間１１を提供するために規定された１つ以上のテンプレートを保持している。

オブジェクト情報は、仮想空間１１を構成する複数のパノラマ画像１３、仮想空間１１にオブジェクトを配置するためのオブジェクトデータを含む。パノラマ画像１３は、静止画像および動画像を含み得る。パノラマ画像１３は、非現実空間の画像と現実空間の画像とを含み得る。非現実空間の画像としては、例えば、コンピュータグラフィックスで生成された画像が挙げられる。

ユーザ情報は、ユーザ５を識別するユーザＩＤを保持する。ユーザＩＤは、例えば、ユーザが使用するコンピュータ２００に設定されるＩＰ（Internet Protocol）アドレスまたはＭＡＣ（Media Access Control）アドレスであり得る。別の局面において、ユーザＩＤはユーザによって設定され得る。ユーザ情報は、ＨＭＤシステム１００の制御装置としてコンピュータ２００を機能させるためのプログラム等を含む。

メモリモジュール５３０に格納されているデータおよびプログラムは、ＨＭＤ１２０のユーザ５によって入力される。あるいは、プロセッサ２１０が、当該コンテンツを提供する事業者が運営するコンピュータ（例えば、サーバ６００）からプログラムあるいはデータをダウンロードして、ダウンロードされたプログラムあるいはデータをメモリモジュール５３０に格納する。

通信制御モジュール５４０は、ネットワーク２を介して、サーバ６００その他の情報通信装置と通信し得る。

ある局面において、コントロールモジュール５１０およびレンダリングモジュール５２０は、例えば、ユニティテクノロジーズ社によって提供されるＵｎｉｔｙ（登録商標）を用いて実現され得る。別の局面において、コントロールモジュール５１０およびレンダリングモジュール５２０は、各処理を実現する回路素子の組み合わせとしても実現され得る。

コンピュータ２００における処理は、ハードウェアと、プロセッサ２１０により実行されるソフトウェアとによって実現される。このようなソフトウェアは、ハードディスクその他のメモリモジュール５３０に予め格納されている場合がある。ソフトウェアは、ＣＤ－ＲＯＭその他のコンピュータ読み取り可能な不揮発性のデータ記録媒体に格納されて、プログラム製品として流通している場合もある。あるいは、当該ソフトウェアは、インターネットその他のネットワークに接続されている情報提供事業者によってダウンロード可能なプログラム製品として提供される場合もある。このようなソフトウェアは、光ディスク駆動装置その他のデータ読取装置によってデータ記録媒体から読み取られて、あるいは、通信制御モジュール５４０を介してサーバ６００その他のコンピュータからダウンロードされた後、記憶モジュールに一旦格納される。そのソフトウェアは、プロセッサ２１０によって記憶モジュールから読み出され、実行可能なプログラムの形式でＲＡＭに格納される。プロセッサ２１０は、そのプログラムを実行する。

［ＨＭＤシステムの制御構造］
図１１を参照して、ＨＭＤセット１１０の制御構造について説明する。図１１は、ある実施の形態に従うＨＭＤセット１１０において実行される処理の一部を表すシーケンスチャートである。

図１１に示されるように、ステップＳ１１１０にて、コンピュータ２００のプロセッサ２１０は、コントロールモジュール５１０として、仮想空間データを特定し、仮想空間１１を定義する。

ステップＳ１１２０にて、プロセッサ２１０は、仮想カメラ１４を初期化する。たとえば、プロセッサ２１０は、メモリのワーク領域において、仮想カメラ１４を仮想空間１１において予め規定された中心１２に配置し、仮想カメラ１４の視線をユーザ５が向いている方向に向ける。

ステップＳ１１３０にて、プロセッサ２１０は、レンダリングモジュール５２０として、初期の視界画像を表示するための視界画像データを生成する。生成された視界画像データは、通信制御モジュール５４０によってＨＭＤ１２０に出力される。

ステップＳ１１３２にて、ＨＭＤ１２０のモニタ１３０は、コンピュータ２００から受信した視界画像データに基づいて、視界画像を表示する。ＨＭＤ１２０を装着したユーザ５は、視界画像を視認すると仮想空間１１を認識し得る。

ステップＳ１１３４にて、ＨＭＤセンサ４１０は、ＨＭＤ１２０から発信される複数の赤外線光に基づいて、ＨＭＤ１２０の位置と傾きを検知する。検知結果は、動き検知データとして、コンピュータ２００に出力される。

ステップＳ１１４０にて、プロセッサ２１０は、ＨＭＤ１２０の動き検知データに含まれる位置と傾きとに基づいて、ＨＭＤ１２０を装着したユーザ５の視界方向を特定する。

ステップＳ１１５０にて、プロセッサ２１０は、アプリケーションプログラムを実行し、アプリケーションプログラムに含まれる命令に基づいて、仮想空間１１にオブジェクトを配置する。

ステップＳ１１６０にて、コントローラ３００は、モーションセンサ４２０から出力される信号に基づいて、ユーザ５の操作を検出し、その検出された操作を表す検出データをコンピュータ２００に出力する。別の局面において、ユーザ５によるコントローラ３００の操作は、ユーザ５の周囲に配置されたカメラからの画像に基づいて検出されてもよい。

ステップＳ１１７０にて、プロセッサ２１０は、コントローラ３００から取得した検出データに基づいて、ユーザ５によるコントローラ３００の操作を検出する。

ステップＳ１１８０にて、プロセッサ２１０は、ユーザ５によるコントローラ３００の操作に基づく視界画像データを生成する。生成された視界画像データは、通信制御モジュール５４０によってＨＭＤ１２０に出力される。

ステップＳ１１９０にて、ＨＭＤ１２０は、受信した視界画像データに基づいて視界画像を更新し、更新後の視界画像をモニタ１３０に表示する。

［アバターオブジェクト］
図１２（Ａ）、（Ｂ）を参照して、本実施の形態に従うアバターオブジェクトについて説明する。以下、ＨＭＤセット１１０Ａ，１１０Ｂの各ユーザ５のアバターオブジェクトを説明する図である。以下、ＨＭＤセット１１０Ａのユーザをユーザ５Ａ、ＨＭＤセット１１０Ｂのユーザをユーザ５Ｂ、ＨＭＤセット１１０Ｃのユーザをユーザ５Ｃ、ＨＭＤセット１１０Ｄのユーザをユーザ５Ｄと表す。ＨＭＤセット１１０Ａに関する各構成要素の参照符号にＡが付され、ＨＭＤセット１１０Ｂに関する各構成要素の参照符号にＢが付され、ＨＭＤセット１１０Ｃに関する各構成要素の参照符号にＣが付され、ＨＭＤセット１１０Ｄに関する各構成要素の参照符号にＤが付される。例えば、ＨＭＤ１２０Ａは、ＨＭＤセット１１０Ａに含まれる。

図１２（Ａ）は、ネットワーク２において、各ＨＭＤ１２０がユーザ５に仮想空間１１を提供する状況を表す模式図である。コンピュータ２００Ａ～２００Ｄは、ＨＭＤ１２０Ａ～１２０Ｄを介して、ユーザ５Ａ～５Ｄに、仮想空間１１Ａ～１１Ｄをそれぞれ提供する。図１２（Ａ）に示される例において、仮想空間１１Ａおよび仮想空間１１Ｂは同じデータによって構成されている。換言すれば、コンピュータ２００Ａとコンピュータ２００Ｂとは同じ仮想空間を共有していることになる。仮想空間１１Ａおよび仮想空間１１Ｂには、ユーザ５Ａのアバターオブジェクト６Ａと、ユーザ５Ｂのアバターオブジェクト６Ｂとが存在する。仮想空間１１Ａにおけるアバターオブジェクト６Ａおよび仮想空間１１Ｂにおけるアバターオブジェクト６ＢがそれぞれＨＭＤ１２０を装着しているが、これは説明を分かりやすくするためのものであって、実際にはこれらのオブジェクトはＨＭＤ１２０を装着していない。

ある局面において、プロセッサ２１０Ａは、ユーザ５Ａの視界画像１７Ａを撮影する仮想カメラ１４Ａを、アバターオブジェクト６Ａの目の位置に配置し得る。

図１２（Ｂ）は、図１２（Ａ）におけるユーザ５Ａの視界画像１７Ａを示す図である。視界画像１７Ａは、ＨＭＤ１２０Ａのモニタ１３０Ａに表示される画像である。この視界画像１７Ａは、仮想カメラ１４Ａにより生成された画像である。視界画像１７Ａには、ユーザ５Ｂのアバターオブジェクト６Ｂが表示されている。特に図示はしていないが、ユーザ５Ｂの視界画像にも同様に、ユーザ５Ａのアバターオブジェクト６Ａが表示されている。

図１２（Ｂ）の状態において、ユーザ５Ａは仮想空間１１Ａを介してユーザ５Ｂと対話による通信（コミュニケーション）を図ることができる。より具体的には、マイク１７０Ａにより取得されたユーザ５Ａの音声は、サーバ６００を介してユーザ５ＢのＨＭＤ１２０Ｂに送信され、ＨＭＤ１２０Ｂに設けられたスピーカ１８０Ｂから出力される。ユーザ５Ｂの音声は、サーバ６００を介してユーザ５ＡのＨＭＤ１２０Ａに送信され、ＨＭＤ１２０Ａに設けられたスピーカ１８０Ａから出力される。

ユーザ５Ｂの動作（ＨＭＤ１２０Ｂの動作およびコントローラ３００Ｂの動作）は、プロセッサ２１０Ａにより仮想空間１１Ａに配置されるアバターオブジェクト６Ｂに反映される。これにより、ユーザ５Ａは、ユーザ５Ｂの動作を、アバターオブジェクト６Ｂを通じて認識できる。

図１３は、本実施の形態に従うＨＭＤシステム１００において実行される処理の一部を表すシーケンスチャートである。図１３においては、ＨＭＤセット１１０Ｄを図示していないが、ＨＭＤセット１１０Ｄについても、ＨＭＤセット１１０Ａ、１１０Ｂ、１１０Ｃと同様に動作する。以下の説明でも、ＨＭＤセット１１０Ａに関する各構成要素の参照符号にＡが付され、ＨＭＤセット１１０Ｂに関する各構成要素の参照符号にＢが付され、ＨＭＤセット１１０Ｃに関する各構成要素の参照符号にＣが付され、ＨＭＤセット１１０Ｄに関する各構成要素の参照符号にＤが付されるものとする。

ステップＳ１３１０Ａにおいて、ＨＭＤセット１１０Ａにおけるプロセッサ２１０Ａは、仮想空間１１Ａにおけるアバターオブジェクト６Ａの動作を決定するためのアバター情報を取得する。このアバター情報は、例えば、動き情報、フェイストラッキングデータ、および音声データ等のアバターに関する情報を含む。動き情報は、ＨＭＤ１２０Ａの位置および傾きの時間的変化を示す情報や、モーションセンサ４２０Ａ等により検出されたユーザ５Ａの手の動きを示す情報などを含む。フェイストラッキングデータは、ユーザ５Ａの顔の各パーツの位置および大きさを特定するデータが挙げられる。フェイストラッキングデータは、ユーザ５Ａの顔を構成する各器官の動きを示すデータや視線データが挙げられる。音声データは、ＨＭＤ１２０Ａのマイク１７０Ａによって取得されたユーザ５Ａの音声を示すデータが挙げられる。アバター情報には、アバターオブジェクト６Ａ、あるいはアバターオブジェクト６Ａに関連付けられるユーザ５Ａを特定する情報や、アバターオブジェクト６Ａが存在する仮想空間１１Ａを特定する情報等が含まれてもよい。アバターオブジェクト６Ａやユーザ５Ａを特定する情報としては、ユーザＩＤが挙げられる。アバターオブジェクト６Ａが存在する仮想空間１１Ａを特定する情報としては、ルームＩＤが挙げられる。プロセッサ２１０Ａは、上述のように取得されたアバター情報を、ネットワーク２を介してサーバ６００に送信する。

ステップＳ１３１０Ｂにおいて、ＨＭＤセット１１０Ｂにおけるプロセッサ２１０Ｂは、ステップＳ１３１０Ａにおける処理と同様に、仮想空間１１Ｂにおけるアバターオブジェクト６Ｂの動作を決定するためのアバター情報を取得し、サーバ６００に送信する。同様に、ステップＳ１３１０Ｃにおいて、ＨＭＤセット１１０Ｃにおけるプロセッサ２１０Ｃは、仮想空間１１Ｃにおけるアバターオブジェクト６Ｃの動作を決定するためのアバター情報を取得し、サーバ６００に送信する。

ステップＳ１３２０において、サーバ６００は、ＨＭＤセット１１０Ａ、ＨＭＤセット１１０Ｂ、およびＨＭＤセット１１０Ｃのそれぞれから受信したプレイヤ情報を一旦記憶する。サーバ６００は、各アバター情報に含まれるユーザＩＤおよびルームＩＤ等に基づいて、共通の仮想空間１１に関連付けられた全ユーザ（この例では、ユーザ５Ａ～５Ｃ）のアバター情報を統合する。そして、サーバ６００は、予め定められたタイミングで、統合したアバター情報を当該仮想空間１１に関連付けられた全ユーザに送信する。これにより、同期処理が実行される。このような同期処理により、ＨＭＤセット１１０Ａ、ＨＭＤセット１１０Ｂ、およびＨＭＤ１１０Ｃは、互いのアバター情報をほぼ同じタイミングで共有することができる。

続いて、サーバ６００から各ＨＭＤセット１１０Ａ～１１０Ｃに送信されたアバター情報に基づいて、各ＨＭＤセット１１０Ａ～１１０Ｃは、ステップＳ１３３０Ａ～Ｓ１３３０Ｃの処理を実行する。ステップＳ１３３０Ａの処理は、図１１におけるステップＳ１１８０の処理に相当する。

ステップＳ１３３０Ａにおいて、ＨＭＤセット１１０Ａにおけるプロセッサ２１０Ａは、仮想空間１１Ａにおける他のユーザ５Ｂ，５Ｃのアバターオブジェクト６Ｂ、アバターオブジェクト６Ｃの情報を更新する。具体的には、プロセッサ２１０Ａは、ＨＭＤセット１１０Ｂから送信されたアバター情報に含まれる動き情報に基づいて、仮想空間１１におけるアバターオブジェクト６Ｂの位置および向き等を更新する。例えば、プロセッサ２１０Ａは、メモリモジュール５３０に格納されたオブジェクト情報に含まれるアバターオブジェクト６Ｂの情報（位置および向き等）を更新する。同様に、プロセッサ２１０Ａは、ＨＭＤセット１１０Ｃから送信されたアバター情報に含まれる動き情報に基づいて、仮想空間１１におけるアバターオブジェクト６Ｃの情報（位置および向き等）を更新する。

ステップＳ１３３０Ｂにおいて、ＨＭＤセット１１０Ｂにおけるプロセッサ２１０Ｂは、ステップＳ１３３０Ａにおける処理と同様に、仮想空間１１Ｂにおけるユーザ５Ａ，５Ｃのアバターオブジェクト６Ａ，６Ｃの情報を更新する。同様に、ステップＳ１３３０Ｃにおいて、ＨＭＤセット１１０Ｃにおけるプロセッサ２１０Ｃは、仮想空間１１Ｃにおけるユーザ５Ａ，５Ｂのアバターオブジェクト６Ａ，６Ｂの情報を更新する。

［モジュールの詳細構成］
図１４を参照して、コンピュータ２００のモジュール構成の詳細について説明する。図１４は、ある実施の形態に従うコンピュータ２００のモジュールの詳細構成を表すブロック図である。

図１４に示されるように、コントロールモジュール５１０は、仮想カメラ制御モジュール１４２１と、視界領域決定モジュール１４２２と、基準視線特定モジュール１４２３と、顔器官検出モジュール１４２４と、動き検出モジュール１４２５と、仮想空間定義モジュール１４２６と、仮想オブジェクト生成モジュール１４２７と、操作オブジェクト制御モジュール１４２８と、アバター制御モジュール１４２９と、を備える。レンダリングモジュール５２０は、視界画像生成モジュール１４３８を備える。メモリモジュール５３０は、空間情報１４３１と、オブジェクト情報１４３２と、ユーザ情報１４３３と、顔情報１４３４と、を保持している。

仮想カメラ制御モジュール１４２１は、仮想空間１１に仮想カメラ１４を配置する。仮想カメラ制御モジュール１４２１は、仮想空間１１における仮想カメラ１４の配置位置と、仮想カメラ１４の向き（傾き）を制御する。視界領域決定モジュール１４２２は、ＨＭＤ１２０を装着したユーザの頭の向きと、仮想カメラ１４の配置位置に応じて、視界領域１５を規定する。視界画像生成モジュール１４３８は、決定された視界領域１５に基づいて、モニタ１３０に表示される視界画像１７を生成する。

基準視線特定モジュール１４２３は、注視センサ１４０からの信号に基づいて、ユーザ５の視線を特定する。顔器官検出モジュール１４２４は、第１カメラ１５０および第２カメラ１６０が生成するユーザ５の顔の画像から、ユーザ５の顔を構成する器官（例えば、口、目、眉）を検出する。動き検出モジュール１４２５は、顔器官検出モジュール１４２４が検出した各器官の動き（形状）を検出する。図１５～図１８において、顔器官検出モジュール１４２４および動き検出モジュール１４２５の制御内容は後述される。

仮想空間定義モジュール１４２６は、仮想空間１１を表す仮想空間データを生成することにより、ＨＭＤシステム１００における仮想空間１１を規定する。

仮想オブジェクト生成モジュール１４２７は、仮想空間１１に配置されるオブジェクトを生成する。オブジェクトは、例えば、ゲームのストーリーの進行に従って配置される森、山その他を含む風景、動物等を含み得る。

操作オブジェクト制御モジュール１４２８は、仮想空間１１においてユーザの操作を受け付けるための操作オブジェクトを仮想空間１１に配置する。ユーザは、操作オブジェクトを操作することにより、例えば、仮想空間１１に配置されるオブジェクトを操作する。ある局面において、操作オブジェクトは、例えば、ＨＭＤ１２０を装着したユーザの手に相当する手オブジェクト等を含み得る。ある局面において、操作オブジェクトは、後述するアバターオブジェクトの手の部分に相当し得る。

アバター制御モジュール１４２９は、ネットワーク２を介して接続される他のコンピュータ２００のユーザのアバターオブジェクトを仮想空間１１に配置するためのデータを生成する。ある局面において、アバター制御モジュール１４２９は、ユーザ５のアバターオブジェクトを仮想空間１１に配置するためのデータを生成する。ある局面において、アバター制御モジュール１４２９は、ユーザ５を含む画像に基づいて、ユーザ５を模したアバターオブジェクトを生成する。別の局面において、アバター制御モジュール１４２９は、複数種類のアバターオブジェクト（例えば、動物を模したオブジェクトや、デフォルメされた人のオブジェクト）の中からユーザ５による選択を受け付けたアバターオブジェクトを仮想空間１１に配置するためのデータを生成する。

アバター制御モジュール１４２９は、ＨＭＤセンサ４１０が検出するＨＭＤ１２０の動きをアバターオブジェクトに反映する。例えば、アバター制御モジュール１４２９は、ＨＭＤ１２０が傾いたことを検知して、アバターオブジェクトを傾けて配置するためのデータを生成する。ある局面において、アバター制御モジュール１４２９は、コントローラ３００の動きをアバターオブジェクトに反映する。この場合、コントローラ３００は、コントローラ３００の動きを検知するためのモーションセンサ、加速度センサ、または複数の発光素子（例えば、赤外線ＬＥＤ）などを備える。アバター制御モジュール１４２９は、動き検出モジュール１４２５が検出した顔器官の動作を、仮想空間１１に配置されるアバターオブジェクトの顔に反映させる。つまり、アバター制御モジュール１４２９は、ユーザ５Ａの顔の動作をアバターオブジェクトに反映する。

コントロールモジュール５１０は、仮想空間１１に配置されるオブジェクトのそれぞれが、他のオブジェクトと衝突した場合に、当該衝突を検出する。コントロールモジュール５１０は、例えば、あるオブジェクトと、別のオブジェクトとが触れたタイミングを検出することができ、当該検出がされたときに、予め定められた処理を行う。コントロールモジュール５１０は、オブジェクトとオブジェクトとが触れている状態から離れたタイミングを検出することができ、当該検出がされたときに、予め定められた処理を行う。コントロールモジュール５１０は、オブジェクトとオブジェクトとが触れている状態であることを検出することができる。具体的には、操作オブジェクト制御モジュール１４２８は、操作オブジェクトと、他のオブジェクトとが触れたときに、これら操作オブジェクトと他のオブジェクトとが触れたことを検出して、予め定められた処理を行う。

メモリモジュール５３０は、コンピュータ２００が仮想空間１１をユーザ５に提供するために使用されるデータを保持している。ある局面において、メモリモジュール５３０は、空間情報１４３１と、オブジェクト情報１４３２と、ユーザ情報１４３３と、顔情報１４３４とを保持している。

空間情報１４３１は、仮想空間１１を提供するために規定された１つ以上のテンプレートを保持している。

オブジェクト情報１４３２は、仮想空間１１において再生されるコンテンツ、当該コンテンツで使用されるオブジェクト、およびオブジェクトを仮想空間１１に配置するための情報（たとえば、位置情報）を保持している。当該コンテンツは、例えば、ゲーム、現実社会と同様の風景を表したコンテンツ等を含み得る。

ユーザ情報１４３３は、ＨＭＤシステム１００の制御装置としてコンピュータ２００を機能させるためのプログラム、オブジェクト情報１４３２に保持される各コンテンツを使用するアプリケーションプログラム等を保持している。

顔情報１４３４は、顔器官検出モジュール１４２４が、ユーザ５の顔器官を検出するために予め記憶されたテンプレートを保持している。ある局面において、顔情報１４３４は、口テンプレート１４３５と、目テンプレート１４３６と、眉テンプレート１４３７とを保持する。各テンプレートは、顔を構成する器官に対応する画像であり得る。例えば、口テンプレート１４３５は、口の画像であり得る。各テンプレートは複数の画像を含んでもよい。

［フェイストラッキング］
以下、図１５～図１８を参照して、ユーザの表情（顔の動き）を検出するための具体例について説明する。図１５～図１８では、一例として、ユーザ５の口の動きを検出する具体例について説明する。なお、図１５～図１８で説明される検出方法は、ユーザ５の口の動きに限られず、ユーザ５の顔を構成する他の器官（例えば、目、眉、鼻、頬）の動きの検出にも適用され得る。

図１５は、ユーザの顔画像１５２１から口を検出する制御について説明する図である。第１カメラ１５０により生成された顔画像１５２１は、ユーザ５の鼻と口を含む。

顔器官検出モジュール１４２４は、顔情報１４３４に格納される口テンプレート１４３５を利用したパターンマッチングにより、顔画像１５２１から口領域１５３１を特定する。ある局面において、顔器官検出モジュール１４２４は、顔画像において、矩形上の比較領域を設定し、この比較領域の大きさ、位置および角度をそれぞれ変えながら、比較領域の画像と、口テンプレート１４３５の画像との類似度を算出する。顔器官検出モジュール１４２４は、予め定められたしきい値よりも大きい類似度が算出された比較領域を、口領域１５３１として特定し得る。

顔器官検出モジュール１４２４はさらに、算出した類似度がしきい値よりも大きい比較領域の位置と、他の顔器官（例えば、目、鼻）の位置との相対関係に基づいて、当該比較領域が口領域に相当するか否かを判断し得る。

動き検出モジュール１４２５は、顔器官検出モジュール１４２４が検出した口領域１５３１から、より詳細な口の形状を検出する。

図１６は、動き検出モジュール１４２５が口の形状を検出する処理を説明する図（その１）である。図１６を参照して、動き検出モジュール１４２５は、口領域１５３１に含まれる口の形状（唇の輪郭）を検出するための輪郭検出線１６４１を設定する。輪郭検出線１６４１は、顔の高さ方向に直交する方向に、所定間隔で複数本設定される。

動き検出モジュール１４２５は、複数本の輪郭検出線１６４１の各々に沿った口領域１５３１の輝度値の変化を検出し、輝度値の変化が急激な位置を輪郭点として特定し得る。より具体的には、動き検出モジュール１４２５は、隣接画素との輝度差（すなわち、輝度値変化）が予め定められたしきい値以上である画素を、輪郭点として特定し得る。画素の輝度値は、例えば、画素のＲＢＧ値を所定の重み付けで積算することにより得られる。

動き検出モジュール１４２５は、口領域１５３１に対応する画像から２種類の輪郭点を特定する。動き検出モジュール１４２５は、口（唇）の外側の輪郭に対応する輪郭点１６４２と、口（唇）の内側の輪郭に対応する輪郭点１６４３とを特定する。ある局面において、動き検出モジュール１４２５は、１つの輪郭検出線１６４１上に３つ以上の輪郭点が検出された場合には、両端の輪郭点を外側の輪郭点１６４２として特定し得る。この場合、動き検出モジュール１４２５は、外側の輪郭点１６４２以外の輪郭点を、内側の輪郭点１６４３として特定し得る。また、動き検出モジュール１４２５は、１つの輪郭検出線１６４１上に２つ以下の輪郭点が検出された場合には、検出された輪郭点を外側の輪郭点１６４２として特定し得る。

図１７は、動き検出モジュール１４２５が口の形状を検出する処理を説明するための図（その２）である。図１７では、外側の輪郭点１６４２は白丸、内側の輪郭点１６４３はハッチングされた丸としてそれぞれ示されている。

動き検出モジュール１４２５は、内側の輪郭点１６４３間を補間することにより、口形状１７２１を特定する。ある局面において、動き検出モジュール１４２５は、スプライン補間などの非線形の補間方法を用いて、口形状１７２１を特定し得る。なお、他の局面において、動き検出モジュール１４２５は、外側の輪郭点１６４２間を補間することにより口形状１７２１を特定してもよい。さらに他の局面において、動き検出モジュール１４２５は、想定される口形状（人の上唇と下唇とによって形成され得る所定の形状）から、大きく逸脱する輪郭点を除外し、残った輪郭点によって口形状１７２１を特定してもよい。このようにして、動き検出モジュール１４２５は、ユーザの口の動作（形状）を特定し得る。なお、口形状１７２１の検出方法は上記に限られず、動き検出モジュール１４２５は、他の手法により口形状１７２１を検出してもよい。また、動き検出モジュール１４２５は、同様にして、ユーザの目および眉の動作を検出し得る。なお、動き検出モジュール１４２５は、頬、鼻などの器官の形状を検出可能に構成されてもよい。

図１８は、フェイストラッキングデータの構造の一例を表す。動き検出モジュール１４２５は、ユーザ５の表情を表すフェイストラッキングデータを生成する。フェイストラッキングデータは、検出対象の各器官の形状を構成する特徴点のｕｖｗ視野座標系における位置座標を表す。例えば、図１８に示されるポイントｍ１、ｍ２・・は、口形状１７２１を構成する外側の輪郭点１６４２に対応する。ある局面において、フェイストラッキングデータは、第１カメラ１５０の位置を基準（原点）としたｕｖｗ視野座標系における座標値である。他の局面において、フェイストラッキングデータは、各器官に予め定められた特徴点を基準（原点）とした座標系における座標値である。一例として、ポイントｍ１、ｍ２・・は、外側の輪郭点１６４２のうち口角に対応するいずれか一方の特徴点を原点とした座標系における座標値である。

コンピュータ２００は、生成されたフェイストラッキングデータをサーバ６００に送信する。サーバ６００は、コンピュータ２００と通信する他のコンピュータ２００にこのデータを転送する。他のコンピュータ２００は、受信したフェイストラッキングデータを、受信元のコンピュータ２００のユーザに対応するアバターオブジェクトに反映する。

図１２（Ａ）に示される例において、コンピュータ２００Ａは、コンピュータ２００Ｂからユーザ５Ｂの表情を表すフェイストラッキングデータを受信する。コンピュータ２００Ａは、受信したデータをアバターオブジェクト６Ｂに反映する。一例として、アバターオブジェクト６Ｂを構成するポリゴンの頂点は、フェイストラッキングデータの特徴点に対応する頂点を含む。コンピュータ２００Ａは、対応する頂点の位置をフェイストラッキングデータに基づいて移動する。これにより、ユーザ５Ｂの表情がアバターオブジェクト６Ｂに反映される。その結果、ユーザ５Ａは、アバターオブジェクト６Ｂを介してユーザ５Ｂの表情を認識できる。

なお、アバターの顔の表情は、ユーザの顔の表情だけでなくユーザの身体の動きに応じて制御されてもよい。例えば手足の動きが閾値を超えて大きい場合は、アバターの顔が喜ぶ笑顔の表情に制御され、頭部が手前に倒れた場合は、アバターの顔が眉尻が下がった悲しい表情に制御される。

［顔のキャリブレーション］
ある実施形態において、コンピュータ２００は、アバターの顔のキャリブレーションを実行することができる。キャリブレーションは、アバターの顔の表情を標準状態に制御する処理である。顔の表情の標準状態は、例えば喜怒哀楽がない無表情であるが、笑顔等の特定の表情を標準状態としてもよい。

キャリブレーションの実行時、コンピュータ２００のプロセッサ２１０は、ＨＭＤ１２０の第１カメラ１５０及び第２カメラ１６０によりユーザ５の顔を撮影する。撮影時、プロセッサ２１０は、メニュー表示、音声案内等により顔の表情を標準状態とすることをユーザ５に促すことができる。プロセッサ２１０は、撮影画像からユーザ５の顔の表情を検出し、標準状態のフェイストラッキングデータを生成することができる。

プロセッサ２１０は、現在のアバターのフェイストラッキングデータを、生成した標準状態のフェイストラッキングデータに更新する。プロセッサ２１０は、更新したフェイストラッキングデータに基づいてアバターの顔のポリゴンの頂点の位置を移動することで、アバターの顔の表情を標準状態に制御することができる。

［キャリブレーション制御］
ある実施形態において、コンピュータ２００は、アバターの顔のキャリブレーションを、ユーザの指示操作に応じて実行することができる。また、ある実施形態において、コンピュータ２００は、ユーザの指示操作がなくとも、キャリブレーションの実行タイミングを検出した場合に、キャリブレーションを自動的に実行することができる。

図１９は、自動的なキャリブレーションの実行のために、コンピュータ２００のプロセッサ２１０により実行される処理を示すフローチャートである。一例として、図１２（Ａ）に示したように、他のコンピュータ２００Ｂと通信するコンピュータ２００Ａが実行する処理を説明する。

図２０は、ユーザ５Ａのコンピュータ２００Ａが定義する仮想空間１１Ａを示す。上述のように、仮想空間１１Ａは、ユーザ５Ｂのコンピュータ２００Ｂが定義する仮想空間１１Ｂとデータが同じであるため、各コンピュータ２００Ａおよび２００Ｂによって共有されている。コンピュータ２００Ａは、仮想空間１１Ａにユーザ５Ａに関連付けられたアバター６Ａとユーザ５Ｂに関連付けられたアバター６Ｂとを配置する。

コンピュータ２００Ａは、ユーザ５Ａに顔を標準状態とすることを促して、ユーザ５Ａの顔の表情を検出し、標準状態のフェイストラッキングデータを生成する。コンピュータ２００Ａは、標準状態のフェイストラッキングデータに基づいてアバター６Ａの顔の表情を制御する。これにより、アバター６Ａの顔に標準状態の表情が反映される。他のコンピュータ２００Ｂからユーザ５Ｂの標準状態のフェイストラッキングデータがアバター情報として送信されるので、コンピュータ２００Ａは、アバター６Ｂの顔にもユーザ５Ｂの標準状態の表情を反映させる。

その後、コンピュータ２００Ａは、所定のタイミングでフェイストラッキングデータを更新し、アバター６Ａ及び６Ｂに各ユーザ５Ａ及び５Ｂの表情を反映させる。ユーザ５Ａは、仮想空間１１Ａを介した通信により、ユーザ５Ｂの表情を認識しながら対話することが可能である。

アバター６Ａの顔には、撮影時のＨＭＤ１２０Ａの位置ずれやユーザ５Ａが触れたことによる顔の変形等も反映され得る。そのため、フェイストラッキングデータの更新を続けると、アバター６Ａの顔の状態が標準状態から大きく変化して顔の崩れが生じ、キャリブレーションが必要になることがある。コンピュータ２００Ａは、図１９に示すステップＳ１９５１において、プロセッサ２１０が予め定められたキャリブレーションの実行条件が満たされたか否かを判断する。

キャリブレーションの実行条件の１つは、ユーザ６のアバター６Ｂからの視界に対応する視界画像がアバター６Ａの顔を含む視界画像であったが、アバター６Ａの顔を含まない画像に切り替わることである。アバター６Ｂからの視界とは、ユーザ５Ｂに関連付けられた仮想カメラ１４（仮想視点）からの視界をいう。このキャリブレーションの実行タイミングによれば、通信相手のユーザＢによってアバター６Ａの崩れた顔が認識されない間にキャリブレーションを実行することができる。また、アバター６Ａの顔が標準状態から大きく変化する前にキャリブレーションが実行されることもあり、顔の崩れを事前に防ぐことも可能である。

ある局面において、プロセッサ２１０は、視界画像の表示モードが視界画像の表示モードとは異なる他の表示モードに切り替えられた場合に、アバター６Ａの顔を含まない画像に切り替わったと判断する。他の表示モードとしては、例えば仮想空間を切り替える間にＨＭＤ１２０Ａ及び１２０Ｂに提供される暗転用の画像、操作方法等のチュートリアル画像、３６０度動画等の表示モードが挙げられる。仮想空間が切り替わる例としては、仮想空間１１Ａ及び１１Ｂのデータが切り替わり、新たな仮想空間が定義される場合、具体的には対話用の仮想空間から戦闘ゲーム用の仮想空間に切り替わる場合等が挙げられる。３６０度動画は、３６０度カメラにより撮像された動画である。３６０動画によって全天球の空間を仮想空間として定義できる。プロセッサ２１０は、例えばサーバ６００から新しい仮想空間データが送信され、更新が指示された場合に、ＨＭＤ１２０Ｂにおける仮想空間の切り替わりを検出することができる。

また、ある局面において、プロセッサ２１０は、アバター６Ｂとアバター６Ａの顔との間にオブジェクトが配置された場合に、アバター６Ａの顔を含まない画像に切り替わったと判断する。視界画像にアバター６Ａが含まれていても、アバター６Ｂとアバター６Ａの顔の間にオブジェクトが配置されると、オブジェクトによって顔が覆われるため、視界画像にはアバター６Ａの顔が含まれない。プロセッサ２１０は、例えばアバター６Ｂの視線上にオブジェクトとアバター６Ａの顔とが並ぶ位置関係を検出した場合に、アバター６Ｂの顔が含まれない画像に切り替わったと判断できる。

オブジェクトは、例えばメニュー等の操作用のオブジェクト、木や壁等のオブジェクト等が挙げられる。メニューは、通知、機能説明等の表示領域を有するユーザーインターフェイス（ＵＩ：User Interface）であり、必要に応じてユーザの指示を受け付ける操作領域も有することができる。メニューの表示形態としては、例えばアイコン、ポップアップウィンドウ、ウィジェット等が挙げられる。メニューは、仮想空間１１Ａ及び１１Ｂに配置されるオブジェクトであってもよいし、視界画像中にレンダリングされる２次元画像であってもよい。

図２１は、メニューを含む視界画像の一例を示している。
図２０に示すように、アバター６Ｂからの視線２０１６Ｂ上にアバター６Ａが位置する場合、ＨＭＤ１２０Ｂに表示される視界画像２１１７にはアバター６Ａが含まれる。しかし、仮想視点とアバター６Ａの顔と間にメニューのオブジェクトが配置された場合、視界画像２１１７には、アバター６Ａの顔の正面に位置するメニュー２１２１が含まれる。メニュー２１２１は、シーンの切り替えを問う表示領域と切り替えするか否かの選択を受け付ける操作領域を有するＵＩである。メニュー２１２１によってアバター６Ａの顔が覆われ、ＨＭＤ１２０Ｂに提供される視界画像２１１７にはアバター６Ａの顔が含まれない。

キャリブレーションの実行条件の１つは、標準状態からのアバター６Ａの顔の表情の変化量が閾値を超えることである。この実行条件によれば、実際に顔が大きく変化したタイミングでキャリブレーションを実行することができる。

プロセッサ２１０は、ユーザ５Ｂに関連付けられたアバター６Ｂの動き又は音声の特定のパターンが検出された場合に、アバター６Ａの顔の表情の変化量が閾値を超えたと判断することができる。これにより、顔の変化に対する通信相手の反応に応じてすぐにキャリブレーションを実行することができる。通信相手から顔の変化を指摘されたユーザ５Ａが逐一キャリブレーションのための操作を省くことができる。

例えば、プロセッサ２１０は、アバター６Ａからの視界に対応する視界画像から、アバター６Ｂが自身の顔を指さす動き、怪訝な顔の表情、笑う表情等の特定の画像パターンを検出した場合に、アバター６Ａの顔の表情の変化量が閾値を超えたと判断できる。アバター６Ａからの視界とは、ユーザ５Ａに関連付けられた仮想カメラ１４（仮想視点）からの視界をいう。プロセッサ２１０は、サーバ６００を介してコンピュータ２００Ｂから送信されるアバター情報からアバター６Ｂの動き情報を抽出し、抽出した動き情報からアバター６Ａの顔の変化を指摘する特定の動きのパターンを検出してもよい。また、プロセッサ２１０は、アバター６Ｂのアバター情報に含まれるユーザ５Ｂの音声データを解析し、「顔」、「おかしい」、「変」等の特定の音声パターンを認識することで、アバター６Ａの顔の表情の変化量が閾値を超えたと判断できる。

画像パターン及び音声パターンの検出方法としては特に限定されず、公知の方法を使用できる。画像パターンの検出方法としては、例えば検出対象の画像パターンをモデルパターンとして準備しておき、視界画像中にモデルパターンの画像の特徴量と類似する画像パターンを検索する方法等が挙げられる。また、音声パターンの検出方法としては、音声データを形態素解析して、音素のモデルと照合することで音素を特定し、目的の音声パターンを検索する方法等が挙げられる。

アバター６Ｂの視界にアバター６Ａが含まれない場合は、ユーザ５Ｂがアバター６Ａの顔の表情を視認できない。よって、アバター６Ｂの視線上にアバター６Ａが位置する場合に限定して、プロセッサ２１０は、上述したアバター６Ａの顔の表情の変化量が閾値を超えているか否かの判断を行うようにしてもよい。

図２２は、アバター６Ｂを含む視界画像の一例を示している。
図２０に示すように、アバター６Ａの視線２０１６Ａ上にアバター６Ｂが位置する場合、図２２に示すように、ＨＭＤ１２０Ａに表示される視界画像２２１７にはアバター６Ｂが含まれる。
図２２に示すように、プロセッサ２１０は、視界画像２２１７中の自身の顔を指さすアバター６Ｂの画像パターンを検出すると、アバター６Ａの顔の表情の変化量が閾値を超えたと判断する。または、プロセッサ２１０は、アバター６Ｂのアバター情報から「顔」及び「変」の音声パターンに一致する、ユーザ５Ｂの「顔が変だよ」の音声２２２１を検出すると、アバター６Ａの顔の表情の変化量が閾値を超えたと判断する。

なお、プロセッサ２１０は、アバター６Ｂからの視界に対応する視界画像を画像解析することにより、当該視界画像中に含まれるアバター６Ａの顔の表情の変化量を検出してもよい。例えば、プロセッサ２１０は、フェイストラッキングデータを生成する場合と同様にしてアバター６Ａの顔の各部位を検出し、その位置、形状等の変化量が閾値を超えるか否かを判断する。アバター６Ｂの視界画像は、ユーザ５Ｂのコンピュータ２００Ｂから取得できる。

キャリブレーションの実行条件の１つは、標準状態にあるユーザ５Ａの顔の表情が検出されたことである。プロセッサ２１０は、更新のために生成したフェイストラッキングデータを標準状態のフェイストラッキングデータと比較し、類似度が一定値以上の場合に、ユーザ５Ａの顔の表情が標準状態にあると判断することができる。この実行条件によれば、顔が大きく変化する前にキャリブレーションが実行されることもあり、顔の崩れの予防も可能である。また、ユーザ５Ａが意図的に顔の表情を標準状態とすることでキャリブレーションが実行されるため、実行の指示が容易になる。

上述したキャリブレーションの実行条件が満たされた場合（Ｓ１９５１：ＹＥＳ）、プロセッサ２１０は、キャリブレーションの実行を決定する。プロセッサ２１０は、上述した複数のキャリブレーションの実行条件のうちの特定の１つが満たされたか否かを判断するようにしてもよい。また、プロセッサ２１０は、複数の実行条件を監視していずれか１つでも満たされた場合に、キャリブレーションの実行を決定するようにしてもよい。ステップＳ１９５１において、キャリブレーションの実行条件が満たされない場合は（Ｓ１９５１：ＮＯ）、本処理を終了する。

キャリブレーションの実行が決定されると、ステップＳ１９５２において、プロセッサ２１０は、キャリブレーションの実行中、キャリブレーションの実行を通知する処理を行う。例えば、プロセッサ２１０は、通知用のメニューをアバター６Ａの顔の正面に配置する。メニューは、実行を通知する表示領域だけでなく、キャリブレーションのために標準状態の表情を促す表示領域を有してもよい。次いで、ステップＳ１９５３において、プロセッサ２１０は、視界画像を生成して更新する。

通知の処理により、ユーザ５ＡのＨＭＤ１２０Ａには、メニューを含む視界画像が表示される。プロセッサ２１０は、メニューのサイズを、キャリブレーション対象のアバター６Ａの顔を覆うサイズに制御してもよい。これにより、アバター６Ｂからの視界に対応する視界画像を、アバター６Ａの顔がメニューにより覆われた視界画像に切り替えることができる。

ステップＳ１９５４において、プロセッサ２１０は、アバター６Ａの顔のキャリブレーションを実行する。具体的には、プロセッサ２１０は、キャリブレーション中のアバター６Ａの顔を、キャリブレーション直前の顔に固定する。プロセッサ２１０は、標準状態にあるユーザ５Ａの顔の表情を検出して、標準状態のフェイストラッキングデータを生成し、アバター６Ａの顔に反映する。なお、標準状態の顔のフェイストラッキングデータを生成し直すのではなく、最初に生成した標準状態のフェイストラッキングデータに基づいて、アバター６Ａの顔の表情を制御してもよい。

ステップＳ１９５５において、プロセッサ２１０は、仮想空間１１Ａにおけるアバター６Ａのアバター情報を、サーバ６００を介してコンピュータ２００Ｂへ送信する。具体的には、サーバ６００が、受信したアバター６Ａのアバター情報を、コンピュータ２００Ｂから送信されたアバター６Ｂのアバター情報と統合して、各コンピュータ２００Ａ及び２００Ｂに送信する。プロセッサ２１０は、統合されたアバター６Ａ及び６Ｂのアバター情報に基づいて、仮想空間１１Ａ上のアバター６Ａ及び６Ｂの位置、向き、顔の表情等を更新する。

ステップＳ１９５６において、プロセッサ２１０は、視界画像を生成して更新する。ユーザ５Ｂのコンピュータ２００Ｂにおいても同様に、アバターと視界画像の更新が行われる。更新により、キャリブレーションによって顔が標準状態に制御されたアバター６Ａを含む視界画像がコンピュータ２００Ｂに表示される。

図２３は、キャリブレーション前後のアバター６Ａを含む視界画像の一例を示す。
図２３に示す視界画像２３１７Ａ及び２３１７Ｂは、図２０に示す視線２０１６Ｂが検出され、ユーザ５ＢのＨＭＤ１２０Ｂに表示された視界画像である。視界画像２３１７Ａは、キャリブレーション前の視界画像であり、図２３に示すように、目、口等の位置が下側にずれて顔が標準状態から大きく変化したアバター６Ａが含まれる。キャリブレーション後、視界画像２３１７Ａは視界画像２３１７Ｂに更新される。視界画像２３１７Ｂ中のアバター６Ａの顔が標準状態の無表情であり、顔の崩れが修正されている。

以上のように、上記キャリブレーション制御によれば、コンピュータ２００Ａのプロセッサ２１０がキャリブレーションの実行条件が満たされた場合に、キャリブレーションを実行する。したがって、ユーザ５Ａのキーボード等の入力装置の操作がなくとも、アバター６Ａの顔のキャリブレーションを適切なタイミングで行うことができる。操作が不要であるため、ＨＭＤ１２０Ａにより視界が遮られて現実空間の入力装置が操作しづらい場合には特に利便性がよい。また、顔の崩れが自動的に修正されるため、ユーザ５Ａはアバター６Ａの顔の崩れやその修正のための操作を気にせずに、対話に没入することができる。

なお、頻繁なキャリブレーションを防ぐため、キャリブレーションの実行条件が満たされた場合でも、前回のキャリブレーションから一定時間が経過していない場合は、プロセッサ２１０は、キャリブレーションを行わないようにしてもよい。

以上、本開示の実施形態について説明したが、本発明の技術的範囲は、本実施形態の説明によって限定的に解釈されるべきではない。本実施形態は一例であって、特許請求の範囲に記載された発明の範囲内において、様々な実施形態の変更が可能であることが当業者によって理解されるところである。本発明の技術的範囲は、特許請求の範囲に記載された発明の範囲およびその均等の範囲に基づいて定められるべきである。

上記実施形態においては、ＨＭＤによってユーザが没入する仮想空間（ＶＲ空間）を例示して説明したが、ＨＭＤとして、透過型のＨＭＤを採用してもよい。この場合、透過型のＨＭＤを介してユーザが視認する現実空間に仮想空間を構成する画像の一部を合成した視界画像を出力することにより、拡張現実（ＡＲ：Augmented Reality）空間または複合現実（ＭＲ：Mixed Reality）空間における仮想体験をユーザに提供してもよい。この場合、操作オブジェクトに代えて、ユーザの手の動きに基づいて、仮想空間内における対象オブジェクトへの作用を生じさせてもよい。具体的には、プロセッサは、現実空間におけるユーザの手の位置の座標情報を特定するとともに、仮想空間内における対象オブジェクトの位置を現実空間における座標情報との関係で定義してもよい。これにより、プロセッサは、現実空間におけるユーザの手と仮想空間における対象オブジェクトとの位置関係を把握し、ユーザの手と対象オブジェクトとの間で上述したコリジョン制御等に対応する処理を実行可能となる。その結果、ユーザの手の動きに基づいて対象オブジェクトに作用を与えることが可能となる。

（構成）
以上に開示された技術的特徴は、以下のように要約され得る。

（構成１）
仮想空間を定義するステップと、前記仮想空間上に、第１ユーザに関連付けられた第１アバターを配置するステップと、前記第１ユーザの顔の表情を検出するステップと、前記第１ユーザの顔の表情に応じて、前記第１アバターの顔の表情を制御するステップと、前記第１アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップ（ステップＳ１９５１、Ｓ１９５４）と、をコンピュータに実行させるためのプログラム。

（構成２）
（構成１）において、前記仮想空間上に、第２ユーザに関連付けられた第２アバターを配置するステップを前記コンピュータにさらに実行させる。前記キャリブレーションの実行条件の１つは、前記第２アバターからの視界に対応する視界画像であって前記第１アバターの顔を含む視界画像が、前記第１アバターの顔を含まない画像に切り替わることである。

（構成３）
(構成２)において、前記キャリブレーションを実行するステップは、前記第２アバターと前記第１アバターの顔との間にオブジェクトが配置された場合に、前記第１アバターの顔を含まない画像に切り替わったと判断する。

（構成４）
(構成２)において、前記キャリブレーションを実行するステップは、前記視界画像の表示モードが前記視界画像の表示モードとは異なる表示モードに切り替えられた場合に、前記第１アバターの顔を含まない画像に切り替わったと判断する。

（構成５）
（構成１）～（構成４）のいずれかにおいて、前記キャリブレーションの実行条件の１つは、前記標準状態からの前記第１アバターの顔の表情の変化量が閾値を超えることである。

（構成６）
（構成１）～（構成５）のいずれかにおいて、前記キャリブレーションの実行条件の１つは、前記標準状態にある前記第１ユーザの顔の表情が検出されたことである。

（構成７）
コンピュータが実行する方法であって、仮想空間を定義するステップと、前記仮想空間上に、第１ユーザに関連付けられた第１アバターを配置するステップと、前記第１ユーザの顔の表情を検出するステップと、前記第１ユーザの顔の表情に応じて、前記第１アバターの顔の表情を制御するステップと、前記第１アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップと、を含む方法。

（構成８）
プログラムを格納したメモリと、プロセッサと、を備え、前記プロセッサは、前記プログラムを読み取って、仮想空間を定義するステップと、前記仮想空間上に、第１ユーザに関連付けられた第１アバターを配置するステップと、前記第１ユーザの顔の表情を検出するステップと、前記第１ユーザの顔の表情に応じて、前記第１アバターの顔の表情を制御するステップと、前記第１アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップと、を実行するコンピュータ。

２…ネットワーク、５…ユーザ、６…アバターオブジェクト、１１…仮想空間、１２…中心、１４…仮想カメラ、１５…視界領域、１００…ＨＭＤシステム、１１０…ＨＭＤセット、１３０…モニタ、１７０…マイク、１８０…スピーカ、１９０…センサ、２００…コンピュータ、２１０…プロセッサ、２２０…メモリ、２３０…ストレージ、２４０…入出力インターフェイス、２５０…通信インターフェイス、３００…コントローラ、３１０…グリップ、３２０…フレーム、３４０、３５０、３７０、３８０…ボタン、３９０…アナログスティック、４１０…ＨＭＤセンサ、４２０…モーションセンサ、４３０…ディスプレイ、５１０…コントロールモジュール、５２０…レンダリングモジュール、５３０…メモリモジュール、５４０…通信制御モジュール、６００…サーバ、６１０…プロセッサ、６２０…メモリ、６３０…ストレージ、６４０…入出力インターフェイス、６５０…通信インターフェイス、１４２１…仮想カメラ制御モジュール、１４２２…視界領域決定モジュール、１４２３…基準視線特定モジュール、１４２４…動き検出モジュール、１４２４…顔器官検出モジュール、１４２５…動き検出モジュール、１４２６…仮想空間定義モジュール、１４２７…仮想オブジェクト生成モジュール、１４２８…操作オブジェクト制御モジュール、１４２９…アバター制御モジュール、１４３８…視界画像生成モジュール

Claims

仮想空間を定義するステップと、
前記仮想空間上に、第１ユーザに関連付けられた第１アバターと第２ユーザに関連付けられた第２アバターを配置するステップと、
前記第１ユーザの顔の表情を検出するステップと、
前記第１ユーザの顔の表情に応じて、前記第１アバターの顔の表情を制御するステップと、
前記第１アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップと、をコンピュータに実行させるためのプログラムであって、
前記キャリブレーションの実行条件の１つは、前記第２アバターからの視界に対応する視界画像であって前記第１アバターの顔を含む視界画像が、前記第１アバターの顔を含まない画像に切り替わることである、
プログラム。
前記キャリブレーションを実行するステップは、前記第２アバターと前記第１アバターの顔との間にオブジェクトが配置された場合に、前記第１アバターの顔を含まない画像に切り替わったと判断する、
請求項１に記載のプログラム。
前記キャリブレーションを実行するステップは、前記視界画像の表示モードが前記視界画像の表示モードとは異なる表示モードに切り替えられた場合に、前記第１アバターの顔を含まない画像に切り替わったと判断する、
請求項１に記載のプログラム。
前記キャリブレーションの実行条件の１つは、前記標準状態からの前記第１アバターの顔の表情の変化量が閾値を超えることである、
請求項１～３のいずれか一項に記載のプログラム。
前記キャリブレーションの実行条件の１つは、前記標準状態にある前記第１ユーザの顔の表情が検出されたことである、
請求項１～４のいずれか一項に記載のプログラム。
プログラムを格納したメモリと、
プロセッサと、を備え、
前記プロセッサは、前記プログラムを読み取って、
仮想空間を定義するステップと、
前記仮想空間上に、第１ユーザに関連付けられた第１アバターと第２ユーザに関連付けられた第２アバターを配置するステップと、
前記第１ユーザの顔の表情を検出するステップと、
前記第１ユーザの顔の表情に応じて、前記第１アバターの顔の表情を制御するステップと、
前記第１アバターの顔の表情を標準状態に制御するキャリブレーションの実行条件が満たされた場合に、前記キャリブレーションを実行するステップと、を実行するコンピュータであって、
前記キャリブレーションの実行条件の１つは、前記第２アバターからの視界に対応する視界画像であって前記第１アバターの顔を含む視界画像が、前記第１アバターの顔を含まない画像に切り替わることである、
コンピュータ。