JP6495399B2 - 仮想空間を提供するためにコンピュータで実行されるプログラム、方法、および当該プログラムを実行するための情報処理装置 - Google Patents

仮想空間を提供するためにコンピュータで実行されるプログラム、方法、および当該プログラムを実行するための情報処理装置 Download PDF

Info

Publication number
JP6495399B2
JP6495399B2 JP2017169613A JP2017169613A JP6495399B2 JP 6495399 B2 JP6495399 B2 JP 6495399B2 JP 2017169613 A JP2017169613 A JP 2017169613A JP 2017169613 A JP2017169613 A JP 2017169613A JP 6495399 B2 JP6495399 B2 JP 6495399B2
Authority
JP
Japan
Prior art keywords
user
computer
virtual space
input
search key
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017169613A
Other languages
English (en)
Other versions
JP2019046250A (ja
Inventor
一晃 澤木
一晃 澤木
星爾 佐竹
星爾 佐竹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Colopl Inc
Original Assignee
Colopl Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Colopl Inc filed Critical Colopl Inc
Priority to JP2017169613A priority Critical patent/JP6495399B2/ja
Priority to JP2019040931A priority patent/JP6911070B2/ja
Publication of JP2019046250A publication Critical patent/JP2019046250A/ja
Application granted granted Critical
Publication of JP6495399B2 publication Critical patent/JP6495399B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Landscapes

  • Processing Or Creating Images (AREA)
  • User Interface Of Digital Computer (AREA)

Description

この開示は、仮想空間を提供する技術に関し、より特定的には、仮想空間に展開されるパノラマ画像を変更するための技術に関する。
ヘッドマウントデバイス(HMD:Head-Mounted Device)を用いて仮想空間を提供する技術が知られている。たとえば、特開2016−140078号公報(特許文献1)は、ヘッドマウントディスプレイにパノラマ画像を表示する技術を開示している。
また、近年、仮想空間におけるユーザの体験を豊かにする様々な技術が提案されている。たとえば、非特許文献1は、仮想空間上に複数のユーザの各々のアバターを配置し、これらアバターを通じてユーザ間でのコミュニケーションを図る技術を開示している。
特開2016−140078号公報
"Facebook、VRの世界で友達と会えるアプリ「Spaces」を発表"、[online]、[平成29年8月25日検索]、インターネット〈URL:http://itpro.nikkeibp.co.jp/atcl/idg/14/481709/042000319/〉
ある局面において、ユーザは、仮想空間に展開されているパノラマ画像を変更したいと考える。非特許文献1は、ユーザに対して切り替え候補のパノラマ画像を提示する技術を開示しているものの、これら切り替え候補のパノラマ画像の中にユーザが所望するパノラマ画像が含まれていない場合があった。したがって、ユーザが所望するパノラマ画像の候補を提示する技術が必要とされている。
本開示は、上記のような問題を解決するためになされたものであって、ある局面における目的は、仮想空間に展開されるパノラマ画像を変更するにあたり、ユーザの所望するパノラマ画像をユーザに提示する技術を提供することである。
ある実施形態に従うと、ヘッドマウントデバイスによって仮想空間を提供するためにコンピュータで実行されるプログラムが提供される。このプログラムはコンピュータに、予め定められた複数のパノラマ画像に含まれる一のパノラマ画像を仮想空間に展開するステップと、ヘッドマウントデバイスのユーザから、仮想空間に展開されているパノラマ画像を他のパノラマ画像に変更するためのトリガの入力を受け付けるステップと、トリガの入力を受け付けた後に、ユーザから検索キーの入力を受け付けるステップと、複数のパノラマ画像の中から、検索キーにより検索された一以上のパノラマ画像を特定するための情報を仮想空間に提示するステップと、ユーザから、一以上のパノラマ画像の中から一のパノラマ画像を選択する入力を受け付けるステップと、選択された一のパノラマ画像を仮想空間に展開するステップとを実行させる。
ある実施形態に従うプログラムは、仮想空間に展開されるパノラマ画像を変更するにあたり、ユーザの所望するパノラマ画像をユーザに提示できる。
開示された技術的特徴の上記および他の目的、特徴、局面および利点は、添付の図面と関連して理解されるこの発明に関する次の詳細な説明から明らかとなるであろう。
ある実施の形態に従うHMDシステムの構成の概略を表す図である。 一局面に従うコンピュータのハードウェア構成の一例を表すブロック図である。 ある実施の形態に従うHMDに設定されるuvw視野座標系を概念的に表す図である。 ある実施の形態に従う仮想空間を表現する一態様を概念的に表す図である。 ある実施の形態に従うHMDを装着するユーザの頭部を上から表した図である。 仮想空間において視界領域をX方向から見たYZ断面を表す図である。 仮想空間において視界領域をY方向から見たXZ断面を表す図である。 ある実施の形態に従うコントローラの概略構成を表す図である。 ある実施の形態に従うコンピュータをモジュール構成として表すブロック図である。 ある実施の形態に従うHMDシステムにおいて実行される処理の一部を表すシーケンスチャートである。 仮想空間に展開されているパノラマ画像を変更するための処理を説明する図(その1)である。 パノラマ画像を変更するための処理を説明する図(その2)である。 パノラマ画像を変更するための処理を説明する図(その3)である。 ある実施形態に従うHMDシステムの構成を説明するための図である。 ユーザの顔画像から口を検出する制御について説明する図である。 フェイストラッキングモジュールが口の形状を検出する処理を説明する図(その1)である。 フェイストラッキングモジュールが口の形状を検出する処理を説明するための図(その2)である。 フェイストラッキングデータの構造の一例を表す。 サーバのハードウェア構成と機能構成とを表すブロック図である。 パノラマ画像DBのデータ構造の一例を表す。 学習用DBのデータ構造の一例を表す。 ユーザが仮想空間において線図を描いている様子を表す視界画像である。 ユーザがパノラマ画像を選択する様子を表す視界画像である。 線図に基づいてパノラマ画像を変更するための処理を表すフローチャートである。 立体的な線図の入力を受け付ける様子を表す視界画像である。 立体的な線図を2次元化する処理を説明する図である。 フェイストラッキングデータに基づいてパノラマ画像を変更するための処理を表すフローチャートである。 ユーザが発話により検索キーを入力する様子を表す視界画像である。 音声信号から抽出される文字列に基づいてパノラマ画像を切り替えるための処理を表すフローチャートである。 複数のユーザが仮想空間を共有している場合のネットワークを説明する図である。 ユーザが視認する視界画像を表す。
以下、この技術的思想の実施形態について図面を参照しながら詳細に説明する。以下の説明では、同一の部品には同一の符号を付してある。それらの名称および機能も同じである。したがって、それらについての詳細な説明は繰り返さない。なお、以下で説明される各実施の形態および各変形例は、適宜選択的に組み合わされてもよい。
[HMDシステムの構成]
図1を参照して、HMDシステム100の構成について説明する。図1は、ある実施の形態に従うHMDシステム100の構成の概略を表す図である。ある局面において、HMDシステム100は、家庭用のシステムとしてあるいは業務用のシステムとして提供される。
HMDシステム100は、HMD110と、HMDセンサ120と、コントローラ160と、コンピュータ200とを備える。HMD110は、モニタ112と、注視センサ140と、スピーカ115と、マイク119とを含む。コントローラ160は、モーションセンサ130を含み得る。
ある局面において、コンピュータ200は、インターネットその他のネットワーク19に接続可能であり、ネットワーク19に接続されているサーバ150その他のコンピュータと通信可能である。他の局面において、HMD110は、HMDセンサ120の代わりに、センサ114を含み得る。
HMD110は、ユーザ190の頭部に装着され、動作中に仮想空間2をユーザ190に提供し得る。より具体的には、HMD110は、右目用の画像および左目用の画像をモニタ112にそれぞれ表示する。ユーザ190の各目がそれぞれの画像を視認すると、ユーザ190は、両目の視差に基づき当該画像を3次元の画像として認識し得る。
モニタ112は、たとえば、非透過型の表示装置として実現される。ある局面において、モニタ112は、ユーザ190の両目の前方に位置するようにHMD110の本体に配置されている。したがって、ユーザ190は、モニタ112に表示される3次元画像を視認すると、仮想空間2に没入することができる。ある実施の形態において、仮想空間2は、たとえば、背景、ユーザ190が操作可能なオブジェクト、ユーザ190が選択可能なメニューの画像を含む。複数のコンピュータ200が各ユーザの動作に基づく信号を受け渡しすることで、複数のユーザが一の仮想空間2で仮想体験できる構成であれば、各ユーザに対応するアバターオブジェクトが、仮想空間2に提示される。
なお、オブジェクトとは、仮想空間2に存在する仮想の物体である。ある局面において、オブジェクトは、ユーザに対応するアバターオブジェクト、アバターオブジェクトが身に着ける仮想アクセサリおよび仮想衣服、ユーザに関する情報が示されたパネルを模した仮想パネル、手紙を模した仮想手紙、およびポストを模した仮想ポストなどを含む。さらに、アバターオブジェクトは、仮想空間2においてユーザ190を象徴するキャラクタであり、たとえば人型、動物型、ロボット型などを含む。オブジェクトの形は様々である。ユーザ190は、予め決められたオブジェクトの中から好みのオブジェクトを仮想空間2に提示するようにしてもよいし、自分が作成したオブジェクトを仮想空間2に提示するようにしてもよい。
ある実施の形態において、モニタ112は、所謂スマートフォンその他の情報表示端末が備える液晶モニタまたは有機EL(Electro Luminescence)モニタとして実現され得る。
ある局面において、モニタ112は、右目用の画像を表示するためのサブスクリーンと、左目用の画像を表示するためのサブスクリーンとを含み得る。他の局面において、モニタ112は、右目用の画像と左目用の画像とを一体として表示する構成であってもよい。この場合、モニタ112は、高速シャッタを含む。高速シャッタは、画像がいずれか一方の目にのみ認識されるように、右目用の画像と左目用の画像とを交互に表示可能に作動する。
注視センサ140は、ユーザ190の右目および左目の視線が向けられる方向(視線方向)を検出する。当該方向の検出は、たとえば、公知のアイトラッキング機能によって実現される。注視センサ140は、当該アイトラッキング機能を有するセンサにより実現される。ある局面において、注視センサ140は、右目用のセンサおよび左目用のセンサを含むことが好ましい。注視センサ140は、たとえば、ユーザ190の右目および左目に赤外光を照射するとともに、照射光に対する角膜および虹彩からの反射光を受けることにより各眼球の回転角を検出するセンサであってもよい。注視センサ140は、検出した各回転角に基づいて、ユーザ190の視線方向を検知することができる。
スピーカ115は、コンピュータ200から受信した音声データに対応する音声(発話)を外部に出力する。マイク119は、ユーザ190の発話に対応する音声データをコンピュータ200に出力する。ユーザ190は、マイク119を用いて他のユーザに向けて発話する一方で、スピーカ115を用いて他のユーザの音声(発話)を聞くことができる。
より具体的には、ユーザ190がマイク119に向かって発話すると、当該ユーザ190の発話に対応する音声データがコンピュータ200に入力される。コンピュータ200は、その音声データを、ネットワーク19を介してサーバ150に出力する。サーバ150は、コンピュータ200から受信した音声データを、ネットワーク19を介して他のコンピュータ200に出力する。他のコンピュータ200は、サーバ150から受信した音声データを、他のユーザが装着するHMD110のスピーカ115に出力する。これにより、他のユーザは、HMD110のスピーカ115を介してユーザ190の音声を聞くことができる。同様に、他のユーザからの発話は、ユーザ190が装着するHMD110のスピーカ115から出力される。
コンピュータ200は、他のユーザのコンピュータ200から受信した音声データに応じて、当該他のユーザに対応する他アバターオブジェクトを動かすような画像をモニタ112に表示する。たとえば、ある局面において、コンピュータ200は、他アバターオブジェクトの口を動かすような画像をモニタ112に表示することで、あたかも仮想空間2内でアバターオブジェクト同士が会話しているかのように仮想空間2を表現する。このように、複数のコンピュータ200間で音声データの送受信が行なわれることで、一の仮想空間2内で複数のユーザ間での会話(チャット)が実現される。
HMDセンサ120は、複数の光源(図示しない)を含む。各光源は、たとえば、赤外線を発するLED(Light Emitting Diode)により実現される。HMDセンサ120は、HMD110の動きを検出するためのポジショントラッキング機能を有する。HMDセンサ120は、この機能を用いて、現実空間内におけるHMD110の位置および傾きを検出する。
なお、他の局面において、HMDセンサ120は、カメラにより実現されてもよい。この場合、HMDセンサ120は、カメラから出力されるHMD110の画像情報を用いて、画像解析処理を実行することにより、HMD110の位置および傾きを検出することができる。
他の局面において、HMD110は、位置検出器として、HMDセンサ120の代わりに、センサ114を備えてもよい。HMD110は、センサ114を用いて、HMD110自身の位置および傾きを検出し得る。たとえば、センサ114が、角速度センサ、地磁気センサ、加速度センサ、あるいはジャイロセンサなどである場合、HMD110は、HMDセンサ120の代わりに、これらの各センサのいずれかを用いて、自身の位置および傾きを検出し得る。一例として、センサ114が角速度センサである場合、角速度センサは、現実空間におけるHMD110の3軸周りの角速度を経時的に検出する。HMD110は、各角速度に基づいて、HMD110の3軸周りの角度の時間的変化を算出し、さらに、角度の時間的変化に基づいて、HMD110の傾きを算出する。
また、HMD110は、透過型表示装置を備えていても良い。この場合、当該透過型表示装置は、その透過率を調整することにより、一時的に非透過型の表示装置として構成可能であってもよい。また、視野画像は仮想空間2を構成する画像の一部に、現実空間を提示する構成を含んでいてもよい。たとえば、HMD110に搭載されたカメラで撮影した画像を視野画像の一部に重畳して表示させてもよいし、当該透過型表示装置の一部の透過率を高く設定することにより、視野画像の一部から現実空間を視認可能にしてもよい。
サーバ150は、コンピュータ200にプログラムを送信し得る。他の局面において、サーバ150は、他のユーザによって使用されるHMD110に仮想現実を提供するための他のコンピュータ200と通信し得る。たとえば、アミューズメント施設において、複数のユーザが参加型のゲームを行なう場合、各コンピュータ200は、各ユーザの動作に基づく信号を他のコンピュータ200と通信して、同じ仮想空間2において複数のユーザが共通のゲームを楽しむことを可能にする。また、上述したように、複数のコンピュータ200が各ユーザの動作に基づく信号を送受信することで、一の仮想空間2内で複数のユーザが会話を楽しむことができる。
コントローラ160は、ユーザ190からコンピュータ200への命令の入力を受け付ける。ある局面において、コントローラ160は、ユーザ190によって把持可能に構成される。他の局面において、コントローラ160は、ユーザ190の身体あるいは衣類の一部に装着可能に構成される。他の局面において、コントローラ160は、コンピュータ200から送られる信号に基づいて、振動、音、光のうちの少なくともいずれかを出力するように構成されてもよい。他の局面において、コントローラ160は、仮想現実を提供する空間に配置されるオブジェクトの位置や動きを制御するためにユーザ190によって与えられる操作を受け付ける。
モーションセンサ130は、ある局面において、ユーザ190の手に取り付けられて、ユーザ190の手の動きを検出する。たとえば、モーションセンサ130は、手の回転速度、回転数などを検出する。モーションセンサ130によって得られたユーザ190の手の動きの検出結果を表すデータ(以下、検出データともいう)は、コンピュータ200に送られる。モーションセンサ130は、たとえば、手袋型のコントローラ160に設けられている。ある実施の形態において、現実空間における安全のため、コントローラ160は、手袋型のようにユーザ190の手に装着されることにより容易に飛んで行かないものに装着されるのが望ましい。他の局面において、ユーザ190に装着されないセンサがユーザ190の手の動きを検出してもよい。たとえば、ユーザ190を撮影するカメラの信号が、ユーザ190の動作を表す信号として、コンピュータ200に入力されてもよい。モーションセンサ130とコンピュータ200とは、有線により、または無線により互いに接続される。無線の場合、通信形態は特に限られず、たとえば、Bluetooth(登録商標)その他の公知の通信手法が用いられる。
他の局面において、HMDシステム100は、テレビジョン放送受信チューナを備えてもよい。このような構成によれば、HMDシステム100は、仮想空間2においてテレビ番組を表示することができる。
さらに他の局面において、HMDシステム100は、インターネットに接続するための通信回路、あるいは、電話回線に接続するための通話機能を備えていてもよい。
[コンピュータのハードウェア構成]
図2を参照して、本実施の形態に係るコンピュータ200について説明する。図2は、一局面に従うコンピュータ200のハードウェア構成の一例を表すブロック図である。コンピュータ200は、主たる構成要素として、プロセッサ10と、メモリ11と、ストレージ12と、入出力インターフェース13と、通信インターフェース14とを備える。各構成要素は、それぞれ、バス15に接続されている。
プロセッサ10は、コンピュータ200に与えられる信号に基づいて、あるいは、予め定められた条件が成立したことに基づいて、メモリ11またはストレージ12に格納されているプログラムに含まれる一連の命令を実行する。ある局面において、プロセッサ10は、CPU(Central Processing Unit)、MPU(Micro Processor Unit)、FPGA(Field-Programmable Gate Array)その他のデバイスとして実現される。
メモリ11は、プログラムおよびデータを一時的に保存する。プログラムは、たとえば、ストレージ12からロードされる。データは、コンピュータ200に入力されたデータと、プロセッサ10によって生成されたデータとを含む。ある局面において、メモリ11は、RAM(Random Access Memory)その他の揮発メモリとして実現される。
ストレージ12は、プログラムおよびデータを永続的に保持する。ストレージ12は、たとえば、ROM(Read-Only Memory)、ハードディスク装置、フラッシュメモリ、その他の不揮発記憶装置として実現される。ストレージ12に格納されるプログラムは、HMDシステム100において仮想空間2を提供するためのプログラム、シミュレーションプログラム、ゲームプログラム、ユーザ認証プログラム、他のコンピュータ200との通信を実現するためのプログラムを含む。ストレージ12に格納されるデータは、仮想空間2を規定するためのデータおよびオブジェクトなどを含む。
なお、他の局面において、ストレージ12は、メモリカードのように着脱可能な記憶装置として実現されてもよい。さらに他の局面において、コンピュータ200に内蔵されたストレージ12の代わりに、外部の記憶装置に保存されているプログラムおよびデータを使用する構成が使用されてもよい。このような構成によれば、たとえば、アミューズメント施設のように複数のHMDシステム100が使用される場面において、プログラムやデータの更新を一括して行なうことが可能になる。
ある実施の形態において、入出力インターフェース13は、HMD110、HMDセンサ120またはモーションセンサ130との間で信号を通信する。ある局面において、入出力インターフェース13は、USB(Universal Serial Bus)インターフェース、DVI(Digital Visual Interface)、HDMI(登録商標)(High-Definition Multimedia Interface)その他の端子を用いて実現される。なお、入出力インターフェース13は上述のものに限られない。
ある実施の形態において、入出力インターフェース13は、さらに、コントローラ160と通信し得る。たとえば、入出力インターフェース13は、モーションセンサ130から出力された信号の入力を受ける。他の局面において、入出力インターフェース13は、プロセッサ10から出力された命令を、コントローラ160に送る。当該命令は、振動、音声出力、発光などをコントローラ160に指示する。コントローラ160は、当該命令を受信すると、その命令に応じて、振動、音声出力または発光のいずれかを実行する。
通信インターフェース14は、ネットワーク19に接続されて、ネットワーク19に接続されている他のコンピュータ(たとえば、サーバ150、他のユーザのコンピュータ200など)と通信する。ある局面において、通信インターフェース14は、たとえば、LAN(Local Area Network)その他の有線通信インターフェース、あるいは、WiFi(Wireless Fidelity)、Bluetooth(登録商標)、NFC(Near Field Communication)その他の無線通信インターフェースとして実現される。なお、通信インターフェース14は上述のものに限られない。
ある局面において、プロセッサ10は、ストレージ12にアクセスし、ストレージ12に格納されている1つ以上のプログラムをメモリ11にロードし、当該プログラムに含まれる一連の命令を実行する。当該1つ以上のプログラムは、コンピュータ200のオペレーティングシステム、仮想空間2を提供するためのアプリケーションプログラム、コントローラ160を用いて仮想空間2で実行可能なゲームソフトウェアなどを含み得る。プロセッサ10は、入出力インターフェース13を介して、仮想空間2を提供するための信号をHMD110に送る。HMD110は、その信号に基づいてモニタ112に映像を表示する。
なお、図2に示される例では、コンピュータ200は、HMD110の外部に設けられる構成が示されているが、他の局面において、コンピュータ200は、HMD110に内蔵されてもよい。一例として、モニタ112を含む携帯型の情報通信端末(たとえば、スマートフォン)がコンピュータ200として機能してもよい。
また、コンピュータ200は、複数のHMD110に共通して用いられる構成であってもよい。このような構成によれば、たとえば、複数のユーザに同一の仮想空間2を提供することもできるので、各ユーザは同一の仮想空間2で他のユーザと同一のアプリケーションを楽しむことができる。
ある実施の形態において、HMDシステム100では、グローバル座標系が予め設定されている。グローバル座標系は、現実空間における鉛直方向、鉛直方向に直交する水平方向、ならびに、鉛直方向および水平方向の双方に直交する前後方向にそれぞれ平行な、3つの基準方向(軸)を有する。本実施の形態では、グローバル座標系は視点座標系の一つである。そこで、グローバル座標系における水平方向、鉛直方向(上下方向)、および前後方向は、それぞれ、x軸、y軸、z軸と規定される。より具体的には、グローバル座標系において、x軸は現実空間の水平方向に平行である。y軸は、現実空間の鉛直方向に平行である。z軸は現実空間の前後方向に平行である。
ある局面において、HMDセンサ120は、赤外線センサを含む。赤外線センサが、HMD110の各光源から発せられた赤外線をそれぞれ検出すると、HMD110の存在を検出する。HMDセンサ120は、さらに、各点の値(グローバル座標系における各座標値)に基づいて、HMD110を装着したユーザ190の動きに応じた、現実空間内におけるHMD110の位置および傾きを検出する。より詳しくは、HMDセンサ120は、経時的に検出された各値を用いて、HMD110の位置および傾きの時間的変化を検出できる。
グローバル座標系は現実空間の座標系と平行である。したがって、HMDセンサ120によって検出されたHMD110の各傾きは、グローバル座標系におけるHMD110の3軸周りの各傾きに相当する。HMDセンサ120は、グローバル座標系におけるHMD110の傾きに基づき、uvw視野座標系をHMD110に設定する。HMD110に設定されるuvw視野座標系は、HMD110を装着したユーザ190が仮想空間2において物体を見る際の視点座標系に対応する。
[uvw視野座標系]
図3を参照して、uvw視野座標系について説明する。図3は、ある実施の形態に従うHMD110に設定されるuvw視野座標系を概念的に表す図である。HMDセンサ120は、HMD110の起動時に、グローバル座標系におけるHMD110の位置および傾きを検出する。プロセッサ10は、検出された値に基づいて、uvw視野座標系をHMD110に設定する。
図3に示されるように、HMD110は、HMD110を装着したユーザ190の頭部を中心(原点)とした3次元のuvw視野座標系を設定する。より具体的には、HMD110は、グローバル座標系を規定する水平方向、鉛直方向、および前後方向(x軸、y軸、z軸)を、グローバル座標系内においてHMD110の各軸周りの傾きだけ各軸周りにそれぞれ傾けることによって新たに得られる3つの方向を、HMD110におけるuvw視野座標系のピッチ方向(u軸)、ヨー方向(v軸)、およびロール方向(w軸)として設定する。
ある局面において、HMD110を装着したユーザ190が直立し、かつ、正面を視認している場合、プロセッサ10は、グローバル座標系に平行なuvw視野座標系をHMD110に設定する。この場合、グローバル座標系における水平方向(x軸)、鉛直方向(y軸)、および前後方向(z軸)は、HMD110におけるuvw視野座標系のピッチ方向(u軸)、ヨー方向(v軸)、およびロール方向(w軸)に一致する。
uvw視野座標系がHMD110に設定された後、HMDセンサ120は、HMD110の動きに基づいて、設定されたuvw視野座標系におけるHMD110の傾き(傾きの変化量)を検出できる。この場合、HMDセンサ120は、HMD110の傾きとして、uvw視野座標系におけるHMD110のピッチ角(θu)、ヨー角(θv)、およびロール角(θw)をそれぞれ検出する。ピッチ角(θu)は、uvw視野座標系におけるピッチ方向周りのHMD110の傾き角度を表す。ヨー角(θv)は、uvw視野座標系におけるヨー方向周りのHMD110の傾き角度を表す。ロール角(θw)は、uvw視野座標系におけるロール方向周りのHMD110の傾き角度を表す。
HMDセンサ120は、検出されたHMD110の傾き角度に基づいて、HMD110が動いた後のHMD110におけるuvw視野座標系を、HMD110に設定する。HMD110と、HMD110のuvw視野座標系との関係は、HMD110の位置および傾きに関わらず、常に一定である。HMD110の位置および傾きが変わると、当該位置および傾きの変化に連動して、グローバル座標系におけるHMD110のuvw視野座標系の位置および傾きが変化する。
ある局面において、HMDセンサ120は、赤外線センサからの出力に基づいて取得される赤外線の光強度および複数の点間の相対的な位置関係(たとえば、各点間の距離など)に基づいて、HMD110の現実空間内における位置を、HMDセンサ120に対する相対位置として特定してもよい。また、プロセッサ10は、特定された相対位置に基づいて、現実空間内(グローバル座標系)におけるHMD110のuvw視野座標系の原点を決定してもよい。
[仮想空間]
図4を参照して、仮想空間2についてさらに説明する。図4は、ある実施の形態に従う仮想空間2を表現する一態様を概念的に表す図である。仮想空間2は、中心21の360度方向の全体を覆う全天球状の構造を有する。図4では、説明を複雑にしないために、仮想空間2のうちの上半分の天球が例示されている。仮想空間2では各メッシュが規定される。各メッシュの位置は、仮想空間2に規定されるXYZ座標系における座標値として予め規定されている。コンピュータ200は、仮想空間2に展開可能なコンテンツ(静止画、動画など)を構成する各部分画像を、仮想空間2において対応する各メッシュにそれぞれ対応付けて、ユーザ190によって視認可能な仮想空間画像22が展開される仮想空間2をユーザ190に提供する。
ある局面において、仮想空間2では、中心21を原点とするXYZ座標系が規定される。XYZ座標系は、たとえば、グローバル座標系に平行である。XYZ座標系は視点座標系の一種であるため、XYZ座標系における水平方向、鉛直方向(上下方向)、および前後方向は、それぞれX軸、Y軸、Z軸として規定される。したがって、XYZ座標系のX軸(水平方向)がグローバル座標系のx軸と平行であり、XYZ座標系のY軸(鉛直方向)がグローバル座標系のy軸と平行であり、XYZ座標系のZ軸(前後方向)がグローバル座標系のz軸と平行である。
HMD110の起動時、すなわちHMD110の初期状態において、仮想カメラ1が、仮想空間2の中心21に配置される。仮想カメラ1は、現実空間におけるHMD110の動きに連動して、仮想空間2を同様に移動する。これにより、現実空間におけるHMD110の位置および向きの変化が、仮想空間2において同様に再現される。
仮想カメラ1には、HMD110の場合と同様に、uvw視野座標系が規定される。仮想空間2における仮想カメラのuvw視野座標系は、現実空間(グローバル座標系)におけるHMD110のuvw視野座標系に連動するように規定されている。したがって、HMD110の傾きが変化すると、それに応じて、仮想カメラ1の傾きも変化する。また、仮想カメラ1は、HMD110を装着したユーザ190の現実空間における移動に連動して、仮想空間2において移動することもできる。
仮想カメラ1の向きは、仮想カメラ1の位置および傾きに応じて決まるので、ユーザ190が仮想空間画像22を視認する際に基準となる視線(基準視線5)は、仮想カメラ1の向きに応じて決まる。コンピュータ200のプロセッサ10は、基準視線5に基づいて、仮想空間2における視界領域23を規定する。視界領域23は、仮想空間2のうち、HMD110を装着したユーザ190の視界に対応する。
注視センサ140によって検出されるユーザ190の視線方向は、ユーザ190が物体を視認する際の視点座標系における方向である。HMD110のuvw視野座標系は、ユーザ190がモニタ112を視認する際の視点座標系に等しい。また、仮想カメラ1のuvw視野座標系は、HMD110のuvw視野座標系に連動している。したがって、ある局面に従うHMDシステム100は、注視センサ140によって検出されたユーザ190の視線方向を、仮想カメラ1のuvw視野座標系におけるユーザ190の視線方向とみなすことができる。
[ユーザの視線]
図5を参照して、ユーザ190の視線方向の決定について説明する。図5は、ある実施の形態に従うHMD110を装着するユーザ190の頭部を上から表した図である。
ある局面において、注視センサ140は、ユーザ190の右目および左目の各視線を検出する。ある局面において、ユーザ190が近くを見ている場合、注視センサ140は、視線R1およびL1を検出する。他の局面において、ユーザ190が遠くを見ている場合、注視センサ140は、視線R2およびL2を検出する。この場合、ロール方向wに対して視線R2およびL2がなす角度は、ロール方向wに対して視線R1およびL1がなす角度よりも小さい。注視センサ140は、検出結果をコンピュータ200に送信する。
コンピュータ200が、視線の検出結果として、視線R1およびL1の検出値を注視センサ140から受信した場合には、その検出値に基づいて、視線R1およびL1の交点である注視点N1を特定する。一方、コンピュータ200は、視線R2およびL2の検出値を注視センサ140から受信した場合には、視線R2およびL2の交点を注視点として特定する。コンピュータ200は、特定した注視点N1の位置に基づき、ユーザ190の視線方向N0を特定する。コンピュータ200は、たとえば、ユーザ190の右目Rと左目Lとを結ぶ直線の中点と、注視点N1とを通る直線の延びる方向を、視線方向N0として検出する。視線方向N0は、ユーザ190が両目により実際に視線を向けている方向である。また、視線方向N0は、視界領域23に対してユーザ190が実際に視線を向けている方向に相当する。
[視界領域]
図6および図7を参照して、視界領域23について説明する。図6は、仮想空間2において視界領域23をX方向から見たYZ断面を表す図である。図7は、仮想空間2において視界領域23をY方向から見たXZ断面を表す図である。
図6に示されるように、YZ断面における視界領域23は、領域24を含む。領域24は、仮想カメラ1の基準視線5と仮想空間2のYZ断面とによって定義される。プロセッサ10は、仮想空間2おける基準視線5を中心として極角αを含む範囲を、領域24として規定する。
図7に示されるように、XZ断面における視界領域23は、領域25を含む。領域25は、基準視線5と仮想空間2のXZ断面とによって定義される。プロセッサ10は、仮想空間2における基準視線5を中心とした方位角βを含む範囲を、領域25として規定する。
ある局面において、HMDシステム100は、コンピュータ200からの信号に基づいて、視界画像をモニタ112に表示させることにより、ユーザ190に仮想空間2を提供する。視界画像は、仮想空間画像22のうちの視界領域23に重畳する部分に相当する。ユーザ190が、頭に装着したHMD110を動かすと、その動きに連動して仮想カメラ1も動く。その結果、仮想空間2における視界領域23の位置が変化する。これにより、モニタ112に表示される視界画像は、仮想空間画像22のうち、仮想空間2においてユーザ190が向いた方向の視界領域23に重畳する画像に更新される。ユーザ190は、仮想空間2における所望の方向を視認することができる。
ユーザ190は、HMD110を装着している間、現実世界を視認することなく、仮想空間2に展開される仮想空間画像22のみを視認できる。そのため、HMDシステム100は、仮想空間2への高い没入感覚をユーザ190に与えることができる。
ある局面において、プロセッサ10は、HMD110を装着したユーザ190の現実空間における移動に連動して、仮想空間2において仮想カメラ1を移動し得る。この場合、プロセッサ10は、仮想空間2における仮想カメラ1の位置および向きに基づいて、HMD110のモニタ112に投影される画像領域(すなわち、仮想空間2における視界領域23)を特定する。
ある実施の形態に従うと、仮想カメラ1は、二つの仮想カメラ、すなわち、右目用の画像を提供するための仮想カメラと、左目用の画像を提供するための仮想カメラとを含むことが望ましい。また、ユーザ190が3次元の仮想空間2を認識できるように、適切な視差が、二つの仮想カメラに設定されていることが好ましい。本実施の形態においては、仮想カメラ1が二つの仮想カメラを含み、二つの仮想カメラのロール方向が合成されることによって生成されるロール方向(w)がHMD110のロール方向(w)に適合されるように構成されているものとして、本開示に係る技術思想を例示する。
[コントローラ]
図8を参照して、コントローラ160の一例について説明する。図8は、ある実施の形態に従うコントローラ160の概略構成を表す図である。
図8の分図(A)に示されるように、ある局面において、コントローラ160は、右コントローラ800と左コントローラ(図示しない)とを含み得る。右コントローラ800は、ユーザ190の右手で操作される。左コントローラは、ユーザ190の左手で操作される。ある局面において、右コントローラ800と左コントローラとは、別個の装置として対称に構成される。したがって、ユーザ190は、右コントローラ800を把持した右手と、左コントローラを把持した左手とをそれぞれ自由に動かすことができる。他の局面において、コントローラ160は両手の操作を受け付ける一体型のコントローラであってもよい。以下、右コントローラ800について説明する。
右コントローラ800は、グリップ30と、フレーム31と、天面32とを備える。グリップ30は、ユーザ190の右手によって把持されるように構成されている。たとえば、グリップ30は、ユーザ190の右手の掌と3本の指(中指、薬指、小指)とによって保持され得る。
グリップ30は、ボタン33,34と、モーションセンサ130とを含む。ボタン33は、グリップ30の側面に配置され、右手の中指による操作を受け付ける。ボタン34は、グリップ30の前面に配置され、右手の人差し指による操作を受け付ける。ある局面において、ボタン33,34は、トリガー式のボタンとして構成される。モーションセンサ130は、グリップ30の筐体に内蔵されている。なお、ユーザ190の動作がカメラその他の装置によってユーザ190の周りから検出可能である場合には、グリップ30は、モーションセンサ130を備えなくてもよい。
フレーム31は、その円周方向に沿って配置された複数の赤外線LED35を含む。赤外線LED35は、コントローラ160を使用するプログラムの実行中に、当該プログラムの進行に合わせて赤外線を発光する。赤外線LED35から発せられた赤外線は、右コントローラ800と左コントローラとの各位置や姿勢(傾き、向き)を検出するために使用され得る。図8に示される例では、二列に配置された赤外線LED35が示されているが、配列の数は図8に示されるものに限られない。一列あるいは3列以上の配列が使用されてもよい。
天面32は、ボタン36,37と、アナログスティック38とを備える。ボタン36,37は、プッシュ式ボタンとして構成される。ボタン36,37は、ユーザ190の右手の親指による操作を受け付ける。アナログスティック38は、ある局面において、初期位置(ニュートラルの位置)から360度任意の方向への操作を受け付ける。当該操作は、たとえば、仮想空間2に配置されるオブジェクトを移動するための操作を含む。
ある局面において、右コントローラ800および左コントローラは、赤外線LED35その他の部材を駆動するための電池を含む。電池は、充電式、ボタン型、乾電池型などを含むが、これらに限定されない。他の局面において、右コントローラ800と左コントローラは、たとえば、コンピュータ200のUSBインターフェースに接続され得る。この場合、右コントローラ800および左コントローラは、電池を必要としない。
図8の分図(B)は、右コントローラ800を把持するユーザ190の右手に対応して仮想空間2に配置されるハンドオブジェクト810の一例を示す。たとえば、ユーザ190の右手に対応するハンドオブジェクト810に対して、ヨー、ロール、ピッチの各方向が規定される。たとえば、入力操作が、右コントローラ800のボタン34に対して行なわれると、ハンドオブジェクト810の人差し指を握りこんだ状態とし、入力操作がボタン34に対して行なわれていない場合には、分図(B)に示すように、ハンドオブジェクト810の人差し指を伸ばした状態とすることもできる。たとえば、ハンドオブジェクト810において親指と人差し指とが伸びている場合に、親指の伸びる方向がヨー方向、人差し指の伸びる方向がロール方向、ヨー方向の軸およびロール方向の軸によって規定される平面に垂直な方向がピッチ方向としてハンドオブジェクト810に規定される。
[HMDの制御装置]
図9を参照して、HMD110の制御装置について説明する。ある実施の形態において、制御装置は周知の構成を有するコンピュータ200によって実現される。図9は、ある実施の形態に従うコンピュータ200をモジュール構成として表すブロック図である。
図9に示されるように、コンピュータ200は、表示制御モジュール220と、仮想空間制御モジュール230と、音声制御モジュール225と、メモリモジュール240と、通信制御モジュール250とを備える。
表示制御モジュール220は、サブモジュールとして、仮想カメラ制御モジュール221と、視界領域決定モジュール222と、視界画像生成モジュール223と、基準視線特定モジュール224と、視線検出モジュール226と、ハンドトラッキングモジュール227と、フェイストラッキングモジュール228とを含む。
仮想空間制御モジュール230は、サブモジュールとして、仮想空間定義モジュール231と、仮想オブジェクト生成モジュール232と、手オブジェクト制御モジュール233とを含む。
ある実施の形態において、表示制御モジュール220、仮想空間制御モジュール230、および音声制御モジュール225は、プロセッサ10によって実現される。他の実施の形態において、複数のプロセッサ10が表示制御モジュール220、仮想空間制御モジュール230、および音声制御モジュール225として作動してもよい。メモリモジュール240は、メモリ11またはストレージ12によって実現される。通信制御モジュール250は、通信インターフェース14によって実現される。
ある局面において、表示制御モジュール220は、HMD110のモニタ112における画像表示を制御する。仮想カメラ制御モジュール221は、仮想空間2に仮想カメラ1を配置し、仮想カメラ1の挙動、向きなどを制御する。視界領域決定モジュール222は、HMD110を装着したユーザ190の頭の向きに応じて、視界領域23を規定する。視界画像生成モジュール223は、決定された視界領域23に基づいて、モニタ112に表示される視界画像のデータ(視界画像データともいう)を生成する。さらに、視界画像生成モジュール223は、仮想空間制御モジュール230から受信したデータに基づいて、視界画像データを生成する。視界画像生成モジュール223によって生成された視界画像データは、通信制御モジュール250によってHMD110に出力される。基準視線特定モジュール224は、HMDセンサ120またはセンサ114からの信号に基づいて基準視線(HMD110の傾き)を検出する。視線検出モジュール226は、注視センサ140からの信号に基づいて、ユーザ190の視線を特定する。ハンドトラッキングモジュール227は、ユーザ190が装着するコントローラ160の動き、つまり、ユーザ190の手の動きを検出する。より具体的には、HMDセンサ120は、コントローラ160に設けられた赤外線LED35が発する赤外線を検出してコンピュータ200に出力する。ハンドトラッキングモジュール227は、HMDセンサ120から入力される検出結果に基づいて、コントローラ160(右コントローラ800および左コントローラの各々)の位置を検出する。フェイストラッキングモジュール228は、ユーザ190の表情を検出する。フェイストラッキングモジュール228の詳細は後述される。
仮想空間制御モジュール230は、ユーザ190に提供される仮想空間2を制御する。仮想空間定義モジュール231は、仮想空間2を表す仮想空間データを生成することにより、HMDシステム100における仮想空間2を規定する。
仮想オブジェクト生成モジュール232は、仮想空間2に配置されるオブジェクトのデータを生成する。オブジェクトは、たとえば、他アバターオブジェクト、仮想パネル、仮想手紙、および仮想ポストなどを含み得る。仮想オブジェクト生成モジュール232によって生成されたデータは、視界画像生成モジュール223に出力される。
手オブジェクト制御モジュール233は、手オブジェクトを仮想空間2に配置する。手オブジェクトは、たとえば、コントローラ160を保持したユーザ190の右手あるいは左手に対応する。ある局面において、手オブジェクト制御モジュール233は、右手あるいは左手に対応する手オブジェクトを仮想空間2に配置するためのデータを生成する。また、手オブジェクト制御モジュール233は、ユーザ190によるコントローラ160の操作に応じて、手オブジェクトを動かすためのデータを生成する。手オブジェクト制御モジュール233によって生成されたデータは、視界画像生成モジュール223に出力される。
他の局面において、ユーザ190の体の一部の動き(たとえば、左手、右手、左足、右足、頭などの動き)がコントローラ160に関連付けられている場合、仮想空間制御モジュール230は、ユーザ190の体の一部に対応する部分オブジェクトを仮想空間2に配置するためのデータを生成する。仮想空間制御モジュール230は、ユーザ190が体の一部を用いてコントローラ160を操作すると、部分オブジェクトを動かすためのデータを生成する。これらのデータは、視界画像生成モジュール223に出力される。
音声制御モジュール225は、HMD110から、ユーザ190のマイク119を用いた発話を検出すると、当該発話に対応する音声データの送信対象のコンピュータ200を特定する。音声データは、音声制御モジュール225によって特定されたコンピュータ200に送信される。音声制御モジュール225は、ネットワーク19を介して他のユーザのコンピュータ200から音声データを受信すると、当該音声データに対応する音声(発話)をスピーカ115から出力する。
メモリモジュール240は、コンピュータ200が仮想空間2をユーザ190に提供するために使用されるデータを保持している。ある局面において、メモリモジュール240は、空間情報241と、オブジェクト情報242と、ユーザ情報243と、顔情報244とを保持している。
空間情報241は、仮想空間2を提供するために規定された1つ以上のテンプレートを保持している。
オブジェクト情報242は、仮想空間2において再生されるコンテンツ、当該コンテンツで使用されるオブジェクトを配置するための情報を保持している。当該コンテンツは、たとえば、ゲーム、現実社会と同様の風景を表したコンテンツなどを含み得る。さらに、オブジェクト情報242は、コントローラ160を操作するユーザ190の手に相当する手オブジェクトを仮想空間2に配置するためのデータと、各ユーザのアバターオブジェクトを仮想空間2に配置するためのデータと、仮想パネルなどのその他のオブジェクトを仮想空間2に配置するためのデータとを含む。
ユーザ情報243は、HMDシステム100の制御装置としてコンピュータ200を機能させるためのプログラム、オブジェクト情報242に保持される各コンテンツを使用するアプリケーションプログラムなどを保持している。メモリモジュール240に格納されているデータおよびプログラムは、HMD110のユーザ190によって入力される。あるいは、プロセッサ10が、当該コンテンツを提供する事業者が運営するコンピュータ(たとえば、サーバ150)からプログラムあるいはデータをダウンロードして、ダウンロードされたプログラムあるいはデータをメモリモジュール240に格納する。顔情報244は、ユーザ190の顔器官を検出するために必要なテンプレートを含む。ある実施形態において、顔情報244は、口テンプレート245と、目テンプレート246と、眉テンプレート247とを含む。各テンプレートは、顔を構成する器官に対応する画像であり得る。たとえば、口テンプレート245は、口の画像であり得る。なお、各テンプレートは複数の画像を含んでもよい。
通信制御モジュール250は、ネットワーク19を介して、サーバ150その他の情報通信装置と通信し得る。
ある局面において、表示制御モジュール220および仮想空間制御モジュール230は、たとえば、ユニティテクノロジーズ社によって提供されるUnity(登録商標)を用いて実現され得る。他の局面において、表示制御モジュール220および仮想空間制御モジュール230は、各処理を実現する回路素子の組み合わせとしても実現され得る。
コンピュータ200における処理は、ハードウェアと、プロセッサ10により実行されるソフトウェアとによって実現される。このようなソフトウェアは、ハードディスクその他のメモリモジュール240に予め格納されている場合がある。また、ソフトウェアは、CD−ROMその他のコンピュータ読み取り可能な不揮発性のデータ記録媒体に格納されて、プログラム製品として流通している場合もある。あるいは、当該ソフトウェアは、インターネットその他のネットワークに接続されている情報提供事業者によってダウンロード可能なプログラム製品として提供される場合もある。このようなソフトウェアは、光ディスク駆動装置その他のデータ読取装置によってデータ記録媒体から読み取られて、あるいは、通信制御モジュール250を介してサーバ150その他のコンピュータからダウンロードされた後、記憶モジュールに一旦格納される。そのソフトウェアは、プロセッサ10によって記憶モジュールから読み出され、実行可能なプログラムの形式でRAMに格納される。プロセッサ10は、そのプログラムを実行する。
コンピュータ200を構成するハードウェアは、一般的なものである。したがって、本実施の形態に係る最も本質的な部分は、コンピュータ200に格納されたプログラムであるとも言える。なお、コンピュータ200のハードウェアの動作は周知であるので、詳細な説明は繰り返さない。
なお、データ記録媒体としては、CD−ROM、FD(Flexible Disk)、ハードディスクに限られず、磁気テープ、カセットテープ、光ディスク(MO(Magnetic Optical Disc)/MD(Mini Disc)/DVD(Digital Versatile Disc))、IC(Integrated Circuit)カード(メモリカードを含む)、光カード、マスクROM、EPROM(Electronically Programmable Read-Only Memory)、EEPROM(Electronically Erasable Programmable Read-Only Memory)、フラッシュROMなどの半導体メモリなどの固定的にプログラムを担持する不揮発性のデータ記録媒体でもよい。
ここで言うプログラムとは、プロセッサ10により直接実行可能なプログラムだけでなく、ソースプログラム形式のプログラム、圧縮処理されたプログラム、暗号化されたプログラムなどを含み得る。
[HMDシステムの制御構造]
図10を参照して、HMDシステム100の制御構造について説明する。図10は、ある実施の形態に従うHMDシステム100において実行される処理の一部を表すシーケンスチャートである。
図10に示されるように、ステップS1010にて、コンピュータ200のプロセッサ10は、仮想空間定義モジュール231として、仮想空間画像データを特定し、仮想空間2を定義する。
ステップS1020にて、プロセッサ10は、仮想カメラ1を初期化する。たとえば、プロセッサ10は、メモリのワーク領域において、仮想カメラ1を仮想空間2において予め規定された中心点に配置し、仮想カメラ1の視線をユーザ190が向いている方向に向ける。
ステップS1030にて、プロセッサ10は、視界画像生成モジュール223として、初期の視界画像を表示するための視界画像データを生成する。生成された視界画像データは、通信制御モジュール250によってHMD110に出力される。
ステップS1032にて、HMD110のモニタ112は、コンピュータ200から受信した視界画像データに基づいて、視界画像を表示する。HMD110を装着したユーザ190は、視界画像を視認すると仮想空間2を認識し得る。
ステップS1034にて、HMDセンサ120は、HMD110から発信される複数の赤外線光に基づいて、HMD110の位置と傾きを検知する。検知結果は、動き検知データとして、コンピュータ200に出力される。
ステップS1040にて、プロセッサ10は、HMD110の動き検知データに含まれる位置と傾きとに基づいて、HMD110を装着したユーザ190の視界方向を特定する。
ステップS1050にて、プロセッサ10は、アプリケーションプログラムを実行し、アプリケーションプログラムに含まれる命令に基づいて、仮想空間2にオブジェクトを提示する。このとき提示されるオブジェクトは、他アバターオブジェクトを含む。
ステップS1060にて、コントローラ160は、モーションセンサ130から出力される信号に基づいて、ユーザ190の操作を検出し、その検出された操作を表す検出データをコンピュータ200に出力する。なお、他の局面において、ユーザ190によるコントローラ160の操作は、ユーザ190の周囲に配置されたカメラからの画像に基づいて検出されてもよい。
ステップS1065にて、プロセッサ10は、コントローラ160から取得した検出データに基づいて、ユーザ190によるコントローラ160の操作を検出する。
ステップS1070にて、プロセッサ10は、手オブジェクトを仮想空間2に提示するための視界画像データを生成する。
ステップS1080にて、プロセッサ10は、ユーザ190によるコントローラ160の操作に基づく視界画像データを生成する。生成された視界画像データは、通信制御モジュール250によってHMD110に出力される。
ステップS1092にて、HMD110は、受信した視界画像データに基づいて視界画像を更新し、更新後の視界画像をモニタ112に表示する。
[技術思想]
次に、図11〜図13を用いて本開示に従う技術思想を説明する。図11は、仮想空間2に展開されている仮想空間画像22(以下、「パノラマ画像22」とも言う)を変更するための処理を説明する図(その1)である。
図11を参照して、仮想空間2には花1110を含むパノラマ画像22が展開されている。また、仮想空間2は、スピーカオブジェクト1120を含む。ある局面において、ユーザ190は、仮想空間2に展開されているパノラマ画像22を変更したいと思う。係る場合、ユーザ190は、パノラマ画像22を変更するためのトリガをコンピュータ200に入力する(ステップS1)。一例として、トリガは、スピーカオブジェクト1120とハンドオブジェクト810とを接触させることを含む。
その後、ユーザ190は、検索キーをコンピュータ200に入力する(ステップS2)。図11に示される例において、ユーザ190は、「動物」と発話する。コンピュータ200は、マイク119から入力される音声信号から文字列「動物」を抽出する。コンピュータ200は、抽出された文字列を表す検索キー1130をサーバ150に送信する(ステップS3)。サーバ150は、パノラマ画像DB(データベース)1934を保持するストレージ1930を有する。パノラマ画像DB1934は、パノラマ画像(動画像を含む)と、パノラマ画像を識別する情報(以下、「パノラマ画像ID」とも言う。)とを関連付けて複数保持する。
サーバ150は、コンピュータ200から検索キー1130が入力されると、当該検索キー1130に基づいて、パノラマ画像DB1934に格納される複数のパノラマ画像の中から、一以上のパノラマ画像を検索する(ステップS4)。サーバ150は、検索された一以上のパノラマ画像のサムネイル1140を生成する。サムネイル1140は、パノラマ画像を特定するための情報として機能する。サーバ150は、生成したサムネイル1140とパノラマ画像ID1150とをコンピュータ200に送信する(ステップS5)。
図12は、パノラマ画像22を変更するための処理を説明する図(その2)である。図12に示される視界画像1200は、サムネイル1210〜1260を含む。これらのサムネイルは、受信した一以上のサムネイル1140に対応する。また、これらのサムネイルは、静止画像または動画像のいずれであってもよい。
ユーザ190は、サムネイル1210〜1260のうち一のサムネイル(パノラマ画像)をハンドオブジェクト810で選択する(ステップS6)。たとえば、ユーザ190は、犬を含むサムネイル1210とハンドオブジェクト810とを接触させることにより、サムネイル1210を選択する。
図13は、パノラマ画像22を変更するための処理を説明する図(その3)である。コンピュータ200は、ユーザ190から選択されたサムネイルに対応するパノラマ画像ID1310をサーバ150に送信する(ステップS7)。サーバ150は、受信したパノラマ画像IDに対応するパノラマ画像1320をコンピュータ200に送信する。コンピュータ200は、受信したパノラマ画像1320を仮想空間2に展開する(ステップS9)。これにより、ユーザ190は、仮想空間2において犬1330を含むパノラマ画像1320を視認できる。
上記によれば、コンピュータ200は、ユーザ190に入力された検索キーに関連する一以上のパノラマ画像、換言すれば、ユーザ190が所望するパノラマ画像(を特定する情報)をユーザ190に提示できる。以下、パノラマ画像を変更するためのより具体的な処理について説明する。
[HMDシステム1400の構成]
図14は、ある実施形態に従うHMDシステム1400の構成を説明するための図である。HMDシステム1400は、HMD110に替えてHMD1410を有する点において、図1で説明したHMDシステム100と相違する。
HMD1410は、第1カメラ116と、第2カメラ117とを有する点において、HMD110と相違する。第1カメラ116は、ユーザ190の顔の下部を撮影する。より具体的には、第1カメラ116は、ユーザ190の鼻、頬、および口などを撮影する。第2カメラ117は、ユーザ190の目および眉などを撮影する。HMD1410のユーザ190側の筐体をHMD1410の内側、HMD1410のユーザ190とは逆側の筐体をHMD1410の外側と定義する。ある局面において、第1カメラ116は、HMD1410の外側に配置され、第2カメラ117は、HMD1410の内側に配置され得る。第1カメラ116および第2カメラ117が生成した画像は、コンピュータ200に入力される。
フェイストラッキングモジュール228は、ユーザ190の第1カメラ116および第2カメラ117が生成するユーザ190の顔の画像から、ユーザ190の顔を構成する器官(例えば、口,目,眉)を検出する。フェイストラッキングモジュール228は、検出した各器官ごとの特徴点の位置を間欠的に検出する。換言すれば、フェイストラッキングモジュール228は、ユーザ190の表情を検出する。以下、フェイストラッキングモジュール228のより具体的な処理を説明する。
[フェイストラッキング]
以下、図15〜図18を参照して、ユーザの表情(顔の動き)を検出するための具体例について説明する。図15〜図18では、一例として、ユーザ190の口の動きを検出する具体例について説明する。なお、図15〜図18で説明される検出方法は、ユーザ190の口の動きに限られず、ユーザ190の顔を構成する他の器官(例えば、目、眉、鼻、頬)の動きの検出にも適用され得る。
図15は、ユーザの顔画像1500から口を検出する制御について説明する図である。第1カメラ116により生成された顔画像1500は、ユーザ190の鼻と口とを含む。
フェイストラッキングモジュール228は、顔情報244に格納される口テンプレート245を利用したパターンマッチングにより、顔画像1500から口領域1510を特定する。ある局面において、フェイストラッキングモジュール228は、顔画像1500において、矩形上の比較領域を設定し、この比較領域の大きさ、位置および角度をそれぞれ変えながら、比較領域の画像と、口テンプレート245の画像との類似度を算出する。フェイストラッキングモジュール228は、予め定められたしきい値よりも大きい類似度が算出された比較領域を、口領域1510として特定し得る。
フェイストラッキングモジュール228はさらに、算出した類似度がしきい値よりも大きい比較領域の位置と、他の顔器官(例えば、目、鼻)の位置との相対関係に基づいて、当該比較領域が口領域に相当するか否かを判断し得る。
フェイストラッキングモジュール228は、特定した口領域1510に基づいて、より詳細な口の形状を検出する。
図16は、フェイストラッキングモジュール228が口の形状を検出する処理を説明する図(その1)である。図16を参照して、フェイストラッキングモジュール228は、口領域1510に含まれる口の形状(唇の輪郭)を検出するための複数の輪郭検出線1600を設定する。各輪郭検出線1600は、顔の高さ方向に直交する方向に、予め定められた間隔で設定される。
フェイストラッキングモジュール228は、複数の輪郭検出線1600の各々に沿った口領域1510の輝度値の変化を検出し、輝度値の変化が急激な位置を輪郭点として特定し得る。より具体的には、フェイストラッキングモジュール228は、隣接画素との輝度差(すなわち、輝度値変化)が予め定められたしきい値以上である画素を、輪郭点として特定し得る。画素の輝度値は、たとえば、画素のRBG値を所定の重み付けで積算することにより得られる。
フェイストラッキングモジュール228は、口領域1510に対応する画像から2種類の輪郭点を特定する。フェイストラッキングモジュール228は、口(唇)の外側の輪郭に対応する輪郭点1610と、口(唇)の内側の輪郭に対応する輪郭点1620とを特定する。ある局面において、フェイストラッキングモジュール228は、1つの輪郭検出線1600上に3つ以上の輪郭点が検出された場合には、両端の輪郭点を外側の輪郭点1610として特定し得る。この場合、フェイストラッキングモジュール228は、外側の輪郭点1610以外の輪郭点を、内側の輪郭点1620として特定し得る。また、フェイストラッキングモジュール228は、1つの輪郭検出線1600上に二つ以下の輪郭点が検出された場合には、検出された輪郭点を外側の輪郭点1610として特定し得る。
図17は、フェイストラッキングモジュール228が口の形状を検出する処理を説明するための図(その2)である。図17では、外側の輪郭点1610は白丸、内側の輪郭点1620はハッチングされた丸としてそれぞれ示されている。
フェイストラッキングモジュール228は、内側の輪郭点1620間を補完することにより、口形状1700を特定する。この場合、輪郭点1620は、口の特徴点と言える。ある局面において、フェイストラッキングモジュール228は、スプライン補完などの非線形の補完方法を用いて、口形状1700を特定し得る。なお、他の局面において、フェイストラッキングモジュール228は、外側の輪郭点1610間を補完することにより口形状1700を特定してもよい。さらに他の局面において、フェイストラッキングモジュール228は、想定される口形状(人の上唇と下唇とによって形成され得る所定の形状)から、大きく逸脱する輪郭点を除外し、残った輪郭点によって口形状1700を特定してもよい。このようにして、フェイストラッキングモジュール228は、ユーザの口の動作(形状)を特定し得る。なお、口形状1700の検出方法は上記に限られず、フェイストラッキングモジュール228は、他の手法により口形状1700を検出してもよい。また、フェイストラッキングモジュール228は、同様にして、ユーザの目および眉の動作を検出し得る。なお、フェイストラッキングモジュール228は、頬、鼻などの器官の形状を検出可能に構成されてもよい。
図18は、フェイストラッキングデータの構造の一例を表す。フェイストラッキングデータは、各器官の形状を構成する複数の特徴点のuvw視野座標系における位置座標を表す。たとえば、図18に示されるポイントm1、m2・・は、口形状1700を構成する内側の輪郭点1620に対応する。ある局面において、フェイストラッキングデータは、第1カメラ116または第2カメラ117の位置を基準(原点)としたuvw視野座標系における座標値である。他の局面において、フェイストラッキングデータは、各器官ごとに予め定められた特徴点を基準(原点)とした座標系における座標値である。一例として、ポイントm1、m2・・・は、内側の輪郭点1620のうち口角に対応するいずれか一方の特徴点を原点とした座標系における座標値である。
[サーバ150の構成]
図19は、サーバ150のハードウェア構成と機能構成とを表すブロック図である。ある実施形態において、サーバ150は、主たるハードウェアとして通信インターフェース1910と、プロセッサ1920と、ストレージ1930とを備える。
通信インターフェース1910は、コンピュータ200など外部の通信機器と信号を送受信するための変復調処理などを行なう無線通信用の通信モジュールとして機能する。通信インターフェース1910は、チューナ、高周波回路等により実現される。
プロセッサ1920は、サーバ150の動作を制御する。プロセッサ1920は、ストレージ1930に格納される各種の制御プログラムを実行することにより、送受信部1921、サーバ処理部1922、検索エンジン1923、物体特定部1924、感情判断部1925、学習部1926として機能する。
送受信部1921は、各コンピュータ200との間で各種情報を送受信する。たとえば、送受信部1921は、仮想空間2にオブジェクトを配置する要求、オブジェクトを仮想空間2から削除する要求、オブジェクトを移動させる要求、ユーザの音声などを各コンピュータ200に送信する。
サーバ処理部1922は、コンピュータ200から受信した情報に基づいて、後述されるユーザDB1933および学習用DB1935を更新する。検索エンジン1923は、コンピュータ200から受信した検索キーに基づいて、パノラマ画像DB1934に含まれる複数のパノラマ画像の中から一以上のパノラマ画像を検索する。
物体特定部1924は、後述する学習モデル1936を利用して、コンピュータ200から入力された線図データに対応する物体の候補を特定する。感情判断部1925は、後述する学習モデル1937を利用して、コンピュータ200から受信したフェイストラッキングデータに対応するユーザ190の感情の候補を判断する。学習部1926は、後述する学習モデル1936、1937を更新する。
ストレージ1930は、仮想空間指定情報1931と、オブジェクト指定情報1932と、ユーザDB1933と、パノラマ画像DB1934と、学習用DB1935と、学習モデル1936、1937とを保持する。
仮想空間指定情報1931は、コンピュータ200の仮想空間定義モジュール231が仮想空間2を定義するために用いられる情報である。たとえば、仮想空間指定情報1931は、仮想空間2の大きさまたは形状を指定する情報を含む。オブジェクト指定情報1932は、コンピュータ200の仮想オブジェクト生成モジュール232が仮想空間2に配置(生成)するオブジェクトを指定する。
ユーザDB1933は、ネットワーク19に接続される複数のコンピュータ200の各々のユーザ190を識別するための情報(以下、「ユーザID」とも言う)と、ユーザの属性情報とを含む。属性情報は、たとえば、年齢、場所(住所など)、性別、趣味などを含む。パノラマ画像DB1934は、パノラマ画像IDと、パノラマ画像(動画像を含む)とを関連付けて保持する。
学習用DB1935は、検索キーと、当該検索キーにより検索された一以上のパノラマ画像のうちユーザ190に選択されたパノラマ画像とを互いに関連付けて保持する。ある局面において、学習用DB1935は、これらの情報にさらにユーザIDを関連付けて保持してもよい。パノラマ画像DB1934および学習用DB1935のデータ構造は後述される。
学習モデル1936は、コンピュータ200から入力された線図データに対応する物体を特定するためのプログラムを保持する。学習モデル1937は、コンピュータ200から入力されたフェイストラッキングデータに対応するユーザ190の感情を判断するためのプログラムを保持する。一例として、学習モデル1936,1937は、入力層、複数の中間層、および出力層を含むニューラルネットワークである。学習部1926は、学習用DB1935に保持される学習用データに基づいて、学習モデル1936、1937の各ノード間の重み係数を更新する。学習部1926は、一例として、誤差逆伝播法に従い重み係数を更新する。
(パノラマ画像DB1934)
図20は、パノラマ画像DB1934のデータ構造の一例を表す。パノラマ画像DB1934は、パノラマ画像IDと、画像データと、タイトルと、タグとを互いに関連付けて保持する。
画像データは、動画像データを含み得る。画像データは、たとえば、コンピュータ200のユーザ、またはサーバ150の管理者によりサーバ150に投稿(登録)される。タイトルは、画像データの投稿者によって設定される。タグは、画像データの投稿者、またはパノラマ画像の視聴者によって設定される。タグは、パノラマ画像のジャンル、パノラマ画像に含まれる物体などを特定する。タグはさらに、感情タグを含み得る。感情タグは、ユーザ190がパノラマ画像を視聴することにより得られると推定される感情を表す。一例として、コメディ動画像のパノラマ画像には、「楽しい」、「リラックス」、「満足」などの感情タグが設定される。
(学習用DB1935)
図21は、学習用DB1935のデータ構造の一例を表す。学習用DB1935は、テーブル2110,2120,2130を含む。テーブル2110は、線図データとしての検索キーと、線図により表される物体と、当該検索キーにより検索された一以上のパノラマ画像のうちユーザ190に選択されたパノラマ画像のパノラマ画像IDとを互いに関連付けて保持する。テーブル2120は、フェイストラッキングデータとしての検索キーと、フェイストラッキングデータにより表される感情と、当該検索キーにより検索された一以上のパノラマ画像のうちユーザ190に選択されたパノラマ画像のパノラマ画像IDとを互いに関連付けて保持する。テーブル2130は、音声信号から抽出された文字列としての検索キーと、当該検索キーにより検索された一以上のパノラマ画像のうちユーザ190に選択されたパノラマ画像のパノラマ画像IDとを互いに関連付けて保持する。
以下、検索キーとして、ユーザ190が仮想空間2で描いた線図を表す線図データ、ユーザ190の表情を表すフェイストラッキングデータ、ユーザ190の発話に基づく音声信号から抽出された文字列、を用いる実施形態について説明する。
[線図データを検索キーとして用いる]
図22は、ユーザ190が仮想空間2において線図を描いている様子を表す視界画像2200である。視界画像2200は、机オブジェクト2210を含む。机オブジェクト2210の上には、コンピュータ200がユーザ190から線図の入力を受け付けるための入力オブジェクト2220が配置されている。入力オブジェクト2220の形状は、平らな面を有する略直方体である。
ある局面において、机オブジェクト2210の上にペンオブジェクト2230が配置されている。また、入力オブジェクト2220の近傍に、入力オブジェクト2220への線図の入力を促すメッセージオブジェクト2240が配置されている。
図22に示される例において、ハンドオブジェクト810とペンオブジェクト2230とが関連付けられている。たとえば、コンピュータ200のプロセッサ10は、ハンドオブジェクト810とペンオブジェクト2230とが接触したことを検出して、これらのオブジェクトを互いに関連付ける。
ユーザ190は、これらのオブジェクトが関連付けられた状態でコントローラ160を動かす。プロセッサ10はハンドトラッキングモジュール227として、コントローラ160の動きをハンドオブジェクト810に反映する。これにより、ペンオブジェクト2230がハンドオブジェクト810に連動して動く。
ユーザ190は、ペンオブジェクト2230を用いて入力オブジェクト2220に線図を入力する。より具体的には、プロセッサ10は、ペンオブジェクト2230と入力オブジェクト2220との接点の軌跡を表す軌跡オブジェクト2250を入力オブジェクト2220上に配置する。これにより、ユーザ190は、自身が描いた線図(に対応する軌跡オブジェクト2250)を認識できる。ある実施形態において、プロセッサ10は、コントローラ160の予め定められたボタンが押下されている間のみ、ペンオブジェクト2230と入力オブジェクト2220との接点の軌跡をトラッキングするように構成されてもよい。
コンピュータ200は、軌跡オブジェクト2250のデータ(ユーザ190が描いた線図を表す線図データ)を検索キーとして、サーバ150に送信する。
サーバ150のプロセッサ1920は、物体特定部1924として、コンピュータ200から入力された線図データが表す物体の候補を特定する。より具体的には、物体特定部1924は、学習モデル1936の各入力層に線図データを入力し、各出力層から出力された値に基づいて、線図データが表す物体の候補を特定する。一例として、物体特定部1924は、予め定められた閾値を超える値を出力した出力層に対応する物体を、線図データが表す物体の候補として特定する。物体特定部1924は、特定された物体の候補を表す情報(例えば文字列)を検索エンジン1923に出力する。
検索エンジン1923は、物体特定部1924から入力された情報に基づいて、パノラマ画像DB1934に格納される複数のパノラマ画像の中から一以上のパノラマ画像を検索する。たとえば、検索エンジン1923は、物体特定部1924から「ねこ」、「いぬ」の文字列の入力を受け付ける。検索エンジン1923は、入力された文字列を用いて、パノラマ画像DB1934の中から、タイトルまたはタグに「ねこ」または「いぬ」の文字列を含むパノラマ画像を検索する。プロセッサ1920は、検索されたパノラマ画像の画像データからサムネイルを生成する。プロセッサ1920は、生成したサムネイルと、当該サムネイルに対応するパノラマ画像IDとをコンピュータ200に送信する。
図23は、ユーザ190がパノラマ画像を選択する様子を表す視界画像2300である。視界画像2300は、ユーザ190により入力された検索キーを表すスクリーン2310と、サーバ150から受信したサムネイル2320〜2350とを含む。
ユーザ190は、サムネイル2320〜2350のうち一のサムネイル(パノラマ画像)をハンドオブジェクト810で選択する。コンピュータ200は、選択されたサムネイルに対応するパノラマ画像IDをサーバ150に送信する。サーバ150は、受信したパノラマ画像IDに対応する画像データをコンピュータ200に送信する。コンピュータ200は、受信した画像データを仮想空間2に展開する。これにより、ユーザ190は、所望のパノラマ画像を視聴できる。なお、パノラマ画像が動画像である場合、コンピュータ200は、当該パノラマ画像を予めダウンロードしてから仮想空間2に展開してもよいし、当該パノラマ画像をストリーミング再生してもよい。
サーバ150のプロセッサ1920は、コンピュータ200から受信したパノラマ画像IDに関連付けられたタグに基づいて、検索キーにより表される物体を特定する。プロセッサ1920は、検索キー(線図データ)と、検索キーにより表される物体と、パノラマ画像IDとを検索用DB1935のテーブル2110に格納する。ある局面において、プロセッサ1920は、学習部1926として、線図データと当該線図データにより表される物体とに基づいて、学習モデル1936の学習(教師あり学習)を実行する。
上記によれば、サーバ150は、ユーザ190の描いた線図に基づいて、ユーザ190が所望するパノラマ画像の候補をユーザ190に提供できる可能性を高め得る。また、図23の視界画像2300に示されるように、ユーザ190は、自分で入力した検索キー(線図)と、検索キーにより検索されたパノラマ画像(のサムネイル)とを一緒に提示されるため、自身が思い浮かべていた検索キー(線図ではなく文字列)に対応するパノラマ動画を正確に選択し得る。その結果、サーバ150は、質の高い学習用データを取得でき、学習効率を高め得る。
ある局面において、視界画像2300は、検索キーに対応する物体が何であるかをユーザ190に問い合わせるための質問オブジェクト2360を含む。たとえば、質問オブジェクト2360は、検索キーに対応する物体が、最も大きな値を出力した出力層に対応する物体(つまり、ユーザが意図している物体である確率が最も高い物体)であるか否かを問い合わせる。質問オブジェクト2360は、当該問い合わせに対する回答の入力を受け付けるための回答オブジェクト2370,2380を含む。ユーザ190は、ハンドオブジェクト810で回答オブジェクト2370,2380のいずれか一方を選択する。コンピュータ200は、当該問い合わせに対するユーザ190の回答結果をサーバ150に送信する。サーバ150のプロセッサ1920は、受信した回答結果と線図データとに基づいて学習モデル1936を学習してもよい。
(線図に基づくパノラマ画像の変更処理の制御構造)
図24は、線図に基づいてパノラマ画像を変更するための処理を表すフローチャートである。図24に示される処理は、コンピュータ200のプロセッサ10およびサーバ150のプロセッサ1920によって実現される。
ステップS2405にて、プロセッサ10は、仮想空間定義モジュール231として、仮想空間2にパノラマ画像を展開する。ステップS2410にて、プロセッサ10は、仮想空間2に、入力オブジェクト、ペンオブジェクト、操作オブジェクトとして機能するハンドオブジェクト、仮想カメラなどの各種オブジェクトを配置する。
ステップS2415にて、プロセッサ10は、操作オブジェクトとペンオブジェクトとが接触したか否かを判断する。プロセッサ10は、これらのオブジェクトが接触したと判断した場合(ステップS2415でYES)、これらのオブジェクトを関連付ける。また、プロセッサ10は、これらのオブジェクトが接触したことを、パノラマ画像を変更するためのトリガとして受け付ける。そうでない場合(ステップS2415でNO)、プロセッサ10は、トリガを受け付けるまで待機する。
ステップS2420にて、プロセッサ10は、入力オブジェクトに対する線図(例えば、ペンオブジェクトと入力オブジェクトとの接点の軌跡)を検索キーとして受け付ける。ステップS2425にて、プロセッサ10は、操作オブジェクトとペンオブジェクトとの関連付けが解除されたか否かを判断する。たとえば、ユーザ190は、コントローラ160に設けられた予め定められたボタンを押下することにより、上記関連付けを解除する。プロセッサ10は、操作オブジェクトとペンオブジェクトとの関連付けが解除されたと判断した場合(ステップS2425でYES)、ステップS2420で入力された線図データをサーバ150に送信する(ステップS2430)。そうでない場合(ステップS2425でNO)、プロセッサ10は、ステップS2420の処理を再び実行する。
ステップS2435にて、プロセッサ1920は、コンピュータ200から線図データ(検索キー)を受信する。ステップS2440にて、プロセッサ1920は、線図データに基づいて物体(例えば、物体を表す文字列)を特定する。ステップS2445にて、プロセッサ1920は、特定した物体を表す文字列に基づいて、パノラマ画像DB1934に格納される複数のパノラマ画像の中から一以上のパノラマ画像を検索する。ステップS2450にて、プロセッサ1920は、検索した一以上のパノラマ画像の各々についてサムネイルを生成し、サムネイルとパノラマ画像IDとをコンピュータ200に送信する。
ステップS2455にて、プロセッサ10は、サーバ150からサムネイルとパノラマ画像IDとを受信する。ステップS2460にて、プロセッサ10は、検索されたパノラマ画像を特定するための情報として機能するサムネイルを仮想空間2に提示する。ステップS2465にて、プロセッサ10は、ユーザ190から、一以上のパノラマ画像(サムネイル)の中から一のパノラマ画像(サムネイル)の選択を受け付ける。ステップS2470にて、プロセッサ10は、選択されたサムネイルに対応するパノラマ画像IDをサーバ150に送信する。
ステップS2475にて、プロセッサ1920は、パノラマ画像IDをコンピュータ200から受信する。ステップS2480にて、プロセッサ1920は、パノラマ画像DB1934を参照して、受信したパノラマ画像IDに対応する画像データをコンピュータ200に送信する。
ステップS2485にて、プロセッサ10は、仮想空間定義モジュール231として、受信した画像データを仮想空間2を構成する天球に展開する。これにより、ユーザ190は、自身の所望するパノラマ画像を視認できる。
ステップS2490にて、プロセッサ1920は、学習部1926として、検索キーとして入力された線図データと、当該線図データにより表される物体とに基づいて、学習モデル1936を学習(更新)する。
(立体的な線図に基づく検索)
上記の例では、コンピュータ200は、平坦な入力オブジェクトに対してユーザが描く平面的な線図の入力を受け付けるように構成されている。他の局面において、コンピュータ200は、ユーザが描く立体的な線図を検索キーとして受け付けるように構成されてもよい。
図25は、立体的な線図の入力を受け付ける様子を表す視界画像2500である。視界画像2500は、入力オブジェクト2510を含む。図25に示される例において、入力オブジェクト2510は、立方体であって、立方体を構成する各辺が破線で表示されている。
ユーザ190は、ペンオブジェクト2230が関連付けられたハンドオブジェクト810を操作して、入力オブジェクト2510に囲まれる領域に立体的な線図を描くことができる。図25に示される例において、飛行機2520が描かれている。
コンピュータ200は、飛行機2520(3次元の線図)を2次元化する。より具体的には、入力オブジェクト2510を構成する立方体の各平面に飛行機2520を転写する。入力オブジェクト2510は、仮想空間2に設定されている各軸に平行に配置されているとする。係る場合、コンピュータ200は、図26に示されるように、飛行機2520を、XY平面、YZ平面、およびZX平面にそれぞれ転写する。図26(A)は、飛行機2520をXY平面に転写した線図である。図26(B)は、飛行機2520をYZ平面に転写した線図である。図26(C)は、飛行機2520をZX平面に転写した線図である。
コンピュータ200は、得られた2次元の線図データを検索キーとしてサーバ150に送信する。その後の処理は上述の通りであるので、当該処理の説明は、繰り返さない。
上記によれば、ユーザ190は、仮想空間2上に描いた立体的な線図を検索キーとしてコンピュータ200およびサーバ150に入力できる。ある局面において、ユーザ190は、仮想空間2を介して他のユーザと通信する場合がある。係る場合、ユーザ190は、ユーザ190が意図する物体を、サーバ150が入力された線図に基づいて正しく認識できているのか否かを、他のユーザとともにゲーム感覚で楽しむことができる。
[フェイストラッキングデータを検索キーとして用いる]
次に、フェイストラッキングデータ、つまり、ユーザ190の表情を検索キーとして用いる場合の実施形態について説明する。
図27は、フェイストラッキングデータに基づいてパノラマ画像を変更するための処理を表すフローチャートである。なお、図27に示される処理のうち図24の処理と同じ処理については同じ符号を付している。そのため、その処理についての説明は繰り返さない。
ステップS2710にて、コンピュータ200のプロセッサ10は、仮想空間2に展開されているパノラマ画像を変更するためのトリガを受け付けたか否かを判断する。たとえば、プロセッサ10は、コントローラ160に設けられた予め定められたボタンが押下されたことに応じて、上記トリガを受け付ける。
ステップS2720にて、プロセッサ10は、フェイストラッキングデータを取得する。このとき、プロセッサ10は、ユーザ190に今の感情(気分)、またはパノラマ画像を視聴することにより得たい感情を問い合わせてもよい。ユーザ190は、当該問い合わせに応じて表情を作る。第1カメラ116および第2カメラ117は、そのときのユーザ190の顔の画像を生成する。プロセッサ10はフェイストラッキングモジュール228として、入力された顔の画像に基づいてフェイストラッキングデータを生成する。ステップS2730にて、プロセッサ10は、生成されたフェイストラッキングデータを検索キーとしてサーバ150に送信する。
ステップS2740にて、サーバ150のプロセッサ1920は、コンピュータ200からフェイストラッキングデータの入力を受け付ける。ステップS2750にて、プロセッサ1920は、感情判断部1925として、入力されたフェイストラッキングデータが表すユーザ190の感情の候補を特定する。より具体的には、感情判断部1925は、学習モデル1937の各入力層にフェイストラッキングデータを入力し、各出力層から出力された値に基づいて、フェイストラッキングデータが表す感情の候補を特定する。一例として、感情判断部1925は、予め定められた閾値を超える値を出力した出力層に対応する感情を、フェイストラッキングデータが表す感情の候補として特定する。ステップS2760にて、プロセッサ1920は、パノラマ画像DB1934に格納されている複数のパノラマ画像の中から、特定された感情の感情タグを含む一以上のパノラマ画像を検索する。
ステップS2790にて、プロセッサ1920は、学習部1926として、検索キーとして入力されたフェイストラッキングデータと、当該フェイストラッキングデータにより表される感情とに基づいて、学習モデル1937を学習(更新)する。
上記によれば、ユーザ190は、表情を作る(たとえば、笑う)だけで、自身の気分(感情)に合わせたパノラマ画像の候補を受けることができる。また、サーバ150は、ユーザ190の表情(を表すフェイストラッキングデータ)に基づいて、ユーザ190が所望するパノラマ画像の候補をユーザ190に提供できる可能性を高め得る。
なお、上記の例では、サーバ150は、フェイストラッキングデータに基づいてユーザ190の感情を推定するように構成されているが、他の局面において他のデータに基づいてユーザ190の感情を推定するように構成されてもよい。たとえば、サーバ150は、ユーザ190の発話に基づく音声信号をコンピュータ200から受け付け、当該音声信号に基づいてユーザ190の感情を推定してもよい。たとえば、サーバ150は、音声信号から文字列を抽出して、当該文字列から感情を推定する。このような処理は、たとえば、メタデータ社が提供する「感情解析API」により実現され得る。他の局面において、サーバ150は、音声信号の波形から感情を推定する。このような処理は、たとえば、AGI社が提供する「ST Emotion SDK」により実現され得る。なお、これらの処理は、サーバ150ではなくコンピュータ200が実行するように構成されてもよい。係る場合、コンピュータ200は、推定した感情を特定する情報をサーバ150に送信する。
[音声信号から抽出される文字列を検索キーとして用いる]
次に、ユーザ190の発話に対応する音声信号から抽出される文字列を検索キーとして用いる場合の実施形態について説明する。
図28は、ユーザ190が発話により検索キーを入力する様子を表す視界画像2800である。視界画像2800は、机オブジェクト2210を含む。机オブジェクト2210の上には、スピーカオブジェクト2810が配置されている。また、スピーカオブジェクト2810に重畳するようにポインタオブジェクト2820が配置されている。
ポインタオブジェクト2820は、ユーザ190の仮想空間2における視点を表す。プロセッサ10は視線検出モジュール226として、注視センサ140の出力に基づいて現実空間におけるユーザ190の視線を検出する。視線検出モジュール226は、現実空間におけるユーザ190の視線を、仮想カメラ1の位置および傾き(基準視線)に基づいて、仮想空間2における視線に変換する。仮想オブジェクト生成モジュール232は、仮想空間2における視線と、オブジェクトとが衝突する位置にポインタオブジェクト2820を配置する。
ある局面において、ユーザ190は、スピーカオブジェクト2810を選択することで、仮想空間2に展開されているパノラマ画像を変更するためのトリガをコンピュータ200に入力する。一例として、ユーザ190は、ハンドオブジェクト810と、スピーカオブジェクト2810とを接触させることで、スピーカオブジェクト2810を選択する。他の例として、ユーザ190は、スピーカオブジェクト2810を予め定められた時間にわたり注視する、つまり、ポインタオブジェクト2820を予め定められた時間にわたりスピーカオブジェクト2810に重畳することにより、スピーカオブジェクト2810を選択する。
コンピュータ200のプロセッサ10は、ユーザ190に対してトリガが入力されたことを通知する。たとえば、プロセッサ10は、「検索したい内容を話してください」等の、ユーザ190の発話を促す音声またはメッセージを出力する。これに従い、ユーザ190は、検索したい内容を発話する。プロセッサ10は、マイク119から音声信号を受け付け、当該音声信号から文字列を抽出する。一例として、プロセッサ10は、音声信号の先頭から所定時間単位(たとえば、10msec単位)で区切られる波形データと、ストレージ12に格納される音響モデル(図示しない)とを照合して、文字列を抽出する。音響モデルは、母音や子音などの音素ごとの特徴量を表す。一例として、プロセッサ10は、隠れマルコフモデルに基づき、音声信号と音響モデルとを照合する。プロセッサ10は、抽出した文字列をサーバ150に送信する。
サーバ150のプロセッサ1920は、パノラマ画像DB1934に格納されている複数のパノラマ画像の中から、タイトルまたはタグに入力された文字列(または当該文字列に含まれる単語)を含むパノラマ画像を検索する。その後の処理は上述の処理と同じであるので繰り返さない。
上記によれば、ユーザ190は、単に発話するだけで検索キーをコンピュータ200に入力できる。また、現実世界においてスピーカ機能を有するデバイス(たとえば、アマゾンエコー(登録商標))とユーザとの間での音声コミュニケーションが一般的になっている。そのため、ユーザ190は、スピーカの形状を有するスピーカオブジェクトが音声入力および出力機能を有すると容易に想像し得る。なお、他の局面において、スピーカオブジェクトに替えて、マイクの形状を有するマイクオブジェクトが配置されていてもよい。
(制御構造)
図29は、音声信号から抽出される文字列に基づいてパノラマ画像を切り替えるための処理を表すフローチャートである。なお、図29に示される処理のうち図24の処理と同じ処理については同じ符号を付している。そのため、その処理についての説明は繰り返さない。
ステップS2910にて、コンピュータ200のプロセッサ10は、仮想空間2に展開されているパノラマ画像を変更するためのトリガを受け付けたか否かを判断する。たとえば、プロセッサ10は、スピーカオブジェクトがユーザ190に選択された場合に、上記トリガを受け付けて、ステップS2920の処理を実行する。そうでない場合(ステップS2910でNO)、プロセッサ10は、トリガを受け付けるまで待機する。
ステップS2920にて、プロセッサ10は、マイク119からユーザ190の発話に対応する音声信号の入力を受け付ける。ステップS2930にて、プロセッサ10は、音声信号から文字列を抽出し、抽出された文字列を検索キーとしてサーバ150に送信する。なお、他の局面において、プロセッサ10は音声信号をサーバ150に送信し、サーバ150が音声信号から文字列を抽出するように構成されてもよい。
ステップS2940にて、サーバ150のプロセッサ1920は、検索キーとしての文字列をコンピュータ200から受信する。
上記によれば、ユーザ190は、発話するだけで、自身の所望するパノラマ画像の候補を受けることができる。
(他のユーザと連携してパノラマ画像を検索)
上述のように、ユーザ190は、ネットワーク19を介して仮想空間2上で他のユーザとコミュニケーションできる。このとき、ユーザ190と他のユーザは、同じパノラマ画像を視聴している。ある局面において、ユーザ190は、他のユーザと相談しながらパノラマ画像の変更を行ないたいと考え得る。その理由は、ユーザ190が勝手にパノラマ画像22を変更することで、他のユーザが驚くことを抑制するためである。そこで、以下に、複数のユーザの入力に基づいてパノラマ画像を変更する処理について説明する。
図30は、複数のユーザが仮想空間を共有している場合のネットワーク19を説明する図である。図30に示される例において、ネットワーク19にコンピュータ200A、200Bが接続されている。コンピュータ200AはHMDシステム1400Aに含まれ、コンピュータ200BはHMDシステム1400Bに含まれる。HMDシステム1400AおよびHMDシステム1400Bの構成は、上述のHMDシステム1400と同じ構成である。以下、HMDシステム1400Aのユーザをユーザ190A、HMDシステム1400Bのユーザをユーザ190Bとする。また、HMDシステム1400Aに関する各構成要素の参照符号にAが付され、HMDシステム1400Bに関する各構成要素の参照符号にBが付される。
図30に示される例において、コンピュータ200Aによって提供される仮想空間2Aと、コンピュータ200Bによって提供される仮想空間2Bとは同じデータによって構成されている。換言すれば、コンピュータ200Aとコンピュータ200Bとは同じ仮想空間を共有していることになる。仮想空間2Aおよび仮想空間2Bには、ユーザ190Aに対応するアバターオブジェクト3000Aと、ユーザ190Bに対応するアバターオブジェクト3000Bとが存在する。なお、仮想空間2Aにおけるアバターオブジェクト3000Aおよび仮想空間2Bにおけるアバターオブジェクト3000BがそれぞれHMDを装着しているが、これは説明を分かりやすくするためのものであって、実際にはこれらのオブジェクトはHMDを装着していない。
コンピュータ200Aは、アバターオブジェクト3000Aの目の位置に仮想カメラ1Aを配置する。これにより、ユーザ190Aは、仮想空間2Aにおけるアバターオブジェクト3000Aの視界を共有する。コンピュータ200Bは、アバターオブジェクト3000Bの目の位置に仮想カメラ1Bを配置する。これにより、ユーザ190Bは、仮想空間2Bにおけるアバターオブジェクト3000Bの視界を共有する。仮想空間2Aおよび仮想空間2Bにおいて、アバターオブジェクト3000Aとアバターオブジェクト3000Bとは互いに向かい合っている。そのため、ユーザ190Aはユーザ190Bに対応するアバターオブジェクト3000Bを視認し、ユーザ190Bはユーザ190Aに対応するアバターオブジェクト3000Aを視認する。この状態において、ユーザ190Aとユーザ190Bとはコミュニケーションを行なう。
たとえば、コンピュータ200Bは、コントローラ160Bが動いたことを検出すると、コントローラ160Bの動きを表すデータをサーバ150を介してコンピュータ200Aに送信する。コンピュータ200Aは、受信したデータをアバターオブジェクト3000Bの手に反映する。これにより、ユーザ190Aは、アバターオブジェクト3000Bを介してユーザ190Bの動きを認識できる。
図31は、ユーザ190Aが視認する視界画像3100を表す。視界画像3100は、コンピュータ200Aに接続されているモニタ112Aに表示される。視界画像3100は、机オブジェクト2210と、机オブジェクト2210の上に配置されるスピーカオブジェクト2810と、アバターオブジェクト3000Bと、サムネイル群3110とを含む。
ある局面において、ユーザ190Bはスピーカオブジェクト2810を選択した後に「動物」と発話することで検索キーをコンピュータ200Bに入力する。サーバ150は、コンピュータ200Bから入力された検索キーに基づいて検索された複数のパノラマ画像に対応するサムネイル群3110を、検索キーの受信元のコンピュータ200Bと、コンピュータ200Bと仮想空間を共有するコンピュータ200Aとに対して送信する。
コンピュータ200Aは、受信したサムネイル群3110を仮想空間2Aに提示する。これにより、ユーザ190Aは、ユーザ190Bがコンピュータ200Bに入力した検索キーによって検索されたパノラマ画像を表すサムネイル群3110を視認する。
ユーザ190Aは、これらサムネイル群3110が表す複数のパノラマ画像をさらに限定するための検索キーをコンピュータ200Aに入力できる。たとえば、ユーザ190Aは、自身の注視点を表すポインタオブジェクト3120を予め定められた時間にわたりスピーカオブジェクト2810に重畳し、スピーカオブジェクト2810を選択する。その後、ユーザ190Aは、「ねこ」と発話することで検索キーをコンピュータ200Aに入力する。
サーバ150は、コンピュータ200Aから他の検索キーの入力を受け付けると、動物に関する複数のパノラマ画像のなかから、ねこに関する一以上のパノラマ画像を検索する。サーバ150は、検索された一以上のパノラマ画像の各々のサムネイルを生成し、コンピュータ200Aおよび200Bに送信する。
コンピュータ200Aは、サーバ150から新たに一以上のサムネイルを受信すると、現在提示しているサムネイル群3110に替えて、新たに受信した一以上のサムネイルを表示する。コンピュータ200Bもコンピュータ200Aと同様の動作を行なう。
ユーザ190Aまたは190Bのいずれか一方が、仮想空間に提示されている一以上のサムネイルの中から一のサムネイルを選択する。これにより、仮想空間2Aおよび2Bに、選択されたサムネイルに対応するパノラマ画像が展開される。
上記によれば、仮想空間を共有するユーザ190Aおよび190Bは、コミュニケーションを図りながら変更するパノラマ画像を決定できる。
[構成]
以上に開示された技術的特徴は、以下のように要約され得る。
(構成1) HMD110によって仮想空間2を提供するためにコンピュータ200で実行されるプログラムが提供される。このプログラムはコンピュータ200に、複数のパノラマ画像に含まれる一のパノラマ画像を仮想空間2に展開するステップ(ステップS2405)と、HMD110のユーザ190から、仮想空間2に展開されているパノラマ画像を他のパノラマ画像に変更するためのトリガの入力を受け付けるステップ(ステップS2415)と、トリガの入力を受け付けた後に、ユーザ190から検索キーの入力を受け付けるステップ(ステップS2420)と、複数のパノラマ画像の中から、検索キーにより検索された一以上のパノラマ画像を特定するための情報を仮想空間2に提示するステップ(ステップS2460)と、ユーザ190から、一以上のパノラマ画像の中から一のパノラマ画像を選択する入力を受け付けるステップ(ステップS2465)と、選択された一のパノラマ画像を仮想空間2に展開するステップ(ステップS2485)とを実行させる。
上記の例において、サーバ150がパノラマ画像の検索を行なう処理について説明したが、他の実施形態において、コンピュータ200が検索を行なってもよい。例えば、コンピュータ200は、ストレージ12に格納される複数のパノラマ画像の中から、検索キーに基づいて一以上のパノラマ画像を検索してもよい。
上記の例において、コンピュータ200は、パノラマ画像を特定するための情報として、当該パノラマ画像から生成されるサムネイルを仮想空間2に提示する処理を説明したが、他の例として、パノラマ画像に関連付けられるタイトル、タグを仮想空間2に提示してもよい。
上記によれば、コンピュータ200は、ユーザ190に入力された検索キーに関連する一以上のパノラマ画像、換言すれば、ユーザ190が所望するパノラマ画像(を特定する情報)をユーザ190に提示できる。
(構成2) ある実施形態において、上記のプログラムはコンピュータ200に、入力された検索キーと、選択された一のパノラマ画像のパノラマ画像IDとを、コンピュータ200と通信可能なサーバ150に送信するステップ(ステップS2430、ステップS2470)とを実行させる。
(構成3) 上記の検索キーは、ユーザ190が仮想空間2で描いた線図を含む。
上記によれば、ユーザ190は、例えば、興味のある物体の名称を知らない、または忘れた場合であっても、当該物体の線図を仮想空間上で描くことによって、コンピュータ200に当該興味のある物体に関する検索キーを入力できる。
(構成4) ある実施形態において、プログラムはコンピュータ200に、ユーザ190の手の動きを検出するステップをさらに実行させる。上記のユーザ190から検索キーの入力を受け付けるステップは、ユーザ190の手の動きに基づく線図を検索キーとして受け付けることを含む。
ある局面において、コンピュータ200は、コントローラ160の動きをユーザ190の手の動きとして検出する。他の局面において、コンピュータ200は、図示しない赤外線カメラによりユーザ190の手を撮影し、撮影結果に基づいてユーザ190の手の動きを検出してもよい。このような技術は、例えば、Leap Motion社が提供するLeap Motion(登録商標)によって実現され得る。上記によれば、ユーザ190は、仮想空間2上で容易に線図を描くことができる。
(構成5) 上記の検索キーの入力を受け付けるステップは、仮想空間2に配置された入力オブジェクトに対してユーザ190が描いた線図を検索キーとして受け付けることを含む。
(構成6) 上記の検索キーをの入力受け付けるステップは、仮想空間2における予め定められた空間内(例えば、入力オブジェクト2510により囲まれる空間)にユーザ190が形成した立体オブジェクト(例えば、飛行機2520)の入力を受け付けることと、立体オブジェクトを2次元化して得られる線図を検索キーとして受け付けることとを含む。
上記によれば、ユーザ190は、立体的な線図を検索キーとしてコンピュータ200に入力できる。さらに、サーバ150またはコンピュータ200は、平面的な線図よりも情報量の多い立体的な線図に基づいて検索を行なうことが出来るため、ユーザ190が所望するパノラマ画像をユーザ190に提示できる可能性を高め得る。
(構成7) ある実施形態に従うプログラムはコンピュータ200に、ユーザ190の表情を表すフェイストラッキングデータを検出するステップ(ステップS2720)をさらに実行させる。検索キーは、ユーザ190のフェイストラッキングデータを含む。
ある局面において、コンピュータ200は、仮想空間2に仮想的なキーボードを配置し、当該仮想的なキーボードに基づいてユーザ190から検索キーの入力を受け付けることも考えられる。しかしながら、仮想的なキーボードは触感がないため現実空間におけるハードウェアキーボードと使用感が異なる。そのため、ユーザ190は、仮想的なキーボードに対してうまく検索キーを入力できない場合もある。これに対し、ユーザ190は、単に表情を作るだけでコンピュータ200に検索キーを入力できる。
(構成8) 上記の検索キーの入力を受け付けるステップは、ユーザ190の音声の入力を受け付けることと、ユーザ190の音声から抽出された文字列を検索キーとして受け付けることとを含む。
上記によれば、ユーザ190は、単に発話するだけでコンピュータ200に検索キーを入力できる。
(構成9) ある実施形態に従うプログラムはコンピュータ200に、スピーカオブジェクトまたはマイクオブジェクトを仮想空間2に配置するステップをさらに実行させる。トリガの入力を受け付けるステップは、スピーカオブジェクトまたはマイクオブジェクトに対するユーザ190の予め定められた動作をトリガとして受け付けることを含む。
ある局面において、コンピュータ200は、ユーザ190の手の動きに連動するハンドオブジェクトと、スピーカオブジェクトまたはマイクオブジェクトとが接触した場合に、上記トリガの入力を受け付ける。他の局面において、コンピュータ200は、ユーザ190がスピーカオブジェクトまたはマイクオブジェクトを予め定められた時間にわたり見つめたことを検出した場合に、上記トリガの入力を受け付ける。
(構成10) 上記の一以上のパノラマ画像を仮想空間2に提示するステップは、検索キーまたは当該検索キーに基づく情報と、一以上のパノラマ画像とを仮想空間2に提示することを含む。
上記によれば、ユーザ190は、自分で入力した検索キーと、検索キーにより検索されたパノラマ画像(のサムネイル)とを一緒に提示されるため、一以上のパノラマ画像の中から自分が意図したパノラマ動画を正確に選択し得る。その結果、サーバ150またはコンピュータ200は、質の高い学習用データを取得でき、学習効率を高め得る。
検索キーに基づく情報は、検索キーに基づいて検索された複数の内容(物体、感情など)のうちユーザ190が意図する可能性が最も高い内容が、検索キーに対応するか否かをユーザ190に問い合わせる情報であり得る。当該問い合わせに対するユーザ190の回答を得ることで、サーバ150またはコンピュータ200は、質の高い学習用データを取得でき、学習効率を高め得る。
(構成11) ある実施形態において、プログラムはコンピュータ200Aに、コンピュータ200Bのユーザ190Bに対応するアバターオブジェクト3000Bを仮想空間2に配置するステップと、複数のパノラマ画像の中から、コンピュータ200Bのユーザ190がコンピュータ200Bに入力した検索キーにより検索された一以上のパノラマ画像を仮想空間2に提示するステップとをさらに実行させる。
上記によれば、コンピュータ200Aのユーザ190Aは、仮想空間を共有するユーザ190Bが入力した検索キーに対する検索結果を確認できる。これにより、コンピュータ200Aは、ユーザ190Aが意図せずにパノラマ画像が変更された場合に、ユーザ190Aが驚くことを抑制し得る。
(構成12) 上記の検索キーの入力を受け付けるステップは、コンピュータ200Bのユーザ190Bによって入力された検索キーにより検索された一以上のパノラマ画像に対する検索キーの入力を受け付けることを含む。
上記によれば、仮想空間を共有するユーザ190Aおよび190Bは、パノラマ画像を変更する処理において、互いの合意形成を行ないながら、パノラマ画像を変更し得る。
(構成13) ある実施形態に従うと、上記のいずれかに記載のプログラムを格納したストレージ12と、当該プログラムを実行するためのプロセッサ10とを備えるコンピュータ200が提供される。
(構成14) ある実施形態に従うと、HMD110によって仮想空間2を提供するためにコンピュータ200で実行される方法が提供される。この方法は、複数のパノラマ画像に含まれる一のパノラマ画像を仮想空間2に展開するステップ(ステップS2405)と、HMD110のユーザ190から、仮想空間2に展開されているパノラマ画像を他のパノラマ画像に変更するためのトリガの入力を受け付けるステップ(ステップS2415)と、トリガの入力を受け付けた後に、ユーザ190から検索キーの入力を受け付けるステップ(ステップS2420)と、複数のパノラマ画像の中から、検索キーにより検索された一以上のパノラマ画像を特定するための情報を仮想空間2に提示するステップ(ステップS2460)と、ユーザ190から、一以上のパノラマ画像の中から一のパノラマ画像を選択する入力を受け付けるステップ(ステップS2465)と、選択された一のパノラマ画像を仮想空間2に展開するステップ(ステップS2485)とを備える。
(構成15) ある実施形態において、HMD110に仮想空間2を提供するコンピュータ200と通信可能なサーバ150によって実行されるプログラムが提供される。このプログラムはサーバ150に、HMD110のモニタ112に展開されるパノラマ画像を変更するための検索キーの入力をコンピュータ200から受け付けるステップ(ステップS2435)と、サーバ150のストレージ1930のパノラマ画像DB1934に格納される複数のパノラマ画像の中から、検索キーに基づいて一以上のパノラマ画像を検索するステップ(ステップS2445)と、検索した一以上のパノラマ画像を特定するための情報(例えば、サムネイル)をコンピュータ200に送信するステップ(ステップS2450)と、一以上のパノラマ画像の中から選択された一のパノラマ画像のパノラマ画像IDの入力をコンピュータ200から受け付けるステップ(ステップS2475)と、パノラマ画像の識別情報と検索キーとに基づいて、検索のための学習を行なうステップ(ステップS2490)とを実行させる。
上記によれば、サーバ150は、検索キーに従い、コンピュータ200のユーザ190が所望するパノラマ画像の候補をユーザ190に提供できる。また、サーバ150は、検索キーと、ユーザ190に選択されたパノラマ画像に関連づけられた情報(例えば、タグ、タイトル)とに基づいて学習を行なうことにより、入力された検索キーに対してユーザ190が所望するパノラマ画像をユーザ190に提供できる可能性を高め得る。
(構成16) 上記の検索するステップは、検索キーから文字列を検出することと、パノラマ画像DB1934に格納される複数のパノラマ画像の中から、検出された文字列が関連付けられた一以上のパノラマ画像を検索することとを含む。
(構成17) 上記の検索キーは、コンピュータ200のユーザ190のフェイストラッキングデータを含む。上記の検索するステップは、ユーザ190のフェイストラッキングデータからユーザ190の感情を推測することと、推測された感情に基づいて一以上のパノラマ画像を検索することとを含む。
(構成18) ある実施形態に従うと、(構成15)〜(構成17)のいずれかに記載のプログラムを格納したストレージ1930と、当該プログラムを実行するためのプロセッサ1920とを備えるサーバ150が提供される。
(構成19) ある実施形態に従うと、HMD110に仮想空間2を提供するコンピュータ200と通信可能なサーバ150によって実行される方法が提供される。この方法は、HMD110のモニタ112に展開されるパノラマ画像を変更するための検索キーの入力をコンピュータ200から受け付けるステップ(ステップS2435)と、サーバ150のストレージ1930のパノラマ画像DB1934に格納される複数のパノラマ画像の中から、検索キーに基づいて一以上のパノラマ画像を検索するステップ(ステップS2445)と、検索した一以上のパノラマ画像を特定するための情報(例えば、サムネイル)をコンピュータ200に送信するステップ(ステップS2450)と、一以上のパノラマ画像の中から選択された一のパノラマ画像のパノラマ画像IDの入力をコンピュータ200から受け付けるステップ(ステップS2475)と、パノラマ画像の識別情報と検索キーとに基づいて、検索のための学習を行なうステップ(ステップS2490)とを備える。
今回開示された実施の形態はすべての点で例示であって制限的なものではないと考えられるべきである。本発明の範囲は上記した説明ではなくて特許請求の範囲によって示され、特許請求の範囲と均等の意味および範囲内でのすべての変更が含まれることが意図される。
1 仮想カメラ、2 仮想空間、5 基準視線、10,1920 プロセッサ、11 メモリ、12,1930 ストレージ、19 ネットワーク、22 パノラマ画像、100,1400 HMDシステム、112 モニタ、114 センサ、115 スピーカ、116 第1カメラ、117 第2カメラ、119 マイク、120 HMDセンサ、130 モーションセンサ、140 注視センサ、150 サーバ、160 コントローラ、190 ユーザ、200 コンピュータ、220 表示制御モジュール、221 仮想カメラ制御モジュール、222 視界領域決定モジュール、223 視界画像生成モジュール、224 基準視線特定モジュール、225 音声制御モジュール、226 視線検出モジュール、227 ハンドトラッキングモジュール、228 フェイストラッキングモジュール、230 仮想空間制御モジュール、231 仮想空間定義モジュール、232 仮想オブジェクト生成モジュール、233 手オブジェクト制御モジュール、240 メモリモジュール、241 空間情報、242 オブジェクト情報、243 ユーザ情報、244 顔情報、810 ハンドオブジェクト1120,2810 スピーカオブジェクト、1130 検索キー、1140,1210,1260,2320,2350 サムネイル、1200,2200,2300,2500,2800,3100 視界画像、1923 検索エンジン、1924 物体特定部、1925 感情判断部、1926 学習部、1934 パノラマ画像DB、1935 学習用DB、1936,1937 学習モデル、2220,2510 入力オブジェクト、2230 ペンオブジェクト、2240 メッセージオブジェクト、2250 軌跡オブジェクト、2310 スクリーン、2520 飛行機、2820,3120 ポインタオブジェクト、3000A,3000B アバターオブジェクト。

Claims (13)

  1. 複数のユーザが共有する仮想空間をヘッドマウントデバイスによって提供するためにコンピュータで実行されるプログラムであって、前記プログラムは前記コンピュータに、
    他のコンピュータとネットワークを介して通信するステップと、
    予め定められた複数のパノラマ画像に含まれる一のパノラマ画像を、前記他のコンピュータと共有する仮想空間に展開するステップと、
    前記仮想空間に、前記コンピュータを操作し、前記ヘッドマウントデバイスの第1のユーザに対応する第1のアバターオブジェクトと、前記コンピュータと通信する前記他のコンピュータを操作する第2のユーザに対応する第2のアバターオブジェクトとを配置するステップと、
    前記第1のユーザの身体の動きを検出するステップと、
    前記第2のユーザの身体の動きを、前記ネットワークを介して取得するステップと、
    前記第1のユーザの動きが検出されることに応答して、前記仮想空間において前記第1のアバターオブジェクトを動かすステップと、
    前記第2のユーザの動きが取得されることに応答して、前記仮想空間において前記第2のアバターオブジェクトを動かすステップと、
    前記第1のユーザから、前記仮想空間に展開されているパノラマ画像を他のパノラマ画像に変更するためのトリガの入力を受け付けるステップと、
    前記トリガの入力を受け付けた後に、前記第1のユーザから検索キーの入力を受け付けるステップと、
    前記複数のパノラマ画像の中から、前記検索キーにより検索された一以上のパノラマ画像を特定するための情報を含む表示用オブジェクトを、前記コンピュータおよび前記他のコンピュータにより共有される前記仮想空間に提示するステップと、
    前記表示用オブジェクトに含まれる前記検索された一以上のパノラマ画像を特定するための情報に対し、前記第1のユーザが動かす前記第1のアバターオブジェクトの動き、および、前記第2のユーザが動かす前記第2のアバターオブジェクトの動きに応答して、前記一以上のパノラマ画像の中から一のパノラマ画像を選択する入力を受け付けるステップと、
    前記選択された一のパノラマ画像を、前記共有される前記仮想空間に展開するステップとを実行させる、プログラム。
  2. 前記プログラムは前記コンピュータに、前記入力された検索キーと、前記選択された一のパノラマ画像の識別情報とを、前記コンピュータと通信可能な情報処理端末に送信するステップとを実行させる、請求項1に記載のプログラム。
  3. 前記検索キーは、前記ユーザが前記仮想空間で描いた線図を含む、請求項1または2に記載のプログラム。
  4. 前記プログラムは前記コンピュータに、前記ユーザの手の動きを検出するステップをさらに実行させ、
    前記ユーザから検索キーの入力を受け付けるステップは、前記ユーザの手の動きに基づく線図を前記検索キーとして受け付けることを含む、請求項3に記載のプログラム。
  5. 前記検索キーの入力を受け付けるステップは、前記仮想空間に配置された予め定められたオブジェクトに対して前記ユーザが描いた線図を前記検索キーとして受け付けることを含む、請求項3または4に記載のプログラム。
  6. 前記検索キーをの入力受け付けるステップは、
    前記仮想空間における予め定められた空間内に前記ユーザが形成した立体オブジェクトの入力を受け付けることと、
    前記立体オブジェクトを2次元化して得られる線図を前記検索キーとして受け付けることとを含む、請求項3または4に記載のプログラム。
  7. 前記プログラムは前記コンピュータに、前記ユーザの表情を表すデータを検出するステップをさらに実行させ、
    前記検索キーは、前記ユーザの表情を表すデータを含む、請求項1または2に記載のプログラム。
  8. 前記検索キーの入力を受け付けるステップは、
    前記ユーザの音声の入力を受け付けることと、
    前記ユーザの音声から抽出された文字列を前記検索キーとして受け付けることとを含む、請求項1または2に記載のプログラム。
  9. 前記プログラムは前記コンピュータに、スピーカオブジェクトまたはマイクオブジェクトを前記仮想空間に配置するステップをさらに実行させ、
    前記トリガの入力を受け付けるステップは、前記スピーカオブジェクトまたは前記マイクオブジェクトに対する前記ユーザの予め定められた動作を前記トリガとして受け付けることを含む、請求項8に記載のプログラム。
  10. 前記一以上のパノラマ画像を前記仮想空間に提示するステップは、前記検索キーまたは当該検索キーに基づく情報と、前記一以上のパノラマ画像とを前記仮想空間に提示することを含む、請求項1〜9のいずれか1項に記載のプログラム。
  11. 前記検索キーの入力を受け付けるステップは、前記他のコンピュータのユーザによって入力された検索キーにより検索された一以上のパノラマ画像に対する検索キーの入力を受け付けることを含む、請求項1に記載のプログラム。
  12. 請求項1〜11のいずれか1項に記載のプログラムを格納したメモリと、
    前記プログラムを実行するためのプロセッサとを備える、情報処理装置。
  13. 複数のユーザが共有する仮想空間をヘッドマウントデバイスによって提供するためにコンピュータで実行される方法であって、
    他のコンピュータとネットワークを介して通信するステップと、
    予め定められた複数のパノラマ画像に含まれる一のパノラマ画像を、前記他のコンピュータと共有する仮想空間に展開するステップと、
    前記仮想空間に、前記コンピュータを操作し、前記ヘッドマウントデバイスの第1のユーザに対応する第1のアバターオブジェクトと、前記コンピュータと通信する前記他のコンピュータを操作する第2のユーザに対応する第2のアバターオブジェクトとを配置するステップと、
    前記第1のユーザの身体の動きを検出するステップと、
    前記第2のユーザの身体の動きを、前記ネットワークを介して取得するステップと、
    前記第1のユーザの動きが検出されることに応答して、前記仮想空間において前記第1のアバターオブジェクトを動かすステップと、
    前記第2のユーザの動きが取得されることに応答して、前記仮想空間において前記第2のアバターオブジェクトを動かすステップと、
    前記第1のユーザから、前記仮想空間に展開されているパノラマ画像を他のパノラマ画像に変更するためのトリガの入力を受け付けるステップと、
    前記トリガの入力を受け付けた後に、前記第1のユーザから検索キーの入力を受け付けるステップと、
    前記複数のパノラマ画像の中から、前記検索キーにより検索された一以上のパノラマ画像を特定するための情報を含む表示用オブジェクトを、前記コンピュータおよび前記他のコンピュータにより共有される前記仮想空間に提示するステップと、
    前記表示用オブジェクトに含まれる前記検索された一以上のパノラマ画像を特定するための情報に対し、前記第1のユーザが動かす前記第1のアバターオブジェクトの動き、および、前記第2のユーザが動かす前記第2のアバターオブジェクトの動きに応答して、前記一以上のパノラマ画像の中から一のパノラマ画像を選択する入力を受け付けるステップと、
    前記選択された一のパノラマ画像を、前記共有される前記仮想空間に展開するステップと、
    前記入力された検索キーと、前記選択された一のパノラマ画像の識別情報とを、前記コンピュータと通信可能な情報処理端末に送信するステップとを備える、方法。
JP2017169613A 2017-09-04 2017-09-04 仮想空間を提供するためにコンピュータで実行されるプログラム、方法、および当該プログラムを実行するための情報処理装置 Active JP6495399B2 (ja)

Priority Applications (2)

Application Number Priority Date Filing Date Title
JP2017169613A JP6495399B2 (ja) 2017-09-04 2017-09-04 仮想空間を提供するためにコンピュータで実行されるプログラム、方法、および当該プログラムを実行するための情報処理装置
JP2019040931A JP6911070B2 (ja) 2017-09-04 2019-03-06 仮想空間を提供するためにコンピュータで実行されるプログラム、方法、および当該プログラムを実行するための情報処理装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017169613A JP6495399B2 (ja) 2017-09-04 2017-09-04 仮想空間を提供するためにコンピュータで実行されるプログラム、方法、および当該プログラムを実行するための情報処理装置

Related Child Applications (1)

Application Number Title Priority Date Filing Date
JP2019040931A Division JP6911070B2 (ja) 2017-09-04 2019-03-06 仮想空間を提供するためにコンピュータで実行されるプログラム、方法、および当該プログラムを実行するための情報処理装置

Publications (2)

Publication Number Publication Date
JP2019046250A JP2019046250A (ja) 2019-03-22
JP6495399B2 true JP6495399B2 (ja) 2019-04-03

Family

ID=65812941

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017169613A Active JP6495399B2 (ja) 2017-09-04 2017-09-04 仮想空間を提供するためにコンピュータで実行されるプログラム、方法、および当該プログラムを実行するための情報処理装置

Country Status (1)

Country Link
JP (1) JP6495399B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP7438786B2 (ja) 2020-02-25 2024-02-27 株式会社コロプラ プログラム、情報処理方法、及び情報処理装置
WO2023210164A1 (ja) * 2022-04-26 2023-11-02 住友電気工業株式会社 アニメーション操作方法、アニメーション操作プログラム及びアニメーション操作システム

Family Cites Families (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH05314240A (ja) * 1992-05-11 1993-11-26 Sony Corp 三次元形状データ表示方法
JPH0785084A (ja) * 1993-09-10 1995-03-31 Toshiba Corp 画像記憶システムおよび画像検索システム
JP2001262416A (ja) * 2000-03-16 2001-09-26 Toyobo Co Ltd 衣服の型紙作成システム
JP2004199159A (ja) * 2002-12-16 2004-07-15 Canon Inc 情報処理方法、情報処理装置、プログラムおよび記憶媒体
JP4367663B2 (ja) * 2007-04-10 2009-11-18 ソニー株式会社 画像処理装置、画像処理方法、プログラム
JP2009266005A (ja) * 2008-04-25 2009-11-12 Clarion Co Ltd 画像検索方法、画像検索プログラム、楽曲再生装置、および楽曲検索用物品
JP5104743B2 (ja) * 2008-12-16 2012-12-19 富士通株式会社 画像検索プログラム、画像検索方法及び記録媒体
JP2013055606A (ja) * 2011-09-06 2013-03-21 Nikon Corp 画像表示システム、画像表示装置、及びプログラム
JP2015007986A (ja) * 2014-07-25 2015-01-15 京セラ株式会社 電子機器、電子機器制御用プログラム、及び電子機器の制御方法

Also Published As

Publication number Publication date
JP2019046250A (ja) 2019-03-22

Similar Documents

Publication Publication Date Title
JP6244593B1 (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるためのプログラム
US10341612B2 (en) Method for providing virtual space, and system for executing the method
JP6263252B1 (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるためのプログラム
US10453248B2 (en) Method of providing virtual space and system for executing the same
US10545339B2 (en) Information processing method and information processing system
JP6290467B1 (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるプログラム
US20190026950A1 (en) Program executed on a computer for providing virtual space, method and information processing apparatus for executing the program
US10894211B2 (en) Information processing method, apparatus, and system for executing the information processing method
US20190005732A1 (en) Program for providing virtual space with head mount display, and method and information processing apparatus for executing the program
JP6257826B1 (ja) 仮想空間を提供するためにコンピュータで実行される方法、プログラム、および、情報処理装置
JP6201028B1 (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるためのプログラム
JP6298523B1 (ja) 仮想空間を介して通信するためにコンピュータによって実行される方法、当該方法をコンピュータに実行させるためのプログラム、およびコンピュータ装置
JP7394158B2 (ja) ヘッドマウントデバイスを介して仮想空間を提供するためにコンピュータで実行されるプログラムおよび方法ならびに情報処理装置
JP2018125003A (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるプログラム
JP2018124981A (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるためのプログラム
JP6495399B2 (ja) 仮想空間を提供するためにコンピュータで実行されるプログラム、方法、および当該プログラムを実行するための情報処理装置
JP6225242B1 (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるプログラム
JP2019030638A (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるためのプログラム
JP2018092635A (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるためのプログラム
JP2018190390A (ja) 仮想空間を提供するための方法、および当該方法をコンピュータに実行させるためのプログラム、および当該プログラムを実行するための情報処理装置
JP2018206340A (ja) 仮想空間を提供するためにコンピュータで実行される方法、プログラム、および、情報処理装置
JP2018092592A (ja) 情報処理方法、装置、および当該情報処理方法をコンピュータに実行させるためのプログラム
JP6911070B2 (ja) 仮想空間を提供するためにコンピュータで実行されるプログラム、方法、および当該プログラムを実行するための情報処理装置
JP6321247B1 (ja) 仮想空間を移動するためにコンピュータで実行される方法、当該方法をコンピュータに実行させるプログラムおよび情報処理装置
JP2018109937A (ja) 情報処理方法、装置、情報処理システム、および当該情報処理方法をコンピュータに実行させるプログラム

Legal Events

Date Code Title Description
TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20190206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20190306

R150 Certificate of patent or registration of utility model

Ref document number: 6495399

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

R250 Receipt of annual fees

Free format text: JAPANESE INTERMEDIATE CODE: R250