WO2023276252A1

WO2023276252A1 - 情報処理装置、情報処理方法及びプログラム

Info

Publication number: WO2023276252A1
Application number: PCT/JP2022/006694
Authority: WO
Inventors: 澄美伊藤
Original assignee: ソニーグループ株式会社
Priority date: 2021-06-30
Filing date: 2022-02-18
Publication date: 2023-01-05
Also published as: CN117546458A; JPWO2023276252A1; EP4366293A1

Abstract

［課題］仮想空間を介して演者と観客との自然なインタラクションを実現する。［解決手段］本開示の情報処理装置は、少なくとも１つの仮想空間に配置された観客アバタ群を表す画像を、前記仮想空間に配置された演者アバタに対応する演者が視認可能な表示領域に提示する提示部と、前記表示領域に提示された前記画像に表される前記観客アバタ群に対する前記演者の動作に基づき、前記少なくとも１つの仮想空間における前記演者アバタを制御する制御部と、を備える。

Description

情報処理装置、情報処理方法及びプログラム

　本開示は、情報処理装置、情報処理方法及びプログラムに関する。

　多人数が同時アクセスできる仮想空間上でのバーチャルライブでは、アーティスト（演者）と視聴者が同じ場所にいない状況でのライブが可能である。仮想空間上でのライブでは、観客を表す観客アバタと、アーティストを表すアバタ（演者アバタ）が仮想空間に配置され、観客は仮想空間に配置された演者アバタをアーティストとして認識する。演者アバタは、スタジオなどにいるアーティストの実際の動きに同期して動作させられる。このような仮想空間上のバーチャルライブでは同時に単一会場でのライブのみならず、複数会場での同時ライブも可能である。

　現状、アーティストと視聴者が同じ場所にいない形式のライブでは、以下のようなアーティスト－ユーザ間インタラクションがある。例えば、ライブビューイングでは、配信用カメラに向かってアーティストが手を振るようなファンサービスが行われる。また端末への配信ライブでは、観客がコメントを記入してそれをアーティストが読む形のインタラクションがある。

　仮想空間上のバーチャルライブでは、アーティストと観客とが同じ空間を共有できるため、この利点を活かし、アーティストが各会場のユーザの様子（ユーザアバタの様子）を見て反応し、アーティストと観客との自然なインタラクションが実現する仕組みがあるとよい。

特開２０１８－３７０９２号公報特開２０２０－０４２５７５号公報特開２０１４－１２３３７６号公報

　本開示は、上述したような問題点に鑑みてなされたものであり、仮想空間を介して演者と観客との自然なインタラクションを実現することを目的とする。

　本開示の情報処理装置は、少なくとも１つの仮想空間に配置された観客アバタ群を表す画像を、前記仮想空間に配置された演者アバタに対応する演者が視認可能な表示領域に提示する提示部と、前記表示領域に提示された前記画像に表される前記観客アバタ群に対する前記演者の動作に基づき、前記少なくとも１つの仮想空間における前記演者アバタを制御する制御部と、を備える。

　本開示の情報処理方法は、少なくとも１つの仮想空間に配置された観客アバタ群を表す画像を、前記仮想空間に配置された演者アバタに対応する演者が視認可能な表示領域に提示し、前記表示領域に提示された前記画像に表される観客アバタ群に対する前記演者の動作に基づき、前記少なくとも１つの仮想空間における前記演者アバタを制御する。

　本開示のコンピュータプログラムは、少なくとも１つの仮想空間に配置された観客アバタ群を表す画像を、前記仮想空間に配置された演者アバタに対応する演者が視認可能な表示領域に提示するステップと、前記表示領域に提示された前記画像に表される前記観客アバタ群に対する前記演者の動作に基づき、前記少なくとも１つの仮想空間における前記演者アバタを制御するステップとをコンピュータに実行させる。

本開示に係る情報処理装置のブロック図。演者の動きを取得するシステムの図。取得した動きからコンテンツを作成するモデリングの図。演者アバタを表示する表示方法の一例の図。本開示の実施形態に係る提示部の一例を示す図。仮想空間の客席の展開の様子を示す図。演者の動きを演者アバタが反映する様子を示す図。演者および演者アバタがインタラクション動作をする図。客席からみた演者アバタの図。仮想空間における観客アバタの位置関係および見え方について示した図。仮想空間の観客アバタに対してインタラクション動作をする演者を示す図。インタラクション動作の対象となっていない仮想空間の観客アバタからみた演者アバタを示す図。本開示の実施形態に係る情報処理装置の処理の流れの一例を説明するフローチャート。本開示の実施形態に係る情報処理装置のモーション編集処理の流れの一例を説明するフローチャート。図１４の変形例を説明するフローチャート。仮想空間の属性に応じて演者アバタのモーションを編集する処理の流れを説明するフローチャート。本開示の実施形態に係る提示部の変形例の一例を示す図。本開示の実施形態に係るＨＭＤによる提示部の変形例の一例を示す図。図１８に仮想空間の表示の一例を示す図。本開示の情報処理装置の一連の処理をプログラムにより実行するコンピュータのハードウエアの構成の一例を示す図。

　図１は、本開示の実施形態に係る情報処理システム１００のブロック図である。情報処理システム１００は、本実施形態に係る情報処理装置としての演者側装置３００と、観客側装置４００とを含む。

　演者側装置３００（情報処理装置）は、モーション取得部３１０と、視線取得部３２０と、第１位置関係計算部３３０と、第２位置関係計算部３４０と、モーション編集部３５０と、映像データ生成部３６０と、データ配信部３７０と、データ受信部３８０と、観客映像合成部３９０と、提示部２００とを備える。本実施形態に係る制御部は、モーション取得部３１０と、視線取得部３２０と、第１位置関係計算部３３０と、第２位置関係計算部３４０と、モーション編集部３５０と、映像データ生成部３６０と、データ配信部３７０と、データ受信部３８０と、観客映像合成部３９０のうちの少なくとも１つの機能を有する。

　観客側装置４００は、データ受信部４１０と、観客提示部４２０と、観客映像生成部４３０と、観客側送信部４４０と、を備える。観客側装置４００は１台のみ示されるが、実際には、観客の人数、観客グループの数又は仮想空間の数などに応じて、複数存在する。例えば、観客ごとに観客側装置４００が存在してよい。

　本実施形態は、仮想空間である会場に演者に対応する演者アバタと、観客に対応する観客アバタとを配置し、演者アバタがライブパフォーマンスを行う状況において演者と観客との自然なインタラクションを実現させる。ここで、演者アバタとは、仮想空間に配置され、演者の動きを反映させるオブジェクトである。以下、仮想空間および演者アバタについて説明する。

（仮想空間）
　本開示の実施形態の仮想空間では、ライブを行う会場が設置され、会場には、演者アバタ、観客アバタの集合体である観客アバタ群、演者アバタがパフォーマンスをする舞台である舞台、各観客アバタが舞台上の演者アバタを見る客席などが配置されている。

　仮想空間は１つ又は複数設けられ、仮想空間ごとに会場が設置される。仮想空間ごとに属性情報を設定してもよい。仮想空間の属性情報は、例えば、仮想空間に配置される観客アバタ群の属性（観客群の使用言語又は居住地等）でもよい。仮想空間では、仮想空間の属性情報に応じたサービス又は動作が行われてもよい。例えば演者の発した言語が、仮想空間の属性情報が示す言語に変換されてもよい。また観客は、自身が希望する属性情報を有する仮想空間を選択し、選択した仮想空間のライブに参加してもよい。

　（演者アバタ）
　図２は、演者１０の動き（モーション）を撮影し、３次元モデルを生成するための撮影環境を示す図である。図３は、取得したモーションから３次元モデル１２を作成するモデリングを説明する図である。図４は、作成した３次元モデル１２を演者アバタ１１として表示する一例の図である。

　図２において、演者１０は撮影環境においてライブのパフォーマンスを行う。カメラ３２１は演者１０を一定のサンプリングレートで撮像する。カメラ３２１は、単数であってもよいし、演者を様々な角度から撮像するために、図２のように複数でもよい。なお、演者１０の前方又は周囲等には仮想空間における観客アバタ群の画像を表示する表示部（図１の提示部２００）が配置されている。これにより、演者１０は各会場の観客アバタ群の状況を見ながらパフォーマンスを行うことができる。なお図２の撮影環境においてマイクを配置し（例えば演者１０にマイクを持たせ）、演者１０の音声を一定のサンプリングレートで収集してもよい。

　次に、カメラ３２１で取得した画像データの集合体から、３次元データ化したオブジェクトを図３のように３次元モデル１２として生成する。３次元モデルの生成には、例えばＶｉｓｕａｌ　Ｈｕｌｌ法等を用いることができる。

　次に生成した３次元モデル１２を任意の視点でレンダリングすることで、図４に示すように、観客側のデバイス（観客提示部４２０）に演者アバタ１１が表示されることができる。演者アバタ１１は、３次元モデル１２を映像データとしてレンダリングすることにより観客側のデバイスに送信されてもよい。モーションデータを観客側のデバイスに送信し、観客側のデバイスで演者アバタ１１をレンダリングしてもよい。演者アバタ１１は、図４（ａ）のようにディスプレイ４０１で再生または、図４（ｂ）のようにヘッドマウントディスプレイ４０２で再生されることができる。これにより演者アバタ１１が観客アバタに対応する観客に提示される。図４（ａ）のディスプレイ４０１は単一の観客、又は複数の観客（観客グループ）により視聴可能である。図４（ｂ）のヘッドマウントディスプレイ４０２の場合、観客ごとにヘッドマウントディスプレイ４０２が設けられる。なお、演者の音声をマイクで収集する場合、演者アバタ１１のレンダリングデータ又はモーションデータとともに、音声データも観客側のデバイスに送信して、演者アバタ１１の動きと同期して音声を出力させる。

　以下、図１の情報処理システム１００について詳細に説明する。
　観客側装置４００は、観客ごとの視聴デバイスである場合、観客群（観客グループ）に共通の視聴デバイスである場合のいずれもあり得る。視聴デバイスはＨＭＤ、モニタ、ＴＶ、ＰＣなど何でもよい。以下では、観客側装置４００は観客ごとの視聴デバイスである場合を想定して説明する。但し、仮想空間ごとに観客群が同時に同一のディスプレイを視聴する状況では、観客側装置４００が仮想空間ごとに、観客群に共通に１つ設けられてもよい。
　観客映像生成部４３０は、仮想空間における観客アバタを表す映像（画像）を生成する。観客映像生成部４３０、観客アバタを表す映像として、例えば、観客側装置４００を視聴する観客自身の体の一部（例えば顔）を撮影した映像を、観客アバタを表す映像としてもよい。あるいは、観客映像生成部４３０は、仮想空間上での観客アバタをレンダリングすることにより、観客アバタを表す映像を生成してもよい。観客アバタを表す映像は，例えば、仮想空間において演者アバタの位置へ向けて観客の視点（仮想空間における仮想カメラの視点）を置いたものである。つまり、演者アバタから見える観客アバタの映像を生成する。このように観客アバタを表す映像（画像）は、観客自身の画像でもよいし、観客アバタ（観客が選択したキャラクタ）の画像でもよい。

　観客側送信部４４０は、観客映像生成部４３０で生成された観客アバタを表す映像（画像）を演者側装置３００に送信する。演者側装置３００のデータ受信部３８０は、各観客側装置４００から観客アバタを表す映像を受信する。観客側送信部４４０は、演者側装置３００と有線又は無線のネットワークを介して接続されている。有線又は無線のネットワークは、インターネット、セルラー通信ネットワーク、又は無線ＬＡＮ（Local Area Network）等を含む。

　演者側装置３００における観客映像合成部３９０は、データ受信部３８０で受信された観客アバタを表す映像（画像）を合成し、合成した映像（画像）を提示部２００に表示させる。

　提示部２００は、観客映像合成部３９０により合成された映像を、演者が視認可能な表示領域に表示する。これにより各仮想空間における観客アバタを表す映像（例えば観客アバタに対応する観客を撮像した映像又は観客が選択したキャラクタの映像）が、演者に視認可能に表示される。提示部２００は、例えば、スタジオ内の演者１０の前方に配置されている。提示部２００は一例として液晶表示装置、有機ＥＬ表示装置などの表示装置であり、この場合は、表示領域は表示装置の画面である。提示部２００は複数の表示領域に対応する複数のディスプレイを備えていてもよいし、１つのディスプレイの表示領域を複数に区切ってもよい。提示部２００は実際の空間に画像を表示する装置（空間画像表示装置）でもよく、この場合、表示領域は画像が表示される空間の一部の領域である。また提示部２００は、映像をスクリーンに投影するプロジェクターでもよく、この場合、表示領域はプロジェクターの映像が投影される投影領域である。

　図５は、提示部２００により提示（表示）された観客アバタ群の一例を示す。図５の例では、４つの仮想空間（それぞれ仮想空間５００＿１、５００＿２、５００＿３、５００＿４とする）で同時にライブが行われる状況を想定している。各仮想空間における会場の観客アバタ群がそれぞれ異なる表示領域に表示されている。より詳細には以下の通りである。

　図５に示す提示部２００は、４つのタイル状の表示領域を有し、各表示領域は４つの仮想空間のそれぞれに対応する。各表示領域には、仮想空間における観客アバタ群を含む長方形の映像が表示される。右上の表示領域に仮想空間５００＿１に対応する観客アバタ群５１０＿１、左上の表示領域に仮想空間５００＿２に対応する観客アバタ群５１０＿２、右下の表示領域に仮想空間５００＿３に対応する観客アバタ群５１０＿３、左下の表示領域に仮想空間５００＿４に対応する観客アバタ群５１０＿４が表示されている。

　実際の物理空間に存在する（例えば撮影スタジオに存在する）演者１０は、各表示領域に提示された観客アバタ群５１０＿１～５１０＿４の画像を通じて、観客アバタ群５１０＿１～５１０＿４に対応する観客群を認識することができる。以下の説明で、任意の観客アバタ又は観客アバタ群を観客アバタ５１０又は観客アバタ群５１０と記載する場合がある。

　観客映像合成部３９０が仮想空間ごとに観客アバタを表す映像（画像）を合成する方法は任意でよい。例えば、仮想空間における観客アバタの映像を、仮想空間に対応する表示領域内のランダムな位置に配置してもよい。仮想空間における観客アバタの相対的な位置関係を維持したたま長方形の表示領域に観客アバタの映像を、圧縮して表示してもよい。また以下に説明する図６に示す方法で合成してもよい。

　図６は、合成方法の例を示す図である。４つの仮想空間５００（５００＿１、５００＿２、５００＿３、５００＿４）において、舞台５２０（５２０＿１、５２０＿２、５２０＿３、５２０＿４）と、客席５３０（５３０＿１、５３０＿２、５３０＿３、５３０＿４）が設けられている。舞台５２０上の演者アバタ及び客席の観客アバタの図示は省略されている。この場合に、客席５３０（５３０＿１、５３０＿２、５３０＿３、５３０＿４）を、図６のように適当な位置で切り、長方形５３１＿１、５３１＿２、５３１＿３、５３１＿４に展開できる。長方形に含まれる各観客アバタの位置に応じて、仮想空間に対応する表示領域に、観客アバタを表す映像を配置することで、観客アバタを表す映像の合成を行う。

　視線取得部３２０は、提示部２００の表示領域を視認している演者１０の視線情報を取得する。視線情報を取得する方法として、演者の目元を撮影するカメラと、予め用意された目の複数の画像とのマッチングに基づいて、視線の方向を特定してもよい。または、提示部２１０がＨＭＤの表示部の場合に、ＨＭＤの表示部に提示される画像の中心を視線の方向とみなしてもよい。

　視線取得部３２０は、取得した視線情報に基づき、演者１０がどの観客アバタ又はどの観客アバタ群を注視しているかを検出する。例えば４つの仮想空間に含まれる４つの観客アバタ群がそれぞれの表示領域に提示されている場合、どの観客アバタ群、あるいは、どの観客アバタ群のうちのどの観客アバタを演者１０が注視しているかを検出する。注視する観客アバタは１つ又は複数でもよい。注視する観客アバタ群は１つ又は複数でもよい。あるいは、視線取得部３２０は、４つの仮想空間のうちどの仮想空間を注視しているかを検出してもよい。演者が注視する観客アバタ群が複数の仮想空間にまたがっていてもよい。演者が注視する少なくとも１つの観客アバタは本開示に係る第１観客アバタに対応する。

　視線取得部３２０は、演者が注視している観客アバタ又は観客アバタ群を特定する情報（注視観客情報）をモーション編集部３５０及び提示部２００に提供する。視線取得部３２０は、演者１０の視線情報をモーション編集部３５０に提供してもよい。

　提示部２００は、視線取得部３２０から演者１０が注視している観客アバタ又は観客アバタ群を示す情報（注視観客情報）を取得し、表示領域において、注視されている観客又は観客群を強調して表示してもよい。例えば、注視されている観客又は観客群の色を変更、し、観客又は観客群を太い線で囲ってもよい（後述する図８参照）。あるいは、注視されていない観客（非注視観客群）をぼかして表示してもよい。

　演者側装置３００におけるモーション取得部３１０は、演者の動き情報（モーション情報）を取得する。モーション情報は、演者の位置情報も含む。例えばモーション取得部３１０は、カメラ３２１で演者１０を撮像した画像データに基づき、演者１０のモーション情報を取得する。またはモーション取得部３１０は、演者の体に取り付けた１つ又は複数のセンサの位置情報を取得し、取得した位置情報に基づき、演者のモーション情報を取得してもよい。モーション取得部３１０は、取得したモーション情報を第１位置関係計算部３３０と、モーション編集部３５０に提供する。

　第１位置関係計算部３３０は、演者１０から見て、演者１０と提示部２００で提示された画像（映像）に示される観客アバタ又は観客アバタ群と位置関係、すなわち、演者視点の位置関係（第１位置関係）を計算する。位置関係の計算は、例えば、演者１０のモーション情報（位置情報を含む）と、提示部２００の位置情報（例えばディスプレイの配置位置・高さ等）と、提示部２００の表示領域内の観客アバタ又は観客アバタ群の位置情報とに基づき行う。第１位置関係は、例えば演者１０の位置からどのベクトルの方向に、表示領域に提示された画像において、演者１０が注視する観客アバタ又は観客アバタ群が存在するかの情報を含む。基準となる演者１０の位置は、演者の体の予め決められた位置（例えば目又は重心など）でもよいし、その他の方法で決めた位置でもよい。

　ここで演者１０と表示領域に提示された観客アバタとの位置関係と、演者アバタ１１と観客アバタとの位置関係は一致しているとは限らない。例えば、演者１０から見て図５の左上の表示領域にいるある観客アバタは左前方に存在するが、仮想空間では演者アバタ１１の右に当該観客アバタが存在するかもしれない。このため、演者１０の動きを演者アバタ１１に反映させる場合、観客との自然なインタラクションを実現するには、演者１０と表示領域に提示された観客アバタとの位置関係（第１位置関係）を考慮する必要がある。第１位置関係計算部３３０は、計算した演者１０と観客アバタとの位置関係を示す情報（演者視点の位置関係情報）をモーション編集部３５０に送信する。

　第２位置関係計算部３４０は、観客アバタ５１０（又は観客）からみた演者アバタ１１と観客アバタ５１０の位置関係、すなわち観客視点の位置関係（第２位置関係）を計算する。位置関係の計算のため、各観客側装置における観客側送信部４４０から、仮想空間における観客アバタの位置情報を送信させ、演者側装置３００のデータ受信部３８０で位置情報を受信する。この位置情報に基づき、第２位置関係計算部３４０は各観客視点での演者アバタと観客アバタとの位置関係（第２位置関係）を計算する。観客アバタ５１０の位置は観客アバタ５１０の位置を特定可能な位置であれば何でもよい。例えば観客アバタ５１０の位置は、仮想空間における仮想カメラの位置でもよい。

　上述のように、演者１０と表示領域に提示された観客アバタとの位置関係と、仮想空間における演者アバタ１１と観客アバタとの位置関係は同じであるとは限らない。このため、演者１０の動きを演者アバタ１１に反映させる場合、観客との自然なインタラクションを実現するには、仮想空間における演者１０と観客アバタ５１０との位置関係（第２位置関係）を考慮する必要がある。

　第２位置関係計算部３４０は、仮想空間における、計算した演者アバタ１１と観客アバタとの位置関係を示す情報（観客視点の位置関係情報）をモーション編集部３５０に提供する。

　モーション編集部３５０は、演者１０の動きを元に実際の演者アバタ１１の動き情報（モーション情報）を編集しコンテンツ１２として出力する。

　モーション編集部３５０は，演者視点の位置関係情報、観客視点の位置関係情報，演者のモーション情報，演者の注視観客情報を受け取り，演者のモーション情報を編集する。モーション情報の編集は、例えば、観客ごと、又は観客群ごと（仮想区間ごと）に行う。

　例えば，演者が存在する現実空間と演者アバタが存在する仮想空間との間でそれぞれの座標系が対応づけられており、演者から見て注視する観客アバタ（表示領域に表示された観客アバタ）へのベクトルに対応するベクトルを仮想空間において特定する。仮想空間における演者アバタは、特定されたベクトルの方向を向く。演者アバタが向く方向（角度）と、仮想空間において演者アバタから見て観客アバタが存在する方向（角度）との差分だけ、モーション情報における演者の動作を編集する。例えば、演者の顔、腕、又は足の角度を、当該差分に応じて回転させる。これにより現実空間における演者が表示領域において注視する観客アバタ（観客アバタＡとする）を、仮想空間において演者アバタが注視する動作を実現できる。

　観客アバタＡと同じ仮想空間に存在する他の観客アバタ（注視されていない観客アバタ）に対しては、演者アバタが上記観客アバタＡを演者アバタが注視している動作が行われるように、演者アバタのモーション情報が編集される。

　観客アバタＡと異なる他の仮想空間に存在する観客アバタに対しては、モーション情報の編集を行わなくてもよい。あるいは、他の仮想空間に観客アバタＡが存在する仮想空間内の様子を示すスクリーンオブジェクト（バックスクリーンなど）を配置し、他の仮想空間における演者アバタが、スクリーンオブジェクト又はスクリーンオブジェクトに表示されている観客アバタＡを注視する動作を行うように他の仮想空間に対する演者のモーション情報を編集してもよい。

　モーション情報の編集によって演者アバタの動作を観客、観客群又は仮想空間ごとに変更させる動作の具体例については後述する。

　また、モーション編集部３５０は、仮想空間の属性情報、例えば言語圏の文化に応じてモーション情報を編集してもよい。例えば演者が手のひらを下にして手首を曲げることにより手招きの動作を行った場合、ある特定の属性情報の仮想空間に対しては、手のひらを上にして手首を曲げる動作にモーション情報を変更してもよい。

　映像データ生成部３６０は、モーション編集部３５０で編集されたモーション情報に基づいて、観客側装置に提供する演者アバタ（演者オブジェクト）のデータを生成する。演者アバタのデータは、一例として、図２～図４で説明した３次元オブジェクト（もしくは２次元オブジェクト）を生成し、生成した３次元オブジェクト（もしくは２次元オブジェクト）を画像データとしてレンダリングしたものである。この場合、観客側装置４００ではレンダリングデータを元に演者アバタが映像として再生される。

　他の例として、演者アバタのデータは、編集後のモーション情報でもよい。この場合、観客側装置で、編集後のモーション情報が演者アバタに適用され、編集後のモーション情報に応じて演者アバタが動作させられる。

　本例では３次元オブジェクトのレンダリングデータを演者アバタのデータとする場合を想定する。

　データ配信部３７０は、映像データ生成部３６０で生成された演者オブジェクトのデータを観客側装置４００に送信する。データ配信部３７０は、観客側装置４００と有線又は無線のネットワークを介して接続されている。有線又は無線のネットワークは、インターネット、セルラー通信ネットワーク、又は無線ＬＡＮ（Local Area Network）等を含む。

　観客側装置４００のデータ受信部４１０は、演者側装置３００から配信された演者オブジェクトのデータを受信する。データ受信部４１０は、受信したデータを観客提示部４２０に提供する。

　観客提示部４２０は、仮想空間と仮想空間内のオブジェクト（演者アバタ、観客オブジェクト、ライブ会場内の各種オブジェクトなど）を示す映像を表示する。観客側装置４００を装着又は視聴する観客自身のオブジェクト（観客アバタ）については、当該観客アバタを表示しない構成及び表示する構成のいずれもあり得る。観客提示部４２０は、仮想空間に設定された観客の仮想カメラに基づき、仮想カメラの視点で、仮想空間５００の様子を示す映像を生成する。仮想カメラは例えば観客アバタの頭部（例えば目の位置）に設定される。生成した映像（演者アバタ、他の観客アバタ、舞台、客席などを含む）が観客に視認される。

　以下、具体例を用いて、本開示の実施形態について詳細に説明する。

　図７は、現実空間における演者１０の動きに応じて、仮想空間５００（５００＿１～５００＿４）上の演者アバタ１１（１１＿１～１１＿４）が動作する様子を示す図である。仮想空間５００＿１～５００＿４には、演者アバタ１１＿１～１１＿４と、演者アバタ１１＿１～１１＿４がパフォーマンスをする舞台５２０＿１～５２０＿４と、観客アバタ群が演者アバタを見るスペースである客席５３０（５３０＿１～５３０＿４）とが含まれる。演者アバタ１１＿１～１１＿４は、演者１０の動きに従い、仮想空間５００上で、演者１０と同様の動作を行う。演者１０が、図７のように左腕を上に上げる動作を行うと、演者アバタ１１もこの動作に連動するように、同様に左腕を上げる動作を行う。なお、この例ではモーション情報の編集は行っていない。

　図８（ａ）は、演者１０がある仮想空間における観客アバタ群のうち観客アバタ５１１＿１を注視して、手を振る動作を行う例を示す。観客アバタ５１１＿１は太い線で囲まれること、又は特定の色で塗られることで、注視された観客アバタであることが演者１０に視認容易になっている。演者１０の視線の方向は方向Ｄ１である。

　図８（ｂ）は、観客アバタ５１１＿１が存在する仮想空間内の演者アバタ１１＿１と観客アバタ群の様子を示す。観客アバタ群は、観客アバタ５１１＿１と、それ以外の観客アバタ５１１＿２とを含む。演者１０のモーション情報を編集しない場合、すなわち、演者アバタ１１＿１の動作を補正しない場合、演者アバタ１１＿１は方向Ｄ１を見ながら、手を振る動作を行う。観客アバタ５１１＿１及び観客アバタ５１１＿２から見た場合、演者アバタ１１＿１が観客アバタ５１１＿１とは別の方向に対して手を振って見える。これに対して、本実施形態では演者アバタ１１＿１が見る方向と、観客アバタ５１１＿１が存在する方向との差分（角度の差分）θに応じてモーション情報の編集を行う。この結果、演者アバタ１１＿１が観客アバタ５１１＿１を見て、手を振る動作を行うことになる。観客アバタ５１１＿１に対応する観客は演者アバタ１１＿１が自分に手を振っているように見える。観客アバタ５１１＿２に対応する観客は、演者アバタ１１＿１が観客アバタ５１１＿１に手を振っているように見える。なお、観客アバタ５１２＿１に対してはモーション情報の補正を行わない構成も可能である。

　図９（ａ）は、モーション情報の編集を行わない場合に、観客アバタ５１１＿１から演者アバタ１１＿１を見た例を示す。演者アバタ１１＿１は観客アバタ５１１＿１とは異なる方向を見て手を振っている。図９（ｂ）は、モーション情報の編集を行った結果、観客アバタ５１１＿１から演者アバタ１１＿１を見た例を示す。演者アバタ１１＿１は観客アバタ５１１＿１を見て、手を振っている。他の観客アバタ５１１＿２（図８（ｂ）参照）の観客も、演者アバタ１１＿１が観客アバタ５１１＿１に手を振っているように見える。

　図１０は、観客アバタ５１１＿１と観客アバタ５１１＿２との視界を説明する図である。図１０（ａ）は仮想空間５００＿１内の様子を示す。図１０（ｂ）は観客アバタ５１１＿１の視界を示し、図１０（ｃ）は観客アバタ５１１＿２の視界を示す。観客アバタ５１１＿１は、演者アバタ１１＿１と対面する方向に対して、右方向に観客アバタ５１２＿１が見えている。一方、観客アバタ５１２＿１は、演者アバタ１１＿１と対面する方向に対して、左方向に観客アバタ５１１＿１が見えている。これにより、観客アバタは、客席５３０＿１のどの位置にいても演者アバタ１１＿１を正面から見ることができ、かつ他の観客との位置関係が維持される。

　モーション編集部３５０は、角度の差分θ（図８又は図９参照）に応じて、モーション情報を編集（演者アバタの動作を補正）するか否かを切り替えてもよい。具体的には、角度の差分θが閾値以下のときは、図８（ｂ）又は図９（ｂ）のようにモーション情報を編集（演者アバタの動作を補正）する。角度の差分θが閾値より大きいときは、不自然な動きになるとして、モーション情報を編集しない（演者アバタの動作を補正しない）。

　上述した説明では演者が注視する観客オブジェクトが存在する仮想空間内での演者アバタの動作の補正例を示したが、他の仮想空間における演者アバタの動作の補正例を説明する。

　図１１は、提示部２００に提示された複数の表示領域のうち右上の表示領域に対応する仮想空間５００＿１における観客アバタ群５１０＿１のうちの観客アバタ５１１＿１を演者１０が注視して手を振っている動作を示す。

　図１２（ａ）は、観客アバタ５１１＿１が存在する仮想空間５００＿１における演者アバタ１１＿１の動作の補正例を示す。この例は上述の図９（ｂ）と同様であるため説明を省略する。
　図１２（ｂ）は、仮想空間５００＿１以外の仮想空間（仮想空間５００＿２とする）における演者アバタ１１＿２の動作の補正例を示す。観客アバタ５１１＿２は、仮想空間５００＿２における任意の観客アバタである。仮想空間５００＿２には、他の仮想空間５００＿１、５００＿３、５００＿４内の様子を示すスクリーンオブジェクト（バックスクリーンなど）５５１、５５３、５５４が配置されている。スクリーンオブジェクト５５１、５５３、５５４には、５００＿１、５００＿３、５００＿４における観客アバタ群５１０＿１、５１０＿３、５１０＿４が表示されている。演者アバタ１１＿２が、演者が注視している観客アバタ５１１＿１を含むスクリーンオブジェクト５５１を見て手を振る動作を行うように、演者のモーション情報が編集（演者アバタ１１＿２の動作が補正）される。すなわち、演者アバタ１１＿２とスクリーンオブジェクト５５１との位置関係（第３位置関係）に基づいて、演者のモーション情報が編集（演者アバタ１１＿２の動作が補正）される。例えば、スクリーンオブジェクト５５１内の観客アバタ５１１＿１を見て手を振る動作を行うように、演者のモーション情報が編集（演者アバタ１１＿２の動作が補正）される。他の仮想空間５００＿３、５００＿４においても、同様にして演者アバタの動作が補正されてよい。

　モーション編集部３５０は、観客アバタ５１１＿２の方向と、スクリーンオブジェクト５５１の方向又は当該スクリーンオブジェクト５５１に含まれる観客アバタ５１１＿１の方向との差分（角度の差分）θ２の大きさ（図１２（ｂ）参照）に応じて、モーション情報の編集を行うかを切り替えてもよい。例えば角度の差分θ２が閾値以下の場合に、モーション情報の編集を行い、角度の差分θ２が閾値より大きい場合に、モーション情報の編集を行わなくてもよい。

　図１２（ｂ）の例ではスクリーンオブジェクトが３つであるが、１つ又は２つ、３つ以上でもよい。例えばスクリーンオブジェクトが１つの場合、時間に応じて、スクリーンオブジェクトに表示される仮想空間が切り替えられてもよい。この場合、演者が注視している観客アバタ５１１＿１が表示されている場合にのみ演者アバタ１１＿２の動作を補正し、それ以外の場合には、演者アバタ１１＿２の動作を補正しなくてもよい。あるいは、観客アバタ５１１＿１がスクリーンオブジェクトに表示されていない場合、強制的にスクリーンオブジェクトに観客アバタ５１１＿１が存在する仮想空間を表示して、演者アバタ１１＿２の動作を補正してもよい。

　図１３は、本開示の実施形態に係る情報処理システム１００の処理の流れの一例を説明するフローチャートである。
　まず、提示部２００が、演者１０に対して仮想空間５００における観客アバタ群の画像を提示する（Ｓ１００１）。このとき、提示部２００は、データ受信部３８０で受信したデータにより観客アバタを表す映像を仮想空間毎に合成して提示してもよい。観客アバタを表す映像は観客を撮影した映像でもよいし、観客が選択したキャラクタの映像でもよい。

　次に、視線取得部３２０が演者１０の視線情報を取得し、注視先を検出する（Ｓ１００２）。注視先を検出できた場合は、ステップＳ１００３に進み、取得できない場合は、ステップＳ１００１に戻る。

　次に、提示部２００は、演者の注視部分を強調して表示する（Ｓ１００３）。次に、モーション編集部３５０は、モーション取得部３１０で取得した演者１０の動き（モーション）情報に基づき、演者が観客への特定の動作（ここではインタラクション動作と呼ぶ）か判定する（Ｓ１００４）。インタラクション動作の例は、例えば手を振る、手招きする、ウィンクをする、首を傾ける、ダンスをする、回転するなど任意に定義することができる。インタラクション動作の行う先は、特定の観客アバタ、又は特定の観客アバタ群などがある。観客アバタ群は、１つの仮想空間内のみならず、複数の仮想空間にわたる場合もあり得る。例えば演者が複数の仮想空間の同じ階数の客席にまたがって手を振る動作を行う場合がある。当該動きがインタラクション動作である場合はステップＳ１００５に進み、インタラクション動作でない場合は、ステップＳ１００１に戻る。インタラクション動作を行ったか否かは、例えば、近傍の過去から現在までの演者の動きから，機械学習手法による予測を用いて判定してもよい。

　次に、モーション編集部３５０は、演者の視線情報、第１位置関係、第２位置関係等に基づき、演者のモーション情報を観客ごと、観客群ごと、又は仮想空間ごとに、編集し、映像データ生成部３６０は、補正後のモーション情報に基づき演者アバタのデータを生成する。データ配信部３７０は、演者アバタのデータを各観客側装置４００に送信する（Ｓ１００５）。演者が注視する観客アバタ群が複数の仮想空間にわたる場合、複数の仮想空間のそれぞれの注視する観客アバタ又は観客アバタ群に対して、前述した演者アバタの動作を補正（モーション情報を編集）すればよい。

　次に、データ受信部３８０は、観客側装置４００から送信された観客アバタを表す映像を受信し、観客アバタ群５１０を提示部２００により演者１０に提示する（Ｓ１００６）。これにより、演者１０は、観客アバタに対して行ったインタラクション動作に対する観客の反応を見ることができる。なお、観客側装置４００では観客の動作が観客アバタに反映させられる。例えば観客が右を向けば、観客アバタも右を向き、観客が手を振れば、観客アバタも手を振る。

　次に、モーション編集部３５０は、インタラクション動作が終了したか判定する（Ｓ１００７）。インタラクション動作が継続していれば、ステップＳ１００５に戻り、インタラクション動作が終了したならば、演者のライブが終了したかを判断し（Ｓ１００８）、終了していなければ、ステップＳ１００１に戻る。ライブが終了した場合は、本フローチャートの処理を終了する。

　図１４は、本開示の実施形態に係る情報処理装システム１００のモーション編集処理の流れの一例を説明するフローチャートである。当該フローチャートの説明においては、４つの仮想空間のうち仮想空間５００＿１の観客アバタ５１１＿１に対して演者１０が手を向けるインタラクション動作をする状況を想定している（図１１参照）。

　まず、モーション編集部３５０は、演者１０が提示部２００により提示された観客アバタ５１１＿１に対して手を向けた方向（演者１０はさらにこの方向を注視している）に対応する方向を、仮想空間５００＿１において特定する。特定した方向と、仮想空間５００＿１において演者アバタ１１＿１の観客アバタ５１１＿１に対する方向との差分（角度の差分）θを計算する（Ｓ１１０１）。

　次にモーション編集部３５０は、差分θが閾値以下か判定する（Ｓ１１０２）。ここで、閾値とは、演者アバタ１１＿１の動きを補正した場合、観客アバタ５１１＿１の観客から見て演者アバタ１１＿１のモーションが不自然とならないかを判定するための値である。差分θが閾値以下の場合は、ステップＳ１１０４に進み、閾値より大きい場合は、ステップＳ１１０３に進む。

　次に、モーション編集部３５０は、モーション情報の編集（モーションの補正）を行わない（あるいは、モーション情報の編集をキャンセルする）（Ｓ１１０３）。

　次に、モーション編集部３５０は、差分θの大きさに応じて演者のモーション情報を編集（演者アバタ１１＿１の動作を補正）する（Ｓ１１０４）。

　次に、映像データ生成部３６０は、補正後のモーション情報（又は補正していないモーション情報）に基づき演者アバタのデータを生成し、データ配信部３７０が観客側装置４００に演者アバタのデータを送信する（Ｓ１１０５）。ここでは演者アバタのデータは、演者アバタのモーションを示すデータであるとする。観客側装置４００は、演者アバタのデータ（モーションデータ）を受信し、演者アバタ１１＿１を当該モーションデータに基づき動作させる（Ｓ１１０６）。当該動作を行う演者アバタ１１＿１が観客に提示される（同Ｓ１１０６）。

　図１５は、本開示の実施形態に係る情報処理システム１００のモーション編集処理の流れの他の例を説明するフローチャートである。ステップＳ１２０１～Ｓ１２０４は図１４のＳ１１０１～Ｓ１１０４と同じである。

　映像データ生成部３６０は、演者のモーション情報に基づき演者アバタの３次元モデル（又は２次元モデル）を補正し、補正後の３次元モデルをレンダリングした映像データをデータ配信部３７０を介して、観客側装置４００に送信する（Ｓ１２０５）。観客側装置４００は、映像データを受信し、当該映像データを再生することで観客に対して演者アバタを提示する（Ｓ１２０６）。

　図１６は、本開示の実施形態に係る情報処理装置のモーション編集処理の流れのさらに他の例を説明するフローチャートである。本例では、仮想空間５００の属性情報に応じて演者アバタ１１のモーションを追加で編集する。ステップＳ１３０１～Ｓ１３０４は図１４のＳ１１０１～Ｓ１１０４と同じである。

　次に、モーション編集部３５０は、仮想空間の属性情報に基づき、演者アバタ１１のモーションが編集対象かを判定する（Ｓ１３０５）。モーションの編集対象の場合は、ステップＳ１３０６に進み、モーションの編集対象でない場合は、ステップＳ１３０７に進む。

　次に、モーション編集部３５０は、演者アバタ１１のモーションを仮想空間の属性情報に応じて編集する（Ｓ１３０６）。例えば、演者１０がした動作が手のひらを下にした手招きである場合、仮想空間５００の言語圏の文化に応じて手のひらを上にして手首を曲げたモーションに演者アバタ１１のモーションを編集する。

　次に、モーション編集部３５０は、編集対象である演者アバタ１１のモーションを更に編集する（Ｓ１３０６）。

　ステップＳ１３０７、Ｓ１３０８は、図１４のＳ１１０５、Ｓ１１０６と同じである。

　以上、本開示の情報処理装置によれば、演者１０と提示部２００に提示された観客アバタとの位置関係に応じて演者アバタを制御することで、演者の動きの意図を演者アバタ１１に正しく反映させることができる。

　（変形例）
　次に、提示部２００の変形例について説明する。
　図１７は、本開示の実施形態に係る提示部２００の変形例として提示部２０２を示す図である。
　提示部２０２は、図１７（ａ）のように、複数の周状の表示パネル２０２＿１、２０２＿２、２０２＿３、２０２＿４を積み重ねるように配置されている。表示パネル２０２＿１、２０２＿２、２０２＿３、２０２＿４はそれぞれ対応する仮想空間内の様子（観客群や客席等）を表示する。提示部２０２は、図１７（ｂ）のように、上から見た場合、演者１０の周囲を囲んだ略楕円又は略円形を有する。

　演者１０は、各仮想空間における客席が舞台を周状に囲む場合に、仮想空間と同様の位置関係で観客アバタを視認できる。演者１０はより直感的に、観客に対してインタラクションをすることができる。

　図１８は、本開示の実施形態に係る提示部２００の他の変形例として提示部２０３を示す。提示部２０３は、図１８のようにヘッドマウントディスプレイ（ＨＭＤ）であってもよい。提示部２０３は、視界内に４つの仮想空間の様子を自由に配置して、演者１０に対して、４つの仮想空間における観客アバタ群５１０＿１～５１０＿４を視認させることができる。

　図１９は、提示部２０３により提示される４つの仮想空間の他の表示例を示す図である。また、演者が注視する観客アバタを含む仮想空間５００＿１の様子を全画面で表示し、その他の仮想空間の様子を小さい画面で、仮想空間５００＿１の様子を全画面の端などに重ねて表示してもよい。

［応用例］
　以下に、情報処理システム１００の応用例について説明する。なお、上述の情報処理システム１００は、以下の情報処理システム１００の任意のシステム、装置及び方法等に対しても応用可能である。

　図２０は、本開示の情報処理システム１００の一連の処理をプログラムにより実行するコンピュータのハードウエアの構成の一例である。コンピュータにおいて、CPU１００１、ROM１００２、RAM１００３は、バス１００４を介して相互に接続されている。

　バス１００４には、入出力インタフェース１００５も接続されている。入出力インタフェース１００５には、入力部１００６、出力部１００７、記憶部１００８、通信部１００９、およびドライブ１０１０が接続されている。

　入力部１００６は、例えば、キーボード、マウス、マイクロホン、タッチパネル、入力端子などよりなる。出力部１００７は、例えば、ディスプレイ、スピーカ、出力端子などよりなる。記憶部１００８は、例えば、ハードディスク、RAMディスク、不揮発性のメモリなどよりなる。通信部１００９は、例えば、ネットワークインタフェースよりなる。ドライブは、磁気ディスク、光ディスク、光磁気ディスク、または半導体メモリなどのリムーバブルメディアを駆動する。

　以上のように構成されるコンピュータでは、CPU１００１が、例えば、記憶部１００８に記憶されているプログラムを、入出力インタフェース１００５およびバス１００４を介して、RAM１００３にロードして実行することにより、上述した一連の処理が行われる。RAM１００３にはまた、CPU１００１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　コンピュータが実行するプログラムは、例えば、パッケージメディア等としてのリムーバブルメディアに記録して適用することができる。その場合、プログラムは、リムーバブルメディアをドライブ１０１０に装着することにより、入出力インタフェース１００５を介して、記憶部１００８にインストールすることができる。

　また、このプログラムは、ローカルエリアネットワーク、インターネット、デジタル衛星放送といった、有線または無線の伝送媒体を介して提供することもできる。その場合、プログラムは、通信部１００９で受信し、記憶部１００８にインストールすることができる。

　本明細書で開示した処理のステップは、必ずしもフローチャートに記載された順序で実行されなくてもよい。例えば、フローチャートに記載した順序と異なる順序でステップが実行されても、フローチャートに記載したステップの一部が並列的に実行されてもよい。

　なお、本発明は上記実施形態そのままに限定されるものではなく、実施段階ではその要旨を逸脱しない範囲で構成要素を変形して具体化できる。また、上記実施形態に開示されている複数の構成要素の適宜な組み合わせにより、種々の発明を形成できる。例えば、実施形態に示される全構成要素から幾つかの構成要素を削除してもよい。さらに、異なる実施形態にわたる構成要素を適宜組み合わせてもよい。

　また、本明細書に記載された本開示の効果は例示に過ぎず、その他の効果があってもよい。

　なお、本開示は以下のような構成を取ることもできる。
［項目１］
　少なくとも１つの仮想空間に配置された観客アバタ群を、前記仮想空間に配置された演者アバタに対応する演者が視認可能な表示領域に提示する提示部と、前記表示領域に提示された前記画像に表される前記観客アバタ群に対する前記演者の動作に基づき、前記少なくとも１つの仮想空間における前記演者アバタを制御する制御部と、を備える。
［項目２］
　前記制御部は、前記演者と、前記表示領域に提示された前記画像が表す前記観客アバタ群との間の第１位置関係と、前記少なくとも１つの仮想空間における前記演者アバタと前記観客アバタ群との間の第２位置関係に基づき、前記少なくとも１つの仮想空間における前記演者アバタを制御する
　項目１に記載の情報処理装置。
［項目３］
　前記少なくとも１つの仮想空間は、複数の前記仮想空間を含み、
　前記提示部は、前記表示領域に前記仮想空間ごとに前記観客アバタ群を表す画像を提示し、
　前記制御部は、前記仮想空間ごとに前記演者アバタを制御する
　項目１又は２に記載の情報処理装置。
［項目４］
　前記表示領域に提示された前記画像が表す前記観客アバタ群において前記演者が注視する少なくとも１つの第１観客アバタを特定する特定部を備え、
　前記第１位置関係は、前記演者と前記画像が表す前記第１観客アバタとの位置関係であり、前記制御部は、前記第１位置関係と、前記第１観客アバタを含む前記仮想空間である第１仮想空間において前記第１観客アバタと前記演者アバタとの第２位置関係とに基づき、前記第１仮想空間における前記演者アバタを制御する、
　項目２に記載の情報処理装置。
［項目５］
　前記特定部は、前記演者の視線情報に基づき、前記第１観客アバタを特定する
　項目４に記載の情報処理装置。
［項目６］
　前記第１観客アバタは、前記仮想空間のいずれか１つにおける前記観客アバタ群の少なくとも１つの観客アバタを含む
　項目４又は５に記載の情報処理装置。
［項目７］
　前記第１観客アバタは、２つ以上の前記仮想空間におけるそれぞれの前記観客アバタ群の少なくとも１つの観客アバタを含む
　項目４～６のいずれか一項に記載の情報処理装置。
［項目８］
　前記第１観客アバタを含まない前記仮想空間である第２仮想空間には前記第１仮想空間における前記観客アバタ群の少なくとも一部を含むスクリーンオブジェクトが表示され、　前記制御部は、前記第２仮想空間において前記スクリーンオブジェクトと前記演者アバタとの第３位置関係と、前記第１位置関係とに基づき、前記第２仮想空間における前記演者アバタを制御する
　項目４～７のいずれか一項に記載の情報処理装置。
［項目９］
　前記演者の動作を取得する取得部を備え、
　前記制御部は、前記演者の動作に基づき、前記第２仮想空間における前記演者アバタを制御し、
　前記制御部は、前記第２仮想空間における前記演者アバタの動作を、前記スクリーンオブジェクトの方向に補正する
　項目８に記載の情報処理装置。
［項目１０］
　前記制御部は、前記演者の動作がインタラクション動作かを判断し、前記インタラクション動作の場合にのみ、前記演者アバタの動作を補正する
　項目８又は９に記載の情報処理装置。
［項目１１］
　前記制御部は、前記演者アバタが向く方向と、前記演者アバタから前記スクリーンオブジェクトの方向との差分に応じて、前記演者アバタの動作を補正する
　項目８～１１のいずれか一項に記載の情報処理装置。
［項目１２］
　前記制御部は、前記差分が閾値以下の場合に、前記演者アバタの動作を補正し、前記差分が閾値より大きい場合に、前記演者アバタの動作を補正しない
　項目１１に記載の情報処理装置。
［項目１３］
　前記仮想空間ごとに属性情報が設定されており、
　前記制御部は、前記仮想空間の属性情報に応じて、前記演者アバタの動作を変更する
　項目３～１２のいずれか一項に記載の情報処理装置。
［項目１４］
　前記属性情報は、前記仮想空間に含まれる観客アバタ群に対応する観客群の使用言語又は居住地に基づく
　項目１３に記載の情報処理装置。
［項目１５］
　前記制御部は、前記演者アバタの動作を示す動作データを、前記仮想空間における前記演者アバタを前記動作データに基づき動作させ、前記仮想空間に設定された仮想視点に基づき前記観客アバタ群に対応する観客群に視界画像を提供する、少なくとも１つの端末装置に送信する
　項目１～１４のいずれか一項に記載の情報処理装置。
［項目１６］
　前記制御部は、前記演者アバタを表す画像を、前記仮想空間に前記画像が示す前記演者アバタを配置し、前記仮想空間に設定された仮想視点に基づき前記観客アバタ群に対応する観客群に視界画像を提供する、少なくとも１つの端末装置に送信する
　項目１～１５のいずれか一項に記載の情報処理装置。
［項目１７］
　前記提示部は、前記演者の前方に配置された表示部、前記演者の周囲を囲む形状を有する表示部を含む、又は、前記演者が装着するヘッドマウンドデバイスの表示部を含む
　項目１～１６のいずれか一項に記載の情報処理装置。
［項目１８］
　前記制御部は、前記観客アバタ群に対応する観客群の少なくとも１つの端末装置から前記観客群を撮像した画像データを受信し、
　前記提示部は、前記観客アバタ群を表す前記画像として、前記画像データが示す前記観客群の画像を提示する　項目１～１７のいずれか一項に記載の情報処理装置。
［項目１９］
　少なくとも１つの仮想空間に配置された観客アバタ群を表す画像を、前記仮想空間に配置された演者アバタに対応する演者が視認可能な表示領域に提示し、前記表示領域に提示された前記画像に表される観客アバタ群に対する前記演者の動作に基づき、前記少なくとも１つの仮想空間における前記演者アバタを制御する
　情報処理方法。
［項目２０］
　少なくとも１つの仮想空間に配置された観客アバタ群を表す画像を、前記仮想空間に配置された演者アバタに対応する演者が視認可能な表示領域に提示するステップと、前記表示領域に提示された前記画像に表される前記観客アバタ群に対する前記演者の動作に基づき、前記少なくとも１つの仮想空間における前記演者アバタを制御するステップとをコンピュータに実行させるためのコンピュータプログラム。

１０　演者
１１　演者アバタ
１２　コンテンツ
１００　情報処理システム
２００、２０３　提示部
３００　演者側装置
３１０　モーション取得部
３２０　視線取得部
３２１　カメラ
３３０　第１位置関係計算部
３４０　第２位置関係計算部
３５０　モーション編集部
３６０　映像データ生成部
３７０　データ配信部
３８０、４１０　データ受信部
３９０　観客映像合成部
４００　観客側装置
４０１　ディスプレイ
４０２　ヘッドマウントディスプレイ
４２０　観客提示部
４３０　観客映像生成部
４４０　観客側送信部
５００　仮想空間
５１０　観客アバタ群
５１１、５１２　観客アバタ
５２０　舞台
５３０、５３１　客席
１００１　CPU
１００２　ROM
１００３　RAM
１００４　バス
１００５　入出力インタフェース
１００６　入力部
１００７　出力部
１００８　記憶部
１００９　通信部
１０１０　ドライブ

Claims

　少なくとも１つの仮想空間に配置された観客アバタ群を表す画像を、前記仮想空間に配置された演者アバタに対応する演者が視認可能な表示領域に提示する提示部と、
　前記表示領域に提示された前記画像が表す前記観客アバタ群に対する前記演者の動作に基づき、前記少なくとも１つの仮想空間における前記演者アバタを制御する制御部と、
　を備えた情報処理装置。
　前記制御部は、前記演者と、前記表示領域に提示された前記画像が表す前記観客アバタ群との間の第１位置関係と、前記少なくとも１つの仮想空間における前記演者アバタと前記観客アバタ群との間の第２位置関係に基づき、前記少なくとも１つの仮想空間における前記演者アバタを制御する
　請求項１に記載の情報処理装置。
　前記少なくとも１つの仮想空間は、複数の前記仮想空間を含み、
　前記提示部は、前記表示領域に前記仮想空間ごとに前記観客アバタ群を表す画像を提示し、
　前記制御部は、前記仮想空間ごとに前記演者アバタを制御する
　請求項１に記載の情報処理装置。
　前記表示領域に提示された前記画像が表す前記観客アバタ群において前記演者が注視する少なくとも１つの第１観客アバタを特定する特定部を備え、
　前記第１位置関係は、前記演者と前記画像が表す前記第１観客アバタとの位置関係であり、前記制御部は、前記第１位置関係と、前記第１観客アバタを含む前記仮想空間である第１仮想空間において前記第１観客アバタと前記演者アバタとの第２位置関係とに基づき、前記第１仮想空間における前記演者アバタを制御する、
　請求項２に記載の情報処理装置。
　前記特定部は、前記演者の視線情報に基づき、前記第１観客アバタを特定する
　請求項４に記載の情報処理装置。
　前記第１観客アバタは、前記仮想空間のいずれか１つにおける前記観客アバタ群の少なくとも１つの観客アバタを含む
　請求項４に記載の情報処理装置。
　前記第１観客アバタは、２つ以上の前記仮想空間におけるそれぞれの前記観客アバタ群の少なくとも１つの観客アバタを含む
　請求項４に記載の情報処理装置。
　前記第１観客アバタを含まない前記仮想空間である第２仮想空間には前記第１仮想空間における前記観客アバタ群の少なくとも一部を含むスクリーンオブジェクトが表示され、　前記制御部は、前記第２仮想空間において前記スクリーンオブジェクトと前記演者アバタとの第３位置関係と、前記第１位置関係とに基づき、前記第２仮想空間における前記演者アバタを制御する
　請求項４に記載の情報処理装置。
　前記演者の動作を取得する取得部を備え、
　前記制御部は、前記演者の動作に基づき、前記第２仮想空間における前記演者アバタを制御し、
　前記制御部は、前記第２仮想空間における前記演者アバタの動作を、前記スクリーンオブジェクトの方向に補正する
　請求項８に記載の情報処理装置。
　前記制御部は、前記演者の動作がインタラクション動作かを判断し、前記インタラクション動作の場合にのみ、前記演者アバタの動作を補正する
　請求項９に記載の情報処理装置。
　前記制御部は、前記演者アバタが向く方向と、前記演者アバタから前記スクリーンオブジェクトの方向との差分に応じて、前記演者アバタの動作を補正する
　請求項９に記載の情報処理装置。
　前記制御部は、前記差分が閾値以下の場合に、前記演者アバタの動作を補正し、前記差分が閾値より大きい場合に、前記演者アバタの動作を補正しない
　請求項１１に記載の情報処理装置。
　前記仮想空間ごとに属性情報が設定されており、
　前記制御部は、前記仮想空間の属性情報に応じて、前記演者アバタの動作を変更する
　請求項３に記載の情報処理装置。
　前記属性情報は、前記仮想空間に含まれる観客アバタ群に対応する観客群の使用言語又は居住地に基づく
　請求項１３に記載の情報処理装置。
　前記制御部は、前記演者アバタの動作を示す動作データを、前記仮想空間における前記演者アバタを前記動作データに基づき動作させ、前記仮想空間に設定された仮想視点に基づき前記観客アバタ群に対応する観客群に視界画像を提供する、少なくとも１つの端末装置に送信する
　請求項１に記載の情報処理装置。
　前記制御部は、前記演者アバタを表す画像を、前記仮想空間に前記画像が示す前記演者アバタを配置し、前記仮想空間に設定された仮想視点に基づき前記観客アバタ群に対応する観客群に視界画像を提供する、少なくとも１つの端末装置に送信する
　請求項１に記載の情報処理装置。
　前記提示部は、前記演者の前方に配置された表示部、前記演者の周囲を囲む形状を有する表示部を含む、又は、前記演者が装着するヘッドマウンドデバイスの表示部を含む
　請求項１に記載の情報処理装置。
　前記制御部は、前記観客アバタ群に対応する観客群の少なくとも１つの端末装置から前記観客群を撮像した画像データを受信し、
　前記提示部は、前記観客アバタ群を表す前記画像として、前記画像データが示す前記観客群の画像を提示する
　請求項１に記載の情報処理装置。
　少なくとも１つの仮想空間に配置された観客アバタ群を表す画像を、前記仮想空間に配置された演者アバタに対応する演者が視認可能な表示領域に提示し、
　前記表示領域に提示された前記画像に表される観客アバタ群に対する前記演者の動作に基づき、前記少なくとも１つの仮想空間における前記演者アバタを制御する
　情報処理方法。
　少なくとも１つの仮想空間に配置された観客アバタ群を表す画像を、前記仮想空間に配置された演者アバタに対応する演者が視認可能な表示領域に提示するステップと、
　前記表示領域に提示された前記画像に表される前記観客アバタ群に対する前記演者の動作に基づき、前記少なくとも１つの仮想空間における前記演者アバタを制御するステップと
　をコンピュータに実行させるためのコンピュータプログラム。