WO2021095704A1

WO2021095704A1 - 情報処理装置、情報処理方法およびプログラム

Info

Publication number: WO2021095704A1
Application number: PCT/JP2020/041812
Authority: WO
Inventors: 都夢田原; 智也石川; 岳成田; 高志瀬能
Original assignee: ソニー株式会社
Priority date: 2019-11-15
Filing date: 2020-11-10
Publication date: 2021-05-20
Also published as: US20220392174A1

Abstract

テンプレートＡＲコンテンツを制作時のシーンとは異なる実施シーンで良好に利用可能とする。　拡張現実実施シーンの環境マップを生成する。拡張現実シーンの環境マップに基づいて拡張現実実施シーンの抽象表現を生成する。拡張現実実施シーンの抽象表現とテンプレート拡張現実環境マップに基づいて生成されたテンプレート拡張現実の抽象表現を比較し、その比較結果に基づいてテンプレート拡張現実コンテンツを拡張現実実施シーンにマッピングして表示用拡張現実コンテンツを生成する。例えば、拡張現実実施シーンの抽象表現またはテンプレート拡張現実の抽象表現を編集可能とする。

Description

情報処理装置、情報処理方法およびプログラム

　本技術は、情報処理装置、情報処理方法およびプログラムに関し、特に、所定の環境を想定して生成された拡張現実コンテンツを用いた拡張現実表示を行うための情報処理装置等に関する。

　従来、テンプレートＡＲ（拡張現実：Augmented Reality）コンテンツが知られている。このテンプレートＡＲコンテンツは、通常想定するシーンをＲＧＢカメラ、デプスセンサ、ＬｉＤＡＲ（Light Detection and Ranging）などの種々のセンサを利用して計測することで取得できる環境マップを用いて制作される。この環境マップは、シーン中の物体の３次元幾何情報、属性、個数、配置などの情報を持つ。

　ＡＲ実施時は、上記センサの他、必要であれば加速度センサやＧＰＳ（Global Positioning System）等を用いて事前に取得した実施シーンの環境マップに対するユーザやＡＲ表示デバイスの位置、姿勢を同定してＡＲコンテンツを表示する。

　上述のテンプレートＡＲコンテンツは、通常、制作時に利用した特定のシーンでしか利用できない。つまり、特定の部屋に対して制作したＡＲコンテンツを別の部屋で正しく表示することができないという問題がある。

　例えば、特許文献１には、テンプレートＡＲコンテンツを製作時とは異なる未知のシーンで実施することを目的とした技術が提案されている。この技術は、ＡＲコンテンツ体験を異なる環境にマッピングするために、シーンの幾何情報やアフォーダンスを制約としてＡＲコンテンツの最適なマッピングを解くというものである。

特表２０１６－５１６２４１号公報

　特許文献１に記載される技術は、未知シーンにおいてもテンプレートＡＲコンテンツを製作した元のシーンと類似した理想的な環境マップや制約が得られることを前提とするという問題がある。つまり、ユーザが未知シーンでテンプレートＡＲコンテンツを体験するためには、元のシーンの条件を再現できるような一定の環境構築作業を実施したうえで、シーンの情報を正確に取得できる必要がある。これは、テンプレートＡＲコンテンツを体験可能なシーンの種類やシーン中に存在する物体の条件を著しく制限してしまう。

　また、ＡＲ実施シーンを変化させない限り、一つのテンプレートＡＲコンテンツから体験可能なＡＲ体験がただ一つに定まってしまうという問題もある。ユーザがＡＲを体験するシーンのばらつきや条件の変化、あるいはユーザの意図通りの表示に対応するには、想定される条件に合わせた大量のテンプレートやテンプレートそのものの複雑化が必要となる。さらに、一つに定まったＡＲ体験がユーザの意図したものとなる保証はない。

　本技術の目的は、テンプレートＡＲコンテンツを制作時のシーンとは異なる実施シーンで良好に利用可能とすることにある。

　本技術の概念は、
　拡張現実実施シーンの環境マップを生成する環境マップ生成部と、
　前記拡張現実シーンの環境マップに基づいて拡張現実実施シーンの抽象表現を生成する抽象表現生成部と、
　前記拡張現実実施シーンの抽象表現とテンプレート拡張現実環境マップに基づいて生成されたテンプレート拡張現実の抽象表現を比較し、該比較結果に基づいてテンプレート拡張現実コンテンツを拡張現実実施シーンにマッピングして表示用拡張現実コンテンツを生成する表示用拡張現実コンテンツ生成部を備える
　情報処理装置にある。

　本技術において、環境マップ生成部により、拡張現実実施シーンの環境マップが生成される。また、抽象表現生成部により、拡張現実シーンの環境マップに基づいて拡張現実実施シーンの抽象表現が生成される。例えば、抽象表現は、グラフ構造を持つ表現であってもよい。

　表示用拡張現実コンテンツ生成部により、拡張現実実施シーンの抽象表現とテンプレート拡張現実環境マップに基づいて生成されたテンプレート拡張現実の抽象表現が比較される。そして、この表示用拡張現実コンテンツ生成部により、その比較結果に基づいてテンプレート拡張現実コンテンツが拡張現実実施シーンにマッピングされて表示用拡張現実コンテンツが生成される。

　このように本技術においては、拡張現実実施シーンの環境マップに基づいて拡張現実実施シーンの抽象表現を生成し、この拡張現実実施シーンの抽象表現とテンプレート拡張現実の抽象表現を比較し、その比較結果に基づいてテンプレート拡張現実コンテンツを拡張現実実施シーンにマッピングして表示用拡張現実コンテンツを生成するものである。

　そのため、環境マップ同士を比較する場合に比べて、テンプレート拡張現実コンテンツを拡張現実実施シーンにマッピングするための計算処理が軽減されて簡単にできる。また、拡張現実実施シーンの抽象表現またはテンプレート拡張現実の抽象表現を編集することで、テンプレート拡張現実コンテンツを個々のユーザの拡張現実実施シーンで体験する際にユーザの意図に沿った適切な表示が可能となり、また、テンプレート拡張現実コンテンツが体験できるユーザシーン（拡張現実実施シーン）の幅を広げることが可能となる。

　なお、本技術において、例えば、拡張現実実施シーンの抽象表現またはテンプレート拡張現実の抽象表現を編集する抽象表現編集部をさらに備える、ようにされてもよい。この場合、例えば、抽象表現編集部は、拡張現実実施シーンの抽象表現およびテンプレート拡張現実の抽象表現を並べてユーザに提示する抽象表現提示部と、この提示に基づいてユーザが拡張現実実施シーンの抽象表現またはテンプレート拡張現実の抽象表現を変更操作するユーザインタフェース部を有する、ようにされてもよい。これにより、ユーザは、抽象表現の変更操作を容易かつ適切に行うことが可能となる。

　また、この場合、例えば、抽象表現提示部は、拡張現実実施シーンの抽象表現にテンプレート拡張現実の抽象表現に対応した部分的同型部分が複数存在する場合には、複数の部分的同型部分をユーザが認識可能に提示する、ようにされてもよい。これにより、ユーザは、複数の部分的同型部分の認識を容易に行うことができ、テンプレート拡張現実コンテンツをユーザの意図に沿った適切な表示とするための抽象表現の変更操作を効率よく行うことが可能となる。

　また、この場合、例えば、抽象表現編集部で拡張現実実施シーンの抽象表現またはテンプレート拡張現実の抽象表現が編集された場合、表示用拡張現実コンテンツ生成部は、変更操作後の拡張現実実施シーンの抽象表現とテンプレート拡張現実の抽象表現を比較する、ようにされてもよい。これにより、テンプレート拡張現実コンテンツをユーザの拡張現実実施シーンで体験する際にユーザの意図に沿った適切な表示とすることが可能となり、あるいはテンプレート拡張現実コンテンツが体験できるユーザシーンの幅を広げることが可能となる。

　また、この場合、例えば、抽象表現編集部における拡張現実実施シーンに対する編集情報に基づいて抽象表現生成部で生成された拡張現実実施シーンの抽象表現を自動的に編集する自動編集部をさらに備える、ようにされてもよい。これにより、拡張現実実施シーンにある特定の物体を拡張現実コンテンツの表示時に利用したくない場合に、コンテンツ毎に抽象表現から削除するような操作をしなくてもよくなる。

　また、この場合、例えば、抽象表現は、グラフ構造を持つ表現であり、編集は、ノード間の関係を変更する操作、またはノードの属性を変更する操作を含む、ようにされてもよい。このような変更操作を含むことで、抽象表現の編集を効果的に行うことが可能となる。

実施の形態としての情報処理システムの構成例を示す図である。実際のシーンの例を示す図である。 ARコンテンツの表示例を示す図である。テンプレートシーンの例を示す図である。テンプレートARコンテンツの例を示す図である。本技術の処理の流れの一例を示すフローチャートである。ＡＲ実施シーン環境マップ（実環境マップ）の生成処理の処理手順の一例を示すフローチャートである。ＡＲ実施シーン環境マップ（実環境マップ）の生成処理の処理手順の他の一例を示すフローチャートである。抽象表現として利用するグラフの構造に関する説明をするための図である。ＡＲ実施シーンの抽象表現の生成処理の処理手順の一例を示すフローチャートである。シーンの抽象表現の編集を介してＡＲコンテンツをマッピングするまでの処理手順の一例を示すフローチャートである。編集処理の処理手順の一例を示すフローチャートである。ＡＲ実施シーンの抽象表現の編集インタフェース提示を示す図である。テンプレートシーンおよびＡＲ実施シーンの抽象表現の編集例について説明するための図である。テンプレートシーンおよびＡＲ実施シーンの抽象表現の編集例について説明するための図である。テンプレートシーンおよびＡＲ実施シーンの抽象表現の他の編集例について説明するための図である。テンプレートシーンおよびＡＲ実施シーンの抽象表現の他の編集例について説明するための図である。表示用ＡＲコンテンツの生成処理の処理手順の一例を示すフローチャートである。テンプレートＡＲ環境マップ、ＡＲ実施シーン環境マップおよび表示用ＡＲコンテンツの一例を示す図である。テンプレートＡＲ環境マップとＡＲ実施しン環境マップにおける各物体の位置関係の例を示す図である。テンプレートＡＲコンテンツにおけるオブジェクトの位置の置換の例を示す図である。テンプレートＡＲ環境マップ、ＡＲ実施シーン環境マップおよび表示用ＡＲコンテンツの一例を示す図である。テンプレートＡＲ環境マップとＡＲ実施しン環境マップにおける各物体の位置関係の例を示す図である。テンプレートＡＲコンテンツにおけるオブジェクトの位置の置換の例を示す図である。テンプレートＡＲ環境マップ、ＡＲ実施シーン環境マップおよび表示用ＡＲコンテンツの一例を示す図である。テンプレートＡＲ環境マップとＡＲ実施しン環境マップにおける各物体の位置関係の例を示す図である。テンプレートＡＲコンテンツにおけるオブジェクトの位置の置換の例を示す図である。ＡＲグラスの構成例を示すブロック図である。情報処理装置の構成例を示すブロック図である。情報処理装置の機能構成例を示すブロック図である。テンプレート環境マップ（マップＡ）とテンプレートＡＲ抽象表現の一例を示す図である。テンプレートＡＲ抽象表現に基づくテンプレートＡＲコンテンツのマッピングの一例を示す図である。ＡＲ実施シーン環境マップ（マップＢ）と取得されたシーンの抽象表現の一例を示す図である。テンプレートＡＲ抽象表現に基づくＡＲコンテンツのマッピング(マップＡ→マップＢ)の一例を示す図である。ＡＲ実施シーン環境マップ(マップＣ)と取得されたシーンの抽象表現の一例を示す図である。複数のマッチング候補が存在する場合を示す図である。テンプレートＡＲ抽象表現に基づくＡＲコンテンツのマッピング(マップＡ→マップＣ；コンテンツ制作者の定めた条件や制約によりいずれかの候補が選択される)の一例を示す図である。ＡＲ実施シーン環境マップ(マップＣ)で取得されたシーンの抽象表現と編集された抽象表現の一例を示す図である。編集されたシーンの抽象表現に基づいて定まったＡＲコンテンツのマッピング(マップＡ→マップＣ；ユーザが意図に合わせて抽象表現を編集することでマッピング結果を多様に変えられる)の一例を示す図である。テンプレートやＡＲ実施環境の編集情報の蓄積による自動適合システムを説明するための図である。テンプレートARコンテンツ作成支援を説明するための図である。

　以下、発明を実施するための形態（以下、「実施の形態」とする）について説明する。なお、説明は以下の順序で行う。
　１．実施の形態
　２．変形例

　＜１．実施の形態＞
　［情報処理システム］
　図１は、実施の形態としての情報処理システム１０の構成例を示している。この情報処理システム１０は、ＡＲ表示装置としてのＡＲグラス１１と情報処理装置１２とが、ＬＡＮ（Local Area Network）等のネットワーク１３を介して接続された構成となっている。

　ＡＲグラス１１は、透過型の表示部を備えた眼鏡型のウェアラブル端末である。ＡＲグラス１１は、ネットワーク１３を介して行われる情報処理装置１２による制御に従って、キャラクタなどの各種のオブジェクトを含む映像を表示部に表示する。ユーザは、自分の前方の風景に重ねてＡＲコンテンツとしてのオブジェクトを見ることになる。オブジェクトを含む映像の投影方式は、虚像投影方式であってもよいし、ユーザの目の網膜に直接結像させる網膜投影方式であってもよい。

　情報処理装置１２は、ＡＲコンテンツを再生し、再生して得られた映像データをＡＲグラス１１に送信することによって、ＡＲコンテンツの映像をＡＲグラス１１において表示させる。情報処理装置１２は、例えばＰＣ（personal computer）により構成される。なお、ＡＲ表示装置はＡＲグラス１１に限定されるものではなく、このＡＲグラス１１に代えて、透過型のＨＭＤ（Head Mounted Display）やスマートフォン等であってもよい。

　図２は、ＡＲ実施シーンの一例を示している。ＡＲコンテンツを視聴するユーザが、ＡＲグラス１１を装着した状態で、図２に示すようなリビングルームにいるものとする。このＡＲ実施シーンは、ユーザがＡＲコンテンツを視聴する実際のシーンとなる。

　このＡＲ実施シーンには、物体として、床面である物体ＯT1、テーブルである物体ＯT11、椅子である物体ＯT21～ＯT24、ソファである物体ＯT12、および、観葉植物である物体ＯT13が存在する。４脚の椅子である物体ＯT21～ＯT24は、略正方形の天板を有するテーブルである物体ＯT11に正面を向けて配置されている。また、ソファである物体ＯT12は、物体ＯT11の近傍に配置されている。

　情報処理装置１２においてＡＲコンテンツの再生が行われ、ＡＲコンテンツの映像データがＡＲグラス１１に送信されてきた場合、ＡＲコンテンツの映像が、このＡＲ実施シーンに重ねて表示される。

　図３は、ＡＲコンテンツの表示例を示している。この表示例においては、オブジェクトとしての４人のキャラクタＣ1からＣ4が、それぞれ椅子である物体ＯT21～ＯT24に座っている映像が表示されている。ユーザは、前方に実際にある物体ＯT21～ＯT24にキャラクタＣ1～Ｃ4が座っている様子を見ることになる。

　キャラクタＣ1～Ｃ4を含むオブジェクトは、例えば３次元形状を有している。３次元空間上におけるユーザの位置と姿勢に応じて、大きさ、角度などのオブジェクトの見え方が異なるものとなる。

　以下、ＡＲコンテンツに含まれるオブジェクトが人型のキャラクタである場合について主に説明するが、動物、乗り物、家具、建物などの他の物体をオブジェクトとすることも可能である。

　このような映像の表示に用いられるＡＲコンテンツは、テンプレートとして予め用意されたＡＲコンテンツであるテンプレートＡＲコンテンツに基づいて、情報処理装置１２により生成される。例えば、テンプレートＡＲコンテンツにおけるオブジェクトの配置を実際のシーンに応じて変更するマッピングを行うことによって、表示用ＡＲコンテンツが生成される。

　ＡＲ実施シーンは、３次元形状の計測を行うまでは、情報処理装置１２にとっては未知シーンである。特定のシーンを想定して生成されたテンプレートＡＲコンテンツを、未知シーンに適用することによって表示用ＡＲコンテンツが生成されることになる。

　テンプレートＡＲコンテンツは、テンプレートとして想定された特定のシーンの３次元形状により表される３次元空間上にオブジェクトを配置することによって構成される。

　ここで、それぞれのシーンの３次元形状を含む環境は、環境マップにより表される。環境マップには、シーンの３次元形状を表す情報と、シーンに存在する物体に関する情報が含まれる。物体に関する情報により、物体の属性、数、位置などが表される。

　テンプレートとして想定されたシーンであるテンプレートシーンの３次元形状は、テンプレートＡＲ環境マップにより表される。このテンプレートＡＲ環境マップには、テンプレートシーンの３次元形状を表す情報と、テンプレートシーンに存在する物体に関する情報が含まれる。テンプレートシーンは、情報処理装置１２にとっては既知のシーンである。

　図４は、テンプレートシーンの一例を示している。この例のテンプレートシーンは、特定のリビングルームを想定したシーンである。このテンプレートシーンには、床面である物体ＯS1、テーブルである物体ＯS11、椅子である物体ＯS21～ＯS24が存在する。４脚の椅子である物体ＯS21～ＯS24は、円形の天板を有するテーブルである物体ＯS11に正面を向けて配置されている。

　テンプレートＡＲ環境マップにより、物体ＯS1、物体ＯS11、物体ＯS21～ＯS24のそれぞれの３次元形状（テンプレートシーンの３次元形状）、属性、数、位置などが表される。

　図５は、テンプレートＡＲコンテンツの一例を示している。このテンプレートＡＲコンテンツは、３次元形状を有するオブジェクトを、テンプレートシーンに配置することによって構成される。ここでは、オブジェクトとしての４人のキャラクタＣ1～Ｃ4がそれぞれ椅子である物体ＯS21～ＯS24に座っている映像により、テンプレートＡＲコンテンツが構成されている。テンプレートＡＲコンテンツには、物体ＯS21～ＯS24に座るキャラクタＣ1～Ｃ4の映像のデータが含まれる。

　ＡＲコンテンツの再生は、このようなテンプレートシーンにおけるキャラクタの映像を含むテンプレートＡＲコンテンツを、ＡＲ実施シーンに応じて加工することによって生成された表示用ＡＲコンテンツに基づいて行われる。

　表示用ＡＲコンテンツの生成時、ＡＲ実施シーンの計測が行われ、このＡＲ実施シーンの３次元形状などを表す環境マップであるＡＲ実施シーン環境マップが生成される。このＡＲ実施シーン環境マップにより、図２の物体ＯT1、物体ＯT11、物体ＯT21～ＯT24などのそれぞれの３次元形状（実際のシーンの３次元形状）、属性、数、位置などが表される。

　また、ＡＲ実施シーンにおけるユーザの位置と姿勢が推定され、ユーザの位置と姿勢を基準としたときに、実際に存在する物体ＯT21～ＯT24にキャラクタＣ1～Ｃ4が座っているように見えるようにするための、図３の表示用ＡＲコンテンツが、図５のテンプレートＡＲコンテンツに基づいて生成される。

　このようにして生成された表示用ＡＲコンテンツが再生されることにより、図３を参照して説明したようなオブジェクトの見え方が実現されることになる。

　本技術においては、ＡＲ実施シーン環境マップに基づいてＡＲ実施シーンの抽象表現を生成し、このＡＲ実施シーンの抽象表現とテンプレートＡＲ抽象表現を比較し、その比較結果に基づいてテンプレートＡＲコンテンツをＡＲ実施シーンにマッピングして表示用コンテンツを生成する。また、本技術においては、ＡＲ実施シーンの抽象表現またはテンプレートＡＲ抽象表現を必要に応じて編集する。

　「本技術の処理」
　図６のフローチャートは、本技術の処理の流れの一例を示している。この図６のフローチャートにおける各処理が、例えば、情報処理装置１２により行われる。

　ステップＳＴ１１の処理では、ＡＲ実施シーン環境マップが生成される。このＡＲ実施シーン環境マップは、ＡＲ実施シーンの情報（ＲＧＢカメラ、デプスセンサ、ＬｉＤＡＲなどの各種センサによって取得された時系列のＲＧＢ画像、距離画像、点群など）に基づいて生成される。このＡＲ実施シーン環境マップの生成は、例えば、非特許文献（G. Narita et al. Panopticfusion: Online volumetric semantic mapping at the level of stuff and things. In IEEE/RSJ Int. Conf. on Intelligent Robots and Systems (IROS), 2019）等に記載されているような方法で行うことができる。

　このＡＲ実施シーン環境マップは、３次元幾何情報や意味的情報を含む属性、個数などが関連付けられたシーンやシーン中に存在する１つ以上の物体と、それら物体同士の相対的な位置関係で構成される。３次元幾何情報の表現方法としては、ボクセル空間や打ち切り符号付き距離を利用する手法が例として挙げられるが、必ずしもそれらに限定されない。

　属性は、物体のカテゴリや物体ＩＤ、材質、色、アフォーダンスなどの識別可能なラベル表現として定義される。物体同士の相対的な位置関係は、例えば、単なる同一座標系内おける各物体の位置や、物体の向きも含めた位置、姿勢（回転と並進）で表される。

　図７のフローチャートは、ＡＲ実施シーン環境マップ（実環境マップ）の生成処理の処理手順の一例を示している。ＡＲ実施シーン環境マップの生成は、ＲＧＢ画像、距離画像、点群データなどを含むＡＲ実施シーン情報に基づいて行われる。例えば、ＡＲグラス１１から情報処理装置１２には、ＡＲ実施シーン情報が所定の周期で繰り返し送信されてくる。

　例えば、ＡＲ実施シーンに存在する物体表面までの打ち切り符号付き距離と、そのＡＲ実施シーンに存在する物体を一意に区別するための物体ＩＤとを格納するボクセル（voxel）から構成されるボクセル空間が用意される。また、各物体の属性を管理する物体属性テーブルが用意される。

　最初に、矢印Ａ１１の先に示すように、ステップＳＴ３１の処理として、情報処理装置１２は、ＲＧＢ画像、距離画像、点群データに基づいて、画像や点群により表される物体の領域分割、属性推定、および物体ＩＤ推定を行う。領域分割により、実際のシーンに存在する各物体の領域が特定される。また、属性推定により、物体の属性が推定される。情報処理装置１２は、画像や点群データにより表される形状などの特徴に基づいて物体の属性を推定するためのデータを有している。

　物体ＩＤ推定により、領域が特定されるとともに属性が推定されたそれぞれの物体の物体ＩＤが推定される。物体ＩＤ推定は、物体に付与された物体ＩＤとの整合性をとるために必要な処理であり、適宜、矢印Ａ１２に示すように、ボクセル空間に既に格納されている物体ＩＤを参照して行われる。また、時系列データとして入力される画像や点群データに基づいて物体追跡処理を行い、物体追跡の結果に基づいて、物体ＩＤが推定されるようにしてもよい。

　矢印Ａ１３の先に示すように、ステップＳＴ３２の処理として、情報処理装置１２は、物体ＩＤ推定により推定された物体ＩＤを、距離画像または点群データに基づいてボクセル空間に格納する。物体ＩＤが、物体までの距離に対応する位置のボクセルの情報として設定される。

　矢印Ａ１４の先に示すように、情報処理装置１２は、物体毎の属性推定の結果と、物体ＩＤ推定の結果を物体属性テーブルに格納する。物体属性テーブルにおいては、物体ＩＤと対応付けて、それぞれの物体の属性が管理される。

　矢印Ａ１５の先に示すように、ステップＳＴ３３の処理として、情報処理装置１２は、ＲＧＢ画像、距離画像、点群データに基づいて、各物体の物体表面までの打ち切り符号付き距離を計算し、ボクセル空間に格納する。ボクセル空間を構成するボクセルに格納された情報により、各ボクセルに対応する位置にある物体のＩＤが表される。

　打ち切り符号付き距離の計算方法およびボクセル空間への格納方法は、例えば、非特許文献（Newcombe, Richard A., et al. "KinectFusion: Real-time dense surface mapping and tracking." Mixed and augmented reality (ISMAR), 2011 10th IEEE international symposium on. IEEE, 2011）に開示されている。

　矢印Ａ１６、Ａ１７の先に示すように、ステップＳＴ３４の処理として、情報処理装置１２は、ボクセル空間の情報と物体属性テーブルの情報を統合し、ＡＲ実施シーンの３次元形状と、ＡＲ実施シーンに存在する各物体の属性、位置、および物体同士の相対的な位置関係とを抽出する。情報処理装置１２は、矢印Ａ１８の先に示すように、抽出した情報を含む情報をＡＲ実施シーン環境マップとして格納する。

　図８のフローチャートは、ＡＲ実施シーン環境マップ（実環境マップ）の生成処理の処理手順の他の一例を示している。この生成処理は、打ち切り符号付き距離のボクセル空間への格納を先に行い、ボクセル空間に格納された情報に基づいて、物体の領域分割、属性推定、物体ＩＤ推定などを行う処理である。

　すなわち、矢印Ａ３１の先に示すように、ステップＳＴ４１の処理として、情報処理装置１２は、ＲＧＢ画像、距離画像、点群データに基づいて、各物体の物体表面までの打ち切り符号付き距離を計算し、ボクセル空間に格納する。

　ステップＳＴ４２において、情報処理装置１２は、打ち切り符号付き距離の配列、点群データ、メッシュなどをボクセル空間から抽出し、抽出した情報に基づいて、物体の領域分割、属性推定、物体ＩＤ推定を行う。

　以降の処理は、図７のフローチャートを参照して説明した処理と同様の処理である。すなわち、ステップＳＴ４３の処理として、情報処理装置１２は、物体ＩＤ推定により推定された物体ＩＤをボクセル空間に格納する。矢印Ａ３２の先に示すように、情報処理装置１２は、物体毎の属性推定の結果と、物体ＩＤ推定の結果を物体属性テーブルに格納する。

　矢印Ａ３３、Ａ３４の先に示すように、ステップＳＴ４４の処理として、情報処理装置１２は、ボクセル空間の情報と物体属性テーブルの情報を統合し、ＡＲ実施シーンの３次元形状と、ＡＲ実施シーンに存在する各物体の属性、位置、および物体同士の相対的な位置関係とを抽出する。情報処理装置１２は、矢印Ａ３５の先に示すように、抽出した情報を含む情報をＡＲ実施シーン環境マップとして格納する。

　このように、ＡＲ実施シーン環境マップの生成に関する各ステップの処理は、適宜、順番を変更することが可能である。また、ＡＲ実施シーン環境マップの生成処理に用いる技術として、カメラにより撮影されたＲＧＢ画像や各種のセンサの計測結果に基づいて、ＡＲ実施シーンの３次元形状などを推定する各種の技術を採用することが可能である。

　図６の説明に戻り、ステップＳＴ１２の処理では、ＡＲ実施シーン環境マップに基づいて、ＡＲ実施シーンの抽象表現が生成される。このＡＲ実施シーンの抽象表現は、ＡＲ実施シーンに存在する物体やユーザをノードとし、それらのノード間をラベル付きエッジや関係ノードを介して接続したグラフ構造を持つ表現として定義される。

　この場合、関係を持たないノード同士は接続関係を持たない。また、物体間の関係は、一例として、自然言語による抽象的な記述を用いた表現で表される。例えば、リビングシーンに存在する椅子がテーブルと近い距離に配置されている場合、椅子ノードとテーブルノードの間に「近い」という関係ラベルを用いた接続関係を定義できる。

　事前に定義された物体間の関係を推定するには、取得された環境マップから関係の主体と客体に対応する物体単位の３次元情報およびそれらの位置、姿勢情報などを抽出し、互いの距離や向きの情報を利用すればよい。この際、必要であれば密な環境マップの物体の３次元情報を“3D bounding box”などを用いて抽象化、簡単化してもよい。

　また、両物体の距離や向きの情報を基にした関係の推定は、例えば、ユークリッド距離や各物体の正面方向に対応するベクトルのなす角を計算して、適当に定めたしきい値処理を行えばよい。この際に、環境マップを取得する際に計測した情報(例えばＲＧＢ－Ｄ画像系列など)を利用してもよく、それらを入力としたニューラルネットワークを用いて推論してもよい。

　代表的な関係ラベルとしては、空間的な位置関係を表すラベル(front/behind/left/right/on/above/under/near etc.)が挙げられる。その他、主体の客体に対する述語関係やそれらに伴う状態を関係ラベルとして取り扱ってもよい。この例としては、「椅子は座面を「持っている(has)」」や「仮想キャラクタは椅子に「座っている(sitting)」」などがある。

　また、物体間の関係は、複数の物体で構成されるグループ単位で定義されてもよい。これには、例えば、「テーブルが椅子に「囲まれている」」といったものがある。グループ単位で定義される関係は、１対1の物体間の関係を統合した結果として取得してもよく、最初から複数の物体の情報を全て用いて推定してもよい。

　抽象表現として利用するグラフの構造としては、物体をノードとしてそれらの関係をエッジのラベルで定義した表現に加えて、例えば、非特許文献（J. Johnson et al. Image Retrieval using Scene Graphs. In Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition (CVPR), pages 3668?3678. IEEE, 2015）で提案されている物体、属性、関係をノードとして相互に接続した有向グラフ表現を用いることができる。また、例えば、非特許文献（R. Ma et al. Language-Driven Synthesis of 3D Scenes from Scene Databases. SIGGRAPHASIA, 2018）のように複数の物体間の関係を集約する関係ノードを用いて表現してもよい。

　グラフ同士のマッチングが得られるのであれば、１つのシーンを物体のまとまり毎に分割したサブシーン単位でグラフを持ち、複数のグラフの集合で１つのシーンを抽象的に記述してもよい。また、1つの物体をパーツや領域ごとに分割して複数のノードの集合としてもよく（図９（ａ）参照）、上位概念で階層化されたグラフであってもよい（図９（ｂ）参照）。

　図１０のフローチャートは、ＡＲ実施シーンの抽象表現の生成処理の処理手順の一例を示している。

　まず、情報処理装置１２は、ステップＳＴ５１において、必要に応じて環境マップの持つ３次元データに対して、ダウンサンプルやノイズ除去の処理をする。次に、情報処理装置１２は、ステップＳＴ５２において、物体のインスタンス（個々の識別物体）毎に、３次元計測情報（点群/Voxelなど）を分割する。

　次に、情報処理装置１２は、ステップＳＴ５３において、必要に応じて、物体の３次元位置情報を例えば“3D bounding box”などを用いて抽象化する。次に、情報処理装置１２は、ステップＳＴ５４において、物体ペアあるいは複数の物体の３次元位置および姿勢を基に、対応する関係を推定する。次に、情報処理装置１２は、ステップＳＴ５５において、推定された全ての物体間関係情報からＡＲ実施シーンの抽象表現データを構成する。

　図６の説明に戻り、テンプレートＡＲデータ群は、情報処理装置１２が保持するものであり、所定数のテンプレートＡＲデータからなっている。それぞれのテンプレートＡＲデータは、テンプレートＡＲ環境マップ、テンプレートＡＲ抽象表現およびテンプレートＡＲコンテンツを含んでいる。

　テンプレートＡＲ環境マップは、上述したＡＲ実施シーン環境マップと同様に、３次元幾何情報や意味的情報を含む属性、個数などが関連付けられたシーンやシーン中に存在する１つ以上の物体と、それら物体同士の相対的な位置関係で構成される。このテンプレートＡＲ環境マップは、ＡＲ実施を想定したＡＲ実施シーンを事前計測することで取得してもよく、また３ＤＣＡＤ（３次元ＣＡＤ）モデルをゲームエンジン等の仮想空間に配置することで取得してもよい。

　テンプレートＡＲ抽象表現は、テンプレートＡＲ環境マップに基づいて、上述したＡＲ実施シーンの抽象表現と同様にして生成される。このテンプレートＡＲ抽象表現は、テンプレートシーンに存在する物体やユーザ、さらにはＡＲコンテンツ提示に用いられるキャラクタ等の仮想オブジェクトをノードとし、それらのノード間をラベル付きエッジや関係ノードを介して接続したグラフ構造を持つ表現として定義される。テンプレートＡＲコンテンツは、テンプレートＡＲ環境マップにより３次元形状などが表されるテンプレートシーンに仮想オブジェクトが配置されることによって構成される。

　ステップＳＴ１３の処理では、ＡＲ実施シーンの抽象表現とこのＡＲ実施シーンで利用するテンプレートＡＲコンテンツに対応したテンプレートＡＲ抽象表現が比較提示され、必要に応じて、ユーザにより抽象表現の編集が行われる。

　テンプレートＡＲ抽象表現から仮想オブジェクトを除いた構造がＡＲ実施シーン抽象表現に含まれる（部分的に同型である）場合、ＡＲ実施シーンの物体ノードとテンプレートＡＲコンテンツの物体ノードを対応させるようにコンテンツをマッピングすることで、テンプレートＡＲコンテンツの別空間での再生を実現できる。

　一方で、ＡＲ実施シーン（実環境）では、上述の通り、必ずしもテンプレートＡＲコンテンツに予め設定されたコンテキスト（シーン条件）を再現した状況を準備できるとは限らない。これは、ＡＲ実施シーンの抽象表現に、テンプレートＡＲ抽象表現が、必ずしも含まれないことに相当する。このような場合に各シーンの抽象表現を編集することで、個別のＡＲ実施シーンに応じたＡＲ適合表示の実現が可能となる。

　図１１のフローチャートは、シーンの抽象表現の編集を介してＡＲコンテンツをマッピングするまでの処理手順の一例を示している。情報処理装置１２は、ステップＳＴ６１において、ＡＲ実施シーンとテンプレートＡＲ環境マップに基づいて、ＡＲ実施シーンとテンプレートＡＲ抽象表現を取得する。

　次に、情報処理装置１２は、ステップＳＴ６２において、ユーザが入力インタフェース（ユーザインタフェース）を介して、例えば映像表示部によりユーザに比較提示（並列提示）されている抽象表現における編集対象の物体ＩＤを指定し、その編集対象の関係や属性のラベルを上書きする。この編集は、ＡＲ実施シーンの抽象表現またはテンプレートＡＲ抽象表現に、あるいはそれらの双方に対して行われる。この編集により、例えば、ＡＲ実施シーンの抽象表現に、テンプレートＡＲ抽象表現が１つだけ含まれるようにすることができる。

　次に、情報処理装置１２は、ステップＳＴ６３において、上書きされた抽象表現を用いてＡＲ実施シーンとテンプレート間での各物体の対応関係を取得する。次に、情報処理装置１２は、ステップＳＴ６４において、取得した対応関係を基に、テンプレートＡＲ環境マップ上の物体をＡＲ実施シーンの環境マップ上の物体に置き換えるマッピングを行って、表示用ＡＲコンテンツを作成する。これにより、ＡＲ実施シーンにおけるＡＲコンテンツの表示が可能となる。

　図１２のフローチャートは、編集処理の処理手順の一例を示している。なお、各処理のステップは必ずしも、図１２に示した順番に限定されないものとする。

　ＡＲ実施シーンの抽象表現とテンプレートＡＲ抽象表現がそれぞれ入力された際に、ユーザはそれらの抽象表現をそのまま用いるかどうかを決めることができる（ステップＳＴ７１，７２）。この場合、例えば、ＡＲ実施シーンの抽象表現およびテンプレートＡＲ抽象表現が並べてユーザに提示（表示）される。この提示により、ユーザは、抽象表現の変更操作を容易かつ適切に行うことが可能となる。

　また、この場合、例えば、ＡＲ実施シーンの抽象表現にテンプレートＡＲ抽象表現に対応した部分的同型部分が複数存在する場合には、複数の部分的同型部分が、ユーザが認識可能に提示される。この提示により、ユーザは、複数の部分的同型部分の認識を容易に行うことができ、テンプレート拡張現実コンテンツをユーザの意図に沿った適切な表示とするための抽象表現の変更操作を効率よく行うことが可能となる。

　抽象表現をそのまま用いる場合は、２つの抽象表現を比較してマッチングを解く処理（ステップＳＴ７３）に遷移する。一方、抽象表現をそのまま用いない場合は、この時点で、ユーザがそれぞれの抽象表現を編集することができる（ステップＳＴ７４、ステップＳＴ７５）。

　抽象表現の編集は、シーンの状態を可視化したＧＵＩ（Graphical User Interface）によるグラフ編集操作で行われてもよい。この編集には、例えば、ノード間の関係を変更する操作や、ノードの属性を変更する操作が含まれる。図１３は、ＡＲ実施シーンにおけるユーザへの抽象表現の編集インタフェース提示を示している。図１３（ａ）はＡＲ実施シーンの一例を示し、図１３（ｂ）は映像表示装置（ディスプレイ、ＨＭＤ、ＡＲグラスなど）を利用した抽象表現の編集工程提示の一例を概略的に示している。

　この場合、ディスプレイやＨＭＤ、ＡＲグラス、あるいはプロジェクタ投映等により提示されたシーンの抽象表現を可視化したインタフェースを、ユーザが直感的に操作する(例えば関係を表すエッジそのものや、個別のラベルをタッチ操作する)ことで編集（例えば、削除など）できてもよい。

　この際に、予め両者のマッチング問題を解いておき、グラフ構造が一致しない場所を色で強調するなど、ユーザに視覚的にわかりやすい提示を用いてもよい。また、物体間の関係や物体の属性などのラベルの追加、編集にはテキストでの入力やユーザが発話した音声を認識して入力するシステムを備えていてもよい。また、システム側がシーンの抽象表現を基に代替できる物体を探索して、ユーザに提示してもよい。

　ステップＳＴ７３で、２つの抽象表現を比較してのマッチングを解く処理を行った後、情報処理装置１２は、ＡＲ実施シーンの抽象表現にテンプレートＡＲ抽象表現が含まれるか、つまる部分的に同型であるかを判断する（ステップＳＴ７６）。ＡＲ実施シーンの抽象表現にテンプレートＡＲ抽象表現が含まれるとき、情報処理装置１２は、表示用ＡＲコンテンツを作成する処理に遷移する（ステップＳＴ８２）。

　ステップＳＴ７６の処理でＡＲ実施シーンの抽象表現にテンプレートＡＲ抽象表現が含まれていないとき、情報処理装置１２は、ＡＲ実施シーン環境マップに代替できそうな属性、関係を持つオブジェクトが存在するかを判断する（ステップＳＴ７７）。ＡＲ実施シーン環境マップに代替できそうな属性、関係を持つオブジェクトが存在するとき、情報処理装置１２は、表示用ＡＲコンテンツを作成する処理に遷移する（ステップＳＴ８２）。

　ステップＳＴ７７の処理でＡＲ実施シーン環境マップに代替できそうな属性、関係を持つオブジェクトが存在しないとき、情報処理装置１２は、ＡＲ実施シーンの抽象表現を編集するか判断する（ステップＳＴ７８）。この判断は、ユーザの編集指示に基づいて行われる。ＡＲ実施シーンの抽象表現を編集するとき、情報処理装置１２は、ステップＳＴ７１の処理に戻る。

　ステップＳＴ７８の処理でＡＲ実施シーンの抽象表現を編集しないとき、情報処理装置１２は、テンプレートＡＲ抽象表現を編集するか判断する（ステップＳＴ７９）。この判断は、ユーザの編集指示に基づいて行われる。テンプレートＡＲ抽象表現を編集するとき、情報処理装置１２は、ステップＳＴ７２の処理に戻る。

　ステップＳＴ７９の処理でＡＲ実施シーンの抽象表現を編集しないとき、情報処理装置１２は、ＡＲ実施シーンに仮想オブジェクトで代替できる空間があるか判断する（ステップＳＴ８０）。ＡＲ実施シーンに仮想オブジェクトで代替できる空間があるとき、情報処理装置１２は、表示用ＡＲコンテンツを作成する処理に遷移する（ステップＳＴ８２）。

　ステップＳＴ８０でＡＲ実施シーンに仮想オブジェクトで代替できる空間がないとき、情報処理装置１２は、表示用ＡＲコンテンツを作成しないこととする（ステップＳＴ８１）。この場合、ＡＲ実施シーンへのテンプレートＡＲコンテンツに基づくＡＲコンテンツの表示はされないことになる。

　図１４を参照して、テンプレートシーンおよびＡＲ実施シーンの抽象表現の編集例について説明する。この編集例は、テンプレートＡＲコンテンツ「仮想キャラクタがユーザの近くの椅子に座る」を複数の椅子候補がある状況で表示する場合の例である。図１４の左側はテンプレートＡＲ抽象表現を表し、図１４の右側はＡＲ実施シーンの抽象表現を表している。

　テンプレートＡＲ抽象表現では、「ユーザ」、「椅子」、「仮想キャラクタ」の３つのノードが存在する。そして、テンプレートＡＲ抽象表現では、「椅子」は「ユーザ」の近くに存在し、「仮想キャラクタ」は「椅子」に座る、ことを表している。

　一方、ＡＲ実施シーンの抽象表現では、「ユーザ」、「椅子Ａ」、「椅子Ｂ」、「椅子Ｃ」の４つのノードが存在する。そして、「椅子Ａ」は「ユーザ」の左側で近くに存在し、「椅子Ｂ」は「ユーザ」の前側で近くに存在し、「椅子Ｃ」は「ユーザ」の右側で近くに存在している、ことを表している。

　この場合、テンプレートＡＲ抽象表現から「仮想キャラクタ」を除いた構造が、ＡＲ実施シーンの抽象表現には、３か所存在する。つまり、「ユーザ」と「椅子Ａ」の部分、「ユーザ」と「椅子Ｂ」の部分、「ユーザ」と「椅子Ａ」の部分である。

　この状態で何ら編集を行わないとすると、後述する表示用ＡＲコンテンツの生成処理におけるマッピングでは、仮想キャラクタは、コンテンツ製作者が事前に設定しておいた条件やシーンのコンテキスト情報などを基に、候補の中から選択して座ることになる。しかし、その選択結果がユーザの意図した通りの結果である保証はなく、ユーザは具体的な条件を知らない限り制御できない。

　この場合、編集処理では、ＡＲ実施シーンの抽象表現とテンプレートＡＲ抽象表現を比較して、ユーザが意図した椅子に仮想キャラクタが座れるように、ＡＲ実施シーンの抽象表現またはテンプレートＡＲ抽象表現を変更する操作を行うことができる。

　図１５（ａ）は、テンプレートＡＲ抽象表現に対して変更操作を行った例である。この場合、「椅子」の「ユーザ」を基準とする関係として、「近い」に加えて、「前側」が追加されている。これにより、テンプレートＡＲ抽象表現から「仮想キャラクタ」を除いた構造が、ＡＲ実施シーンの抽象表現における「ユーザ」と「椅子Ｂ」の部分のみに該当する状態となり、仮想キャラクタをユーザが意図した椅子Ｂに座らせることが可能となる。

　図１５（ｂ）は、ＡＲ実施シーンの抽象表現に対して変更操作を行った例である。この場合、「椅子Ａ」の「ユーザ」を基準とする関係として、「近い」と「左側」から、「近い」が削除され、また「椅子Ｃ」の「ユーザ」を基準とする関係として、「近い」と「右側」から、「近い」が削除されている。これにより、テンプレートＡＲ抽象表現から「仮想キャラクタ」を除いた構造が、ＡＲ実施シーンの抽象表現における「ユーザ」と「椅子Ｂ」の部分のみに該当する状態となり、仮想キャラクタをユーザが意図した椅子Ｂに座らせることが可能となる。

　次に、図１６を参照して、テンプレートシーンおよびＡＲ実施シーンの抽象表現の他の編集例について説明する。この編集例は、テンプレートＡＲコンテンツ「ユーザの近くのテーブルの上に仮想物体を表示する」をテーブルではなくキャビネットがある状況で表示する場合の例である。図１６の左側はテンプレートＡＲ抽象表現を表し、図１６の右側はＡＲ実施シーンの抽象表現を表している。

　テンプレートＡＲ抽象表現では、「ユーザ」、「キャビネット」、「仮想物体」の３つのノードが存在する。そして、テンプレートＡＲ抽象表現では、「椅子」は「ユーザ」の近くに存在し、「仮想物体」は「キャビネット」の上に表示される、ことを表している。一方、ＡＲ実施シーンの抽象表現では、「ユーザ」、「テーブル」の２つのノードが存在する。そして、「テーブル」は「ユーザ」の近くに存在している、ことを表している。

　この状態で何ら編集を行わないとすると、後述する表示用ＡＲコンテンツの生成処理においては、ＡＲ実施シーンがテンプレートＡＲコンテンツの想定する状況と異なるため、そのままテンプレートＡＲコンテンツをＡＲ実施シーンにマッピングすることはできない。

　この場合、テンプレートシーンおよびＡＲ実施シーンの抽象表現の両者に共通した高次の属性(上面に物を置くことができる、など)を事前に定義しておけば、それを利用してマッピングを行うことができる。

　図１７（ａ）は、テンプレートＡＲ抽象表現に対して変更操作を行った例である。この場合、テンプレートＡＲ抽象表現における「キャビネット」が「テーブル」という属性に変更されている。これにより、テンプレートＡＲ抽象表現から「仮想物体」を除いた構造が、ＡＲ実施シーンの抽象表現における「ユーザ」と「テーブル」の部分に該当する状態となり、テンプレートＡＲコンテンツをＡＲ実施シーンにマッピングすることが可能となる。

　図１７（ｂ）は、ＡＲ実施シーンの抽象表現に対して変更操作を行った例である。この場合、ＡＲ実施シーンの抽象表現における「テーブル」が「キャビネット」という属性に変更されている。これにより、テンプレートＡＲ抽象表現から「仮想物体」を除いた構造が、ＡＲ実施シーンの抽象表現における「ユーザ」と「キャビネット」の部分に該当する状態となり、テンプレートＡＲコンテンツをＡＲ実施シーンにマッピングすることが可能となる。

　図６の説明に戻り、ステップＳＴ１４では、ステップＳＴ１３における編集処理を経た後のテンプレートＡＲとＡＲ実施シーンの抽象表現、ＡＲ実施シーンの環境マップ、テンプレートＡＲ環境マップ、および、テンプレートＡＲコンテンツに基づいて、表示用ＡＲコンテンツの生成が行われる。表示用ＡＲコンテンツの生成は、テンプレートＡＲ抽象表現とＡＲ実施シーンの抽象表現とを比較し、その比較結果（対応関係）を基にテンプレートＡＲ環境マップ上の物体をＡＲ実施シーンの環境マップ上の物体に置き換えるマッピングをすることによって行われる。

　図１８のフローチャートは、表示用ＡＲコンテンツの生成処理の処理手順の一例を示している。ステップＳＴ９１において、情報処理装置１２は、テンプレートＡＲ抽象表現により表される物体ＯS_iと同一の属性Ｘ_iを有する物体ＯT_iを、ＡＲ実施シーンの抽象表現により表される、ＡＲ実施シーンに存在する物体ＯT_iの中から検索する。

　ステップＳＴ９２において、情報処理装置１２は、検索された物体ＯT_iの数、および、物体ＯT_iの相対的な位置関係が、それぞれ、テンプレートＡＲ抽象表現により表される、属性Ｘ_iを有する物体ＯS_iの数、および、物体ＯS_iの相対的な位置関係と一致するか否かを判定する。

　ここでは、同じ属性の物体が同じ数だけテンプレートシーンとＡＲ実施シーンのそれぞれにあり、かつ、同じ属性の物体のテンプレートシーンにおける位置関係とＡＲ実施シーンにおける位置関係が同じである場合に、条件を満たすものとして判定される。物体の位置関係については、完全に同じである必要はなく、位置関係の類似度が閾値以上高い場合に、条件を満たすものとして判定されるようにしてもよい。

　検索された物体ＯT_iの数および相対的な位置関係が、それぞれ、物体ＯS_iの数および相対的な位置関係と一致するとステップＳＴ９２において判定された場合、情報処理装置１２はステップＳＴ９３の処理に進む。

　ステップＳＴ９３において、情報処理装置１２は、テンプレートＡＲコンテンツにおける、物体ＯS_iの位置を基準としたオブジェクトの位置を、物体ＯT_iの位置を基準とした位置に置換することによって、表示用ＡＲコンテンツを生成する。表示用ＡＲコンテンツにおけるオブジェクトと物体ＯT_iとの間の位置関係は、テンプレートＡＲコンテンツにおけるオブジェクトと物体ＯS_iとの間の位置関係と同じ位置関係となる。

　図１９は、テンプレートＡＲ環境マップ、ＡＲ実施シーン環境マップおよび表示用ＡＲコンテンツの一例を示している。なお、ここで、テンプレートＡＲおよびＡＲ実施シーンの環境マップは編集処理を経た後の抽象表現に対応したものであるとする。

　図１９の上段に示すテンプレートＡＲ環境マップは、床面上に１つのテーブルと４脚の椅子が存在し、かつ、４脚の椅子がテーブルを囲んでいる、図４に示すテンプレートシーンを表す。また、図１９の中段に示すＡＲ実施シーン環境マップは、床面上に１つのテーブルと４脚の椅子が存在し、かつ、４脚の椅子がテーブルを囲んでいる、図２に示すＡＲ実施シーンを表す。

　このようなテンプレートＡＲ環境マップ用意されている場合、物体ＯS_iと同一の属性Ｘ_iを有する物体ＯT_iとして、物体ＯS11（図４）と同一の「テーブル」の属性を有する物体ＯT11（図２）が検索される。また、物体ＯS21と同一の「椅子」の属性を有する物体ＯT21、物体ＯS22と同一の「椅子」の属性を有する物体ＯT22、物体ＯS23と同一の「椅子」の属性を有する物体ＯT23、および、物体ＯS24と同一の「椅子」の属性を有する物体ＯT24が、それぞれ検索される。

　また、テンプレートシーンにおける物体ＯS11（テーブル）と物体ＯS21～ＯS24（椅子）の数、およびそれぞれの位置関係は、ＡＲ実施シーンにおける物体ＯT11（テーブル）と物体ＯT21～ＯT24（椅子）の数、およびそれぞれの位置関係と同一であると判定される。

　図２０は、テンプレートＡＲ環境マップとＡＲ実施シーンの環境マップにおける各物体の位置関係の例を示す図である。テンプレートＡＲ環境マップにより表される、テンプレートシーンにおける物体ＯS11と物体ＯS21～ＯS24の位置関係は、図２０の左側に示すような位置関係となる。一方、ＡＲ実施シーン環境マップにより表される、ＡＲ実施シーンにおける物体ＯT11と物体ＯT21～ＯT24の位置関係は、図２０の右側に示すような位置関係となる。なお、図２０において、物体ＯS21～ＯS24と物体ＯT21～ＯT24の近傍に示す矢印は椅子の向きを表す。

　テンプレートシーンにおける物体ＯS11と物体ＯS21～ＯS24の位置関係は、ＡＲ実施シーンにおける物体ＯT11と物体ＯT21～ＯT24の位置関係と、同じ「テーブル」の属性を有する物体を囲む位置に４脚の椅子が存在するという点で同一である。

　この場合、図１９の下段に示すように、テーブルを囲む４脚の椅子に、異なる４人のキャラクタをそれぞれ着席させる見え方を実現する表示用ＡＲコンテンツがテンプレートＡＲコンテンツに基づいて生成される。ここで、４人のキャラクタを着席させることに用いられる椅子は、ＡＲ実施シーンに存在する物体ＯT21～ＯT24である。

　図２１は、テンプレートＡＲコンテンツにおけるオブジェクトの位置の置換の例を示す図である。図２０に示す位置関係を各物体が有している場合、テンプレートＡＲコンテンツにおいて物体ＯS21に着席するキャラクタＣ1の位置は、図２１の矢印Ａ１０１で示すように、物体ＯT21の位置に置換される。図２１において、各キャラクタの位置は、所定の模様を付した円で表される。テンプレートＡＲコンテンツにおいて、キャラクタＣ1の位置は物体ＯS11や物体ＯS21の位置を基準として設定されるが、それと同じ位置関係が、物体ＯT11や物体ＯT21の位置を基準として維持される。

　同様に、テンプレートＡＲコンテンツにおいて物体ＯS22に着席するキャラクタＣ2の位置は、矢印Ａ１０２で示すように物体ＯT22の位置に置換される。また、テンプレートＡＲコンテンツにおいて物体ＯS23に着席するキャラクタＣ3の位置は、矢印Ａ１０３で示すように物体ＯT23の位置に置換される。テンプレートＡＲコンテンツにおいて物体ＯS24に着席するキャラクタＣ4の位置は、矢印Ａ１０４で示すように物体ＯT24の位置に置換される。

　このようにして位置が置換されることによって生成された表示用ＡＲコンテンツが再生されることにより、図３を参照して説明したようなキャラクタＣ1～Ｃ4の見え方が実現されることになる。

　図１８の説明に戻り、ステップＳＴ９２において、検索された物体ＯT_iの数および相対的な位置関係が、それぞれ、物体ＯS_iの数および相対的な位置関係と一致しないと判定された場合、情報処理装置１２は、ステップＳＴ９４の処理に進む。

　ステップＳＴ９４において、情報処理装置１２は、テンプレートＡＲ抽象表現により表される物体ＯS_iと類似する属性Ｘ’_iを有する物体ＯT’_iを、ＡＲ実施シーンの抽象表現により表される、ＡＲ実施シーンに存在する物体ＯT_iの中から検索する。

　属性Ｘ_iと類似する属性Ｘ’_iについては、例えば、テンプレートＡＲコンテンツの生成時にテーブル等で予め定義されている。表示用ＡＲコンテンツの生成時にユーザにより属性Ｘ’_iが指定されるようにしてもよい。

　ステップＳＴ９５において、情報処理装置１２は、検索された物体ＯT’_iを含めて、物体ＯT_iの数、および、物体ＯT_iの相対的な位置関係が、それぞれ、テンプレートＡＲ抽象表現により表される、属性Ｘ_iを有する物体ＯS_iの数、および、物体ＯS_iの相対的な位置関係と一致するか否かを判定する。

　ここでは、類似する属性の物体を含めて、同一の属性の物体が同じ数だけテンプレートシーンとＡＲ実施シーンのそれぞれにあり、かつ、それぞれの物体のテンプレートシーンにおける位置関係とＡＲ実施シーンにおける位置関係が同じである場合に、条件を満たすものとして判定される。

　物体ＯT_iの数および相対的な位置関係が、それぞれ、物体ＯS_iの数および相対的な位置関係と一致するとステップＳＴ９５において判定された場合、情報処理装置１２は、ステップＳＴ９３の処理に進む。

　ステップＳＴ９３においては、上述した処理と同様に、テンプレートＡＲコンテンツにおける、物体ＯS_iの位置を基準としたオブジェクトの位置を、物体ＯT_iの位置を基準とした位置に置換することによって、表示用ＡＲコンテンツが生成される。

　図２２は、テンプレートＡＲ環境マップ、ＡＲ実施シーン環境マップおよび表示用ＡＲコンテンツの一例を示している。なお、ここで、テンプレートＡＲおよびＡＲ実施シーンの環境マップは編集処理を経た後の抽象表現に対応したものであるとする。

　図２２の上段に示すテンプレートＡＲ環境マップは、床面上に１つのテーブルと４脚の椅子が存在し、かつ、４脚の椅子がテーブルを囲んでいる、図４に示すテンプレートシーンを表す。また、図２２の中段に示すＡＲ実施シーン環境マップは、床面が存在するとともに、床面上に１つのテーブルと４脚の椅子、および、１脚のソファが存在するシーンを表す。この例においては、４脚の椅子のうちの３脚の椅子はテーブルを囲んでいるものの、１脚の椅子はテーブルから離れた位置にあるものとされている。また、１脚のソファはテーブルの近傍にあるものとされている。

　このようなテンプレートＡＲ環境マップ用意されている場合、物体ＯS_iと同一の属性Ｘ_iを有する物体ＯT_iとして、物体ＯS11（図４）と同一の「テーブル」の属性を有する物体ＯT11が検索される。また、物体ＯS21と同一の「椅子」の属性を有する物体ＯT21、物体ＯS22と同一の「椅子」の属性を有する物体ＯT22、物体ＯS23と同一の「椅子」の属性を有する物体ＯT23、および、物体ＯS24と同一の「椅子」の属性を有する物体ＯT24が、それぞれ検索される。

　また、テンプレートシーンにおける物体ＯS11（テーブル）と物体ＯS21～ＯS24（椅子）の数、およびそれぞれの位置関係は、ＡＲ実施シーンにおける物体ＯT11（テーブル）と物体ＯT21～ＯT24（椅子）の数、およびそれぞれの位置関係と同一ではないと判定される。

　図２３は、テンプレートＡＲ環境マップとＡＲ実施シーンの環境マップにおける各物体の位置関係の例を示す図である。図２３の左側に示す、テンプレートＡＲ環境マップにより表される、テンプレートシーンにおける物体ＯS11と物体ＯS21～ＯS24の位置関係は、図２０を参照して説明した位置関係と同じである。一方、ＡＲ実施シーン環境マップにより表される、ＡＲ実施シーンにおける物体ＯT11と物体ＯT21～ＯT24の位置関係は、図２３の右側に示すような位置関係となる。ＡＲ実施シーンには、ソファである物体ＯT12も存在する。

　テンプレートシーンにおける物体ＯS11と物体ＯS21～ＯS24の位置関係は、ＡＲ実施シーンにおける物体ＯT11と物体ＯT21～ＯT24の位置関係と、１脚の「椅子」である物体ＯT24が離れた位置に存在するという点で同一ではない。この場合、「椅子」に類似する属性を有する「ソファ」の属性を有する物体ＯT12が、ＡＲ実施シーン環境マップにより表される、ＡＲ実施シーンに存在する物体ＯT_iの中から検索される。

　また、テンプレートシーンにおける物体ＯS11（テーブル）と物体ＯS21～ＯS24（椅子）の数、およびそれぞれの位置関係は、物体ＯT12を含めて、ＡＲ実施シーンにおける物体ＯT11（テーブル）と物体ＯT21～ＯT23（椅子）と物体ＯT12（ソファ）の数、およびそれぞれの位置関係と同一であると判定される。

　この場合、図２２の下段に示すように、テーブルを囲む３脚の椅子とテーブルの近傍のソファに、異なる４人のキャラクタがそれぞれ着席させる見え方を実現する表示用ＡＲコンテンツがテンプレートＡＲコンテンツに基づいて生成される。ここで、４人のキャラクタを着席させることに用いられる椅子は、実際のシーンに存在する物体ＯT21～ＯT23、および物体ＯT12である。

　図２４は、テンプレートＡＲコンテンツにおけるオブジェクトの位置の置換の例を示す図である。図２３に示す位置関係を各物体が有している場合、テンプレートＡＲコンテンツにおいて物体ＯS21に着席するキャラクタＣ1の位置は、図２４の矢印Ａ１１１で示すように、物体ＯT21の位置に置換される。

　同様に、テンプレートＡＲコンテンツにおいて物体ＯS22に着席するキャラクタＣ2の位置は、矢印Ａ１１２で示すように物体ＯT22の位置に置換される。テンプレートＡＲコンテンツにおいて物体ＯS23に着席するキャラクタＣ3の位置は、矢印Ａ１１３で示すように物体ＯT23の位置に置換される。また、テンプレートＡＲコンテンツにおいて物体ＯS24に着席するキャラクタＣ4の位置は、矢印Ａ１１４で示すように、ソファである物体ＯT12の位置に置換される。

　このように、テンプレートシーンに存在する物体と同一の属性の物体がない場合、類似する属性の物体を用いて、キャラクタの位置の置換が行われる。これにより、テンプレートシーンに存在する物体と完全に同じ物体がＡＲ実施のシーンにない場合であっても、テンプレートＡＲコンテンツを実際のシーンに適用することが可能となる。

　図１８の説明に戻り、ステップＳＴ９５において、検索された物体ＯT_iの数および相対的な位置関係が、それぞれ、物体ＯS_iの数および相対的な位置関係と一致しないと判定された場合、情報処理装置１２は、ステップＳＴ９６の処理に進む。この場合、属性が類似する物体を含めたとしても、ＡＲ実施シーンには、テンプレートシーンに存在する物体と同じ数、同じ位置関係の物体が存在していないことになる。

　ステップＳＴ９６において、情報処理装置１２は、テンプレートＡＲ抽象表現により表される物体ＯS_iと同一の属性Ｘ_iを有するオブジェクトＣ_j（仮想的な物体）を、不足する数だけ、生成する。「椅子」の属性を有する物体がＡＲ実施シーンにおいて不足する場合、「椅子」の属性を有するオブジェクトが生成される。同一の属性のオブジェクトが生成されるのではなく、類似する属性のオブジェクトが生成されるようにしてもよい。

　ステップＳＴ９７において、情報処理装置１２は、ＡＲ実施シーンに存在する物体ＯT_iと新たに生成したオブジェクトＣ_jとの相対的な位置関係が、テンプレートシーンにおける物体ＯS_iの位置関係と一致するように、オブジェクトＣ_jの配置位置を決定する。ここで、物体ＯT_iには、ステップＳＴ９４において検索された物体ＯT’_iも含まれる。

　ステップＳＴ９８において、情報処理装置１２は、テンプレートＡＲコンテンツにおける、物体ＯS_iの位置を基準としたオブジェクトの位置を、物体ＯT_iおよびオブジェクトＣ_jの位置を基準とした位置に置換することによって、表示用ＡＲコンテンツを生成する。

　図２５は、テンプレートＡＲ環境マップ、ＡＲ実施シーン環境マップおよび表示用ＡＲコンテンツの一例を示している。なお、ここで、テンプレートＡＲおよびＡＲ実施シーンの環境マップは編集処理を経た後の抽象表現に対応したものであるとする。

　図２５の上段に示すテンプレートＡＲ環境マップは、床面上に１つのテーブルと４脚の椅子が存在し、かつ、４脚の椅子がテーブルを囲んでいる、図４に示すテンプレートシーンを表す。また、図２５の中段に示すＡＲ実施シーン環境マップは、床面が存在するとともに、床面上に１つのテーブルと３脚の椅子が存在するシーンを表す。この例においては、３脚の椅子はテーブルを囲んでいるものとされている。

　このようなテンプレートＡＲ環境マップ用意されている場合、物体ＯS_iと同一の属性Ｘ_iを有する物体ＯT_iとして、物体ＯS11（図４）と同一の「テーブル」の属性を有する物体ＯT11が検索される。同様に、物体ＯS21と同一の「椅子」の属性を有する物体ＯT21、物体ＯS22と同一の「椅子」の属性を有する物体ＯT22、および、物体ＯS23と同一の「椅子」の属性を有する物体ＯT23が、それぞれ検索される。

　また、テンプレートシーンにおける物体ＯS11（テーブル）と物体ＯS21～ＯS24（椅子）の数、およびそれぞれの位置関係は、実際のシーンにおける物体ＯT11（テーブル）と物体ＯT21～ＯT23（椅子）の数、およびそれぞれの位置関係と同一ではないと判定される。ＡＲ実施シーンにおいては、椅子の数が１脚だけ不足することになる。

　図２６は、テンプレートＡＲ環境マップとＡＲ実施シーンの環境マップにおける各物体の位置関係の例を示す図である。図２６の左側に示す、テンプレートＡＲ環境マップにより表される、テンプレートシーンにおける物体ＯS11と物体ＯS21～ＯS24の位置関係は、図２０、図２３を参照して説明した位置関係と同じである。一方、ＡＲ実施シーン環境マップにより表される、ＡＲ実施シーンにおける物体ＯT11と物体ＯT21～ＯT23の位置関係は、図２６の右側に示すような位置関係となる。

　テンプレートシーンにおける物体ＯS11と物体ＯS21～ＯS24の位置関係は、実際のシーンにおける物体ＯT11と物体ＯT21～ＯT23の位置関係と、１脚の「椅子」が不足しているという点で同一ではない。この場合、「椅子」の属性を有するオブジェクトＣ11が生成される。

　また、破線で示すように、オブジェクトＣ11の配置位置が、テンプレートシーンにおける物体ＯS11と物体ＯS21～ＯS24の位置関係と同じ位置関係を有するように決定される。図２６の右側に示すＡＲ実施シーンにおける物体ＯT11、物体ＯT21～ＯT23、オブジェクトＣ11の位置関係と、テンプレートシーンにおける物体ＯS11と物体ＯS21～ＯS24の位置関係は同じ位置関係を有する。

　この場合、図２５の下段に示すように、テーブルを囲む３脚の椅子と仮想的な椅子に、４人のキャラクタをそれぞれ着席させる見え方を実現する表示用ＡＲコンテンツがテンプレートＡＲコンテンツに基づいて生成される。ここで、４人のキャラクタを着席させることに用いられる椅子は、実際のシーンに存在する物体ＯT21～ＯT23、および、仮想的なオブジェクトＣ11である。表示用ＡＲコンテンツには、オブジェクトＣ11を表示させるための映像データも含まれる。

　図２７は、テンプレートＡＲコンテンツにおけるオブジェクトの位置の置換の例を示す図である。図２６に示す位置関係を各物体が有している場合、テンプレートＡＲコンテンツにおいて物体ＯS21に着席するキャラクタＣ1の位置は、図２７の矢印Ａ１２１で示すように、物体ＯT21の位置に置換される。

　同様に、テンプレートＡＲコンテンツにおいて物体ＯS22に着席するキャラクタＣ2の位置は、矢印Ａ１２２で示すように物体ＯT22の位置に置換される。テンプレートＡＲコンテンツにおいて物体ＯS23に着席するキャラクタＣ3の位置は、矢印Ａ１２３で示すように物体ＯT23の位置に置換される。また、テンプレートＡＲコンテンツにおいて物体ＯS24に着席するキャラクタＣ4の位置は、矢印Ａ１２４で示すように、オブジェクトＣ11の位置に置換される。

　このように、実際のシーンに存在する物体が不足する場合、仮想的なオブジェクトを用いて、キャラクタの位置の置換が行われる。これにより、テンプレートシーンに存在する物体と完全に同じ物体が実際のシーンにない場合であっても、テンプレートＡＲコンテンツを実際のシーンに適用することが可能となる。

　図１８の説明に戻り、ステップＳＴ９３またはステップＳＴ９８において表示用ＡＲコンテンツが生成された後、処理は終了となる。

　図６の説明に戻り、ステップＳＴ１５では、ＡＲ実施シーン情報（環境テ゛ータ）と、ステップＳＴ１１において生成されたＡＲ実施シーンの環境マップとに基づいて、ＡＲ実施シーンの環境マップにより表されるＡＲ実施シーンにおけるユーザの位置と姿勢が推定される。例えば、表示デバイスであるＡＲグラス１１の位置と姿勢が、ユーザの位置と姿勢として推定される。

　ステップＳＴ１６では、表示用ＡＲコンテンツの再生が行われ、ステップＳＴ１５において推定された位置と姿勢に応じたＡＲコンテンツの表示が行われる。ユーザの位置と姿勢に応じた映像のデータが情報処理装置１２からＡＲグラス１１に対して送信され、ＡＲ実施シーンに重ねて映像が表示される。

　上述したように図６のフローチャートにおける処理で表示用ＡＲコンテンツが生成されることで、以下のような効果が得られる。すなわち、表示用ＡＲコンテンツを生成する際に、抽象表現同士を比較するものであり、環境マップ同士を比較する場合に比べて、テンプレートＡＲコンテンツをＡＲ実施シーンにマッピングするための計算処理が軽減されて簡単になる。

　また、ＡＲ実施シーンの抽象表現またはテンプレートＡＲ抽象表現を編集することで、テンプレートＡＲコンテンツを個々のユーザのＡＲ実施シーンで体験する際に、ユーザの意図に沿った適切な表示が可能となり、また、テンプレートＡＲコンテンツを体験できるユーザシーン（ＡＲ実施シーン）の幅を広げることが可能となる。

　「ＡＲグラスの構成」
　図２８は、ＡＲグラス１１の構成例を示している。ＡＲグラス１１は、制御部１１１と、カメラ１１２と、センサ１１３と、通信部１１４と、表示部１１５と、メモリ１１６を有している。

　制御部１１は、ＣＰＵ(Central Processing Unit)、ＲＯＭ(Read Only Memory)、ＲＡＭ(Random Access Memory)などにより構成される。制御部１１１は、ＲＯＭやメモリ１１６に記憶されているプログラムを実行し、ＡＲグラス１１の全体の動作を制御する。

　制御部１１１は、ＡＲコンテンツの再生時、カメラ１１２により撮影されたＲＧＢ画像とセンサ１１３による計測結果に基づいてＡＲ実施シーン情報（環境データ）を生成し、通信部１１４から情報処理装置１２に対して送信させる。また、制御部１１１は、表示用ＡＲコンテンツの再生が情報処理装置１２において行われ、ＡＲコンテンツの映像データが通信部１１４において受信された場合、その映像データによる映像を表示部１１５に出力し、表示させる。

　カメラ１１２は、ＡＲコンテンツの再生時などの所定のタイミングにおいて、ユーザの前方の風景を撮影する。そして、カメラ１１２は、撮影することによって得られたＲＧＢ画像を制御部１１１に出力する。

　センサ１１３は、デプスセンサやＬｉＤＡＲなどにより構成される。センサ１１３を構成するデプスセンサやＬｉＤＡＲは、ＡＲ実施シーン（実際のシーン）を構成する各位置までの距離を計測し、距離画像、点群データなどを、計測結果を表すデータとして制御部１１１に出力する。

　センサ１１３には、適宜、加速度センサ、ジャイロセンサ、測位センサなどの各種のセンサも含まれる。この場合、加速度センサ、ジャイロセンサ、測位センサによる計測結果が環境データに含まれ、情報処理装置１２に出力される。加速度センサ、ジャイロセンサ、測位センサによる計測結果は、ユーザの位置と姿勢などの推定に用いられる。

　通信部１１４は、無線ＬＡＮなどの通信モジュールにより構成される。通信部１１４は、ネットワーク１３を介して情報処理装置１２と通信を行い、制御部１１１から供給された環境データを情報処理装置１２に対して送信する。また、通信部１１４は、情報処理装置１２から送信された映像データを受信し、制御部１１１に対して出力する。

　表示部１１５は、制御部１１１から供給された映像データに基づいて、ＡＲコンテンツの映像を表示させる。メモリ１１６は、フラッシュメモリなどの記憶媒体である。メモリ１１６には、制御部１１１のＣＰＵが実行するプログラムなどの各種のデータが記憶される。

　「情報処理装置の構成」
　図２９は、情報処理装置１２の構成例を示している。ＣＰＵ１５１、ＲＯＭ１５２、ＲＡＭ１５３は、バス１５４により相互に接続されている。

　バス１５４には、さらに、入出力インタフェース１５５が接続されている。入出力インタフェース１５５には、キーボード、マウスなどよりなる入力部１５６、ディスプレイ、スピーカなどよりなる出力部１５７が接続されている。また、入出力インタフェース１５５には、ハードディスクや不揮発性のメモリなどよりなる記憶部１５８、ネットワークインタフェースなどよりなる通信部１５９、リムーバブルメディア１６１を駆動するドライブ１６０が接続されている。

　「情報処理装置の機能構成」
　図３０は、情報処理装置１２の機能構成例を示している。情報処理装置１２においては、図２９のＣＰＵ１５１により所定のプログラムが実行されることで各機能部が実現される。

　情報処理装置１２は、ＡＲ実施シーン情報取得部１８１と、ＡＲ実施シーン環境マップ生成部１８２と、ＡＲ実施シーン抽象表現生成部１８３と、テンプレートＡＲデータ群記憶部１８４と、抽象表現比較・編集部１８５と、表示用ＡＲコンテンツ生成部１８６と、推定部１８７と、表示制御部１８８を有している。

　ＡＲ実施シーン情報取得部１８１は、ＡＲコンテンツの再生時にＡＲグラス１１から送信され、通信部１５９において受信されたＡＲ実施シーン情報（環境データ）を取得する。ＡＲ実施シーン情報取得部１８１により取得されたＡＲ実施シーン情報は、ＡＲ実施シーン環境マップ生成部１８２と推定部１８７に供給される。

　ＡＲ実施シーン環境マップ生成部１８２は、ＡＲ実施シーン情報取得部１８１から供給されたＡＲ実施シーン情報に基づいてＡＲ実施シーンの環境マップ（実環境マップ）を生成する。図６のステップＳＴ１１の処理が、ＡＲ実施シーン環境マップ生成部１８２が行う処理となる。ＡＲ実施シーン環境マップ生成部１８２により生成されたＡＲ実施シーンの環境マップは、ＡＲ実施シーン抽象表現生成部１８３と推定部１８７、さらには表示用ＡＲコンテンツ生成部１８６に供給される。

　ＡＲ実施シーン抽象表現生成部１８３は、ＡＲ実施シーン環境マップ生成部１８２から供給されるＡＲ実施シーンの環境マップに基づいてＡＲ実施シーンの抽象表現を生成する。図６のステップＳＴ１２の処理が、ＡＲ実施シーン抽象表現生成部１８３が行う処理となる。

　テンプレートＡＲデータ群記憶部１８４は、テンプレートＡＲデータ群を記憶する。つまり、このテンプレートＡＲデータ群記憶部１８４は、情報処理装置１２または他の情報処理装置で予め生成された所定数のテンプレートＡＲデータを記憶する。それぞれのテンプレートＡＲデータは、図６に示すように、テンプレートＡＲ環境マップ、テンプレートＡＲ抽象表現およびテンプレートＡＲコンテンツを含んでいる。

　抽象表現比較・編集部１８５は、ＡＲ実施シーン抽象表現生成部１８３で生成されたＡＲ実施シーンの抽象表現とそのＡＲ実施シーンで利用するテンプレートＡＲコンテンツに対応したテンプレートＡＲ抽象表現をユーザに比較提示（並列提示）し、ユーザのユーザインタフェースからの変更操作の下、抽象表現を変更する。図６のステップＳＴ１３の処理が、抽象表現比較・編集部１８５が行う処理となる。

　表示用ＡＲコンテンツ生成部１８６は、ＡＲ実施シーン抽象表現生成部１８３からＡＲ実施シーンの抽象表現を取得すると共に、テンプレートＡＲデータ群記憶部１８４からそのＡＲ実施シーンで利用するテンプレートＡＲコンテンツに対応したテンプレートＡＲコンテンツとその抽象表現を取得する。抽象表現は、ステップＳＴ１３の編集処理を経たものであり、必要に応じて変更されたものである。また、表示用ＡＲコンテンツ生成部１８６は、ＡＲ実施シーン環境マップ生成部１８２からＡＲ実施シーンの環境マップを取得すると共に、テンプレートＡＲデータ群記憶部１８４からＡＲ実施シーンで利用するテンプレートＡＲコンテンツに対応したテンプレートＡＲ環境マップを取得する。

　表示用ＡＲコンテンツ生成部１８６は、取得した各情報に基づいて、表示用ＡＲコンテンツを生成する。この表示用ＡＲコンテンツの生成は、テンプレートＡＲ抽象表現とＡＲ実施シーンの抽象表現とを比較し、その比較結果（対応関係）を基にテンプレートＡＲ環境マップ上の物体をＡＲ実施シーンの環境マップ上の物体に置き換えるマッピングをすることによって行われる。図６のステップＳＴ１４の処理が、表示用ＡＲコンテンツ生成部１８６が行う処理となる。表示用ＡＲコンテンツ生成部１８６により生成された表示用ＡＲコンテンツは表示制御部１８８に供給される。

　推定部１８７は、ＡＲ実施シーン情報取得部１８１から供給されたＡＲ実施シーン情報（環境データ）とＡＲ実施シーン環境マップ生成部１８２から供給されたＡＲ実施シーンの環境マップ（実環境マップ）とに基づいて、ＡＲ実施シーンにおけるユーザの位置と姿勢を推定する。図６のステップＳＴ１５の処理が、推定部１８７が行う処理となる。推定部１８７による推定結果を表す情報は表示制御部１８８に供給される。

　表示制御部１８８は、表示用ＡＲコンテンツ生成部１８６から供給された表示用ＡＲコンテンツを再生し、推定部１８７により推定された位置と姿勢に応じた映像データを生成する。図６のステップＳＴ１６の処理が、表示制御部１８８が行う処理となる。表示制御部１８８は、通信部１５９（図２９参照）を制御することによって映像データをＡＲグラス１１に送信し、表示用ＡＲコンテンツの映像をＡＲグラス１１において表示させる。

　「シーンの抽象表現を用いたテンプレートＡＲコンテンツのマッピングに関する処理例」
　シーンの抽象表現を用いたテンプレートＡＲコンテンツのマッピングに関する処理例を説明する。ここでは、「ユーザがソファに座ってテレビを見ているときに、仮想キャラクタがユーザの近くにある椅子に座る」というテンプレートＡＲコンテンツを想定し、それをシーンの抽象表現を用いてマッピングする一連の処理を説明する。

　「テンプレートＡＲコンテンツとその抽象表現」
　「ユーザがソファに座ってテレビを見ている(テレビの方向を向いている)ときに、仮想キャラクタがユーザの近くにある椅子に座る」というテンプレートＡＲコンテンツを想定した際に、テンプレートＡＲ環境マップとして、図３１（ａ）に示すような位置関係（真上から見た図）に椅子、ソファ、テレビ、ユーザが配置されているものを考える(以下、「マップＡ」と呼称する)。

　テンプレートＡＲ環境マップには、各物体の３次元幾何情報や属性などの意味的情報および相対的な３次元位置関係の情報が含まれている。このとき、マップＡの持つ情報から物体間の関係を抽出し、テンプレートＡＲコンテンツの情報と併せることで、コンテンツマッピングを行うためのテンプレートＡＲ抽象表現が、図３１（ｂ）に示すように定義できる．

　このテンプレートＡＲ抽象表現では、仮想キャラクタと椅子が「sitting」という関係で接続されているが、これはコンテンツマッピング後の関係を示している。マップＡ上でコンテンツマッピングを行う際には、図３２に示すように、抽象表現における物体ノードと環境マップ上の物体との対応を取り、仮想キャラクタの「sitting」の対象となる椅子を決定することで、対象の椅子との仮想キャラクタの状態が「sitting」となるように仮想キャラクタを制御すればよい。

　「異なるＡＲ実施シーンへのシーンの抽象表現を用いたテンプレートＡＲコンテンツマッピング」
　図３１のテンプレートＡＲコンテンツを異なるＡＲ実施シーンにマッピングする例を、以下に示す。ここでは、テンプレートＡＲ環境マップとは椅子の配置と数が異なる、図３３（ａ）に示すようなＡＲ実施シーン環境マップ(以下、「マップＢ」と呼称する)へのマッピングを考える。

　図３３（ａ）に示した通り、マップＢにおいてはマップＡと反対側に椅子Ａが配置され，その隣に椅子Ｂが配置されている。このとき、椅子Ａとユーザは「near」、椅子Ａと椅子Ｂは「on left」という関係を持つことが、マップＢの情報から得られるとすると、図３３（ｂ）に示すように、マップＢに対するシーンの抽象表現を得ることができる。

　図３１（ｂ）に示すテンプレートＡＲ抽象表現と比較すると、ソファ、ユーザ、テレビ、椅子Ａから構成される部分グラフとテンプレートＡＲ抽象表現グラフがマッチングしている。そのため、マップＡにおける椅子をマップＢにおける椅子Ａと対応させることができる。したがって、図３４に示すように、椅子Ａに対して仮想キャラクタが「sitting」の状態となるように制御することで、マップＡにおいて制作されたテンプレートＡＲコンテンツのマップＢへのマッピングが実現できる。

　「複数のマッピング候補が存在するようなシーンへのテンプレートＡＲコンテンツマッピング」
　次に、椅子の配置条件を、図３５（ａ）に示すように変えた異なるＡＲ実施シーンの環境マップ（以下、「マップＣ」と呼称する）に対するコンテンツマッピングの例を示す。マップＣにおいてはユーザの椅子Ａと椅子Ｂがユーザの両脇に配置されており、それぞれユーザに対する位置関係（on left，on right, near)が得られているものとすると、図３５（ｂ）に示すように、マップＣに対するシーンの抽象表現を得ることができる。

　マップＡで制作されたテンプレートＡＲコンテンツをマップＣに抽象表現を介してマッピングするには、テンプレートＡＲ抽象表現からＡＲコンテンツに関わるノード（仮想キャラクタ）を除いたものとマップＣのシーン抽象表現とのマッチングを行えばよい。

　このとき、マップＡで制作された今回の場合は、図３６（ｂ），（ｃ）に破線で識別可能に示しているように、図３６（ａ）に示すテンプレートＡＲ抽象表現と同型となる部分を２通り含んでいる。そのため、図３７に示すように、椅子Ａと椅子Ｂのいずれかに仮想キャラクタが座るというマッピングが考えられる。

　このとき、マッピング対象の椅子は候補の中から予めテンプレートＡＲコンテンツ制作者が定めた条件や制約に基づいて選択される。具体的には、ユーザとの間の「near」という関係の評価値がより高いもの（例えば、ユークリッド距離がより小さいものなど）や、ユーザとより近い方向を向いているものなどの条件・制約が考えられる。

　このような条件や制約に基づく選択結果は、環境マップが更新されない限り一通りに決まってしまう。そのため、その選択結果がユーザの意図通りのものとなる保証はない。すなわち、上記の枠組みでは，ユーザがマッピングのための条件や制約の詳細を踏まえた上でそれを満たすような環境マップを構成しなければ、ユーザが意図した通りのマッピングを保証できず、そのような条件や制約を満たさないようなマッピング（例えば、敢えて「near」の評価値が２番目に高い椅子を選択する、など）を行えないという不都合がある。

　「複数のマッピング候補が存在するようなシーンへの抽象表現の編集を介したテンプレートＡＲコンテンツマッピング」
　マップＣにおいて取得された環境マップに基づくシーンの抽象表現をそのままマッピングに利用するのではなく、抽象表現を編集するステップを介して利用する例について述べる。

　図３８（ａ）の左側には、図３５（ｂ）と同様に、図３５（ａ）に示すマップＣから取得したシーンの抽象表現を示している。このシーンの抽象表現に対し、ユーザの編集操作の入力により、図３８（ａ）の右側に示すようなシーンの抽象表現を取得する。ここでは、椅子Ａとユーザとの間に取得された「near」という関係を抽象表現から削除している。抽象表現の編集に際しては、シーン抽象表現を表すグラフが何らかの映像表示装置によりユーザにＧＵＩで提示されていてもよく、関係の削除のみならず新たな関係の追加や物体の属性の変更なども含めた編集を、テキストや音声、タッチ操作等の様々な入力方法で行えるものとする。

　図３８（ａ）の右側に示すように編集されたシーンの抽象表現とテンプレートＡＲ抽象表現を用いることで、マップＣに対して、図３９に示すように、一意なＡＲコンテンツマッピングを実現できる。また、同一条件下で逆に椅子Ｂの「near」という関係を削除すると、今度はテンプレートＡＲコンテンツを椅子Ａに対してマッピングさせることができる。

　また、図３８（ｂ）の左側に示すテンプレートＡＲ抽象表現に対し、ユーザの編集操作の入力により、図３８（ｂ）の右側に示すようなシーンの抽象表現を取得することでも、マップＣに対して、図３９に示すように、一意なＡＲコンテンツマッピングを実現できる。

　このように、シーンの抽象表現を介したテンプレートＡＲコンテンツマッピングと、シーンの抽象表現の編集操作を組み合わせることで、マップＣにおける配置条件を変えずに、ユーザの抽象表現の編集操作のみでテンプレートＡＲコンテンツのマッピング結果を変化させることができる。そのため、ユーザの意図通りのコンテンツマッピングや１つのテンプレートＡＲコンテンツの多様な個別環境への適合が実現できる。

　＜２．変形例＞
　「テンプレートやＡＲ実施環境の編集情報の蓄積による自動適合システム」
　図４０のフローチャートに示すように、ユーザがＡＲ実施シーンの抽象表現を編集した履歴を蓄積しておき、新たに取得したテンプレートＡＲコンテンツを表示する際に、予め自動でＡＲ実施シーンの抽象表現を編集する処理ステップ（ステップＳＴ１７）をさらに設けることが考えられる。例えば、ＡＲ実施シーンにある特定の物体をＡＲコンテンツ表示時に利用したくない場合に、コンテンツ毎に抽象表現から削除するような操作をしなくてもよく、自動でその設定を反映するようにしておいてもよい。なお、図４０のフローチャートにおいて、図６のフローチャートと対応する部分には、同一のステップ番号を付して示している。

　「テンプレートARコンテンツ作成支援」
　図４１のフローチャートに示すように、編集したテンプレートＡＲの抽象表現を新たなテンプレートとして利用することで（ステップＳＴ１８の処理）、コンテンツ製作者によるテンプレートの作成コストを削減できる。ユーザが編集したものを共有してコンテンツ製作者が操作できるようにしてもよいし、コンテンツ製作者が予めベースとなるテンプレートを作成して、その派生テンプレートを制作するために利用してもよい。なお、図４１のフローチャートにおいて、図６のフローチャートと対応する部分には、同一のステップ番号を付して示している。

　「代用物を用いたＡＲシミュレーションシステム」
　ＡＲを実施したい環境をスケールやカテゴリを問わない代用物を用いたモックで構成し、それらに対して得られた抽象表現をテンプレートと合わせるように編集することで、ＡＲを実施する本番環境に行かなくてもＡＲコンテンツを再生するシミュレーションを行うことができる。例えば、机上に載るスケールの部屋の模型やプロトタイプ品に対して計測を行い、それらの抽象表現を編集して表示することでその部屋でのＡＲ表示をシミュレーションできる。シミュレーションとして提示できるコンテンツとして、例えば、屋内でのロボットや仮想キャラクタなどのエージェントの行動計画などが考えられる。

　また、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、特許請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。

　また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。

　なお、本技術は、以下のような構成もとることができる。
　（１）拡張現実実施シーンの環境マップを生成する環境マップ生成部と、
　前記拡張現実シーンの環境マップに基づいて拡張現実実施シーンの抽象表現を生成する抽象表現生成部と、
　前記拡張現実実施シーンの抽象表現とテンプレート拡張現実環境マップに基づいて生成されたテンプレート拡張現実の抽象表現を比較し、該比較結果に基づいてテンプレート拡張現実コンテンツを拡張現実実施シーンにマッピングして表示用拡張現実コンテンツを生成する表示用コンテンツ生成部を備える
　情報処理装置。
　（２）前記抽象表現は、グラフ構造を持つ表現である
　前記（１）に記載の情報処理装置。
　（３）前記拡張現実実施シーンの抽象表現または前記テンプレート拡張現実の抽象表現を編集する抽象表現編集部をさらに備える
　前記（１）または（２）に記載の情報処理装置。
　（４）前記抽象表現編集部は、前記拡張現実実施シーンの抽象表現およびテンプレート拡張現実の抽象表現を並べてユーザに提示する抽象表現提示部と、
　前記提示に基づいて前記ユーザが前記拡張現実実施シーンの抽象表現またはテンプレート拡張現実の抽象表現を変更操作するユーザインタフェース部を有する
　前記（３）に記載の情報処理装置。
　（５）前記抽象表現提示部は、前記拡張現実実施シーンの抽象表現に前記テンプレート拡張現実の抽象表現に対応した部分的同型部分が複数存在する場合には、前記複数の部分的同型部分を前記ユーザが認識可能に提示する
　前記（４）に記載の情報処理装置。
　（６）前記抽象表現編集部で前記拡張現実実施シーンの抽象表現またはテンプレート拡張現実の抽象表現が編集された場合、
　前記表示用拡張現実コンテンツ生成部は、前記変更操作後の前記拡張現実実施シーンの抽象表現と前記テンプレート拡張現実の抽象表現を比較する
　前記（３）から（５）のいずれかに記載の情報処理装置。
　（７）前記抽象表現編集部における前記拡張現実実施シーンに対する編集情報に基づいて前記抽象表現生成部で生成された前記拡張現実実施シーンの抽象表現を自動的に編集する自動編集部をさらに備える
　前記（３）から（６）のいずれかに記載の情報処理装置。
　（８）前記抽象表現は、グラフ構造を持つ表現であり、
　前記編集は、ノード間の関係を変更する操作、またはノードの属性を変更する操作を含む
　前記（３）から（７）のいずれかに記載の情報処理装置。
　（９）拡張現実実施シーンの環境マップを生成する手順と、
　前記拡張現実シーンの環境マップに基づいて拡張現実実施シーンの抽象表現を生成する手順と、
　前記拡張現実実施シーンの抽象表現とテンプレート拡張現実環境マップに基づいて生成されたテンプレート拡張現実の抽象表現を比較し、該比較結果に基づいてテンプレート拡張現実コンテンツを拡張現実実施シーンにマッピングして表示用コンテンツを生成する手順を有する
　情報処理方法。
　（１０）コンピュータを、
　拡張現実実施シーンの環境マップを生成する環境マップ生成手段と、
　前記拡張現実シーンの環境マップに基づいて拡張現実実施シーンの抽象表現を生成する抽象表現生手段と、
　前記拡張現実実施シーンの抽象表現とテンプレート拡張現実環境マップに基づいて生成されたテンプレート拡張現実の抽象表現を比較し、該比較結果に基づいてテンプレート拡張現実コンテンツを拡張現実実施シーンにマッピングして表示用拡張現実コンテンツを生成する表示用拡張現実コンテンツ生成手段として機能させる
　プログラム。

　１０・・・情報処理システム
　１１・・・ＡＲグラス
　１２・・・情報処理
　１３・・・ネットワーク
　１１１・・・制御部
　１１２・・・カメラ
　１１３・・・センサ
　１１４・・・通信部
　１１５・・・表示部
　１１６・・・メモリ
　１８１・・・ＡＲ実施シーン情報取得部
　１８２・・・ＡＲ実施シーン環境マップ生成部
　１８３・・・ＡＲ実施シーン抽象表現生成部
　１８４・・・テンプレートＡＲデータ群記憶部
　１８５・・・抽象表現比較・編集部
　１８６・・・表示用ＡＲコンテンツ生成部
　１８７・・・推定部
　１８８・・・表示制御部

Claims

　拡張現実実施シーンの環境マップを生成する環境マップ生成部と、
　前記拡張現実シーンの環境マップに基づいて拡張現実実施シーンの抽象表現を生成する抽象表現生成部と、
　前記拡張現実実施シーンの抽象表現とテンプレート拡張現実環境マップに基づいて生成されたテンプレート拡張現実の抽象表現を比較し、該比較結果に基づいてテンプレート拡張現実コンテンツを拡張現実実施シーンにマッピングして表示用拡張現実コンテンツを生成する表示用拡張現実コンテンツ生成部を備える
　情報処理装置。
　前記抽象表現は、グラフ構造を持つ表現である
　請求項１に記載の情報処理装置。
　前記拡張現実実施シーンの抽象表現または前記テンプレート拡張現実の抽象表現を編集する抽象表現編集部をさらに備える
　請求項１に記載の情報処理装置。
　前記抽象表現編集部は、前記拡張現実実施シーンの抽象表現およびテンプレート拡張現実の抽象表現を並べてユーザに提示する抽象表現提示部と、
　前記提示に基づいて前記ユーザが前記拡張現実実施シーンの抽象表現またはテンプレート拡張現実の抽象表現を変更操作するユーザインタフェース部を有する
　請求項３に記載の情報処理装置。
　前記抽象表現提示部は、前記拡張現実実施シーンの抽象表現に前記テンプレート拡張現実の抽象表現に対応した部分的同型部分が複数存在する場合には、前記複数の部分的同型部分を前記ユーザが認識可能に提示する
　請求項４に記載の情報処理装置。
　前記抽象表現編集部で前記拡張現実実施シーンの抽象表現またはテンプレート拡張現実の抽象表現が編集された場合、
　前記表示用拡張現実コンテンツ生成部は、前記変更操作後の前記拡張現実実施シーンの抽象表現と前記テンプレート拡張現実の抽象表現を比較する
　請求項３に記載の情報処理装置。
　前記抽象表現編集部における前記拡張現実実施シーンに対する編集情報に基づいて前記抽象表現生成部で生成された前記拡張現実実施シーンの抽象表現を自動的に編集する自動編集部をさらに備える
　請求項３に記載の情報処理装置。
　前記抽象表現は、グラフ構造を持つ表現であり、
　前記編集は、ノード間の関係を変更する操作、またはノードの属性を変更する操作を含む
　請求項３に記載の情報処理装置。
　拡張現実実施シーンの環境マップを生成する手順と、
　前記拡張現実シーンの環境マップに基づいて拡張現実実施シーンの抽象表現を生成する手順と、
　前記拡張現実実施シーンの抽象表現とテンプレートＡＲ環境マップに基づいて生成されたテンプレート拡張現実の抽象表現を比較し、該比較結果に基づいてテンプレート拡張現実コンテンツを拡張現実実施シーンにマッピングして表示用拡張現実コンテンツを生成する手順を有する
　情報処理方法。
　コンピュータを、
　拡張現実実施シーンの環境マップを生成する環境マップ生成手段と、
　前記拡張現実シーンの環境マップに基づいて拡張現実実施シーンの抽象表現を生成する抽象表現生手段と、
　前記拡張現実実施シーンの抽象表現とテンプレートＡＲ環境マップに基づいて生成されたテンプレート拡張現実の抽象表現を比較し、該比較結果に基づいてテンプレート拡張現実コンテンツを拡張現実実施シーンにマッピングして表示用拡張現実コンテンツを生成する表示用拡張現実コンテンツ生成手段として機能させる
　プログラム。