WO2023286321A1

WO2023286321A1 - 情報処理装置、情報処理方法、及びプログラム

Info

Publication number: WO2023286321A1
Application number: PCT/JP2022/007805
Authority: WO
Inventors: 宏真土井
Original assignee: ソニーセミコンダクタソリューションズ株式会社
Priority date: 2021-07-12
Filing date: 2022-02-25
Publication date: 2023-01-19
Also published as: CN117616463A; JPWO2023286321A1

Abstract

本開示は、映像表現の幅を広げることができるようにする情報処理装置、情報処理方法、及びプログラムに関する。現実空間を３Ｄスキャンして得られるスキャン結果に基づいて、現実空間に応じた領域を、対応付けたコンテンツに置き換える処理を行う処理部を備え、処理部は、現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づいて、現実空間に応じた領域にコンテンツを対応付ける情報処理装置が提供される。本開示は、例えば、各種センサを有する電子機器に適用することができる。

Description

情報処理装置、情報処理方法、及びプログラム

　本開示は、情報処理装置、情報処理方法、及びプログラムに関し、特に、映像表現の幅を広げることができるようにした情報処理装置、情報処理方法、及びプログラムに関する。

　環境メッシュや３Ｄオブジェクトの認識結果を、ゲームやSNS(Social Networking Service)の動画撮影へ活用するために、様々な映像処理を用いて拡張現実(AR：Augmented Reality)の映像を生成することがある。拡張現実の映像を生成する技術としては、例えば、特許文献１に開示されている技術が知られている。

特開2020-64592号公報

　拡張現実の映像を生成するに際しては、映像表現の幅を広げるための技術が求められていた。

　本開示はこのような状況に鑑みてなされたものであり、映像表現の幅を広げることができるようにするものである。

　本開示の一側面の情報処理装置は、現実空間を３Ｄスキャンして得られるスキャン結果に基づいて、前記現実空間に応じた領域を、対応付けたコンテンツに置き換える処理を行う処理部を備え、前記処理部は、前記現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づいて、前記現実空間に応じた領域に前記コンテンツを対応付ける情報処理装置である。

　本開示の一側面の情報処理方法は、情報処理装置が、現実空間を３Ｄスキャンして得られるスキャン結果に基づいて、前記現実空間に応じた領域を、対応付けたコンテンツに置き換える処理を行い、前記現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づいて、前記現実空間に応じた領域に前記コンテンツを対応付ける情報処理方法である。

　本開示の一側面のプログラムは、コンピュータを、現実空間を３Ｄスキャンして得られるスキャン結果に基づいて、前記現実空間に応じた領域を、対応付けたコンテンツに置き換える処理を行う処理部を備え、前記処理部は、前記現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づいて、前記現実空間に応じた領域に前記コンテンツを対応付ける情報処理装置として機能させるプログラムである。

　本開示の一側面の情報処理装置、情報処理方法、及びプログラムにおいては、現実空間を３Ｄスキャンして得られるスキャン結果に基づいて、前記現実空間に応じた領域が、対応付けられたコンテンツに置き換えられ、前記現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づいて、前記現実空間に応じた領域に前記コンテンツが対応付けられる。

　なお、本開示の一側面の情報処理装置は、独立した装置であってもよいし、１つの装置を構成している内部ブロックであってもよい。

本開示を適用した情報処理装置の一実施の形態の構成例を示すブロック図である。本開示を適用した情報処理装置の機能的構成例を示すブロック図である。 AR処理部の詳細な構成例を示すブロック図である。本開示を適用した情報処理装置で実行される処理の流れを説明するフローチャートである。 AR処理の詳細を説明するフローチャートである。 ARアプリケーションの表示の第１の例を示す図である。 ARアプリケーションの表示の第２の例を示す図である。 ARアプリケーションの表示の第３の例を示す図である。本開示を適用した処理を行う装置を含むシステムの構成例を示す図である。電子機器の構成例を示すブロック図である。エッジサーバ又はクラウドサーバの構成例を示すブロック図である。光センサの構成例を示すブロック図である。

＜１．本開示の実施の形態＞

（装置の構成）
　図１は、本開示を適用した情報処理装置の一実施の形態の構成例を示すブロック図である。

　情報処理装置１０は、スマートフォン、タブレット型端末、携帯電話機等の電子機器である。

　情報処理装置１０は、各部の動作の制御や各種の処理を行うCPU(Central Processing Unit)１００と、画像処理や並列処理に特化したGPU(Graphics Processing Unit)１０１と、DRAM(Dynamic Random Access Memory)等のメインメモリ１０２と、フラッシュメモリ等の補助メモリ１０３を有し、バス１１２を介して接続される。

　補助メモリ１０３は、プログラムや各種パラメータ、データを記録している。CPU１００は、補助メモリ１０３に記録されたプログラムやパラメータをメインメモリ１０２に展開してプログラムを実行する。プログラムを実行する際には、補助メモリ１０３に記録されたデータを必要に応じて用いることができる。GPU１０１も同様に補助メモリ１０３に記録されたプログラムを実行することができる。

　情報処理装置１０において、バス１１２には、物理的なボタンやタッチパネル等の操作系１０４と、テキスト等の情報や映像を表示するディスプレイ１０５と、音を出力するスピーカ１０６と、所定の通信方式に対応した通信モジュール等の通信I/F１０７とがさらに接続される。通信方式としては、例えば、5G(5th Generation)等の移動通信システムや、無線LAN(Local Area Network)などが含まれる。

　また、情報処理装置１０において、バス１１２には、RGBセンサ１０８と、IMU(Inertial Measurement Unit)１０９と、測距センサ１１０と、GPS(Global Positioning System)１１１とがさらに接続される。

　RGBセンサ１０８は、CMOS(Complementary Metal Oxide Semiconductor)イメージセンサ等のイメージセンサを含む画像センサである。RGBセンサ１０８は、対象を撮影してその結果得られる撮影画像を出力する。撮影画像としては、１つの画素をR(赤)、G(緑)、B(青)の３原色で表したRGB画像が出力される。

　IMU１０９は、３軸の加速度計や３軸のジャイロからなる慣性計測装置である。IMU１０９は、３次元の加速度や角速度を計測してその結果得られる加速度情報を出力する。

　測距センサ１１０は、ToF(Time of Flight)センサなどの測距センサである。ToFセンサは、dToF(direct Time of Flight)方式とiToF(indirect Time of Flight)方式のいずれの方式であってもよい。測距センサ１１０は、対象までの距離を測定してその結果得られる測距情報を出力する。なお、測距センサ１１０は、ストラクチャライト方式のセンサ、LiDAR(Light Detection and Ranging)方式のセンサ、その他、複数のセンサを用いて測距を行うステレオカメラなどであってもよい。

　GPS１１１は、GPS衛星からの信号を受け取ることで現在位置を測定し、その結果得られるロケーション情報を出力する。なお、GPSは、衛星測位システムの一例であり、他の衛星測位システムを用いてもよい。

　なお、図１に示したハードウェア構成は一例であり、他の構成要素が追加されたり、一部の構成要素が取り除かれたりしてもよい。図１において、CPU１００とGPU１０１は、SoC(System on a Chip)として構成されてもよい。CPU１００が後述するAR処理用のプログラムを実行する場合にはGPU１０１を設けなくてもよい。

（機能的構成）
　図２は、本開示を適用した情報処理装置の機能的構成例を示すブロック図である。

　図２において、情報処理装置１０は、RGB画像取得部１５１、加速度情報取得部１５２、測距情報取得部１５３、ロケーション情報取得部１５４、天気情報取得部１５５、時間情報取得部１５６、オブジェクト検出部１５７、SLAM処理部１５８、ポイントクラウド生成部１５９、モデリング部１６０、３Ｄオブジェクト・材質認識部１６１、メッシュクラスタリング部１６２、形状認識部１６３、セマンティックセグメンテーション部１６４、及びAR処理部１６５から構成される。これらのブロックは、拡張現実(AR)に関する処理を行う処理部として構成される。

　RGB画像取得部１５１は、RGBセンサ１０８により撮影されたRGB画像を取得し、オブジェクト検出部１５７、SLAM処理部１５８、及びセマンティックセグメンテーション部１６４に供給する。

　加速度情報取得部１５２は、IMU１０９により測定された加速度情報を取得し、SLAM処理部１５８に供給する。

　測距情報取得部１５３は、測距センサ１１０により測定された測距情報を取得し、SLAM処理部１５８、ポイントクラウド生成部１５９、及び３Ｄオブジェクト・材質認識部１６１に供給する。

　測距情報は、デプス画像とIR反射率情報を含む。SLAM処理部１５８とポイントクラウド生成部１５９には、測距情報としてデプス画像が供給される。３Ｄオブジェクト・材質認識部１６１には、IR反射率情報が供給される。

　デプス画像は、ピクセルごとにデプス値を持ったデプスマップなどである。IR反射率情報は、ピクセルごとにIR(infrared)の値を持った赤外線画像などである。例えば、測距センサ１１０がToFセンサである場合に、発光素子からの赤外光を対象物体に照射してその反射光が戻ってくるまでの時間から、対象物体表面までの距離を算出する方式がある。この方式では、受光素子で受光した反射光(赤外光)から画像を生成するので、それらの画像を蓄積することで、赤外線画像が得られる。

　ロケーション情報取得部１５４は、GPS１１１により測定されたロケーション情報を取得し、AR処理部１６５に供給する。ロケーション情報は、情報処理装置１０の位置を示す情報である。

　天気情報取得部１５５は、通信I/F１０７を介してインターネット等のネットワーク上のサーバから天気情報を取得し、AR処理部１６５に供給する。天気情報は、晴、曇り、雨などを示す情報や、気温などの情報を含む。

　時間情報取得部１５６は、現在の時刻や日付などの時間情報を取得し、AR処理部１６５に供給する。時間情報は、情報処理装置１０の内部で管理している時間情報を取得してもよいし、あるいは、インターネット等のネットワーク上のサーバで管理されている時間情報を、通信I/F１０７を介して取得してもよい。

　オブジェクト検出部１５７は、RGB画像取得部１５１から供給されるRGB画像に含まれるオブジェクトを検出し、その検出結果を３Ｄオブジェクト・材質認識部１６１に供給する。

　SLAM処理部１５８には、RGB画像取得部１５１からのRGB画像と、加速度情報取得部１５２からの加速度情報と、測距情報取得部１５３からのデプス画像が供給される。SLAM処理部１５８は、RGB画像、加速度情報、及びデプス画像に基づいて、SLAM(Simultaneous Localization and Mapping)処理を行う。

　このSLAM処理では、RGB画像と加速度情報を用いた自己位置推定などの処理が行われ、情報処理装置１０(のRGBセンサ１０８)の位置と向きに関する姿勢情報が得られる。SLAM処理部１５８は、姿勢情報を、３Ｄオブジェクト・材質認識部１６１、及びモデリング部１６０に供給する。

　なお、SLAM処理においては、デプス画像は必須ではないが、測距情報としてのデプス画像をスケールの解決に用いることで、SLAM処理の精度を向上させることができる。また、SLAM処理では、加速度情報を用いずに、姿勢情報を算出しても構わない。

　ポイントクラウド生成部１５９は、測距情報取得部１５３から供給されるデプス画像に基づいて、ポイントクラウドを生成し、モデリング部１６０に供給する。ポイントクラウドは、３次元座標や色などの情報を持つ点群データである。

　モデリング部１６０には、SLAM処理部１５８からの姿勢情報と、ポイントクラウド生成部１５９からのポイントクラウドが供給される。モデリング部１６０は、姿勢情報及びポイントクラウドに基づいて、モデリングを行う。

　このモデリングでは、現実空間の環境をポリゴンメッシュ構造で表した環境メッシュが生成される。すなわち、現実空間の環境が３Ｄスキャンされ、ポリゴンメッシュ構造でモデリングされる。モデリング部１６０は、環境メッシュを、３Ｄオブジェクト・材質認識部１６１、メッシュクラスタリング部１６２、及び形状認識部１６３に供給する。

　３Ｄオブジェクト・材質認識部１６１には、測距情報取得部１５３からのIR反射率情報と、オブジェクト検出部１５７からのオブジェクト検出結果と、SLAM処理部１５８からの姿勢情報と、モデリング部１６０からの環境メッシュが供給される。３Ｄオブジェクト・材質認識部１６１は、姿勢情報、オブジェクト検出結果、IR反射率情報、及び環境メッシュに基づいて、３Ｄオブジェクトや材質を認識する認識処理を行う。

　３Ｄオブジェクトの認識処理では、オブジェクト検出結果(RGB画像)と姿勢情報等の情報を用いることで、現実空間に存在する椅子やソファー、ベッド、テレビ、人、ペットボトル、本などの物体が認識される。材質の認識処理では、オブジェクト検出結果(RGB画像)、IR反射率情報、及び環境メッシュ等の情報を用いることで、木、金属、石、織物、布などの材質が認識される。３Ｄオブジェクト・材質認識部１６１は、３Ｄオブジェクトと材質の認識結果を、AR処理部１６５に供給する。

　なお、材質の認識処理においては、IR反射率情報と環境メッシュを用いることは必須ではない。材質の認識処理を行うに際して、RGB画像の情報だけでなく、IR反射率情報(赤外線画像)を用いることで情報量が増えるため、より正しく材質を認識することができる。また、材質の認識処理においては、形状認識部１６３により認識される形状の認識結果をさらに用いてもよい。

　メッシュクラスタリング部１６２は、モデリング部１６０から供給される環境メッシュに基づいて、メッシュクラスタリングを行い、メッシュクラスタリング結果を、AR処理部１６５に供給する。

　このメッシュクラスタリングでは、クラスタリングの手法を用いて、環境メッシュのグループ分けが行われ、床、天井、壁、窓、ドア、椅子、ソファー、ベッドなどに分けられる。すなわち、ポリゴンメッシュは、オブジェクトの形状を定義する頂点などの集合からなる情報であるが、それらの頂点がどのグループ(床など)に属するかが認識されて分けられる。

　なお、メッシュクラスタリングを行うに際しては、セマンティックセグメンテーション部１６４によるセマンティックセグメンテーションの認識結果を用いても構わない。セマンティックセグメンテーションでは、RGB画像に基づき、特徴的なカテゴリを形成するピクセルの集まりを認識することができる。

　形状認識部１６３は、モデリング部１６０から供給される環境メッシュに基づいて、形状や大きさを認識する認識処理を行い、形状や大きさの認識結果を、AR処理部１６５に供給する。

　形状や大きさの認識処理では、空間や突起、凹みなどの特定の形状や大きさが認識される。例えば、空間の形状や大きさとしては、広い空間が存在しているなどが認識される。すなわち、環境メッシュは、頂点などの集合からなるポリゴンメッシュで表されるため、このポリゴンメッシュから、例えば四角や凹んでいるなどの特定の形状を認識することができる。この認識処理では、ポリゴンメッシュのかたまりが、特定の形状に一致するかどうかが判定されるが、その判定に際しては、ルールベースで行ってもよいし、あるいは、RGB画像等の学習データを用いた機械学習により学習された学習済みモデルを用いてもよい。

　AR処理部１６５には、３Ｄオブジェクト・材質認識部１６１からの３Ｄオブジェクトや材質の認識結果と、メッシュクラスタリング部１６２からのクラスタリング結果と、形状認識部１６３からの形状や大きさの認識結果が供給される。３Ｄオブジェクトの認識結果には、物体(椅子やソファー等)や色に関する情報が含まれる。すなわち、AR処理部１６５には、クラスタリング結果とともに、物体、形状、大きさ、色、及び材質に関する情報が供給される。ただし、物体、形状、大きさ、色、及び材質に関する情報は、少なくともいずれかの情報が供給されればよい。

　AR処理部１６５にはまた、ロケーション情報取得部１５４からのロケーション情報と、天気情報取得部１５５からの天気情報と、時間情報取得部１５６からの時間情報が供給される。

　AR処理部１６５は、３Ｄオブジェクトや材質の認識結果、クラスタリング結果、形状や大きさの認識結果、ロケーション情報、天気情報、及び時間情報に基づいて、拡張現実(AR)の映像を生成するAR処理を行う。AR処理部１６５は、AR処理を行うに際して、補助メモリ１０３に記録されたデータ(ARオブジェクト等のコンテンツのデータ)を適宜読み出して用いることができる。

　図３は、AR処理部１６５の詳細な構成例を示している。図３において、AR処理部１６５は、オブジェクト生成部１９１、モーフィング処理部１９２、及びエフェクト処理部１９３から構成される。

　オブジェクト生成部１９１は、拡張現実の映像として用いられるARオブジェクトを生成する。例えば、ARオブジェクトとしては、船等の乗り物、家等の建物、木や花等の植物、動物や虫等の生き物、風船、ロケット、人(キャラクタ)などのオブジェクトが生成される。

　モーフィング処理部１９２は、モーフィング処理を行い、ポリゴンメッシュやオブジェクトの置換を行う。モーフィング処理では、ある物体から他の物体へと自然に変形する映像が表示されるように処理が行われる。例えば、ポリゴンメッシュの置換では、メッシュクラスタリングでグループ分けされたポリゴンメッシュが、空、海、滝、地面などの画像に置換される。オブジェクトの置換では、３Ｄオブジェクトとして認識された人が、その背景の情報に応じたCG(Computer Graphics)モデルなどに置換される。

　エフェクト処理部１９３は、VFX(Visual Effects)を用いたエフェクト処理を行い、現実空間には見ることのできない映像効果を実現する。例えば、VFXとしては、昼や夜の時間帯、曇り等の天候などに応じたライティング(Lighting)の変更や、雨や雪などの天候に対応したエフェクトを画面全体に施すなどの処理がある。

　オブジェクト生成部１９１、モーフィング処理部１９２、及びエフェクト処理部１９３は、それぞれの処理を行うに際して、様々な情報を用いることができる。例えば、エフェクト処理部１９３では、ロケーション情報や天気情報、時間情報などの付加情報に基づき、場所や天候、時間帯などの条件に応じたライティングの変更などのコンテンツの加工を行うことができる。ロケーション情報、天気情報、及び時間情報などの情報を用いることで、それらの情報に応じた拡張現実の映像を生成することができる。

　以上のように構成される情報処理装置１０では、AR処理部１６５等を含む処理部によって、現実空間を３Ｄスキャンして得られるスキャン結果に基づき、現実空間に応じた領域を、対応付けたコンテンツに置き換える処理が行われる。この対応付けに際しては、現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づき、現実空間に応じた領域にコンテンツが対応付けられる。

　より具体的には、AR処理部１６５は、現実空間における物体に関する情報に基づいて、特定の物体を有する領域に、コンテンツを対応付ける。この物体は、RGBセンサ１０８により撮影されたRGB画像に基づいて認識される。また、AR処理部１６５は、現実空間における形状に関する情報に基づいて、特定の形状を有する領域に、コンテンツを対応付ける。この形状は、RGBセンサにより撮影されたRGB画像、IMU１０９により測定された加速度情報、及び測距センサ１１０により測定された測距情報に基づいて認識される。

　AR処理部１６５は、現実空間における大きさに関する情報に基づいて、特定の大きさを有する領域に、コンテンツを対応付ける。この大きさは、RGBセンサにより撮影されたRGB画像、IMU１０９により測定された加速度情報、及び測距センサ１１０により測定された測距情報に基づいて認識される。また、AR処理部１６５は、現実空間における色に関する情報に基づいて、特定の色を有する領域に、コンテンツを対応付ける。この色は、RGBセンサ１０８により撮影されたRGB画像に基づいて認識される。

　AR処理部１６５は、現実空間における材質に関する情報に基づいて、特定の材質を有する領域に、コンテンツを対応付ける。この材質は、RGBセンサ１０８により撮影されたRGB画像、及び測距センサ１１０により測定された測距情報に基づいて認識される。

　なお、AR処理部１６５において、オブジェクト生成部１９１によるオブジェクト生成処理と、エフェクト処理部１９３によるエフェクト処理は、必要に応じて実行される処理である。図２において、ブロック間の矢印は、ブロック間でやり取りされる信号やデータの流れを表しているが、破線で表した矢印は、信号やデータの流れが必須ではないことを意味している。

（処理の流れ）
　次に、図４，図５のフローチャートを参照して、本開示を適用した情報処理装置で実行される処理の流れを説明する。スマートフォン等の情報処理装置１０では、拡張現実の映像を表示するARアプリケーションがインターネット上のサーバからダウンロードされて起動される。例えば、情報処理装置１０では、ARアプリケーションの起動時に、ユーザにより所定の操作がなされたとき、図４のフローチャートに示した処理が実行される。

　ステップＳ１１において、各取得部は必要に応じてデータを取得する。RGB画像取得部１５１、加速度情報取得部１５２、及び測距情報取得部１５３によって、RGB画像、加速度情報、及び測距情報がそれぞれ取得される。また、ロケーション情報取得部１５４、天気情報取得部１５５、及び時間情報取得部１５６によって、ロケーション情報、天気情報、及び時間情報がそれぞれ取得される。

　ステップＳ１２において、SLAM処理部１５８は、RGB画像、加速度情報、及びデプス画像に基づいて、SLAM処理を行い、姿勢情報を算出する。なお、SLAM処理では、加速度情報とデプス画像は適宜用いられ、少なくもRGB画像を用いて姿勢情報が算出される。

　ステップＳ１３において、ポイントクラウド生成部１５９は、デプス画像に基づいて、ポイントクラウドを生成する。

　ステップＳ１４において、モデリング部１６０は、姿勢情報及びポイントクラウドに基づいて、モデリングを行い、環境メッシュを生成する。

　ステップＳ１５において、３Ｄオブジェクト・材質認識部１６１は、姿勢情報、オブジェクト検出結果、IR反射率情報、及び環境メッシュに基づいて、３Ｄオブジェクトや材質を認識する認識処理を行う。

　３Ｄオブジェクトの認識処理では、オブジェクト検出結果(RGB画像)と姿勢情報等の情報を用いることで、現実空間に存在する物体が認識される。材質の認識処理では、オブジェクト検出結果(RGB画像)、IR反射率情報、及び環境メッシュ等の情報を用いることで材質が認識される。なお、材質の認識処理では、IR反射率情報と環境メッシュは必要に応じて用いられる。

　ステップＳ１６において、メッシュクラスタリング部１６２は、環境メッシュに基づいて、メッシュクラスタリングを行う。このメッシュクラスタリングでは、クラスタリングの手法を用いて、環境メッシュ(ポリゴンメッシュのかたまり)のグループ分けが行われる。なお、メッシュクラスタリングを行うに際しては、セマンティックセグメンテーションの認識結果を用いてもよい。

　ステップＳ１７において、形状認識部１６３は、環境メッシュに基づいて、形状や大きさを認識する認識処理を行う。形状の認識処理では、環境メッシュが頂点などの集合からなるポリゴンメッシュで表されるため、このポリゴンメッシュから、例えば四角や凹んでいるなどの特定の形状とその大きさを認識することができる。

　ステップＳ１８において、AR処理部１６５は、３Ｄオブジェクトや材質の認識結果、形状や大きさの認識結果、及びクラスタリング結果などの情報に基づいて、AR処理を行う。AR処理では、ロケーション情報や天気情報、時間情報などの付加情報を適宜用いることができる。ここで、図５のフローチャートを参照して、AR処理の詳細を説明する。

　ステップＳ５１において、オブジェクト生成部１９１は、船や家などのARオブジェクトを生成するオブジェクト生成処理を行う。

　ステップＳ５２において、モーフィング処理部１９２は、ポリゴンメッシュの置換やオブジェクトの置換などのモーフィング処理を行う。

　ポリゴンメッシュの置換では、メッシュクラスタリングでグループ分けされたポリゴンメッシュが、空や海などの画像に置換される。オブジェクトの置換では、３Ｄオブジェクトとして認識された人が、CGモデルなどに置換される。

　ステップＳ５３において、エフェクト処理部１９３は、時間帯や天候などの条件に応じたライティングの変更や、画面全体にエフェクトを施すなどのエフェクト処理を行う。

　このように、AR処理として、オブジェクト生成処理によってARオブジェクトを生成したり、モーフィング処理によってポリゴンメッシュやオブジェクトを置換したり、エフェクト処理によってライティングの変更や画面全体にエフェクトを施したりすることで、拡張現実の映像が生成される。

　図４に戻り、ステップＳ１９において、AR処理部１６５は、AR処理により得られる拡張現実の映像データを、ディスプレイ１０５に出力する。これにより、ディスプレイ１０５には、AR処理部１６５により生成された拡張現実の映像が表示される。

　図６，図７には、ARアプリケーションの表示例を示している。図６に示すように、スマートフォン等の情報処理装置１０を操作しているユーザが、ARアプリケーションを起動して部屋にあるソファーを撮影している場面を想定する。このとき、情報処理装置１０では、ソファー２００を含む映像がディスプレイ１０５に表示される。

　情報処理装置１０では、ARアプリケーションによって、図４，図５のフローチャートに示した処理が実行されることで、図７に示すような、拡張現実の映像が表示される。例えば、AR処理として、オブジェクト生成処理やモーフィング処理が行われることで、オブジェクト２１１，２１２が表示される。また、AR処理として、モーフィング処理が行われることで、ソファー２００のほか、床や壁の形状を定義したポリゴンメッシュが、空や地面などに置換されている。

　具体的には、ソファー２００の座面の部分が、地面などの画像２１３に置き換えられ、そこに、建物などのオブジェクト２１１，２１２が配置された拡張現実の映像が表示されている。オブジェクト２１１，２１２は、オブジェクト生成処理により生成されたARオブジェクトであってもよいし、モーフィング処理によるオブジェクトの置換により置き換えられたCGモデル等のオブジェクトであってもよい。それ以外にも、例えば、階段を滝に置き換えたり、絨毯を草原に置き換えたり、テーブルに置かれたペットボトルをロケットに置き換えたり、壁掛け時計を太陽に置き換えたりてもよい。

　以上、本開示を適用した情報処理装置で実行される処理を説明した。本開示を適用した情報処理装置では、図４，図５のフローチャートに示した処理を実行することで、オブジェクト生成処理やモーフィング処理で用いられる情報の情報量と精度が高くなる。そのため、拡張現実の映像表現の幅を広げることができる。また、拡張現実の映像表現の幅が広がることで、映像の不自然さが解消されるなどの効果が得られる。

　近年、環境メッシュや３Ｄオブジェクトの認識結果を、ゲームやSNSの動画撮影へ活用するために、CGオブジェクト生成やモーフィング処理、ライティング変更処理、VFX処理などを用いて拡張現実の映像を生成することが行われている。CGオブジェクトの配置には、メッシュクラスタリング結果や３Ｄオブジェクトの認識結果が主に使用されていた。しかしながら、メッシュクラスタリング結果が少ないことや精度が悪いこと、あるいは３Ｄオブジェクトの認識結果が少ないことや精度が悪いことなどによる情報の不足に起因して、拡張現実の映像表現の幅が狭くなり、面白さを損ねてしまうことがあった。

　それに対して、本開示を適用した情報処理装置では、現実空間を３Ｄスキャンして得られるスキャン結果に基づき、現実空間に応じた領域を、対応付けたコンテンツに置き換える処理を行うに際して、現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づき、現実空間に応じた領域にコンテンツが対応付けられる。これにより、AR処理で用いられる情報が増えるため、結果として拡張現実の映像表現の幅を広げることができる。

＜２．変形例＞

（ポリゴンメッシュの表示と編集）
　情報処理装置１０においては、現実空間を３Ｄスキャンしてポリゴンメッシュ構造でモデリングし、ポリゴンメッシュをコンテンツに置き換える処理が行われることで、ディスプレイ１０５には拡張現実の映像が表示される。例えば、ユーザがARアプリケーションを操作することで、現実空間の３Ｄスキャンが開始されるが、このとき、現実空間の３Ｄスキャンを開始した後であって、ポリゴンメッシュをコンテンツに置き換える前に、ポリゴンメッシュに関する映像をディスプレイ１０５に表示してもよい。

　図８には、ARアプリケーションの表示例を示している。図８において、ディスプレイ１０５には、部屋にあるソファー、壁、床をポリゴンメッシュ２２１により表現した映像が表示されている。すなわち、図８の表示例は、時系列としては、図６の撮影映像と図７の拡張現実の映像との間に表示される中間的な状態を表示したものである。

　また、ARアプリケーションは、ポリゴンメッシュの編集機能を提供してもよい。例えば、図８に示したポリゴンメッシュ２２１に対してユーザが指で触れるなどの編集操作を行った場合に、当該編集操作に応じてポリゴンメッシュ２２１を加工(変形等)してもよい。ポリゴンメッシュ２２１を後から編集できるように関連するデータを補助メモリ１０３に記録しておき、補助メモリ１０３から読み出したデータに基づき、ポリゴンメッシュ２２１を編集してもよい。あるいは、ARアプリケーションから、ユーザに対して、ポリゴンメッシュ２２１の編集を提案してもよい。

（スキャン情報の保存）
　情報処理装置１０は、現実空間を３Ｄスキャンして得られるスキャン結果のデータを、補助メモリ１０３に記録することができる。スキャン結果のデータは、インターネット等のネットワーク上のサーバに送信して記録し、必要に応じて取得してもよい。このように、スキャン結果のデータを保持しておくことで、例えばユーザがスキャン済みの現実空間を再度訪れたとき、情報処理装置１０では、保持していたスキャン結果のデータに基づき、拡張現実の映像を表示することができる。

　このとき、情報処理装置１０は、現実空間を３Ｄスキャンする必要がないため、処理負荷を軽減できるとともに、拡張現実の映像を表示するまでの時間を短縮することができる。同一の場所を訪れたかどうかは、ロケーション情報やセンシング情報などの情報を用いて判定すればよい。

（他の電子機器の例）
　上述した説明では、情報処理装置１０がスマートフォン等のモバイル機器である場合を例示したが、情報処理装置１０は、HMD(Head Mounted Display)や、ウェアラブル機器、PC(Personal Computer)などの他の電子機器であってもよい。

（クラウドの利用）
　上述した説明では、情報処理装置１０において、補助メモリ１０３が、ARオブジェクト等のコンテンツのデータを記録する場合を例示したが、コンテンツのデータは、インターネット等のネットワーク上のサーバに記録しておき、必要に応じて取得してもよい。

　また、本開示の他の実施の形態として、１つの機能を、ネットワークを介して複数の装置で分担、共同して処理するクラウドコンピューティングの構成をとることができる。具体的には、図２に示した情報処理装置１０の機能的構成例の機能のうち、少なくとも一部の機能をクラウド側のサーバが備えるようにしてもよい。例えば、現実空間を３Ｄスキャンしてポリゴンメッシュを形成するまでの処理をローカル側の情報処理装置１０が行い、それ以降のAR処理などをクラウド側のサーバが行うことができる。あるいは、図２に示した情報処理装置１０の機能的構成例の機能の全てをクラウド側のサーバが備えるようにしてもよい。例えば、ローカル側の情報処理装置１０は、各種センサ等から得られた情報をクラウド側のサーバに送ることで、クラウド側のサーバにより図４，図５のフローチャートに示した処理が行われる。クラウド側のサーバからの処理結果は、ローカル側の情報処理装置１０に送られ、拡張現実の映像が表示される。

（他の構成の例）
　図９は、本開示を適用した処理を行う装置を含むシステムの構成例を示している。

　電子機器２０００１は、スマートフォン、タブレット型端末、携帯電話機等のモバイル端末である。電子機器２０００１は、例えば、図１の情報処理装置１０に対応しており、RGBセンサ１０８（図１）や測距センサ１１０（図１）に対応した光センサ２００１１を有する。光センサは、光を電気信号に変換するセンサ（画像センサ）である。電子機器２０００１は、所定の通信方式に対応した無線通信によって所定の場所に設置された基地局２００２０に接続することで、コアネットワーク２００３０を介して、インターネット等のネットワーク２００４０に接続することができる。

　基地局２００２０とコアネットワーク２００３０の間などのモバイル端末により近い位置には、モバイルエッジコンピューティング（ＭＥＣ：Mobile Edge Computing）を実現するためのエッジサーバ２０００２が設けられる。ネットワーク２００４０には、クラウドサーバ２０００３が接続される。エッジサーバ２０００２とクラウドサーバ２０００３は、用途に応じた各種の処理を行うことができる。なお、エッジサーバ２０００２は、コアネットワーク２００３０内に設けられてもよい。

　電子機器２０００１、エッジサーバ２０００２、クラウドサーバ２０００３、又は光センサ２００１１により、本開示を適用した処理が行われる。本開示を適用した処理は、図４，図５のフローチャートに示した各ステップの処理のうち、少なくともいずれかの処理を含む。

　電子機器２０００１、エッジサーバ２０００２、クラウドサーバ２０００３、又は光センサ２００１１においては、ＣＰＵ(Central Processing Unit)等のプロセッサがプログラムを実行したり、あるいは特定用途に特化したプロセッサ等の専用のハードウェアを用いたりすることで、本開示を適用した処理が実現される。例えば、特定用途に特化したプロセッサとしては、ＧＰＵ(Graphics Processing Unit)を用いることができる。

　図１０は、電子機器２０００１の構成例を示している。電子機器２０００１は、各部の動作の制御や各種の処理を行うＣＰＵ２０１０１と、画像処理や並列処理に特化したＧＰＵ２０１０２と、ＤＲＡＭ(Dynamic Random Access Memory)等のメインメモリ２０１０３と、フラッシュメモリ等の補助メモリ２０１０４を有する。

　補助メモリ２０１０４は、本開示を適用した処理用のプログラムや各種パラメータ等のデータを記録している。ＣＰＵ２０１０１は、補助メモリ２０１０４に記録されたプログラムやパラメータをメインメモリ２０１０３に展開してプログラムを実行する。あるいは、ＣＰＵ２０１０１とＧＰＵ２０１０２は、補助メモリ２０１０４に記録されたプログラムやパラメータをメインメモリ２０１０３に展開してプログラムを実行する。これにより、ＧＰＵ２０１０２を、ＧＰＧＰＵ(General-Purpose computing on Graphics Processing Units)として用いることができる。

　なお、ＣＰＵ２０１０１やＧＰＵ２０１０２は、ＳｏＣ(System on a Chip)として構成されてもよい。ＣＰＵ２０１０１が本開示を適用した処理用のプログラムを実行する場合には、ＧＰＵ２０１０２を設けなくてもよい。

　電子機器２０００１はまた、光センサ２００１１と、物理的なボタンやタッチパネル等の操作部２０１０５と、少なくとも１以上のセンサを含むセンサ２０１０６と、画像やテキスト等の情報を表示するディスプレイ２０１０７と、音を出力するスピーカ２０１０８と、所定の通信方式に対応した通信モジュール等の通信Ｉ／Ｆ２０１０９と、それらを接続するバス２０１１０を有する。

　センサ２０１０６は、光センサ（画像センサ）、音センサ（マイクロフォン）、振動センサ、加速度センサ、角速度センサ、圧力センサ、匂いセンサ、生体センサ等の各種のセンサを少なくとも１以上有している。本開示を適用した処理では、光センサ２００１１から取得したデータ（画像データ）とともに、センサ２０１０６の少なくとも１以上のセンサから取得したデータを用いることができる。すなわち、光センサ２００１１は、RGBセンサ１０８（図１）と測距センサ１１０（図１）に対応し、センサ２０１０６は、IMU１０９（図１）に対応している。

　なお、センサフュージョンの技術によって２以上の光センサから取得したデータやそれらを統合的に処理して得られるデータが、本開示を適用した処理で用いられてもよい。２以上の光センサとしては、光センサ２００１１とセンサ２０１０６内の光センサの組み合わせでもよいし、あるいは光センサ２００１１内に複数の光センサが含まれていてもよい。例えば、光センサには、ＲＧＢの可視光センサ、ＴｏＦ（Time of Flight）等の測距センサ、偏光センサ、イベントベースのセンサ、ＩＲ像を取得するセンサ、多波長取得可能なセンサなどが含まれる。

　電子機器２０００１においては、ＣＰＵ２０１０１やＧＰＵ２０１０２等のプロセッサによって本開示を適用した処理を行うことができる。電子機器２０００１のプロセッサが本開示を適用した処理を行う場合には、光センサ２００１１で画像データを取得した後に時間を要さずに処理を開始することができるため、高速に処理を行うことができる。そのため、電子機器２０００１では、短い遅延時間で情報を伝達することが求められるアプリケーションなどの用途に処理が用いられた際に、ユーザは遅延による違和感なく操作を行うことができる。また、電子機器２０００１のプロセッサが本開示を適用した処理を行う場合、クラウドサーバ２０００３等のサーバを利用する場合と比べて、通信回線やサーバ用のコンピュータ機器などを利用する必要がなく、低コストで処理を実現することができる。

　図１１は、エッジサーバ２０００２の構成例を示している。エッジサーバ２０００２は、各部の動作の制御や各種の処理を行うＣＰＵ２０２０１と、画像処理や並列処理に特化したＧＰＵ２０２０２を有する。エッジサーバ２０００２はさらに、ＤＲＡＭ等のメインメモリ２０２０３と、ＨＤＤ(Hard Disk Drive)やＳＳＤ(Solid State Drive)等の補助メモリ２０２０４と、ＮＩＣ(Network Interface Card)等の通信Ｉ／Ｆ２０２０５を有し、それらがバス２０２０６に接続される。

　補助メモリ２０２０４は、本開示を適用した処理用のプログラムや各種パラメータ等のデータを記録している。ＣＰＵ２０２０１は、補助メモリ２０２０４に記録されたプログラムやパラメータをメインメモリ２０２０３に展開してプログラムを実行する。あるいは、ＣＰＵ２０２０１とＧＰＵ２０２０２は、補助メモリ２０２０４に記録されたプログラムやパラメータをメインメモリ２０２０３に展開してプログラムを実行することで、ＧＰＵ２０２０２をＧＰＧＰＵとして用いることができる。なお、ＣＰＵ２０２０１が本開示を適用した処理用のプログラムを実行する場合には、ＧＰＵ２０２０２を設けなくてもよい。

　エッジサーバ２０００２においては、ＣＰＵ２０２０１やＧＰＵ２０２０２等のプロセッサによって本開示を適用した処理を行うことができる。エッジサーバ２０００２のプロセッサが本開示を適用した処理を行う場合、エッジサーバ２０００２はクラウドサーバ２０００３と比べて、電子機器２０００１と近い位置に設けられるため、処理の低遅延化を実現することができる。また、エッジサーバ２０００２は、電子機器２０００１や光センサ２００１１に比べて、演算速度などの処理能力が高いため、汎用的に構成することができる。そのため、エッジサーバ２０００２のプロセッサが本開示を適用した処理を行う場合、電子機器２０００１や光センサ２００１１の仕様や性能の違いに依らず、データを受信できれば本開示を適用した処理を行うことができる。エッジサーバ２０００２で本開示を適用した処理を行う場合には、電子機器２０００１や光センサ２００１１における処理の負荷を軽減することができる。

　クラウドサーバ２０００３の構成は、エッジサーバ２０００２の構成と同様であるため、説明は省略する。

　クラウドサーバ２０００３においては、ＣＰＵ２０２０１やＧＰＵ２０２０２等のプロセッサによって本開示を適用した処理を行うことができる。クラウドサーバ２０００３は、電子機器２０００１や光センサ２００１１に比べて、演算速度などの処理能力が高いため、汎用的に構成することができる。そのため、クラウドサーバ２０００３のプロセッサが本開示を適用した処理を行う場合、電子機器２０００１や光センサ２００１１の仕様や性能の違いに依らず、本開示を適用した処理を行うことができる。また、電子機器２０００１又は光センサ２００１１のプロセッサで負荷の高い本開示を適用した処理を行うことが困難である場合には、その負荷の高い本開示を適用した処理をクラウドサーバ２０００３のプロセッサが行い、その処理結果を電子機器２０００１又は光センサ２００１１のプロセッサにフィードバックすることができる。

　図１２は、光センサ２００１１の構成例を示している。光センサ２００１１は、例えば複数の基板が積層された積層構造を有する１チップの半導体装置として構成することができる。光センサ２００１１は、基板２０３０１と基板２０３０２の２枚の基板が積層されて構成される。なお、光センサ２００１１の構成としては積層構造に限らず、例えば、撮像部を含む基板が、ＣＰＵやＤＳＰ(Digital Signal Processor)等の本開示を適用した処理を行うプロセッサを含んでいてもよい。

　上層の基板２０３０１には、複数の画素が２次元に並んで構成される撮像部２０３２１が搭載されている。下層の基板２０３０２には、撮像部２０３２１での画像の撮像に関する処理を行う撮像処理部２０３２２と、撮像画像や信号処理結果を外部に出力する出力Ｉ／Ｆ２０３２３と、撮像部２０３２１での画像の撮像を制御する撮像制御部２０３２４が搭載されている。撮像部２０３２１、撮像処理部２０３２２、出力Ｉ／Ｆ２０３２３、及び撮像制御部２０３２４により撮像ブロック２０３１１が構成される。

　下層の基板２０３０２には、各部の制御や各種の処理を行うＣＰＵ２０３３１と、撮像画像や外部からの情報等を用いた信号処理を行うＤＳＰ２０３３２と、ＳＲＡＭ（Static Random Access Memory）やＤＲＡＭ（Dynamic Random Access Memory）等のメモリ２０３３３と、外部と必要な情報のやり取りを行う通信Ｉ／Ｆ２０３３４が搭載されている。ＣＰＵ２０３３１、ＤＳＰ２０３３２、メモリ２０３３３、及び通信Ｉ／Ｆ２０３３４により信号処理ブロック２０３１２が構成される。ＣＰＵ２０３３１及びＤＳＰ２０３３２の少なくとも１つのプロセッサによって本開示を適用した処理を行うことができる。

　このように、複数の基板が積層された積層構造における下層の基板２０３０２に、本開示を適用した処理用の信号処理ブロック２０３１２を搭載することができる。これにより、上層の基板２０３０１に搭載される撮像用の撮像ブロック２０３１１で取得される画像データが、下層の基板２０３０２に搭載された本開示を適用した処理用の信号処理ブロック２０３１２で処理されるため、１チップの半導体装置内で一連の処理を行うことができる。

　光センサ２００１１においては、ＣＰＵ２０３３１等のプロセッサによって本開示を適用した処理を行うことができる。光センサ２００１１のプロセッサが処理等の本開示を適用した処理を行う場合、１チップの半導体装置内で一連の処理が行われるため、センサ外部に情報が漏れないことから情報の秘匿性を高めることができる。また、画像データ等のデータを他の装置に送信する必要がないため、光センサ２００１１のプロセッサでは、画像データを用いた処理等の本開示を適用した処理を高速に行うことができる。例えば、リアルタイム性が求められるアプリケーションなどの用途に処理が用いられた際に、リアルタイム性を十分に確保することができる。ここで、リアルタイム性を確保するということは、短い遅延時間で情報を伝達できることを指す。さらに、光センサ２００１１のプロセッサが本開示を適用した処理を行うに際して、電子機器２０００１のプロセッサにより各種のメタデータを渡すことで、処理を削減して低消費電力化を図ることができる。

　なお、本明細書において、コンピュータ(CPU等のプロセッサ)がプログラムに従って行う処理は、必ずしもフローチャートとして記載された順序に沿って時系列に行われる必要はない。すなわち、コンピュータがプログラムに従って行う処理は、並列的あるいは個別に実行される処理(例えば、並列処理あるいはオブジェクトによる処理)も含む。また、プログラムは、１のコンピュータ(CPU等のプロセッサ)により処理されてもよいし、複数のコンピュータによって分散処理されてもよい。

　なお、本開示の実施の形態は、上述した実施の形態に限定されるものではなく、本開示の要旨を逸脱しない範囲において種々の変更が可能である。本明細書に記載された効果はあくまで例示であって限定されるものではなく、他の効果があってもよい。

　また、本開示は、以下のような構成をとることができる。

（１）
　現実空間を３Ｄスキャンして得られるスキャン結果に基づいて、前記現実空間に応じた領域を、対応付けたコンテンツに置き換える処理を行う処理部を備え、
　前記処理部は、前記現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づいて、前記現実空間に応じた領域に前記コンテンツを対応付ける
　情報処理装置。
（２）
　前記コンテンツを記録する記録部をさらに備える
　前記（１）に記載の情報処理装置。
（３）
　前記処理部は、前記物体に関する情報に基づいて、特定の物体を有する領域に、前記コンテンツを対応付ける
　前記（１）又は（２）に記載の情報処理装置。
（４）
　前記処理部は、前記形状に関する情報に基づいて、特定の形状を有する領域に、前記コンテンツを対応付ける
　前記（１）又は（２）に記載の情報処理装置。
（５）
　前記処理部は、前記大きさに関する情報に基づいて、特定の大きさを有する領域に、前記コンテンツを対応付ける
　前記（１）又は（２）に記載の情報処理装置。
（６）
　前記処理部は、前記色に関する情報に基づいて、特定の色を有する領域に、前記コンテンツを対応付ける
　前記（１）又は（２）に記載の情報処理装置。
（７）
　前記処理部は、前記材質に関する情報に基づいて、特定の材質を有する領域に、前記コンテンツを対応付ける
　前記（１）又は（２）に記載の情報処理装置。
（８）
　前記物体は、画像センサにより撮影された撮影画像に基づいて認識される
　前記（３）に記載の情報処理装置。
（９）
　前記形状は、画像センサにより撮影された撮影画像、IMUにより測定された加速度情報、及び測距センサにより測定された測距情報に基づいて認識される
　前記（４）に記載の情報処理装置。
（１０）
　前記大きさは、画像センサにより撮影された撮影画像、IMUにより測定された加速度情報、及び測距センサにより測定された測距情報に基づいて認識される
　前記（５）に記載の情報処理装置。
（１１）
　前記色は、画像センサにより撮影された撮影画像に基づいて認識される
　前記（６）に記載の情報処理装置。
（１２）
　前記材質は、画像センサにより撮影された撮影画像、及び測距センサにより測定された測距情報に基づいて認識される
　前記（７）に記載の情報処理装置。
（１３）
　前記処理部は、前記現実空間に応じた領域に配置するオブジェクトを生成する処理、及び前記現実空間に応じた領域にエフェクトを施す処理のうち、少なくとも一方の処理をさらに行う
　前記（１）乃至（１２）のいずれかに記載の情報処理装置。
（１４）
　前記処理部は、ネットワークを経由して取得された付加情報に基づいて、前記コンテンツを加工する
　前記（１３）に記載の情報処理装置。
（１５）
　前記付加情報は、天気、及び時間の少なくとも一方に関する情報を含む
　前記（１４）に記載の情報処理装置。
（１６）
　前記現実空間に応じた領域を前記コンテンツに置き換えた映像を表示する表示部をさらに備える
　前記（１）乃至（１５）のいずれかに記載の情報処理装置。
（１７）
　前記処理部は、前記現実空間を３Ｄスキャンしてポリゴンメッシュ構造でモデリングし、ポリゴンメッシュを前記コンテンツに置き換える処理を行い、
　前記表示部は、前記現実空間の３Ｄスキャンを開始した後であって、前記ポリゴンメッシュを前記コンテンツに置き換える前に、前記ポリゴンメッシュに関する映像を表示する
　前記（１６）に記載の情報処理装置。
（１８）
　前記処理部は、ユーザの編集操作に応じて、前記ポリゴンメッシュを加工する
　前記（１７）に記載の情報処理装置。
（１９）
　情報処理装置が、
　現実空間を３Ｄスキャンして得られるスキャン結果に基づいて、前記現実空間に応じた領域を、対応付けたコンテンツに置き換える処理を行い、
　前記現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づいて、前記現実空間に応じた領域に前記コンテンツを対応付ける
　情報処理方法。
（２０）
　コンピュータを、
　現実空間を３Ｄスキャンして得られるスキャン結果に基づいて、前記現実空間に応じた領域を、対応付けたコンテンツに置き換える処理を行う処理部を備え、
　前記処理部は、前記現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づいて、前記現実空間に応じた領域に前記コンテンツを対応付ける
　情報処理装置として機能させるプログラム。

　１０　情報処理装置，　１００　CPU，　１０１　GPU，　１０２　メインメモリ，　１０３　補助メモリ，　１０４　操作系，　１０５　ディスプレイ，　１０６　スピーカ，　１０７　通信I/F，　１０８　RGBセンサ，　１０９　IMU，　１１０　測距センサ，　１１１　GPS，　１５１　RGB画像取得部，　１５２　加速度情報取得部，　１５３　測距情報取得部，　１５４　ロケーション情報取得部，　１５５　天気情報取得部，　１５６　時間取得部，　１５７　オブジェクト検出部，　１５８　SLAM処理部，　１５９　ポイントクラウド生成部，　１６０　モデリング部，　１６１　３Ｄオブジェクト・材質認識部，　１６２　メッシュクラスタリング部，　１６３　形状認識部，　１６４　セマンティックセグメンテーション部，　１６５　AR処理部，　１９１　オブジェクト生成部，　１９２　モーフィング処理部，　１９３　エフェクト処理部

Claims

　現実空間を３Ｄスキャンして得られるスキャン結果に基づいて、前記現実空間に応じた領域を、対応付けたコンテンツに置き換える処理を行う処理部を備え、
　前記処理部は、前記現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づいて、前記現実空間に応じた領域に前記コンテンツを対応付ける
　情報処理装置。
　前記コンテンツを記録する記録部をさらに備える
　請求項１に記載の情報処理装置。
　前記処理部は、前記物体に関する情報に基づいて、特定の物体を有する領域に、前記コンテンツを対応付ける
　請求項１に記載の情報処理装置。
　前記処理部は、前記形状に関する情報に基づいて、特定の形状を有する領域に、前記コンテンツを対応付ける
　請求項１に記載の情報処理装置。
　前記処理部は、前記大きさに関する情報に基づいて、特定の大きさを有する領域に、前記コンテンツを対応付ける
　請求項１に記載の情報処理装置。
　前記処理部は、前記色に関する情報に基づいて、特定の色を有する領域に、前記コンテンツを対応付ける
　請求項１に記載の情報処理装置。
　前記処理部は、前記材質に関する情報に基づいて、特定の材質を有する領域に、前記コンテンツを対応付ける
　請求項１に記載の情報処理装置。
　前記物体は、画像センサにより撮影された撮影画像に基づいて認識される
　請求項３に記載の情報処理装置。
　前記形状は、画像センサにより撮影された撮影画像、IMUにより測定された加速度情報、及び測距センサにより測定された測距情報に基づいて認識される
　請求項４に記載の情報処理装置。
　前記大きさは、画像センサにより撮影された撮影画像、IMUにより測定された加速度情報、及び測距センサにより測定された測距情報に基づいて認識される
　請求項５に記載の情報処理装置。
　前記色は、画像センサにより撮影された撮影画像に基づいて認識される
　請求項６に記載の情報処理装置。
　前記材質は、画像センサにより撮影された撮影画像、及び測距センサにより測定された測距情報に基づいて認識される
　請求項７に記載の情報処理装置。
　前記処理部は、前記現実空間に応じた領域に配置するオブジェクトを生成する処理、及び前記現実空間に応じた領域にエフェクトを施す処理のうち、少なくとも一方の処理をさらに行う
　請求項１に記載の情報処理装置。
　前記処理部は、ネットワークを経由して取得された付加情報に基づいて、前記コンテンツを加工する
　請求項１３に記載の情報処理装置。
　前記付加情報は、天気、及び時間の少なくとも一方に関する情報を含む
　請求項１４に記載の情報処理装置。
　前記現実空間に応じた領域を前記コンテンツに置き換えた映像を表示する表示部をさらに備える
　請求項１に記載の情報処理装置。
　前記処理部は、前記現実空間を３Ｄスキャンしてポリゴンメッシュ構造でモデリングし、ポリゴンメッシュを前記コンテンツに置き換える処理を行い、
　前記表示部は、前記現実空間の３Ｄスキャンを開始した後であって、前記ポリゴンメッシュを前記コンテンツに置き換える前に、前記ポリゴンメッシュに関する映像を表示する
　請求項１６に記載の情報処理装置。
　前記処理部は、ユーザの編集操作に応じて、前記ポリゴンメッシュを加工する
　請求項１７に記載の情報処理装置。
　情報処理装置が、
　現実空間を３Ｄスキャンして得られるスキャン結果に基づいて、前記現実空間に応じた領域を、対応付けたコンテンツに置き換える処理を行い、
　前記現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づいて、前記現実空間に応じた領域に前記コンテンツを対応付ける
　情報処理方法。
　コンピュータを、
　現実空間を３Ｄスキャンして得られるスキャン結果に基づいて、前記現実空間に応じた領域を、対応付けたコンテンツに置き換える処理を行う処理部を備え、
　前記処理部は、前記現実空間における物体、形状、大きさ、色、及び材質の少なくともいずれかに関する情報に基づいて、前記現実空間に応じた領域に前記コンテンツを対応付ける
　情報処理装置として機能させるプログラム。