WO2023047653A1

WO2023047653A1 - 情報処理装置、情報処理方法

Info

Publication number: WO2023047653A1
Application number: PCT/JP2022/011732
Authority: WO
Inventors: 剛松盛; 幸喜辻
Original assignee: ソニーセミコンダクタソリューションズ株式会社
Priority date: 2021-09-27
Filing date: 2022-03-15
Publication date: 2023-03-30
Also published as: CN117980959A; JPWO2023047653A1

Abstract

本技術に係る情報処理装置は、可視光カメラ、測距センサの少なくとも一方によるセンシング情報に基づき生成された、対象空間の三次元構造を示すマップデータの表示処理を行う表示処理部を備え、表示処理部は、可視光カメラと測距センサとを除くセンサである第三センサによるセンシング情報に基づいてマップデータの表示処理を行う。

Description

情報処理装置、情報処理方法

　本技術は、情報処理装置とその方法に関するものであり、特には、可視光カメラ、測距センサの少なくとも一方によるセンシング情報に基づき生成された対象空間の三次元構造を示すマップデータについての表示処理技術に関する。

　例えばＳＬＡＭ（Simultaneous Localization and Mapping）等の技術により、対象空間の三次元構造を示すマップデータを生成するということが行われている。ＳＬＡＭにおいては、例えばＲＧＢカメラ等の可視光カメラと、ＬｉＤＡＲ（Light Detection And Ranging）センサやＴｏＦ（Time Of Flight）センサ等の測距センサの双方又は何れか一方を用いて対象空間をスキャニングしてマップデータが生成される。

　このように対象空間をスキャニングして得られるマップデータは、様々なサービスに活用することが可能である。一例としては、対象空間内に位置するユーザにＡＲ（Augmented Reality：拡張現実）コンテンツを提供するサービスを挙げることができる。この場合、マップデータに基づき対象空間内の所定位置に仮想オブジェクトを提示したり、対象空間内の所定位置にユーザが位置したことをトリガとして所定の仮想オブジェクトを提示したりする等といったことが考えられる。

　なお、関連する従来技術については下記特許文献１を挙げることができる。該特許文献１には、複数種類のセンサを用いて、それらのセンシング情報をフュージョンさせてマップデータを生成する技術が開示されている。

特開２０１８－５５６９５号公報

　ここで、マップデータを用いたサービスを実現する上では、所定の表示装置にマップデータに基づくマップを表示するということが考えられる。例えば、上記のようなＡＲコンテンツの提供サービスにおいては、対象空間におけるＡＲコンテンツの提示位置を設定するためのＧＵＩ（Graphical User Interface）画面として、マップの表示を伴うＧＵＩ画面を表示するということが考えられる。

　しかしながら、現状においてマップ表示は、対象空間内でスキャニングされた物体の形状を示すようにしか行われていない。

　本技術は上記事情に鑑み為されたものであり、対象空間の三次元構造を示すマップついて、情報価値の向上を図ることを目的とする。

　本技術に係る情報処理装置は、可視光カメラ、測距センサの少なくとも一方によるセンシング情報に基づき生成された、対象空間の三次元構造を示すマップデータの表示処理を行う表示処理部を備え、前記表示処理部は、前記可視光カメラと前記測距センサとを除くセンサである第三センサによるセンシング情報に基づいて前記マップデータの表示処理を行うものである。
　可視光カメラとは、可視光を受光可能に構成された撮像素子により撮像を行うカメラを意味する。測距センサとは、対象物体までの距離を検出するセンサを意味する。上記構成により、対象空間の三次元構造を示すマップとして、第三センサによるセンシング情報や該センシング情報から推定される情報を含むマップを表示する等、該センシング情報を反映させたマップ表示を行うことが可能となる。

　また、本技術に係る情報処理方法は、可視光カメラ、測距センサの少なくとも一方によるセンシング情報に基づき生成された、対象空間の三次元構造を示すマップデータの表示処理を行う情報処理装置における情報処理方法であって、前記可視光カメラと前記測距センサとを除くセンサである第三センサによるセンシング情報に基づいて前記マップデータの表示処理を行う情報処理方法である。
　このような情報処理方法によっても、上記した本技術に係る情報処理装置と同様の作用が得られる。

本技術に係る実施形態としてのＡＲサービス提供システムの概略構成を例示したブロック図である。実施形態においてユーザに提供するＡＲサービスの例の説明図である。実施形態におけるマップデータのイメージを示した図である。実施形態としてのコンピュータ装置のハードウエア構成例を示したブロック図である。実施形態としての情報処理装置が有する機能を説明するための機能ブロック図である。実施形態における偏光カメラの撮像画像に基づくマップ生成関連処理の説明図である。実施形態におけるマルチスペクトラムカメラの撮像画像に基づくマップ生成関連処理の説明図である。対象空間内における外光ノイズ領域の例を示した図である。実施形態におけるサーマルカメラの撮像画像に基づくマップデータ生成関連処理の説明図である。実施形態における図である。ＥＶＳのセンシング情報に基づくマップ生成関連処理の説明図である。設定画面の例を示した図である。マルチスペクトラムカメラが選択された場合の設定画面の例を示した図である。偏光カメラの撮像画像に基づく被写体の面区分情報の表示例を示した図である。透明部分を示す情報の表示例を示した図である。マルチスペクトラムカメラの撮像画像から推定される特定の素材部分を示す情報の表示例を示した図である。サーマルカメラのセンシング情報に基づく情報表示の別例を示した図である。

　以下、添付図面を参照し、本技術に係る情報処理装置の実施の形態を次の順序で説明する。
＜１．システムの概要＞
（1-1．システム全体構成）
（1-2．ハードウエア構成＞
＜２．実施形態としての処理＞
（2-1．マップ生成関連処理）
（2-2．表示処理）
＜３．変形例＞
＜４．実施形態のまとめ＞
＜５．本技術＞

＜１．システムの概要＞
（1-1．システム全体構成）
　図１は、本技術に係る実施形態としてのＡＲ（Augmented Reality：拡張現実）サービス提供システム１００の概略構成を例示したブロック図である。
　図示のようにＡＲサービス提供システム１００は、サーバ装置１と、可視光カメラ２と、測距センサ３と、第三センサ４と、フュージョンデータ生成装置５と、１又は複数のユーザ端末６とを備えている。
　ＡＲサービス提供システム１００において、サーバ装置１、フュージョンデータ生成装置５、及びユーザ端末６は、それぞれ、インターネットやＬＡＮ（Local Area Network）等の通信ネットワークであるネットワーク７を介したデータ通信機能を有するコンピュータ装置として構成され、これらサーバ装置１、フュージョンデータ生成装置５、及びユーザ端末６は、ネットワーク７を介して相互にデータ通信を行うことが可能とされている。
　また、フュージョンデータ生成装置５は、可視光カメラ２、測距センサ３、及び第三センサ４のそれぞれと有線又は無線によるデータ通信を行うことが可能に構成され、これら可視光カメラ２、測距センサ３、及び第三センサ４それぞれのセンシング情報を取得可能とされる。

　ユーザ端末６は、ＡＲサービス提供システム１００において提供するＡＲサービスの受け手であるユーザにより使用されることが想定されるコンピュータ装置である。ユーザ端末６としては、可搬性を有するコンピュータ装置として構成され、例えばスマートフォンやタブレット端末、ノートブック型のパーソナルコンピュータ、或いはスマートグラスやヘッドマウントディスプレイ等の装置形態が考えられる。
　本例では、後述するＡＲコンテンツをユーザに提示可能とするため、ユーザ端末６には、画像表示が可能なディスプレイデバイスが設けられる。このディスプレイデバイスの表示画面を以下、「表示画面６ａ」と表記する。
　また、ユーザ端末６には、実空間を撮像した画像である実空間撮像画像を得るための可視光カメラが設けられる。ここで、可視光カメラとは、可視光を受光可能に構成された撮像素子により撮像を行うカメラを意味する。
　また、本例では、ＡＲサービスを受けるにあたり、ユーザ端末６が自己位置推定を行うことが要請される。この自己位置推定を可能とするために、ユーザ端末６には、上記した可視光カメラ以外に、例えばＬｉＤＡＲ（Light Detection And Ranging）センサやＴｏＦ（Time Of Flight）センサ等による測距センサが設けられる場合がある。測距センサは、物体までの距離を検出するセンサである。

　サーバ装置１は、上記ＡＲサービスの提供者により使用されることが想定されるコンピュータ装置である。

　可視光カメラ２は、可視光を受光可能に構成された撮像素子により撮像を行うカメラである。本例において、可視光カメラ２は、Ｒ（赤）光、Ｂ（青）光、Ｇ（緑）光を個別に受光するためのカラーフィルタを有し、これらＲ光、Ｂ光、Ｇ光の受光信号に基づいて撮像画像としてカラー画像を得るＲＧＢカメラとして構成されている。

　測距センサ３は、物体までの距離を検出する。測距センサ３としては、例えばＬｉＤＡＲセンサやＴｏＦセンサ等、物体に対して照射した光の反射光を受光した結果に基づいて測距を行うセンサを用いることができる。本例では、測距センサ３としてＴｏＦセンサが用いられる。ここで言うＴｏＦセンサは、物体からの反射光を受光する受光部として、受光素子を有する画素が複数配列された画素アレイ部を有する受光部を有し、該受光部が画素ごとに検出した受光信号に基づき、距離画像データを得ることが可能に構成されたものであるとする。
　ここで、距離画像とは、画素ごとに距離を示す情報が対応づけられた情報を意味する。

　第三センサ４は、可視光カメラ２及び測距センサ３以外のセンサを表すものである。
　フュージョンデータ生成装置５は、可視光カメラ２、測距センサ３、及び第三センサ４としての複数のセンサによるセンシング情報をフュージョンしたフュージョンデータを生成する装置である。
　なお、第三センサ４、及びフュージョンデータ生成装置５の詳細は後述する。

　ここで、ユーザに提供するＡＲサービスの例を図２を参照して説明しておく。
　先ず、本例におけるＡＲコンテンツは、ユーザ端末６が上述した実空間撮像画像を表示画面６ａ上に表示している状態で、該実空間撮像画像上に仮想オブジェクトＶｏを重畳表示することで実現されるコンテンツとなる（図２Ａ、図２Ｂ参照）。
　ＡＲサービスは、このようなＡＲコンテンツをユーザに提示するサービスとされる。

　ユーザにＡＲを体験させる対象空間の例としては、例えば、ショッピングモールや遊園地等の商業施設や公園等の公共施設といった各種の施設、街中等といった人工構築物が配置された空間を挙げることができる。或いは、例えば洞窟等といった天然の構築物が配置された空間を対象空間とすることも考えられる。

　仮想オブジェクトＶｏとしては、例えば商業施設における店舗の広告情報（例えば、図２Ｂ中に例示するような「３０％ＯＦＦ」等の割引き情報等）を示すオブジェクトや、所定の目的地に案内（ナビゲーション）するためのナビゲーション情報（例えば、図２Ｂ中に例示する矢印マーク等）を示すオブジェクトを提示すること等が考えられる。

　ＡＲサービス提供システム１００では、ＡＲサービスの提供にあたり、例えば上記のようなショッピングモール等の対象空間をスキャニングして、該対象空間の三次元構造を示すマップデータの生成が行われる。
　本例では、該マップデータの生成は、少なくとも可視光カメラ２、測距センサ３の少なくとも何れか一方のセンシング情報に基づいてサーバ装置１が行う。具体的に、この場合のマップデータ生成は、可視光カメラ２により得られる可視光画像データと、測距センサ３（本例ではＴｏＦセンサ）により得られる距離画像データとを生成元データとし、これら可視光画像データと距離画像データとをフュージョンして得られるＲＧＢＤ画像データ（Ｄ：Depth）に基づきサーバ装置１が行う。

　図３に、マップデータのイメージを示す。
　マップデータの生成にあたっては、例えば自走可能なロボット（車両の態様も含む）やドローン等の移動体を用意する。この移動体に、対象空間スキャニングのための可視光カメラ２及び測距センサ３を搭載しておく。このように可視光カメラ２及び測距センサ３が搭載された移動体を対象空間内で移動させながら、対象空間のスキャニングを行うことで、図３に例示するような、対象空間の三次元構造を示すマップデータを生成する。
　マップデータは、例えば三次元座標空間上においてスキャニングされた物体の位置や形状、姿勢を示す３Ｄモデルデータとして生成される。
　マップデータの具体的な生成手法については特に限定されない。一例として、マップデータは、例えばＳＬＡＭ（Simultaneous Localization and Mapping）の技術により生成することが考えられる。
　なお、マップデータ生成に用いる移動体としては、必ずしも自走可能なものに限定されず、例えば人力で移動させる手法も採り得る。

　このようにサーバ装置１が生成したマップデータは、ＡＲサービスにおける各種処理に用いられる。具体的に、本例においてマップデータは、サービス提供者が対象空間内における仮想オブジェクトＶｏの配置位置の設定を行うための設定画面Ｇｓの表示に用いられる。この設定画面Ｇｓには、マップデータに基づく対象空間のマップが表示され、このような設定画面Ｇｓによりサービス提供者は、マップ上で仮想オブジェクトＶｏの配置位置を容易に設定することが可能とされる。
　例えば、図２Ｂで例示したような広告情報としての仮想オブジェクトＶｏについては、対象とする店舗の壁等の所定位置に提示することが考えられ、また、矢印マーク等のナビゲーション情報であれば、ユーザが対象空間内の所定の位置に位置した場合に対応する仮想オブジェクトＶｏが対象空間内の所定位置に提示されるように仮想オブジェクトＶｏの提示位置を設定することが考えられる。このようにＡＲコンテンツを生成する上では、サービス提供者が、対象空間内における仮想オブジェクトＶｏの提示位置の設定作業を行うことが想定されるものである。
　ここで、本例では、設定画面Ｇｓの表示に関して、サーバ装置１が実施形態としての各種表示処理を行うが、該表示処理の詳細は後に改めて説明する。

　また、サーバ装置１が生成したマップデータは、本例では、ユーザ端末６が対象空間内で行う自己位置推定にも用いられる。この自己位置推定を行うことで、ユーザ端末６は、対象空間内の正しい位置に仮想オブジェクトＶｏを提示することが可能とされる。
　本例では、ユーザ端末６には、ＡＲサービスを受けるためのアプリ（アプリケーションプログラム）がインストールされると共に、サーバ装置１が生成したマップデータが記憶される。ユーザ端末６は、このように記憶されたマップデータを参照して、ＳＬＡＭによる自己位置推定を行う。

　ここで、図１において、フュージョンデータ生成装置５は、上述した移動体を用いて対象空間をスキャニングする現場において配置されることが想定された装置とされる。
　また、ユーザ端末６は、上記のようなスキャニングが行われる期間とは異なる期間において対象空間内に配置されることが想定される。
　サーバ装置１は、例えばクラウドサーバ等として、対象空間に対する遠隔地に配置されることが想定されている。

（1-2．ハードウエア構成）
　図１に示したサーバ装置１、フュージョンデータ生成装置５、及びユーザ端末６としての各コンピュータ装置（情報処理装置）は、図４に示すようなハードウエア構成を有するコンピュータ装置１０により実現することができる。
　図示のようにコンピュータ装置１０は、ＣＰＵ１１を備えている。ＣＰＵ１１は、ＲＯＭ１２や例えばＥＥＰ－ＲＯＭ（Electrically Erasable Programmable Read-Only Memory）などの不揮発性メモリ部１４に記憶されているプログラム、又は記憶部１９からＲＡＭ１３にロードされたプログラムに従って各種の処理を実行する。ＲＡＭ１３にはまた、ＣＰＵ１１が各種の処理を実行する上において必要なデータなども適宜記憶される。

　ＣＰＵ１１、ＲＯＭ１２、ＲＡＭ１３、及び不揮発性メモリ部１４は、バス２３を介して相互に接続されている。このバス２３にはまた、入出力インタフェース（Ｉ／Ｆ）１５も接続されている。

　入出力インタフェース１５には、操作子や操作デバイスよりなる入力部１６が接続される。例えば、入力部１６としては、キーボード、マウス、キー、ダイヤル、タッチパネル、タッチパッド、リモートコントローラ等の各種の操作子や操作デバイスが想定される。
　入力部１６によりユーザの操作が検知され、入力された操作に応じた信号はＣＰＵ１１によって解釈される。

　また入出力インタフェース１５には、ＬＣＤ（Liquid Crystal Display）或いは有機ＥＬ（Electro-Luminescence）パネルなどよりなる表示部１７や、スピーカなどよりなる音声出力部１８が一体又は別体として接続される。
　表示部１７は各種の情報表示に用いられ、例えばコンピュータ装置１０の筐体に設けられるディスプレイデバイスや、コンピュータ装置に接続される別体のディスプレイデバイス等により構成される。

　表示部１７は、ＣＰＵ１１の指示に基づいて表示画面上に各種の画像処理のための画像や処理対象の動画等の表示を実行する。また表示部１７はＣＰＵ１１の指示に基づいて、各種操作メニュー、アイコン、メッセージ等、即ちＧＵＩ（Graphical User Interface）としての表示を行う。

　入出力インタフェース１５には、ＨＤＤ（Hard Disk Drive）や固体メモリなどより構成される記憶部１９や、モデムなどより構成される通信部２０が接続される場合もある。

　通信部２０は、インターネット等の伝送路を介しての通信処理や、各種機器との有線／無線通信、バス通信などによる通信を行う。

　入出力インタフェース１５にはまた、必要に応じてドライブ２１が接続され、磁気ディスク、光ディスク、光磁気ディスク、或いは半導体メモリなどのリムーバブル記録媒体２２が適宜装着される。

　ドライブ２１により、リムーバブル記録媒体２２から各処理に用いられるプログラム等のデータファイルなどを読み出すことができる。読み出されたデータファイルは記憶部１９に記憶されたり、データファイルに含まれる画像や音声が表示部１７や音声出力部１８で出力されたりする。またリムーバブル記録媒体２２から読み出されたコンピュータプログラム等は必要に応じて記憶部１９にインストールされる。

　上記のようなハードウエア構成を有するコンピュータ装置１０では、例えば本実施形態の処理のためのソフトウエアを、通信部２０によるネットワーク通信やリムーバブル記録媒体２２を介してインストールすることができる。或いは、当該ソフトウエアは予めＲＯＭ１２や記憶部１９等に記憶されていてもよい。

　ＣＰＵ１１が各種のプログラムに基づいて処理動作を行うことで、前述したサーバ装置１やフュージョンデータ生成装置５、ユーザ端末６としての必要な情報処理や通信処理が実行される。
　なお、コンピュータ装置１０は、図４のような構成によるコンピュータ装置が単一で構成されることに限らず、複数のコンピュータ装置がシステム化されて構成されてもよい。複数のコンピュータ装置は、ＬＡＮ（Local Area Network）等によりシステム化されていてもよいし、インターネット等を利用したＶＰＮ（Virtual Private Network）等により遠隔地に配置されたものでもよい。複数のコンピュータ装置には、クラウドコンピューティングサービスによって利用可能なサーバ群（クラウド）としてのコンピュータ装置が含まれてもよい。

　なお、ユーザ端末６への適用の場合、コンピュータ装置１０には、前述した自己位置推定に用いる各種のセンサ（例えば、可視光カメラや距離センサ、ＩＭＵ（Inertial Measurement Unit）センサ等）が設けられる。

＜２．実施形態としての処理＞
　図５は、サーバ装置１が有する実施形態としての機能を説明するための機能ブロック図である。これら実施形態としての機能は、本例では、サーバ装置１のＣＰＵ１１によるソフトウエア処理により実現される。
　図示のようにサーバ装置１は、マップ生成部Ｆ１、表示処理部Ｆ２、及びＡＲサービス処理部Ｆ３としての機能を有する。

　マップ生成部Ｆ１は、可視光カメラ２、測距センサ３の少なくとも一方によるセンシング情報と、第三センサ４によるセンシング情報とに基づいてマップデータの生成を行う。前述のように、本例においてマップデータの生成は、可視光カメラ２により得られる可視光画像データと測距センサ３（ＴｏＦセンサ）により得られる距離画像データとを生成元データとし、これら可視光画像データと距離画像データとをフュージョンして得られるＲＧＢＤ画像データに基づきサーバ装置１が行う。つまり、この場合のマップ生成部Ｆ１は、可視光カメラ２、測距センサ３の双方によるセンシング情報と第三センサ４によるセンシング情報とに基づいてマップデータの生成を行う。
　第三センサ４は、可視光カメラ２及び測距センサ３と同様に、前述した移動体に搭載される。これにより、マップデータ生成のための対象空間のスキャニング時において、可視光カメラ２、測距センサ３、及び第三センサ４が連動して移動するようにされる。

　ここで、第三センサ４としては、少なくとも、可視光カメラ２と測距センサ３とを除くセンサを用いればよいが、特に本実施形態では、第三センサ４として、偏光カメラ、マルチスペクトラムカメラ、サーマルカメラ、ＥＶＳ（イベントベースドビジョンセンサ：Event Based Vision Sensor）を用いる例を説明する（図１参照）。

　ここで、偏光カメラとは、被写体からの反射光についての偏光情報を画素ごとに示す偏光画像を取得可能に構成されたカメラを意味する。
　また、マルチスペクトラムカメラとは、複数の波長帯の撮像ができるカメラを総称したものであり、一般にマルチスペクトラムカメラと言われるもののほか、ハイパースペクトラムカメラ（Hyper Spectrum Camera）と呼ばれるものなども含む。
　サーマルカメラとは、被写体の温度を画素ごとに示すサーマル画像を取得可能に構成されたカメラを意味する。
　ＥＶＳとは、受光素子を有する画素が複数配列された画素アレイ部を有するセンサであって、受光量の所定量以上の変化をイベントとして検出するセンサを意味する。ＥＶＳは、ＤＶＳ（Dynamic Vision Sensor）と呼ばれることもある。

　なお、偏光カメラについては下記参考文献１等を参照されたい。また、マルチスペクトラムカメラについては下記参考文献２等を、サーマルカメラについては下記参考文献３等を、ＥＶＳについては下記参考文献４等を参照されたい。
　・参考文献１：特開２０１９－６７３２３号公報
　・参考文献２：特開２０２１－１２４３３号公報
　・参考文献３：特表２００４－５０６３５４号公報
　・参考文献４：特開２０２１－１０３８４２号公報

　ここで、マルチスペクトラムカメラは、複数の波長帯それぞれについての撮像画像を得るものであり、これは、被写体光（被写体からの反射光）に含まれる各波長帯の光についての受光量の情報を得ているものと換言できる。この点から、マルチスペクトラムカメラの撮像画像は、被写体光の波長解析情報であると言うことができる。

　ここで、図１に示したフュージョンデータ生成装置５は、上記のような可視光カメラ２、測距センサ３、及び第三センサ４のセンシング情報に基づくマップデータ生成を可能とするべく、これら可視光カメラ２、測距センサ３、及び第三センサ４のセンシング情報をフュージョンしたフュージョンデータを生成する。ここで言うフュージョンデータとは、少なくとも、可視光カメラ２、測距センサ３、第三センサ４それぞれのセンサによるセンシング情報を含み、且つこれら異なるセンサによるセンシング情報の時刻的な同期がとられた状態のデータを意味する。

　偏光カメラとしての第三センサ４によるセンシング情報は、偏光画像としての情報である。また、マルチスペクトラムカメラによるセンシング情報は、複数の波長帯それぞれについての撮像画像の情報、換言すれば、被写体光の波長解析情報である。
　また、サーマルカメラとしての第三センサ４によるセンシング情報は、サーマル画像であり、ＥＶＳとしての第三センサ４によるセンシング情報はイベントの検出位置を示すイベント検出画像である。

　なお、本例のようにサーバ装置１におけるマップデータ生成をＳＬＡＭの技術により行う場合には、第三センサ４の一つとして、ＩＭＵセンサを設ける。このＩＭＵセンサにより得られる、移動体の位置や姿勢（相対的な位置や姿勢）を示す情報を、可視光カメラ２により得られる可視光画像データや測距センサ３により得られる距離画像データとフュージョンしたデータをフュージョンデータ生成装置５からサーバ装置１に転送する。サーバ装置１は、このようにフュージョンデータ生成装置５経由で転送された移動体の位置や姿勢を示す情報に基づき、ＳＬＡＭの技術によるマップデータ（環境地図）の生成を行うことが可能となる。

　サーバ装置１におけるマップ生成部Ｆ１は、上記のような第三センサ４によるセンシング情報を含むフュージョンデータに基づき、マップデータの生成処理を行う。このような第三センサ４によるセンシング情報を用いたマップデータの生成処理例については後述する。

　表示処理部Ｆ２は、可視光カメラ２、測距センサ３の少なくとも一方によるセンシング情報に基づき生成された、対象空間の三次元構造を示すマップデータの表示処理を行う。
具体的に、この場合のマップデータの表示処理は、前述した設定画面Ｇｓの表示処理として行われる。ここで、設定画面Ｇｓの表示は、サーバ装置１における表示部１７（図４参照）上で行われる。
　本実施形態において、表示処理部Ｆ２は、第三センサ４によるセンシング情報に基づいてマップデータの表示処理を行うが、該表示処理の詳細は改めて説明する。

　ＡＲサービス処理部Ｆ３は、ＡＲサービスに係る各種の処理を行う。例えば、ＡＲサービスの提供を受けるユーザのアカウント情報の登録処理や、ユーザ端末６からの要求に応じた各種情報の配信処理（例えば、前述したアプリやマップデータ等の配信）等を行う。

（2-1．マップ生成関連処理）
　以下、マップ生成部Ｆ１がマップデータの生成において第三センサ４のセンシング情報に基づき行う処理（マップ生成関連処理）について説明する。
　ここでは、第三センサ４が偏光カメラである場合、マルチスペクトラムカメラである場合、サーマルカメラである場合、ＥＶＳである場合の各場合について、それぞれ対応するマップ生成関連処理を説明する。

　図６は、偏光カメラの撮像画像に基づくマップ生成関連処理の説明図である。
　この場合のマップ生成関連処理は、偏光カメラにより得られる被写体光の偏光情報に基づくマップデータの生成処理と換言できるものである。
　この場合、マップ生成部Ｆ１は、偏光情報に基づく処理として、ノイズ低減処理、面区分特定処理、透明物体の特定処理を行う。

　ここで言うノイズ低減処理は、測距センサ３により得られた距離画像に生じるノイズ、具体的には、被写体からの反射光のマルチパス起因ノイズの低減処理である。測距センサ３は、測距対象物に対し測距用の光を照射し、その反射光を受光した結果に基づいて測距を行う。具体的には、測距用の光を発してから反射光が受光されるまでの時間に基づいて測距を行う。このとき、測距対象物の形状によっては、反射光が複数回反射する部分、換言すれば、反射光のマルチパスが生じる部分が発生する。反射光のマルチパスが生じた部分は、測距情報を正しく得ることができなくなるため、測距におけるノイズ部分となる。
　反射光のマルチパスは、例えば床面と壁面の境界部分等、面の境界部分において生じ易い。このため、マルチパス起因ノイズの低減処理として、偏光カメラによる偏光情報から推定される、被写体の法線方向情報に基づいたノイズ低減処理を行う。ここで、被写体の法線方向情報とは、被写体を構成する面の法線方向（面が向く方向）を示す情報を意味する。
　なお、偏光情報から被写体の法線方向を推定する手法については、例えば前述した参考文献１を参照されたい。

　被写体の法線方向情報が特定できれば、距離画像データにおいて、上記のような床面と壁面との境界部等、マルチパス起因のノイズが生じている領域を推定できる。マップ生成部Ｆ１は、このように推定したノイズ領域の距離の値を、周囲の非ノイズ領域の距離の値から線形補間等で求めた距離の値に補正する。これにより、マルチパス起因ノイズの低減を行うことが可能とされる。

　或いは、マルチパス起因ノイズの低減処理は、被写体の法線方向情報から推定される、被写体の面区分情報に基づき行うこともできる。被写体の面区分情報とは、例えば床面、壁面の区分等、被写体の面の区分を示す情報を意味する。
　このような面区分情報から、床面と壁面との境界部等、マルチパス起因のノイズが生じている領域を推定できる。マップ生成部Ｆ１は、このように推定したノイズ領域の距離の値を、周囲の非ノイズ領域の距離の値から線形補間等で求めた距離の値に補正する。

　図６に示す面区分特定処理は、上記した被写体の面区分情報に基づいて、マップデータについてのトポロジー処理（図形同士の空間的な位置関係を管理する処理）を行うことを意味している。
　被写体の面区分情報を用いずにトポロジー処理を行う場合よりも、検出図形同士の位置関係を正確に管理することが可能となる。
　従って、マップデータの正確性向上を図ることができる。

　透明物体の特定処理は、偏光情報に基づいて被写体における透明物体領域を推定（特定）する処理となる。
　偏光情報に基づく透明物体領域の推定手法については多様に考えられる。一例としては、可視光画像と偏光画像との比較結果に基づき透明物体領域を推定する手法が挙げられる。具体的には、例えば、可視光画像においては物体が存在しないが偏光画像においては偏光情報が検出されている領域を透明物体領域として推定する手法等を挙げることができる。或いは、透明物体領域の推定は、偏光画像を学習用データとして用いて学習させたＡＩ（人工知能）を用いて行うことも考えられる。

　マップ生成部Ｆ１は、このように偏光情報に基づき推定される透明物体領域の情報に基づいてマップデータの生成を行う。具体的には、透明物体領域に透明物体としての物体が存在していることを表すマップデータの生成を行う。
　これにより、可視光画像データによっては検出し難いガラス等の透明物体領域の情報をマップデータに反映させることが可能となり、マップデータの正確性向上を図ることができる。

　図７は、マルチスペクトラムカメラの撮像画像に基づくマップ生成関連処理の説明図である。
　この場合のマップ生成関連処理は、マルチスペクトラムカメラにより得られる被写体光の波長解析情報に基づくマップデータの生成処理と換言できるものである。
　この場合、マップ生成部Ｆ１は、被写体光の波長解析情報に基づく処理として、特定物体の排除処理、及び外光キャンセル処理を行う。

　特定物体の排除処理は、波長解析情報に基づき推定される被写体の素材情報に基づく処理であり、具体的には、該素材情報から推定される特定被写体部分、具体的に本例では植物部分をマップから排除する処理である。
　ここで、マルチスペクトラムカメラにより得られる被写体光の波長解析情報によれば、被写体の素材を推定することが可能である。これは、素材ごとに、反射光の有する波長特性が異なり得ることに起因する。例えば、予めターゲットとする素材を定めておき、該ターゲットとしての素材が有する反射光の波長特性と一致又は類似する波長特性を有する部分を、特定被写体部分として推定する。ターゲットとする素材が複数ある場合には、素材ごとに上記のような波長特性の一致又は類似性に基づく処理を行って、それぞれの素材の被写体部分を推定する。

　ここで、前述のようにマップ生成部Ｆ１が生成したマップデータは、ユーザ端末６における自己位置推定において参照されるが、例えば植木等の植物部分は、経時的に形状や色が変化するため、植物部分がマップデータに含まれていると、ユーザ端末６がＳＬＡＭにおいて生成するマップデータとの乖離が生じ、ユーザ端末６における自己位置推定の精度が低下してしまう虞がある。
　上記のように植物部分をマップから排除する処理を行うことで、このようなユーザ端末６における自己位置推定の精度低下の抑制を図ることができる。

　なお、マップからの排除対象とする部分は、植物部分に限定されるものではない。具体的には、マップデータに基づく自己位置推定においてノイズとなり得る部分を素材情報に基づき推定し、該部分をマップから排除するものとすればよい。

　ここで、被写体光の波長解析情報に基づくマップデータの生成処理としては、上記のような特定物体の排除処理に限定されない。例えば、図示による説明は省略するが、マップ生成部Ｆ１は、被写体光の波長解析情報に基づくマップデータの生成処理として、該波長解析情報から推定される被写体の素材情報を付随情報として付加したマップデータを生成する処理を行うこともできる。
　これにより、対象空間をより正確に表すマップデータの生成を行うことができ、マップデータの正確性向上を図ることができる。

　外光キャンセル処理は、波長解析情報に基づき推定される外光ノイズ領域についての画像補正を行う処理である。
　外光ノイズ領域とは、例えば太陽光等に基づく外光が所定強度以上の強度で照射されている領域を意味する。
　図８は、対象空間内における外光ノイズ領域の例を示した図である。
　図中、「Ｘ」「Ｙ」でそれぞれ示す部分は、施設内の建物に設けられた窓ガラス等の透明部分を表している。この場合、外光が夕方における西日等、照射角度が浅い光とされると、建物内の廊下部分や壁部分には、図中の斜線部で示すように外光が強く当たる部分が生じる。外光が強く当たった部分は、その周囲部分と比較して明るさや色の違いが生じ、このため、該部分について、本来の色や明るさが正しく反映されていないマップデータが生成されてしまうことになる。これに起因して、ユーザ端末６が該マップデータを参照して行う自己位置推定の精度が低下してしまう虞がある。

　そこで、この場合のマップ生成部Ｆ１は、外光キャンセル処理として、マルチスペクトラムカメラによる波長解析情報に基づき外光ノイズ領域を推定し、外光ノイズ領域の本来の明るさや色が再現されるように、外光ノイズ領域の画像補正処理を施す。例えば、マップデータの生成元データとして用いる可視光画像データについて、外光ノイズ領域の明るさや色を、外光ノイズ領域周囲の領域の明るさや色に近づける補正（同色にする補正も含む）を行う。
　これにより、サーバ装置１側で生成するマップデータについて、ユーザ端末６がＳＬＡＭにおいて生成するマップデータとの乖離が生じ難くなるようにすることができ、ユーザ端末６における自己位置推定精度の低下抑制を図ることができる。

　図９は、サーマルカメラの撮像画像に基づくマップデータ生成関連処理の説明図である。
　この場合のマップ生成関連処理は、サーマルカメラにより得られる被写体の温度情報に基づくマップデータの生成処理と換言できる。
　この場合、マップ生成部Ｆ１は、セグメンテーション処理、特定物体の排除処理を行う。

　セグメンテーション処理は、対象空間内における物体ごとの領域区分を行う処理である。ここで、サーマルカメラにより得られる被写体の温度情報によっては、物体のセグメンテーション（物体ごとの領域区分）を行うことが可能である。これは、物体ごとに温度が異なり得ることによる。
　マップ生成部Ｆ１は、サーマルカメラにより得られる被写体の温度情報に基づき、セグメンテーション処理として、物体ごとの領域区分を推定する処理を行い、推定した物体ごとの領域区分を示す情報を付随情報として付加したマップデータを生成する処理を行う。
　これにより、対象空間をより正確に表すマップデータの生成を行うことができ、マップデータの正確性向上を図ることができる。

　特定物体の排除処理は、特定の温度特性を有する特定被写体部分をマップから排除する処理である。具体的に本例では、サーマルカメラによる被写体の温度情報から、マップデータに基づく自己位置推定においてノイズとなり得る部分、具体的には、人物部分を推定し、該人物部分をマップから排除する処理を行う。
　これにより、自己位置推定に用いる上でのマップデータの正確性向上を図ることができる。

　図１０は、ＥＶＳのセンシング情報に基づくマップ生成関連処理の説明図である。
　前述のようにＥＶＳは受光量の所定量以上の変化をイベントとして検出するセンサとされるため、被写体の動きを検出するセンサであると換言できる。

　この場合のマップ生成部Ｆ１は、ＥＶＳのセンシング情報に基づく処理として、動物体の排除処理を行う。具体的には、ＥＶＳのセンシング情報に基づき、例えば人物や動物、車両等の動物体を検出し、該動物体をマップから排除する処理を行う。
　人物や動物、車両等の動物体としても、マップデータに基づく自己位置推定においてノイズとなり得る部分となる。従って、上記のように動物体をマップから排除する処理を行うことで、マップデータの正確性向上を図ることができる。

　ここで、上記で例示した偏光カメラ、マルチスペクトラムカメラ、サーマルカメラ、ＥＶＳ等の第三センサ４について、それらセンサのセンシング情報から推定される情報、例えば、偏光カメラに係る法線方向情報、面区分情報、マルチスペクトラムカメラに係る素材情報等の情報を総称して「メタ情報」と表記する。
　上記説明では、メタ情報の生成をサーバ装置１が行う例としたが、メタ情報の生成はフュージョンデータ生成装置５側で行うことも可能である。この場合、フュージョンデータとして、メタ情報が付加されたデータがサーバ装置１に転送され、サーバ装置１は該メタ情報に基づいて、上記で説明したメタ情報に基づく各種の処理を行う。

　また、上記では、偏光カメラ、マルチスペクトラムカメラ、サーマルカメラ、ＥＶＳそれぞれのセンシング情報に基づくマップデータ生成処理を個別に説明したが、それぞれのセンシング情報に基づくマップデータ生成処理の全てを組み合わせて、又は一部を組み合わせて行うことも可能である。

（2-2．表示処理）
　続いて、図５に示した表示処理部Ｆ２の処理について説明する。
　前述のように表示処理部Ｆ２は、第三センサによるセンシング情報に基づいて、マップデータの表示処理を行うものである。
　ここで、この場合において表示対象とされるマップデータは、上記で例示した第三センサ４のセンシング情報に基づく生成処理により生成されたものであることに限定されない。

　表示処理部Ｆ２は、対象空間の三次元構造を示すマップとして、第三センサ４によるセンシング情報を含むマップを表示部１７に表示させる処理を行う。
　図１１から図１３を参照し、センシング情報の表示例を説明する。

　図１１は、設定画面Ｇｓの例を示している。
　図示のように設定画面Ｇｓには、第三センサ４として設けられた偏光カメラ、マルチスペクトラムカメラ、サーマルカメラ、ＥＶＳのうち何れのセンシング情報を表示するかの選択を行うための操作受付部Ｐｓとしての画像が、マップデータに基づくマップと共に表示されている。図示のように操作受付部Ｐｓには、偏光カメラ、マルチスペクトラムカメラ、サーマルカメラ、ＥＶＳを個別に選択するためのチェックボックスが配置されている。
　本例における表示処理部Ｆ２は、このチェックボックスに対する操作が行われたセンサのセンシング情報が、設定画面Ｇｓにおけるマップ上に表示されるように表示部１７についての表示処理を行う。

　図１２は、偏光カメラが選択された場合の設定画面Ｇｓの例を示している。この場合、設定画面Ｇｓのマップ上には、偏光カメラにより得られる偏光情報を表示する。このとき、偏光情報の表示は、図中で例示するように、偏光情報が示す偏光角度の違いを表示態様の違い（例えば偏光角度ごとに図柄を異ならせる、或いは、色を異ならせる等）により表現するようにして行う。

　図１３は、マルチスペクトラムカメラが選択された場合の設定画面Ｇｓの例を示している。
　マルチスペクトラムカメラによるセンシング情報については、例えば、波長帯ごとの受光量を示す情報をマップ上に表示することが考えられる。図１３では、その場合に対応した操作受付部Ｐｓの例を示しているが、この場合の操作受付部Ｐｓには、マルチスペクトラムカメラが選択されたことに応じて、選択可能な各波長帯ごとのチェックボックスが表示される。この場合、表示処理部Ｆ２は、これらチェックボックスのうちから選択されたチェックボックスに対応する波長帯の受光量を示す情報を設定画面Ｇｓにおけるマップ上に表示させる。

　なお、図示は省略したが、サーマルカメラ、ＥＶＳのセンシング情報についても、同様の要領でマップ上に表示されるようにすればよい。例えば、サーマルカメラによるセンシング情報の表示としては、温度分布を示す情報をマップ上に表示することが考えられる。また、ＥＶＳのセンシング情報の表示としては、イベントの検出結果を示す情報をマップ上に表示することが考えられる。

　上記のような第三センサ４のセンシング情報に基づくマップデータの表示処理を行うことで、対象空間の三次元構造を示すマップとして、可視光カメラ２や測距センサ３のセンシング情報から特定される物体の形状を示す情報のみでなく、物体の形状以外の属性情報を表示することが可能となる。
　従って、マップの情報価値向上を図ることができる。

　また、表示処理部Ｆ２は、第三センサ４によるセンシング情報から推定される情報を含むマップを表示部１７に表示させる処理を行う。
　センシング情報から推定される情報としては、例えば偏光カメラであれば、偏光カメラの撮像画像から推定される被写体の面区分情報を表示させることが考えられる。
　また、マルチスペクトラムカメラであれば、マルチスペクトラムカメラの撮像画像から推定される特定被写体の存在領域を示す情報（特定の素材による物体の存在領域を示す情報）を表示させることが考えられる。
　また、サーマルカメラであれば、サーマルカメラの撮像画像から推定される特定被写体の存在領域を示す情報を表示させることが考えられる。

　図１４は、偏光カメラの撮像画像に基づく被写体の面区分情報の表示例を示している。
　この場合、操作受付部Ｐｓには、偏光情報から推定可能な床面、壁面、透明部分（図中、透明部）を選択するためのチェックボックスが表示される。
　この場合の表示処理部Ｆ２は、これらチェックボックスから床面、壁面のチェックボックスが選択された場合には、選択されたチェックボックスに対応する面を示す情報（図中の例では斜線部）を設定画面Ｇｓのマップ上に表示させる処理を行う。

　また、表示処理部Ｆ２は、透明部分のチェックボックスが選択された場合には、図１５に例示するように、偏光情報に基づき推定された透明部分を示す情報を設定画面Ｇｓのマップ上に表示させる処理を行う。

　図１６は、マルチスペクトラムカメラの撮像画像から推定される特定の素材部分を示す情報の表示例を示している。
　この場合の操作受付部Ｐｓには、素材を選択するためのチェックボックスが選択可能な素材ごとに表示される。表示処理部Ｆ２は、これらチェックボックスうち選択されたチェックボックスに対応する素材部分を示す情報（図中の例では斜線部）を設定画面Ｇｓのマップ上に表示させる処理を行う。

　なお、図示は省略したが、サーマルカメラの撮像画像から推定される特定被写体の存在領域を示す情報についても、図１６と同様の要領で、選択された特定被写体について、その特定被写体の存在領域を示す情報が表示されるようにすればよい。

　なお、サーマルカメラのセンシング情報に基づく情報表示としては、例えば図１７の例のように、高温部と低温部等、温度帯の選択を可能としておき、選択された温度帯となっている領域を示す情報をマップ上に表示させるといったことも考えられる。

　ここで、上記で説明した設定画面Ｇｓの構成はあくまでも一例であり、これに限定されない。例えば、表示すべき情報の選択は、チェックボックスに対する操作ではなく、例えばボタンの操作等の他の操作で実現されるようにすることも可能である。

　また、上記では、センシング情報の表示と、センシング情報から推定される情報の表示とを個別に行うものとして説明したが、センシング情報とセンシング情報から推定される情報の双方をマップ上に表示させることも可能である。
　このとき、例えば図１３に例示したようなマルチスペクトラムカメラのセンシング情報と、図１４に例示したような偏光カメラのセンシング情報に基づく面区分情報の双方をマップ上に表示させる等、異なるセンサによるセンシング情報、及びセンシング情報から推定される情報をマップ上に表示させることもできる。

　また、第三センサ４のセンシング情報に基づくマップデータの表示処理において、マップ上に表示させる情報としては、上記で例示した情報に限定されない。例えば、偏光カメラについて、被写体の法線方向情報を表示することが考えられる。また、マルチスペクトラムカメラについて、外光ノイズ領域を示す情報を表示することも考えられる。

＜３．変形例＞
　なお、実施形態としては上記した具体例に限定されるものでなく、多様な変形例としての構成を採り得る。
　例えば上記では、マップデータの生成をサーバ装置１が行う例としたが、マップデータの生成はフュージョンデータ生成装置５等のローカル側の装置により行う構成とすることもできる。この場合、サーバ装置１は、ローカル側で生成されたマップデータに基づいて、第三センサ４のセンシング情報に基づくマップデータの表示処理を行う。

　また、上記では、本技術に係るマップデータの表示処理や生成処理を、ＡＲサービスの提供に係るマップデータについての処理に適用する例としたが、本技術に係るマップデータの表示処理や生成処理は、例えば工事現場等のマップデータや、実世界と同じマップを使用するゲームの作成用のマップデータ等、多種多様なマップデータについての処理として適用することが可能である。
　また、本技術に係るマップデータの表示処理や生成処理は、ＡＲサービスの提供に係るマップデータのみでなく、ＶＲ（Virtual Reality）サービスの提供に係るマップデータについても好適に適用することができる。

＜４．実施形態のまとめ＞
　以上で説明したように実施形態としての情報処理装置（サーバ装置１）は、可視光カメラ（同２）、測距センサ（同３）の少なくとも一方によるセンシング情報に基づき生成された、対象空間の三次元構造を示すマップデータの表示処理を行う表示処理部（同Ｆ２）を備え、表示処理部は、可視光カメラと測距センサとを除くセンサである第三センサ（同４）によるセンシング情報に基づいてマップデータの表示処理を行うものである。
　上記構成により、対象空間の三次元構造を示すマップとして、第三センサによるセンシング情報や該センシング情報から推定される情報を含むマップを表示する等、該センシング情報を反映させたマップ表示を行うことが可能となる。
　従って、対象空間の三次元構造を示すマップとして物体の形状のみでなく素材や種別等といった物体の形状以外の属性情報を表示することが可能となり、マップの情報価値向上を図ることができる。

　また、実施形態としての情報処理装置においては、表示処理部は、対象空間の三次元構造を示すマップとして、第三センサによるセンシング情報を含むマップを表示部（同１７）に表示させる処理を行っている。
　これにより、例えば第三センサが偏光カメラである場合に得られる被写体光の偏光情報や、第三センサがマルチスペクトラムカメラである場合に得られる被写体光（被写体からの反射光）の波長解析情報、或いは第三センサがサーマルカメラである場合に得られる被写体の温度情報等、第三センサによるセンシング情報を反映させたマップ表示を行うことが可能となる。
　従って、マップの情報価値向上を図ることができる。

　さらに、実施形態としての情報処理装置においては、表示処理部は、対象空間の三次元構造を示すマップとして、第三センサによるセンシング情報から推定される情報を含むマップを表示部に表示させる処理を行っている。
　これにより、例えば第三センサが偏光カメラである場合に得られる被写体光の偏光情報から推定される被写体の面区分情報を含むマップを表示する等、第三センサによるセンシング情報そのものではなく、該センシング情報から推定される情報を含むマップ表示を行うことが可能となる。
　従って、物体の属性情報としてより具体的な情報を表示することが可能となり、マップの情報価値のさらなる向上を図ることができる。

　さらにまた、実施形態としての情報処理装置においては、第三センサには偏光カメラが含まれ、表示処理部は、対象空間の三次元構造を示すマップとして、偏光カメラの撮像画像から推定される被写体の面区分情報を含むマップを表示部に表示させる処理を行っている。
　上記構成によれば、対象空間の何れの領域が床面や壁面に該当するか等といった対象空間の面区分の情報をマップの閲覧者に容易に理解させることができる。

　また、実施形態としての情報処理装置においては、第三センサにはマルチスペクトラムカメラが含まれ、表示処理部は、対象空間の三次元構造を示すマップとして、マルチスペクトラムカメラの撮像画像から推定される特定被写体の存在領域を示す情報を含むマップを表示部に表示させる処理を行っている。
　第三センサとしてマルチスペクトラムカメラを用いる場合には、被写体光の波長解析により例えば植物等の特定被写体の存在領域を推定可能であり、上記構成によれば、このように推定された特定被写体の存在領域を示す情報を含むマップの表示を行うことが可能となる。
　従って、例えばマップに映し出される物体の形状のみでは植物等の特定被写体であることを識別し難い場合であっても、特定被写体の存在領域をマップ閲覧者に示すことができ、マップの情報価値向上を図ることができる。

　さらに、実施形態としての情報処理装置においては、第三センサにはサーマルカメラが含まれ、表示処理部は、対象空間の三次元構造を示すマップとして、サーマルカメラの撮像画像から推定される特定被写体の存在領域を示す情報を含むマップを表示部に表示させる処理を行っている。
　第三センサとしてサーマルカメラを用いる場合には、被写体の温度情報より例えば人物や動物等の特定被写体の存在領域を推定可能であり、上記構成によれば、このように推定された特定被写体の存在領域を示す情報を含むマップの表示を行うことが可能となる。
　従って、例えばマップに映し出される物体の形状のみでは人物や動物等の特定被写体であることを識別し難い場合であっても、特定被写体の存在領域をマップ閲覧者に示すことができ、マップの情報価値向上を図ることができる。

　さらにまた、実施形態としての情報処理装置においては、可視光カメラ、測距センサの少なくとも一方によるセンシング情報と、第三センサによるセンシング情報とに基づいてマップデータの生成を行うマップ生成部（同Ｆ１）を備えている。
　上記のように可視光カメラや測距センサによるセンシング情報のみでなく、第三センサによるセンシング情報も活用してマップデータ生成を行うことで、マップデータの正確性向上を図ることができる。

　また、実施形態としての情報処理装置においては、第三センサには偏光カメラが含まれ、マップ生成部は、偏光カメラにより得られる被写体光の偏光情報に基づいてマップデータの生成を行っている。
　これにより、例えば被写体光の偏光情報から推定される被写体の法線方向情報に基づき距離画像データについてのマルチパス起因ノイズの低減処理を行ったり、偏光情報から推定される透明物体領域の情報をマップデータに反映させる処理を行ったりする等、マップデータの生成過程において、偏光情報に基づいたマップデータ正確性向上のための処理を行うことが可能となる。
　従って、マップデータの正確性向上を図ることができる。

　さらに、実施形態としての情報処理装置においては、マップ生成部は、偏光情報から推定される被写体の法線方向情報に基づいてマップデータの生成を行っている。
　上記構成によれば、法線方向情報そのもの、或いは、法線方向情報から推定される被写体の面区分情報に基づいて距離画像データについてのマルチパス起因ノイズの低減処理を行う等、マップデータの生成過程において、法線方向情報に基づいたマップデータ正確性向上のための処理を行うことが可能となる。
　従って、マップデータの正確性向上を図ることができる。

　さらにまた、実施形態としての情報処理装置においては、マップ生成部は、マップデータの生成元データとして測距センサにより得られる距離画像データを入力し、マップデータの生成処理において、法線方向情報から推定される被写体の面区分情報に基づき、距離画像データについてマルチパス起因ノイズの低減処理を行っている。
　上記構成によれば、測距において対象物体からの反射光のマルチパスに起因した測距ノイズの低減を図ることが可能となる。
　従って、マップデータの正確性向上を図ることができる。

　また、実施形態としての情報処理装置においては、マップ生成部は、マップデータの生成元データとして可視光カメラにより得られる可視光画像データを入力し、偏光情報に基づき推定される透明物体領域の情報に基づいてマップデータの生成を行っている。
　これにより、可視光画像データによっては検出し難いガラス等の透明物体領域の情報をマップデータに反映させることが可能となる。
　従って、マップデータの正確性向上を図ることができる。

　さらに、実施形態としての情報処理装置においては、第三センサにはマルチスペクトラムカメラが含まれ、マップ生成部は、マルチスペクトラムカメラにより得られる被写体光の波長解析情報に基づいてマップデータの生成を行っている。
　これにより、例えば被写体光の波長解析情報から推定される被写体の素材情報を付随情報として付加したマップデータを生成して、対象空間をより正確に表すマップデータの生成を可能としたり、或いは、植物部分等の特定の素材で構成される特定被写体部分をマップから除外する処理を行ったり、波長解析情報から推定される外光ノイズ領域の画像補正処理を行ったりする等、マップデータの生成過程において、波長解析情報に基づいたマップデータ正確性向上のための処理を行うことが可能となる。
　従って、マップデータの正確性向上を図ることができる。

　さらにまた、実施形態としての情報処理装置においては、マップ生成部は、波長解析情報に基づき推定される被写体の素材情報に基づいてマップデータの生成を行っている。
　これにより、例えば被写体光の波長解析情報から推定される被写体の素材情報を付随情報として付加したマップデータを生成して、対象空間をより正確に表すマップデータの生成を可能としたり、或いは、植物部分等、マップデータに基づく自己位置推定においてノイズとなり得る部分をマップから排除する処理等、素材情報に基づいたマップデータ正確性向上のための処理を行ったりすることが可能となる。
　従って、マップデータの正確性向上を図ることができる。

　また、実施形態としての情報処理装置においては、マップ生成部は、マップデータの生成処理において、波長解析情報に基づき推定される植物部分を排除する処理を行っている。
　これにより、マップデータに基づく自己位置推定においてノイズとなり得る植物部分をマップから排除する処理が行われる。
　従って、自己位置推定に用いる上でのマップデータの正確性向上を図ることができる。

　さらに、実施形態としての情報処理装置においては、マップ生成部は、マップデータの生成元データとして可視光カメラにより得られる可視光画像データを入力し、マップデータの生成処理において、波長解析情報に基づき推定される外光ノイズ領域についての画像補正処理を行っている。
　上記構成によれば、マップデータにおいて外光ノイズ領域の発生により不正確となった部分を正確な状態に補正することが可能となる。
　従って、マップデータの正確性向上を図ることができる。

　さらにまた、実施形態としての情報処理装置においては、第三センサにはサーマルカメラが含まれ、マップ生成部は、サーマルカメラにより得られる被写体の温度情報に基づいてマップデータの生成を行っている。
　温度情報によっては、物体のセグメンテーション（物体領域の区分）を行うことが可能とされる（物体ごとに温度が異なり得るため）。上記構成によれば、例えばこのようなセグメンテーションにより特定される物体領域の区分情報に基づいてマップデータの正確性向上のための処理を行うことが可能となる。
　従って、マップデータの正確性向上を図ることができる。

　また、実施形態としての情報処理装置においては、マップ生成部は、温度情報に基づき推定される物体領域の区分情報に基づいてマップデータの生成を行っている。
　これにより、対象空間に存在する物体についての物体領域の区分情報に基づいて、マップデータの正確性向上のための処理を行うことが可能となる。
　従って、マップデータの正確性向上を図ることができる。

　さらに、実施形態としての情報処理装置においては、マップ生成部は、マップデータの生成処理において、温度情報に基づき推定される人物部分を排除する処理を行っている。
　これにより、マップデータに基づく自己位置推定においてノイズとなり得る人物部分をマップから排除する処理が行われる。
　従って、自己位置推定に用いる上でのマップデータの正確性向上を図ることができる。

　さらにまた、実施形態としての情報処理装置においては、第三センサにはイベントベースドビジョンセンサが含まれ、マップ生成部は、イベントベースドビジョンセンサのセンシング情報に基づき得られる被写体の動き情報に基づいてマップデータの生成を行っている。
　上記構成によれば、イベントベースドビジョンセンサのセンシング情報に基づき得られる被写体の動き情報に基づいて、例えば人物や動物、車両等といった動物体をマップから排除する処理を行う等、被写体の動き情報に基づいたマップデータの正確性向上のための処理を行うことが可能となる。
　従って、マップデータの正確性向上を図ることができる。

　実施形態としての情報処理方法は、可視光カメラ、測距センサの少なくとも一方によるセンシング情報に基づき生成された、対象空間の三次元構造を示すマップデータの表示処理を行う情報処理装置における情報処理方法であって、可視光カメラと測距センサとを除くセンサである第三センサによるセンシング情報に基づいてマップデータの表示処理を行う情報処理方法である。
　このような情報処理方法によっても、上記した実施形態としての情報処理装置と同様の作用及び効果を得ることができる。

　なお、本明細書に記載された効果はあくまでも例示であって限定されるものではなく、また他の効果があってもよい。

＜５．本技術＞
　本技術は以下のような構成を採ることもできる。
（１）
　可視光カメラ、測距センサの少なくとも一方によるセンシング情報に基づき生成された、対象空間の三次元構造を示すマップデータの表示処理を行う表示処理部を備え、
　前記表示処理部は、前記可視光カメラと前記測距センサとを除くセンサである第三センサによるセンシング情報に基づいて前記マップデータの表示処理を行う
　情報処理装置。
（２）
　前記表示処理部は、前記対象空間の三次元構造を示すマップとして、前記第三センサによるセンシング情報を含むマップを表示部に表示させる処理を行う
　前記（１）に記載の情報処理装置。
（３）
　前記表示処理部は、前記対象空間の三次元構造を示すマップとして、前記第三センサによるセンシング情報から推定される情報を含むマップを表示部に表示させる処理を行う
　前記（１）又は（２）に記載の情報処理装置。
（４）
　前記第三センサには偏光カメラが含まれ、
　前記表示処理部は、前記対象空間の三次元構造を示すマップとして、前記偏光カメラの撮像画像から推定される被写体の面区分情報を含むマップを表示部に表示させる処理を行う
　前記（３）に記載の情報処理装置。
（５）
　前記第三センサにはマルチスペクトラムカメラが含まれ、
　前記表示処理部は、前記対象空間の三次元構造を示すマップとして、前記マルチスペクトラムカメラの撮像画像から推定される特定被写体の存在領域を示す情報を含むマップを表示部に表示させる処理を行う
　前記（３）又は（４）に記載の情報処理装置。
（６）
　前記第三センサにはサーマルカメラが含まれ、
　前記表示処理部は、前記対象空間の三次元構造を示すマップとして、前記サーマルカメラの撮像画像から推定される特定被写体の存在領域を示す情報を含むマップを表示部に表示させる処理を行う
　前記（３）から（５）の何れかに記載の情報処理装置。
（７）
　前記可視光カメラ、前記測距センサの少なくとも一方によるセンシング情報と、前記第三センサによるセンシング情報とに基づいて前記マップデータの生成を行うマップ生成部を備えた
　前記（１）から（６）の何れかに記載の情報処理装置。
（８）
　前記第三センサには偏光カメラが含まれ、
　前記マップ生成部は、前記偏光カメラにより得られる被写体光の偏光情報に基づいて前記マップデータの生成を行う
　前記（７）に記載の情報処理装置。
（９）
　前記マップ生成部は、前記偏光情報から推定される被写体の法線方向情報に基づいて前記マップデータの生成を行う
　前記（８）に記載の情報処理装置。
（１０）
　前記マップ生成部は、前記マップデータの生成元データとして前記測距センサにより得られる距離画像データを入力し、前記マップデータの生成処理において、前記法線方向情報から推定される被写体の面区分情報に基づき、前記距離画像データについてマルチパス起因ノイズの低減処理を行う
　前記（９）に記載の情報処理装置。
（１１）
　前記マップ生成部は、前記マップデータの生成元データとして前記可視光カメラにより得られる可視光画像データを入力し、前記偏光情報に基づき推定される透明物体領域の情報に基づいて前記マップデータの生成を行う
　前記（８）から（１０）の何れかに記載の情報処理装置。
（１２）
　前記第三センサにはマルチスペクトラムカメラが含まれ、
　前記マップ生成部は、前記マルチスペクトラムカメラにより得られる被写体光の波長解析情報に基づいて前記マップデータの生成を行う
　前記（７）から（１１）の何れかに記載の情報処理装置。
（１３）
　前記マップ生成部は、前記波長解析情報に基づき推定される被写体の素材情報に基づいて前記マップデータの生成を行う
　前記（１２）に記載の情報処理装置。
（１４）
　前記マップ生成部は、前記マップデータの生成処理において、前記波長解析情報に基づき推定される植物部分を排除する処理を行う
　前記（１３）に記載の情報処理装置。
（１５）
　前記マップ生成部は、前記マップデータの生成元データとして前記可視光カメラにより得られる可視光画像データを入力し、前記マップデータの生成処理において、前記波長解析情報に基づき推定される外光ノイズ領域についての画像補正処理を行う
　前記（１２）から（１４）の何れかに記載の情報処理装置。
（１６）
　前記第三センサにはサーマルカメラが含まれ、
　前記マップ生成部は、前記サーマルカメラにより得られる被写体の温度情報に基づいて前記マップデータの生成を行う
　前記（７）から（１５）の何れかに記載の情報処理装置。
（１７）
　前記マップ生成部は、前記温度情報に基づき推定される物体領域の区分情報に基づいて前記マップデータの生成を行う
　前記（１６）に記載の情報処理装置。
（１８）
　前記マップ生成部は、前記マップデータの生成処理において、前記温度情報に基づき推定される人物部分を排除する処理を行う
　前記（１６）又は（１７）に記載の情報処理装置。
（１９）
　前記第三センサにはイベントベースドビジョンセンサが含まれ、
　前記マップ生成部は、前記イベントベースドビジョンセンサのセンシング情報に基づき得られる被写体の動き情報に基づいて前記マップデータの生成を行う
　前記（７）から（１８）の何れかに記載の情報処理装置。
（２０）
　可視光カメラ、測距センサの少なくとも一方によるセンシング情報に基づき生成された、対象空間の三次元構造を示すマップデータの表示処理を行う情報処理装置における情報処理方法であって、
　前記可視光カメラと前記測距センサとを除くセンサである第三センサによるセンシング情報に基づいて前記マップデータの表示処理を行う
　情報処理方法。

１　サーバ装置
２　可視光カメラ
３　測距センサ
４　第三センサ
５　フュージョンデータ生成装置
６　ユーザ端末
６ａ　表示画面
７　ネットワーク
１０　コンピュータ装置
１１　ＣＰＵ
１２　ＲＯＭ
１３　ＲＡＭ
１４　不揮発性メモリ部
１５　入出力インタフェース
１６　入力部
１７　表示部
１８　音声出力部
１９　記憶部
２０　通信部
２１　ドライブ
２２　リムーバブル記録媒体
２３　バス
Ｆ１　マップ生成部
Ｆ２　表示処理部
Ｆ３　ＡＲサービス処理部
Ｇｓ　設定画面
Ｐｓ　操作受付部

Claims

　可視光カメラ、測距センサの少なくとも一方によるセンシング情報に基づき生成された、対象空間の三次元構造を示すマップデータの表示処理を行う表示処理部を備え、
　前記表示処理部は、前記可視光カメラと前記測距センサとを除くセンサである第三センサによるセンシング情報に基づいて前記マップデータの表示処理を行う
　情報処理装置。
　前記表示処理部は、前記対象空間の三次元構造を示すマップとして、前記第三センサによるセンシング情報を含むマップを表示部に表示させる処理を行う
　請求項１に記載の情報処理装置。
　前記表示処理部は、前記対象空間の三次元構造を示すマップとして、前記第三センサによるセンシング情報から推定される情報を含むマップを表示部に表示させる処理を行う
　請求項１に記載の情報処理装置。
　前記第三センサには偏光カメラが含まれ、
　前記表示処理部は、前記対象空間の三次元構造を示すマップとして、前記偏光カメラの撮像画像から推定される被写体の面区分情報を含むマップを表示部に表示させる処理を行う
　請求項３に記載の情報処理装置。
　前記第三センサにはマルチスペクトラムカメラが含まれ、
　前記表示処理部は、前記対象空間の三次元構造を示すマップとして、前記マルチスペクトラムカメラの撮像画像から推定される特定被写体の存在領域を示す情報を含むマップを表示部に表示させる処理を行う
　請求項３に記載の情報処理装置。
　前記第三センサにはサーマルカメラが含まれ、
　前記表示処理部は、前記対象空間の三次元構造を示すマップとして、前記サーマルカメラの撮像画像から推定される特定被写体の存在領域を示す情報を含むマップを表示部に表示させる処理を行う
　請求項３に記載の情報処理装置。
　前記可視光カメラ、前記測距センサの少なくとも一方によるセンシング情報と、前記第三センサによるセンシング情報とに基づいて前記マップデータの生成を行うマップ生成部を備えた
　請求項１に記載の情報処理装置。
　前記第三センサには偏光カメラが含まれ、
　前記マップ生成部は、前記偏光カメラにより得られる被写体光の偏光情報に基づいて前記マップデータの生成を行う
　請求項７に記載の情報処理装置。
　前記マップ生成部は、前記偏光情報から推定される被写体の法線方向情報に基づいて前記マップデータの生成を行う
　請求項８に記載の情報処理装置。
　前記マップ生成部は、前記マップデータの生成元データとして前記測距センサにより得られる距離画像データを入力し、前記マップデータの生成処理において、前記法線方向情報から推定される被写体の面区分情報に基づき、前記距離画像データについてマルチパス起因ノイズの低減処理を行う
　請求項９に記載の情報処理装置。
　前記マップ生成部は、前記マップデータの生成元データとして前記可視光カメラにより得られる可視光画像データを入力し、前記偏光情報に基づき推定される透明物体領域の情報に基づいて前記マップデータの生成を行う
　請求項８に記載の情報処理装置。
　前記第三センサにはマルチスペクトラムカメラが含まれ、
　前記マップ生成部は、前記マルチスペクトラムカメラにより得られる被写体光の波長解析情報に基づいて前記マップデータの生成を行う
　請求項７に記載の情報処理装置。
　前記マップ生成部は、前記波長解析情報に基づき推定される被写体の素材情報に基づいて前記マップデータの生成を行う
　請求項１２に記載の情報処理装置。
　前記マップ生成部は、前記マップデータの生成処理において、前記波長解析情報に基づき推定される植物部分を排除する処理を行う
　請求項１３に記載の情報処理装置。
　前記マップ生成部は、前記マップデータの生成元データとして前記可視光カメラにより得られる可視光画像データを入力し、前記マップデータの生成処理において、前記波長解析情報に基づき推定される外光ノイズ領域についての画像補正処理を行う
　請求項１２に記載の情報処理装置。
　前記第三センサにはサーマルカメラが含まれ、
　前記マップ生成部は、前記サーマルカメラにより得られる被写体の温度情報に基づいて前記マップデータの生成を行う
　請求項７に記載の情報処理装置。
　前記マップ生成部は、前記温度情報に基づき推定される物体領域の区分情報に基づいて前記マップデータの生成を行う
　請求項１６に記載の情報処理装置。
　前記マップ生成部は、前記マップデータの生成処理において、前記温度情報に基づき推定される人物部分を排除する処理を行う
　請求項１６に記載の情報処理装置。
　前記第三センサにはイベントベースドビジョンセンサが含まれ、
　前記マップ生成部は、前記イベントベースドビジョンセンサのセンシング情報に基づき得られる被写体の動き情報に基づいて前記マップデータの生成を行う
　請求項７に記載の情報処理装置。
　可視光カメラ、測距センサの少なくとも一方によるセンシング情報に基づき生成された、対象空間の三次元構造を示すマップデータの表示処理を行う情報処理装置における情報処理方法であって、
　前記可視光カメラと前記測距センサとを除くセンサである第三センサによるセンシング情報に基づいて前記マップデータの表示処理を行う
　情報処理方法。