WO2021171768A1

WO2021171768A1 - 情報処理装置及び情報処理方法、コンピュータプログラム、並びに観測装置

Info

Publication number: WO2021171768A1
Application number: PCT/JP2020/048315
Authority: WO
Inventors: 由香有木; 良寺澤; 拓也成平; 利充坪井
Original assignee: ソニーグループ株式会社
Priority date: 2020-02-27
Filing date: 2020-12-23
Publication date: 2021-09-02
Also published as: JP2021135770A

Abstract

部分観測情報から周辺環境を生成する情報を処理する情報処理装置を提供する。　情報処理装置は、高次元の環境情報を低次元空間の環境情報にエンコードする立体エンコーダと、環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコーダと、低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する立体デコーダを具備する。情報処理装置は、前記立体デコーダが再構築した環境情報と元の高次元の環境情報の差分を識別する識別器をさらに備える。

Description

情報処理装置及び情報処理方法、コンピュータプログラム、並びに観測装置

　本明細書で開示する技術（以下、「本開示」とする）は、ロボットの経路に関する情報を処理する情報処理装置及び情報処理方法、コンピュータプログラム、並びに観測装置に関する。

　最近、ロボットやドローンなどの移動体装置に普及が進んでいる。ロボットは、カメラの画像に基づいて環境認識して、与えられた目的地までの経路を計画して自律的に移動したり、障害物を回避しながらマニピュレータを移動させて目標とする物体を把持したりする。例えば、カメラと演算機能を用いて自己位置と回転角度、さらには障害物有無を判断し、経路を補正する移動ロボットが提案されている（例えば、特許文献１を参照のこと）。

特開２０１４－２１９８２４号公報

　本開示の目的は、ロボットの経路に関する情報を処理する情報処理装置及び情報処理方法、コンピュータプログラム、並びに観測装置を提供することにある。

　本開示の第１の側面は、
　高次元の環境情報を低次元空間の環境情報にエンコードする立体エンコーダと、
　環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコーダと、
　低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する立体デコーダと、
を具備する情報処理装置である。

　前記立体エンコーダは、第１のニューラルネットワークモデルを用いて、高次元の環境情報を低次元空間の環境情報にエンコードする。また、前記部分観測エンコーダは、第２のニューラルネットワークモデルを用いて、環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードする。また、前記立体デコーダは、学習済みの第３のニューラルネットワークモデルを用いて、低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する。

　第１の側面に係る情報処理装置は、前記立体デコーダが再構築した環境情報と元の高次元の環境情報の差分を識別する識別器をさらに備える。そして、前記識別器が識別する差分が最小となるように、前記第１乃至第３のニューラルネットワークの学習を行う。

　第１の側面に係る情報処理装置は、前記立体デコーダが再構築した環境情報に基づいてマップを生成するマップ生成部をさらに備えてもよい。前記マップ生成部は、ロボットの経験則に基づいて、ロボットの目的地の入力に対するロボットの経路計画を出力する障害物マップを生成する、

　また、本開示の第２の側面は、
　高次元の環境情報を低次元空間の環境情報にエンコードする立体エンコードステップと、
　環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコードステップと、
　低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する立体デコードステップと、
を有する情報処理方法である。

　また、本開示の第３の側面は、
　高次元の環境情報を低次元空間の環境情報にエンコードする立体エンコーダ、
　環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコーダ、
　低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する立体デコーダ、
としてコンピュータを機能させるようにコンピュータ可読形式で記述されたコンピュータプログラムである。

　本開示の第３の側面に係るコンピュータプログラムは、コンピュータ上で所定の処理を実現するようにコンピュータ可読形式で記述されたコンピュータプログラムを定義したものである。換言すれば、本開示の第３の側面に係るコンピュータプログラムをコンピュータにインストールすることによって、コンピュータ上では協働的作用が発揮され、本開示の第１の側面に係る情報処理装置と同様の作用効果を得ることができる。

　また、本開示の第４の側面は、
　周囲環境を部分観測するセンサーと、
　前記センサーが観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコーダと、
　前記部分観測エンコーダがエンコードした情報を外部に出力する出力部と、
を具備する観測装置である。

　本開示によれば、部分観測情報から周辺環境を生成する情報を処理する情報処理装置及び情報処理方法、コンピュータプログラム、並びに観測装置を提供することができる。

　なお、本明細書に記載された効果は、あくまでも例示であり、本開示によりもたらされる効果はこれに限定されるものではない。また、本開示が、上記の効果以外に、さらに付加的な効果を奏する場合もある。

　本開示のさらに他の目的、特徴や利点は、後述する実施形態や添付する図面に基づくより詳細な説明によって明らかになるであろう。

図１は、情報処理装置１００の機能的構成を示した図である。図２は、実験に使用した環境（本棚）を示した図である。図３は、実験に使用した環境（散らかったテーブル）を示した図である。図４は、トレーニング用データとなる環境マップを示した図である。図５は、図４に示したトレーニング用データからＶＡＥのみを用いて生成された環境マップを示した図である。図６は、図４に示したトレーニング用データからＶＡＥ－ＧＡＮを用いて生成された環境マップを示した図である。図７は、本棚（図２を参照のこと）を視野の狭いカメラで撮影した部分観察結果を示した図である。図８は、図７に示した部分観察結果からＶＡＥのみを用いて生成された環境マップを示した図である。図９は、図７に示した部分観察結果からＶＡＥ－ＧＡＮを用いて生成された環境マップを示した図である。図１０は、ＨＭＮｅｔがＶＡＥ－ＧＡＮを用いて生成された環境マップから生成したヒューリスティックマップを示した図である。図１１は、情報処理装置１００のハードウェア構成例を示した図である。図１２は、情報処理装置１００の機能的構成例（変形例）を示した図である。

　以下、図面を参照しながら本開示に係る技術について、以下の順に従って説明する。

Ａ．概要
Ｂ．導入
Ｃ．フレームワーク
Ｄ．ＶＡＥについて
Ｅ．ＧＡＮについて
Ｆ．ＶＡＥ－ＧＡＮについて
Ｇ．部分観測組み込みネットワークについて
Ｈ．ＨＭＮｅｔ及びプランニングについて
Ｉ．実験
Ｊ．結果
Ｋ．結論
Ｌ．ハードウェア構成例

Ａ．概要
　狭い空間や雑多な障害物が散らばる環境におけるロボットやマニピュレータの経路計画は難しい問題である。一般に、ロボットはカメラやＬｉＤＡＲ（Ｌｉｇｈｔ　Ｄｅｔｅｃｔｉｏｎ　ａｎｄ　Ｒａｎｇｉｎｇ）といった環境を測定するセンサーを装備しているが、これらのセンサーの視界は狭いため、狭い視野で煩雑な環境下でロボットが動くことが期待されている。そこで、本開示では、ロボットが視野外の状況を推定し、その推定結果に基づいて障害物との接触や衝突を回避しながら移動するための情報処理について提案する。

　本開示では、カメラやＬｉＤＡＲなどの視野が狭いセンサーを利用した部分的な観測結果から、広視野又は環境全体の高精細な情報を推定して、障害物との接触や衝突を回避するロボットの経路計画を行うものである。具体的には、本開示では、変分オートエンコーダ（ＶＡＥ：Ｖａｒｉａｔｉｏｎａｌ　Ａｕｔｏ－Ｅｎｃｏｄｅｒ）に敵対的生成ネットワーク（ＧＡＮ：Ｇｅｎｅｒａｔｉｖｅ　Ａｄｖｅｒｓａｒｉａｌ　Ｎｅｔｗｏｒｋ）を組み合わせたＶＡＥ－ＧＡＮを用いて、部分観測情報から周辺環境を生成する。部分観測情報は、カメラで撮影した画像や、ＬｉＤＡＲなどで計測した点群のデータである。

　本開示は、物体や環境を認識するというよりも、部分観測を満たす周辺環境を生成する技術である。本開示により生成された周辺環境を評価するために、実際にロボットの経路計画を行うようにしてもよい。例えば、本出願人に既に譲渡されている特願２０１９－４２６７８号明細書には、ロボットが経路を探索してきた経験則に基づいて周辺環境から経路計画を高速化する方法について開示している。この方法を用いて本開示により生成した周辺環境からロボットの経路計画を行うことで、本開示を評価することができる。

Ｂ．導入
　最近、視覚を含んだ経路計画に関する深層学習に関する研究が進んでおり、ロボットのマニピュレータの操作、把持、移動などのアプリケーションで成果を挙げている。これらのアプリケーションは、ロボットの操作がデカルト空間（Ｔ空間）で実行されるものとして考慮される。煩雑な環境下で物体を把持するような多くのアプリケーションでは、通常、ロボットのゴール姿勢よりもむしろゴール位置を指定して、ロボットがそのゴール位置にエンドエフェクタを移動させるように経路計画を行う。したがって、プランナーは実行可能な経路と所望のゴール位置に対応するゴール姿勢を同時に見つけることができるので、Ｔ空間で解決を探索するのが当然である。さらに、Ｔ空間内で経路計画を行うことによって、環境情報を直接活用することができる。Ｔ空間内で計画を行う利点を得るために、環境情報を効率的に得ることが重要な問題である。多くの視覚に基づく行動計画では、この問題に触れていないが、トップダウンカメラの平面操作に制限しているため、多くの実際のシナリオでは不十分である。また、ロボットのビジョンシステムの視野（例えば、リアルセンスのような）は狭い。広範囲の詳細なマップを作成するには、時間を要する。

　本開示は、部分観測した情報から周辺環境を推定するフレームワークである。本開示に係るフレームワークは、主に手さばき（ｍａｎｉｐｕｌａｔｉｏｎ）に適用されるが、把持（ｇｒａｓｐ）と組み合わせることも容易である。

　最近のコンピュータグラフィックスの分野では、３Ｄオブジェクトの生成並びに再構築が盛んである。使用するニューラルネットワークをすべて畳み込みニューラルネットワーク（ＣＮＮ：Ｃｏｎｖｏｌｕｔｉｏｎａｌ　Ｎｅｕｒａｌ　Ｎｅｔｗｏｒｋ）で構成して３Ｄオブジェクトを生成する研究が最も盛んである。これらの研究では、トレーニング用データセットからのみ３Ｄオブジェクトを生成する。

　さまざまな３Ｄヘアスタイルを変分オートエンコーダ（ＶＡＥ）のコンパクトな潜在空間を通じて暗に表現する研究もなされている。この研究では、ｅｎｄ－ｔｏ－ｅｎｄの３Ｄヘアスタイル推定を実現するために、２Ｄの入力画像のみからＶＡＥ潜在空間内の符号を予測するように、追加の埋め込みネットワークのトレーニングを行う。

　これに対し、本開示に係るフレームワークは、立体変分オートエンコーダ（Ｖｏｌｕｍｅｔｒｉｃ　ＶＡＥ）のコンパクトな潜在空間を敵対的生成ネットワーク（ＧＡＮ）と組み合わせて、部分観測した画像又は点群を入力としてさまざまな３Ｄ周辺環境を表現するものである。本開示に係るニューラルネットワークの構造は、ＶＡＥ－３ＤＧＡＮに近い面もある。本開示によって再構築された周辺環境は、前述した特願２０１９－４２６７８号明細書で開示される情報処理装置に対する入力データとなり、この情報処理装置によってロボットの経験則に基づく障害物マップを高速に生成することができる。この障害物マップに目的地を入力すれば、経路計画を得ることができる。

Ｃ．フレームワーク
　図１には、本開示に係る、部分観測データから周辺環境を生成する情報処理装置１００の機能的構成例を示している。なお、図１では、本開示により生成された周辺環境から、ロボットの経験則に基づく障害物マップを生成するマップ生成部１０５を含めて、情報処理装置１００の構成を示している。

　情報処理装置１００は、立体エンコーダ（Ｖｏｌｕｍｅｔｒｉｃ　Ｅｎｃｏｄｅｒ）１０１と、立体デコーダ（Ｖｏｌｕｍｅｔｒｉｃ　Ｄｅｃｏｄｅｒ）１０２と、識別器（Ｄｉｓｃｒｉｍｉｎａｔｏｒ）１０３と、部分観測エンコーダ（Ｖｏｌｕｍｅｔｒｉｃ　ｏｒ　Ｉｍａｇｅ　Ｅｎｃｏｄｅｒ）１０４を備えている。

　立体エンコーダ１０１と、立体デコーダ１０２と、部分観測エンコーダ１０４は、それぞれＣＮＮなどのニューラルネットワークで構成される。まず、立体エンコーダ１０１と、立体デコーダ１０２と、部分観測エンコーダ１０４の各ニューラルネットワークが学習済みであるものとして、各々の機能について説明する。

　立体エンコーダ１０１は、周囲環境の３Ｄ点群データ１１１を入力して、低次元空間（又は、潜在空間）１１２にエンコードする。立体エンコーダ１０１に入力される３Ｄ点群データ１１１は、例えば６４×６４×６４ボクセルからなる高次元空間である。立体エンコーダ１０１は、入力された高次元空間データを例えば２００次元の低次元空間１１２の３Ｄ点群にエンコードする。低次元空間１１２は、上述した「コンパクトな潜在空間」のことである。そして、立体デコーダ１０２は、低次元空間１１２の３Ｄ点群データを入力して、元の高次元空間の周囲環境の３Ｄ点群データ１１３を再構築する。立体エンコーダ１０１と立体デコーダ１０２の組み合わせにより、変分オートエンコーダ（ＶＡＥ）が構成される。

　部分観測エンコーダ１０４は、カメラが撮影した２次元イメージや、ＬｉＤＡＲなどを用いて計測された部分観測結果の３Ｄ点群データなどの部分観測データ１１４を入力して、低次元空間１１２の部分環境の３Ｄ点群データにエンコードする。カメラやＬｉＤＡＲなどのセンサーの視野は狭い。したがって、部分観測エンコーダ１０４には、周囲環境の部分観測データのみが入力される。

　本実施形態では、部分観測エンコーダ１０４のニューラルネットワークは、周辺環境全体と対応付けて部分観測結果を低次元空間にエンコードするように学習が行われている。また、立体デコーダ１０２のニューラルネットワークは、部分観測結果の低次元空間データを、部分観測結果ではなく元の周辺環境全体をデコードするように学習が行われている。したがって、部分観測エンコーダ１０４に部分環境の画像や３Ｄ点群データが入力され、その低次元空間データが推定された場合には、立体デコーダ１０２は、部分環境に対応する周辺環境全体を再構築することができる。

　要するに、立体デコーダ１０２は、周辺環境又は周辺環境の部分観測結果の低次元空間データから、元の高次元の周辺環境データを再構築する。マップ生成部１０５は、立体デコーダ１０２が再構築した周辺環境データから、ロボットの経験則に基づく障害物マップ１１５を生成する。障害物マップにロボットの目的地を入力すると、ロボットの現在値から目的地までの経路計画を行うことができる。

　識別器１０３は、学習時に使用され、立体デコーダ１０２が再構築した周辺環境と教師データの周辺環境との差分を求め、立体エンコーダ１０１と、立体デコーダ１０２と、部分観測エンコーダ１０４にフィードバックする。立体エンコーダ１０１と、立体デコーダ１０２と、部分観測エンコーダ１０４は、識別器１０３からフィードバックされたデータに基づいて、ニューラルネットワークの学習を行う。

　続いて、立体エンコーダ１０１と、立体デコーダ１０２と、部分観測エンコーダ１０４の各ニューラルネットワークの学習について説明する。本実施形態では、立体エンコーダ１０１による周辺環境のエンコードと、部分観測エンコーダ１０４による部分観測結果のエンコードを対応付けるように学習が行われる。

　立体エンコーダ１０１のニューラルネットワークの学習を行うときには、立体デコーダ１０２のニューラルネットワークの学習を停止する。立体エンコーダ１０１は、学習データとなる周辺環境の３Ｄ点群データを入力して、低次元空間の３Ｄ点群データを推定する。立体デコーダ１０２は、立体エンコーダ１０１が推定した低次元空間の３Ｄ点群データから、元の高次元空間の周囲環境の３Ｄ点群データを再構築する。識別器１０３は、立体デコーダ１０２が再構築した周辺環境と立体エンコーダ１０１に入力された学習データの周辺環境との差分を求め、立体エンコーダ１０１にフィードバックする。そして、識別器１０３からフィードバックされる差分が小さくなるように、立体エンコーダ１０１のニューラルネットワークの学習が行われる。

　また、立体デコーダ１０２のニューラルネットワークの学習を行うときには、立体エンコーダ１０１のニューラルネットワークの学習を停止する。立体エンコーダ１０１は、学習データとなる周辺環境の３Ｄ点群データを入力して、低次元空間の３Ｄ点群データを推定する。立体デコーダ１０２は、立体エンコーダ１０１が推定した低次元空間の３Ｄ点群データから、元の高次元空間の周囲環境の３Ｄ点群データを再構築する。識別器１０３は、立体デコーダ１０２が再構築した周辺環境と立体エンコーダ１０１に入力された学習データの周辺環境との差分を求め、立体デコーダ１０２にフィードバックする。そして、識別器１０３からフィードバックされる差分が小さくなるように、立体デコーダ１０２のニューラルネットワークの学習が行われる。立体エンコーダ１０１と、立体デコーダ１０２と、識別器１０３で、ＶＡＥ－ＧＡＮを構成する。本開示に係るＶＡＥ－ＧＡＮは、３Ｄ環境情報を扱うことから、ＶＡＥ－３ＤＧＡＮと呼ぶこともできる。

　また、部分観測エンコーダ１０４のニューラルネットワークの学習を行うときには、立体エンコーダ１０１及び立体デコーダ１０２のニューラルネットワークの学習を停止する。部分観測エンコーダ１０４は、学習データとして、立体エンコーダ１０１への学習データとなる周辺環境の部分観測結果を入力して、その部分観測結果に対する低次元空間の３Ｄ点群データを推定する。部分観測結果は、カメラが撮影した狭い視野の２次元イメージや、ＬｉＤＡＲなどを用いて計測された狭い視野の３Ｄ点群データである。立体デコーダ１０２は、部分観測エンコーダ１０４が推定した部分観測結果の３Ｄ点群データから、立体エンコーダ１０１への学習データである、元の高次元空間の周囲環境の３Ｄ点群データを再構築する。識別器１０３は、立体デコーダ１０２が再構築した周辺環境と立体エンコーダ１０１に入力された学習データの周辺環境との差分を求め、部分観測エンコーダ１０４にフィードバックする。そして、識別器１０３からフィードバックされる差分が小さくなるように、部分観測エンコーダ１０４のニューラルネットワークの学習が行われる。

　なお、部分観測エンコーダ１０４は、図１に示したシステム構成では、情報処理装置１００内に組み込まれ、外部のカメラが撮影した２次元イメージや、ＬｉＤＡＲなどを用いて計測された部分観測結果の３Ｄ点群データを情報処理装置１００に取り込んでエンコードを行う。他のシステム構成例として、情報処理装置１００の外部のカメラやＬｉＤＡＲなどの観測装置に部分観測エンコーダ１０４が組み込まれてもよい（図１２を参照のこと）。この場合、観測装置は、カメラやＬｉＤＡＲなどのセンサーによって観測された周囲環境の部分観測データを部分観測エンコーダ１０４によってエンコードした低次元空間１１２の部分環境の３Ｄ点群データを、情報処理装置１００に入力することで、図１に示したシステム構成例と実質的に同様の機能を有する。

Ｄ．ＶＡＥについて
　情報処理装置１００の機能的構成は、変分オートエンコーダ（ＶＡＥ）を利用して構成される。オートエンコーダは入力サンプルよりも圧倒的に次元数の低い特徴を抽出する生成モデルである。変分オートエンコーダは、オートエンコーダの拡張であり、最近出現した人気のある生成モデルの１つである。

　典型的な変分オートエンコーダは、入力を潜在空間上の特徴量で表すエンコーダと、潜在空間から元の次元を再現するデコーダからなる。エンコーダＥ（ｘ）は、入力ｘを潜在変数ｚにエンコードし、デコーダＤ（ｚ）は潜在変数ｚから入力ｘの推定値を生成する。そして、入力ｘとデコーダＤ（ｚ）が出力するｘの推定値との誤差が最小となるように、エンコーダ及びデコーダの重み係数が学習される。ここで言う入力は、図１中の周辺環境の３Ｄ点群データ１１１に対応し、エンコーダは立体エンコーダ１０１に対応し、潜在空間は低次元空間１１２に対応し、デコーダは立体デコーダ１０２に対応する。

　変数オートエンコーダは、エンコーダＥ（ｘ）を事後分布ｑ（ｚ｜ｘ）として近似し、事前分布から潜在変数ｚをサンプリングして新しいｘの推定値を生成する。ちなみに、バニラオートエンコーダはエンコーダＥ（ｘ）に決定的関数を用いる。変分オートエンコーダは、潜在分布ｐ（ｚ）に事前分布を課すことによって、エンコーダを正規化する。通常、ｚ乃至Ｎ（０，Ｉ）が選択される。変分オートエンコーダの損失は、期待される対数尤度（再構成誤差）と初期分布の正則化項との合計を引いたものである。エンコーダとデコーダの学習には、下式（１）に示す、確率的勾配変数ベイズ（ＳＧＶＢ）アルゴリズムが用いられる。

Ｅ．ＧＡＮについて
　敵対的生成ネットワーク（ＧＡＮ）は、生成（ｇｅｎｅｒａｔｏｒ）ネットワークと識別（ｄｉｓｃｒｉｍｉｎａｔｏｒ）ネットワークの２つのネットワークで構成される、ニューラルネットワークにより実装される人工知能である。生成ネットワークＧｅｎ（ｚ）は、潜在変数ｚをデータ空間にマッピングし、識別ネットワークは確率ｙ＝Ｄｉｓ（ｘ）∈［０，１］（但し、ｘは現実のトレーニング用サンプルである）と確率１－ｙ（但し、ｘはｘ＝Ｇｅｎ（ｚ）からｚ～ｐ（ｚ）の範囲で本開示に係るモデルを使って生成される）を割り当てる。敵対的生成ネットワークの目的は、真のデータと生成されたデータとの可能な限り最良の識別を与えると同時に、生成ネットワークが真のデータ分布に適合するように促すバイナリ分類器を見つけることにある。したがって、本開示では、下式（２）に基づいて、バイナリクロスエントロピーを最大化又は最小化することを目指す。

　上式（２）において、識別ネットワーク及び生成ネットワークに関して、ｘはトレーニングサンプルとｚ～ｐ（ｚ）に従う。

　ここで言う生成ネットワークは、図１中の立体エンコーダ１０１及び立体デコーダ１０２に対応し、識別ネットワークは識別器１０３に対応する。

Ｆ．ＶＡＥ－ＧＡＮについて
　敵対的生成ネットワーク（ＧＡＮ）の魅力的な特性は、イメージ又は３Ｄオブジェクトの豊富な類似性メトリックをイメージでないものから識別できるように、暗黙的に学習する必要がある点である。識別ネットワークに、イメージ又は３Ｄオブジェクトの性質を学習させて、変分オートエンコーダのより抽象的な再構築誤差に転送できるようにするべきである。ＶＡＥ－ＧＡＮは、高品質の生成モデルであるＧＡＮの利点と、データを潜在空間ｚにエンコードするエンコーダを生成するメソッドであるＶＡＥを組み合わせたものである。

　ＶＡＥはイメージや不変量を持つその他の信号に対する要素毎の再構成誤差が十分でないので、ＶＡＥ－ＧＡＮは、上式（１）中からＶＡＥの再構築（予想される対数尤度）のエラー項を、ＧＡＮの識別器において表される再構築エラーに置き換える。これを実現するには、Ｄｉｓ_l（ｘ）が識別器の隠れ層の第ｌ層を示すようにする。ガウス観察モデルは、下式（３）に示す通りである。

　したがって、ＶＡＥ－ＧＡＮの尤度は下式（４）に示す通りである。

Ｇ．部分観測組み込みネットワークについて
　ＶＡＥ－ＧＡＮの１つの利点は、マルチモーダル入力に潜在ベクトルが用いられることである。エンドツーエンドのシングルビュー３Ｄ環境推定を実現するために、本開示では、部分観察結果の入力から、ＶＡＥ－ＧＡＮの潜在空間における潜在変数ｚを予測するように、部分観測組み込みネットワークのトレーニングが行われる。

　部分的な点群又は画像の収集されたデータセットと、対応する３Ｄ環境が、部分観測組み込みネットワークのトレーニング用データである。トレーニング用データは限られているので、部分観測埋め込みネットワークのより堅牢なトレーニングのために予測される未知数の数を削減することが望ましい。本開示では、線形マッピングとカーネル標準の相関解析（ｋＣＣＡ）を使用して、組み込みネットワークの潜在と３Ｄ環境の実行可能空間の潜在変数ｚ表現をマッピングする。確率的にサンプリングされた潜在変数ｚ～Ｎ（ｚ_μ，ｚ_σ）の代わりに線形マッピングとカーネル標準の相関解析（ｋＣＣＡ）を使用することによって、組み込み家庭におけるランダム性を排除する点に留意されたい。本開示に係る部分観測組み込みパイプラインは、図１に示した情報処理装置１００内では、部分観測組み込みネットワークは部分観測エンコーダ１０４に対応する。

Ｈ．ＨＭＮｅｔ及び経路計画について
　本開示を利用して、上述したＶＡＥ－ＧＡＮによって生成された３Ｄ環境から探索コストを最小にする、より効率的なヒューリスティック関数を最終的に見つけることができる。ここで言う探索コストは、探索の間に訪れ又は試行した頂点の数で表される。具体的には、図１に示す情報処理装置１００において、マップ生成部１０５は、立体デコーダ１０２が再構築した周辺環境データから、ロボットの経験則に基づく障害物マップ１１５を生成する。

　マップ生成部１０５が障害物マップを生成する手法のことを、本明細書では「ＨＭＮｅｔ」とも呼ぶ。ＨＭＮｅｔは、バイナリ障害物マップを入力として含む環境を考察して、ＣＮＮを用いて「経験マップ（ｈｅｕｒｉｓｔｉｃ　ｍａｐ）」と呼ぶグラフ内の各ノードｖにおける経験値を予測する。予測された経験マップは、プランナー（ここでは、「ＴＳ－ＲＲＴ」とする）の要求に基づいてグラフ探索を行う最中に、経験値ｈ（ｖ，φ）の問合せ用の早見表として使用される。

　ＨＭＮｅｔは、予測と目標のＣｏｓｔ－ｔｏ－Ｇｏ値の二乗誤差を最小化することによって直接学習を行うことができる。頂点のＣｏｓｔ－ｔｏ－ｖａｌｕｅは、ゴールへの最短経路に沿った累積コストとして定義される。ＴＳＳ－ＲＲＴアルゴリズムにより、ｃｏｓｔ－ｔｏ－ｇｏ値を計算することができる。ＨＭＮｅｔの学習は、下式（５）に示す損失関数を最小にすることで実行される。

　マスクＭは、例えば障害物により占有され又は囲まれた領域である。学習済みのＨＭＮｅｔは、ＶＡＥ－ＧＡＮによって推定された３Ｄ環境と目標位置を持つヒューリスティック関数である。

　なお、マップ生成部１０５の詳細については、本出願人に既に譲渡されている特願２０１９－４２６７８号明細書を参照されたい。

Ｉ．実験
　本開示に係るフレームワーク（図１を参照のこと）の一般性及び有効性を検証するために、モバイルマニピュレータを用いてデータセットの収集と評価を実施した。本開示に係る手法を現実のロボット及び環境に直接適用するために、この実験では、実際の深度センサーから得られた実世界のデータを環境情報に用いた。実験の詳細なセットアップ及び実験について、以下で説明する。

Ｉ－１．実験セットアップ
（１）ハードウェアのセットアップ
　実験に使用されるモバイルマニピュレータは、モバイルプラットフォームに搭載された２本のアームを備え、合計で２５ＤｏＦ（Ｄｅｇｒｅｅｓ　ｏｆ　Ｆｒｅｅｄｏｍ）を持つ。すべての実験で、対象関節グループは、３ＤｏＦを持つ胴体関節と７ＤｏＦを持つ右腕関節のセット（合計で１０ＤｏＦ）である。周辺環境を検出するために、頭部に深度カメラが搭載されている。

（２）データセット
　経路計画を行う対象の環境として、仕切りを持つ本棚や、雑多な物体が散らばるテーブルを選択した。オクトマップを用いた深度センサーを使って捕捉された３Ｄ占有グリッドマップをトレーニング用データとする。さらに、シミュレーションキッチン環境をトレーニング用データに選択する。データセットの収集では、３２ケースの本棚環境が深度カメラによって測定された。各ケースで、３Ｄ占有グリッドマップが構築された。

（３）実装の詳細
　すべての実験を通じて、深度センサーの解像度とロボットの周囲環境のグリッドサイズは、０．０２５メートル、６５×５７×５７ボクセルに固定された。このグリッドサイズをＶＡＥ－ＧＡＮのトレーニング用に６４×６４×６４ボクセルにした。３Ｄ　ＶＡＥ－ＧＡＮでは、生成器Ｇ（図１中の立体エンコーダ１０１に対応する）は、確率的潜在空間からランダムにサンプルされた、２００次元の潜在ベクトルｚを、３Ｄボクセル空間を表す６４×６４×６４のキューブにマップする。識別器Ｄ（図１中の識別器１０３に対応する）は、３Ｄオブジェクト入力ｘは実数又は合成のいずれであるかを示す信頼性値Ｄ（ｘ）を出力する。識別器は、基本的に、生成器をミラーリングしたものである。分類損失としてバイナリクロスエントロピーを使用する。実装の詳細を以下に述べる。

（１）ネットワークアーキテクチャ：

（２）変分オートエンコーダ（ＶＡＥ）：
　ＶＡＥは、２つの完全結合アフィン層であるエンコーダ及びデコーダと、オリジナルのソフト＋関数から置き換えたＥｌｕからなる。ＶＡＥからの出力は、２００次元ベクトルのガウス確率密度のパラメータである。ＶＡＥへの入力は、［０，１］の値を持つ６４×６４×６４行列である。

（３）生成器（ＧＡＮ）：
　生成器は、５つの完全な畳み込み層からなる。各畳み込み層のチャネル数は｛５１２，２５６，１２８，６４，１｝、カーネルサイズは｛４，４，４，４，４｝、ストライドは｛１，２，２，２，２｝である。畳み込み層とシグモイド層の終端の間には、活性化関数ＲｅＬＵ（Ｒｅｃｔｉｆｉｅｄ　Ｌｉｎｅａｒ　Ｕｎｉｔ）及びバッチ正規化層が用いられる。ＶＡＥからＧＡＮへの入力は２００次元ベクトルであり、ＧＡＮの出力は［０，１］の値を持つ６４×６４×６４行列である。

（４）識別器（ＧＡＮ）：
　識別器は、５つの立体畳み込み層からなる。各立体畳み込み層のチャネル数は｛６４，１２８，５１２，１｝、カーネルサイズは｛４，４，４，４，４｝、ストライドは｛２，２，２，２，１｝である。各立体畳み層の間には、パラメータ０．２のｌｅａｋｙ　ＲｅＬＵ層とバッチ正規化層が配置され、終端にシグモイド層が配置されている。

（５）トレーニング：
　トレーニングには、適応的トレーニング戦略が用いられる。各バッチで、最後のバッチの精度が８０より高くなければ、識別器は更新される。

（６）生成器学習率：０．００２５

（７）識別器学習率：１０^-5

（８）バッチサイズ：２０

（９）β＝０．５のＡｄａｍによる最適化

　ＨＭＮｅｔ、拡張畳み込み、及びエンコーダ－デコーダの観点から、ニューラルネットワークアーキテクチャの構造が採用されている。このような構造によれば、３Ｄ入力マップと出力の空間的に一貫したマップから、グローバル及びローカルな空間コンテキストを抽出することができるので、本開示を実現するのに適している。

　エンコーダのＣＮＮでは、畳み込みモジュールを３回適用して、小さい空間次元と広い空間コンテキストを持つ特徴マップを生成する。畳み込みモジュールは、３個の３×３×３畳み込みからなり、各々の畳み込みの後にはバッチ正規化とＬｅａｋｙ　ＲｅＬＵが続く。最初の畳み込みには２のストライドが用いられ、畳み込みカーネルの膨張係数は１から３に増加する。３つの畳み込みモジュールの畳み込みチャネル数は、それぞれ１６、３２、及び６４として増加する。

　デコーダ部分でも逆畳み込みモジュールが３回適用される。この逆畳み込みモジュールは、最初の畳み込みが２のアップスケーリング係数を持つ４×４×４の逆畳み込みに置き換えられる以外は、上述の畳み込みモジュールと同様である。３つのモジュールの畳み込みチャネルはそれぞれ３２、１６、及び１６であり、最後の逆畳み込みモジュールの畳み込みを除いて、単一のチャネルをヒューリスティックマップとして出力する。

　トレーニング中、データセットから２０の入力が抽出され、確率的勾配降下ステップのミニバッチが作成される。確率的勾配降下アルゴリズムとして、α＝０．０００１、β₁＝０．９、及びβ₂＝０．９９９を持つＡｄａｍが用いられる。２つの損失の重みは、ｗ₁＝１．０、ｗ₂＝１０^-5である。インテル社製のＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）であるＣｏｒｅ　ｉ７－Ｋ７７００　４．２ＧＨｚと、ＣＮＮ用にＧＰＵ（Ｇｒａｐｈｉｃ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）であるシングルＧＴＸ　１０８０Ｔｉ上で、トレーニングと評価を実行した。ＨＭＮｅｔのトレーニング時間は約３時間である。

Ｉ－２．パフォーマンス評価
（１）計画シナリオ：
　本開示に係る手法を、３つの異なるシナリオでテストしてみた。

Ａ）仕切りのある本棚の環境における簡単な問題と部分観察。
Ｂ）散らかったテーブルとキッチンの異なる環境における比較的難しい問題。

　図２及び図３には、これらの問題の環境と目標位置をそれぞれ示している。

　上記の問題Ａ及びＢは、上記Ｉ－１項の実験セットアップで説明した通りの２つのテストデータセットである。問題Ｃの環境は、ＨＭＮｅｔには決して見られたことがないが、本開示に係るフレームワークの一般性を検証することを意図したものであり、問題Ｂと同様の空間的構造を持つ。

（２）アルゴリズムのセットアップ：
　本開示を適用したプランナーであるＨＭ－ＴＳ－ＲＲＴを用いて、推定環境のヒューリスティックを部分環境のみと比較した。ＨＭ－ＴＳ－ＲＲＴのパラメータは、ｐ＝０．４、ｒ＝６０である。この実験では、各プランナーについて計画を３０回試行したときの平均計画時間と経路長を比較して、計画時間の機能として成功率を評価した。プランナーの実行には完了するまでに最大１０秒が与えられ、成功した計画の時間を平均化した。

Ｊ．結果
　まず、各々の問題において、ＶＡＥ及びＶＡＥ－ＧＡＮを用いて生成されたヒューリスティックマップについて評価した。次いで、平均再構築誤差を再構築した環境と比較した。ＶＡＥのみを用いて生成された環境マップは、ノイズが多い。一方、ＶＡＥ－ＧＡＮを用いて生成したマップは、トレーニング用データに近似している。

　図４には、トレーニング用データとなる環境マップを示している。このトレーニング用データは、ＶＡＥ及びＶＡＥ－ＧＡＮのエンコーダに入力される３Ｄ点群データである。図５には、ＶＡＥのみを用いて生成された環境マップを示している。この環境マップは、図４に示した環境マップをエンコーダで潜在空間に圧縮した後、デコーダで再構築した結果である。図５から分かるように、ＶＡＥのみを用いて生成された環境マップは、ノイズが多い。

　また、図６には、ＶＡＥ－ＧＡＮを用いて生成された環境マップを示している。ＶＡＥは再構成誤差が十分でない。これに対し、ＶＡＥ－ＧＡＮは、ＶＡＥにより生成された環境マップが元のトレーニング用データとの最良の識別をＶＡＥに与え、生成された環境マップがトレーニング用データに適合するようにＶＡＥをトレーニングする。したがって、図６に示すＶＡＥ－ＧＡＮを用いて生成された環境マップは、図４に示したトレーニング用データにより近づいている。

　本開示に係る手法を検証するために、以下の２つの評価を行った。

（１）ＨＭＮｅｔからのヒューリスティックマップと部分観察のみのデータとの比較。
（２）ＨＭＮｅｔからのヒューリスティックマップと部分観察のみのデータの各々についてのＨＭ－ＴＳ－ＲＲＴの比較。

　各プランナーについて計画を３０回実行したときの平均計画時間を評価した。プランナーの実行には完了するまでに最大１０秒が与えられ、各プランナーについての成功率も評価した。

Ｊ－１．部分観察からのヒューリスティックの評価
　図７には、本棚（図２を参照のこと）を視野の狭いカメラで撮影した部分観察結果を示している。図８には、図７に示した部分観察結果からＶＡＥのみを用いて生成された環境マップ（３Ｄ点群データ）を示している。また、図９には、図７に示した部分観察結果からＶＡＥ－ＧＡＮを用いて生成された環境マップ（３Ｄ点群データ）を示している。

　そして、図１０には、ＨＭＮｅｔが、ＶＡＥ－ＧＡＮを用いて生成された環境マップ（図９を参照のこと）から生成したヒューリスティックマップを示している。図１０は、ＸＹＺ座標系におけるヒューリスティックマップの垂直断面におけるヒューリスティック値を示しており、目標位置も含んでいる。矢印で表されているベクトル場は、この平面におけるヒューリスティック値の負の勾配である。このようなベクトル場は、障害物を回避しながら、主に目的地に向かって流れる。ヒューリスティックマップの中には誤ったヒューリスティクスを持つ頂点もあるが、このマップは、ＨＭ－ＴＳ－ＲＲＴのような探索アルゴリズムにおいて探索の組み合わせにより依然として利用可能である。図１０を参照すると、ヒューリスティックマップのほとんどの頂点は合理的なヒューリスティック値を持つことが分かり、ＨＭＮｅｔから得られたヒューリスティックマップがプランナーに役に立つ手掛かりを提供することができる。

Ｋ．結論
　本開示によれば、部分観察をＶＡＥ及びＶＡＥ－ＧＡＮに組み込むことによって、新規マップ生成モデルを提供することができる。３Ｄ－ＣＮＮの特徴を活用することによって、高速モーションプランナーに適用することができる、モーションの経験からヒューリスティックマップを学習するＨＭＮｅｔを提供することができる。本明細書で紹介したＨＭ－ＴＳ－ＲＲＴは、ＨＭＮｅｔからのヒューリスティックマップの純粋な探索に代えて、搾取とガイド付き探索を実行する。

　実験結果によって、本開示に係る手法は、ローカルトラップや狭い通路の問題などの困難な問題でも、同様の分散を持つ平均計画時間という面では、よりよいパフォーマンスを持つことが示された。実験結果は、問題がトレーニングサンプルと同様の空間構造を持つときに、本明細書で説明した学習のアプローチにより、新しい計画シナリオを一般化することができるということも意味する。しかしながら、さまざまな環境において本開示に係るフレームワークの一般化パフォーマンスを定量的に評価することは困難である。ドメイン適応（転移学習）は、さまざまな環境で一般化を増加するための解決策の１つである。転移学習や強化学習などの他の方法でＨＭＮｅｔをトレーニングすることも考えられる。

Ｌ．ハードウェア構成例
　図１１には、図１に示した情報処理装置１００を実現する具体的なハードウェア構成例を示している。図示の情報処理装置１００は、プロセッサ１１０１と、ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）１１０２と、ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）１１０３と、ホストバス１１０４と、ブリッジ１１０５と、外部バス１１０６と、インターフェース１１０７と、入力装置１１０８と、出力装置１１０９と、ストレージ１１１０と、ドライブ１１１１と、接続ポート１１１２と、通信装置１１１３を備えている。但し、図１１に示したすべての構成要素が情報処理装置１００に必須とは限らず、図示した構成要素の一部を含まない構成や、図示しない他の構成要素をさらに含む構成も実現する。

　プロセッサ１１０１は、例えば演算処理装置又は制御装置として機能し、ＲＯＭ１１０２、ＲＡＭ１１０３、ストレージ１１１０、又はリムーバブル記録媒体１１２１に記録された各種プログラムを実行して、情報処理装置１００内の各構成要素の動作全般又はその一部を制御する。図１に示した、立体エンコーダ１０１、立体デコーダ１０２、識別器１０３、部分観測エンコーダ１０４、及びマップ生成部１０５は、プロセッサ１１０１がプログラムを実行することによって実現される機能モジュールである。

　ＲＯＭ１１０２は、プロセッサ１１０１に読み込まれるプログラムや演算に用いるデータなどを不揮発的に格納するメモリである。ＲＡＭ１１０３は、プロセッサ１１０１が実行するプログラムをストレージ１１１０やリムーバブル記録媒体１１２１から読み込んだり、プロセッサ１１０１がプログラムを実行する際に適宜変化する各種パラメータなどの作業データを一時的に格納したりするために使用されるメモリである。

　ホストバス１１０４は、高速なデータ伝送が可能な伝送路であり、プロセッサ１１０１と、ＲＯＭ１１０２と、ＲＡＭ１１０３を相互接続する。一方、外部バス１１０６は、比較的データ伝送速度が低速な伝送路であり、種々の構成要素を接続するインターフェース１１０７が接続されている。ブリッジ１１０５は、ホストバス１１０４と外部バス１１０６を相互接続する。

　図１１に示す構成例では、インターフェース１１０７に接続される構成要素は、入力装置１１０８と、出力装置１１０９と、ドライブ１１１１と、接続ポート１１１２と、通信装置１１１３である。

　入力装置１１０８は、例えば、マウスやキーボード、タッチパネル、ボタン、スイッチ、レバーなどである。また、入力装置１１０８は、赤外線信号や無線信号を送信するリモートコントローラとその受信機を含んでいてもよい。また、入力装置１１０９は、マイクロフォンなどの音声入力装置を含んでいてもよい。

　出力装置１１０９は、液晶表示ディスプレイ（ＬＣＤ）や有機ＥＬ（Ｅｌｅｃｔｒｏ　Ｌｕｍｉｎｅｓｃｅｎｔ）ディスプレイなどの表示装置、スピーカやヘッドホンなどの音声出力装置を始め、ユーザに対し視覚的又は聴覚的に情報を通知することが可能な装置が含まれる。また、出力装置１１０９は、触覚刺激によりユーザに情報を通知することが可能な振動デバイスなどの装置を含んでいてもよい。また、出力装置１１０９は、プリンタや複合機、スマートフォンやタブレットなどの多機能端末を含んでいてもよい。

　ドライブ１１１１は、リムーバブル記録媒体１１２１に記録された情報を読み出し、又はリムーバブル記録媒体１１２１に情報を書き込む装置である。

　リムーバブル記録媒体１１２１は、例えば、ＤＶＤ（Ｄｉｇｉｔａｌ　Ｖｅｒｓａｔｉｌｅ　Ｄｉｓｃ）ディスク、Ｂｌｕ－ｒａｙ（登録商標）ディスク、並びに半導体メモリなどのうち少なくとも１つである。また、リムーバブル記録媒体１１２１は、非接触ＩＣチップを搭載したＩＣカードや電子機器などであってもよい。

　接続ポート１１１２は、例えばＵＳＢ（Ｉｎｉｖｅｒｓａｌ　Ｓｅｒｉａｌ　Ｂｕｓ）ポートである。また、接続ポート１１１２は、ＩＥＥＥ１３９４ポート、ＳＣＳＩ（Ｓｍａｌｌ　Ｃｏｍｐｕｔｅｒ　Ｓｙｓｔｅｍ　Ｉｎｔｅｒｆａｃｅ）ポート、ＲＳ－２３２Ｃポート、ＨＤＭＩ（登録商標）（Ｈｉｇｈ－Ｄｅｆｉｎｉｔｉｏｎ　Ｍｕｌｔｉｍｅｄｉａ　Ｉｎｔｅｒｆａｃｅ）ポートであってもよい。

　外部接続機器１１２２は、例えばプリンタ、携帯音楽プレイヤ、デジタルカメラ、デジタルビデオカメラ、又はＩＣレコーダなどである。また、情報処理装置１００が図１２に示したようなシステム構成の場合には、カメラやＬｉＤＡＲなどの観測装置は、外部接続機器１１２２の１つとして、接続ポート１１１２経由で情報処理装置１００に外部接続される。

　通信装置１１１３は、情報処理装置１００をネットワークに接続するための装置であり、例えば、有線ＬＡＮ（Ｌｏｃａｌ　Ａｒｅａ　Ｎｅｔｗｏｒｋ）、無線ＬＡＮ、Ｂｌｕｅｔｏｏｔｈ（登録商標）、又はＷＵＳＢ（Ｗｉｒｅｌｅｓｓ　ＵＳＢ）用の通信インターフェースカード、光通信用のルータ、ＡＤＳＬ（Ａｓｙｍｍｅｔｒｉｃ　Ｄｉｇｉｔａｌ　Ｓｕｂｓｃｒｉｂｅｒ　Ｌｉｎｅ）用のルータ、又は各種通信用のモデムなどである。

　以上、特定の実施形態を参照しながら、本開示について詳細に説明してきた。しかしながら、本開示の要旨を逸脱しない範囲で当業者が該実施形態の修正や代用を成し得ることは自明である。

　本開示は、ロボットやドローン、自動運転車など自律動作するさまざまな移動体装置における経路計画、物体を把持するマニピュレータの経路計画などに適用することができる。

　要するに、例示という形態により本開示について説明してきたのであり、本明細書の記載内容を限定的に解釈するべきではない。本開示の要旨を判断するためには、特許請求の範囲を参酌すべきである。

　なお、本開示は、以下のような構成をとることも可能である。

（１）高次元の環境情報を低次元空間の環境情報にエンコードする立体エンコーダと、
　環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコーダと、
　低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する立体デコーダと、
を具備する情報処理装置。

（２）前記立体エンコーダは、第１のニューラルネットワークモデルを用いて、高次元の環境情報を低次元空間の環境情報にエンコードし、
　前記部分観測エンコーダは、第２のニューラルネットワークモデルを用いて、環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードし、
　前記立体デコーダは、学習済みの第３のニューラルネットワークモデルを用いて、低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する、
上記（１）に記載の情報処理装置。

（３）前記立体デコーダが再構築した環境情報と元の高次元の環境情報の差分を識別する識別器をさらに備える、
上記（２）に記載の情報処理装置。

（４）前記立体エンコーダ及び前記立体デコーダは変分オートエンコーダを構成する、
上記（１）乃至（３）のいずれかに記載の情報処理装置。

（５）前記立体エンコーダ、前記立体デコーダ、及び前記識別器は、敵対的生成ネットワークを構成する、
上記（３）に記載の情報処理装置。

（６）前記識別器によって識別された、前記立体デコーダが再構築した環境情報と元の高次元の環境情報の差分が最小となるように、前記第１乃至第３のニューラルネットワークの学習を行う、
上記（３）又は（５）のいずれかに記載の情報処理装置。

（７）前記立体デコーダが再構築した環境情報に基づいてマップを生成するマップ生成部をさらに備える、
上記（１）乃至（６）のいずれかに記載の情報処理装置。

（８）前記マップ生成部は、ロボットの経験則に基づく障害物マップを生成する、
上記（７）に記載の情報処理装置。

（９）前記マップ生成部は、前記障害物マップとロボットの目的地から新たなマップを生成する、
上記（８）に記載の情報処理装置。

（１０）高次元の環境情報を低次元空間の環境情報にエンコードする立体エンコードステップと、
　環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコードステップと、
　低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する立体デコードステップと、
を有する情報処理方法。

（１１）高次元の環境情報を低次元空間の環境情報にエンコードする立体エンコーダ、
　環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコーダ、
　低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する立体デコーダ、
としてコンピュータを機能させるようにコンピュータ可読形式で記述されたコンピュータプログラム。

（１２）周囲環境を部分観測するセンサーと、
　前記センサーが観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコーダと、
　前記部分観測エンコーダがエンコードした情報を外部に出力する出力部と、
を具備する観測装置。

　１００…情報処理装置、１０１…立体エンコーダ
　１０２…立体デコーダ、１０３…識別器、１０４…部分観測エンコーダ　
　１０５…マップ生成部
　１１０１…プロセッサ、１１０２…ＲＯＭ、１１０３…ＲＡＭ
　１１０４…ホストバス、１１０５…ブリッジ、１１０６…外部バス
　１１０７…インターフェース、１１０８…入力装置
　１１０９…出力装置、１１１０…ストレージ、１１１１…ドライブ
　１１１２…接続ポート、１１１３…通信装置
　１１２１…リムーバブル記録媒体、１１２２…外部接続機器

Claims

　高次元の環境情報を低次元空間の環境情報にエンコードする立体エンコーダと、
　環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコーダと、
　低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する立体デコーダと、
を具備する情報処理装置。
　前記立体エンコーダは、第１のニューラルネットワークモデルを用いて、高次元の環境情報を低次元空間の環境情報にエンコードし、
　前記部分観測エンコーダは、第２のニューラルネットワークモデルを用いて、環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードし、
　前記立体デコーダは、学習済みの第３のニューラルネットワークモデルを用いて、低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する、
請求項１に記載の情報処理装置。
　前記立体デコーダが再構築した環境情報と元の高次元の環境情報の差分を識別する識別器をさらに備える、
請求項２に記載の情報処理装置。
　前記立体エンコーダ及び前記立体デコーダは変分オートエンコーダ（Ｖａｒｉａｔｉｏｎａｌ　Ａｕｔｏ－Ｅｎｃｏｄｅｒ）を構成する、
請求項１に記載の情報処理装置。
　前記立体エンコーダ、前記立体デコーダ、及び前記識別器は、ＶＡＥ－ＧＡＮを構成する、
請求項３に記載の情報処理装置。
　前記識別器によって識別された、前記立体デコーダが再構築した環境情報と元の高次元の環境情報の差分が最小となるように、前記第１乃至第３のニューラルネットワークの学習を行う、
請求項３に記載の情報処理装置。
　前記立体デコーダが再構築した環境情報に基づいてマップを生成するマップ生成部をさらに備える、
請求項１に記載の情報処理装置。
　前記マップ生成部は、ロボットの経験則に基づく障害物マップを生成する、
請求項７に記載の情報処理装置。
　前記マップ生成部は、前記障害物マップとロボットの目的地から新たなマップを生成する、
請求項８に記載の情報処理装置。
　高次元の環境情報を低次元空間の環境情報にエンコードする立体エンコードステップと、
　環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコードステップと、
　低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する立体デコードステップと、
を有する情報処理方法。
　高次元の環境情報を低次元空間の環境情報にエンコードする立体エンコーダ、
　環境を部分的に観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコーダ、
　低次元空間の環境情報並びに低次元空間の部分観測情報から高次元の環境情報を再構築する立体デコーダ、
としてコンピュータを機能させるようにコンピュータ可読形式で記述されたコンピュータプログラム。
　周囲環境を部分観測するセンサーと、
　前記センサーが観測した部分観測情報を低次元空間の部分観測情報にエンコードする部分観測エンコーダと、
　前記部分観測エンコーダがエンコードした情報を外部に出力する出力部と、
を具備する観測装置。