JP2020140641A5

JP2020140641A5 - 情報処理装置、方法、制御装置及び装置

Info

Publication number: JP2020140641A5
Application number: JP2019037752A
Authority: JP
Filing date: 2019-03-01
Publication date: 2022-03-03
Anticipated expiration: 2039-03-01

Description

本発明は、情報処理装置、方法、制御装置及び装置に関する。

本開示の一態様による情報処理装置は、例えば、以下のような構成を有する。即ち、
少なくとも１つのメモリと、
少なくとも１つのプロセッサと、を備え、
前記少なくとも１つのプロセッサは、
現実世界の観測結果に基づく情報と、環境変数と、に基づいて、仮想世界の状態についてシミュレーションを実行することと、
前記シミュレーションの結果が、前記現実世界が変化した後の観測結果に基づく変化後の前記仮想世界の状態に近づくように、前記環境変数を更新することと、
を実行する。

Claims

少なくとも１つのメモリと、
少なくとも１つのプロセッサと、を備え、
前記少なくとも１つのプロセッサは、
現実世界の観測結果に基づく情報と、環境変数と、に基づいて、仮想世界の状態についてシミュレーションを実行することと、
前記シミュレーションの結果が、前記現実世界が変化した後の観測結果に基づく変化後の前記仮想世界の状態に近づくように、前記環境変数を更新することと、
を実行する、
情報処理装置。
前記少なくとも１つのプロセッサは、前記シミュレーションの結果が、前記変化後の前記仮想世界の状態に近づくように、誤差逆伝播を行うことで、前記環境変数を更新する、
請求項１に記載の情報処理装置。
前記少なくとも１つのプロセッサは、更に、
前記シミュレーションの出力を第１のニューラルネットワークに入力し、前記シミュレーションの結果を生成することと、
前記シミュレーションの結果が、前記変化後の前記仮想世界の状態に近づくように、前記第１のニューラルネットワークを訓練することと、
を実行する、
請求項１または２に記載の情報処理装置。
前記少なくとも１つのプロセッサは、
前記現実世界の観測結果に基づく情報と、前記環境変数と、前記現実世界における制御方法に関する情報と、に基づいて、前記シミュレーションを実行し、
前記シミュレーションの結果が、前記制御方法に基づく制御によって前記現実世界が変化した後の前記観測結果に基づく前記変化後の前記仮想世界の状態に近づくように、前記環境変数を更新する、
請求項１乃至３のいずれか１項に記載の情報処理装置。
前記少なくとも１つのプロセッサは、更に、
前記現実世界の観測結果に基づく情報と、前記環境変数とを第２のニューラルネットワークに入力して、前記現実世界における制御方法に関する情報を出力することと、
を実行する、
請求項１乃至４のいずれか１項に記載の情報処理装置。
前記少なくとも１つのプロセッサは、更に、前記シミュレーションの結果に基づいて、前記第２のニューラルネットワークを訓練すること、を実行する、
請求項５に記載の情報処理装置。
前記環境変数は、物体に関する情報を含む、
請求項１乃至６のいずれか１項に記載の情報処理装置。
前記現実世界の観測結果に基づく情報は、前記仮想世界の状態を含む、
請求項１乃至７のいずれか１項に記載の情報処理装置。
前記シミュレーションは微分可能なシミュレーションである、
請求項１乃至８のいずれか１項に記載の情報処理装置。
請求項３に記載の情報処理装置を用いて、前記第１のニューラルネットワークを生成する方法。
請求項６に記載の情報処理装置を用いて、前記第２のニューラルネットワークを生成する方法。
少なくとも１つのメモリと、
少なくとも１つのプロセッサと、を備え、
前記少なくとも１つのプロセッサは、
仮想世界の状態と、環境変数とを第１のニューラルネットワークに入力して、制御方法に関する情報を出力することと、
前記仮想世界の状態と、前記環境変数と、前記制御方法に関する情報とに基づいて、前記制御方法に基づいて対象を制御した後の前記仮想世界の状態をシミュレーションすることと、
前記シミュレーションの結果に基づいて、前記第１のニューラルネットワークを訓練することと、
を実行する、
情報処理装置。
前記少なくとも１つのプロセッサは、前記シミュレーションの結果に基づいて報酬を算出し、前記報酬に基づいて前記第１のニューラルネットワークを訓練する、
請求項１２に記載の情報処理装置。
前記シミュレーションは、微分可能なシミュレーションである、
請求項１２または１３に記載の情報処理装置。
前記少なくとも１つのプロセッサは、前記微分可能なシミュレーションの出力を第２のニューラルネットワークに入力し、前記シミュレーションの結果を生成する、
請求項１４に記載の情報処理装置。
前記環境変数は、前記対象に関する情報を含む、
請求項１２乃至１５のいずれか１項に記載の情報処理装置。
請求項１２乃至１６のいずれか１項に記載の情報処理装置を用いて、前記第１のニューラルネットワークを生成する方法。
少なくとも１つのメモリと、
少なくとも１つのプロセッサと、を備え、
前記少なくとも１つのプロセッサは、
仮想世界の状態と、環境変数と、に基づいて、前記仮想世界の状態についてシミュレーションを実行すること、
を実行し、
前記環境変数は、シミュレーションの結果が、現実世界の観測結果に基づく変化後の前記仮想世界の状態に近づくように更新されたものである、
情報処理装置。
前記少なくとも１つのプロセッサは、更に、
前記シミュレーションの出力を第１のニューラルネットワークに入力すること、
を実行し、
前記第１のニューラルネットワークは、前記シミュレーションの結果が、前記変化後の前記仮想世界の状態に近づくように訓練されたものである、
請求項１８に記載の情報処理装置。
前記少なくとも１つのプロセッサは、
前記仮想世界の状態と、前記環境変数と、制御方法に関する情報とに基づいて、前記シミュレーションを実行する、
請求項１８または１９に記載の情報処理装置。
前記環境変数は、物体に関する情報を含む、
請求項１８乃至２０のいずれか１項に記載の情報処理装置。
前記シミュレーションは微分可能なシミュレーションである、
請求項１８乃至２１のいずれか１項に記載の情報処理装置。
少なくとも１つのメモリと、
少なくとも１つのプロセッサと、を備え、
前記少なくとも１つのプロセッサは、
仮想世界の状態と、環境変数とを第１のニューラルネットワークに入力して、制御方法に関する情報を出力することと、
前記仮想世界の状態と、前記環境変数と、前記制御方法に関する情報とに基づいて、前記制御方法に基づいて対象を制御した後の前記仮想世界の状態をシミュレーションすることと、
を実行し、
前記第１のニューラルネットワークは、前記仮想世界の状態のシミュレーションの結果に基づいて訓練されたものである、
情報処理装置。
前記第１のニューラルネットワークは、前記シミュレーションの結果に基づいて算出された報酬に基づいて訓練されたものである、
請求項２３に記載の情報処理装置。
前記シミュレーションは、微分可能なシミュレーションである、
請求項２３または２４に記載の情報処理装置。
前記環境変数は、前記対象に関する情報を含む、
請求項２３乃至２５のいずれか１項に記載の情報処理装置。
少なくとも１つのメモリと、
少なくとも１つのプロセッサと、を備え、
前記少なくとも１つのプロセッサは、現実世界の観測結果に関する情報を請求項２３乃至２６のいずれか１項に記載の情報処理装置に送信することと、
前記情報処理装置から前記現実世界における制御方法に関する情報を受信することと、
前記制御方法に関する情報に基づいて、前記現実世界において対象を制御することと、
を実行する、
制御装置。
現実世界の観測結果を取得するセンサ装置と、
前記現実世界で駆動する駆動装置と、
請求項２７に記載の制御装置と、を備え、
前記駆動装置は、前記制御装置が取得した前記制御方法に関する情報に基づいて動作する、
装置。