WO2023157235A1

WO2023157235A1 - 計算装置

Info

Publication number: WO2023157235A1
Application number: PCT/JP2022/006669
Authority: WO
Inventors: 真也安田; 裕志吉田
Original assignee: 日本電気株式会社
Priority date: 2022-02-18
Filing date: 2022-02-18
Publication date: 2023-08-24

Abstract

計算装置４００は、駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて前記駆動装置が駆動した後の前記駆動装置の状態をシミュレーションする実行部４２１と、前記実行部４２１が複数回シミュレーションすることで特定される前記駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定する分析部４２２と、前記分析部４２２が選定した結果に基づいて、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値を決定する決定部４２３と、を有する。

Description

計算装置

　本発明は、計算装置、決定方法、駆動装置、駆動方法、記録媒体に関する。

　地面の凹凸や機械的な遊びなど細かな誤差要因により、指示した制御入力通りにロボットなどの駆動装置が動かない場合がある。このような不確実さを加味した制御入力の評価を行う際に、数１で示すような形の積分を評価することが知られている。
　なお、数１のうちｘはロボットの位置や向きなどのロボットの状態を示しており、ｆ（ｘ）は状態の良さを評価する関数である。また、ｐ（ｘ）は、状態ｘをとる確率密度を示している。

　上記を近似的に評価する方法として、例えば、確率微分方程式を繰り返し数値的に解く、つまり、シミュレーションして、得られた軌道について評価値を計算して平均するような、いわゆるモンテカルロ法がある。モンテカルロ法を用いて確率微分方程式を解いている文献としては、例えば、特許文献１のようなものがある。

　また、関連する文献として、例えば、特許文献２がある。特許文献２には、大量のパラメタが存在する場合に主成分分析を用いて入力の次元を削減する旨が開示されている。また、特許文献２には、２つの基準を順番に実行することで少数のサンプリング点を選択して、選択されたサンプリング点においてシミュレーション演算を実行することが開示されている。

特開２００１－３２５４３１号公報特表２００８－５２３５１６号公報

Yu Zhou and G. S. Chirikjian, "Probabilistic models of dead-reckoning error in nonholonomic mobile robots," 2003 IEEE International Conference on Robotics and Automation, 2003, pp. 1594-1599. Andrew W. Long, Kevin C. Wolfe, Michael J. Mashner, and Gregory S. Chirikjian, "The Banana Distribution Is Gaussian: A Localization Study with Exponential Coordinates," in Robotics: Science and Systems VIII , MIT Press, 2013, pp.265-272.

　特許文献１に記載のようなモンテカルロ法を用いた場合、サンプル数が少ない場合などに評価関数の計算に見落としが発生して、推定された評価関数値が安定せず制御が不安定になるおそれがある。特に、上述したようなロボットの制御においては、例えば１／３０秒程度である制御周期の中で十分な回数シミュレーションを行うことが必要になり、上記問題は顕著になる。その結果、制御精度を向上させることが難しい、という課題が生じている。なお、このような短い制御周期の中で制御精度を向上させることは、例えば、特許文献２に記載の技術でも難しい。

　そこで、本発明の目的は、上述した課題を解決することが可能な計算装置、決定方法、駆動装置、駆動方法、記録媒体を提供することにある。

　かかる目的を達成するため本開示の一形態である計算装置は、
　駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて前記駆動装置が駆動した後の前記駆動装置の状態をシミュレーションする実行部と、
　前記実行部が複数回シミュレーションすることで特定される前記駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定する分析部と、
　前記分析部が選定した結果に基づいて、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値を決定する決定部と、
　を有する
　という構成をとる。

　また、本開示の他の形態である決定方法は、
　情報処理装置が、
　駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて前記駆動装置が駆動した後の前記駆動装置の状態をシミュレーションし、
　複数回シミュレーションすることで特定される前記駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定し、
　選定した結果に基づいて、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値を決定する
　という構成をとる。

　また、本開示の他の形態である記録媒体は、
　情報処理装置に、
　駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて前記駆動装置が駆動した後の前記駆動装置の状態をシミュレーションし、
　複数回シミュレーションすることで特定される前記駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定し、
　選定した結果に基づいて、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値を決定する
　処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体である。

　また、本開示の他の形態である駆動装置は、
　駆動装置に対して入力可能な制御入力の値を用いたシミュレーションの結果に対する主成分分析の結果に基づいて決定された、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値と、前記駆動装置の状態と、に基づいて、前記制御入力の候補に応じた評価値を推定する推定部と、
　前記推定部による推定の結果に基づいて、複数の前記制御入力の候補の中から実際に入力する制御入力を選択する選択部と、
　前記選択部の選択結果に基づいて自装置を駆動させる駆動部と、
　を有する
　という構成をとる。

　また、本開示の他の形態である駆動方法は、
　駆動装置が、
　駆動装置に対して入力可能な制御入力の値を用いたシミュレーションの結果に対する主成分分析の結果に基づいて決定された、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値と、前記駆動装置の状態と、に基づいて、前記制御入力の候補に応じた評価値を推定し、
　推定の結果に基づいて、複数の前記制御入力の候補の中から実際に入力する制御入力を選択し、
　選択の結果に基づいて駆動する
　という構成をとる。

　また、本開示の他の形態である記録媒体は、
　駆動装置に、
　駆動装置に対して入力可能な制御入力の値を用いたシミュレーションの結果に対する主成分分析の結果に基づいて決定された、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値と、前記駆動装置の状態と、に基づいて、前記制御入力の候補に応じた評価値を推定し、
　推定の結果に基づいて、複数の前記制御入力の候補の中から実際に入力する制御入力を選択し、
　選択の結果に基づいて駆動する
　処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体である。

　上述したような各構成によると、精度制御を向上させることが可能な計算装置、決定方法、駆動装置、駆動方法、記録媒体を提供することができる。

本発明の第１の実施形態における制御システムの構成例を示す図である。駆動装置の挙動の一例を示す図である。計算装置の構成例を示すブロック図である。制御入力候補情報の一例を示す図である。シミュレーション結果情報の一例を示す図である。サンプル点情報の一例を示す図である。主成分分析実行部の処理例を説明するための図である。サンプル点選択部の処理例を説明するための図である。サンプル点選択部の処理例を説明するための図である。重み算出部の処理例を説明するための図である。重み算出部の処理例を説明するための図である。シミュレーション結果の一例を示す図である。データ変換部と逆変換部の処理例を説明するための図である。駆動装置の構成例を示すブロック図である。評価例を示す図である。計算装置の動作例を示すフローチャートである。計算装置の他の動作例を示すフローチャートである。駆動装置の動作例を示すフローチャートである。本開示の第２の実施形態における計算装置のハードウェア構成例を示す図である。計算装置の構成例を示すブロック図である。駆動装置の構成例を示すブロック図である。

［第１の実施形態］
　本開示の第１の実施形態について、図１から図１８までを参照して説明する。図１は、制御システム１００の構成例を示す図である。図２は、駆動装置３００の挙動の一例を示す図である。図３は、計算装置２００の構成例を示すブロック図である。図４は、制御入力候補情報２４１の一例を示す図である。図５は、シミュレーション結果情報２４２の一例を示す図である。図６は、サンプル点情報２４３の一例を示す図である。図７は、主成分分析実行部２５２の処理例を説明するための図である。図８、図９は、サンプル点選択部２５３の処理例を説明するための図である。図１０、図１１は、重み算出部２５４の処理例を説明するための図である。図１２は、シミュレーション結果の一例を示す図である。図１３は、データ変換部２５５と逆変換部２５６の処理例を説明するための図である。図１４は、駆動装置３００の構成例を示すブロック図である。図１５は、評価例を示す図である。図１６、図１７は、計算装置２００の動作例を示すフローチャートである。図１８は、駆動装置３００の動作例を示すフローチャートである。

　本開示の第１の実施形態においては、図１で示すように、計算装置２００と駆動装置３００とを有する制御システム１００について説明する。本実施形態の場合、後述するように、計算装置２００は、制御入力の候補それぞれについて予め十分な数のシミュレーションを行ったうえで主成分分析を行って、もっとも寄与率の大きい軸上でサンプル点と重みを決定する。また、駆動装置３００は、駆動制御を実行する際、計算装置２００が決定したサンプル点と重みを用いて評価関数値を評価して、評価結果に基づく駆動制御を行う。

　なお、本実施形態においては、一例として、計算装置２００においてサンプル点や重みの決定を事前に行っておき、計算装置２００における決定の結果を駆動装置３００が有する記憶装置などに予め格納しておく場合について説明する。しかしながら、後述するように、計算装置２００と駆動装置３００とは、駆動装置３００の駆動中も通信可能なよう構成してもよい。換言すると、計算装置２００による決定の結果が駆動装置３００の駆動中などにおいても反映されるように、駆動装置３００の駆動中などにおいて計算装置２００と駆動装置３００とが通信を行うよう構成してもよい。

　また、本実施形態においては、図２で示すように、駆動装置３００は、当該駆動装置３００が向いている方向のみに移動可能な、平面上を移動する二輪移動ロボットであるものとする。図２では、駆動装置３００が向いている方向である丸印の方向に移動可能である一方で、横向きなど駆動装置３００が向いている方向とは異なるバツ印の方向には駆動装置３００が移動できないことを示している。例えば、駆動装置３００には、速度ｖと角速度ωを入力することができる。換言すると、本実施形態における制御入力には、速度ｖや角速度ωを示す値が含まれる。制御入力には、駆動させる時間を示す情報などが含まれてもよい。また、駆動装置３００の状態は、位置（ｘ、ｙ）と駆動装置３００が向いている向きθで定まる。一例として、駆動装置３００は、非特許文献１に記載されているような運動モデルで駆動する。

　ただし、本発明は、上述したような二輪移動ロボットに限らず適用可能である。例えば、駆動装置３００は、横方向など向いている方向以外にも移動可能なよう構成されていてもよいし、３次元方向に移動可能であってもよい。また、駆動装置３００は、ロボットアームなどのその他任意のロボットであってもよい。駆動装置３００が上述したような二輪移動ロボット以外である場合、駆動装置３００に対する制御入力の内容や駆動装置３００の状態は、本発明を適用するロボットの移動方法などに応じて定まるものであってよい。例えば、駆動装置３００に対して、角速度の代わりにまたは角速度とともに、ｘ軸方向速度、ｙ軸方向速度、回転トルクなどの制御入力を入力可能なよう構成してもよいし、駆動装置３００の状態を示す位置にｘ座標やｙ座標の他にｚ座標なども含まれてもよい。

　制御システム１００は、駆動装置３００の駆動を制御するシステムである。図１で示すように、制御システム１００には、例えば、計算装置２００と駆動装置３００とが含まれている。

　図１を参照すると、計算装置２００と駆動装置３００とは、例えば、ネットワークなどを介して、互いに通信可能なよう接続することができる。計算装置２００と駆動装置３００とは、有線により互いに通信可能なよう接続されてもよいし、無線により互いに通信可能なよう接続されてもよい。

　計算装置２００は、駆動装置３００に対して入力する制御入力の候補を評価する際に用いる値を決定する情報処理装置である。例えば、計算装置２００は、制御入力の候補を評価する際に用いる数２で示す式を評価するために用いる値として、複数のシミュレーション結果に基づいて選択されるサンプル点と重みを決定する。
　なお、数２のうちｘはロボットの位置や向きなどのロボットの状態を示しており、ｆ（ｘ）は状態の良さを評価する関数である。また、ｐ（ｘ）は、状態ｘをとる確率密度を示している。

　図３は、計算装置２００の構成例を示している。図３を参照すると、計算装置２００は、主な構成要素として、例えば、操作入力部２１０と、画面表示部２２０と、通信Ｉ／Ｆ（interface）部２３０と、記憶部２４０と、演算処理部２５０と、を有している。

　なお、図３では、１台の情報処理装置を用いて計算装置２００としての機能を実現する場合について例示している。しかしながら、計算装置２００は、例えば、クラウド上に実現されるなど、複数台の情報処理装置を用いて実現されてもよい。また、計算装置２００は、操作入力部や画面表示部を有さないなど上記例示した構成の一部を含まなくてもよいし、上記例示した以外の構成を有してもよい。

　操作入力部２１０は、キーボード、マウスなどの操作入力装置からなる。操作入力部２１０は、計算装置２００を操作する操作者の操作を検出して演算処理部２５０に出力する。

　画面表示部２２０は、ＬＣＤ（Ｌｉｑｕｉｄ　Ｃｒｙｓｔａｌ　Ｄｉｓｐｌａｙ、液晶ディスプレイ）などの画面表示装置からなる。画面表示部２２０は、演算処理部２５０からの指示に応じて、記憶部２４０に格納されている各種情報などを画面表示することができる。

　通信Ｉ／Ｆ部２３０は、データ通信回路などからなる。通信Ｉ／Ｆ部２３０は、通信回線を介して接続された駆動装置３００などの外部装置との間でデータ通信を行う。

　記憶部２４０は、ハードディスクやメモリなどの記憶装置である。記憶部２４０は、演算処理部２５０における各種処理に必要な処理情報やプログラム２４４を記憶する。プログラム２４４は、演算処理部２５０に読み込まれて実行されることにより各種処理部を実現する。プログラム２４４は、通信Ｉ／Ｆ部２３０などのデータ入出力機能を介して外部装置や記録媒体から予め読み込まれ、記憶部２４０に保存されている。記憶部２４０で記憶される主な情報としては、例えば、制御入力候補情報２４１、シミュレーション結果情報２４２、サンプル点情報２４３などがある。

　制御入力候補情報２４１は、駆動装置３００に入力する可能性のある制御入力の候補を示している。例えば、制御入力候補情報２４１には、駆動装置３００の状態が基準点（例えば、ｘ＝０、ｙ＝０、θ＝０）である場合において、駆動装置３００に入力する可能性のある制御入力の候補すべてが含まれる。制御入力候補情報２４１には、入力する可能性のあるすべての制御入力の候補のうち任意の方法で抽出した一部の制御入力の候補のみが含まれてもよい。例えば、制御入力候補情報２４１は、通信Ｉ／Ｆ部２３０を介して外部装置から取得する、操作入力部２１０を用いて入力する、などの方法を用いて予め取得されており、記憶部２４０に格納されている。

　図４は、制御入力候補情報２４１の一例を示している。図４を参照すると、制御入力候補情報２４１には、駆動装置３００に入力する可能性のある制御入力の候補である速度ｖと角速度ωの組み合わせが複数含まれている。例えば、図４の場合、（ｖ^１、ω^１）、…、（ｖ^ｍ、ω^ｍ）というｍ個の速度ｖと角速度ωの組み合わせが含まれている。なお、ｍは任意の値であってよい。

　シミュレーション結果情報２４２は、後述するシミュレーション実行部２５１が駆動装置３００の駆動結果をシミュレーションした結果を示している。例えば、シミュレーション結果情報２４２は、制御入力候補情報２４１が示す制御入力の候補を入力した場合における、駆動後の駆動装置３００の状態を示すシミュレーション結果を制御入力の候補ごとに示している。また、シミュレーション結果情報２４２には、例えば、１秒後と２秒後と３秒後など、駆動装置３００を駆動させた時間が異なる複数のシミュレーション結果を示す情報が含まれる。シミュレーション結果情報２４２には、０．５秒後など任意の時間の間、駆動装置３００を駆動させた場合のシミュレーション結果を示す情報のみが含まれてもよい。例えば、シミュレーション結果情報２４２は、シミュレーション実行部２５１がシミュレーションを実行することなどに応じて更新される。

　後述するように、シミュレーション実行部２５１は、制御入力候補情報２４１が示す制御入力の候補ごとに、複数回シミュレーションを実行する。例えば、シミュレーション実行部２５１は、予め定められた任意の条件を満たすまで、複数回シミュレーションを実行する。また、本実施形態の場合、シミュレーション実行部２５１は、不確かさのある系でシミュレーションを実行する。そのため、シミュレーションを複数回行うと、その度に得られる解軌道が確率的に変動する。その結果、シミュレーション結果情報２４２には、シミュレーションの結果として特定される、駆動後の駆動装置３００の位置（ｘ、ｙ）や向きθなどを示す駆動装置３００の状態を示す情報が複数含まれる。例えば、図５は、ある制御入力の候補についてシミュレーション実行部２５１が複数回シミュレーションすることで特定される、駆動装置３００が１秒間駆動した後の状態分布例を示している。図５で例示する場合、丸印の一つ一つが駆動装置３００の駆動後の状態を示す。つまり、図５ではθの図示が省略されているものの、丸印の一つ一つが駆動後の駆動装置３００の位置（ｘ、ｙ）や向きθを示す情報に対応する。シミュレーション結果情報２４２には、例えば、図５で示す丸印の一つ一つに対応する駆動装置３００の状態を示す情報が含まれる。

　なお、上述したように、シミュレーション結果情報２４２には、制御入力の候補ごとに、駆動装置３００の状態を示す情報が含まれる。また、シミュレーション結果情報２４２には、駆動装置３００を駆動させた時間が異なる複数のシミュレーション結果を示す情報が含まれてよい。換言すると、シミュレーション結果情報２４２には、制御入力の候補や駆動装置３００が駆動した時間に応じた、それぞれの状態分布に対応する駆動装置３００の状態を示す情報が含まれてよい。

　サンプル点情報２４３は、後述するサンプル点選択部２５３がシミュレーション結果情報２４２に基づいて選択するサンプル点を示す情報を含んでいる。ここで、サンプル点は、シミュレーション実行部２５１がシミュレーションの結果として特定する駆動装置３００の状態１つに対応している。換言すると、本実施形態の場合、サンプル点は、位置（ｘ、ｙ）と駆動装置３００が向いている向きθを示す情報を含んでいる。また、サンプル点情報２４３には、後述する重み算出部２５４が算出するサンプル点の重みを示す情報が含まれる。例えば、サンプル点情報２４３は、サンプル点選択部２５３がサンプル点を選択すること、重み算出部２５４がサンプル点に対応する重みを算出すること、逆変換部２５６が逆変換を行うこと、などに応じて更新される。

　図６は、サンプル点情報２４３に含まれる情報の一例を示している。図６を参照すると、サンプル点情報２４３には、制御入力の候補ごとの、サンプル点や重みを示す情報が含まれている。換言すると、サンプル点情報２４３では、制御入力の候補を示す情報と、制御入力の候補を評価する際に用いる値であるサンプル点や重みを示す情報と、が関連付けられている。例えば、図６を参照すると、サンプル点情報２４３には、制御入力の候補が（ｖ^１、ω^１）の場合において、ｎ個のサンプル点と各サンプル点に対応する重みとを示す情報が含まれている。同様に、サンプル点情報２４３には、制御入力の候補（ｖ^ｍ、ω^ｍ）まで各候補に対応する、サンプル点と重みを示す情報が含まれている。なお、図６中のｎは、サンプル点の数に応じた値となる。ｎは任意の値であってよい。

　なお、上述したように、シミュレーション結果情報２４２には、駆動装置３００が駆動した時間に応じた、それぞれの状態分布に対応する駆動装置３００の状態を示す情報が含まれうる。サンプル点情報２４３も、シミュレーション結果情報２４２の場合と同様に、シミュレーション時に駆動装置３００を駆動させた時間ごとに、制御入力の各候補に対応するサンプル点や重みを示す情報が含まれてよい。

　演算処理部２５０は、ＣＰＵ（Central Processing Unit）などの演算装置とその周辺回路を有する。演算処理部２５０は、記憶部２４０からプログラム２４４を読み込んで実行することにより、上記ハードウェアとプログラム２４４とを協働させて各種処理部を実現する。演算処理部２５０で実現される主な処理部としては、例えば、シミュレーション実行部２５１、主成分分析実行部２５２、サンプル点選択部２５３、重み算出部２５４、データ変換部２５５、逆変換部２５６、出力部２５７などがある。なお、後述するように、サンプル点選択部２５３と重み算出部２５４とは、制御入力の候補を評価する際に用いる値であるサンプル点と重みを決定する処理を行う。そのため、サンプル点選択部２５３と重み算出部２５４とにより上記値を決定する決定部が構成されている、ということもできる。

　シミュレーション実行部２５１は、制御入力候補情報２４１が示す制御入力の候補ごとに、駆動装置３００を所定の時間駆動させた後の駆動装置３００の状態をシミュレーションする。例えば、シミュレーション実行部２５１は、制御入力の候補ごとに、予め定められた任意の条件を満たすまで複数回のシミュレーションを実行する。シミュレーション実行部２５１は、駆動装置３００を駆動させた時間が異なる複数種類のシミュレーションを行ってもよい。本実施形態の場合、シミュレーション実行部２５１は、不確かさのある系でシミュレーションを実行する。そのため、シミュレーションを複数回行うと、その度に得られる解軌道が確率的に変動する。また、シミュレーション実行部２５１は、シミュレーションの結果として特定される駆動装置３００の状態を示す情報を、シミュレーション結果情報２４２として記憶部２４０に格納する。

　例えば、シミュレーション実行部２５１は、非特許文献１中の式１６で示すような運動モデルを用いた場合における、駆動装置３００の状態をシミュレーションする。図５で示すように、シミュレーション実行部２５１は、制御入力の各候補において、複数のシミュレーションを実行することで、駆動後の駆動装置３００の状態を複数特定する。なお、非特許文献１中の式１６のうち、ｒω(t)は、上述した速度ｖに対応する。また、ｌは車輪間距離を示している。

　また、非特許文献１中の式１６では、Ｄの部分がばらつきの尺度を表している。ここで、ばらつきの尺度は、例えば、任意の方法で定められてよい。例えば、ばらつきの尺度は、事前に予め定められていてもよいし、駆動装置３００を実際に駆動させる現場の環境などに応じて定められてもよい。

　なお、シミュレーション実行部２５１がシミュレーションを行う際に用いる運動モデルは、上記例示した場合に限定されない。シミュレーション実行部２５１は、上記例示した以外の既知の運動モデルを用いてシミュレーションを行うよう構成してよい。また、本実施形態においては駆動装置３００が二輪移動ロボットである場合について例示するが、上述したように、駆動装置３００は二輪移動ロボット以外であってもよい。駆動装置３００が二輪移動ロボット以外である場合、シミュレーション実行部２５１がシミュレーションを行う際に用いる運動モデルも、駆動装置３００の種類などに応じたものであってよい。

　主成分分析実行部２５２（分析部）は、シミュレーション結果情報２４２が示す、制御入力の候補や駆動時間ごとの状態分布に対して主成分分析を行うことで、最も分散幅の大きくなる主成分軸を選定する。例えば、主成分分析実行部２５２は、上記状態分布における状態（状態データ）のばらつきが最大となるように、状態分布ごとに主成分軸を引く処理を実行する。

　図７は、主成分分析実行部２５２の処理を説明するための図である。図７で示すように、主成分分析実行部２５２は、主成分分析を行うことで、状態分布の中において一例として最も分散幅の大きくなる直線状の主成分軸を選定する。

　なお、本実施形態において、主成分分析実行部２５２は、一例として、分散幅が広い軸、つまり、第１主成分軸を選定する。しかしながら、例えば、状態分布の形状など状態分布の状況に応じて、主成分分析実行部２５２は、第１主成分軸のほかに、分散幅が２番目に大きな第２主成分軸を選定してもよい。同様に、主成分分析実行部２５２は、任意の条件などに応じて、第３主成分軸、第４主成分軸、…、と複数の軸を選定するよう構成してもよい。

　また、一例として、駆動装置３００が３次元空間を自在に移動できるロボットとする場合、駆動装置３００の状態には、位置だけで３次元、向きも３次元（ロール・ピッチ・ヨー）で６次元の情報を含むことになる。このような場合に第１主成分軸のみ選定して１次元に落とすと、情報の欠落が多数生じるおそれがある。そこで、主成分分析実行部２５２は、駆動装置３００の種類などに応じて、複数の軸を選定するよう構成してもよい。例えば、以上のように、主成分分析実行部２５２は、状態分布の状況や駆動装置３００の種類などの条件に応じて、選定する軸の数を選択するよう構成してもよい。

　サンプル点選択部２５３は、主成分軸上の状態データの中から所定の条件を満たすサンプル点を選択する。例えば、サンプル点選択部２５３は、状態分布ごと、つまり、制御入力の候補や駆動時間ごとに、サンプル点を選択する。また、サンプル点選択部２５３は、選択したサンプル点に対応する駆動装置３００の状態を示す情報をサンプル点情報２４３として記憶部２４０に格納する。

　例えば、サンプル点選択部２５３は、主成分軸に向けて状態データを射影する。そして、サンプル点選択部２５３は、軸方向に射影された状態データの標準偏差をσとした際の、－ｋσから＋ｋσまでに相当する点をサンプル点として選択する。例えば、図８は、ｋが３である場合におけるサンプル点選択部２５３による選択処理の一例を示している。図８を参照すると、例えば、サンプル点選択部２５３は、主成分軸上の状態データに応じた点のうち、－３σ、－２σ、－σ、０、σ、２σ、３σそれぞれに対応する状態データの点をサンプル点として選択する。なお、ｋの値は任意であってよい。

　例えば、以上のように、主成分分析実行部２５２とサンプル点選択部２５３とにより、図９で示すように、状態分布の中から主成分分析軸上のサンプル点を選択する。つまり、主成分分析実行部２５２とサンプル点選択部２５３とは、状態分布に含まれる複数の状態データの点の中から最も状態分布の状況を示す主成分分析軸上において所定の条件を満たす点をサンプル点として選択する。

　なお、上述したように、主成分分析実行部２５２が複数の軸を選定する場合がある。このような場合、サンプル点選択部２５３は、複数の軸上のデータ点からサンプル点を選択するよう構成してもよいし、例えば、第１主成分軸と第２主成分軸（または、それ以上）のそれぞれの方向ベクトルによって張られる部分空間からサンプル点を選択するよう構成してもよい。サンプル点選択部２５３がどのような手段でサンプル点を選択するかは、任意の方法により定められてよい。

　重み算出部２５４は、サンプル点選択部２５３が選択したサンプル点に対応する重みを算出する。例えば、重みは、主成分軸上における状態データの分布状況に応じた値を示す。また、重み算出部２５４は、算出した重みを示す情報をサンプル点情報２４３として記憶部２４０に格納する。

　例えば、重み算出部２５４は、サンプル点選択部２５３により軸方向に射影された状態データ点の分布が正規分布であると仮定して、状態データの分布を図１０で示す範囲で積分することで、サンプル点に対応する重みを算出する。つまり、重み算出部２５４は、サンプル点選択部２５３により軸方向に射影された状態データ点の分布に基づいて、サンプル点ごとにサンプル点に対応する範囲で積分することで、各サンプル点に対応する重みを算出する。なお、図１０は、ｋが３である場合について例示している。ｋが３以外である場合、積分する範囲もｋの値に応じたものであってよい。

　また、重み算出部２５４は、状態データ点の数に基づいて重みを算出してもよい。例えば、図１１で示すように、重み算出部２５４は、サンプル点選択部２５３により軸方向に射影された状態データ点の分布に基づいて、各サンプル点の中点で区切った区間内に入る状態データ点の数（つまり、状態の数)を数える。そして、重み算出部２５４は、数えた状態データ点の数を重みとして算出する。

　例えば、重み算出部２５４は、上記例示した方法のいずれかを用いて、サンプル点選択部２５３が選択した各サンプル点に対応する重みを算出する。重み算出部２５４は、上記例示した以外の方法を用いて状態の分布に応じた重みを算出してもよい。

　例えば以上説明したような方法により、計算装置２００はサンプル点と重みを決定する。なお、上述したような方法によると、サンプル点は直線状の主成分軸上に置かれる。そのため、図１２で示すような曲がった状態分布となっている場合、上述したような方法は適さない場合がある。

　そこで、計算装置２００は、図１３で示すように、データ変換部２５５を用いることで状態分布をまっすぐなデータ分布に変換して、変換した状態で主成分分析実行部２５２とサンプル点選択部２５３とにより主成分分析軸上のサンプル点を選択することができる。一例として、非特許文献２には、２次元平面上のロボットについての座標変換方法が記載されている。例えば、データ変換部２５５は、非特許文献２に記載されているような方法で非線形変換を行うことで、全体として曲がった形状の状態分布をまっすぐな形状に変換してよい。また、サンプル点を選択した後、逆変換部２５６は、変換部２５５の逆の処理を行うことなどにより、全体としてまっすぐな形状を元の曲がった状態分布に逆変換する。これにより、計算装置２００は、曲がった状態分布に対応した適切な形でサンプル点を選択することができる。なお、データ変換部２５５は、上記例示した以外の既知の方法を用いて、サンプル点の選択に適さない形状の状態分布を主成分分析実行部２５２とサンプル点選択部２５３とによるサンプル点の選択に適した形状に変換するよう構成してもよい。

　なお、データ変換部２５５と逆変換部２５６とによる処理を行うか否かは、任意の方法で決定してよい。例えば、計算装置２００は、データ変換部２５５と逆変換部２５６とによる処理を行わない場合と行う場合の両方でサンプル点を選択して、より適切な数を選択できたサンプル点を選択するなどより適切であると評価可能な選択結果を採用するよう構成してもよい。例えば、計算装置２００は、データ変換部２５５と逆変換部２５６とによる処理を行わない場合で予め定められた数のサンプル点を抽出できなかった場合などにデータ変換部２５５と逆変換部２５６とによる処理を行うよう構成してもよい。計算装置２００は、状態分布の様子が所定の条件を満たす、または、満たさない場合に、データ変換部２５５と逆変換部２５６とによる処理を行うよう構成してもよい。計算装置２００は、上記例示した以外の条件に基づいて、データ変換部２５５と逆変換部２５６とによる処理を行うか否か判断するよう構成してもよい。

　出力部２５７は、サンプル点情報２４３などを出力する。例えば、出力部２５７は、サンプル点情報２４３などの記憶部２４０に格納された情報を画面表示部２２０上に表示させたり、通信Ｉ／Ｆ部２３０を介して駆動装置３００などの外部装置に対して送信したりする。

　駆動装置３００は、計算装置２００が決定したサンプル点や重みなどを用いて制御入力の候補を評価して、評価した結果に応じて駆動するロボットである。上述したように、本実施形態において、駆動装置３００は、当該駆動装置３００が向いている方向のみに移動可能な、平面上を移動する二輪移動ロボットである。駆動装置３００は、例示した以外であってもよい。

　図１４は、駆動装置３００の構成例を示している。図１４を参照すると、駆動装置３００は、主な構成要素として、例えば、通信Ｉ／Ｆ部３１０と、記憶部３２０と、演算処理部３３０と、を有している。

　通信Ｉ／Ｆ部３１０は、データ通信回路などからなる。通信Ｉ／Ｆ部３１０は、通信回線を介して接続された計算装置２００などの外部装置との間でデータ通信を行う。

　記憶部３２０は、ハードディスクやメモリなどの記憶装置である。記憶部３２０は、演算処理部３３０における各種処理に必要な処理情報やプログラム３２３を記憶する。プログラム３２３は、演算処理部３３０に読み込まれて実行されることにより各種処理部を実現する。プログラム３２３は、通信Ｉ／Ｆ部３１０などのデータ入出力機能を介して外部装置や記録媒体から予め読み込まれ、記憶部３２０に保存されている。記憶部３２０で記憶される主な情報としては、例えば、制御入力候補情報３２１、サンプル点情報３２２などがある。

　制御入力候補情報３２１は、駆動装置３００に入力する可能性のある制御入力の候補を示している。制御入力候補情報３２１には、計算装置２００に記憶された制御入力候補情報に含まれる制御入力の候補のうち少なくとも一部が含まれる。例えば、制御入力候補情報３２１は、通信Ｉ／Ｆ部３１０を介して計算装置２００などの外部装置から予め取得されており、記憶部３２０に格納されている。

　サンプル点情報３２２は、計算装置２００が有するサンプル点情報２４３と同様に、上述したサンプル点選択部２５３がシミュレーション結果情報２４２に基づいて選択するサンプル点を示す情報を含んでいる。例えば、サンプル点情報３２２では、制御入力の候補を示す情報と、制御入力の候補を評価する際に用いる値であるサンプル点や重みを示す情報と、が関連付けられている。サンプル点情報３２２には、計算装置２００に記憶されたサンプル点情報２４３に含まれるサンプル点や重みのうち少なくとも一部が含まれる。例えば、サンプル点情報３２２は、通信Ｉ／Ｆ部３１０を介して計算装置２００などの外部装置から予め取得されており、記憶部３２０に格納されている。

　演算処理部３３０は、ＣＰＵなどの演算装置とその周辺回路を有する。演算処理部３３０は、記憶部３２０からプログラム３２３を読み込んで実行することにより、上記ハードウェアとプログラム３２３とを協働させて各種処理部を実現する。演算処理部３３０で実現される主な処理部としては、例えば、サンプル点抽出部３３１、評価値推定部３３２、選択部３３３、駆動部３３４などがある。

　サンプル点抽出部３３１は、サンプル点情報３２２などに基づいて、評価対象となる制御入力に応じたサンプル点などを抽出する。例えば、サンプル点抽出部３３１は、駆動装置３００に入力する可能性のある制御入力の候補に応じた、サンプル点や重みを抽出する。

　例えば、サンプル点抽出部３３１は、ロボットの状態などに基づいて入力する可能性のある制御入力の候補を特定する。サンプル点抽出部３３１は、外部装置などから入力された目標地点や移動させたい方向などの制御の内容に応じて入力する可能性のある制御入力の候補を特定するなど、任意の方法を用いて入力する可能性のある制御入力の候補を特定してよい。また、サンプル点抽出部３３１は、サンプル点情報３２２を参照して、特定した制御入力の候補に対応する、サンプル点と重みを抽出する。例えば、サンプル点抽出部３３１は、複数の候補に対応するサンプル点と重みを抽出することができる。

　評価値推定部３３２は、サンプル点抽出部３３１が抽出したサンプル点や重みに基づいて、入力する可能性のある制御入力の各候補に対応する評価値を推定する。

　例えば、評価値推定部３３２は、駆動装置３００の位置（ｘ、ｙ）や向きθなどの状態と、サンプル点抽出部３３１が抽出したサンプル点や重みなどと、に基づいて、制御入力の各候補に対応する評価値を推定する。一例として、制御入力の候補（ｖ^ｍ、ω^ｍ）を評価する際、評価値推定部３３２は、数３で示す式を用いることで、数２で示す式を近似的に評価する。
　なお、数３中のｘ_ｉは駆動装置３００の状態を示している。また、x^mがサンプル点の値を示しており、p^mが重みの値を示している。ｊには、１からｎまでの値が入る。なお、ｍは評価対象となる制御入力の候補に応じた値になる。

　選択部３３３は、評価値推定部３３２による評価結果に基づいて、入力する可能性のある制御入力の候補のうち実際に入力する制御入力を選択する。例えば、選択部３３３は、制御入力の各候補に対応する評価結果を比較して、最も望ましい評価値に対応する制御入力の候補を実際に入力する制御入力の候補として選択する。

　例えば、選択部３３３は、制御入力の候補全部または一部について、制御入力の各候補に対して得られた評価結果を比較して、最大（評価関数を損失として定義した場合には最小）の評価値を与える制御入力の候補を実際に入力する制御入力として選択する。例えば、速度として低速（０．１）もしくは高速（１．０）の２パターン、角速度として左旋回（０．３）、直進（０）、右旋回（－０．３）の３パターンが制御入力の候補であった場合、すべての速度と角速度の組み合わせは２×３で６通りある。そこで、選択部３３３は、上記６通りの入力それぞれに対して評価値推定部３３２により得られた評価結果を比較して、最大の評価値を与えた制御入力の候補を実際に入力する制御入力として選択する。選択部３３３は、上記例示した以外の方法を用いて、より望ましい制御入力の候補を実際に入力する制御入力として選択するよう構成してもよい。

　駆動部３３４は、選択部３３３による選択の結果に基づいて、駆動装置３００を実際に駆動させる。換言すると、駆動部３３４は、選択部３３３が選択した制御入力に応じた速度ｖ、角速度ωで、制御入力に対応する時間の間、駆動装置３００を駆動させる。

　以上が、駆動装置３００の構成例である。

　ここで、図１５は、本開示により選択される制御入力に対応する評価値の一例を示している。具体的に、図１５では、速度ｖとして０．５の値を入力するとともに角速度ωの値として０を入力した場合における正解値と評価値との一例を示している。また、図１５では、本開示との間の比較例として、各モンテカルロサンプル数を用いた場合におけるモンテカルロ法で推定される推定値を示している。モンテカルロ法を用いた場合、図１５で示すエラーバーの大きさを標準偏差とする程度にばらけることになる。図１５で示すように、バラツキの大きさはモンテカルロサンプル数が少ないほど大きくなり、特に本開示で一例として説明したサンプル数が７となる場合、バラツキが非常に大きくなることが分かる。一方、本開示で説明した方法によると、精度よく正解値に近い値を推定できていることが分かる。

　続いて、図１６から図１８までを参照して、計算装置２００と駆動装置３００の動作例について説明する。まず、図１６、図１７を参照して、計算装置２００の動作例について説明する。

　図１６は、計算装置２００の動作例を示すフローチャートである。図１６を参照すると、シミュレーション実行部２５１は、制御入力候補情報２４１が示す制御入力の候補ごとに、駆動装置３００を所定の時間駆動させた後の駆動装置３００の状態をシミュレーションする（ステップＳ１０１）。例えば、シミュレーション実行部２５１は、制御入力の候補ごとに、予め定められた任意の条件を満たすまで複数回のシミュレーションを実行する。シミュレーション実行部２５１は、駆動装置３００を駆動させた時間が異なる複数種類のシミュレーションを行ってもよい。

　主成分分析実行部２５２は、シミュレーション実行部２５１によるシミュレーションの結果に基づいて、制御入力の候補や駆動時間ごとの状態分布に対して主成分分析を行うことで、一例として最も分散幅の大きくなる主成分軸を選定する（ステップＳ１０２）。

　サンプル点選択部２５３は、主成分軸上の状態データの中から所定の条件を満たすサンプル点を選択する（ステップＳ１０３）。例えば、サンプル点選択部２５３は、状態分布ごと、つまり、制御入力の候補や駆動時間ごとに、サンプル点を選択する。

　重み算出部２５４は、サンプル点選択部２５３が選択したサンプル点の重みを算出する（ステップＳ１０４）。例えば、重み算出部２５４は、主成分軸上における状態データの分布状況に応じて、各サンプル点に対応する重みを算出する。

　サンプル点選択部２５３は、選択したサンプル点を記憶部２４０に格納する。また、重み算出部２５４は、算出した重みを記憶部２４０に格納する（ステップＳ１０５）。ステップＳ１０５の処理は、ステップＳ１０３、ステップＳ１０４それぞれの処理の後に行われてよい。

　例えば、以上のような動作により、計算装置２００はサンプル点と重みを決定する。計算装置２００が決定したサンプル点と重みを示す情報は、例えば、任意のタイミングで駆動装置３００などに対して出力することができる。

　また、図１７は、計算装置２００の他の動作例を示すフローチャートである。図１７を参照すると、データ変換部２５５は、ステップＳ１０１の処理の後、任意の方法で非線形変換を行うことで、全体として曲がった形状の状態分布をまっすぐな形状に変換する（ステップＳ２０１）。

　ステップＳ２０１の処理の後、ステップＳ１０２からステップＳ１０４までの処理が行われる。ステップＳ１０４の処理の後、逆変換部２５６は、データ変換部２５５の逆の処理を行うことで、全体としてまっすぐな形状を元の曲がった状態分布に逆変換する（ステップＳ２０２）。その後、逆変換部２５６は、逆変換により元の曲がった状態分布に対応したサンプル点を記憶部２４０に格納する（ステップＳ２０３）。

　なお、上述したように、計算装置２００は図１６で例示した処理と図１７で例示した処理のいずれを実行するかは、任意の方法で選択されてよい。計算装置２００は、図１６で例示した処理と図１７で例示した処理の両方を行うよう構成してもよい。その場合、計算装置２００は、図１６の処理結果と図１７の処理結果のいずれを採用するか、任意の方法で決定してよい。

　次に、図１８を参照して駆動装置３００の動作例について説明する。図１８は、駆動装置３００の動作例を示すフローチャートである。図１８を参照すると、サンプル点抽出部３３１は、サンプル点情報３２２などに基づいて、評価対象となる制御入力に応じたサンプル点などを抽出する（ステップＳ３０１）。例えば、サンプル点抽出部３３１は、駆動装置３００に入力する可能性のある制御入力の候補に応じた、サンプル点や重みを抽出する。

　評価値推定部３３２は、サンプル点抽出部３３１が抽出したサンプル点や重みに基づいて、入力する可能性のある制御入力の各候補に対応する評価値を推定する（ステップＳ３０２）。例えば、評価値推定部３３２は、駆動装置３００の位置（ｘ、ｙ）や向きθなどの状態と、サンプル点抽出部３３１が抽出したサンプル点や重みなどと、に基づいて、制御入力の各候補に対応する評価値を推定する。

　選択部３３３は、評価値推定部３３２による評価結果に基づいて、入力する可能性のある制御入力の候補のうち実際に入力する制御入力を選択する（ステップＳ３０３）。選択部３３３は、任意の方法を用いて、最も望ましい評価値に対応する制御入力を選択してよい。

　駆動部３３４は、選択部３３３による選択の結果に基づいて、駆動装置３００を実際に駆動させる（ステップＳ３０４）。これにより、駆動装置３００は、選択部３３３による選択に応じて動作することになる。

　以上が、駆動装置３００の動作例である。

　このように、計算装置２００は、シミュレーション実行部２５１と主成分分析実行部２５２とサンプル点選択部２５３とを有している。このような構成によると、サンプル点選択部２５３は、主成分分析実行部２５２がシミュレーション実行部２５１によるシミュレーションの結果に基づいて選定した主成分軸上の状態データの中から、所定の条件を満たす状態データであるサンプル点を選択することができる。その結果、駆動装置３００は、サンプル点選択部２５３が選択したサンプル点に基づく評価値の推定を行うことが可能となる。これにより、駆動装置３００がより精度よく制御入力候補の評価を行うことが可能となり、制御精度を向上させることが可能となる。

　また、本実施形態で説明した方法によると、事前に計算装置２００が決定したサンプル点などを用いて駆動装置３００による推定を行う。このような事前の計算結果を用いることで、実際に制御入力の候補を評価する際の計算コストを抑制することができる。その結果、より高精度、かつ、より高速に制御入力の候補を評価することができる。

　なお、本実施形態においては、計算装置２００においてサンプル点や重みの決定を事前に行っておき、計算装置２００における決定の結果を駆動装置３００が有する記憶装置などに予め格納しておくとした。しかしながら、上述したように、計算装置２００と駆動装置３００とは、駆動装置３００の駆動中も通信可能なよう構成してもよい。例えば、計算装置２００は、駆動装置３００の駆動中もシミュレーション実行やサンプル点の選択などの処理を行って、処理の結果に基づくサンプル点情報３２２の更新情報などを駆動装置３００に対して送信するよう構成してもよい。この場合、駆動装置３００は、新たに制御入力の候補を評価する場合などにおいて、受信した更新情報などに応じて更新されたサンプル点情報３２２などに基づく評価を行うよう構成してよい。

　また、制御システム１００の構成は、本開示で例示した場合に限定されない。例えば、計算装置２００が有する機能のうちの少なくとも一部を駆動装置３００が有していてもよい。例えば、駆動装置３００が計算装置２００としての機能をすべて有する場合などにおいて、制御システム１００は計算装置２００を有さなくてもよい。

［第２の実施形態］
　次に、本開示の第２の実施形態について、図１９から図２１までを参照して説明する。図１９は、計算装置４００のハードウェア構成例を示す図である。図２０は、計算装置４００の構成例を示すブロック図である。図２１は、駆動装置５００の構成例を示すブロック図である。

　本開示の第２の実施形態においては、駆動装置に対して入力可能な制御入力の値に基づいて、制御入力の候補を評価する際に用いる値を決定する情報処理装置である計算装置４００について説明する。また、計算装置４００が決定した値を用いた評価を行って評価結果に基づく選択を行う駆動装置５００について説明する。

　図１９は、計算装置４００のハードウェア構成例を示している。図１９を参照すると、計算装置４００は、一例として、以下のようなハードウェア構成を有している。
　・ＣＰＵ（Ｃｅｎｔｒａｌ　Ｐｒｏｃｅｓｓｉｎｇ　Ｕｎｉｔ）４０１（演算装置）
　・ＲＯＭ（Ｒｅａｄ　Ｏｎｌｙ　Ｍｅｍｏｒｙ）４０２（記憶装置）
　・ＲＡＭ（Ｒａｎｄｏｍ　Ａｃｃｅｓｓ　Ｍｅｍｏｒｙ）４０３（記憶装置）
　・ＲＡＭ４０３にロードされるプログラム群４０４
　・プログラム群４０４を格納する記憶装置４０５
　・情報処理装置外部の記録媒体４１０の読み書きを行うドライブ装置４０６
　・情報処理装置外部の通信ネットワーク４１１と接続する通信インタフェース４０７
　・データの入出力を行う入出力インタフェース４０８
　・各構成要素を接続するバス４０９

　また、計算装置４００は、プログラム群４０４をＣＰＵ４０１が取得して当該ＣＰＵ４０１が実行することで、図２０に示す実行部４２１と分析部４２２と決定部４２３としての機能を実現することができる。なお、プログラム群４０４は、例えば、予め記憶装置４０５やＲＯＭ４０２に格納されており、必要に応じてＣＰＵ４０１がＲＡＭ４０３などにロードして実行する。また、プログラム群４０４は、通信ネットワーク４１１を介してＣＰＵ４０１に供給されてもよいし、予め記録媒体４１０に格納されており、ドライブ装置４０６が該プログラムを読み出してＣＰＵ４０１に供給してもよい。

　なお、図１９は、計算装置４００のハードウェア構成例を示している。計算装置４００のハードウェア構成は上述した場合に限定されない。例えば、計算装置４００は、ドライブ装置４０６を有さないなど、上述した構成の一部から構成されてもよい。

　実行部４２１は、駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて駆動装置が駆動した後の駆動装置の状態をシミュレーションする。なお、駆動装置の状態には、駆動装置の位置や向きを示す情報などが含まれうる。

　分析部４２２は、実行部４２１が複数回シミュレーションすることで特定される駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定する。

　決定部４２３は、分析部４２２が選定した結果に基づいて、駆動装置に対して入力する制御入力の候補を評価する際に用いる値を決定する。例えば、決定部４２３は、制御入力の候補を評価する際に用いる値として、サンプル点や重みを決定する。

　このように、計算装置４００は、実行部４２１と分析部４２２と決定部４２３とを有している。このような構成によると、決定部４２３は、実行部４２１によるシミュレーション結果を用いて分析部４２２が選定した結果に基づいて、制御入力の候補を評価する際に用いる値を決定することができる。その結果、駆動装置は、決定部４２３が決定した値を用いた評価を行うことができる。これにより、制御精度を向上させることが可能となる。また、上記構成によると、駆動装置は、例えば、予め決定された値を用いて評価を行うことができる。その結果、より高速に評価を行うことができる。

　なお、上述した計算装置４００は、当該計算装置４００などの情報処理装置に所定のプログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、計算装置４００などの情報処理装置に、駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて駆動装置が駆動した後の駆動装置の状態をシミュレーションし、複数回シミュレーションすることで特定される駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定し、選定した結果に基づいて、駆動装置に対して入力する制御入力の候補を評価する際に用いる値を決定する、処理を実現するためのプログラムである。

　また、上述した計算装置４００などの情報処理装置により実行される決定方法は、計算装置４００などの情報処理装置が、駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて駆動装置が駆動した後の駆動装置の状態をシミュレーションし、複数回シミュレーションすることで特定される駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定し、選定した結果に基づいて、駆動装置に対して入力する制御入力の候補を評価する際に用いる値を決定する、という方法である。

　上述した構成を有する、プログラム、又は、プログラムを記録したコンピュータが読み取り可能な記録媒体、又は、決定方法であっても、上述した計算装置４００と同様の作用・効果を奏するので、上述した本発明の目的を達成することができる。

　また、本発明の目的は、推定部５２１と選択部５２２とを有する駆動装置５００によっても達成することができる。例えば、駆動装置５００は、図１９を参照して説明した計算装置４００が有するハードウェア構成と同様の構成を有することができる。例えば、駆動装置５００は、計算装置４００の場合と同様には、プログラム群をＣＰＵが取得して当該ＣＰＵが実行することで、図２１に示す推定部５２１と選択部５２２としての機能を実現することができる。計算装置４００の場合と同様に、駆動装置５００のハードウェア構成は、図１９で示す場合に限定されず様々な変形例が採用されてよい。

　推定部５２１は、駆動装置に対して入力可能な制御入力の値を用いたシミュレーションの結果に対する主成分分析の結果に基づいて決定された、駆動装置に対して入力する制御入力の候補を評価する際に用いる値と、駆動装置の状態と、に基づいて、制御入力の候補に応じた評価値を推定する。例えば、制御入力の候補を評価する際に用いる値は、計算装置４００などの外部装置などにより予め決定されている。

　選択部５２２は、推定部５２１による推定の結果に基づいて、複数の制御入力の候補の中から実際に入力する制御入力を選択する。選択部５２２は、任意の方法を用いて上記選択を行ってよい。

　駆動部５２３は、選択部５２２の選択結果に基づいて自装置を駆動させる。

　このように、駆動装置５００は、推定部５２１と選択部５２２と駆動部５２３とを有している。このような構成によると、選択部５２２は、推定部５２１による推定の結果に基づいて、複数の制御入力の候補の中から実際に入力する制御入力を選択することができる。また、駆動部５２３は、選択部５２２の選択結果に基づいて自装置を駆動させることができる。その結果、として、制御精度を向上させることができる。

　なお、上述した駆動装置５００は、当該駆動装置５００などの情報処理装置に所定のプログラムが組み込まれることで実現できる。具体的に、本発明の他の形態であるプログラムは、駆動装置５００などの情報処理装置に、駆動装置に対して入力可能な制御入力の値を用いたシミュレーションの結果に対する主成分分析の結果に基づいて決定された、駆動装置に対して入力する制御入力の候補を評価する際に用いる値と、駆動装置の状態と、に基づいて、制御入力の候補に応じた評価値を推定し、推定の結果に基づいて、複数の制御入力の候補の中から実際に入力する制御入力を選択する、処理を実現するためのプログラムである。

　また、上述した駆動装置５００などの情報処理装置により実行される駆動方法は、駆動装置に対して入力可能な制御入力の値を用いたシミュレーションの結果に対する主成分分析の結果に基づいて決定された、駆動装置に対して入力する制御入力の候補を評価する際に用いる値と、駆動装置の状態と、に基づいて、制御入力の候補に応じた評価値を推定し、推定の結果に基づいて、複数の制御入力の候補の中から実際に入力する制御入力を選択する、という方法である。

　上述した構成を有する、プログラム、又は、プログラムを記録したコンピュータが読み取り可能な記録媒体、又は、駆動方法であっても、上述した駆動装置５００と同様の作用・効果を奏するので、上述した本発明の目的を達成することができる。

　＜付記＞
　上記実施形態の一部又は全部は、以下の付記のようにも記載されうる。以下、本発明における計算装置や駆動装置などの概略を説明する。但し、本発明は、以下の構成に限定されない。

（付記１）
　駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて前記駆動装置が駆動した後の前記駆動装置の状態をシミュレーションする実行部と、
　前記実行部が複数回シミュレーションすることで特定される前記駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定する分析部と、
　前記分析部が選定した結果に基づいて、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値を決定する決定部と、
　を有する
　計算装置。
（付記２）
　付記１に記載の計算装置であって、
　前記決定部は、前記制御入力の候補を評価する際に用いる値として、前記駆動装置の状態を示すサンプル点を前記主成分軸上の状態の中から複数選択する
　計算装置。
（付記３）
　付記２に記載の計算装置であって、
　前記決定部は、前記サンプル点を選択するとともに、選択した前記サンプル点に対応する、前記主成分軸上における状態の分布状況に応じた重みを算出する
　計算装置。
（付記４）
　付記３に記載の計算装置であって、
　前記決定部は、前記駆動装置に対して入力する前記制御入力の候補に応じた評価値を推定する際に用いる値として、前記サンプル点と前記重みとを算出する
　計算装置。
（付記５）
　付記１から付記４までのうちのいずれか１項に記載の計算装置であって、
　前記決定部は、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値として、数４で示す式を近似的に評価する際に用いる値を決定する
　計算装置。
（付記６）
　付記１から付記５までのうちのいずれか１項に記載の計算装置であって、
　前記実行部が複数回シミュレーションすることで特定される前記駆動装置の状態分布に対して所定の変換処理を行うデータ変換部を有し、
　前記分析部は、前記データ変換部による変換の結果に基づいて前記主成分軸を選定する
　計算装置。
（付記７）
　付記１から付記６までのうちのいずれか１項に記載の計算装置であって、
　前記決定部が決定した値を駆動装置に対して出力する出力部を有する
　計算装置。
（付記８）
　情報処理装置が、
　駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて前記駆動装置が駆動した後の前記駆動装置の状態をシミュレーションし、
　複数回シミュレーションすることで特定される前記駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定し、
　選定した結果に基づいて、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値を決定する
　決定方法。
（付記９）
　情報処理装置に、
　駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて前記駆動装置が駆動した後の前記駆動装置の状態をシミュレーションし、
　複数回シミュレーションすることで特定される前記駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定し、
　選定した結果に基づいて、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値を決定する
　処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
（付記１０）
　駆動装置に対して入力可能な制御入力の値を用いたシミュレーションの結果に対する主成分分析の結果に基づいて決定された、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値と、前記駆動装置の状態と、に基づいて、前記制御入力の候補に応じた評価値を推定する推定部と、
　前記推定部による推定の結果に基づいて、複数の前記制御入力の候補の中から実際に入力する制御入力を選択する選択部と、
　前記選択部の選択結果に基づいて自装置を駆動させる駆動部と、
　を有する
　駆動装置。
（付記１１）
　付記１０に記載の駆動装置であって、
　制御入力の候補を示す情報と、前記制御入力の候補を評価する際に用いる値と、を関連付けた情報を記憶する記憶部と、
　前記記憶部が記憶する情報の中から評価対象となる制御入力の候補に応じた値を抽出する抽出部と、を有し、
　前記推定部は、前記抽出部が抽出した値と、前記駆動装置の状態と、に基づいて、前記評価値を推定する
　駆動装置。
（付記１２）
　付記１１に記載の駆動装置であって、
　前記記憶部には、駆動装置に対して入力可能な制御入力の値に基づいて制御入力の候補を評価する際に用いる値を決定する計算装置により予め決定された値が、前記計算装置から予め取得されて記憶されている
　駆動装置。
（付記１３）
　付記１０から付記１２までのうちのいずれか１項に記載の駆動装置であって、
　前記制御入力の候補を評価する際に用いる値は、前記駆動装置の状態を示すサンプル点を示す情報と、前記サンプル点に対応する重みを示す情報と、を含んでいる
　駆動装置。
（付記１４）
　付記１３に記載の駆動装置であって、
　前記推定部は、前記サンプル点と前記重みとを用いて、下記数５で示す式を解くことで前記評価値を推定する
　駆動装置。
（付記１５）
　駆動装置が、
　駆動装置に対して入力可能な制御入力の値を用いたシミュレーションの結果に対する主成分分析の結果に基づいて決定された、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値と、前記駆動装置の状態と、に基づいて、前記制御入力の候補に応じた評価値を推定し、
　推定の結果に基づいて、複数の前記制御入力の候補の中から実際に入力する制御入力を選択し、
　選択の結果に基づいて駆動する
　駆動方法。
（付記１６）
　駆動装置に、
　駆動装置に対して入力可能な制御入力の値を用いたシミュレーションの結果に対する主成分分析の結果に基づいて決定された、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値と、前記駆動装置の状態と、に基づいて、前記制御入力の候補に応じた評価値を推定し、
　推定の結果に基づいて、複数の前記制御入力の候補の中から実際に入力する制御入力を選択し、
　選択の結果に基づいて駆動する
　処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。

　以上、上記各実施形態を参照して本願発明を説明したが、本願発明は、上述した実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明の範囲内で当業者が理解しうる様々な変更をすることができる。

１００　制御システム
２００　計算装置
２１０　操作入力部
２２０　画面表示部
２３０　通信Ｉ／Ｆ部
２４０　記憶部
２４１　制御入力候補情報
２４２　シミュレーション結果情報
２４３　サンプル点情報
２４４　プログラム
２５０　演算処理部
２５１　シミュレーション実行部
２５２　主成分分析実行部
２５３　サンプル点選択部
２５４　重み算出部
２５５　データ変換部
２５６　逆変換部
２５７　出力部
３００　駆動装置
３１０　通信Ｉ／Ｆ部
３２０　記憶部
３２１　制御入力候補情報
３２２　サンプル点情報
３２３　プログラム
３３０　演算処理部
３３１　サンプル点抽出部
３３２　評価値推定部
３３３　選択部
３３４　駆動部
４００　計算装置
４０１　ＣＰＵ
４０２　ＲＯＭ
４０３　ＲＡＭ
４０４　プログラム群
４０５　記憶装置
４０６　ドライブ装置
４０７　通信インタフェース
４０８　入出力インタフェース
４０９　バス
４１０　記録媒体
４１１　通信ネットワーク
４２１　実行部
４２２　分析部
４２３　決定部
５００　駆動装置
５２１　推定部
５２２　選択部
５２３　駆動部

Claims

　駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて前記駆動装置が駆動した後の前記駆動装置の状態をシミュレーションする実行部と、
　前記実行部が複数回シミュレーションすることで特定される前記駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定する分析部と、
　前記分析部が選定した結果に基づいて、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値を決定する決定部と、
　を有する
　計算装置。
　請求項１に記載の計算装置であって、
　前記決定部は、前記制御入力の候補を評価する際に用いる値として、前記駆動装置の状態を示すサンプル点を前記主成分軸上の状態の中から複数選択する
　計算装置。
　請求項２に記載の計算装置であって、
　前記決定部は、前記サンプル点を選択するとともに、選択した前記サンプル点に対応する、前記主成分軸上における状態の分布状況に応じた重みを算出する
　計算装置。
　請求項３に記載の計算装置であって、
　前記決定部は、前記駆動装置に対して入力する前記制御入力の候補に応じた評価値を推定する際に用いる値として、前記サンプル点と前記重みとを算出する
　計算装置。
　請求項１から請求項４までのうちのいずれか１項に記載の計算装置であって、
　前記決定部は、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値として、数１で示す式を近似的に評価する際に用いる値を決定する
　計算装置。
　請求項１から請求項５までのうちのいずれか１項に記載の計算装置であって、
　前記実行部が複数回シミュレーションすることで特定される前記駆動装置の状態分布に対して所定の変換処理を行うデータ変換部を有し、
　前記分析部は、前記データ変換部による変換の結果に基づいて前記主成分軸を選定する
　計算装置。
　請求項１から請求項６までのうちのいずれか１項に記載の計算装置であって、
　前記決定部が決定した値を駆動装置に対して出力する出力部を有する
　計算装置。
　情報処理装置が、
　駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて前記駆動装置が駆動した後の前記駆動装置の状態をシミュレーションし、
　複数回シミュレーションすることで特定される前記駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定し、
　選定した結果に基づいて、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値を決定する
　決定方法。
　情報処理装置に、
　駆動装置に対して入力可能な制御入力の値に基づいて、当該制御入力に応じて前記駆動装置が駆動した後の前記駆動装置の状態をシミュレーションし、
　複数回シミュレーションすることで特定される前記駆動装置の状態分布に対して主成分分析を行うことで主成分軸を選定し、
　選定した結果に基づいて、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値を決定する
　処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。
　駆動装置に対して入力可能な制御入力の値を用いたシミュレーションの結果に対する主成分分析の結果に基づいて決定された、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値と、前記駆動装置の状態と、に基づいて、前記制御入力の候補に応じた評価値を推定する推定部と、
　前記推定部による推定の結果に基づいて、複数の前記制御入力の候補の中から実際に入力する制御入力を選択する選択部と、
　前記選択部の選択結果に基づいて自装置を駆動させる駆動部と、
　を有する
　駆動装置。
　請求項１０に記載の駆動装置であって、
　制御入力の候補を示す情報と、前記制御入力の候補を評価する際に用いる値と、を関連付けた情報を記憶する記憶部と、
　前記記憶部が記憶する情報の中から評価対象となる制御入力の候補に応じた値を抽出する抽出部と、を有し、
　前記推定部は、前記抽出部が抽出した値と、前記駆動装置の状態と、に基づいて、前記評価値を推定する
　駆動装置。
　請求項１１に記載の駆動装置であって、
　前記記憶部には、駆動装置に対して入力可能な制御入力の値に基づいて制御入力の候補を評価する際に用いる値を決定する計算装置により予め決定された値が、前記計算装置から予め取得されて記憶されている
　駆動装置。
　請求項１０から請求項１２までのうちのいずれか１項に記載の駆動装置であって、
　前記制御入力の候補を評価する際に用いる値は、前記駆動装置の状態を示すサンプル点を示す情報と、前記サンプル点に対応する重みを示す情報と、を含んでいる
　駆動装置。
　請求項１３に記載の駆動装置であって、
　前記推定部は、前記サンプル点と前記重みとを用いて、下記数１で示す式を解くことで前記評価値を推定する
　駆動装置。
　駆動装置が、
　駆動装置に対して入力可能な制御入力の値を用いたシミュレーションの結果に対する主成分分析の結果に基づいて決定された、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値と、前記駆動装置の状態と、に基づいて、前記制御入力の候補に応じた評価値を推定し、
　推定の結果に基づいて、複数の前記制御入力の候補の中から実際に入力する制御入力を選択し、
　選択の結果に基づいて駆動する
　駆動方法。
　駆動装置に、
　駆動装置に対して入力可能な制御入力の値を用いたシミュレーションの結果に対する主成分分析の結果に基づいて決定された、前記駆動装置に対して入力する前記制御入力の候補を評価する際に用いる値と、前記駆動装置の状態と、に基づいて、前記制御入力の候補に応じた評価値を推定し、
　推定の結果に基づいて、複数の前記制御入力の候補の中から実際に入力する制御入力を選択し、
　選択の結果に基づいて駆動する
　処理を実現するためのプログラムを記録した、コンピュータが読み取り可能な記録媒体。