JPWO2019167374A1 - 情報処理装置および情報処理方法 - Google Patents

情報処理装置および情報処理方法 Download PDF

Info

Publication number
JPWO2019167374A1
JPWO2019167374A1 JP2020502813A JP2020502813A JPWO2019167374A1 JP WO2019167374 A1 JPWO2019167374 A1 JP WO2019167374A1 JP 2020502813 A JP2020502813 A JP 2020502813A JP 2020502813 A JP2020502813 A JP 2020502813A JP WO2019167374 A1 JPWO2019167374 A1 JP WO2019167374A1
Authority
JP
Japan
Prior art keywords
motion
information processing
command value
autonomous
control command
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2020502813A
Other languages
English (en)
Other versions
JP7207393B2 (ja
Inventor
友哉 木村
友哉 木村
啓 福井
啓 福井
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Corp
Original Assignee
Sony Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Corp filed Critical Sony Corp
Publication of JPWO2019167374A1 publication Critical patent/JPWO2019167374A1/ja
Application granted granted Critical
Publication of JP7207393B2 publication Critical patent/JP7207393B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B11/00Automatic controllers
    • G05B11/01Automatic controllers electric
    • G05B11/36Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential
    • G05B11/42Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential for obtaining a characteristic which is both proportional and time-dependent, e.g. P. I., P. I. D.
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J13/00Controls for manipulators
    • BPERFORMING OPERATIONS; TRANSPORTING
    • B25HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
    • B25JMANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
    • B25J9/00Programme-controlled manipulators
    • B25J9/16Programme controls
    • B25J9/1628Programme controls characterised by the control loop
    • B25J9/163Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/04Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
    • G05B13/042Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B17/00Systems involving the use of models or simulators of said systems
    • G05B17/02Systems involving the use of models or simulators of said systems electric
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D1/00Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
    • G05D1/02Control of position or course in two dimensions
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05DSYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
    • G05D13/00Control of linear speed; Control of angular speed; Control of acceleration or deceleration, e.g. of a prime mover
    • G05D13/62Control of linear speed; Control of angular speed; Control of acceleration or deceleration, e.g. of a prime mover characterised by the use of electric means, e.g. use of a tachometric dynamo, use of a transducer converting an electric value into a displacement
    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B2219/00Program-control systems
    • G05B2219/30Nc systems
    • G05B2219/40Robotics, robotics mapping to robotics vision
    • G05B2219/40394Combine offline with online information to generate robot actions

Landscapes

  • Engineering & Computer Science (AREA)
  • Automation & Control Theory (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Software Systems (AREA)
  • Robotics (AREA)
  • Evolutionary Computation (AREA)
  • Medical Informatics (AREA)
  • Artificial Intelligence (AREA)
  • Health & Medical Sciences (AREA)
  • Mechanical Engineering (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Aviation & Aerospace Engineering (AREA)
  • Radar, Positioning & Navigation (AREA)
  • Remote Sensing (AREA)
  • Manipulator (AREA)
  • Feedback Control In General (AREA)
  • Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)

Abstract

【課題】シミュレータモデルと実ロボットとに係る運動特性の差異をより簡易かつ効果的に吸収する。【解決手段】制御指令値に基づく自律動作体の動作結果を受信する通信部と、前記自律動作体の動作結果に基づいて、前記自律動作体の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似するパラメータ近似部、を備え、前記パラメータ近似部は、前記制御指令値に基づく前記動作シミュレーションにおいて異なる前記運動特性パラメータに基づいて取得された複数のシミュレーション結果と、前記自律動作体の前記動作結果との類似度に基づいて、前記運動特性パラメータを近似する、情報処理装置が提供される。【選択図】図3

Description

本開示は、情報処理装置および情報処理方法に関する。
近年、シミュレータ上におけるモデルの学習結果を実ロボットに適用する技術が研究されている。また、上記モデルと実ロボットとに係る運動特性の差異を吸収するための技術も提案されている。例えば、非特許文献1には、シミュレータ上のモデルと同一の動作を実ロボットに実行させるために、ディープニューラルネットワークを用いて制御指令値を変換する技術が開示されている。
Wojciech Zaremba、外7名、「Transfer fromSimulation to Real World through Learning Deep Inverse Dynamics Model」、2016年10月11日、[Online]、[平成30年2月26日検索]、インターネット<https://arxiv.org/abs/1610.03518>
しかし、非特許文献1に開示される技術では、実ロボットに係る大量の動作データを基に訓練を行うことが求められる。また、当該技術では、制御指令値を都度ディープニューラルネットワークにより変換することから計算コストが増大する傾向がある。
そこで、本開示では、シミュレータモデルと実ロボットとに係る運動特性の差異をより簡易かつ効果的に吸収することが可能な、新規かつ改良された情報処理装置および情報処理方法を提案する。
本開示によれば、制御指令値に基づく自律動作体の動作結果を受信する通信部と、前記自律動作体の動作結果に基づいて、前記自律動作体の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似するパラメータ近似部、を備え、前記パラメータ近似部は、前記制御指令値に基づく前記動作シミュレーションにおいて異なる前記運動特性パラメータに基づいて取得された複数のシミュレーション結果と、前記自律動作体の前記動作結果との類似度に基づいて、前記運動特性パラメータを近似する、情報処理装置が提供される。
また、本開示によれば、プロセッサが、制御指令値に基づく自律動作体の動作結果を受信することと、前記自律動作体の動作結果に基づいて、前記自律動作体の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似することと、を含み、前記近似することは、前記制御指令値に基づく前記動作シミュレーションにおいて異なる前記運動特性パラメータに基づいて取得された複数のシミュレーション結果と、前記自律動作体の前記動作結果との類似度に基づいて、前記運動特性パラメータを近似すること、をさらに含む、情報処理方法が提供される。
が提供される。
以上説明したように本開示によれば、シミュレータモデルと実ロボットとに係る運動特性の差異をより簡易かつ効果的に吸収することが可能となる。
なお、上記の効果は必ずしも限定的なものではなく、上記の効果とともに、または上記の効果に代えて、本明細書に示されたいずれかの効果、または本明細書から把握され得る他の効果が奏されてもよい。
本開示の一実施形態に係る運動特性に由来する制御速度のずれについて説明するための図である。 同実施形態に係る運動特性に由来する軌道のずれについて説明するための図である。 同実施形態に係る運動特性パラメータの近似について説明するための図である。 同実施形態に係る情報処理システムの構成例を示すブロック図である。 同実施形態に係る自律動作体および情報処理サーバの機能構成例を示すブロック図である。 同実施形態に係る運動特性パラメータの一例について説明するための図である。 同実施形態に係る運動特性の差が現れやすい動作について説明するための図である。 同実施形態に係る運動特性の差が現れやすい動作について説明するための図である。 同実施形態に係る運動特性パラメータの再近似について説明するための図である。 同実施形態に係る自動近似の流れを示すフローチャートである。 同実施形態に係る運動特性パラメータの再近似の流れを示すフローチャートである。 同実施形態に係る運動特性パラメータの自動近似が奏する効果について説明するための図である。 同実施形態に係る同実施形態に係る運動特性パラメータの自動近似が奏する効果について説明するための図である。 本開示の一実施形態に係る情報処理サーバのハードウェア構成例を示す図である。
以下に添付図面を参照しながら、本開示の好適な実施の形態について詳細に説明する。なお、本明細書及び図面において、実質的に同一の機能構成を有する構成要素については、同一の符号を付することにより重複説明を省略する。
なお、説明は以下の順序で行うものとする。
1.実施形態
1.1.概要
1.2.システム構成例
1.3.自律動作体10および情報処理サーバ20の機能構成例
1.4.自動近似の詳細
1.5.運動特性パラメータの自動再近似
1.6.動作の流れ
1.7.効果
2.ハードウェア構成例
3.まとめ
<1.実施形態>
<<1.1.概要>>
まず、本開示の一実施形態の概要について説明する。上述したように、近年においては、シミュレータ上におけるモデルの学習結果を実ロボットに適用する技術が研究されている。上記の手法によれば、種々の環境をシミュレータ上で再現することで、例えば、実世界では収集が困難な動作データを多量かつ効率的に収集することができ、効果的な学習を実現することが可能となる。
一方、シミュレータ上における学習結果を実ロボットに適用しようとする場合、シミュレータ上のモデルと実ロボットとの運動特性の差異を考慮することが重要となる。ここで、運動特性とは、実ロボットやシミュレータモデルの動作に係る個体差を生じさせる種々の要因を指す。運動特性には、例えば、最大速度や最大加速度、一定速度への追従具体、摩擦係数などが含まれ得る。
通常、実ロボットはそれぞれ異なる運動特性を有するため、同一の制御指令値を与えた場合であっても、個々の運動特性に応じた異なる動作が行われることとなる。このため、シミュレータモデルと実ロボットとの運動特性が異なる場合、シミュレータ上の学習結果をそのまま実ロボットに適用しても、想定する動作とは異なる動作が実行されることとなる。
図1は、運動特性に由来する制御速度のずれについて説明するための図である。図1には、制御指令値として与えられる目標速度CVに対する、実ロボットの実際速度AVが例示されている。図1に示す一例の場合、実ロボットが有する運動特性により、追従誤差や制御遅延、PID制御由来のオーバーシュートなどが発生し、目標速度CVと実際速度AVとに大きなずれが生じていることがわかる。
また、図2は、運動特性に由来する軌道のずれについて説明するための図である。図2の左側には、所定の制御指令値に対するシミュレータモデルSMの軌道Tが示されており、ミュレータモデルSMが制御指令値に基づいて対向車OCと衝突することなく自車線を移動している状況が示されている。
一方、図2の右側には、同一の制御指令値に対する実ロボット(自律動作体10)の軌道Tが示されている。図2に示す一例では、シミュレータモデルSMと自律動作体10の運動特性(例えば、タイヤの摩擦係数など)が異なることから、同一の制御指令値を与えた場合、自律動作体10がシミュレータモデルSMと異なる動作を行い、対向車OCに衝突してしまう状況が示されている。
このように、シミュエータモデルと実ロボットとの運動特性が異なる場合、同一の制御指令値に対する動作に大きなずれが生じ、実ロボットが想定と異なる動作を行うことで、正確性や安全性が損なわれる事態にも繋がりかねない。
上記のような事態を回避するためには、例えば、実ロボットの運動特性に応じたシミュレータモデルを設計することが考えれるが、この場合、実ロボットごとに対応するシミュレータモデルを作り込むこととなるため、コストが増大することとなる。
一方、近年においては、単一のシミュレーションモデルに係る学習結果を複数の実ロボットに適用する技術も提案されている。例えば、非特許文献1には、シミュレータモデルと同一の動作を実ロボットに実行させるために、ディープニューラルネットワークを用いて制御指令値を変換する技術が開示されている。
非特許文献1に記載の技術によれば、シミュレータモデルと同一の動作(例えば、速度や角速度)が行われるように都度制御指令値を変換し実ロボットに与えることで、シミュレータモデルと実ロボットとの運動特性の差異を吸収することができ、単一のシミュレータモデルに係る学習結果を複数の実ロボットに適用することが可能となる。
しかし、非特許文献1に記載の技術では、上記の制御を実現するために、実ロボットに係る大量の動作データを収集し訓練を行うことが求められる。また、非特許文献1に記載の技術では、ディープニューラルネットワークを用いて都度制御指令値を変換することが求められるため、計算コストが増大してしまう傾向がある。
本開示の一実施形態に係る技術思想は、上記のような点に着目して発想されたものであり、シミュレータモデルと実ロボットとに係る運動特性の差異をより簡易かつ効果的に吸収することが可能とする。このために、本開示の一実施形態に係る情報処理サーバ20は、制御指令値に基づく実ロボット(自律動作体10)の動作結果に基づいて、自律動作体10の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似する。この際、本開示の一実施形態に係る情報処理サーバ20は、同一の制御指令値に基づく動作シミュレーションにおいて異なる運動特性パラメータに基づいて取得された複数のシミュレーション結果と、自律動作体10の動作結果との類似度に基づいて、運動特性パラメータを近似すること、を特徴の一つとする。
図3は、本実施形態に係る運動特性パラメータの近似について説明するための図である。本実施形態に係る情報処理サーバ20は、まず、ある環境において、自律動作体10に所定の動作を行わせるための制御指令値を生成する。図3に示す一例の場合、情報処理サーバ20は、自律動作体10に所定の速度および角速度で動作を行わせるための制御指令値を生成している。なお、図3におけるグラフ中においては、速度指令値および角速度指令値が、それぞれ実線および点線で示されている。
次に、情報処理サーバ20は、生成した制御指令値を自律動作体10に送信し、当該制御指令値に対する動作を実行させ、動作結果を取得する。図3に示す一例では、情報処理サーバ20は、動作結果として自律動作体10の軌道Tを取得している。
また、情報処理サーバ20は、自律動作体10に送信した制御指令値と同一の制御指令値および同一の環境に対し、異なる運動特性パラメータのセットを設定し、複数のシミュレーション結果を取得する。図3に示す一例の場合、情報処理サーバ20は、PID制御パラメータK、K、K、および車輪の摩擦パラメータμの値がそれぞれ異なるパラメータセットを設定し、シミュレータモデルSMに動作を実行させ、3つの異なる軌道TS1、TS2、TS3を取得している。この際、情報処理サーバ20は、例えば、ランダムサーチ、グリッドサーチ、遺伝的アルゴリズム、山登り探索などの探索手法を用いて運動特性パラメータの設定を行ってよい。
次に、情報処理サーバ20は、取得した複数のシミュレーション結果と自律動作体10の動作結果との類似度をそれぞれ算出し、最も類似度の高いシミュレーション結果に基づいて、運動特性パラメータを近似する。
図3に示す一例の場合、情報処理サーバ20は、自律動作体10の軌道Tに最も類似するシミュレータモデルSMの軌道TS3に基づいて、当該シミュレーションにおいて設定された運動特性パラメータを特定し、シミュレータモデルSMの運動特性パラメータを近似することができる。
このように、本実施形態に係る情報処理サーバ20によれば、同一の制御指令値に対する自律動作体10の動作結果とシミュレーション結果とを比較することで、両者の運動特性パラメータを効率的に自動的に近似することができる。本実施形態に係る情報処理サーバ20が有する上記の機能によれば、短時間かつ少ない動作データに基づいて、人手を介さずに自動的に運動特性パラメータを近似することができ、シミュレータ上の学習結果を自律動作体10に容易に適用することが可能となる。また、本実施形態に係る自動近似によれば、非特許文献1に記載される技術のように、都度制御指令値を変換する必要がないため、計算コストを大幅に削減することが可能である。
<<1.2.システム構成例>>
次に、本開示の一実施形態に係る情報処理システムの構成例について説明する。図4は、本実施形態に係る情報処理システムの構成例を示すブロック図である。図4を参照すると、本実施形態に係る情報処理システムは、自律動作体10および情報処理サーバ20を備える。また、自律動作体10と情報処理サーバ20は、互いに通信が行えるように、ネットワーク30を介して接続される。
(自律動作体10)
本実施形態に係る自律動作体10は、シミュレータ上における学習結果と、与えられる制御指令値に基づいて動作を行う種々のロボットである。本実施形態に係る自律動作体10は、例えば、自動車、航空機、ドローン、船舶、潜水艦、羽ばたきロボットなどの移動ロボットや、電磁モータ駆動アームや空気圧駆動アームなどを備えるアーム型ロボットであってもよい。また、本実施形態に係る自律動作体10は、空気圧アクチュエータなどを用いた人工筋を利用した外骨格スーツなどであってもよい。
(情報処理サーバ20)
本実施形態に係る情報処理サーバ20は、自律動作体10とシミュレータモデルとに係る運動特性を近似する機能を有する情報処理装置である。本実施形態に係る情報処理サーバ20は、制御指令値の生成機能や当該制御指令値に基づくシミュレーション機能を有するシミュレータであってもよい。本実施形態に係る情報処理サーバ20が有する機能の詳細については、別途後述する。
(ネットワーク30)
ネットワーク30は、自律動作体10と情報処理サーバ20とを接続する機能を有する。ネットワーク30は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでもよい。また、ネットワーク30は、IP−VPN(Internet Protocol−Virtual Private Network)などの専用回線網を含んでもよい。また、ネットワーク30は、Wi−Fi(登録商標)、Bluetooth(登録商標)など無線通信網を含んでもよい。
以上、本開示の一実施形態に係る情報処理システムの構成例について説明した。なお、図4を用いて示した上記の機能構成はあくまで一例であり、本実施形態に係る情報処理システムの機能構成は係る例に限定されない。本実施形態に係る情報処理システムの機能構成は、仕様や運用に応じて柔軟に変形可能である。
<<1.3.自律動作体10および情報処理サーバ20の機能構成例>>
次に、本開示の一実施形態に係る自律動作体10および情報処理サーバ20の機能構成例について説明する。図5は、本実施形態に係る自律動作体10および情報処理サーバ20の機能構成例を示すブロック図である。図5を参照すると、本実施形態に係る自律動作体10は、動作実行部110を備える。また、本実施形態に係る情報処理サーバ20は、指令値生成部210、探索部220、データ保持部230、類似度算出部240、パラメータ近似部250、および通信部260を備える。
(動作実行部110)
本実施形態に係る動作実行部110は、情報処理サーバ20から送信される制御指令値およびシミュレータ上における学習結果に基づいて種々の動作を実行する機能を有する。動作実行部110は、例えば、上記の制御指令値および学習結果に基づいて、モータやアクチュエータなどを備える駆動部の動作を制御する。動作実行部110の構成は、自律動作体10の特性に応じて適宜設計され得る。
(指令値生成部210)
本実施形態に係る指令値生成部210は、自律動作体10およびシミュータモデルを動作させるための制御指令値を生成する。指令値生成部210は、例えば、目標速度変化や目標角速度変化を伴う動作に係る制御指令値を生成してもよい。指令値生成部210は、例えば、目標速度・目標角度列[(v,w), (v,w)...(v,w)]を含む制御指令値を生成し、通信部260および探索部220に引き渡す。指令値生成部210は、生成した制御指令値を通信部260を介して自律動作体10に送信し、当該制御指令値に対応する動作の実行を制御することが可能である。係る機能によれば、自律動作体10およびシミュレータモデルに係る運動特性パラメータの自動近似を人手を介さずに実現することが可能である。
(探索部220)
本実施形態に係る探索部220は、指令値生成部210が生成した制御指令値に基づいて、異なる運動特性パラメータのセットを設置し、複数のシミュレーション結果を取得する機能を有する。この際、探索部220は、例えば、ランダムサーチ、グリッドサーチ、遺伝的アルゴリズム、山登り探索などの探索手法を用いて、異なる運動特性パラメータに基づく複数のシミュレーション結果を取得してもよい。
また、探索部220は、設定した運動特性パラメータとシミュレーション結果とを対応づけてデータ保持部230に引き渡す。なお、本実施形態に係る運動特性パラメータは、自律動作体10の自動制御に係る種々のパラメータを含む。上記の自動制御には、種々の追従制御や定値制御が広く含まれる。本実施形態に係る運動特性パラメータの一例としては、例えば、図3に示したようなPID制御パラメータや摩擦パラメータが挙げられる。また、シミュレーション結果には、t秒間の制御指令値に対する軌道Tなどが挙げられる。また、シミュレーション結果は、軌道の他、t秒間のジャイロ遷移、t秒後の相対位置や相対姿勢、t秒間の速度遷移や角速度遷移、t秒間のタイヤやモータの回転角遷移などであってもよい。
(データ保持部230)
本実施形態に係るデータ保持部230は、探索部220から引き渡される運動特性パラメータとシミュレーション結果、および通信部260が受信した自律動作体10の動作結果や動作環境に係る情報を保持する。ここで、上記の動作結果は、指令値生成部210が生成し、通信部260により自律動作体10に送信された制御指令値に対する自律動作体10の動作結果であってよく、当該動作結果は、例えば、図3に示したような自律動作体10の軌道Tなど、上述した種々のシミュレーション結果に対応する種々の情報であり得る。また、動作環境としては、例えば、床摩擦、風、水流など環境が挙げられる。
(類似度算出部240)
本実施形態に係る類似度算出部240は、データ保持部230が保持する自律動作体10の動作結果およびシミュレーション結果に係る類似度を算出する。類似度算出部240は、例えば、|軌道T−軌道T|などの演算などに基づいて、自律動作体10の動作結果と各シミュレーション結果との類似度を算出し、各シミュレーション結果に運動特性パラメータの値と類似度とをパラメータ近似部250に引き渡す。なお、類似度算出部240による類似度算出の対象は、軌道に限定されず、上述した相対位置・姿勢、速度・角速度遷移、タイヤの回転角などであり得る。
(パラメータ近似部250)
本実施形態に係るパラメータ近似部250は、類似度算出部240が算出した自律動作体10の動作結果と各シミュレーション結果との類似度に基づいて、運動特性パラメータを近似する機能を有する。より具体的には、パラメータ近似部250は、各シミュレーション結果のうち、自律動作体10の動作結果と最も類似度が高いシミュレーション結果に係る運動特性パラメータをパラメータ近似に採用してよい。本実施形態に係るパラメータ近似部250が有する上記の機能によれば、自律動作体10と近い運動特性を有するシミュレータモデルを自動で生成することができ、当該シミュレータモデルによる学習結果を自律動作体10にそのまま適用することが可能となる。
(通信部260)
本実施形態に係る通信部260は、ネットワーク30を介して自律動作体10との情報通信を行う。具体的には、通信部260は、指令値生成部210が生成した制御指令値を自律動作体に送信する。また、通信部260は、上記制御指令値に基づく自律動作体10の動作結果や動作環境に係る情報を自律動作体10から受信する。
以上、本開示の一実施形態に係る自律動作体10および情報処理サーバ20の機能構例について説明した。なお、図5を用いて説明した上記の機能構成はあくまで一例であり、本実施形態に係る自律動作体10および情報処理サーバ20の機能構成は係る例に限定されない。例えば、上述したシミュレータ機能や学習機能は、情報処理サーバ20とは別途の装置により実現されてもよい。本実施形態に係る自律動作体10および情報処理サーバ20の機能構成は、仕様や運用に応じて柔軟に変形可能である。
<<1.4.自動近似の詳細>>
次に、本実施形態に係る情報処理サーバ20による運動特性パラメータの自動近似について、より詳細に説明する。上述したように、本実施形態に係る情報処理サーバ20は、自律動作体10とシミュレータモデルに係る運動特性パラメータを自動的に近似する機能を有する。
また、本実施形態に係る自律動作体10は、自動車、航空機、ドローン、船舶、潜水艦などの移動ロボットや、電磁モータ駆動アームや空気圧駆動アームなどを備えるアーム型ロボット、また外骨格スーツなどの種々のロボットであり得る。
このため、情報処理サーバ20による近似対象となる運動特性パラメータは、自律動作体10の種別や特性によって適宜設計されてよい。図6は、本実施形態に係る運動特性パラメータの一例について説明するための図である。
図6には、本実施形態に係る運動特性の一例が階層構造により示されている。上述したように、本実施形態に係る運動特性パラメータは、自律動作体10の自動制御(追従制御や定値制御)に係る種々のパラメータを含む。追従制御パラメータとしては、例えば、図示するようなPID制御パラメータや差動(Differential Drive)制御パラメータなどのフィードバック制御パラメータまたはフィードフォワード制御パラメータが挙げられる。また、追従対象となる要素としては、図示するような速度(v)および角速度(w)、モータの回転角(θ)、モータに加えるトルク(τ)、モータに加える電流(I)などが挙げられる。
この際、追従制御は、図6におけるどの階層に対して行われてもよい。例えば、目標測速度や目標角速度を追従対象としたPID制御が行われてもよいし、トルクを追従対象としたPID制御が行われてもよい。本実施形態に係る情報処理サーバ20は、追従制御の対象に関係なく運動特性を合わせこむことが可能である。
なお、本実施形態に係る運動特性パラメータは、図6に示す一例に限定されず、例えば、制御遅延パラメータや、最大加速度、最大角速度、車輪の摩擦、最小回転半径、自身の形状や表面素材に起因する抗力の係数(例えば、空気中や水中における抵抗)など、自律動作体10の種別や特性に応じた種々の要素が含まれ得る。
続いて、本実施形態に係る制御指令値の具体例について説明する。上述したように、本実施形態に係る情報処理サーバ20は、同一の制御指令値に基づく自律動作体10の動作結果およびシミュレーション結果とに基づいて、運動特性パラメータを近似することができる。このために、本実施形態に係る制御指令値は、自律動作体10とシミュレータモデルとの運動特性の差が如実に現れる動作を指令するものであってよい。
図7Aおよび図7Bは、運動特性の差が現れやすい動作について説明するための図である。図7Aの上部には、自動車である自律動作体10が急減速する状況が例示されている。このように、自動車である自律動作体10が急減速を伴う動作を行う場合、急激な速度変化に対する追従遅延が生じやすく、また、自律動作体10に強い慣性力が掛かり、車体が前滑りしてしまうなどの事象が発生しやすくなる。
また、図7Aの下部には、アーム型ロボットである自律動作体10が急減速する状況が示されている。このように、アーム型ロボットである自律動作体10が急減速を伴う動作を行う場合、上述の追従遅延や、モータMに強い荷重が加わることによる動作ずれが発生しやすくなる。
また、図7Bには、自動車である自律動作体10が急回転を行う状況が示されている。この場合も同様に、急激な角速度変化に対する追従遅延や、慣性力による横滑りなどが発生しやすい。
このため、本実施形態に係る情報処理サーバ20は、急減速や急回転などの、速度変化や角速度変化を伴う動作に係る制御指令値を採用することで、自律動作体10およびシミュレータモデルに係る運動特性の差が生じやすい動作を両者に実行させ、運動特性を効果的に近似することを可能とする。
また、本実施形態に係る情報処理サーバ20は、複数の制御要素の組み合わせを考慮して制御指令値を生成することができる。例えば、制御要素として速度(v)および角速度(w)が存在する場合、指令値生成部210は、v、w、Δv、Δwの組み合わせにバリエーションを持たせた制御指令値を生成してよい。ここで、上記のΔvおよびΔwは、それぞれvおよびwの変化量を示す。
具体的には、自律動作体10が低速移動時(v小)に急回転(Δw大)を行う場合と、高速移動時(v大)に急回転(Δw大)を行う場合とでは、それぞれ挙動が異なることが想定される。このため、本実施形態に係る指令値生成部210が、上記のような制御要素の組み合わせを考慮して制御指令値を生成することで、運動特性の差が現れやすい動作を自律動作体10およびシミュエータモデルに実行させ、効果的に運動特性パラメータを近似することが可能となる。
以上、本実施形態に係る制御指令値や運動特性パラメータについて具体例を挙げて説明した。本実施形態に係る情報処理サーバ20は、上記のように生成した同一の制御指令値に基づく動作を、自律動作体10およびシミュレータモデルに実行させることで、種々の運動特性パラメータを自動的に近似することができる。
なお、上記では、主に自律動作体10そのものの動作に係る運動特性を近似する場合を例に述べたが、本実施形態に係る情報処理サーバ20は、例えば、ドローンなどの自律動作体10に附随するカメラ装置の軌跡(位置・姿勢)を基に運動特性パラメータを自動近似することで、シミュレータモデルと同様の動画撮影が行えるよう学習結果を適用することも可能である。このように、本実施形態に係る自動近似の対象は、自律動作体10に附随する種々の装置が含まれ得る。
また、上述したように、本実施形態に係る自律動作体10は、空気圧アクチュエータなどにより実現される人工筋を備える外骨格スーツなどであってもよい。この場合であっても、同一の空気圧指令値を与えた人工筋の軌道に基づく動作結果とシミュレーション結果から、人工筋に係る運動特性パラメータを自動的に近似することが可能である。
<<1.5.運動特性パラメータの自動再近似>>
次に、本実施形態に係る情報処理サーバ20による運動特性パラメータの自動再近似について説明する。上述したように、本実施形態に係る情報処理サーバ20によれば、自律動作体10およびシミュレータモデルに係る運動特性パラメータを自動で近似することで、非特許文献1に記載の技術のように、都度制御指令値を変換することなく、シミュレータ上における学習結果を自律動作体10に適用することが可能である。
一方、本実施形態に係る自動近似を実行した場合であっても、例えば、自律動作体10が備える部品の経年劣化や交換などにより、運動特性パラメータに変化が生じることも想定される。このため、本実施形態に係る情報処理サーバ20は、一度、運動特性パラメータの近似を実行した後においても、定期または不定期に運動特性パラメータの再近似を実行してよい。
図8は、本実施形態に係る運動特性パラメータの再近似について説明するための図である。情報処理サーバ20は、シミュレータ上における学習結果を自律動作体10に適用するために、まず図8の上段に示されるように、最初の自動近似を実行する。
この際、情報処理サーバ20は、上述した手法により制御指令値を生成し、当該制御指令値を自律動作体10に送信する。また、情報処理サーバ20は、上記制御指令値に基づいて自律動作体10が実行した動作に係る動作ログを受信する。ここで、上記の動作ログには、制御指令値、動作環境、動作結果、取得日時などが含まれる。図8に示す一例の場合、情報処理サーバ20は、動作ログに含まれる軌道Tとシミュレーション結果として得られた軌道Tに基づいて、運動特性パラメータの自動近似し、自動近似後の学習結果を自律動作体10に送信する。
上記の処理の後、本実施形態に係る自律動作体10は、継続的または断続的に上記の動作ログを情報処理サーバ20に送信してよい。この際、通信部260は、受信した動作ログをデータ保持部230に引き渡し蓄積させる。
また、パラメータ近似部250は、蓄積された動作ログから再近似の実行が必要であると判断した場合、図8の下段に示すように、探索部220や類似度算出部240を制御し、再度、運動特性パラメータの自動近似処理を実行する。この際、パラメータ近似部250は、例えば、前回実行した自動近似日時から所定の時間が経過したことに基づいて、運動特性パラメータの自動再近似を実行してもよい。この場合、パラメータ近似部250は、前回自動近似を実行した際に取得された動作ログに含まれる取得日時に基づいて、再近似の実行要否を判定することができる。
また、パラメータ近似部250は、例えば、自律動作体10が備える部品が交換されたことなどを検出し、運動特性パラメータの再近似の必要性を判定してもよい。また、パラメータ近似部250は、データ保持部230に蓄積される動作ログが含む制御指令値に基づくシミュレーションを実行させ、得られたシミュレーション結果と上記動作ログに含まれる動作ログとの間に乖離が認められることに基づいて、再近似の必要性を判定してもよい。
このように、本実施形態に係る情報処理サーバ20は、運動特性パラメータの再近似に係る要否を動的に判定し、必要に応じて再近似を実行することで、自律動作体10に係る学習モデルを継続的にアップデートすることが可能である。本実施形態に係る情報処理サーバ20が有する上記の機能によれば、経年劣化や部品交換などにより生じ得る運動特性パラメータの乖離を吸収し、シミュレータ上における学習結果を継続的に自律動作体10に適用し続けることが可能となる。
<<1.6.動作の流れ>>
次に、本実施形態に係る情報処理サーバ20の動作の流れについて詳細に説明する。まず、本実施形態に係る情報処理サーバ20による自動近似の流れについて述べる。図9は、本実施形態に係る自動近似の流れを示すフローチャートである。
図9を参照すると、まず、指令値生成部210が制御指令値を生成する(S1101)。
次に、通信部260が、ステップS1101において生成された制御指令値を自律動作体10に送信する(S1102)。
続いて、通信部260は、ステップS1102において送信された制御指令値に基づいて実行された動作に係る動作ログを自律動作体10から受信する(S1103)。
また、ステップS1102およびS1103と並行して、探索部220が、ステップS1101において生成された制御指令値に基づいて、異なる運動特性パラメータを設定した複数のシミュレーション結果を取得する(S1104)。
次に、類似度算出部240は、ステップS1103において受信された動作ログに含まれる動作結果と、ステップS1104において取得された複数のシミュレーション結果との類似度を算出する(S1105)。
次に、パラメータ近似部250は、ステップS1105において算出された類似度に基づいて、運動特性パラメータの自動近似を実行する(S1106)。
次に、通信部260は、ステップS1106において近似された運動特性パラメータに基づく学習結果を自律動作体10に送信する。
続いて、本実施形態に係る運動特性パラメータの再近似に係る流れについて詳細に説明する。図10は、本実施形態に係る運動特性パラメータの再近似の流れを示すフローチャートである。
図10を参照すると、まず、パラメータ近似部250が、データ保持部230に蓄積された動作ログに基づいて、運動特性パラメータに係る再近似の要否を判定する(S1201)。この際、パラメータ近似部250は、前回の近似実行からの時間経過や、部品交換、動作結果とシミュレーション結果との乖離などに基づいて、再近似の要否を判定してもよい。
ここで、パラメータ近似部250が、運動特性パラメータの再近似が必要であると判定した場合(S1201:Yes)、続いて、パラメータ近似部250は、データ保持部230から最新の動作ログを取得する(S1202)。
続いて、パラメータ近似部250は、ステップS1202において取得した動作ログに基づいて、運動特性パラメータの再近似を実行する(S1203)。
次に、通信部260により再近似後の学習結果が自律動作体10に送信され、学習器が更新される(S1204)。
次に、パラメータ近似部250は、近似が完了した日時を取得し、データ保持部230が保持する自動近似日時を更新する(S1205)。
<<1.7.効果>>
次に図11および図12を用いて、本実施形態に係る運動特性パラメータの自動近似が奏する効果について説明する。ここでは、シミュレータモデルに対し自律動作体10と同一の制御指令値(目標速度および目標加速度)を与え、得られた軌道を比較した。
図11は、本実施形態に係る自動近似を行う前における計測結果である。図11では、左から順に、目標速度(Command_V)に対するシミュレータモデルの実際速度(Actual_V)、目標加速度(Command_W)に対するシミュレータモデルの実際加速度(Actual_W)、および自律動作体10の軌道Tとシミュレータモデルの軌道Tが示されている。
ここで、自律動作体10の軌道Tとシミュレータモデルの軌道Tに着目すると、本実施形態に係る運動特性パラメータの自動近似を行う前では、両者に大きなずれが生じていることがわかる。
一方、図12は、本実施形態に係る自動近似を行った後の計測結果である。なお、近似対象の運動特性パラメータとしては、加速度、角加速度、PID制御パラメータ、および遅延制御パラメータを用いた。また、図12においても、図11の場合と同様に、左から順に、目標速度(Command_V)に対するシミュレータモデルの実際速度(Actual_V)、目標加速度(Command_W)に対するシミュレータモデルの実際加速度(Actual_W)、および自律動作体10の軌道Tとシミュレータモデルの軌道Tが示されている。
図12を参照すると、本実施形態に係る自動近似後においては、近似前である図11と比較して、目標速度および目標角速度に対する追従性がわずかに変化しており、結果として、シミュレータモデルの軌道Tが大きく変化し、自律動作体10の軌道Tとほぼ一致していることがわかる。
以上、図11および図12を参照して、本実施形態に係る情報処理サーバ20による自動近似の効果について説明した。このように、本実施形態に係る情報処理サーバ20によれば、自律動作体10と類似する運動特性パラメータを有するシミュレータモデルを自動で生成し、シミュレータ上における学習結果を自律動作体10に適用することが可能となる。
<2.ハードウェア構成例>
次に、本開示の一実施形態に係る情報処理サーバ20のハードウェア構成例について説明する。図13は、本開示の一実施形態に係る情報処理サーバ20のハードウェア構成例を示すブロック図である。図13を参照すると、情報処理サーバ20は、例えば、プロセッサ871と、ROM872と、RAM873と、ホストバス874と、ブリッジ875と、外部バス876と、インターフェース877と、入力装置878と、出力装置879と、ストレージ880と、ドライブ881と、接続ポート882と、通信装置883と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。
(プロセッサ871)
プロセッサ871は、例えば、演算処理装置又は制御装置として機能し、ROM872、RAM873、ストレージ880、又はリムーバブル記録媒体901に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。
(ROM872、RAM873)
ROM872は、プロセッサ871に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。RAM873には、例えば、プロセッサ871に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。
(ホストバス874、ブリッジ875、外部バス876、インターフェース877)
プロセッサ871、ROM872、RAM873は、例えば、高速なデータ伝送が可能なホストバス874を介して相互に接続される。一方、ホストバス874は、例えば、ブリッジ875を介して比較的データ伝送速度が低速な外部バス876に接続される。また、外部バス876は、インターフェース877を介して種々の構成要素と接続される。
(入力装置878)
入力装置878には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置878としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ(以下、リモコン)が用いられることもある。また、入力装置878には、マイクロフォンなどの音声入力装置が含まれる。
(出力装置879)
出力装置879は、例えば、CRT(Cathode Ray Tube)、LCD、又は有機EL等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置879は、触覚刺激を出力することが可能な種々の振動デバイスを含む。
(ストレージ880)
ストレージ880は、各種のデータを格納するための装置である。ストレージ880としては、例えば、ハードディスクドライブ(HDD)等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。
(ドライブ881)
ドライブ881は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体901に記録された情報を読み出し、又はリムーバブル記録媒体901に情報を書き込む装置である。
(リムーバブル記録媒体901)
リムーバブル記録媒体901は、例えば、DVDメディア、Blu−ray(登録商標)メディア、HD DVDメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体901は、例えば、非接触型ICチップを搭載したICカード、又は電子機器等であってもよい。
(接続ポート882)
接続ポート882は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)、RS−232Cポート、又は光オーディオ端子等のような外部接続機器902を接続するためのポートである。
(外部接続機器902)
外部接続機器902は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はICレコーダ等である。
(通信装置883)
通信装置883は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線LAN、Bluetooth(登録商標)、又はWUSB(Wireless USB)用の通信カード、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、又は各種通信用のモデム等である。
<3.まとめ>
以上説明したように、本開示の一実施形態に係る情報処理サーバ20は、制御指令値に基づく自律動作体10の動作結果を受信する通信部260と、自律動作体10の動作結果に基づいて、自律動作体10の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似するパラメータ近似部250を備える。また、本開示の一実施形態に係るパラメータ近似部250は、制御指令値に基づく動作シミュレーションにおいて異なる運動特性パラメータに基づいて取得された複数のシミュレーション結果と、自律動作体10の動作結果との類似度に基づいて、運動特性パラメータを近似すること、を特徴の一つとする。係る構成によれば、シミュレータモデルと実ロボットとに係る運動特性の差異をより簡易かつ効果的に吸収することが可能となる。
以上、添付図面を参照しながら本開示の好適な実施形態について詳細に説明したが、本開示の技術的範囲はかかる例に限定されない。本開示の技術分野における通常の知識を有する者であれば、請求の範囲に記載された技術的思想の範疇内において、各種の変更例または修正例に想到し得ることは明らかであり、これらについても、当然に本開示の技術的範囲に属するものと了解される。
また、本明細書に記載された効果は、あくまで説明的または例示的なものであって限定的ではない。つまり、本開示に係る技術は、上記の効果とともに、または上記の効果に代えて、本明細書の記載から当業者には明らかな他の効果を奏しうる。
また、本明細書の情報処理サーバ20の処理に係る各ステップは、必ずしもフローチャートに記載された順序に沿って時系列に処理される必要はない。例えば、情報処理サーバ20の処理に係る各ステップは、フローチャートに記載された順序と異なる順序で処理されても、並列的に処理されてもよい。
なお、以下のような構成も本開示の技術的範囲に属する。
(1)
制御指令値に基づく自律動作体の動作結果を受信する通信部と、
前記自律動作体の動作結果に基づいて、前記自律動作体の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似するパラメータ近似部、
を備え、
前記パラメータ近似部は、前記制御指令値に基づく前記動作シミュレーションにおいて異なる前記運動特性パラメータに基づいて取得された複数のシミュレーション結果と、前記自律動作体の前記動作結果との類似度に基づいて、前記運動特性パラメータを近似する、
情報処理装置。
(2)
前記通信部は、前記パラメータ近似部により近似された前記運動特性パラメータに基づく学習結果を前記自律動作体に送信する、
前記(1)に記載の情報処理装置。
(3)
前記パラメータ近似部は、異なる前記運動特性パラメータに基づいて取得された複数の前記シミュレーション結果のうち、前記自律動作体の前記動作結果との類似度が最も高い前記シミュレーション結果に基づいて、前記運動特性パラメータを近似する、
前記(1)または(2)に記載の情報処理装置。
(4)
前記運動特性パラメータは、追従制御パラメータを含む、
前記(1)〜(3)のいずれかに記載の情報処理装置。
(5)
前記追従制御パラメータは、PID制御パラメータまたは差動制御パラメータのうち少なくともいずれかを含む、
前記(4)に記載の情報処理装置。
(6)
前記運動特性パラメータは、速度、角速度、モータの回転角、トルク、電流のうち少なくともいずれかを含む、
前記(1)〜(5)のいずれかに記載の情報処理装置。
(7)
前記自律動作体の前記動作結果および前記シミュレーション結果は、前記制御指令値に基づく軌道、ジャイロ遷移、相対位置遷移、相対姿勢遷移、速度遷移、角速度遷移、またはモータの回転角遷移のうち少なくともいずれかを含む、
前記(1)〜(6)のいずれかに記載の情報処理装置。
(8)
前記制御指令値は、速度変化または角速度変化を伴う動作に係る指令値である、
前記(1)〜(7)のいずれかに記載の情報処理装置。
(9)
前記制御指令値は、複数の制御要素に係る指令値の組み合わせから成る、
前記(1)〜(8)のいずれかに記載の情報処理装置。
(10)
異なる前記運動特性パラメータに基づく複数の前記シミュレーション結果は、ランダムサーチ、グリッドサーチ、遺伝的アルゴリズム、山登り探索のうち少なくともいずれかの探索手法を用いて取得される、
前記(1)〜(9)のいずれかに記載の情報処理装置。
(11)
前記通信部は、前記制御指令値に基づく前記自律動作体の動作ログを継続的または断続的に受信し、
前記パラメータ近似部は、前記動作ログに基づいて、前記運動特性パラメータを再近似する、
前記(1)〜(10)のいずれかに記載の情報処理装置。
(12)
前記動作ログは、前記動作結果または取得日時のうち少なくともいずれかを含む、
前記(11)に記載の情報処理装置。
(13)
前記パラメータ近似部は、前回実行した自動近似日時からの経過時間に基づいて、前記運動特性パラメータを再近似する、
前記(11)または(12)に記載の情報処理装置。
(14)
前記パラメータ近似部は、前記動作結果と前記シミュレーション結果の乖離に基づいて、前記運動特性パラメータを再近似する、
前記(11)〜(13)のいずれかに記載の情報処理装置。
(15)
前記通信部は、生成された前記制御指令値を前記自律動作体に送信する、
前記(1)〜(14)のいずれかに記載の情報処理装置。
(16)
前記制御指令値を生成する指令値生成部、
をさらに備える、
前記(1)〜(15)のいずれかに記載の情報処理装置。
(17)
前記制御指令値に基づいて、異なる前記運動特性パラメータを設定し、複数の前記シミュレーション結果を取得する探索部、
をさらに備える、
前記(1)〜(16)のいずれかに記載の情報処理装置。
(18)
前記制御指令値に基づく前記自律動作体の動作結果と、前記シミュレーション結果との類似度を算出する類似度算出部、
をさらに備える、
前記(1)〜(17)のいずれかに記載の情報処理装置。
(19)
前記自律動作体は、移動ロボットまたはアーム型ロボットのうち少なくともいずれかを含む、
前記(1)〜(18)のいずれかに記載の情報処理装置。
(20)
プロセッサが、制御指令値に基づく自律動作体の動作結果を受信することと、
前記自律動作体の動作結果に基づいて、前記自律動作体の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似することと、
を含み、
前記近似することは、前記制御指令値に基づく前記動作シミュレーションにおいて異なる前記運動特性パラメータに基づいて取得された複数のシミュレーション結果と、前記自律動作体の前記動作結果との類似度に基づいて、前記運動特性パラメータを近似すること、
をさらに含む、
情報処理方法。
10 自律動作体
110 動作実行部
20 情報処理サーバ
210 指令値生成部
220 探索部
230 データ保持部
240 類似度算出部
250 パラメータ近似部
260 通信部

Claims (20)

  1. 制御指令値に基づく自律動作体の動作結果を受信する通信部と、
    前記自律動作体の動作結果に基づいて、前記自律動作体の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似するパラメータ近似部、
    を備え、
    前記パラメータ近似部は、前記制御指令値に基づく前記動作シミュレーションにおいて異なる前記運動特性パラメータに基づいて取得された複数のシミュレーション結果と、前記自律動作体の前記動作結果との類似度に基づいて、前記運動特性パラメータを近似する、
    情報処理装置。
  2. 前記通信部は、前記パラメータ近似部により近似された前記運動特性パラメータに基づく学習結果を前記自律動作体に送信する、
    請求項1に記載の情報処理装置。
  3. 前記パラメータ近似部は、異なる前記運動特性パラメータに基づいて取得された複数の前記シミュレーション結果のうち、前記自律動作体の前記動作結果との類似度が最も高い前記シミュレーション結果に基づいて、前記運動特性パラメータを近似する、
    請求項1に記載の情報処理装置。
  4. 前記運動特性パラメータは、追従制御パラメータを含む、
    請求項1に記載の情報処理装置。
  5. 前記追従制御パラメータは、PID制御パラメータまたは差動制御パラメータのうち少なくともいずれかを含む、
    請求項4に記載の情報処理装置。
  6. 前記運動特性パラメータは、速度、角速度、モータの回転角、トルク、電流のうち少なくともいずれかを含む、
    請求項1に記載の情報処理装置。
  7. 前記自律動作体の前記動作結果および前記シミュレーション結果は、前記制御指令値に基づく軌道、ジャイロ遷移、相対位置遷移、相対姿勢遷移、速度遷移、角速度遷移、またはモータの回転角遷移のうち少なくともいずれかを含む、
    請求項1に記載の情報処理装置。
  8. 前記制御指令値は、速度変化または角速度変化を伴う動作に係る指令値である、
    請求項1に記載の情報処理装置。
  9. 前記制御指令値は、複数の制御要素に係る指令値の組み合わせから成る、
    請求項1に記載の情報処理装置。
  10. 異なる前記運動特性パラメータに基づく複数の前記シミュレーション結果は、ランダムサーチ、グリッドサーチ、遺伝的アルゴリズム、山登り探索のうち少なくともいずれかの探索手法を用いて取得される、
    請求項1に記載の情報処理装置。
  11. 前記通信部は、前記制御指令値に基づく前記自律動作体の動作ログを継続的または断続的に受信し、
    前記パラメータ近似部は、前記動作ログに基づいて、前記運動特性パラメータを再近似する、
    請求項1に記載の情報処理装置。
  12. 前記動作ログは、前記動作結果または取得日時のうち少なくともいずれかを含む、
    請求項11に記載の情報処理装置。
  13. 前記パラメータ近似部は、前回実行した自動近似日時からの経過時間に基づいて、前記運動特性パラメータを再近似する、
    請求項11に記載の情報処理装置。
  14. 前記パラメータ近似部は、前記動作結果と前記シミュレーション結果の乖離に基づいて、前記運動特性パラメータを再近似する、
    請求項11に記載の情報処理装置。
  15. 前記通信部は、生成された前記制御指令値を前記自律動作体に送信する、
    請求項1に記載の情報処理装置。
  16. 前記制御指令値を生成する指令値生成部、
    をさらに備える、
    請求項1に記載の情報処理装置。
  17. 前記制御指令値に基づいて、異なる前記運動特性パラメータを設定し、複数の前記シミュレーション結果を取得する探索部、
    をさらに備える、
    請求項1に記載の情報処理装置。
  18. 前記制御指令値に基づく前記自律動作体の動作結果と、前記シミュレーション結果との類似度を算出する類似度算出部、
    をさらに備える、
    請求項1に記載の情報処理装置。
  19. 前記自律動作体は、移動ロボットまたはアーム型ロボットのうち少なくともいずれかを含む、
    請求項1に記載の情報処理装置。
  20. プロセッサが、制御指令値に基づく自律動作体の動作結果を受信することと、
    前記自律動作体の動作結果に基づいて、前記自律動作体の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似することと、
    を含み、
    前記近似することは、前記制御指令値に基づく前記動作シミュレーションにおいて異なる前記運動特性パラメータに基づいて取得された複数のシミュレーション結果と、前記自律動作体の前記動作結果との類似度に基づいて、前記運動特性パラメータを近似すること、
    をさらに含む、
    情報処理方法。
JP2020502813A 2018-02-28 2018-12-05 情報処理装置および情報処理方法 Active JP7207393B2 (ja)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2018035014 2018-02-28
JP2018035014 2018-02-28
PCT/JP2018/044742 WO2019167374A1 (ja) 2018-02-28 2018-12-05 情報処理装置および情報処理方法

Publications (2)

Publication Number Publication Date
JPWO2019167374A1 true JPWO2019167374A1 (ja) 2021-02-12
JP7207393B2 JP7207393B2 (ja) 2023-01-18

Family

ID=67804904

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2020502813A Active JP7207393B2 (ja) 2018-02-28 2018-12-05 情報処理装置および情報処理方法

Country Status (5)

Country Link
US (1) US11392092B2 (ja)
EP (1) EP3761124A4 (ja)
JP (1) JP7207393B2 (ja)
CN (1) CN111742270A (ja)
WO (1) WO2019167374A1 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116047889B (zh) * 2023-01-16 2023-06-27 中国人民解放军国防科技大学 一种虚实结合仿真系统中控制补偿方法及装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6355603A (ja) * 1986-08-27 1988-03-10 Yamatake Honeywell Co Ltd セルフチユ−ニングコントロ−ラの制御方式
JP2006107256A (ja) * 2004-10-07 2006-04-20 Toshiba Corp モデルパラメータの自動フィッティング装置
JP2008102714A (ja) * 2006-10-18 2008-05-01 Tokyo Univ Of Agriculture & Technology 多軸工作機械の送り駆動系用最適設計支援装置およびその装置用プログラム

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2001350503A (ja) 2000-06-09 2001-12-21 Toshiba Corp Pid制御装置
JP2004188541A (ja) 2002-12-11 2004-07-08 Yamazaki Mazak Corp 工作機械の送り軸パラメータ調整システム
JP4133435B2 (ja) 2003-02-26 2008-08-13 健蔵 野波 小型無人ヘリコプタの自律制御方法
JP2006236226A (ja) 2005-02-28 2006-09-07 Toshiba Corp プラント運用制御装置
JP2006302078A (ja) 2005-04-22 2006-11-02 Yamatake Corp 制御対象モデル生成装置および生成方法
FR2945624B1 (fr) * 2009-05-15 2011-06-10 Mbda France Procede et systeme d'estimation d'une trajectoire d'un mobile
JP5633961B2 (ja) 2010-05-19 2014-12-03 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation シミュレーション・システム、方法及びプログラム
WO2012001213A1 (en) * 2010-06-30 2012-01-05 Metso Automation Oy Tracking simulation method
CN101930216B (zh) 2010-08-27 2012-04-18 东南大学 基于主从参考模型的遥操作机器人自适应控制方法
CN102736628B (zh) * 2012-06-12 2014-05-07 华中科技大学 一种具有环境适应性的足式机器人稳定性控制方法及系统
JP6172649B2 (ja) * 2012-12-19 2017-08-02 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 情報処理装置、プログラム、及び、情報処理方法
JP6355603B2 (ja) 2015-09-29 2018-07-11 有限会社ファーストステージ インテーク装置
CN105929860A (zh) * 2016-07-07 2016-09-07 上海海事大学 舰艇海况动态模拟器控制系统
CN106599342B (zh) * 2016-10-31 2020-12-04 金阳娃 仿真人机器人的仿人动作映射与实现方法
CN107610579A (zh) * 2017-09-05 2018-01-19 芜湖瑞思机器人有限公司 基于vr系统控制的工业机器人示教系统及其示教方法
JP6900863B2 (ja) * 2017-09-22 2021-07-07 オムロン株式会社 制御装置、制御方法および制御プログラム

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS6355603A (ja) * 1986-08-27 1988-03-10 Yamatake Honeywell Co Ltd セルフチユ−ニングコントロ−ラの制御方式
JP2006107256A (ja) * 2004-10-07 2006-04-20 Toshiba Corp モデルパラメータの自動フィッティング装置
JP2008102714A (ja) * 2006-10-18 2008-05-01 Tokyo Univ Of Agriculture & Technology 多軸工作機械の送り駆動系用最適設計支援装置およびその装置用プログラム

Also Published As

Publication number Publication date
CN111742270A (zh) 2020-10-02
US20200409317A1 (en) 2020-12-31
WO2019167374A1 (ja) 2019-09-06
JP7207393B2 (ja) 2023-01-18
EP3761124A1 (en) 2021-01-06
EP3761124A4 (en) 2021-04-14
US11392092B2 (en) 2022-07-19

Similar Documents

Publication Publication Date Title
US11897133B2 (en) Deep reinforcement learning for robotic manipulation
KR101977912B1 (ko) 속도 컨트롤러와 선형 예측 위치에 따른 전방향 바퀴형 휴머노이드 로봇
CN106794576B (zh) 基于线性预测位置和速度控制器的全向轮式类人机器人
WO2018098906A1 (en) Unmanned aerial vehicle control method and unmanned aerial vehicle control apparatus
JPWO2018143003A1 (ja) ロボットパス生成装置及びロボットシステム
JP2020526402A (ja) ロボットアクションへの修正の判定および利用
Xiao et al. Flying through a narrow gap using end-to-end deep reinforcement learning augmented with curriculum learning and sim2real
CN114516060A (zh) 用于控制机器人装置的设备和方法
JPWO2019187548A1 (ja) 情報処理装置および情報処理方法
CN112155940A (zh) 基于康复机器人的康复运动控制方法、系统、设备及介质
JPWO2019167374A1 (ja) 情報処理装置および情報処理方法
Ren et al. Nonlinear tracking control for nonholonomic mobile robots with input constraints: An experimental study
CN115047769A (zh) 一种基于约束跟随的无人作战平台避障-到达控制方法
Urban et al. Fusion of voice, gesture, and human-computer interface controls for remotely operated robot
KR102559608B1 (ko) 무인 항공기의 제어를 위한 학습 방법 및 이를 수행하는 전자 장치
Ioi et al. Design of wall-climber with coaxial propeller’s thruster
KR102093476B1 (ko) 자동 타임 워핑에 기반한 온라인 궤적 최적화 시스템 및 방법
Bechlioulis et al. Robust Prescribed Performance tracking control for unknown underactuated torpedo-like AUVs
Habas et al. Inverted Landing in a Small Aerial Robot via Deep Reinforcement Learning for Triggering and Control of Rotational Maneuvers
Kastritsi et al. A pHRI Framework for Modifying a Robot's Kinematic Behaviour via Varying Stiffness and Dynamical System Synchronization
US11282254B2 (en) Full-body modeling method and apparatus based on model predictive control with visuomotor system
CN110785723B (zh) 一种飞行轨迹复演方法、装置、服务器及存储介质
WO2024089728A1 (ja) 遠隔操縦装置、移動体遠隔操縦システム、移動体制御装置、画像表示装置、移動体および遠隔操縦方法
US20240094736A1 (en) Robot navigation in dependence on gesture(s) of human(s) in environment with robot
Habas et al. From Flies to Robots: Inverted Landing in Small Quadcopters with Dynamic Perching

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20211020

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220607

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20220802

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20220927

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20221121

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20221206

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20221219

R151 Written notification of patent or utility model registration

Ref document number: 7207393

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R151