JPWO2019167374A1 - 情報処理装置および情報処理方法 - Google Patents
情報処理装置および情報処理方法 Download PDFInfo
- Publication number
- JPWO2019167374A1 JPWO2019167374A1 JP2020502813A JP2020502813A JPWO2019167374A1 JP WO2019167374 A1 JPWO2019167374 A1 JP WO2019167374A1 JP 2020502813 A JP2020502813 A JP 2020502813A JP 2020502813 A JP2020502813 A JP 2020502813A JP WO2019167374 A1 JPWO2019167374 A1 JP WO2019167374A1
- Authority
- JP
- Japan
- Prior art keywords
- motion
- information processing
- command value
- autonomous
- control command
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 119
- 238000003672 processing method Methods 0.000 title claims description 6
- 230000033001 locomotion Effects 0.000 claims abstract description 175
- 238000004088 simulation Methods 0.000 claims abstract description 70
- 238000004891 communication Methods 0.000 claims abstract description 36
- 238000000034 method Methods 0.000 claims description 20
- 230000007704 transition Effects 0.000 claims description 17
- 238000004364 calculation method Methods 0.000 claims description 16
- 238000004422 calculation algorithm Methods 0.000 claims description 4
- 230000009194 climbing Effects 0.000 claims description 4
- 230000002068 genetic effect Effects 0.000 claims description 4
- 238000010586 diagram Methods 0.000 abstract description 12
- 230000006870 function Effects 0.000 description 16
- 230000000694 effects Effects 0.000 description 11
- 230000001133 acceleration Effects 0.000 description 9
- 230000003287 optical effect Effects 0.000 description 5
- 238000012545 processing Methods 0.000 description 5
- 238000013528 artificial neural network Methods 0.000 description 4
- 210000003205 muscle Anatomy 0.000 description 4
- 238000005259 measurement Methods 0.000 description 3
- 239000004065 semiconductor Substances 0.000 description 3
- 230000005540 biological transmission Effects 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000001151 other effect Effects 0.000 description 2
- 238000012549 training Methods 0.000 description 2
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 2
- 101150012579 ADSL gene Proteins 0.000 description 1
- 102100020775 Adenylosuccinate lyase Human genes 0.000 description 1
- 108700040193 Adenylosuccinate lyases Proteins 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000001934 delay Effects 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000014759 maintenance of location Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B11/00—Automatic controllers
- G05B11/01—Automatic controllers electric
- G05B11/36—Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential
- G05B11/42—Automatic controllers electric with provision for obtaining particular characteristics, e.g. proportional, integral, differential for obtaining a characteristic which is both proportional and time-dependent, e.g. P. I., P. I. D.
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J13/00—Controls for manipulators
-
- B—PERFORMING OPERATIONS; TRANSPORTING
- B25—HAND TOOLS; PORTABLE POWER-DRIVEN TOOLS; MANIPULATORS
- B25J—MANIPULATORS; CHAMBERS PROVIDED WITH MANIPULATION DEVICES
- B25J9/00—Programme-controlled manipulators
- B25J9/16—Programme controls
- B25J9/1628—Programme controls characterised by the control loop
- B25J9/163—Programme controls characterised by the control loop learning, adaptive, model based, rule based expert control
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
- G05B13/042—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators in which a parameter or coefficient is automatically adjusted to optimise the performance
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B17/00—Systems involving the use of models or simulators of said systems
- G05B17/02—Systems involving the use of models or simulators of said systems electric
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D1/00—Control of position, course, altitude or attitude of land, water, air or space vehicles, e.g. using automatic pilots
- G05D1/02—Control of position or course in two dimensions
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05D—SYSTEMS FOR CONTROLLING OR REGULATING NON-ELECTRIC VARIABLES
- G05D13/00—Control of linear speed; Control of angular speed; Control of acceleration or deceleration, e.g. of a prime mover
- G05D13/62—Control of linear speed; Control of angular speed; Control of acceleration or deceleration, e.g. of a prime mover characterised by the use of electric means, e.g. use of a tachometric dynamo, use of a transducer converting an electric value into a displacement
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B2219/00—Program-control systems
- G05B2219/30—Nc systems
- G05B2219/40—Robotics, robotics mapping to robotics vision
- G05B2219/40394—Combine offline with online information to generate robot actions
Landscapes
- Engineering & Computer Science (AREA)
- Automation & Control Theory (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- Robotics (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Mechanical Engineering (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Aviation & Aerospace Engineering (AREA)
- Radar, Positioning & Navigation (AREA)
- Remote Sensing (AREA)
- Manipulator (AREA)
- Feedback Control In General (AREA)
- Control Of Position, Course, Altitude, Or Attitude Of Moving Bodies (AREA)
Abstract
Description
が提供される。
1.実施形態
1.1.概要
1.2.システム構成例
1.3.自律動作体10および情報処理サーバ20の機能構成例
1.4.自動近似の詳細
1.5.運動特性パラメータの自動再近似
1.6.動作の流れ
1.7.効果
2.ハードウェア構成例
3.まとめ
<<1.1.概要>>
まず、本開示の一実施形態の概要について説明する。上述したように、近年においては、シミュレータ上におけるモデルの学習結果を実ロボットに適用する技術が研究されている。上記の手法によれば、種々の環境をシミュレータ上で再現することで、例えば、実世界では収集が困難な動作データを多量かつ効率的に収集することができ、効果的な学習を実現することが可能となる。
次に、本開示の一実施形態に係る情報処理システムの構成例について説明する。図4は、本実施形態に係る情報処理システムの構成例を示すブロック図である。図4を参照すると、本実施形態に係る情報処理システムは、自律動作体10および情報処理サーバ20を備える。また、自律動作体10と情報処理サーバ20は、互いに通信が行えるように、ネットワーク30を介して接続される。
本実施形態に係る自律動作体10は、シミュレータ上における学習結果と、与えられる制御指令値に基づいて動作を行う種々のロボットである。本実施形態に係る自律動作体10は、例えば、自動車、航空機、ドローン、船舶、潜水艦、羽ばたきロボットなどの移動ロボットや、電磁モータ駆動アームや空気圧駆動アームなどを備えるアーム型ロボットであってもよい。また、本実施形態に係る自律動作体10は、空気圧アクチュエータなどを用いた人工筋を利用した外骨格スーツなどであってもよい。
本実施形態に係る情報処理サーバ20は、自律動作体10とシミュレータモデルとに係る運動特性を近似する機能を有する情報処理装置である。本実施形態に係る情報処理サーバ20は、制御指令値の生成機能や当該制御指令値に基づくシミュレーション機能を有するシミュレータであってもよい。本実施形態に係る情報処理サーバ20が有する機能の詳細については、別途後述する。
ネットワーク30は、自律動作体10と情報処理サーバ20とを接続する機能を有する。ネットワーク30は、インターネット、電話回線網、衛星通信網などの公衆回線網や、Ethernet(登録商標)を含む各種のLAN(Local Area Network)、WAN(Wide Area Network)などを含んでもよい。また、ネットワーク30は、IP−VPN(Internet Protocol−Virtual Private Network)などの専用回線網を含んでもよい。また、ネットワーク30は、Wi−Fi(登録商標)、Bluetooth(登録商標)など無線通信網を含んでもよい。
次に、本開示の一実施形態に係る自律動作体10および情報処理サーバ20の機能構成例について説明する。図5は、本実施形態に係る自律動作体10および情報処理サーバ20の機能構成例を示すブロック図である。図5を参照すると、本実施形態に係る自律動作体10は、動作実行部110を備える。また、本実施形態に係る情報処理サーバ20は、指令値生成部210、探索部220、データ保持部230、類似度算出部240、パラメータ近似部250、および通信部260を備える。
本実施形態に係る動作実行部110は、情報処理サーバ20から送信される制御指令値およびシミュレータ上における学習結果に基づいて種々の動作を実行する機能を有する。動作実行部110は、例えば、上記の制御指令値および学習結果に基づいて、モータやアクチュエータなどを備える駆動部の動作を制御する。動作実行部110の構成は、自律動作体10の特性に応じて適宜設計され得る。
本実施形態に係る指令値生成部210は、自律動作体10およびシミュータモデルを動作させるための制御指令値を生成する。指令値生成部210は、例えば、目標速度変化や目標角速度変化を伴う動作に係る制御指令値を生成してもよい。指令値生成部210は、例えば、目標速度・目標角度列[(v0,w0), (v1,w1)...(vr,wr)]を含む制御指令値を生成し、通信部260および探索部220に引き渡す。指令値生成部210は、生成した制御指令値を通信部260を介して自律動作体10に送信し、当該制御指令値に対応する動作の実行を制御することが可能である。係る機能によれば、自律動作体10およびシミュレータモデルに係る運動特性パラメータの自動近似を人手を介さずに実現することが可能である。
本実施形態に係る探索部220は、指令値生成部210が生成した制御指令値に基づいて、異なる運動特性パラメータのセットを設置し、複数のシミュレーション結果を取得する機能を有する。この際、探索部220は、例えば、ランダムサーチ、グリッドサーチ、遺伝的アルゴリズム、山登り探索などの探索手法を用いて、異なる運動特性パラメータに基づく複数のシミュレーション結果を取得してもよい。
本実施形態に係るデータ保持部230は、探索部220から引き渡される運動特性パラメータとシミュレーション結果、および通信部260が受信した自律動作体10の動作結果や動作環境に係る情報を保持する。ここで、上記の動作結果は、指令値生成部210が生成し、通信部260により自律動作体10に送信された制御指令値に対する自律動作体10の動作結果であってよく、当該動作結果は、例えば、図3に示したような自律動作体10の軌道TRなど、上述した種々のシミュレーション結果に対応する種々の情報であり得る。また、動作環境としては、例えば、床摩擦、風、水流など環境が挙げられる。
本実施形態に係る類似度算出部240は、データ保持部230が保持する自律動作体10の動作結果およびシミュレーション結果に係る類似度を算出する。類似度算出部240は、例えば、|軌道TR−軌道TS|などの演算などに基づいて、自律動作体10の動作結果と各シミュレーション結果との類似度を算出し、各シミュレーション結果に運動特性パラメータの値と類似度とをパラメータ近似部250に引き渡す。なお、類似度算出部240による類似度算出の対象は、軌道に限定されず、上述した相対位置・姿勢、速度・角速度遷移、タイヤの回転角などであり得る。
本実施形態に係るパラメータ近似部250は、類似度算出部240が算出した自律動作体10の動作結果と各シミュレーション結果との類似度に基づいて、運動特性パラメータを近似する機能を有する。より具体的には、パラメータ近似部250は、各シミュレーション結果のうち、自律動作体10の動作結果と最も類似度が高いシミュレーション結果に係る運動特性パラメータをパラメータ近似に採用してよい。本実施形態に係るパラメータ近似部250が有する上記の機能によれば、自律動作体10と近い運動特性を有するシミュレータモデルを自動で生成することができ、当該シミュレータモデルによる学習結果を自律動作体10にそのまま適用することが可能となる。
本実施形態に係る通信部260は、ネットワーク30を介して自律動作体10との情報通信を行う。具体的には、通信部260は、指令値生成部210が生成した制御指令値を自律動作体に送信する。また、通信部260は、上記制御指令値に基づく自律動作体10の動作結果や動作環境に係る情報を自律動作体10から受信する。
次に、本実施形態に係る情報処理サーバ20による運動特性パラメータの自動近似について、より詳細に説明する。上述したように、本実施形態に係る情報処理サーバ20は、自律動作体10とシミュレータモデルに係る運動特性パラメータを自動的に近似する機能を有する。
次に、本実施形態に係る情報処理サーバ20による運動特性パラメータの自動再近似について説明する。上述したように、本実施形態に係る情報処理サーバ20によれば、自律動作体10およびシミュレータモデルに係る運動特性パラメータを自動で近似することで、非特許文献1に記載の技術のように、都度制御指令値を変換することなく、シミュレータ上における学習結果を自律動作体10に適用することが可能である。
次に、本実施形態に係る情報処理サーバ20の動作の流れについて詳細に説明する。まず、本実施形態に係る情報処理サーバ20による自動近似の流れについて述べる。図9は、本実施形態に係る自動近似の流れを示すフローチャートである。
次に図11および図12を用いて、本実施形態に係る運動特性パラメータの自動近似が奏する効果について説明する。ここでは、シミュレータモデルに対し自律動作体10と同一の制御指令値(目標速度および目標加速度)を与え、得られた軌道を比較した。
次に、本開示の一実施形態に係る情報処理サーバ20のハードウェア構成例について説明する。図13は、本開示の一実施形態に係る情報処理サーバ20のハードウェア構成例を示すブロック図である。図13を参照すると、情報処理サーバ20は、例えば、プロセッサ871と、ROM872と、RAM873と、ホストバス874と、ブリッジ875と、外部バス876と、インターフェース877と、入力装置878と、出力装置879と、ストレージ880と、ドライブ881と、接続ポート882と、通信装置883と、を有する。なお、ここで示すハードウェア構成は一例であり、構成要素の一部が省略されてもよい。また、ここで示される構成要素以外の構成要素をさらに含んでもよい。
プロセッサ871は、例えば、演算処理装置又は制御装置として機能し、ROM872、RAM873、ストレージ880、又はリムーバブル記録媒体901に記録された各種プログラムに基づいて各構成要素の動作全般又はその一部を制御する。
ROM872は、プロセッサ871に読み込まれるプログラムや演算に用いるデータ等を格納する手段である。RAM873には、例えば、プロセッサ871に読み込まれるプログラムや、そのプログラムを実行する際に適宜変化する各種パラメータ等が一時的又は永続的に格納される。
プロセッサ871、ROM872、RAM873は、例えば、高速なデータ伝送が可能なホストバス874を介して相互に接続される。一方、ホストバス874は、例えば、ブリッジ875を介して比較的データ伝送速度が低速な外部バス876に接続される。また、外部バス876は、インターフェース877を介して種々の構成要素と接続される。
入力装置878には、例えば、マウス、キーボード、タッチパネル、ボタン、スイッチ、及びレバー等が用いられる。さらに、入力装置878としては、赤外線やその他の電波を利用して制御信号を送信することが可能なリモートコントローラ(以下、リモコン)が用いられることもある。また、入力装置878には、マイクロフォンなどの音声入力装置が含まれる。
出力装置879は、例えば、CRT(Cathode Ray Tube)、LCD、又は有機EL等のディスプレイ装置、スピーカ、ヘッドホン等のオーディオ出力装置、プリンタ、携帯電話、又はファクシミリ等、取得した情報を利用者に対して視覚的又は聴覚的に通知することが可能な装置である。また、本開示に係る出力装置879は、触覚刺激を出力することが可能な種々の振動デバイスを含む。
ストレージ880は、各種のデータを格納するための装置である。ストレージ880としては、例えば、ハードディスクドライブ(HDD)等の磁気記憶デバイス、半導体記憶デバイス、光記憶デバイス、又は光磁気記憶デバイス等が用いられる。
ドライブ881は、例えば、磁気ディスク、光ディスク、光磁気ディスク、又は半導体メモリ等のリムーバブル記録媒体901に記録された情報を読み出し、又はリムーバブル記録媒体901に情報を書き込む装置である。
リムーバブル記録媒体901は、例えば、DVDメディア、Blu−ray(登録商標)メディア、HD DVDメディア、各種の半導体記憶メディア等である。もちろん、リムーバブル記録媒体901は、例えば、非接触型ICチップを搭載したICカード、又は電子機器等であってもよい。
接続ポート882は、例えば、USB(Universal Serial Bus)ポート、IEEE1394ポート、SCSI(Small Computer System Interface)、RS−232Cポート、又は光オーディオ端子等のような外部接続機器902を接続するためのポートである。
外部接続機器902は、例えば、プリンタ、携帯音楽プレーヤ、デジタルカメラ、デジタルビデオカメラ、又はICレコーダ等である。
通信装置883は、ネットワークに接続するための通信デバイスであり、例えば、有線又は無線LAN、Bluetooth(登録商標)、又はWUSB(Wireless USB)用の通信カード、光通信用のルータ、ADSL(Asymmetric Digital Subscriber Line)用のルータ、又は各種通信用のモデム等である。
以上説明したように、本開示の一実施形態に係る情報処理サーバ20は、制御指令値に基づく自律動作体10の動作結果を受信する通信部260と、自律動作体10の動作結果に基づいて、自律動作体10の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似するパラメータ近似部250を備える。また、本開示の一実施形態に係るパラメータ近似部250は、制御指令値に基づく動作シミュレーションにおいて異なる運動特性パラメータに基づいて取得された複数のシミュレーション結果と、自律動作体10の動作結果との類似度に基づいて、運動特性パラメータを近似すること、を特徴の一つとする。係る構成によれば、シミュレータモデルと実ロボットとに係る運動特性の差異をより簡易かつ効果的に吸収することが可能となる。
(1)
制御指令値に基づく自律動作体の動作結果を受信する通信部と、
前記自律動作体の動作結果に基づいて、前記自律動作体の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似するパラメータ近似部、
を備え、
前記パラメータ近似部は、前記制御指令値に基づく前記動作シミュレーションにおいて異なる前記運動特性パラメータに基づいて取得された複数のシミュレーション結果と、前記自律動作体の前記動作結果との類似度に基づいて、前記運動特性パラメータを近似する、
情報処理装置。
(2)
前記通信部は、前記パラメータ近似部により近似された前記運動特性パラメータに基づく学習結果を前記自律動作体に送信する、
前記(1)に記載の情報処理装置。
(3)
前記パラメータ近似部は、異なる前記運動特性パラメータに基づいて取得された複数の前記シミュレーション結果のうち、前記自律動作体の前記動作結果との類似度が最も高い前記シミュレーション結果に基づいて、前記運動特性パラメータを近似する、
前記(1)または(2)に記載の情報処理装置。
(4)
前記運動特性パラメータは、追従制御パラメータを含む、
前記(1)〜(3)のいずれかに記載の情報処理装置。
(5)
前記追従制御パラメータは、PID制御パラメータまたは差動制御パラメータのうち少なくともいずれかを含む、
前記(4)に記載の情報処理装置。
(6)
前記運動特性パラメータは、速度、角速度、モータの回転角、トルク、電流のうち少なくともいずれかを含む、
前記(1)〜(5)のいずれかに記載の情報処理装置。
(7)
前記自律動作体の前記動作結果および前記シミュレーション結果は、前記制御指令値に基づく軌道、ジャイロ遷移、相対位置遷移、相対姿勢遷移、速度遷移、角速度遷移、またはモータの回転角遷移のうち少なくともいずれかを含む、
前記(1)〜(6)のいずれかに記載の情報処理装置。
(8)
前記制御指令値は、速度変化または角速度変化を伴う動作に係る指令値である、
前記(1)〜(7)のいずれかに記載の情報処理装置。
(9)
前記制御指令値は、複数の制御要素に係る指令値の組み合わせから成る、
前記(1)〜(8)のいずれかに記載の情報処理装置。
(10)
異なる前記運動特性パラメータに基づく複数の前記シミュレーション結果は、ランダムサーチ、グリッドサーチ、遺伝的アルゴリズム、山登り探索のうち少なくともいずれかの探索手法を用いて取得される、
前記(1)〜(9)のいずれかに記載の情報処理装置。
(11)
前記通信部は、前記制御指令値に基づく前記自律動作体の動作ログを継続的または断続的に受信し、
前記パラメータ近似部は、前記動作ログに基づいて、前記運動特性パラメータを再近似する、
前記(1)〜(10)のいずれかに記載の情報処理装置。
(12)
前記動作ログは、前記動作結果または取得日時のうち少なくともいずれかを含む、
前記(11)に記載の情報処理装置。
(13)
前記パラメータ近似部は、前回実行した自動近似日時からの経過時間に基づいて、前記運動特性パラメータを再近似する、
前記(11)または(12)に記載の情報処理装置。
(14)
前記パラメータ近似部は、前記動作結果と前記シミュレーション結果の乖離に基づいて、前記運動特性パラメータを再近似する、
前記(11)〜(13)のいずれかに記載の情報処理装置。
(15)
前記通信部は、生成された前記制御指令値を前記自律動作体に送信する、
前記(1)〜(14)のいずれかに記載の情報処理装置。
(16)
前記制御指令値を生成する指令値生成部、
をさらに備える、
前記(1)〜(15)のいずれかに記載の情報処理装置。
(17)
前記制御指令値に基づいて、異なる前記運動特性パラメータを設定し、複数の前記シミュレーション結果を取得する探索部、
をさらに備える、
前記(1)〜(16)のいずれかに記載の情報処理装置。
(18)
前記制御指令値に基づく前記自律動作体の動作結果と、前記シミュレーション結果との類似度を算出する類似度算出部、
をさらに備える、
前記(1)〜(17)のいずれかに記載の情報処理装置。
(19)
前記自律動作体は、移動ロボットまたはアーム型ロボットのうち少なくともいずれかを含む、
前記(1)〜(18)のいずれかに記載の情報処理装置。
(20)
プロセッサが、制御指令値に基づく自律動作体の動作結果を受信することと、
前記自律動作体の動作結果に基づいて、前記自律動作体の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似することと、
を含み、
前記近似することは、前記制御指令値に基づく前記動作シミュレーションにおいて異なる前記運動特性パラメータに基づいて取得された複数のシミュレーション結果と、前記自律動作体の前記動作結果との類似度に基づいて、前記運動特性パラメータを近似すること、
をさらに含む、
情報処理方法。
110 動作実行部
20 情報処理サーバ
210 指令値生成部
220 探索部
230 データ保持部
240 類似度算出部
250 パラメータ近似部
260 通信部
Claims (20)
- 制御指令値に基づく自律動作体の動作結果を受信する通信部と、
前記自律動作体の動作結果に基づいて、前記自律動作体の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似するパラメータ近似部、
を備え、
前記パラメータ近似部は、前記制御指令値に基づく前記動作シミュレーションにおいて異なる前記運動特性パラメータに基づいて取得された複数のシミュレーション結果と、前記自律動作体の前記動作結果との類似度に基づいて、前記運動特性パラメータを近似する、
情報処理装置。 - 前記通信部は、前記パラメータ近似部により近似された前記運動特性パラメータに基づく学習結果を前記自律動作体に送信する、
請求項1に記載の情報処理装置。 - 前記パラメータ近似部は、異なる前記運動特性パラメータに基づいて取得された複数の前記シミュレーション結果のうち、前記自律動作体の前記動作結果との類似度が最も高い前記シミュレーション結果に基づいて、前記運動特性パラメータを近似する、
請求項1に記載の情報処理装置。 - 前記運動特性パラメータは、追従制御パラメータを含む、
請求項1に記載の情報処理装置。 - 前記追従制御パラメータは、PID制御パラメータまたは差動制御パラメータのうち少なくともいずれかを含む、
請求項4に記載の情報処理装置。 - 前記運動特性パラメータは、速度、角速度、モータの回転角、トルク、電流のうち少なくともいずれかを含む、
請求項1に記載の情報処理装置。 - 前記自律動作体の前記動作結果および前記シミュレーション結果は、前記制御指令値に基づく軌道、ジャイロ遷移、相対位置遷移、相対姿勢遷移、速度遷移、角速度遷移、またはモータの回転角遷移のうち少なくともいずれかを含む、
請求項1に記載の情報処理装置。 - 前記制御指令値は、速度変化または角速度変化を伴う動作に係る指令値である、
請求項1に記載の情報処理装置。 - 前記制御指令値は、複数の制御要素に係る指令値の組み合わせから成る、
請求項1に記載の情報処理装置。 - 異なる前記運動特性パラメータに基づく複数の前記シミュレーション結果は、ランダムサーチ、グリッドサーチ、遺伝的アルゴリズム、山登り探索のうち少なくともいずれかの探索手法を用いて取得される、
請求項1に記載の情報処理装置。 - 前記通信部は、前記制御指令値に基づく前記自律動作体の動作ログを継続的または断続的に受信し、
前記パラメータ近似部は、前記動作ログに基づいて、前記運動特性パラメータを再近似する、
請求項1に記載の情報処理装置。 - 前記動作ログは、前記動作結果または取得日時のうち少なくともいずれかを含む、
請求項11に記載の情報処理装置。 - 前記パラメータ近似部は、前回実行した自動近似日時からの経過時間に基づいて、前記運動特性パラメータを再近似する、
請求項11に記載の情報処理装置。 - 前記パラメータ近似部は、前記動作結果と前記シミュレーション結果の乖離に基づいて、前記運動特性パラメータを再近似する、
請求項11に記載の情報処理装置。 - 前記通信部は、生成された前記制御指令値を前記自律動作体に送信する、
請求項1に記載の情報処理装置。 - 前記制御指令値を生成する指令値生成部、
をさらに備える、
請求項1に記載の情報処理装置。 - 前記制御指令値に基づいて、異なる前記運動特性パラメータを設定し、複数の前記シミュレーション結果を取得する探索部、
をさらに備える、
請求項1に記載の情報処理装置。 - 前記制御指令値に基づく前記自律動作体の動作結果と、前記シミュレーション結果との類似度を算出する類似度算出部、
をさらに備える、
請求項1に記載の情報処理装置。 - 前記自律動作体は、移動ロボットまたはアーム型ロボットのうち少なくともいずれかを含む、
請求項1に記載の情報処理装置。 - プロセッサが、制御指令値に基づく自律動作体の動作結果を受信することと、
前記自律動作体の動作結果に基づいて、前記自律動作体の動作シミュレーションに係るシミュレータモデルの運動特性パラメータを近似することと、
を含み、
前記近似することは、前記制御指令値に基づく前記動作シミュレーションにおいて異なる前記運動特性パラメータに基づいて取得された複数のシミュレーション結果と、前記自律動作体の前記動作結果との類似度に基づいて、前記運動特性パラメータを近似すること、
をさらに含む、
情報処理方法。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2018035014 | 2018-02-28 | ||
JP2018035014 | 2018-02-28 | ||
PCT/JP2018/044742 WO2019167374A1 (ja) | 2018-02-28 | 2018-12-05 | 情報処理装置および情報処理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
JPWO2019167374A1 true JPWO2019167374A1 (ja) | 2021-02-12 |
JP7207393B2 JP7207393B2 (ja) | 2023-01-18 |
Family
ID=67804904
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2020502813A Active JP7207393B2 (ja) | 2018-02-28 | 2018-12-05 | 情報処理装置および情報処理方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US11392092B2 (ja) |
EP (1) | EP3761124A4 (ja) |
JP (1) | JP7207393B2 (ja) |
CN (1) | CN111742270A (ja) |
WO (1) | WO2019167374A1 (ja) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116047889B (zh) * | 2023-01-16 | 2023-06-27 | 中国人民解放军国防科技大学 | 一种虚实结合仿真系统中控制补偿方法及装置 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6355603A (ja) * | 1986-08-27 | 1988-03-10 | Yamatake Honeywell Co Ltd | セルフチユ−ニングコントロ−ラの制御方式 |
JP2006107256A (ja) * | 2004-10-07 | 2006-04-20 | Toshiba Corp | モデルパラメータの自動フィッティング装置 |
JP2008102714A (ja) * | 2006-10-18 | 2008-05-01 | Tokyo Univ Of Agriculture & Technology | 多軸工作機械の送り駆動系用最適設計支援装置およびその装置用プログラム |
Family Cites Families (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2001350503A (ja) | 2000-06-09 | 2001-12-21 | Toshiba Corp | Pid制御装置 |
JP2004188541A (ja) | 2002-12-11 | 2004-07-08 | Yamazaki Mazak Corp | 工作機械の送り軸パラメータ調整システム |
JP4133435B2 (ja) | 2003-02-26 | 2008-08-13 | 健蔵 野波 | 小型無人ヘリコプタの自律制御方法 |
JP2006236226A (ja) | 2005-02-28 | 2006-09-07 | Toshiba Corp | プラント運用制御装置 |
JP2006302078A (ja) | 2005-04-22 | 2006-11-02 | Yamatake Corp | 制御対象モデル生成装置および生成方法 |
FR2945624B1 (fr) * | 2009-05-15 | 2011-06-10 | Mbda France | Procede et systeme d'estimation d'une trajectoire d'un mobile |
JP5633961B2 (ja) | 2010-05-19 | 2014-12-03 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | シミュレーション・システム、方法及びプログラム |
WO2012001213A1 (en) * | 2010-06-30 | 2012-01-05 | Metso Automation Oy | Tracking simulation method |
CN101930216B (zh) | 2010-08-27 | 2012-04-18 | 东南大学 | 基于主从参考模型的遥操作机器人自适应控制方法 |
CN102736628B (zh) * | 2012-06-12 | 2014-05-07 | 华中科技大学 | 一种具有环境适应性的足式机器人稳定性控制方法及系统 |
JP6172649B2 (ja) * | 2012-12-19 | 2017-08-02 | インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation | 情報処理装置、プログラム、及び、情報処理方法 |
JP6355603B2 (ja) | 2015-09-29 | 2018-07-11 | 有限会社ファーストステージ | インテーク装置 |
CN105929860A (zh) * | 2016-07-07 | 2016-09-07 | 上海海事大学 | 舰艇海况动态模拟器控制系统 |
CN106599342B (zh) * | 2016-10-31 | 2020-12-04 | 金阳娃 | 仿真人机器人的仿人动作映射与实现方法 |
CN107610579A (zh) * | 2017-09-05 | 2018-01-19 | 芜湖瑞思机器人有限公司 | 基于vr系统控制的工业机器人示教系统及其示教方法 |
JP6900863B2 (ja) * | 2017-09-22 | 2021-07-07 | オムロン株式会社 | 制御装置、制御方法および制御プログラム |
-
2018
- 2018-12-05 WO PCT/JP2018/044742 patent/WO2019167374A1/ja unknown
- 2018-12-05 US US16/971,686 patent/US11392092B2/en active Active
- 2018-12-05 EP EP18907803.3A patent/EP3761124A4/en not_active Withdrawn
- 2018-12-05 JP JP2020502813A patent/JP7207393B2/ja active Active
- 2018-12-05 CN CN201880090057.1A patent/CN111742270A/zh not_active Withdrawn
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JPS6355603A (ja) * | 1986-08-27 | 1988-03-10 | Yamatake Honeywell Co Ltd | セルフチユ−ニングコントロ−ラの制御方式 |
JP2006107256A (ja) * | 2004-10-07 | 2006-04-20 | Toshiba Corp | モデルパラメータの自動フィッティング装置 |
JP2008102714A (ja) * | 2006-10-18 | 2008-05-01 | Tokyo Univ Of Agriculture & Technology | 多軸工作機械の送り駆動系用最適設計支援装置およびその装置用プログラム |
Also Published As
Publication number | Publication date |
---|---|
CN111742270A (zh) | 2020-10-02 |
US20200409317A1 (en) | 2020-12-31 |
WO2019167374A1 (ja) | 2019-09-06 |
JP7207393B2 (ja) | 2023-01-18 |
EP3761124A1 (en) | 2021-01-06 |
EP3761124A4 (en) | 2021-04-14 |
US11392092B2 (en) | 2022-07-19 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US11897133B2 (en) | Deep reinforcement learning for robotic manipulation | |
KR101977912B1 (ko) | 속도 컨트롤러와 선형 예측 위치에 따른 전방향 바퀴형 휴머노이드 로봇 | |
CN106794576B (zh) | 基于线性预测位置和速度控制器的全向轮式类人机器人 | |
WO2018098906A1 (en) | Unmanned aerial vehicle control method and unmanned aerial vehicle control apparatus | |
JPWO2018143003A1 (ja) | ロボットパス生成装置及びロボットシステム | |
JP2020526402A (ja) | ロボットアクションへの修正の判定および利用 | |
Xiao et al. | Flying through a narrow gap using end-to-end deep reinforcement learning augmented with curriculum learning and sim2real | |
CN114516060A (zh) | 用于控制机器人装置的设备和方法 | |
JPWO2019187548A1 (ja) | 情報処理装置および情報処理方法 | |
CN112155940A (zh) | 基于康复机器人的康复运动控制方法、系统、设备及介质 | |
JPWO2019167374A1 (ja) | 情報処理装置および情報処理方法 | |
Ren et al. | Nonlinear tracking control for nonholonomic mobile robots with input constraints: An experimental study | |
CN115047769A (zh) | 一种基于约束跟随的无人作战平台避障-到达控制方法 | |
Urban et al. | Fusion of voice, gesture, and human-computer interface controls for remotely operated robot | |
KR102559608B1 (ko) | 무인 항공기의 제어를 위한 학습 방법 및 이를 수행하는 전자 장치 | |
Ioi et al. | Design of wall-climber with coaxial propeller’s thruster | |
KR102093476B1 (ko) | 자동 타임 워핑에 기반한 온라인 궤적 최적화 시스템 및 방법 | |
Bechlioulis et al. | Robust Prescribed Performance tracking control for unknown underactuated torpedo-like AUVs | |
Habas et al. | Inverted Landing in a Small Aerial Robot via Deep Reinforcement Learning for Triggering and Control of Rotational Maneuvers | |
Kastritsi et al. | A pHRI Framework for Modifying a Robot's Kinematic Behaviour via Varying Stiffness and Dynamical System Synchronization | |
US11282254B2 (en) | Full-body modeling method and apparatus based on model predictive control with visuomotor system | |
CN110785723B (zh) | 一种飞行轨迹复演方法、装置、服务器及存储介质 | |
WO2024089728A1 (ja) | 遠隔操縦装置、移動体遠隔操縦システム、移動体制御装置、画像表示装置、移動体および遠隔操縦方法 | |
US20240094736A1 (en) | Robot navigation in dependence on gesture(s) of human(s) in environment with robot | |
Habas et al. | From Flies to Robots: Inverted Landing in Small Quadcopters with Dynamic Perching |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20211020 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220607 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20220802 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20220927 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20221121 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20221206 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20221219 |
|
R151 | Written notification of patent or utility model registration |
Ref document number: 7207393 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R151 |