JP7391635B2 - 制御システム - Google Patents
制御システム Download PDFInfo
- Publication number
- JP7391635B2 JP7391635B2 JP2019215401A JP2019215401A JP7391635B2 JP 7391635 B2 JP7391635 B2 JP 7391635B2 JP 2019215401 A JP2019215401 A JP 2019215401A JP 2019215401 A JP2019215401 A JP 2019215401A JP 7391635 B2 JP7391635 B2 JP 7391635B2
- Authority
- JP
- Japan
- Prior art keywords
- matrix
- neural network
- contact
- control
- force
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000013528 artificial neural network Methods 0.000 claims description 71
- 239000011159 matrix material Substances 0.000 claims description 61
- 230000033001 locomotion Effects 0.000 claims description 44
- 238000000034 method Methods 0.000 claims description 33
- 238000012545 processing Methods 0.000 claims description 7
- 230000001133 acceleration Effects 0.000 claims description 6
- 230000005484 gravity Effects 0.000 claims description 6
- 230000008569 process Effects 0.000 claims description 4
- 230000006870 function Effects 0.000 description 20
- 238000010586 diagram Methods 0.000 description 14
- 238000012549 training Methods 0.000 description 11
- 238000002474 experimental method Methods 0.000 description 9
- 238000004891 communication Methods 0.000 description 8
- 238000004364 calculation method Methods 0.000 description 7
- 239000013598 vector Substances 0.000 description 7
- 238000013459 approach Methods 0.000 description 6
- 238000003062 neural network model Methods 0.000 description 6
- 230000007246 mechanism Effects 0.000 description 4
- 238000003860 storage Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000015654 memory Effects 0.000 description 3
- 238000005457 optimization Methods 0.000 description 3
- 230000008901 benefit Effects 0.000 description 2
- 238000013461 design Methods 0.000 description 2
- 230000004069 differentiation Effects 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000005070 sampling Methods 0.000 description 2
- 230000004913 activation Effects 0.000 description 1
- 238000000540 analysis of variance Methods 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 238000005183 dynamical system Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000002360 preparation method Methods 0.000 description 1
- 230000000306 recurrent effect Effects 0.000 description 1
- 230000002787 reinforcement Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000004513 sizing Methods 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000007492 two-way ANOVA Methods 0.000 description 1
- 238000010200 validation analysis Methods 0.000 description 1
- 230000003936 working memory Effects 0.000 description 1
Landscapes
- Manipulator (AREA)
Description
図10は、このようなモデル予測制御の手続きを説明するための概念図である。
図1は、本実施の形態におけるフィンガーロボットで使用される関節構造の構成事例を示す図である。
(制御ソフトウェアの構成)
図2は、制御装置20において、制御信号を生成する制御プログラムの構成と動作を説明するための概念図である。
(ニューラルネットワークのモデル予測制御の構成)
以下では、ニューラルネットワークのモデル予測制御 (NN-MPC) フレームワークの背景をまとめる。
従来の技術では、ニューラルネットワークとしては、全接続されたネットワーク(非特許文献5)や繰り返しニューラルネットワーク(非特許文献4)が使用された。
これに対して、ダイナミクス関数fを表すために、本実施の形態のモデルでは、構造化ニューラルネットワークを使用する。
また、モデル予測制御に関しては、有限ホライズン T、コスト関数 l(x, u)、および、終末コスト lf (x) を指定して、制御シーケンス U0≡{u0,u1,…, uT-1}と総コスト関数 J(x0, U0) を、以下の式(2) として定義する。
公知文献:N. Heess, S. Sriram, J. Lemmon, J. Merel, G. Wayne, Y. Tassa, T. Erez, Z. Wang, A. Eslami, M. Riedmiller et al., “Emergence of locomotion behaviours in rich environments,” arXiv preprint arXiv:1707.02286, 2017. [Online]. Available: https://arxiv.org/pdf/1707.02286
Available: http://proceedings.mlr.press/v37/schulman15.pdf
簡単に言えば、反復線形二次レギュレータでは、制御対象のダイナミクスとコスト関数は、それぞれ、直線的および二次的に近似され、次にガウスニュートン法に類似の方法を用いて、iLQRの制御シーケンスを最適化する。
(構造化 NN-MPCについての方法)
以下では、慣性行列を明示的に表現したネットワークモデルを使用する構造化 NN-MPCについて説明する。
(1 ロボットダイナミクスをモデル化する構造化ニューラルネットワーク)
式(1)でのロボットの離散時間のダイナミクスを、以下の状態変数xで考えてみる。
(2 構造化ニューラルネットワークダイナミクスによるモデルベース制御)
図4で説明した構造化ニューラルネットワークに対して、接触リッチなタスクを学習するために、2段階のモデル学習方法を採用する。
(3 構造化ニューラルネットワークダイナミクスによるモデルベース制御)
学習処理がされた構造化ニューラルネットワークを用いて、式(4a)または式(4b)で示されるようなフィンガーロボットのシステムダイナミクスが表されるとの前提で、さらに、反復線形二次レギュレータ(iLQR)を使用して最適な制御シーケンスU*を決定するには、システムダイナミクスfとコスト関数lの導関数 (fx, fu, lx, lxxなど) を計算する必要がある。これらの計算のためのアルゴリズムは、通常は、時間を要するものとなる。
ただし、コスト関数は設計の対象となるため、解析的に微分可能なものとできる。
ii)勾配ベクトルの計算は nに関して相互に独立しているため、並列化できる。
iii)すべての計算は、通常ニューラルネットワークの演算処理に使用される並列演算に適したGPU (Graphics Processing Unit)ではなく CPU(Central Processing Unit:中央演算処理装置) で実行する必要がある。CPU と GPU 間のデータ転送コストは、GPU の高速線形代数計算の利点を超えることになるからである。
(実験の構成)
以下に説明する通り、接触リッチなタスクとして、「実際の」3DoF(自由度) フィンガーロボットを使用したトラックボール操作タスクを検討した。その結果、明示的な慣性行列表現を持つ制約付きネットワークモデル (この実施の形態では構造化 NN-MPC と呼ばれるフレームワーク) の制御パフォーマンスが、標準の全接続されたネットワークモデルの制御パフォーマンスよりも優れていることがわかった。
(1 システムのセットアップ)
制御の対象となるのは5DoF(自由度)のロボットフィンガーであり、トラックボールをロボットフィンガーが駆動するシステムである。
この制御信号は、所望のトルクを表し、モータドライバによって所望の電流に変換される。この実験では、システムにはコンタクトセンサーが取り付けられていなかったが、接触ダイナミクスはEネットワークモデルで潜在的に表現されている。
(2 ニューラルネットワークダイナミクスモデルのトレーニング)
クラウドサービスで提供されているディープラーニングフレームワークを使用して、構造化ニューラルネットワークを実装した。この実験では、ロボットとトラックボールシステムの性質上、Mネットワークに以下のような追加の制約を適用した。
(3 パフォーマンス評価)
図6は、ロボットの動きに合わせて移動する画像中の車を示す概念図である。
したがって、NN-MPCフレームワークは、ロボットとトラックボール間の接触力を介してトラックボールを回転させるために、ロボットのための制御信号を導出する必要があった。トライアル中のパフォーマンスは、式(7)であらわされるMPC コストの合計として定義されたこのゲームSのスコアによって評価された。
(実験結果)
(1 構造化 NN-MPC の制御パフォーマンス)
全接続されたネットワークを使用して、構造化 NN-MPC と標準 NN-MPC の両方をテストした。
(2 MPCにおける制御周波数の影響)
上述の実験では、制御時間ステップをΔt=10msに固定し、接触リッチな作業において制御ロボットに高周波制御が必要であることを確認するために、それぞれ10、20、30ms(100、50、33Hz)のように様々な制御時間ステップで実験を繰り返した。10ミリ秒の時間ステップを持つ構造化NN-MPCはコースを完了することができたが、より長い時間ステップでは、コースに従うことができない傾向があった。
(3 異なるネットワークモデル間の比較)
ドライビングゲームタスクの15の試験に対して、各ネットワークでNN-MPCをテストした。
以上説明した通り、接触リッチなタスクモデルを習得するための2段階のトレーニング手順とすることで、構造化NN-MPCフレームワークが有用であることがわかる。構造化ネットワークモデルでは、慣性行列が明示的に表されているので、接触ダイナミクスが潜在的に予測された。
Claims (5)
- 複数のパラメータで状態が規定される多関節の構造体を目標状態となるように駆動するための制御システムであって、
前記複数のパラメータを計測するためのセンサと、
制御信号で制御され、前記多関節の構造体の関節を駆動するためのアクチュエータ手段と、
前記制御信号を生成するための制御手段とを備え、
前記制御手段は、
前記多関節の構造体のダイナミクスをモデル化するニューラルネットワークと、
前記ニューラルネットワークで予測される前記ダイナミクスに基づいて、前記制御信号を、反復線形二次レギュレータによるモデル予測制御で生成するレギュレータ手段とを含み、
前記ニューラルネットワークは、学習処理として、
前記多関節の構造体が、接触して駆動するべき対象に接触していない状態で、ランダムな動きの非接触運動の学習データを収集し、非接触の学習データにより前記ニューラルネットワークを学習させて非接触モデルを生成し、
オペレータによって前記対象に前記構造体の一部を接触させて生成された動きに応じた前記パラメータを測定し、前記非接触モデルを使用して、接触運動の学習データを収集し、収集された前記接触運動の学習データにより、学習処理を実施して、接触状態でのダイナミクスのモデルを生成する、制御システム。 - 前記ニューラルネットワークは、
前記構造体の運動を表現する一般化座標の加速度を、コリオリ力および重力を表す第1の力関連行列と関節トルクおよび外部接触力を表す第2の力関連行列との和と逆慣性行列との積で表すとき、
前記逆慣性行列を表現する第1のニューラルネットワークと、
前記第1の力関連行列を表現する第2のニューラルネットワークと、
前記第2の力関連行列を表現する第3のニューラルネットワークとを含む、請求項1記載の制御システム。 - 前記ニューラルネットワークは、
前記構造体の運動を表現する一般化座標の加速度を、コリオリ力および重力を表す行列と関節トルクおよび外部接触力を表す第2の行列とを統合した統合力関係行列と逆慣性行列との積で表すとき、
前記逆慣性行列を表現する第1のニューラルネットワークと、
前記統合力関係行列を表現する第2のニューラルネットワークとを含む、請求項1記載の制御システム。 - 前記逆慣性行列の逆行列は、対称な正定値行列である、請求項2または3記載の制御システム。
- 前記逆慣性行列は、前記構造体と前記対象とに対応する要素が、分割して配置される対称行列である、請求項2または3記載の制御システム。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019215401A JP7391635B2 (ja) | 2019-11-28 | 2019-11-28 | 制御システム |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP2019215401A JP7391635B2 (ja) | 2019-11-28 | 2019-11-28 | 制御システム |
Publications (2)
Publication Number | Publication Date |
---|---|
JP2021084188A JP2021084188A (ja) | 2021-06-03 |
JP7391635B2 true JP7391635B2 (ja) | 2023-12-05 |
Family
ID=76088698
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP2019215401A Active JP7391635B2 (ja) | 2019-11-28 | 2019-11-28 | 制御システム |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP7391635B2 (ja) |
Families Citing this family (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113771081B (zh) * | 2021-07-06 | 2024-04-30 | 清华大学 | 一种基于物理的虚拟人手自动抓取方法及装置 |
CN115107031A (zh) * | 2022-07-15 | 2022-09-27 | 广州数控设备有限公司 | 基于神经网络的机器人拖动示教方法、装置、设备和介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050187643A1 (en) | 2004-02-19 | 2005-08-25 | Pavilion Technologies, Inc. | Parametric universal nonlinear dynamics approximator and use |
JP2016215357A (ja) | 2015-05-26 | 2016-12-22 | 国立大学法人 名古屋工業大学 | パラメータ推定装置、パラメータ推定方法、プログラム及び制御装置 |
JP2017170553A (ja) | 2016-03-23 | 2017-09-28 | 国立大学法人 東京大学 | 制御方法 |
JP2019171540A (ja) | 2018-03-29 | 2019-10-10 | ファナック株式会社 | 機械学習装置、機械学習装置を用いたロボット制御装置及びロボットビジョンシステム、並びに機械学習方法 |
Family Cites Families (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5673367A (en) * | 1992-10-01 | 1997-09-30 | Buckley; Theresa M. | Method for neural network control of motion using real-time environmental feedback |
JPH0736505A (ja) * | 1993-07-21 | 1995-02-07 | Nkk Corp | 制御対象の同定・制御方法 |
JP3436320B2 (ja) * | 1994-04-18 | 2003-08-11 | 富士通株式会社 | 非線形システムの出力軌道と動特性の制御方法および装置 |
-
2019
- 2019-11-28 JP JP2019215401A patent/JP7391635B2/ja active Active
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20050187643A1 (en) | 2004-02-19 | 2005-08-25 | Pavilion Technologies, Inc. | Parametric universal nonlinear dynamics approximator and use |
JP2016215357A (ja) | 2015-05-26 | 2016-12-22 | 国立大学法人 名古屋工業大学 | パラメータ推定装置、パラメータ推定方法、プログラム及び制御装置 |
JP2017170553A (ja) | 2016-03-23 | 2017-09-28 | 国立大学法人 東京大学 | 制御方法 |
JP2019171540A (ja) | 2018-03-29 | 2019-10-10 | ファナック株式会社 | 機械学習装置、機械学習装置を用いたロボット制御装置及びロボットビジョンシステム、並びに機械学習方法 |
Also Published As
Publication number | Publication date |
---|---|
JP2021084188A (ja) | 2021-06-03 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Jin et al. | Robot manipulator control using neural networks: A survey | |
Thuruthel et al. | Learning dynamic models for open loop predictive control of soft robotic manipulators | |
Bekey et al. | Neural networks in robotics | |
Slotine et al. | On the adaptive control of robot manipulators | |
KR102003216B1 (ko) | 로봇을 위한 모터 제어 및/또는 조정 | |
Killpack et al. | Model predictive control for fast reaching in clutter | |
EP1974869A1 (en) | Apparatus and method for generating and controlling the motion of a robot | |
Sharkawy et al. | A neural network-based approach for variable admittance control in human–robot cooperation: online adjustment of the virtual inertia | |
JP7295421B2 (ja) | 制御装置及び制御方法 | |
JP2013003845A (ja) | 組み込み知能コントローラ、制御システム、制御プログラム、記録媒体、及び制御方法 | |
JP2014006566A (ja) | 組み込み知能コントローラ、制御システム、制御プログラム、記録媒体、及び制御方法 | |
JP7391635B2 (ja) | 制御システム | |
Gu et al. | Development and implementation of a real-time open-architecture control system for industrial robot systems | |
Mazare et al. | Adaptive variable impedance control for a modular soft robot manipulator in configuration space | |
Grazioso et al. | Modeling and simulation of hybrid soft robots using finite element methods: Brief overview and benefits | |
Zhang et al. | Time delay compensation of a robotic arm based on multiple sensors for indirect teaching | |
Adel et al. | End-effector position estimation and control of a flexible interconnected industrial manipulator using machine learning | |
Khanesar et al. | A Neural Network Separation Approach for the Inclusion of Static Friction in Nonlinear Static Models of Industrial Robots | |
Xu et al. | An accurate identification method based on double weighting for inertial parameters of robot payloads | |
KR101227092B1 (ko) | 로봇의 동작 제어 시스템 및 동작 제어 방법 | |
Yin et al. | Active tracking of unknown surface using force sensing and control technique for robot | |
Zhu et al. | Vision-admittance-based adaptive RBFNN control with a SMC robust compensator for collaborative parallel robots | |
Kasaei et al. | Data-efficient non-parametric modelling and control of an extensible soft manipulator | |
Knani | Dynamic modelling of flexible robotic mechanisms and adaptive robust control of trajectory computer simulation––Part I | |
Dash et al. | Inverse kinematics solution of a 6-DOF industrial robot |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
RD02 | Notification of acceptance of power of attorney |
Free format text: JAPANESE INTERMEDIATE CODE: A7422 Effective date: 20220913 |
|
A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20221017 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230222 |
|
A977 | Report on retrieval |
Free format text: JAPANESE INTERMEDIATE CODE: A971007 Effective date: 20230823 |
|
A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230829 |
|
A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20231010 |
|
TRDD | Decision of grant or rejection written | ||
A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20231024 |
|
A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20231122 |
|
R150 | Certificate of patent or registration of utility model |
Ref document number: 7391635 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |