JPH07319507A - ロボット制御装置 - Google Patents

ロボット制御装置

Info

Publication number
JPH07319507A
JPH07319507A JP6112359A JP11235994A JPH07319507A JP H07319507 A JPH07319507 A JP H07319507A JP 6112359 A JP6112359 A JP 6112359A JP 11235994 A JP11235994 A JP 11235994A JP H07319507 A JPH07319507 A JP H07319507A
Authority
JP
Japan
Prior art keywords
neural network
control
actuator
learning
robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6112359A
Other languages
English (en)
Inventor
Ozukan Mahametsudo
オズカン マハメッド
Koichi Negishi
公一 根岸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Bridgestone Corp
Original Assignee
Bridgestone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Bridgestone Corp filed Critical Bridgestone Corp
Priority to JP6112359A priority Critical patent/JPH07319507A/ja
Publication of JPH07319507A publication Critical patent/JPH07319507A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)
  • Control Of Position Or Direction (AREA)
  • Manipulator (AREA)

Abstract

(57)【要約】 (修正有) 【目的】 ロボットの運動軌道を、遅れ時間無しで、高
精度に制御する。 【構成】 一軸毎に位置制御とアクチュエータ制御を受
け持つ、二つのニューラルネットから構成された、ロボ
ット軌道のオープンループ制御装置に関するものであ
る。制御対象の動力学パラメータは、位置制御用のバッ
クプロパゲーションのニューラルネット上で一般化デル
タ則を用いて学習される。また、アクチュエータの伝達
関数パラメータは、別のニューラルネットの組み合わせ
によって学習される。アクチュエータ用の圧力センサや
位置センサが、それぞれのニューラルネットの独立した
学習に使われる。このセンサ信号は、ニューラルネット
の学習のみに使われ、制御段階ではフィードバックルー
プは存在しない。制御段階と学習段階は、ニューラルネ
ットを有効に割り当て、1サンプリング内で実行され
る。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ロボットの運動及び軌
道を制御するロボット制御装置に関する。
【0002】
【従来の技術】人間の手の動きと同様な動作は、メカニ
カルなアームを持ったロボットによって実現されてい
る。このようなロボットのアームは、可動または固定関
節で接続されたリンクの結合構造体で、関節をアクチュ
エータで駆動することで動作されている。またロボット
アームの運動軌道は、関節での回転角、回転速度、加速
度、に変換できる。
【0003】ロボットアームを制御する上でロボットア
ームのエンドエフェクタの運動軌道つまり、ロボットの
手先の運動軌道を制御することは重要である。このエン
ドエフェクタの運動軌道は、そこに至る各関節の運動軌
道を統合する事で実現される。従って、共通または独立
に各関節を駆動しているアクチュエータの生み出す出力
は、ロボットシステム全体を制御するべく調節される必
要がある。
【0004】多関節型のロボットアームは、姿勢により
慣性モーメントが変化する事や、関節間に干渉があり、
アクチュエータのトルクが他の関節に影響を与える等の
為、非線形性が強い。さらにアクチュエータやアクチュ
エータの出力を制御するアクチュエータ制御系の非線形
特性がそれに加わり、多関節型ロボットアームの制御は
一般に難しい。
【0005】このようなロボットアームの制御には、局
所的に設計されたフィードバックループによるPID制
御を用いたロボット制御装置が使われている。この制御
方法は、予めPID定数を決定しておき、制御段階にお
いては、制御対象に取り付けられた、例えば、位置検出
手段等により得られる制御量によって操作量を決定し、
制御対象に操作を加える制御方法である。しかしなが
ら、よく調整されたPID制御装置でも、制御対象の応
答が極度に遅い場合やアクチュエータのコンプライアン
スが大きい場合には、この、フィードバック信号への依
存性が欠点となる。つまり位置の誤差がフィードバック
される時点で、すでに位置を補正するには遅すぎるとい
う問題が生じてしまう。このことは、特に速度や加速度
の大きい動作軌道で顕著である。
【0006】そのような場合制御系の設計者は、精度ま
たは速度において妥協することになり、軌道制御におい
て良い結果が得られなかった。
【0007】さらに、フィードバックをやめて目標とな
る関節軌道から直接制御に必要な制御量を計算する方法
が提案されている。この方法は厳密な制御対象のモデル
を作りそのモデルから得られたパラメータの推定に基づ
くオープンループ制御である。しかしながら、多関節ロ
ボットアームなどの非線形システムは、前述の非線形性
を持つために良いモデルを立てることと精密なパラメー
タ推定を行うことが、実際には非常に困難であり、殆ど
実現されていない。
【0008】近年、人工のニューラルネットが、非線形
な制御対象の挙動をまねるように学習され得ることが示
されてきている。
【0009】ニューラルネットワークは、人間の脳にお
ける神経回路網を簡略化したモデルである。それは神経
細胞ニューロンと、ニューロンをリンクで介したシナプ
ス結合でよって構成されている。ニューロン間の信号の
伝達はシナプス結合を通して行われ、この結合の強度を
適当に調整することにより、様々な情報処理が可能とな
る。各ニューロン素子では、他のニューロン素子からの
出力をシナプス結合の重み付けをして入力し、それらの
総和を非線形応答関数の変数を加えて再度他のニューロ
ン素子へ出力する。
【0010】従って上記のようなニューラルネットワー
クは、ある入力に対する望ましい出力と実際の出力との
誤差からシナプス結合の強度を修正し、種々の入力に対
して望ましい出力を常に得られるようにする事が出来
る。これがニューラルネットワークの学習機能である。
【0011】ニューラルネットワークの学習方法は、一
般的には、バックプロパゲーションとよばれる最適化手
法を用いて行われる。以下にその最適化手法を示す第1
図はニューラルネットワークを示す図であり、1はニュ
ーロン素子を示し、各ニューロン素子は生体系のアクソ
ンに相当するリンク2で結合され、ニューロン素子iと
ニューロン素子jは生体系のシナプス結合の重みに相当
する結合加重Wijで結合されている。
【0012】一般にニューロン素子(ノード)は、図1
に示すように層構造内に存在する。最初の層は、入力デ
ータを受け取る入力層と呼ばれる。最後の層は出力層
で、中間の層は隠れ層と呼ばれる。
【0013】2つのニューロン素子i、j間の結合は、
リンクと呼ばれ、結合の強度は、図1のようにWjiであ
らわされ、生体に於ける神経細胞のシナプス結合に対応
している。入力と出力の組合せで構成される与えられた
教示データに対して、全ての結合強度の正確な値を見つ
け出すのが学習に相当する。学習段階においては、信号
の伝搬に2種類のモードがある。
【0014】第1の信号の伝搬モードは、前進伝搬で入
力層のニューロン素子は、入力ベクトルを受け取り、出
力値を計算する。ニューロン素子jの入力は、
【0015】
【数1】 ここで、nはニューロン素子jと結合しているニューロ
ン素子の数である。学習対象が非線形ならば、ニューロ
ン素子jの出力は数2で表される、飽和特性を持つ単調
増加関数の、通常はシグモイド関数で計算される。
【0016】
【数2】 第2の信号の伝搬モードは、逆伝搬で出力誤差は、入力
ベクトルに対応して、教示出力と計算出力を比較するこ
とにより計算される。その後、学習アルゴリズムを使っ
て、結合の強度を調整する目的で、中間層に向かって伝
搬していく。
【0017】出力誤差が教示データに対して、目標とす
る最小のレベルまで減少すれば、その学習済みのニュー
ラルネットワークは、未知の入力パターンに対してシス
テムの出力を計算する前進伝搬に利用できる。
【0018】一般化デルタ則はバックプロパゲーション
(BP)ニューラルネットワークの結合荷重を調整する
ための学習アルゴリズムである。BPの出力ノードの出
力誤差は次式で定義される。
【0019】
【数3】 ここで、tは出力ニューロン素子に対する教示値で、M
は出力ニューロン素子の総数である。デルタ則は、結合
荷重を調整するのに、最急降下法を使う。したがって、
結合荷重Wjiの修正量は、次式で定義される。
【0020】
【数4】 更に、ニューロン素子jに対して、δj を次式で定義す
る。
【0021】
【数5】 変形して、
【0022】
【数6】 この式と数3より
【0023】
【数7】
【0024】
【数8】 更に、ニューロンの非線形応答関数に数2のシグモイド
関数を用いると
【0025】
【数9】 一方数1より
【0026】
【数10】
【0027】数7、数9、数10より出力ニューロン素
子に対する数4を書き直すと、
【0028】
【数11】 以上の学習則がデルタ則と呼ばれるものである。ここ
で、δj は出力誤差の関数で、隠れ層から直接に利用で
きない。出力ノードの誤差量を内部の層に伝搬するアル
ゴリズムは、1986年にRumelhart らによって、紹介され
ており、デルタ則を一般化した形態を取り、一般化デル
タ則(GDR)と呼ばれる。学習則にGDRを採用した
ニューラルネットワークは、バックプロパゲーションニ
ューラルネットワークと呼ばれる。GDRで、隠れ層に
対するδj は、
【0029】
【数12】 ところが、
【0030】
【数13】 したがって、シグモイド関数を使ったGDRは、
【0031】
【数14】 t回目にニューロン素子iとjの結合強度は、次式で修
正される。
【0032】
【数15】 ここで、uとαは各々、学習定数、安定化定数である。
両者を動的に変化させる方法もあるが、普通は実験的に
求めた定数を使えば十分である。以上のバックプロパゲ
ーションニューラルネットワークが一般化デルタ則(G
DR)で学習する多層の非線形ニューラルネットワーク
を数学的にうまく記述した学習モデルである。
【0033】この学習則は、生体の神経細胞の振る舞い
から考案されたもので、最急降下法に基づく一般化デル
タ則は、ニューラルネットの実用例において、最も効果
的な学習技術になってきている。
【0034】以上のような、学習によって、ニューラル
ネットワークが制御段階で入出力の事例に含まれる一般
的な対応関係を獲得し再現するようになる。従って、制
御対象が非線形特性を有するロボットの制御を上記のニ
ューラルネットワークを用いた制御装置で、フィードバ
ックループを持たない、オープンループ制御を行うこと
が考えられる。
【0035】
【発明が解決しようとする課題】ところが、前述の通り
ロボットアームの運動軌道の制御は、いくつかの非線形
な関係を制御することを含んでいる。つまり一つ目は、
エンドエフェクタ座標系と関節座標系の関係であり、二
つ目は、関節位置とアクチュエータ入力信号の関係であ
り、さらに、三つ目は、アクチュエータの入出力の関係
である。
【0036】一般的にニューラルネットワークの層は、
数が多いほどより多くの制御対象の非線形特性を学習出
来る。従って、非線形な関係を複合して含んでいるロボ
ットアームの特性をニューラルネットワークで学習する
ためには、その特性を学習するのに十分な層を持つ事が
必要である。ところが、このようなニューラルネットワ
ークは、ロボットアームの軌道が与えられた目標軌道に
同じかまたは非常に近くなるまで、何組かの教示軌道を
用いて、単独のニューラルネットワークにロボットアー
ムの全特性を学習させてロボットを制御するが、教示用
軌道に対しては満足できる動きを実現するかもしれない
が、教示用軌道の組みが関節座標の全体を代表するよう
な配慮で選ばれない場合には、教示用軌道に含まれなか
った軌道については良い制御結果を生まない可能性があ
る。
【0037】また、複雑な動きをロボットアームにさせ
る際の目標軌道の連続した変化や、ロボットの環境や構
成の変化に適応できる、ニューラルネットワークのオン
ライン学習と、ロボットアームの実時間における操作を
制御するリアルタイム制御を行う場合には、ニューラル
ネットワークへのサンプリング期間内にすべてのニュー
ラルネットワークの計算処理を終了することが必要であ
る、つまりコントロール信号の計算とシナプス結合の重
みを調整する処理の全てがサンプリング期間内に終了す
るようにニューラルネットを構成することが必要であ
る。
【0038】ニューラルネットワークの学習は層が一つ
増える毎に必要な計算時間が二乗に比例して増大するた
め、サンプリング期間内にすべてのニューラルネットワ
ークの計算処理を終了する為には、ニューラルネットの
大きさを適切に構成しなければならない。しかしなが
ら、ロボット制御に関わるすべての非線形特性を学習す
るのに十分な大きさのニューラルネットワークは、リア
ルタイム制御とオンライン学習を可能とする学習時間を
実現する事は難しい。
【0039】本発明は上記問題点を解決するためになさ
れたものであり、この発明の主な目的は、ロボットの制
御段階においてフィードバック信号に依存せず、また、
対象ロボットアームの厳密なモデルを作ることなしに、
オープンループ制御を利用して高精度且つ高速なロボッ
ト制御を可能とし、またロボット制御装置が環境や構成
の変化に適応できるオンライン学習及びリアルタイム制
御を可能とするロボット制御装置を提供することにあ
る。
【0040】
【問題を解決するための手段】前記目的を達成するため
に、請求項1に記載のロボット制御装置は、非線形特性
を有する複数の制御対象と、前記それぞれの制御対象に
ニューラルネットワークを備え、このニューラルネット
ワークにそれぞれの制御対象の非線形特性を学習させる
ことにより、ロボットの運動軌道を制御させるようにし
たことを特徴とするロボット制御装置であることを特徴
としている。
【0041】請求項2に記載のロボット制御装置は、前
記ニューラルネットワークが、ロボットアームの運動軌
道とこの運動軌道を制御するために前記ロボットアーム
を駆動するアクチュエータの目標出力との関係を学習す
る位置制御ニューラルネットワークと、前記アクチュエ
ータの伝達関数を学習するアクチュエータニューラルネ
ットワークとからなる請求項1に記載のロボット制御装
置であることを特徴としている。
【0042】
【作用】請求項1に記載のロボット制御装置では、ロボ
ットの制御対象が持つ非線形特性をその非線形特性ごと
に学習するニューラルネットワークを備えている。その
ため、ロボットの制御対象が持つ複雑な非線形特性を学
習するために、極端に多数のニューロン素子を持つ多数
の中間層からなるニューラルネットワークを使うことな
しに、適当なサイズのニューラルネットワークがそれぞ
れ制御対象の特性を学習する。
【0043】従って、コントロール信号の計算とシナプ
ス結合の重みを調整する処理の全てが、オンライン学習
及びリアルタイム制御を可能とするサンプリング時間内
に終了する事が可能であり、リアルタイムであって、高
精度且つ環境や構成の変化に適応する制御を行える。
【0044】請求項2に記載のロボット制御装置では、
ロボットアームの運動軌道とこの運動軌道を生成するた
めに前記ロボットアームを駆動するアクチュエータの目
標出力との関係を学習する位置制御ニューラルネットワ
ークと、アクチュエータの伝達関数を学習するアクチュ
エータニューラルネットワークとを備え、前記アクチュ
エータニューラルネットワークは、前記位置制御ニュー
ラルネットワークの出力ポートに接続されている。
【0045】そして、適当な大きさのニューラルネット
ワークがロボットアームの運動軌道とアクチュエータの
目標出力の間の非線形性及び、アクチュエータの入出力
の間の非線形性をそれぞれ独立して学習する。
【0046】動作制御段階では、目標軌道が与えられる
と、前記位置制御ニューラルネットワークがアクチュエ
ータの目標出力値を計算しその信号を、アクチュエータ
ニューラルネットワークの入力ポートへを送る。更に、
アクチュエータニューラルネットワークは、アクチュエ
ータの目標出力値を得るのに必要なアクチュエータ制御
量を計算する。
【0047】従って、コントロール信号の計算とシナプ
ス結合の重みを調整する処理の全てが、オンライン学習
及びリアルタイム制御を可能とするサンプリング時間内
に終了する事が可能であり、例えばロボットアームとア
ームを駆動するアクチュエータの非線型特性が大きいロ
ボットのアームを制御する場合において、リアルタイム
であって、高精度且つ環境や構成の変化に適応する制御
を行える。
【実施例】
【0048】以下本発明の一実施例を詳細に説明する。
図3及び図4は本発明のロボット制御装置を適応したロ
ボットアームの正面図及び側面図を示した図である。同
図において、ロボットアーム6は可動な関節9〜12を
持つ4自由度のアームであり、それぞれの関節は、アク
チュエータとして空気の供給により膨径変形し軸線方向
に収縮力を生じる、例えば特公昭52−40378号に
開示されたエアバックタイプの弾性収縮体14を少なく
とも2本で一組とし、複数組用いて所定自由度(4自由
度)のロボットアーム6としている。尚、個々の自由度
方向におけるロボットアーム6の運動量は、その関節を
構成する回転軸に関連して設けられた光または磁気式の
ロータリーエンコーダ8により検知することができる。
また個々の弾性収縮体14は、図示しないサーボバルブ
及びサ−ボドライバによってアクチュエータに導入され
る空気圧を制御している。10は、ロボットアームのエ
ンドエフェクタ(手先)13を示し、実際には、この手
先13につかみ装置や、溶接装置、スプレーガン等をセ
ットすることで様々な用途にロボットアームを使用でき
る。
【0049】図5は弾性収縮体14による各関節の駆動
方法を示した図であり、このモデルが1自由度関節に対
応するモデルである。弾性収縮体14は図5のように二
本の弾性収縮体14をプーリ15に巻回したワイヤー1
6によって相互に連結している。プーリ15は二本の弾
性収縮体14に供給する空気圧の差圧により回動移動で
きる。即ち二本の弾性収縮体14は互いに対抗する軸力
を発生して、その合成力が回転関節のトルクを生み出
す。
【0050】従って、関節でのトルクは次式で定義され
る。
【0051】
【数16】 rはプーリ15の半径 F2:加圧側弾性収縮体の収縮力 F1:減圧側弾性収縮体の収縮力
【0052】弾性収縮体単体の出力即ち、内圧と収縮量
の関係は、図6に示す通りである。この図において縦軸
は弾性収縮体の収縮力、横軸は収縮率を現している。ま
た、収縮量εは次式で定義される。
【0053】
【数17】 ここで、Lo は初期長さ、Lは収縮時の長さである。
【0054】アーム各軸のそれぞれの弾性収縮体はサー
ボバルブで空気圧を制御している。サーボバルブはPI
フィードバック制御ボードを実装した空気圧のサーボバ
ルブである。PIコントローラの目的は、目標圧力レベ
ルを維持することである。
【0055】図7は本発明のロボット制御装置で軌道制
御される、ロボットアームのエンドエフェクタ(手先)
13周辺を示した図である。17、18はベベルギャを
示し、この2つのベベルギャ17にそれぞれプーリ15
を介して、接続される2本一組4本の弾性収縮体14に
よってエンドエフェクタ13の軸19に関する回転運動
と、ベベルギャ17の回転軸を中心とする回転運動を行
っている。また、関節11及び12の位置は、光エンコ
ーダ8によって検出している。この光エンコーダ8は、
関節9〜12に同じように取り付けられそれぞれの関節
の位置を検出している。
【0056】図2は、本発明のロボット制御装置のブロ
ック図を示したものである。本発明のロボット制御装置
は、運動軌道変換部3、位置制御ニューラルネットワー
ク4(PONNET)、アクチュエータニューラルネッ
トワーク5(ANNET)、PLANT6、(本実施例
では前記のロボットアーム)、アクチュエータセンサ7
(実施例では圧力センサ)、位置センサ8(実施例では
エンコーダ)から構成されている。本発明のロボット制
御装置は信号伝搬の異なる段階である学習サイクルと制
御サイクルとから構成されている。それぞれ実線部が制
御サイクル、破線部が学習サイクルを現す。さらに学習
サイクルの内、l1サイクルはアクチュエータニューラ
ルネットワークの学習サイクルを、l2サイクルは位置
制御ニューラルネットワークの学習サイクルを示す。
【0057】図8に本実施例のロボット制御装置のハー
ドウェア構成を示す。20〜23はロボットアームの可
動関節9〜12を駆動するアクチュエータである。これ
らのアクチュエータ20〜23は、各アクチュエータに
制御圧力を供給するサーボバルブをコントロールするサ
ーボドライバ24によって制御されている。また各軸の
アクチュエータはアクチュエータ毎に取り付けられた圧
力センサ7によってアクチュエータの制御圧力が検出さ
れる。更に、各関節の角度はエンコーダ8で検出され、
エンコーダ8からのパルス値を取り込み積算するカウン
タ機能部25に送られる。トランスピュータTr2〜T
r5はニューラルネットワークの演算処理と、サーボド
ライバの制御信号及び、ニューラルネットワークの学習
のために使われる圧力センサやエンコーダからの検出信
号の入出力処理を行うトランスピュータである。このト
ランスピュータTr2〜Tr5は、ホストコンピュータ
のコマンドを解釈するユーザーインタフェース及び逆運
動力学によるパラメータ計算を行っているTr1トラン
スピューを介して、これらTr1トランスピュータ及び
Tr2〜Tr5トランスピュータを統合しているホスト
コンピュータに接続されている。
【0058】図9はTr1〜Tr5トランスピュータの
構成及び、本実施例のロボット制御装置のソフトウェア
構成を示した図である。Tr1〜Tr5トランスピュー
タは、お互いに高速で信頼性の高い通信を可能とする4
つのシリアルポートLINK0〜LINK3を備え、そ
れぞれのトランスピュータが相互に接続されている。ま
たTr2には、A/D、D/A等の周辺装置が接続され
ている。Tr1トランスピュータでは、ユーザインター
フェースでホストコンピュータからのコマンドを解釈
し、次いでロボットアームの目標運動軌道から目標の関
節軌道を逆運動力学により計算を行い目標の関節軌道を
Tr2に送る。Tr2トランスピュータは、入力モジュ
ールNET INと、位置制御ニューラルネットワーク
(PONNET)及びアクチュエータニューラルネット
ワーク(ANNET)と、ニューラルネットワークの出
力モジュールNET OUTと、A/D、D/A及びカ
ウンタ機能部を介してサーボドライバや、各センサ類に
接続される入出力モジュールから成っている。Tr3〜
Tr5トランスピュータは入力モジュールNET IN
と、位置制御ニューラルネットワーク(PONNET)
及びアクチュエータニューラルネットワーク(ANNE
T)と、ニューラルネットワークの出力モジュールNE
T OUTを備えている。
【0059】Tr2の入力モジュールNET INに入
力された目標の関節軌道は、4軸アームの内1軸分のデ
ータが選ばれTr2ニューラルネットワークに取り込ま
れる。そして、その演算結果が、Tr2のNET OU
Tでホールドされる。NETINで選択されなかった他
の3軸分のデータは、Tr3〜Tr5に送られ、それぞ
れ相当するデータが各ニューラルネットワークに取り込
まれ、NET OUTでホールドされる。そしてTr5
のNET OUTまで演算が終了した後、Tr5〜Tr
2のNET OUTでホールドされている演算値が、T
r2トランスピュータで統合され入出力モジュールへ送
られ、ロボットアームの駆動信号となる。従って、ニュ
ーラルネットワークの学習に必要な圧力センサやエンコ
ーダからの検出信号は、全て、Tr2トランスピュータ
を介して行われる。尚、実施例の制御アルゴリズムは、
学習と制御の全部の処理がサンプリング周期内に終了す
るよう構成した。
【0060】図10に位置制御ニューラルネットワーク
を示す。この図において、ニューラルネットワークは、
前進方向のニューラルネットワーク26及び、後進方向
のニューラルネットワーク27を一組をして、回転角度
に対応する複数のニューラルネットワーク1〜i(実施
例では1〜100または、1〜200)を備える。28
及び29は、回転角度に対応してニューラルネットワー
クをソフトウェアー的に切り換えるスイッチを現す。各
ニューラルネットワークの前後に配置されるスイッチ3
0、31は、回転方向に依ってソフトウェアー的に切り
換えるスイッチを現す。この構成により、ラバチュエー
タの内圧と出力の関係は離散的ではあるが、線形とな
る。また、アクチュエータのヒステリシス特性を考慮す
ることが出来る。
【0061】図11に一自由度用のアクチュエータニュ
ーラルネットワークのブロック図を示す。ロボットアー
ムの関節トルクが弾性収縮体の内圧と比例するならば、
弾性収縮体の内圧を制御することにより目標トルクを得
る事が出来る。ところで、関節トルクは、2本の弾性収
縮体の内圧をそれぞれ、P0 +ΔP、P0 −ΔPに保こ
とで得られる(数16)。弾性収縮体14に取り付けら
れた圧力センサ7からの検出信号は圧力比較部32で目
標内圧と比較されその誤差量がアクチュエータニューラ
ルネットワーク(ANNET)CH1とCH2の学習に
使われる。従って、アクチュエータニューラルネットワ
ーク(ANNET)CH1とCH2の2つのニューラル
ネットワークは、それぞれの弾性収縮体の伝達率を学習
し、動作制御段階では、関節の目標トルクに対して、そ
れぞれ2本の弾性収縮体の内圧の制御量を出力する。
【0062】以下で、本実施例のロボット制御装置の制
御サイクルの動作について説明する。図2において、ロ
ボットアームの目標運動軌道は、3で各関節の回転座標
系で現される目標運動軌道ベクトルθd に変換される。
即ち、ロボットアームのエンドエフェクタ(手先)13
に至る各リンクの相対位置や姿勢の座標系は、同次変換
により表現できる。この時の変換マトリクスがアームの
運動方程式となるが、この変換マトリクスの逆変換を計
算する事で、アームのエンドエフェクタ(手先)の運動
軌道から対応する関節の運動軌道を計算できる。これら
の計算方法は、オイラーまたは、ダイナビット、ハーテ
ンベルクらの逆運動方程式が知られている。
【0063】3で変換された変換値θd が位置制御ニュ
ーラルネットワーク(PONNET)4の入力ポートに
入力され、ニューラルネットワークで制御信号が計算さ
れる。即ち、運動軌道ベクトルθd が入力層のそれぞれ
のニューロン素子に入力され、学習によって調整されて
いる各ニューロン素子間の異なる結合荷重を掛け合わ
せ、これらを加算した値に、シグモイド関数により関数
処理を施し、その結果を出力する。この値が、各関節で
の目標トルクτdとなる。
【0064】詳細は後述するが、本発明においてラクラ
ンジェ力学が、目標軌道から各関節での目標トルクτd
を計算するニューラルネットワークの入力に適した要素
データ、ここではベクトルθd 、を決めるガイドにな
る。
【0065】ラグランジェ力学は、系の運動エネルギー
と一般化座標、一般化力、時間で記述される運動方程式
である。即ち、系のラグランジアン(L)は、運動エネ
ルギ(K)と位置エネルギ(P)の差として定義され、
【0066】
【数18】 関節iでの必要な力は、
【0067】
【数19】 qは関節iでの角度や、変位を示す変数である。角度座
標では、対応するトルクはT=Frから計算できる。r
は関節軸からの力方向への垂線の長さである。
【0068】位置制御ニューラルネットワークで計算さ
れた、目標トルクτdはアクチュエータニューラルネッ
トワーク(ANNET)5へ送られる。ANNETはア
クチュエータの目標トルクτdを得るのに必要なサーボ
バルブの入力信号を計算する。即ち、本実施例のアクチ
ュエータである弾性収縮体とサーボバルブの特性を一次
遅れ伝達関数と仮定し、この逆伝達関数計算の役割をア
クチュエータニューラルネットワークにさせることで、
アクチュエータの出力が目標値τd と一致するようなサ
ーボバルブヘの入力制御信号をアクチュエータニューラ
ルネットワークで計算することができる。
【0069】以上のような、ニューラルネットワークに
よる一連の前進伝搬処理によって、ロボットアーム6の
目標軌道に対するアクチュエータ制御値を計算する。こ
れが、フィードフォワード処理で、図2の実線部に相当
する。
【0070】次に、本実施例のロボット制御装置の学習
サイクルの動作について説明する。図2における、波線
部の流れが、ロボット制御装置の学習段階をあらわす。
学習段階には、2つの同時進行の学習部分がある。(図
2のl1とl2)
【0071】学習l1では、アクチュエータの状態はア
クチュエータに取り付けられた、圧力センサ7で検出さ
れる。測定値τm は目標値τd と比較され、両者を一致
させるのが目的である。τm とτd が異なる場合、AN
NET5のパラメータが一般化デルタ則GDRアルゴリ
ズムにより、調整される。
【0072】学習l2では、各関節の位置θm がロボッ
トアームの関節に取り付けられた、位置センサ(エンコ
ーダ)8で検出され、目標値θd と比較される。関節位
置の誤差がある場合は、PONNET4のパラメータが
GDRにより調整される。
【0073】尚、学習l1終了後に学習l2が行われる
よう設定されているためアクチュエータの伝達特性が位
置制御ニューラルネットワークの学習に影響することは
ない。
【0074】上記の学習フェーズl1,l2の途中、ま
たは終了後のいずれにおいてもフィードバック信号は、
直接プラント即ち、ロボットアームに伝達されないの
で、コントローラのオープンループの特性が保たれる。
【0075】前述した位置制御ニューラルネットワーク
とアクチュエータニューラルネットワークをさらに以下
で説明する。
【0076】アクチュエータニューラルネットワーク
は、アクチュエータが目標トルクτdとなるサーボバル
ブの制御信号を得るために、アクチュエータの伝達関数
を学習することを目的としている。もちろん、アクチュ
エータの種類は、電動、空気圧、油圧等のいずれでもよ
いとする。
【0077】駆動系の機械的なロスを無視すれば、弾性
収縮体とサーボバルブからなる系の特性は1次遅れの伝
達関数と仮定できる。もちろん、出力誤差と伝達関数の
パラメータ間のある関係式を明確にできるならば、もっ
と複雑な伝達関数を設定してもよい。
【0078】ところで、システムの特性が次式であらわ
されるならば
【0079】
【数20】 ここで、yはプラント出力、xは入力信号、Tは時定
数。この時、ラプラス変換により、
【0080】
【数21】 したがって、一次遅れ系の伝達関数は
【0081】
【数22】 逆伝達関数は、
【0082】
【数23】 出力yを目標値vに遅れ時間なしで一致させるには、プ
ラントへの入力は次式となる。
【0083】
【数24】 この時、
【0084】
【数25】 時間領域では、次式に変換される。
【0085】
【数26】 この式が1次遅れ系の伝達関数を表す式であり、したが
って、1次遅れ系で目標値がv(t)ならば、入力信号は、
数26のx(t)とすれば、実際の出力y(t)はv(t)に一致す
ることになる。
【0086】今、一次遅れ系におけるアクチュエータの
応答τmは次式で表される。
【0087】
【数27】 数26と図2を参照して、
【0088】
【数28】
【0089】以上により理論上は、目標速度と加速度の
軌道がロボットの物理的な制約内にあるならば、時定数
Tがわかればアクチュエータ応答の遅れ時間を打ち消す
ことが可能である。しかし、マニピュレータには、物理
的な限界があり、目標軌道がシステムの応答以上に速い
なら、その遅れは補償できない。従って、一次遅れ系の
システムの応答遅れは、目標軌道が物理的に実現可能と
いう条件の基でのみ修正される。但し制御システムに対
する正確な時定数Tを求めなければならないため、この
式だけからアクチュエータの制御信号τaを求めること
は困難である。そこでアクチュエータニューラルネット
ワークにアクチュエータの伝達関数を学習させる。
【0090】以下、アクチュエータニューラルネットワ
ークの学習について説明する。アクチュエータニューラ
ルネットワークにアクチュエータのパラメータを教示す
るために前述の入力層と出力層からなるニューラルネッ
トワークに一般化デルタ則(GDR)を適用した。本実
施例では、小サイズの中間層なしのニューラルネットワ
ークで十分な効果を得た。なぜならば、1次遅れ系の特
性が弾性収縮体とサーボバルブの挙動によく一致してい
るからである。
【0091】アクチュエータニューラルネットワークの
入力ノードは2つあり、目標トルク信号と目標トルク信
号の変化率である。バイアス項も考慮すると、数1と数
26から、出力ニューロン素子oへの入力は、
【0092】
【数29】 で現され、この式がアクチュエータニューラルネットワ
ークが学習する逆伝達関数である。そして数3よりアク
チュエータニューラルネットワークの誤差は、
【0093】
【数30】 この数30により、単純なバックプロパゲーションニュ
ーラルネットワークを適用して、アクチュエータニュー
ラルネットワークの各ニューロン素子間の異なる結合荷
重を調整する、即ち、数29のWの項を調整すること
が、アクチュエータニューラルネットワークの学習とな
る。
【0094】ここでの制御対象は、弾性収縮体駆動のロ
ボットなので、図11に示すようにアクチュエータ出力
は直接に次式のように内圧に関係する。
【0095】
【数31】 α、β、γは弾性収縮体の固有定数である。
【0096】ここで、関節の角度θが収縮率εを一定に
するように保たれると仮定すると内圧と出力の関係は、
線形となる。したがって、内圧の制御はトルク制御と同
義となる。
【0097】図12及び図13に本実施例の弾性収縮体
の目標内圧と測定値の関係及び学習済のアクチュエータ
ニューラルネットワークにより弾性収縮体の内圧が補償
される様子を示す。1自由度の弾性収縮体の関節の挙動
を解析すると、図12に示すように弾性収縮体の内圧
は、遅れを伴って、目標値に追従している。
【0098】図5に示すような1自由度2本の弾性収縮
体に対して、数29のように逆伝達関数をアクチュエー
タニューラルネットワークで学習すれば、図13に示す
ように遅れなしの圧力制御を得ることが可能である。
【0099】次に、位置制御ニューラルネットワークの
学習について説明する。位置制御ニューラルネットワー
ク(PONNET)の主な目的は、動作軌道と目標トル
ク信号(図2のθd とτd )の関係を学習することであ
る。この関係は、前述のラグランジェ力学により理論的
に確立できる。しかし、正確に定義されねばならないパ
ラメータが多すぎて、多自由度のアームへの適応は困難
である。
【0100】以下、図14に示す、2リンクのアームを
例にして説明する。
【0101】図14において、両リンクの質量m1およ
びm2はリンク先端の質点で代表する。吊り下がりリン
ク長さはd1,d2で、座標系の原点及びリンクd1と
リンクd2の交点が関節となる。座標は図に示したθ1
、θ2 と選ぶ。このモデルを数19に適応して、数1
9を何度か微分することで、各関節でのトルクは、次式
で示される。
【0102】
【数32】
【0103】
【数33】 数32と数33は図14のアームの関節トルクに対する
ある程度完全な式であるが、実際に図13、図14のロ
ボットアームに対する有効質点、有効リンク長さ、等の
パラメータを計算するのはあまり実用的でない。そのう
え、必要となるトルクを定義するには、コリオリ力やク
ーロン力といった、弾性収縮体のロボットアームにとっ
て、より算出の困難な要因が存在する。しかし、数3
2、数33でパラメータが一定か、またはロボットの寿
命に比べて、ほとんど変化しないことは、重要である。
そこで、数32、数33で、軌道の変数、すなわち非線
形関数を分離すると、次式を得る。
【0104】
【数34】
【0105】
【数35】
【0106】荷重パラメータのWjiは、m1、m2、d
1、d2、g等のロボットパラメータの関数である。数
34、数35から位置制御ニューラルネットワークへの
入力ベクトルは次式で定義される。
【0107】
【数36】 したがって位置制御ニューラルネットワークは同時に機
能するn個のバックプロパゲーションニューラルネット
ワークを持ち、各々の関節毎に荷重ベクトルWn があ
る。ここで、nはマニピュレータの関節数である。
【0108】入力ベクトルθd は、各軸の位置制御ニュ
ーラルネットワークへ分割される。また、マニピュタの
構造から位置制御ニューラルネットワークへの入力ベク
トルがきまる。数1に相当する出力ニューロン素子の入
力の総和は、入力ベクトルθd と各関節の荷重ベクトル
wn との内積である。数36は、必要ならばコリオリ力
やクーロン力の影響を含むように拡張することもでき
る。
【0109】ニューロン素子の出力は数2で計算され、
出力誤差は次式のようになる。
【0110】
【数37】 ここで、θnmとθndは各々第n番目の関節の実際の測定
値と目標値である。この数37により、バックプロパゲ
ーションニューラルネットワークを適用して、位置制御
ニューラルネットワークの各ニューロン素子間の異なる
結合荷重、即ち数34及び数35のWの項を調整するこ
とが、位置制御ニューラルネットワークの学習となる。
【0111】アクチュエータニューラルネットワーク
(ANNET)と位置制御ニューラルネットワーク(P
ONNET)における前述の学習定数μ、αはANNE
TがPONNETより早く学習できるように設定する。
従って、弾性収縮体とサーボバルブの系の誤差e1(図
2参照)は、位置誤差e2よりも早くゼロに収束する。
【0112】アクチュエータニューラルネットワークが
学習後に、位置誤差e2が位置制御ニューラルネットワ
ークに取り込まれる。この時点で、アクチュエータの状
態は位置制御ニューラルネットワークに対して許容範囲
になるように補償されているので、アクチュエータニュ
ーラルネットワークが収束した後に位置制御ニューラル
ネットワークが軌道とトルクの関係を学習する。
【0113】本実施例では、位置制御ニューラルネット
ワークの結合強度はリンクの長さや、質点等のラグラン
ジェ力学に関わっているが、位置制御ニューラルネット
ワークの出力がシグモイド関数により制限されているの
で、実際のリンクに対して、厳密に対応しない。位置制
御ニューラルネットワークとアクチュエータニューラル
ネットワーク共に中間層を含まないので、一般には、し
きい関数を使う必要はないが、実施例では、アクチュエ
ータの飽和特性に合致させるためにしきい関数を使用し
た。
【0114】図16は弾性収縮体の内圧と出力及び収縮
率の関係を示した特性図であるが、この図によれば、弾
性収縮体の出力が関節の位置の変化と共に変わることが
わかる。位置と出力の関係は、ゴムの特性、弾性収縮体
のサイズ、配管の長さ等の構造的な要因に依存してい
る。これらは、定義しずらく、ロボットアームによって
も異なる。
【0115】前述の数34及び、数35で定義したラグ
ランジェ力学で導いた運動方程式は、位置制御ニューラ
ルネットワークで学習されるに際して、トルクが位置に
依存しないことを仮定しているため、このままでは数3
5の入力ベクトルで位置制御ニューラルネットワークを
学習される課程は、教示情報が関節位置毎に矛盾して、
ニューラルネットワークの結合強度は収束しない。すな
わち、位置依存性の教示データを使って、位置に依存し
ない関係式を学習するとになり、精度を得られないか、
制御不能のいずれかである。
【0116】そこで、本実施例においては、位置制御ニ
ューラルネットに複数(実施例では、100〜200)
の小サイズのニューラルネットワークをつかう方法を考
案した。即ち、位置によって、この中の1つだけを選択
的に有効にする。但し、ニューラルネットワークの構造
は、数34及び、数35の関係式から決める。
【0117】また、アクチュエータのヒステリシス特性
を考慮するために関節の動作方向別に異なるニューラル
ネットワークを使用する。例えば、図5の1自由度の関
節に対して、時計方向に100個のニューラルネットワ
ークを用意した場合、同じ関節に対して、反時計方向に
も100個のニューラルネットワークを準備する。その
結果、方向別に機能する2つのニューラルネットワーク
により位置と圧力即ち、位置とトルクの関係がニューラ
ルネットワークの総数に応じた分解能で学習される。こ
のようにして、ラバチュエータの内圧と出力の関係は部
分的に線形であると仮定した。
【0118】図15に、従来のPID制御装置による制
御結果を示す。この図で実線は目標軌道を示し、一点鎖
線は制御結果を示している。縦軸は本実施例のロボット
アームの関節11の軌道を示し、横軸は制御時間を示し
ている。関節11の目標軌道は、エンドエフェクタ(手
先)の姿勢を一定に保った直線動作で、500mm/secの
スピードで50mmピッチで、1秒ずつ止まりながら前進
動作する。この図によれば、アームが止まる度に大きな
オーバーシュートと加速時の遅れが示されている。図2
3は図22の一部分を拡大したものであるが、この図に
よれば、オーバーシュートと加速時の遅れがより顕著に
示されている。
【0119】同じロボットアームと同じ動作軌道に対し
て、本実施例のロボット制御装置を適用すると図17及
び図17の一部分を拡大した図18に示すようにオーバ
ーシュートはなくなり遅れも小さくなる。また、かなり
速いスピード(500m/s)に対しても有効であっ
た。
【0120】
【発明の効果】以上のように、この発明は、極端に多数
のニューロンを持つ多数の中間層からなるニューラルネ
ットワークを使わずに、ロボットの制御対象が持つ非線
形特性を十分に学習出来き、リアルタイムであって、高
精度且つ環境や構成の変化に適応する制御を行える。
【図面の簡単な説明】
【図1】多層ニューラルネットワーク例。各ニューロン
素子は生体系のアクソンに相当するリンクで結合され、
ニューロン素子iとニューロン素子jは生体系のシナプ
ス結合に相当する結合加重Wjiで結合されている。
【図2】本発明のロボット制御装置のブロック図
【図3】
【図4】本発明のロボット制御装置を適応したロボット
アームの正面図及び側面図
【図5】1自由度のラバチュエータの動作原理図
【図6】ラバチュエータの内圧と出力、収縮量の関係を
示す特性図
【図7】本発明のロボット制御装置を適応したロボット
アームの手先部分を示した図
【図8】本発明のロボット制御装置のハードウェアを示
した図
【図9】本発明のロボット制御装置のソフトウェアを示
した図
【図10】本発明のロボット制御装置の位置制御ニュー
ラルネットワークのブロック図
【図11】本発明のロボット制御装置のアクチュエータ
ニューラルネットワークのブロック図
【図12】弾性収縮体の内圧の目標値と測定値の関係を
示した図
【図13】学習済のアクチュエータニューラルネットワ
ークにより弾性収縮体の内圧が補償される様子を示した
【図14】ラグランジェ力学の方程式を導くのに使用す
る2自由度マニピュレータモデル
【図15】PID制御による4軸の位置制御結果例。
【図16】図15の一部拡大図
【図17】図15と同じ軌道を本発明のロボット制御装
置により軌道制御を行った結果例
【図18】図17の一部拡大図
【符号の説明】
1 ニューロン素子 2 リンク 3 運動軌道変換部 4 位置制御ニューラルネットワーク 5 アクチュエータニューラルネットワーク 6 ロボットアーム 7 圧力センサ 8 エンコーダ 9〜12 可動関節 13 手先(エンドエフェクタ) 14 弾性収縮体 15 プーリ 16 ワイヤ 25 カウンタ機能部 32 圧力比較部

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】非線形特性を有する複数の制御対象と、前
    記それぞれの制御対象にニューラルネットワークを備
    え、このニューラルネットワークにそれぞれの制御対象
    の非線形特性を学習させることにより、ロボットの運動
    軌道を制御させるようにしたことを特徴とするロボット
    制御装置。
  2. 【請求項2】前記ニューラルネットワークが、ロボット
    アームの運動軌道とこの運動軌道を制御するために前記
    ロボットアームを駆動するアクチュエータの目標出力と
    の関係を学習する位置制御ニューラルネットワークと、
    前記アクチュエータの伝達関数を学習するアクチュエー
    タニューラルネットワークとからなる請求項1に記載の
    ロボット制御装置。
JP6112359A 1994-05-26 1994-05-26 ロボット制御装置 Pending JPH07319507A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6112359A JPH07319507A (ja) 1994-05-26 1994-05-26 ロボット制御装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6112359A JPH07319507A (ja) 1994-05-26 1994-05-26 ロボット制御装置

Publications (1)

Publication Number Publication Date
JPH07319507A true JPH07319507A (ja) 1995-12-08

Family

ID=14584726

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6112359A Pending JPH07319507A (ja) 1994-05-26 1994-05-26 ロボット制御装置

Country Status (1)

Country Link
JP (1) JPH07319507A (ja)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2006018791A (ja) * 2004-06-04 2006-01-19 Matsushita Electric Ind Co Ltd 弾性体アクチュエータ駆動型可動機構の制御装置及び制御方法
US7184858B2 (en) 2003-09-22 2007-02-27 Matsushita Electric Industrial Co., Ltd. Apparatus and method for controlling elastic actuator
WO2009044751A1 (ja) * 2007-10-01 2009-04-09 Riken ニューロン装置、神経回路網装置、フィードバック制御装置、ならびに、情報記録媒体
CN107924227A (zh) * 2015-10-20 2018-04-17 国际商业机器公司 电阻处理单元
CN111278613A (zh) * 2017-11-02 2020-06-12 三菱电机株式会社 校准装置、校准方法和控制装置
CN111496794A (zh) * 2020-04-29 2020-08-07 华中科技大学 一种基于仿真工业机器人的运动学自抓取学习方法和系统
KR102339688B1 (ko) * 2021-09-01 2021-12-14 이철웅 자동화 장비 프로그램 설계 방법 및 시스템
WO2022030274A1 (ja) * 2020-08-05 2022-02-10 キヤノン株式会社 振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージ
KR20220034610A (ko) * 2020-09-11 2022-03-18 네이버랩스 주식회사 와이어 구동 방식 로봇의 모델링 및 제어 방법
CN114601451A (zh) * 2021-04-09 2022-06-10 长春工业大学 一种基于表面肌电信号的上肢外骨骼机器人控制方法
WO2022239749A1 (ja) * 2021-05-11 2022-11-17 株式会社ブリヂストン 推定装置、推定方法、プログラム、及び学習モデル生成装置
CN116619383A (zh) * 2023-06-21 2023-08-22 山东大学 基于确定学习的机械臂pid控制方法及系统
US11960267B2 (en) 2020-04-24 2024-04-16 Yokogawa Electric Corporation Control apparatus, control method, and storage medium

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7184858B2 (en) 2003-09-22 2007-02-27 Matsushita Electric Industrial Co., Ltd. Apparatus and method for controlling elastic actuator
US7260450B2 (en) 2003-09-22 2007-08-21 Matsushita Electric Industrial Co., Ltd. Apparatus and method for controlling elastic actuator
JP2006018791A (ja) * 2004-06-04 2006-01-19 Matsushita Electric Ind Co Ltd 弾性体アクチュエータ駆動型可動機構の制御装置及び制御方法
WO2009044751A1 (ja) * 2007-10-01 2009-04-09 Riken ニューロン装置、神経回路網装置、フィードバック制御装置、ならびに、情報記録媒体
US8620844B2 (en) 2007-10-01 2013-12-31 Riken Neuron device for simulating a nerve cell and neural network device, integer cluster device, feedback control device, and computer program product thereof
CN107924227A (zh) * 2015-10-20 2018-04-17 国际商业机器公司 电阻处理单元
JP2019502970A (ja) * 2015-10-20 2019-01-31 インターナショナル・ビジネス・マシーンズ・コーポレーションInternational Business Machines Corporation 抵抗型処理ユニット
CN111278613B (zh) * 2017-11-02 2022-10-04 三菱电机株式会社 校准装置、校准方法和控制装置
CN111278613A (zh) * 2017-11-02 2020-06-12 三菱电机株式会社 校准装置、校准方法和控制装置
US11960267B2 (en) 2020-04-24 2024-04-16 Yokogawa Electric Corporation Control apparatus, control method, and storage medium
CN111496794A (zh) * 2020-04-29 2020-08-07 华中科技大学 一种基于仿真工业机器人的运动学自抓取学习方法和系统
CN111496794B (zh) * 2020-04-29 2022-04-01 华中科技大学 一种基于仿真工业机器人的运动学自抓取学习方法和系统
WO2022030274A1 (ja) * 2020-08-05 2022-02-10 キヤノン株式会社 振動型アクチュエータの制御装置及びそれを有する振動型駆動装置、交換用レンズ、撮像装置、自動ステージ
KR20220034610A (ko) * 2020-09-11 2022-03-18 네이버랩스 주식회사 와이어 구동 방식 로봇의 모델링 및 제어 방법
CN114601451A (zh) * 2021-04-09 2022-06-10 长春工业大学 一种基于表面肌电信号的上肢外骨骼机器人控制方法
WO2022239749A1 (ja) * 2021-05-11 2022-11-17 株式会社ブリヂストン 推定装置、推定方法、プログラム、及び学習モデル生成装置
KR102339688B1 (ko) * 2021-09-01 2021-12-14 이철웅 자동화 장비 프로그램 설계 방법 및 시스템
CN116619383A (zh) * 2023-06-21 2023-08-22 山东大学 基于确定学习的机械臂pid控制方法及系统
CN116619383B (zh) * 2023-06-21 2024-02-20 山东大学 基于确定学习的机械臂pid控制方法及系统

Similar Documents

Publication Publication Date Title
US5719480A (en) Parametric control device
Sanger Neural network learning control of robot manipulators using gradually increasing task difficulty
JP3436320B2 (ja) 非線形システムの出力軌道と動特性の制御方法および装置
JP5930754B2 (ja) ロボット装置の制御方法及びロボット装置
JPH07319507A (ja) ロボット制御装置
JP2008238396A (ja) ロボットのモーションの発生及び制御のための装置ならびに方法
Jamone et al. Incremental learning of context-dependent dynamic internal models for robot control
CN115990888B (zh) 一种具有死区和时变约束功能的机械臂控制方法
Paraschos et al. Model-free probabilistic movement primitives for physical interaction
Yamawaki et al. Iterative learning of variable impedance control for human-robot cooperation
Teramae et al. Optimal control approach for pneumatic artificial muscle with using pressure-force conversion model
CN114310851B (zh) 一种机器人免力矩传感器的拖动示教方法
Perrusquía et al. Task space human-robot interaction using angular velocity Jacobian
Wiese et al. Transfer learning for accurate modeling and control of soft actuators
Yan et al. Robot learning control based on recurrent neural network inverse model
Thomas et al. Compliance shaping for control of strength amplification exoskeletons with elastic cuffs
Yıldırım Adaptive robust neural controller for robots
JP3105694B2 (ja) マニピュレータ制御方法
CN105467841B (zh) 一种类人机器人上肢运动的类神经控制方法
Koops Trajectory tracking control of the philips experimental robot arm in the port-hamiltonian framework
Bock et al. Parametric motion control of robotic arms: a biologically based approach using neural networks
JPH04340603A (ja) 障害物回避を考慮したマニピュレータの制御方法
Tahara et al. Sensory-motor control of a muscle redundant arm for reaching movements-convergence analysis and gravity compensation
Purwanto et al. Position-velocity-based trajectory control for manipulator and its application to visual tracking system
Tonggoed et al. Omnidirectional Mobile Robot for Upper Limb Rehabilitation Based Mirror Therapy