JPS6315302A

JPS6315302A - 学習制御方式

Info

Publication number: JPS6315302A
Application number: JP15894686A
Authority: JP
Inventors: Taku Arimoto; 有本　卓; Munehisa Takeda; 宗久武田
Original assignee: Mitsubishi Electric Corp
Current assignee: Mitsubishi Electric Corp
Priority date: 1986-07-07
Filing date: 1986-07-07
Publication date: 1988-01-22

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】［産業上の利用分野］この発明は、プレイバック形ロボット等のように繰り返
し制御を行う対象物の学習制御方式に係り、特に収束性
の速い（試行回数の少ない）学習制御方式に関するもの
である。

［従来の技術］この種の従来の学習制御方式は、プレイパック形ロボッ
ト等の繰り返し制御を行う対象物の位置決め制御を行う
場合には、まず教示動作を行って対象物に目標とする作
業軌跡の位置データ（教示値）を覚え込ませ、この教示
値に従って再生運転を行うと共に、上記教示値と運転軌
跡との差（誤差）を検出して、（１）式に示すように、
この誤差にゲインをかけたものを教示値に加えて次回の
再生運転の為の指令値とする方式が採用されている。

この次回の試行の指令値Ｕに、＋（ｔ）　（ｋ　＋　１
回目の試行の指令値）は次のようにして求めることがで
きる。まず加速度Ｒ１速度Ｑ、位置に係わる力Ｐとから
指令値Ｕに（１）を算出する。

Ｘに　：に回目の状態変数Ｕに　：に回目の試行の指令値ｅに　：に回目試行の誤差 φに　：学習ゲイン［発明が解決しようとする問題点コ従来の学習制御方式は以上のように構成されているので
、学習のゲインが固定的であり、試行回数を多く繰り返
さなければならないという問題点があった。

この発明は上記のような問題点を解消するためになされ
たもので、位置決め精度が良いとともに、収束性の速い
学習制御方式を得ることを目的とする。

［問題点を解決するための手段］この発明に係る学習制御方式は、制御対象の教示値と該
教示値に基づいて運転される再生軌跡との誤差を測定し
、各自由度毎の学習制御におけるゲインを増加する方向
に試行毎に変化させ、このゲインを上記誤差にかけて得
られる値を教示値に加えて再生運転を行なうものである
。

［作用］この発明における学習制御方式は、学習制御のゲインを
試行ごとに変化するようにしたことにより、はじめの誤
差が大きいときと試行をくり返すに従い誤差が小さくな
ってきたとき、この学習ゲインを変化することができ、
常に収束性のよい、つまり収束性の速い学習制御が実現
できる。

［実施例］以下、この発明の一実施例を第１図及び第２図に基づい
て説明する。上記第１図に本実施例に係る学習制御方式
を行うためのブロック図、第２図に本実施例の処理手順
のフローチャートを示し、上記各図において（１）は制
御対象物（８）を制御する指令値を発生する例えばデジ
タル計算機で構成される指令値演算装置、（２）は指令
値演算装置（１）からのデジタル信号をアナログ信号に
変換するＤ／Ａコンバータ、（３）は例えば演算アンプ
で構成される比較器、（４）は制御回路、（５）はサー
ボアンプ、（８）は制御対象物、（７）は制御対象物（
８）からの出力信号を検出する検出器、（８）は検出器
（７）により帰還されたアナログ信号をデジタル信号に
変換するＡ／Ｄコンバータ、（９）はＡ／Ｄコンバータ
（８）からのデジタル信号を記憶するメモリである。

次にこの実施例の動作を第２図に基づいて説明する。ま
ず初期設定では、教示動作等により、制御対象物（６）
に目標とする作業軌跡の位置データを覚え込ませるとと
もに、各種ゲインの初期設定を行う（ステップ１１）、
続いて、初期設定に基づいて再生運転を行なう（ステッ
プ１２）、この時、各サンプリング時間ごとの制御対象
物（６）からの出力信号は検出器（７）　、　Ａ／Ｄコ
ンバータ（８）を通して、メモリ（８）に記憶される。

１回の再生運転が終了すると、記憶されたデータを基に
指令値演算装置（１）において、例えば誤差２乗積分値
のような評価関数が計算される（ステップ１３）、もし
、評価関数が所定の値Ｊｍｉｎより小さい場合（ステッ
プ１４）には、制御を終了するか、そうでない（ステッ
プ１４）場合には、誤差ｅ＋（ｔ）に学習ゲインφｌを
掛ける指令値Ｕ＋（ｔ）を修正し、新たな指令値Ｕ２（
ｔ）を用いて再度再生運転を行なう（ステップ１５）、
以下同様の操作を評価関数ＪがＪ　ｗｉｎより小さくな
るまでくり返す、一般に、試行が少ないほど誤差が大き
いため、大きな学習ゲインφをとることはできないが、
試行を繰り返すに従い誤差は小さくなるため、これまで
のように同じ学習ゲインφを使っていたのでは試行回数
がふえたときの収束性が悪くなる。これに対し、今回提
案するように学習ゲインφを試行が増えるに従い増加さ
せることにより、常に収束性の高い、つまり速い収束の
学習制御が実現できる。

なお、上記実施例では、サーボ制御装置及び制御対象物
はアナログサーボ系としたが、デジタルサーボ系として
もよいことは言うまでもない、また、上記説明ではｌ自
由度に限って説明したが、同様に多自由度を有する制御
対象についても適用可能であ、る。

また上記実施例における学習ゲインは単に増加する構成
としたが、指数函数的、線形的等に増加する構成とする
こともできる。

［発明の効果］以上のように、この発明によれば、学習制御方式におい
て、各自由度毎の学習ゲインを試行毎に変化させるよう
に構成したので、位置決め精度が良いとともに、収束性
の速い学習制御が得られる効果がある。

【図面の簡単な説明】

第１図はこの発明を一実施例に係る学習制御方式を行う
ためのブロック図、第２図は本実施例の学習制御方式の
処理手順の一例を示すフローチャートを示す。図において、（１）は指令値演算装置、（２）はＤ／Ａコンバータ、（３）は演算アンプ、（４）は制御回路、（５）はサーボアンプ、（６）は制御対象物、（７）は検出器、（８）はメモリである。なお、各図中、同一符号は同−又は相当部分を示す。代　　理　　人　　　大　　岩　　増　　雄第１図第２図手続補正書（自発）昭和　　年　　月　　日２、発明の名称学習制御方式３、補正をする者事件との関係　特許出願人代表者　志　岐　守　哉４、代理人５、補正の対象明細！２の発明の詳細な説明の欄。６、補正の内容（１）明細書第２頁第９行の「る。」という記載を「る
、この指令値は以下の様に算出される。」と補正する。（２）明細書節２亘第１０−１３行の「この次回の試行
の指令・・・指令値Ｕに（１）を算出する。」という記
載を削除する。（３）明細書第５頁第１５行の「終了するか、」という
記載を「終了するが、」と補正する。（４）明細書第５頁第１７行の「掛ける指令値」という
記載を「掛けたもので指令値」と補正する。以　　上

Claims

【特許請求の範囲】

複数の自由度を有する制御対象を教示値に従って再生運
転させて教示値と再生軌跡との誤差を測定し、次回の再
生運転時には、教示値もしくは今回の指令値に、上記誤
差にゲインをかけたものを加えて再生運転する学習制御
方式において、各自由度毎の学習制御におけるゲインを
増加する方向に試行ごとに変化させる構成としたことを
特徴とする学習制御方式。