JPH0527805A - 学習制御方式 - Google Patents

学習制御方式

Info

Publication number
JPH0527805A
JPH0527805A JP3203881A JP20388191A JPH0527805A JP H0527805 A JPH0527805 A JP H0527805A JP 3203881 A JP3203881 A JP 3203881A JP 20388191 A JP20388191 A JP 20388191A JP H0527805 A JPH0527805 A JP H0527805A
Authority
JP
Japan
Prior art keywords
trial
correction amount
control input
deviation
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP3203881A
Other languages
English (en)
Other versions
JP3039573B2 (ja
Inventor
Yuji Nakamura
裕司 中村
Kenji Fujimoto
健司 藤本
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yaskawa Electric Corp
Original Assignee
Yaskawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yaskawa Electric Corp filed Critical Yaskawa Electric Corp
Priority to JP3203881A priority Critical patent/JP3039573B2/ja
Publication of JPH0527805A publication Critical patent/JPH0527805A/ja
Application granted granted Critical
Publication of JP3039573B2 publication Critical patent/JP3039573B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Abstract

(57)【要約】 【目的】本発明は、工作機械、ロボット等の所定パター
ンの繰り返し動作を行うサーボ系に適用される学習制御
装置において、補正の度合いを調節したり、制御入力の
値やその変化の度合いに制約を与えたりすることができ
る学習制御装置を提供することを目的とする。 【構成】同じパターンを繰り返す目標指令に制御対象の
出力を追従させるよう試行を繰り返し、所定回数目の試
行の、所定時刻における制御入力を、補正量を指令に加
える形式の所定の式で与える学習制御系において、所定
ステップ未来までの追従偏差を予測し、それらの予測値
と補正量(または増分補正量、または制御入力、または
制御入力の増分値)の重み付き2乗和が最小となるよう
に、増分補正量をリアルタイムで、あるいは試行間にオ
フライン的に決定する。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、繰り返し動作をする工
作機械、ロボット等の制御方式に関する。
【0002】
【従来の技術】繰り返し目標値に対する学習制御系の設
計法としては、本出願人が特開平1-237701号公報におい
て、提案した方式がある。この方式は、同じ目標値に対
する動作を繰り返し、過去の偏差および制御対象の動特
性に関する情報をもとに未来の偏差を予測し、その予測
値の重み付き2乗和を評価関数として、その評価関数が
最小となるように制御入力を補正していくというもの
で、最終的には目標値と出力が一致するため、高精度な
追従動作が実現される。
【0003】
【発明が解決しようとする課題】ところが、上述の方式
では、評価関数が未来の偏差の予測値のみに関するもの
であるため、補正の度合いを調節したり、制御入力の値
やその変化の度合いに制約を与えたりすることができな
かった。
【0004】
【課題を解決するための手段】上記問題点を解決するた
め、本願の第1の発明では、同じパターンを繰り返す目
標指令に制御対象の出力を追従させるよう試行を繰り返
し、k回目の試行の、時刻iにおける制御入力uk (i)
を、次式 uk (i) = uk-1 (i) + σk (i) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1 (i) からの補正量である。で与える学習制御
系において、Mステップ未来までの追従偏差eを予測
し、それらの予測値{ek *(i+1),eK * (i+2),…, e
K * (i+M) }と補正量σK (i) の重み付き2乗和が最小
となるように、補正量σK (i) を決定することを特徴と
している。本願の第2の発明では、同じパターンを繰り
返す目標指令に制御対象の出力を追従させるよう試行を
繰り返し、k回目の試行の、時刻iにおける制御入力u
k (i) を、次式 uk (i) = uk-1 (i) + σk (i) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1 (i) からの補正量である。で与える学習制御
系において、Mステップ未来までの追従偏差eを予測
し、それらの予測値{eK *(i+1),ek * (i+2),…, e
K * (i+M) }と増分補正量Δσk (i) の重み付き2乗和
が最小となるように、補正量σk (i) を決定することを
特徴としている。本願の第3の発明では、同じパターン
を繰り返す目標指令に制御対象の出力を追従させるよう
試行を繰り返し、k回目の試行の、時刻iにおける制御
入力uk (i) を、次式 uk (i) = uk-1 (i) + σk (i) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1 (i) からの補正量である。で与える学習制御
系において、Mステップ未来までの追従偏差eを予測
し、それらの予測値{eK *(i+1),eK * (i+2),…, e
K * (i+M) }と制御入力uK (i) の重み付き2乗和が最
小となるように、補正量σK (i) を決定することを特徴
としている。本願の第4の発明では、同じパターンを繰
り返す目標指令に制御対象の出力を追従させるよう試行
を繰り返し、k回目の試行の、時刻iにおける制御入力
k (i) を、次式 uk (i) = uk-1 (i) + σk (i) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1 (i) からの補正量である。で与える学習制御
系において、Mステップ未来までの追従偏差eを予測
し、それらの予測値{eK *(i+1),ek * (i+2),…, e
K * (i+M) }と制御入力の増分値Δuk (i) の重み付き
2乗和が最小となるように、補正量σk (i) を決定する
ことを特徴としている。
【0005】
【作用】上記手段により、補正の度合いを調節したり、
制御入力の値やその変化の度合いに制約を与えたりする
ことが可能となる。
【0006】
【実施例】本発明は目標指令が一定周期で連続的に繰り
返す場合にも適用可能であるが、制御入力を決定する際
に偏差の現在値を利用しないため、各試行を間欠的に行
い、各試行間に次の1試行分の制御入力をオフライン的
にまとめて算出することも可能である。ここでは、後者
の場合について本発明の具体的実施例を図1に示して説
明する。図中1は同じパターンを間欠的に発生する指令
発生器であり、1試行分の目標指令値の系列{r(j) }
(j=i0,i0+1,…,in ) を発生する。ここで、i0と i
n は、試行の開始時刻と終了時刻である。2は減算器で
あり、今回の試行時の偏差の系列{ek (j) } (j=i0,i
0+1,…,in ) を出力する。3は、定数q1 、q2 、・・・
、qM 、f1 、f2 、・・・ 、fN-1 を記憶するメモ
リ、4は、今回試行時の補正量σk (j) (j=i0,i0+1,
…,in ) を記憶するメモリ、5は、前回の試行時の偏差
k-1 (j) (j=i0,i0+1, …,in ) を記憶するメモリであ
り、今回の試行の際には、減算器2の出力値すなわち偏
差のek (j) (j=i0,i0+1, …,in )が記憶される。6は
演算器であり、本願の第1の発明では、
【0007】
【数9】
【0008】本願の第2の発明では、
【0009】
【数10】
【0010】本願の第3の発明では、
【0011】
【数11】
【0012】本願の第4の発明では、
【0013】
【数12】
【0014】なる演算によって、時刻iにおける補正量
σk (i)を算出し、さらに、 uk (i) = uk-1 (i) + σk (i) により、今回の試行時の制御入力uk (j) (j=i0,i0+1,
…,in ) を求め出力する。7は、1試行分の制御入力を
記憶するメモリで、前回の試行時には前回の試行時の入
力uk-1(j) (j=i0,i0+1,…,in ) が記憶されており、前
回の試行が終了した後に、演算器6によって算出される
今回の試行時の入力uk (j) (j=i0,i0+1,…,in ) が記
憶され、今回の試行の際に出力される。8、9はサンプ
リング周期Tで閉じるサンプラであり、10はホールド
回路である。11は入力がu(t)で出力がy(t) の制御
対象である。 (1a)〜(1d)式の導出を行う。制御対象11はインパルス
応答モデルにより、
【0015】
【数13】
【0016】と表すことができる。ここで、{H 1 ,
H2 , …,HN }は前もって測定された、制御対象11の
単位ステップ応答のサンプル値である(図2)。Nは応
答が十分に整定するように、すなわち、H n ≒H N (n>
N)となるように選ぶものとし、H0=0 である。さらに、
実際の出力y(i) と(2) 式のモデル出力
【0017】
【数14】
【0018】との差、すなわち、推定誤差をd(i) とす
る。
【0019】
【数15】
【0020】いまk回目の試行の、時刻iにおける制御
入力uk (i) を、次式で与えるものとする。 uk (i) = uk-1 (i) + σk (i) (4) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1 (i) からの補正量である。ここで、未来の追
従偏差の予測値ek * を以下の手順で求める。k回目の
試行の時刻iにおいて、出力yk (i) は、次式で表すこ
とができる。
【0021】
【数16】
【0022】さらにk−1回目の試行の時刻iにおいて
は、
【0023】
【数17】
【0024】となる。(5) 式から(6) 式を引くことによ
り、次式を得る。
【0025】
【数18】
【0026】ただし、
【0027】
【数19】
【0028】である。ここでδk (i) は、出力yk (i)
の、前回試行時の同じ時刻の出力yk- 1 (i) からの変化
分である。さらに、時刻 i+mの出力変化分δk (i+m) は
次式で表される。
【0029】
【数20】
【0030】いま、時刻iにおいてMステップ先までの
出力変化分の予測値δK * (i+m) (m=1,2,…,M) を求め
る際に、 (2) 式のモデルによる推定誤差は不変、すなわち、d
k (i+m) =dk-1(i+m)であり、さらに、 未来の補正量は現在値から変化しない、すなわち、σ
k (i+m)=σk (i) と仮定すると、予測値δk * (i+m)
は、(10)式より、
【0031】
【数21】
【0032】となる。δk (i) の定義により、時刻 i+m
における追従偏差ek (i+m) は次式で表される。 ek (i+m) = ek-1 (i+m) - δk (i+m) (12) したがって, その予測値ek * (i+m) は次式で与えられ
る。 ek * (i+m) = ek-1 (i+m) - δk * (i+m) (13) (11)、(13)式より、偏差の予測値eK * (i+m) は結局
次式で与えられる。
【0033】
【数22】
【0034】上式より未来の追従偏差の予測値ek * (i
+m) は、前回の試行における追従偏差eK-1 、現在に至
るまでに入力してきた補正量σK (i-n) 、および現在決
定すべき補正量σK (i) によって予測されている。そこ
で、本願の第1の発明では、Mステップ未来までの追従
偏差の予測値eK * (i+m) (m=1,2, …,M) をより小さく
するための指標として、次の評価関数J
【0035】
【数23】
【0036】を考え、この評価関数Jが最小となるよう
にσK (i) を決定する。ここでw m は、m ステップ未来
の追従偏差の予測値ek * (i+m) にかける重み係数であ
り、近い未来の予測値ほど重視する減衰型(図3)や、
現在決定する補正量σK (i) が出力に与える影響度を考
慮したインパルス応答型(図4, wm =Hm -H m-1)など
が考えられる。ただし,wm >0 (m=1,2,…,M) とする。ま
た、c は補正量σk (i)にかける重み係数であり、c ≧0
とする。 (14)、(15a) 式より、∂J/∂σk (i) = 0は、
【0037】
【数24】
【0038】となり、上式は未知数σk (i) に関する1
次方程式である。さらに、
【0039】
【数25】
【0040】であるため、(15a) 式の評価関数を最小に
するσk (i) は(16)式より、
【0041】
【数26】
【0042】を満たす。したがって、時刻iにおける補
正量σk (i) は(1a)式に従って決定される。本願の第2
の発明では、次の評価関数J
【0043】
【数27】
【0044】を考え、この評価関数Jを最小とするσk
(i) を同様に求めると(1b)式となる。本願の第3の発明
では、次の評価関数J
【0045】
【数28】
【0046】を考え、この評価関数Jを最小とするσK
(i) を同様に求めると(1c)式となる。本願の第4の発明
では、次の評価関数J
【0047】
【数29】
【0048】を考え、この評価関数Jを最小とするσk
(i) を同様に求めると(1d)式となる。ただし、
【0049】
【数30】
【0050】であり、これらの定数は、ステップ応答デ
ータ{H n }を測定し、重み係数{w m }を適当に与え
ることにより、学習を行う前にあらかじめ算出できる。
以上で、(1a)〜(1d)式で与えられる補正量σk (i) が、
(15a) 〜(15d) 式の評価関数Jを最小にすることが示さ
れた。なお、重み係数cは、試行を重ねる過程で、学習
が利きすぎる場合は大きくしたり、収束を速くしたい箇
所では小さくしたりして、変化させても良い。
【0051】
【発明の効果】以上述べたように、本発明によれば、同
じパターンの目標値に対する動作を繰り返す学習制御系
において、過去の偏差および制御対象の動特性に関する
情報をもとに未来の偏差を予測し、その予測値および制
御入力あるいはその補正量の重み付き2乗和が最小とな
るように制御入力を補正していくため、補正の度合いを
調節したり、制御入力の値やその変化の度合いに制約を
与えたりすることが可能であり、最終的には目標値と出
力が一致し、高精度な追従動作が実現される。
【図面の簡単な説明】
【図1】本発明の実施例を示す図
【図2】本発明の動作説明図
【図3】本発明の動作説明図
【図4】本発明の動作説明図
【符号の説明】
2 減算器 3は、定数q1 、q2 、・・・ 、qM 、f1 、f2 、・・・
、fN-1 を記憶するメモリ 4 今回試行時の補正量σk (j) (j=i0,i0+1,…,in )
を記憶するメモリ 5 前回の試行時の偏差ek-1 (j) (j=i0,i0+1, …,
in ) を記憶するメモリ 6 演算器 7 1試行分の制御入力を記憶するメモリ 8、9 サンプリング周期Tで閉じるサンプラ 10 ホールド回路 11 制御対象

Claims (9)

    【特許請求の範囲】
  1. 【請求項1】 同じパターンを繰り返す目標指令に制御
    対象の出力を追従させるよう試行を繰り返し、k回目の
    試行の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1(i)+σk (i) ただし、kは試行回数を表わし、σk (i) は前回の制御
    入力uk-1(i)からの補正量である。で与える学習制御系
    において、 Mステップ未来までの追従偏差eを予測し、それらの予
    測値{ek * (i+1),ek * (i+2),…, ek * (i+M) }と
    補正量σk (i) の重み付き2乗和 【数1】 (ただし、 wm は、m ステップ未来の追従偏差の予測値
    k * (i+m) にかける重み係数であり、cは補正量σk
    (i) にかける重み係数である)が最小となるように、補
    正量σk (i) を決定することを特徴とする学習制御方
    式。
  2. 【請求項2】 k回目の試行の、時刻iにおける補正量
    σk (i) を、 【数2】 (ただし、qm 、fn は、制御対象のステップ応答のサ
    ンプル値と、予測される未来の偏差および補正量に掛け
    る重みによって決定される定数である)とすることを特
    徴とする請求項1記載の学習制御方式。
  3. 【請求項3】 同じパターンを繰り返す目標指令に制御
    対象の出力を追従させるよう試行を繰り返し、k回目の
    試行の、時刻iにおける制御入力uk (i) を次式 uk (i) = uk-1 (i) +σk (i) ただし、kは試行回数を表わし、σk (i) は前回の制御
    入力uk-1 (i) からの補正量である。で与える学習制御
    系において、 Mステップ未来までの追従偏差eを予測し、それらの予
    測値{ek * (i+1),ek * (i+2),…, ek * (i+M) }と
    補正量の増分値Δσk (i) の重み付き2乗和 【数3】 (ただし、 wm は、m ステップ未来の追従偏差の予測値
    k * (i+m) にかける重み係数であり、cは増分補正量
    Δσk (i)=σk (i)-σk (i-1) にかける重み係数であ
    る)が最小となるように、補正量σk (i) を決定するこ
    とを特徴とする学習制御方式。
  4. 【請求項4】 k回目の試行の、時刻iにおける補正量
    σk (i) を、 【数4】 (ただし、qm 、fn 、Cは、制御対象のステップ応答
    のサンプル値と、予測される未来の偏差および補正量の
    増分値に掛ける重みによって決定される定数である)と
    することを特徴とする請求項3記載の学習制御方式。
  5. 【請求項5】 同じパターンを繰り返す目標指令に制御
    対象の出力を追従させるよう試行を繰り返し、k回目の
    試行の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1 (i) + σk (i) ただし、kは試行回数を表わし、σk (i) は前回の制御
    入力uk-1 (i) からの補正量である。で与える学習制御
    系において、 Mステップ未来までの追従偏差eを予測し、それらの予
    測値{ek * (i+1),eK * (i+2),…, ek * (i+M) }と
    制御入力uK (i) の重み付き2乗和 【数5】 (ただし、 wm は、m ステップ未来の追従偏差の予測値
    k * (i+m) にかける重み係数であり、cは制御入力u
    k (i) にかける重み係数である)が最小となるように、
    補正量σk (i) を決定することを特徴とする学習制御方
    式。
  6. 【請求項6】 k回目の試行の、時刻iにおける補正量
    σk (i) を、 【数6】 (ただし、qm 、fn 、Cは、制御対象のステップ応答
    のサンプル値と、予測される未来の偏差および制御入力
    に掛ける重みによって決定される定数である)とするこ
    とを特徴とする請求項5記載の学習制御方式。
  7. 【請求項7】 同じパターンを繰り返す目標指令に制御
    対象の出力を追従させるよう試行を繰り返し、k回目の
    試行の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1 (i) + σk (i) ただし、kは試行回数を表わし、σk (i) は前回の制御
    入力uk-1 (i) からの補正量である。で与える学習制御
    系において、 Mステップ未来までの追従偏差eを予測し、それらの予
    測値{eK * (i+1),ek * (i+2),…, eK * (i+M) }と
    制御入力の増分値Δuk-1 (i)の重み付き2乗和 【数7】 (ただし、 wm は、m ステップ未来の追従偏差の予測値
    k * (i+m) にかける重み係数であり、cは制御入力の
    増分値Δuk (i) にかける重み係数である)が最小とな
    るように、補正量σk (i) を決定することを特徴とする
    学習制御方式。
  8. 【請求項8】 k回目の試行の、時刻iにおける補正量
    σk (i) を、 【数8】 (ただし、qm 、fn 、Cは、制御対象のステップ応答
    のサンプル値と、予測される未来の偏差および制御入力
    の増分値に掛ける重みによって決定される定数である)
    とすることを特徴とする請求項7記載の学習制御方式。
  9. 【請求項9】 試行を重ねる過程で、重み係数c の値を
    変化させることを特徴とする請求項1、3、5、または
    7記載の学習制御方式。
JP3203881A 1991-07-17 1991-07-17 学習制御方式 Expired - Fee Related JP3039573B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP3203881A JP3039573B2 (ja) 1991-07-17 1991-07-17 学習制御方式

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP3203881A JP3039573B2 (ja) 1991-07-17 1991-07-17 学習制御方式

Publications (2)

Publication Number Publication Date
JPH0527805A true JPH0527805A (ja) 1993-02-05
JP3039573B2 JP3039573B2 (ja) 2000-05-08

Family

ID=16481269

Family Applications (1)

Application Number Title Priority Date Filing Date
JP3203881A Expired - Fee Related JP3039573B2 (ja) 1991-07-17 1991-07-17 学習制御方式

Country Status (1)

Country Link
JP (1) JP3039573B2 (ja)

Also Published As

Publication number Publication date
JP3039573B2 (ja) 2000-05-08

Similar Documents

Publication Publication Date Title
KR970003823B1 (ko) 주기적 목표치에 최적하게 추종하는 제어방식
JP3516232B2 (ja) 最適かつ自動的に外乱を排除するフィードバック制御を実現するための方法及び装置
JPH10133703A (ja) 適応的ロバスト制御装置
EP0709754B1 (en) Prediction controller
KR100267362B1 (ko) 예견제어장치
JP3214876B2 (ja) ニューラルネットワークの構成方法およびニューラルネットワーク構築支援システム
JPH0527805A (ja) 学習制御方式
JP3109605B2 (ja) 学習制御方法
JP3039814B2 (ja) 学習制御方式
JP2921056B2 (ja) 速度指令の補正による学習制御装置
JP3196907B2 (ja) 出力検出にむだ時間を持つ系の学習制御装置
JP3152251B2 (ja) 増分値演算による学習制御方法
JP3152250B2 (ja) 増分値による予見制御方法
JPH0830979B2 (ja) 周期的目標値に最適に追従する制御方法
JP3036654B2 (ja) 学習制御方式
JPH04369002A (ja) 近似ステップ応答による予見学習制御方式
JP3870767B2 (ja) 予測制御方法
JP3256950B2 (ja) 最適予見学習制御装置
JP2958978B2 (ja) 学習制御方法
JP3191836B2 (ja) 学習制御装置
JPH05119828A (ja) ステツプ応答を用いた予見制御方式
JPH05143109A (ja) 速度指令の補正による学習制御方式
JPH06314106A (ja) 学習制御装置
JPH05324007A (ja) プロセス制御装置
JPH05265510A (ja) 学習制御装置

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090303

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090303

Year of fee payment: 9

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20100303

Year of fee payment: 10

LAPS Cancellation because of no payment of annual fees