JP3109605B2 - 学習制御方法 - Google Patents

学習制御方法

Info

Publication number
JP3109605B2
JP3109605B2 JP03161031A JP16103191A JP3109605B2 JP 3109605 B2 JP3109605 B2 JP 3109605B2 JP 03161031 A JP03161031 A JP 03161031A JP 16103191 A JP16103191 A JP 16103191A JP 3109605 B2 JP3109605 B2 JP 3109605B2
Authority
JP
Japan
Prior art keywords
correction amount
value
equation
predicted
deviation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03161031A
Other languages
English (en)
Other versions
JPH04358202A (ja
Inventor
裕司 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yaskawa Electric Corp
Original Assignee
Yaskawa Electric Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yaskawa Electric Corp filed Critical Yaskawa Electric Corp
Priority to JP03161031A priority Critical patent/JP3109605B2/ja
Publication of JPH04358202A publication Critical patent/JPH04358202A/ja
Application granted granted Critical
Publication of JP3109605B2 publication Critical patent/JP3109605B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、繰り返し動作をする工
作機械、ロボット等の制御方法に関する。
【0002】
【従来の技術】繰り返し目標値に対する学習制御系の設
計法としては、本出願人が特開平1-237701号公報におい
て、提案した方式がある。この方式は、同じ目標値に対
する動作を繰り返し、過去の偏差および制御対象の動特
性に関する情報をもとに未来の偏差を予測し、その予測
値の重み付き2乗和を評価関数として、その評価関数が
最小となるように制御入力を補正していくというもの
で、最終的には目標値と出力が一致するため、高精度な
追従動作が実現される。
【0003】
【発明が解決しようとする課題】ところが、上述の方式
では、評価関数が未来の偏差の予測値のみに関するもの
であるため、補正の度合いを調節したり、制御入力の値
やその変化の度合いに制約を与えたりすることができな
かった。そこで、本発明は、補正の度合いを調節した
り、制御入力の値やその変化の度合いに制約を与えるこ
とができる方法を提供することを目的とする。
【0004】
【課題を解決するための手段】上記課題を解決するた
め、本願の第1の発明では、同じパターンを繰り返す目
標指令に制御対象の出力を追従させるよう試行を繰り返
し、k回目の試行の、時刻iにおける制御入力uk (i)
を、次式 uk (i) = uk-1 (i) + σk (i) σk (i) = σk (i-1)+Δσk (i) (ただし、kは試行回数を表わし、σk (i) は前回の制
御入力uk-1 (i) からの補正量であり、Δσk (i) はそ
の増分値である)で与える学習制御系において、Mステ
ップ未来までの追従偏差eを予測し、それらの予測値
{ek * (i+1),ek * (i+2),…, ek * (i+M) }と補正
量σk (i) の重み付き2乗和が最小となるように、増分
補正量Δσk (i) を決定することを特徴としている。本
願の第2の発明では、同じパターンを繰り返す目標指令
に制御対象の出力を追従させるよう試行を繰り返し、k
回目の試行の、時刻iにおける制御入力uk(i) を、次
式 uk (i) = uk-1 (i) + σk (i) σk (i) = σk (i-1)+Δσk (i) (ただし、kは試行回数を表わし、σk (i) は前回の制
御入力uk-1 (i) からの補正量であり、Δσk (i) はそ
の増分値である)で与える学習制御系において、Mステ
ップ未来までの追従偏差eを予測し、それらの予測値
{ek * (i+1),ek * (i+2),…, ek * (i+M) }と増分
補正量Δσk (i) の重み付き2乗和が最小となるよう
に、増分補正量Δσk (i) を決定することを特徴として
いる。
【0005】
【作用】本発明は、追従偏差の予測値と補正量等との重
み付き2乗和が最小となるように、増分補正量を決定す
るため、補正量側の重みを加減することにより、補正の
度合いを調節したり、制御入力の値やその変化の度合い
に制約を与えたりすることが可能となる。
【0006】
【実施例】以下、本発明の具体的実施例を図1に示して
説明する。図中1は指令発生器であり、現在時刻iにお
ける目標指令値r(i) を発生する。2は減算器であり、
目標指令rとの偏差eを出力する。3は、定数q1 、q
2 、・・・ 、qM 、Q、g1、g2 、・・・ 、gN-1 を記憶
するメモリ、4は、前回の試行の時刻iから現在時刻i
までの偏差e(ek-1(i)〜ek (i) )を記憶するメモ
リ、5は、現在時刻iに至るまでの増分補正量(Δσk
(j),j=i-1,i-2,・・,i-N+1) を記憶するメモリ、6は前
回の試行の時刻iから現在時刻iまでの制御入力(u
k-1(i)〜uk (i))を記憶するメモリである。7は演算
器であり、本願の第1の発明では、
【0007】
【数5】
【0008】本願の第2の発明では、
【0009】
【数6】
【0010】なる演算によって、時刻iにおける増分補
正量Δσk (i) を算出する。また、8は積算器で、 σk (i) = σk (i-1) + Δσk (i) なる演算によって、時刻iにおける補正量σk (i) を算
出する。さらに、9は現在時刻iにおける補正量σk
(i) と、前回の試行の時刻iの制御入力uk-1(i)とを加
算して、今回の制御入力uk (i) を出力する加算器であ
る。10、11はサンプリング周期Tで閉じるサンプラ
であり、12はホールド回路である。13は入力がu
(t) で出力がy(t) の制御対象である。(1a),(1b)式の
導出を行う。制御対象13はステップ応答モデルによ
り、
【0011】
【数7】
【0012】と表すことができる。ここで、{H 1 ,H
2 , …,HN }は、前もって測定された制御対象13の単
位ステップ応答のサンプル値である(図2)。Nは応答
が十分に整定するように、すなわち、H n(n>N)がH N
ほぼ等しくなるように選ぶものとし、H0= 0 である。Δ
u(i) は、入力u(i) の増分値で、Δu(i)=u(i)-u(i
-1) である。さらに、実際の出力y(i) と(2) 式のモデ
ル出力
【0013】
【数8】
【0014】との差、すなわち、推定誤差をd(i) とす
る。
【0015】
【数9】
【0016】いまk回目の試行の、時刻iにおける制御
入力uk (i) を、次式で与えるものとする。 uk (i) = uk-1 (i) + σk (i) (4) ただし、kは試行回数を表わし、σk (i) は前回の制御
入力uk-1 (i) からの補正量である。ここで、未来の追
従偏差の予測値ek * を以下の手順で求める。k回目の
試行の時刻iにおいて、出力yk (i) は、次式で表すこ
とができる。
【0017】
【数10】
【0018】さらにk−1回目の試行の時刻iにおいて
は、
【0019】
【数11】
【0020】となる。(5) 式から(6) 式を引くことによ
り、次式を得る。
【0021】
【数12】
【0022】ただし、
【0023】
【数13】
【0024】である。ここでδk (i) は、出力yk (i)
の、前回試行時の同じ時刻の出力yk-1 (i) からの変化
分である。さらに、時刻 i+mの出力変化分δk (i+m) は
次式で表される。
【0025】
【数14】
【0026】いま、時刻iにおいてMステップ先までの
出力変化分の予測値δk * (i+m) (m=1,2,…,M) を求め
る際に、(2) 式のモデルによる推定誤差の変化分は不
変、すなわち、dk (i+m) -dk-1(i+m)=d k (i)-d
k-1(i)であり、さらに、未来の補正量の増分値Δσk
(i+m) はすべて零であると仮定すると、予測値δk * (i
+m) は、(10)式より、
【0027】
【数15】
【0028】となる。したがって、(7) 、(9) 、(11)式
より、予測値δk * (i+m) は次式で与えられる。
【0029】
【数16】
【0030】δk (i) の定義により、時刻i+mにおけ
る追従偏差ek (i+m) は次式で表される。 ek (i+m) = ek-1 (i+m) -δk (i+m) (13) したがって、その予測値ek * (i+m) は次式で与えられ
る。 ek * (i+m) = ek-1 (i+m) - δk * (i+m) (14) さらに、δk (i) も次式のように追従偏差で表すことが
できる。 δk (i) = ek-1 (i) - ek (i) (15) (12)、(14)、(15)式より、偏差の予測値ek * (i+m) は
結局次式で与えられる。
【0031】
【数17】
【0032】上式より未来の追従偏差の予測値ek * (i
+m) は、前回の試行における追従偏差ek-1 、現在の追
従偏差ek (i) 、現在に至るまでに入力してきた増分補
正量Δσk (i-n) 、および現在決定すべき増分補正量Δ
σk (i) によって予測されている。そこで、本願の第1
の発明では、Mステップ未来までの追従偏差の予測値e
k * (i+m) (m=1,2, …,M) をより小さくするための指標
として、次の評価関数J
【0033】
【数18】
【0034】を考え、この評価関数Jが最小となるよう
にΔσk (i) を決定する。ここでw mは、m ステップ未
来の追従偏差の予測値ek * (i+m) にかける重み係数で
あり、近い未来の予測値ほど重視する減衰型(図3)
や、現在決定する増分補正量Δσk (i) が出力に与える
影響度を考慮したインパルス応答型(図4 ,wm =Hm -H
m-1 )などが考えられる。ただし,wm >0 (m=1,2,…,M)
とする。また、c は補正量σk (i) にかける重み係数で
あり、c ≧0 とする。(16)、(17a) 式より、
【0035】
【数19】
【0036】は、
【0037】
【数20】
【0038】となり、上式は未知数Δσk (i) に関する
1次方程式である。さらに、
【0039】
【数21】
【0040】であるため、(17a) 式の評価関数を最小に
するΔσk (i) は(18)式より、
【0041】
【数22】
【0042】を満たす。したがって、時刻iにおける増
分補正量Δσk (i) は(1a)式に従って決定される。本願
の第2の発明では、次の評価関数J
【0043】
【数23】
【0044】を考え、この評価関数Jを最小とするΔσ
k (i) を同様に求めると(1b)式となる。ただし、
【0045】
【数24】
【0046】であり、これらの定数は、ステップ応答デ
ータ{Hn}を測定し、重み係数{wm}を適当に与える
ことにより、学習を行う前に予め算出できる。以上で、
(1a),(1b)式で与えられる増分補正量Δσk (i) が、(17
a) 、(17b)式の評価関数Jを最小にすることが示され
た。なお、重み係数c は、試行を重ねる過程で、学習が
利きすぎる場合は大きくしたり、収束を速くしたい箇所
では小さくしたりして、変化させても良い。
【0047】
【発明の効果】以上述べたように、本発明によれば、同
じパターンの目標値に対する動作を繰り返す学習制御系
において、過去の偏差および制御対象の動特性に関する
情報をもとに未来の偏差を予測し、その予測値および制
御入力の補正量の重み付き2乗和が最小となるように制
御入力を補正していくため、補正の度合いを調節した
り、制御入力の値やその変化の度合いに制約を与えたり
することが可能であり、最終的には目標値と出力が一致
し、高精度な追従動作が実現される。
【図面の簡単な説明】
【図1】本発明の実施例を示す図
【図2】本発明の動作説明図
【図3】本発明の動作説明図
【図4】本発明の動作説明図
【符号の説明】
3 定数q1 、q2 、・・・ 、qM 、Q、g1 、g2 、・・
・ 、gN-1 を記憶するメモリ 4 前回の試行の時刻iから現在時刻iまでの偏差e
(ek-1(i)〜ek (i) )を記憶するメモリ 5 現在時刻iに至るまでの増分補正量(Δσk (j),j=
i-1,i-2,・・,i-N+1)を記憶するメモリ 6 前回の試行の時刻iから現在時刻iまでの制御入力
(uk-1(i)〜uk (i))を記憶するメモリ 7 演算回路 12 ホールド回路 13 制御対象

Claims (5)

    (57)【特許請求の範囲】
  1. 【請求項1】同じパターンを繰り返す目標指令に制御対
    象の出力を追従させるよう試行を繰り返し、k回目の試
    行の、時刻iにおける制御入力uk (i) を、次式 uk (i) = uk-1(i)+σk (i) σk (i) = σk(i-1)+Δσk (i) (ただし、kは試行回数を表わし、σk (i) は前回の制
    御入力uk-1(i)からの補正量であり、Δσk (i) はその
    増分値である)で与える学習制御系において、 Mステップ未来までの追従偏差eを予測し、それらの予
    測値{ek * (i+1),ek * (i+2),…, ek * (i+M) }と
    補正量σk (i) の重み付き2乗和 【数1】 (ただし、 wm は、m ステップ未来の追従偏差の予測値
    k * (i+m) にかける重み係数であり、cは補正量σk
    (i) にかける重み係数である)が最小となるように、増
    分補正量Δσk (i) を決定することを特徴とする学習制
    御方法。
  2. 【請求項2】k回目の試行の、時刻iにおける増分補正
    量Δσk (i) を、 【数2】 (ただし、qm 、Q、gn 、Cは、制御対象のステップ
    応答のサンプル値と、予測される未来の偏差および補正
    量に掛ける重みによって決定される定数である)とする
    ことを特徴とする請求項1記載の学習制御方法。
  3. 【請求項3】同じパターンを繰り返す目標指令に制御対
    象の出力を追従させるよう試行を繰り返し、k回目の試
    行の、時刻iにおける制御入力uk (i) を次式 uk (i) = uk-1 (i) +σk (i) σk (i) = σk (i-1)+Δσk (i) (ただし、kは試行回数を表わし、σk (i) は前回の制
    御入力uk-1 (i) からの補正量であり、Δσk (i) はそ
    の増分値である)で与える学習制御系において、 Mステップ未来までの追従偏差eを予測し、それらの予
    測値{ek * (i+1),ek * (i+2),…, ek * (i+M) }と
    増分補正量Δσk (i) の重み付き2乗和 【数3】 (ただし、 wm は、m ステップ未来の追従偏差の予測値
    k * (i+m) にかける重み係数であり、cは増分補正量
    Δσk (i) にかける重み係数である)が最小となるよう
    に、増分補正量Δσk (i) を決定することを特徴とする
    学習制御方法。
  4. 【請求項4】k回目の試行の、時刻iにおける増分補正
    量Δσk (i) を、 【数4】 (ただし、qm 、Q、gn は、制御対象のステップ応答
    のサンプル値と、予測される未来の偏差および補正量の
    増分値に掛ける重みによって決定される定数である)と
    することを特徴とする請求項3記載の学習制御方法。
  5. 【請求項5】試行を重ねる過程で、重み係数c の値を変
    化させることを特徴とする請求項1または3記載の学習
    制御方法。
JP03161031A 1991-06-04 1991-06-04 学習制御方法 Expired - Fee Related JP3109605B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03161031A JP3109605B2 (ja) 1991-06-04 1991-06-04 学習制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03161031A JP3109605B2 (ja) 1991-06-04 1991-06-04 学習制御方法

Publications (2)

Publication Number Publication Date
JPH04358202A JPH04358202A (ja) 1992-12-11
JP3109605B2 true JP3109605B2 (ja) 2000-11-20

Family

ID=15727285

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03161031A Expired - Fee Related JP3109605B2 (ja) 1991-06-04 1991-06-04 学習制御方法

Country Status (1)

Country Link
JP (1) JP3109605B2 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3256950B2 (ja) * 1993-11-12 2002-02-18 株式会社安川電機 最適予見学習制御装置
JP6646025B2 (ja) * 2017-09-15 2020-02-14 ファナック株式会社 制御装置及び機械学習装置

Also Published As

Publication number Publication date
JPH04358202A (ja) 1992-12-11

Similar Documents

Publication Publication Date Title
KR970003823B1 (ko) 주기적 목표치에 최적하게 추종하는 제어방식
JPH10133703A (ja) 適応的ロバスト制御装置
US5179514A (en) Method and apparatus for trajectory control of robot manipulators or the like
EP0709754B1 (en) Prediction controller
JP2645464B2 (ja) エレベータの位置制御装置の調整方法
JP3109605B2 (ja) 学習制御方法
JP3158439B2 (ja) 予見制御装置
JP3039573B2 (ja) 学習制御方式
JP2921056B2 (ja) 速度指令の補正による学習制御装置
JP3039814B2 (ja) 学習制御方式
JP3036654B2 (ja) 学習制御方式
JP3152251B2 (ja) 増分値演算による学習制御方法
JP3191836B2 (ja) 学習制御装置
JP2541163B2 (ja) 周期的目標値に最適に追従する制御方式
JP3196907B2 (ja) 出力検出にむだ時間を持つ系の学習制御装置
JP2876702B2 (ja) 学習制御方法
JPH04369002A (ja) 近似ステップ応答による予見学習制御方式
JP3152250B2 (ja) 増分値による予見制御方法
JP3256950B2 (ja) 最適予見学習制御装置
CN116015119B (zh) 永磁同步电机电流控制方法及装置、存储介质及电子设备
JP3870767B2 (ja) 予測制御方法
JPH0830979B2 (ja) 周期的目標値に最適に追従する制御方法
JPH06314106A (ja) 学習制御装置
JPS62118406A (ja) 未来目標値と過去の操作量及び試行時の偏差の情報を用いる制御方式
JPH05143109A (ja) 速度指令の補正による学習制御方式

Legal Events

Date Code Title Description
FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20070914

Year of fee payment: 7

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20080914

Year of fee payment: 8

FPAY Renewal fee payment (event date is renewal date of database)

Free format text: PAYMENT UNTIL: 20090914

Year of fee payment: 9

LAPS Cancellation because of no payment of annual fees