JPH04372001A

JPH04372001A - 学習制御方法および装置

Info

Publication number: JPH04372001A
Application number: JP17723091A
Authority: JP
Inventors: Yuji Nakamura; 裕司中村
Original assignee: Yaskawa Electric Corp
Current assignee: Yaskawa Electric Corp
Priority date: 1991-06-20
Filing date: 1991-06-20
Publication date: 1992-12-25

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、同じパターンを繰り返
す目標指令が与えられる工作機械やロボット等で使用さ
れる学習制御方法および装置に関する。

【０００２】

【従来の技術】定位性を持つ制御対象を対象とした、繰
り返し目標値に対する学習制御系の設計法としては、本
出願人が特開平１−２３７７０１号公報において、提案
した方式がある。この方式の第１の発明の実施例の簡単
な構成図を図３に示す。ｒ（ｉ）　は周期Ｌで同じパタ
ーンを繰り返す目標指令であり、ｅ（ｉ）　、ｕ（ｉ）
　、ｙ（ｉ）　は、偏差、補正指令、出力である。この
方式では、繰り返し目標指令ｒ（ｉ）　に対する偏差ｅ
（ｉ）が学習制御装置に入力され、学習制御装置は、未
来の偏差ｅ（ｉ＋ｋ）　を予測して、その予測値の重み
付き２乗和Ｊ

【０００３】

【数３】

【０００４】が最小となるように補正指令ｕ（ｉ）　を
１周期前の値ｕ（ｉ’）から補正していくというもので
、最終的には目標値と出力が一致するため、高精度な追
従動作が実現される。ここで時刻ｉに学習制御装置が出
力する補正指令ｕ（ｉ）　は、次式により決定される。

【０００５】

【数４】

【０００６】で与えられ、Ｈｊ　（ｊ＝１，２，　・・
・，Ｎ）　は制御対象のステップ応答のサンプル値であ
り、Ｎは応答が充分に整定するように、すなわちＨＮ　
’　＝ＨＮ　（　Ｎ’　＞Ｎ）となるように選ばれる。したがって、ｇ０　＝１、ｇＮ　＝０であることに注意
して、ｇｎ　−ｇｎ−１　をあらためてｇｎ　とおけば
、学習制御装置の入力ｅ（ｉ）　から出力ｕ（ｉ）　ま
での伝達関数Ｇ（ｚ）　は、

【０００７】

【数５】

【０００８】となる。また、本出願人は、上述の設計法
における制御系のステップ応答のサンプリング点数Ｎを
短縮する方法として、ステップ応答を最初のＮ個だけサ
ンプリングして、その後はステップ応答の差分値ｈｋ　
が一定減衰比Ｐで減少するものと近似する方法を「近似
ステップ応答による予見学習制御方式」（平成３年６月
１７日特許出願）において提案している。ここでの時刻
ｉ　における補正指令ｕ（ｉ）　は、次式により決定さ
れる。

【０００９】

【数６】

【００１０】とする。したがって、この方式の場合も、
Ｎ−１　をあらためてＮとおけば、学習制御装置の入力
ｅ（ｉ）　から出力ｕ（ｉ）　までの伝達関数Ｇ（ｚ）
　は、

【００１１】

【数７】

【００１２】となる。これらの方式をモータの位置制御
系に適用すると、学習制御装置の入力は位置追従偏差で
あり、出力は補正位置指令で、学習制御装置は位置ルー
プの外側に位置することになる（図４）。そこで本出願
人は、さらに特願平２−１９６９４０号において、学習
制御装置を位置ループの内側に挿入し、その入力ｚ（ｉ
）　を位置追従偏差あるいはその定数倍した値とし、未
来の入力（追従偏差）を予測して、Ｍステップ未来まで
の予測値の重み付き２乗和が最小となるように補正指令
ｕ（ｉ）　を１周期前の値ｕ（ｉ’）から補正し、これ
を補正速度指令として速度制御器に入力する方式を提案
している（図５）。　　ここでの学習制御装置が出力す
る補正指令ｕ（ｉ）　は、次式により決定される。

【００１３】

【数８】

【００１４】で与えられ、Ｈｊ　（ｊ＝１，２，　・・
・，Ｎ）は、補正指令ｕ（ｉ）　を入力とし学習制御装
置への入力ｚ（ｉ）　を出力とするシステムのステップ
応答のサンプル値の差分値であり、Ｎは応答が充分に整
定するように、すなわちＨＮ　’　＝ＨＮ　（Ｎ’＞Ｎ
）となるように選ばれる。したがって、この方式の場合
も、定数ｇｎ　の符号を反転し、ｇＮ　＝０に注意すれ
ば、学習制御装置の入力ｚ（ｉ）　から出力ｕ（ｉ）　
までの伝達関数Ｇ（ｚ）　は、

【００１５】

【数９】

【００１６】となる。

【００１７】

【発明が解決しようとする課題】以上のように、上記の
３方式における学習制御装置の入出力間の伝達関数Ｇ（
ｚ）　は、定数の与え方は違うがすべて

【００１８】

【数１０】

【００１９】となる。しかし、上式の　ｚ−Ｌ／（　１
−ｚ−Ｌ）部分は、中立型むだ時間系となっているため
制御系全体の安定性が保証されないという問題がある（
中野他著、繰返し制御、第２章参照）。そこで本発明は
、より安定性の高い学習制御装置を提供することを目的
とする。

【００２０】

【課題を解決するための手段】上記問題点を解決するた
め、本発明は、同じパターンを繰り返す目標指令に制御
対象の出力を追従させるよう、制御対象に補正指令を出
力する学習制御系において、追従偏差あるいは追従偏差
を定数倍したものを入力とし、その入力信号に下記伝達
関数Ｇ（ｚ）　を乗じたものを補正指令として出力する
ことを特徴とするものである。

【００２１】

【数１１】

【００２２】ここで、Ｑ、ｇｎ　、ｑｍ　は、現在時刻
よりＭステップ未来時刻までの偏差の予測値の重み付き
２乗和が、最小となるよう定められる定数であり、Ｆ（
ｚ）　はローパスフィルタの伝達関数である。

【００２３】

【作用】制御対象の伝達関数をＧｐ（ｚ）とすると、上
記手段により、

【００２４】

【数１２】

【００２５】なる関係が成り立ち、これを変形すると、
　　Ｅ（ｚ）　＝　　ｚ−ＬＦ（ｚ）（１−Ｇ１（ｚ）
　）Ｅ（ｚ）　＋Ｇ２（ｚ）（１−Ｆ（ｚ）ｚ−Ｌ）Ｒ
（ｚ）　となる。ただし、Ｇ１（ｚ）　＝　　Ｇ２（ｚ）　　Ｇｐ（ｚ）　　Ｄ（
ｚ）　−１　　Ｃ（ｚ）Ｇ２（ｚ）　＝（１＋ＱＧｐ（
ｚ）Ｄ（ｚ）　−１）　−１

【００２６】

【数１３】

【００２７】とする。ここで、制御系の安定条件は、｜
Ｆ（ｊω）　｜｜１−Ｇ１（ｊω）　｜＜１すなわち、
Ｇ１（ｊω）　のベクトル軌跡が中心（１，０）　半径
１／｜Ｆ（ｊω）　｜の円内にあることである。したが
って、Ｆ（ｚ）　にローパスフィルタの特性を持たせ、
追従させたい周波数域ではＦ（ｊω）　≒１とし、｜１
−Ｇ１（ｊω）　｜が１以上となる高周波数域では｜Ｆ
（ｊω）　｜＜１とすることにより、安定性が保証され
る。

【００２８】

【実施例】以下、本発明を実施例に基づいて具体的に説
明する。図１は、本発明の学習制御装置の第１の内部構
成例である。同図において、１、４、９は、加算器、２
、６、１０は、サンプリング周期に同期してデータをシ
フトする、第１、第２、第３のシフトレジスタであり、
それぞれの段数は、２ｐ段、Ｌ−ｐ段、Ｎ段である。た
だし、Ｌは、繰り返し動作の１周期分に相当する段数で
ある。３、７、８、１１は、それぞれ２ｐ＋１個、Ｍ個
、１個、Ｎ個の、乗算器、５は、第１のシフトレジスタ
２と２ｐ＋１個の乗算器３と、第２の加算器４からなる
２ｐ＋１次のローパスフィルタである。以下、同図の学
習制御装置の入力である追従偏差ｅ（ｉ）　から、出力
である補正指令ｕ（ｉ）　までのデータの流れを追うこ
とにより、本装置の機能を説明する。

【００２９】まず、入力された追従偏差ｅ（ｉ）　は、
第１の加算器１により、第２のシフトレジスタ６の最終
段の出力と加算されるとともに、第３の乗算器８に入力
される。第１の加算器１の出力は、フィルタ５に入力さ
れ、フィルタ内の第１のシフトレジスタ２において、サ
ンプリング周期に同期してシフトされる。この２ｐ段の
シフトレジスタ２の初段の入力データ、および各段の出
力データは、乗算器３により乗数倍された後、第２の加
算器４に入力され、当加算器４の出力がフィルタ５の出
力となる。

【００３０】フィルタ５の出力は、第２のシフトレジス
タ６に入力され、サンプリング周期でシフトされる。こ
のシフトレジスタ６の最終段より１段前からＭ段前の出
力は、それぞれＭ個の乗算器７によって乗数倍され、前
記第３の乗算器８の出力とともに、第３の加算器９に入
力される。さらに、第３のシフトレジスタ１０の各段の
出力も、それぞれ、第４の乗算器１１により、乗数倍さ
れ、符号を反転されて、この第３の加算器９に入力され
る。第３の加算器９の出力は、本学習制御装置の出力と
して出力されるとともに、第３のシフトレジスタ１０に
入力され、サンプリング周期でシフトされていく。以上
のデータ処理により、入力ｅ（ｉ）　から出力ｕ（ｉ）
　までの伝達関数Ｇ（ｚ）　は、

【００３１】

【数１４】

【００３２】となる。ただし、Ｆ（ｚ）　はローパスフ
ィルタ５からその遅れ時間ｐを除いたものの伝達関数で
あり、フィルタの係数　ａ０，ａ１，　…，ａｐ　は、
伝達関数Ｆ（ｚ）　が、追従させたい周波数域ではＦ（
ｊω）　≒１となり、それ以上の高周波数域では｜Ｆ（
ｊω）　｜≪１となるよう設定する。定数Ｑ、ｇｎ　、
ｑｍ　は、乗算器８、１１、７の乗数で、現在時刻ｉよ
りＭステップ未来時刻までの偏差の予測値｛ｅ（ｉ＋１
），ｅ（ｉ＋２），…，　ｅ（ｉ＋Ｍ）　｝の重み付き
２乗和が、最小となるよう以下のように定められる。例
えば、学習方式として、特開平１ー２３７７０１号公報
の第１の発明の方式を利用する場合には、各定数は、

【
００３３】

【数１５】

【００３４】で与えられる。ただし、Ｈｊ　（ｊ＝１，
２，　・・・，Ｎ）　は制御対象のステップ応答のサン
プル値であり、Ｎは応答が充分に整定するように、すな
わちＨＮ　’　＝ＨＮ　（Ｎ’　＞Ｎ）となるように選
ばれる。さらに、ｈｊ　＝　Ｈｊ　−Ｈｊ−１　である
。また、「近似ステップ応答による予見学習制御方式」
（平成３年６月１７日特許出願）の方式を利用する場合
には、各定数は、

【００３５】

【数１６】

【００３６】で与えられる。さらに、特願平２−１９６
９４０号の方式を利用する場合には、各定数は、

【００
３７】

【数１７】

【００３８】で与えられ、Ｈｊ　（ｊ＝１，２，　・・
・，Ｎ）は、補正指令ｕ（ｉ）　を入力とし学習制御装
置への入力ｅ（ｉ）　を出力とするシステムのステップ
応答のサンプル値の差分値であり、Ｎは応答が充分に整
定するように、すなわちＨＮ　’　＝ＨＮ　（Ｎ’＞Ｎ
）となるように選ばれる。また、この場合の入力ｅ（ｉ
）　は、偏差を乗数倍した（特願平２−１９６９４０号
ではｚ（ｉ）　と表記）ものである。

【００３９】次に本発明の学習制御装置の第２の内部構
成例を図２に示す。同図において、２１は、加算部、２
３、２６は、積和演算部であり、これらの演算はＣＰＵ
によって、サンプリング周期で行われる。２４は、第１
の内部構成図のローパスフィルタ５に相当する。２２は
、現在時刻ｉから２ｐサンプリング過去までのデータβ
（ｊ）　ｊ＝ｉ，ｉ−１，…ｉ−２ｐを記憶する第１の
リングメモリ、２５は、１周期分のデータα（ｊ）　ｊ
＝０，１，…，Ｌ−１を記憶する第２のリングメモリ、
２７は、現在時刻ｉからＮサンプリング過去までのデー
タｕ（ｊ）　ｊ＝ｉ，ｉ−１，…，ｉ−Ｎを記憶する第
３のリングメモリである。

【００４０】以下、同図の学習制御装置の入力である追
従偏差ｅ（ｉ）　から、出力である補正指令ｕ（ｉ）　
までのデータの流れを追うことにより、本装置の機能を
説明する。まず、時刻ｉにおいて入力された追従偏差ｅ
（ｉ）と、第２のリングメモリ２５の時刻ｉに対応する
番地のデータα（ｉ）　とを加算した値β（ｉ）　を、
第１のリングメモリ２２の時刻ｉに対応する番地に格納
する（β（ｉ）　＝　ｅ（ｉ）＋α（ｉ）　）。つぎに
、

【００４１】

【数１８】

【００４２】なる積和演算２３によって得られたα（ｉ
−ｐ）　を第２のリングメモリ２５に格納する。さらに
、

【００４３】

【数１９】

【００４４】なる演算２６により補正指令ｕ（ｉ）　を
決定し出力するとともに、この値を第３のリングメモリ
２７に格納する。以上のデータ処理により、入力ｅ（ｉ
）　から出力ｕ（ｉ）　までの伝達関数Ｇ（ｚ）　は、

【００４５】

【数２０】

【００４６】となる。ただし、ローパスフィルタ２４か
らその遅れ時間ｐを除いたものの伝達関数Ｆ（ｚ）　お
よび、定数Ｑ、ｇｎ　、ｑｍ　は、図１の場合と同様に
設定される。なお第１、第２の内部構成例において、十
分な試行を経て、入力である偏差ｅがあらかじめ設定さ
れた値以内に収束した後は、入力ｅ（ｉ）　の加算器１
、２１への入力をやめ、ａ０　＝　１　，　ａｊ　＝　
０（ｊ≠０）としてフィルタ機能をころすことによって
、補正機能を削除しても良い。

【００４７】

【発明の効果】以上述べたように、本発明によれば、同
じパターンの目標指令に対する動作を繰り返す学習制御
系において、未来の追従偏差予測値の重み付き２乗和が
、最小となるように補正指令を決定しており、さらに、
安定化のためにローパスフィルタを利用しているため、
より安定した高精度な追従動作が可能な学習制御装置が
実現される。

【図面の簡単な説明】

【図１】本発明の実施例

【図２】本発明の他の実施例

【図３】従来例

【図４】従来例

【図５】従来例

【符号の説明】

１、４、９　　加算器２　　第１のシフトレジスタ３　　２ｐ＋１個の乗算器５　　ローパスフィルタ６　　第２のシフトレジスタ７　　Ｍ個の乗算器８　　乗算器１０　　第３のシフトレジスタ１１　　Ｎ個の乗算器、２１　　加算部２２　　第１のリングメモリ２３、２６　　積和演算部２４　　ローパスフィルタ２５　　第２のリングメモリ２７　　第３のリングメモリ

Claims

【特許請求の範囲】

【請求項１】　　同じパターンを繰り返す目標指令に制
御対象の出力を追従させるよう、制御対象に補正指令を
出力する学習制御系において、追従偏差あるいは追従偏
差を定数倍したものを入力とし、その入力信号に下記伝
達関数Ｇ（ｚ）　を乗じたものを補正指令として出力す
ることを特徴とする学習制御方法。【数１】（ここで、Ｌは、目標指令１周期分のサンプリング数で
あり、Ｑ、ｇｎ　、ｑｍ　は、現在時刻よりＭステップ
未来時刻までの偏差の予測値の重み付き２乗和が、最小
となるよう定められる定数であり、Ｆ（ｚ）　はローパ
スフィルタの伝達関数である）
【請求項２】　　同じパターンを繰り返す目標指令に制
御対象の出力を追従させるよう、制御対象に補正指令を
出力する学習制御装置において、２ｐ段の第１のシフト
レジスタを持つローパスフィルタと、Ｌ−ｐ段の第２の
シフトレジスタと、Ｎ段の第３のシフトレジスタとを備
え、前記各シフトレジスタはサンプリング周期に同期し
てデータをシフトするものとし、時刻ｉに入力された追
従偏差ｅ（ｉ）　と、前記第２のシフトレジスタの最終
段の出力とを加算したものを、前記ローパスフィルタに
入力し、その前記ローパスフィルタの出力を前記第２の
シフトレジスタの初段に入力し、追従偏差ｅ（ｉ）　を
乗数倍したものと、前記第２のシフトレジスタの最終段
より１段前からＭ段前までの各出力をそれぞれ乗数倍し
たものと、前記第３のシフトレジスタの各段の出力をそ
れぞれ乗数倍して符号を反転したものとを加算して前記
第３のシフトレジスタに入力するとともに、補正指令ｕ
（ｉ）　として出力するようにしたことを特徴とする学
習制御装置。
【請求項３】　　十分な試行を経て、入力である偏差ｅ
があらかじめ設定された値以内に収束した後は、入力ｅ
（ｉ）　と第２のシフトレジスタの最終段の出力との加
算をやめ、第２のシフトレジスタの最終段の出力のみを
第１のシフトレジスタに入力し、当シフトレジスタのｐ
段目の出力のみを第２のシフトレジスタに入力すること
を特徴とする請求項２記載の学習制御装置。
【請求項４】　　　　同じパターンを繰り返す目標指令
に制御対象の出力を追従させるよう、制御対象に補正指
令を出力する学習制御装置において、現在時刻ｉからｉ
−２ｐサンプリング過去までのデータβ（ｊ）　ｊ＝ｉ
，ｉ−１，…ｉ−２ｐを記憶する第１のリングメモリを
持つローパスフィルタと、１周期分のデータα（ｊ）　
ｊ＝０，１，…，Ｌ−１を記憶する第２のリングメモリ
と、現在時刻ｉからＮサンプリング過去までのデータｕ
（ｊ）　ｊ＝ｉ，ｉ−１，…，ｉ−Ｎを記憶する第３の
リングメモリとを備え、各サンプリング時刻ｉにおいて
、入力された追従偏差ｅ（ｉ）　と、前記第２のリング
メモリの時刻ｉに対応する番地のデータα（ｉ）　とを
加算した値β（ｉ）を、前記ローパスフィルタに入力し
、その前記ローパスフィルタの出力α（ｉ−ｐ）　を前
記第２のリングメモリの時刻ｉ−ｐに対応する番地に格
納し、さらに、【数２】なる演算により補正指令ｕ（ｉ）　を決定し出力すると
ともに、この値を前記第３のリングメモリに格納するこ
とを特徴とする学習制御装置。
【請求項５】　　十分な試行を経て、入力である偏差ｅ
があらかじめ設定された値以内に収束した後は、入力ｅ
（ｉ）　と第２のリングメモリのデータα（ｉ）　との
加算をやめ、α（ｉ）　のみを第１のリングメモリの時
刻ｉに対応する番地に格納し、当リングメモリの時刻ｉ
−ｐに対応する番地のデータのみを第２のリングメモリ
の時刻ｉ−ｐに対応する番地に格納することを特徴とす
る請求項４記載の学習制御装置。