JPH04358202A

JPH04358202A - 学習制御方法

Info

Publication number: JPH04358202A
Application number: JP16103191A
Authority: JP
Inventors: Yuji Nakamura; 裕司中村
Original assignee: Yaskawa Electric Corp
Current assignee: Yaskawa Electric Corp
Priority date: 1991-06-04
Filing date: 1991-06-04
Publication date: 1992-12-11
Anticipated expiration: 2015-11-20
Also published as: JP3109605B2

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】

【０００１】

【産業上の利用分野】本発明は、繰り返し動作をする工
作機械、ロボット等の制御方式に関する。

【０００２】

【従来の技術】繰り返し目標値に対する学習制御系の設
計法としては、本出願人が特開平１−２３７７０１号公
報において、提案した方式がある。この方式は、同じ目
標値に対する動作を繰り返し、過去の偏差および制御対
象の動特性に関する情報をもとに未来の偏差を予測し、
その予測値の重み付き２乗和を評価関数として、その評
価関数が最小となるように制御入力を補正していくとい
うもので、最終的には目標値と出力が一致するため、高
精度な追従動作が実現される。

【０００３】

【発明が解決しようとする課題】ところが、上述の方式
では、評価関数が未来の偏差の予測値のみに関するもの
であるため、補正の度合いを調節したり、制御入力の値
やその変化の度合いに制約を与えたりすることができな
かった。そこで、本発明は、補正の度合いを調節したり
、制御入力の値やその変化の度合いに制約を与えること
ができる方式を提供することを目的とする。

【０００４】

【課題を解決するための手段】上記課題を解決するため
、本願の第１の発明では、同じパターンを繰り返す目標
指令に制御対象の出力を追従させるよう試行を繰り返し
、ｋ回目の試行の、時刻ｉにおける制御入力ｕｋ　（ｉ
）　を、次式ｕｋ　（ｉ）　＝　ｕｋ−１　（ｉ）　＋　σｋ　（ｉ
）σｋ　（ｉ）　＝　σｋ　（ｉ−１）＋Δσｋ　（ｉ
）（ただし、ｋは試行回数を表わし、σｋ　（ｉ）　は
前回の制御入力ｕｋ−１　（ｉ）　からの補正量であり
、Δσｋ　（ｉ）　はその増分値である）で与える学習
制御系において、Ｍステップ未来までの追従偏差ｅを予
測し、それらの予測値｛ｅｋ　＊　（ｉ＋１），ｅｋ　
＊　（ｉ＋２），…，　ｅｋ　＊　（ｉ＋Ｍ）　｝と補
正量σｋ　（ｉ）　の重み付き２乗和が最小となるよう
に、増分補正量Δσｋ　（ｉ）　を決定することを特徴
としている。本願の第２の発明では、同じパターンを繰
り返す目標指令に制御対象の出力を追従させるよう試行
を繰り返し、ｋ回目の試行の、時刻ｉにおける制御入力
ｕｋ　（ｉ）　を、次式ｕｋ　（ｉ）　＝　ｕｋ−１　（ｉ）　＋　σｋ　（ｉ
）σｋ　（ｉ）　＝　σｋ　（ｉ−１）＋Δσｋ　（ｉ
）（ただし、ｋは試行回数を表わし、σｋ　（ｉ）　は
前回の制御入力ｕｋ−１　（ｉ）　からの補正量であり
、Δσｋ　（ｉ）　はその増分値である）で与える学習
制御系において、Ｍステップ未来までの追従偏差ｅを予
測し、それらの予測値｛ｅｋ　＊　（ｉ＋１），ｅｋ　
＊　（ｉ＋２），…，　ｅｋ　＊　（ｉ＋Ｍ）　｝と増
分補正量Δσｋ　（ｉ）　の重み付き２乗和が最小とな
るように、増分補正量Δσｋ　（ｉ）　を決定すること
を特徴としている。本願の第３の発明では、同じパター
ンを繰り返す目標指令に制御対象の出力を追従させるよ
う試行を繰り返し、ｋ回目の試行の、時刻ｉにおける制
御入力ｕｋ　（ｉ）　を、次式ｕｋ　（ｉ）　＝　ｕｋ−１　（ｉ）　＋　σｋ　（ｉ
）σｋ　（ｉ）　＝　σｋ　（ｉ−１）＋Δσｋ　（ｉ
）（ただし、ｋは試行回数を表わし、σｋ　（ｉ）　は
前回の制御入力ｕｋ−１　（ｉ）　からの補正量であり
、Δσｋ　（ｉ）　はその増分値である）で与える学習
制御系において、Ｍステップ未来までの追従偏差ｅを予
測し、それらの予測値｛ｅｋ　＊　（ｉ＋１），ｅｋ　
＊　（ｉ＋２），…，　ｅｋ　＊　（ｉ＋Ｍ）　｝と制
御入力ｕｋ　（ｉ）　の重み付き２乗和が最小となるよ
うに、増分補正量Δσｋ　（ｉ）　を決定することを特
徴としている。本願の第４の発明では、同じパターンを繰り返す目標指
令に制御対象の出力を追従させるよう試行を繰り返し、
ｋ回目の試行の、時刻ｉにおける制御入力ｕｋ（ｉ）　
を、次式ｕｋ　（ｉ）　＝　ｕｋ−１　（ｉ）　＋　σｋ　（ｉ
）σｋ　（ｉ）　＝　σｋ　（ｉ−１）＋Δσｋ　（ｉ
）（ただし、ｋは試行回数を表わし、σｋ　（ｉ）　は
前回の制御入力ｕｋ−１　（ｉ）　からの補正量であり
、Δσｋ　（ｉ）　はその増分値である）で与える学習
制御系において、Ｍステップ未来までの追従偏差ｅを予
測し、それらの予測値｛ｅｋ　＊　（ｉ＋１），ｅｋ　
＊　（ｉ＋２），…，　ｅｋ　＊　（ｉ＋Ｍ）　｝と制
御入力の増分値Δｕｋ　（ｉ）　の重み付き２乗和が最
小となるように、増分補正量Δσｋ　（ｉ）　を決定す
ることを特徴としている。

【０００５】

【作用】本発明は、追従偏差の予測値と補正量等との重
み付き２乗和が最小となるように、増分補正量を決定す
るため、補正量側の重みを加減することにより、補正の
度合いを調節したり、制御入力の値やその変化の度合い
に制約を与えたりすることが可能となる。

【０００６】

【実施例】以下、本発明の具体的実施例を図１に示して
説明する。図中１は指令発生器であり、現在時刻ｉにお
ける目標指令値ｒ（ｉ）　を発生する。２は減算器であ
り、目標指令ｒとの偏差ｅを出力する。３は、定数ｑ１
　、ｑ２　、・・・　、ｑＭ　、Ｑ、ｇ１　、ｇ２　、
・・・　、ｇＮ−１　を記憶するメモリ、４は、前回の
試行の時刻ｉから現在時刻ｉまでの偏差ｅ（ｅｋ−１（
ｉ）〜ｅｋ（ｉ）　）を記憶するメモリ、５は、現在時
刻ｉに至るまでの増分補正量（Δσｋ　（ｊ），ｊ＝ｉ
−１，ｉ−２，・・，ｉ−Ｎ＋１）　を記憶するメモリ
、６は前回の試行の時刻ｉから現在時刻ｉまでの制御入
力（ｕｋ−１（ｉ）〜ｕｋ　（ｉ）　）を記憶するメモ
リである。７は演算器であり、本願の第１の発明では、

【０００７】

【数９】

【０００８】本願の第２の発明では、

【０００９】

【数１０】

【００１０】本願の第３の発明では、

【００１１】

【数１１】

【００１２】本願の第４の発明では、

【００１３】

【数１２】

【００１４】なる演算によって、時刻ｉにおける増分補
正量Δσｋ　（ｉ）　を算出する。また、８は積算器で
、σｋ　（ｉ）　＝　σｋ　（ｉ−１）　＋　Δσｋ　
（ｉ）なる演算によって、時刻ｉにおける補正量σｋ　
（ｉ）　を算出する。さらに、９は現在時刻ｉにおける
補正量σｋ　（ｉ）　と、前回の試行の時刻ｉの制御入
力ｕｋ−１（ｉ）とを加算して、今回の制御入力ｕｋ　
（ｉ）　を出力する加算器である。１０、１１はサンプ
リング周期Ｔで閉じるサンプラであり、１２はホールド
回路である。１３は入力がｕ（ｔ）で出力がｙ（ｔ）　
の制御対象である。（１ａ）〜（１ｄ）式の導出を行う
。制御対象１３はステップ応答モデルにより、

【００１５】

【数１３】

【００１６】と表すことができる。ここで、｛Ｈ　１　
，Ｈ２　，　…，ＨＮ　｝は、前もって測定された制御
対象１３の単位ステップ応答のサンプル値である（図２
）。Ｎは応答が十分に整定するように、すなわち、Ｈ　
ｎ　≒Ｈ　Ｎ　（ｎ＞Ｎ）となるように選ぶものとし、
Ｈ０＝　０　である。Δｕ（ｉ）　は、入力ｕ（ｉ）　
の増分値で、Δｕ（ｉ）＝ｕ（ｉ）−ｕ（ｉ−１）　で
ある。さらに、実際の出力ｙ（ｉ）　と（２）　式のモ
デル出力

【００１７】

【数１４】

【００１８】との差、すなわち、推定誤差をｄ（ｉ）　
とする。

【００１９】

【数１５】

【００２０】いまｋ回目の試行の、時刻ｉにおける制御
入力ｕｋ　（ｉ）　を、次式で与えるものとする。　　　　ｕｋ　（ｉ）　＝　ｕｋ−１　（ｉ）　＋　σ
ｋ　（ｉ）　　　　　　　　　　　　　　　　　　　　
　　　　　　　　　　　　　（４）　ただし、ｋは試行
回数を表わし、σｋ　（ｉ）　は前回の制御入力ｕｋ−
１　（ｉ）　からの補正量である。ここで、未来の追従
偏差の予測値ｅｋ　＊　を以下の手順で求める。ｋ回目
の試行の時刻ｉにおいて、出力ｙｋ　（ｉ）　は、次式
で表すことができる。

【００２１】

【数１６】

【００２２】さらにｋ−１回目の試行の時刻ｉにおいて
は、

【００２３】

【数１７】

【００２４】となる。（５）　式から（６）　式を引く
ことにより、次式を得る。

【００２５】

【数１８】

【００２６】ただし、

【００２７】

【数１９】

【００２８】である。ここでδｋ　（ｉ）　は、出力ｙ
ｋ　（ｉ）　の、前回試行時の同じ時刻の出力ｙｋ−１
　（ｉ）　からの変化分である。さらに、時刻　ｉ＋ｍ
の出力変化分δｋ　（ｉ＋ｍ）　は次式で表される。

【００２９】

【数２０】

【００３０】いま、時刻ｉにおいてＭステップ先までの
出力変化分の予測値δｋ　＊　（ｉ＋ｍ）　（ｍ＝１，
２，…，Ｍ）　を求める際に、■（２）　式のモデルに
よる推定誤差の変化分は不変、すなわち、ｄｋ　（ｉ＋
ｍ）　−ｄｋ−１（ｉ＋ｍ）＝ｄ　ｋ　（ｉ）−ｄｋ−
１（ｉ）であり、さらに、■未来の補正量の増分値Δσ
ｋ　（ｉ＋ｍ）　はすべて零であると仮定すると、予測
値δｋ　＊　（ｉ＋ｍ）　は、（１０）式より、

【００３１】

【数２１】

【００３２】となる。したがって、（７）　、（９）　
、（１１）式より、予測値δｋ　＊　（ｉ＋ｍ）　は次
式で与えられる。

【００３３】

【数２２】

【００３４】δｋ　（ｉ）　の定義により、時刻ｉ＋ｍ
における追従偏差ｅｋ　（ｉ＋ｍ）　は次式で表される
。　　　　　　　　ｅｋ　（ｉ＋ｍ）　＝　ｅｋ−１　（
ｉ＋ｍ）　　−δｋ　　（ｉ＋ｍ）　　　　　　　　　
　　　　　　　　　　（１３）　したがって、その予測
値ｅｋ　＊　（ｉ＋ｍ）　は次式で与えられる。　　　　　　　　ｅｋ　＊　（ｉ＋ｍ）　＝　ｅｋ−１
　（ｉ＋ｍ）　−　δｋ　＊　（ｉ＋ｍ）　　　　　　
　　　　　　　　　　（１４）　さらに、δｋ　（ｉ）
　も次式のように追従偏差で表すことができる。　　　　　　　　δｋ　（ｉ）　＝　ｅｋ−１　（ｉ）
　−　ｅｋ　（ｉ）　　　　　　　　　　　　　　　　
　　　　　　　　　　（１５）　　　（１２）、（１４
）、（１５）式より、偏差の予測値ｅｋ＊　（ｉ＋ｍ）
　は結局次式で与えられる。

【００３５】

【数２３】

【００３６】上式より未来の追従偏差の予測値ｅｋ　＊
　（ｉ＋ｍ）　は、前回の試行における追従偏差ｅｋ−
１　、現在の追従偏差ｅｋ　（ｉ）　、現在に至るまで
に入力してきた増分補正量Δσｋ　（ｉ−ｎ）　、およ
び現在決定すべき増分補正量Δσｋ　（ｉ）によって予
測されている。そこで、本願の第１の発明では、Ｍステ
ップ未来までの追従偏差の予測値ｅｋ　＊　（ｉ＋ｍ）
　（ｍ＝１，２，…，Ｍ）　をより小さくするための指
標として、次の評価関数Ｊ

【００３７】

【数２４】

【００３８】を考え、この評価関数Ｊが最小となるよう
にΔσｋ　（ｉ）　を決定する。ここでｗ　ｍ　は、ｍ
　ステップ未来の追従偏差の予測値ｅｋ　＊　（ｉ＋ｍ
）　にかける重み係数であり、近い未来の予測値ほど重
視する減衰型（図３）や、現在決定する増分補正量Δσ
ｋ　（ｉ）　が出力に与える影響度を考慮したインパル
ス応答型（図４　，ｗｍ　＝Ｈｍ　−Ｈｍ−１　）など
が考えられる。ただし，ｗｍ　＞０　（ｍ＝１，２，…
，Ｍ）　とする。また、ｃ　は補正量σｋ　（ｉ）　に
かける重み係数であり、ｃ　≧０とする。（１６）、（
１７ａ）　式より、

【００３９】

【数２５】

【００４０】は、

【００４１】

【数２６】

【００４２】となり、上式は未知数Δσｋ　（ｉ）　に
関する１次方程式である。さらに、

【００４３】

【数２７】

【００４４】であるため、（１７ａ）　式の評価関数を
最小にするΔσｋ　（ｉ）　は（１８）式より、

【００
４５】

【数２８】

【００４６】を満たす。したがって、時刻ｉにおける増
分補正量Δσｋ（ｉ）　は（１ａ）式に従って決定され
る。本願の第２の発明では、次の評価関数Ｊ

【００４７】

【数２９】

【００４８】を考え、この評価関数Ｊを最小とするΔσ
ｋ　（ｉ）　を同様に求めると（１ｂ）式となる。本願
の第３の発明では、次の評価関数Ｊ

【００４９】

【数３０】

【００５０】を考え、この評価関数Ｊを最小とするΔσ
ｋ　（ｉ）　を同様に求めると（１ｃ）式となる。本願
の第４の発明では、次の評価関数Ｊ

【００５１】

【数３１】

【００５２】を考え、この評価関数Ｊを最小とするΔσ
ｋ　（ｉ）　を同様に求めると（１ｄ）式となる。ただ
し、

【００５３】

【数３２】

【００５４】であり、これらの定数は、ステップ応答デ
ータ｛Ｈ　ｎ　｝を測定し、重み係数｛ｗ　ｍ　｝を適
当に与えることにより、学習を行う前にあらかじめ算出
できる。以上で、（１ａ）〜（１ｄ）式で与えられる増分補正量
Δσｋ　（ｉ）　が、（１７ａ）　〜（１７ｄ）式の評
価関数Ｊを最小にすることが示された。なお、重み係数
ｃ　は、試行を重ねる過程で、学習が利きすぎる場合は
大きくしたり、収束を速くしたい箇所では小さくしたり
して、変化させても良い。

【００５５】

【発明の効果】以上述べたように、本発明によれば、同
じパターンの目標値に対する動作を繰り返す学習制御系
において、過去の偏差および制御対象の動特性に関する
情報をもとに未来の偏差を予測し、その予測値および制
御入力あるいはその補正量の重み付き２乗和が最小とな
るように制御入力を補正していくため、補正の度合いを
調節したり、制御入力の値やその変化の度合いに制約を
与えたりすることが可能であり、最終的には目標値と出
力が一致し、高精度な追従動作が実現される。

【図面の簡単な説明】

【図１】本発明の実施例を示す図

【図２】本発明の動作説明図

【図３】本発明の動作説明図

【図４】本発明の動作説明図

【符号説明】３　　定数ｑ１　、ｑ２　、・・・　、ｑ
Ｍ　、Ｑ、ｇ１　、ｇ２　、・・・　、ｇＮ−１を記憶
するメモリ４　　前回の試行の時刻ｉから現在時刻ｉま
での偏差ｅ（ｅｋ−１（ｉ）〜ｅｋ　（ｉ）　）を記憶
するメモリ５　　現在時刻ｉに至るまでの増分補正量（
Δσｋ　（ｊ），ｊ＝ｉ−１，ｉ−２，・・，ｉ−Ｎ＋
１）　を記憶するメモリ６　　前回の試行の時刻ｉから
現在時刻ｉまでの制御入力（ｕｋ−１（ｉ）〜ｕｋ　（
ｉ）　）を記憶するメモリ７　　演算回路１２　　ホールド回路１３　　制御対象

Claims

【特許請求の範囲】

【請求項１】同じパターンを繰り返す目標指令に制御対
象の出力を追従させるよう試行を繰り返し、ｋ回目の試
行の、時刻ｉにおける制御入力ｕｋ　（ｉ）　を、次式
ｕｋ　（ｉ）　＝　ｕｋ−１（ｉ）＋σｋ　（ｉ）σｋ
　（ｉ）　＝　σｋ　（ｉ−１）＋Δσｋ　（ｉ）（た
だし、ｋは試行回数を表わし、σｋ　（ｉ）　は前回の
制御入力ｕｋ−１（ｉ）からの補正量であり、Δσｋ　
（ｉ）　はその増分値である）で与える学習制御系にお
いて、Ｍステップ未来までの追従偏差ｅを予測し、それ
らの予測値｛ｅｋ　＊　（ｉ＋１），ｅｋ　＊　（ｉ＋
２），…，　ｅｋ　＊　（ｉ＋Ｍ）　｝と補正量σｋ　
（ｉ）　の重み付き２乗和【数１】（ただし、　ｗｍ　は、ｍ　ステップ未来の追従偏差の
予測値ｅｋ　＊　（ｉ＋ｍ）　にかける重み係数であり
、ｃは補正量σｋ　（ｉ）　にかける重み係数である）
が最小となるように、増分補正量Δσｋ　（ｉ）　を決
定することを特徴とする学習制御方式。
【請求項２】ｋ回目の試行の、時刻ｉにおける増分補正
量Δσｋ　（ｉ）を、【数２】（ただし、ｑｍ　、Ｑ、ｇｎ　、Ｃは、制御対象のステ
ップ応答のサンプル値と、予測される未来の偏差および
補正量に掛ける重みによって決定される定数である）と
することを特徴とする請求項１記載の学習制御方式。
【請求項３】同じパターンを繰り返す目標指令に制御対
象の出力を追従させるよう試行を繰り返し、ｋ回目の試
行の、時刻ｉにおける制御入力ｕｋ　（ｉ）　を次式ｕ
ｋ　（ｉ）　＝　ｕｋ−１　（ｉ）　＋σｋ　（ｉ）σ
ｋ　（ｉ）　＝　σｋ　（ｉ−１）＋Δσｋ　（ｉ）（
ただし、ｋは試行回数を表わし、σｋ　（ｉ）　は前回
の制御入力ｕｋ−１　（ｉ）　からの補正量であり、Δ
σｋ　（ｉ）　はその増分値である）で与える学習制御
系において、Ｍステップ未来までの追従偏差ｅを予測し
、それらの予測値｛ｅｋ　＊　（ｉ＋１），ｅｋ　＊　
（ｉ＋２），…，　ｅｋ　＊　（ｉ＋Ｍ）　｝と増分補
正量Δσｋ　（ｉ）　の重み付き２乗和【数３】（ただし、　ｗｍ　は、ｍ　ステップ未来の追従偏差の
予測値ｅｋ　＊　（ｉ＋ｍ）　にかける重み係数であり
、ｃは増分補正量Δσｋ　（ｉ）　にかける重み係数で
ある）が最小となるように、増分補正量Δσｋ　（ｉ）
　を決定することを特徴とする学習制御方式。
【請求項４】ｋ回目の試行の、時刻ｉにおける補正量Δ
σｋ　（ｉ）　を、【数４】（ただし、ｑｍ　、Ｑ、ｇｎ　は、制御対象のステップ
応答のサンプル値と、予測される未来の偏差および補正
量の増分値に掛ける重みによって決定される定数である
）とすることを特徴とする請求項３記載の学習制御方式
。
【請求項５】同じパターンを繰り返す目標指令に制御対
象の出力を追従させるよう試行を繰り返し、ｋ回目の試
行の、時刻ｉにおける制御入力ｕｋ　（ｉ）　を、次式
ｕｋ　（ｉ）　＝　ｕｋ−１　（ｉ）　＋　σｋ　（ｉ
）σｋ　（ｉ）　＝　σｋ　（ｉ−１）＋Δσｋ　（ｉ
）（ただし、ｋは試行回数を表わし、σｋ　（ｉ）　は
前回の制御入力ｕｋ−１　（ｉ）　からの補正量であり
、Δσｋ　（ｉ）　はその増分値である）で与える学習
制御系において、Ｍステップ未来までの追従偏差ｅを予
測し、それらの予測値｛ｅｋ　＊　（ｉ＋１），ｅｋ　
＊　（ｉ＋２），…，　ｅｋ　＊　（ｉ＋Ｍ）　｝と制
御入力ｕｋ　（ｉ）　の重み付き２乗和【数５】（ただし、　ｗｍ　は、ｍ　ステップ未来の追従偏差の
予測値ｅｋ　＊　（ｉ＋ｍ）　にかける重み係数であり
、ｃは制御入力ｕｋ　（ｉ）　にかける重み係数である
）が最小となるように、増分補正量Δσｋ　（ｉ）　を
決定することを特徴とする学習制御方式。
【請求項６】ｋ回目の試行の、時刻ｉにおける補正量Δ
σｋ　（ｉ）　を、【数６】（ただし、ｑｍ　、Ｑ、ｇｎ　、Ｃは、制御対象のステ
ップ応答のサンプル値と、予測される未来の偏差および
制御入力に掛ける重みによって決定される定数である）
とすることを特徴とする請求項５記載の学習制御方式。
【請求項７】同じパターンを繰り返す目標指令に制御対
象の出力を追従させるよう試行を繰り返し、ｋ回目の試
行の、時刻ｉにおける制御入力ｕｋ　（ｉ）　を、次式
ｕｋ　（ｉ）　＝　ｕｋ−１　（ｉ）　＋　σｋ　（ｉ
）σｋ　（ｉ）　＝　σｋ　（ｉ−１）＋Δσｋ　（ｉ
）ただし、ｋは試行回数を表わし、σｋ　（ｉ）　は前
回の制御入力ｕｋ−１　（ｉ）　からの補正量であり、
Δσｋ　（ｉ）　はその増分値である。で与える学習制
御系において、Ｍステップ未来までの追従偏差ｅを予測
し、それらの予測値｛ｅｋ　＊　（ｉ＋１），ｅｋ　＊
　（ｉ＋２），…，　ｅｋ　＊　（ｉ＋Ｍ）　｝と制御
入力の増分値Δｕｋ−１　（ｉ）　の重み付き２乗和【
数７】ただし、　ｗｍ　は、ｍ　ステップ未来の追従偏差の予
測値ｅｋ　＊　（ｉ＋ｍ）　にかける重み係数であり、
ｃは制御入力の増分値Δｕｋ　（ｉ）　にかける重み係
数である。が最小となるように、増分補正量Δσｋ　（
ｉ）　を決定することを特徴とする学習制御方式。
【請求項８】ｋ回目の試行の、時刻ｉにおける増分補正
量Δσｋ　（ｉ）を、【数８】（ただし、ｑｍ　、Ｑ、ｇｎ　、Ｃは、制御対象のステ
ップ応答のサンプル値と、予測される未来の偏差および
制御入力の増分値に掛ける重みによって決定される定数
である）とすることを特徴とする請求項７記載の学習制
御方式。
【請求項９】試行を重ねる過程で、重み係数ｃ　の値を
変化させることを特徴とする請求項１、３、５、または
７記載の学習制御方式。