JPH0377101A

JPH0377101A - ニューラルネットワークを用いた最適レギュレータ

Info

Publication number: JPH0377101A
Application number: JP21306389A
Authority: JP
Inventors: Tetsuo Yabuta; 藪田　哲郎; Takayuki Yamada; 孝行山田; Koichi Yoshida; 耕一吉田
Original assignee: Nippon Telegraph and Telephone Corp
Current assignee: Nippon Telegraph and Telephone Corp
Priority date: 1989-08-21
Filing date: 1989-08-21
Publication date: 1991-04-02

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔産業上の利用分野〕この発明は、ロボット、ａ業用機械、プラント等に用い
られている制御系一般に関連するもので、安定な制御形
であるニューラルネットワークを用いた最適レギュレー
タに関するものである。

（従来の技術）現代制御理論の大きな成果として最適レギュレータがあ
る。最適レギュレータは、評価基準としてプラント状態
量および制御入力に関する二次形式評価関数を用い、そ
れを最小にする制御（最適制御）として状態フィードバ
ック制御を求めるものである。最適レギュレータの工学
的意義は、状態フィードバックというその制御則の簡単
さにあるだけでなく、その安定性がシステムの特性変動
に対して損なわれ難いという「ロバスト性」を有してい
る点にある。

しかし、従来の制御理論から構成される最適レギュレー
タは、線形プラントのみを対象にしている。これを第９
図に示したブロック線図を用いて、以下に概要を述べる
。

第９図で、１は制御対象であるプラント、２はゲインマ
トリクスで、評価関数とリカッチの方程式により最適状
態フィードバックゲインＧが支配される。

時刻ｋにおけるプラント１の制御量、状態量、出力およ
びエラーをそれぞれＵ（ｋ）Ｘ　（ｋ）、Ｙ　（ｋ）、
ｅとすると、第１０図（ａ）、（ｂ）に示すように、一
連のプラント１の制御操作において、出力Ｙ　（ｋ）の
二乗誤差（ハツチング部分）および制御量を最小にする
ような制御量Ｕ　（ｋ）を作るコントローラを最適レギ
ュレータと呼ぶ。最適レギュレータ型コントローラは、
コンピュータ上でソフトウェアサーボとして実現するか
、もしくは処理速度の向上を図るならば、一部もしくは
全部をハード化した専用制御装置として実現できる。こ
の時、適用対象のプラント１は化学プラント、ロボット
さらには一般の制御系に適用できる。最適レギュレータ
型コントローラを実現する上で重要な要素は、コントロ
ーラを構成する最適状態フィードバックゲインＧであり
、この最適状態フィードバックゲインＧが得られれば、
プラント１の状態量Ｘ　（ｋ）または出力誤差ｅ　（ｋ
）を用いて、コントローラは上記出力偏差および制御量
を最小にする制御１Ｕ（ｋ）を作りだすことができる。

以下に最適状態フィードバックゲインＧを求める方法を
示す。線形プラントの状態方程式は次式で与えられる。

Ｘ　（ｋ＋１）＝ＡＸ　（ｋ）＋ＢＵ　（ｋ）Ｙ　　（
ｋ）　　＝ＣＸ　　（ｋ）　　　　　　　　　　”’−
（１）ただし、最適レギュレータは状態量をゼロに移行
させるように働くので、実際のプラント１では、目標値
Ｙｄと平衡状態の状態：ｆｆｃ　Ｘ　ａおよび制御ｍ　
Ｕ　ｄとし、次式に示す誤差を用いて誤差状態方程式で
ＭＷｉ　ｍするのが便利である。

ｘ　（ｋ）　＝Ｘ　（ｋ）　−Ｘｄｕ　（ｋ）　＝Ｕ　（ｋ）　−１Ｊｄｅ　（ｋ）＝Ｙ　（ｋ）　−Ｙｄ　　　　・・・−（２
）この時、誤差方程式は次式で与えられる。

ｘ　（ｋ＋１）＝Ａｘ　（ｋ）＋Ｂｕ　（ｋ）ｅ　（ｋ
）　＝Ｃｘ　（ｋ）　　　　　　　・・・・”　　（３
）ここで、Ａ、Ｂ、Ｃはプラント１の特徴を示すマトリ
ックス、ｘ、ｕ、ｅはベクトルである。

二次形式評価関数を次式で定義する。

Ｊ−Σ　　［ｅ”（ｋ＋１）Ｑｅ（ｋ＋１）＋ｕ”（ｋ
）Ｒｕ（ｋ）］・”・・・　　（４）ｋｇ＋ここで、Ｑ、Ｒは任意の正定価マトリックス、ｅＴ、ｕ
Ｔはベクトルｅ、ｕの転置ベクトルである。

最適レギュレータは、上記の二次形式評価関数を最小に
するような状態フィードバックゲインＧを求める問題で
ある。この時、制御量ｕ　（ｋ）は次式で与えられる。

ｕ　（ｋ）＝−Ｇｘ　（ｋ）＝−ＧＣ−’ｅ　（ｋ）・
・・・・・　（５）最適状態フィードバックゲインＧは下記のプロセスで求
められる。

Ｇ＝Ｄ−’Ｂ”　ＰＡ　　　　　　　　　・・・・・・
　（６）Ｄ＝Ｒ＋ＢＴＰＢ　　　　　　　　　・・・・
・・　（７）第　（６）式および第　（７）式に含まれ
るＰは、下記のリカッチの方程式の半正定唯−解Ｐで与
えられる。

Ｐ＝Ｑ＋ＡＴ　ＰＡ−ＡＴ　ＰＢＤ−’ＢＴ　ＰＡ・・
・・・・　（８）上記に示すように、最適状態フィードバックゲインＧは
第（８）式のマトリクス方程式の解を求める煩雑な作業
が必要である。このような煩雑な作業を行っても、適用
対象は第　（３）式に示すような線形システムのみであ
り、最適制御入力も簡単な線形型のみであった。

〔発明が解決しようとする課題〕

上記に示すように、従来の制御理論から生れた最適レギ
ュレータは、線形プラントのみを対象にしている。しか
し、一般のプラントは非線形要素を含む非線形プラント
であり、上記に示した現代制御理論の成果をそのまま適
用できない欠点があった。また、線形プラントに対して
も最適ゲインを定める時に非線形リカッチの方程式とい
う難解な方程式を解く作業が必要であった。

この発明の目的は、ニューラルネットワークの非線形写
像能力および学習能力を用い、現実の非線形プラントに
適用できる最適レギュレータを実現し、さらに、従来の
リカッチ方程式の解法をニューラルネットワークの学習
能力を用いることによって自動的に行うことができる最
適レギュレータを）是イ共することにある。

〔課題を解決するための手段）この発明にかかる請求項　（１）に記載のニューラルネ
ットワークを用いた最適レギュレータの発明は、コント
ローラとして、ニューラルネットワーク部と評価関数型
適応部とで構成したものである。

また、請求項　（２）に記載の発明は、評価関数型適応
部は、ニューラルネットワーク部の出力をゲインマトリ
クスの要素と対応させてニューラルネットワークの出力
を用いてゲインマトリクスを調整するものである。

ざらに、請求項　（３）に記載の発明は、記憶部を設け
、さらに評価関数型適応部に初期時刻から有限時刻まで
のプラントの出力偏差および定常状態からの制御量偏差
の二次形式を加え合わせたものを評価関数Ｊとして用い
、ニューラルネットワークの重みＷｌｊ要素で評価関数
Ｊを微分した値を計算し、次ステップのニューラルネッ
トワークの重み要素の変更量を微分した値の符号と変え
た量に比例するように変更する機能を具備させたもので
ある。

（作用）この発明にかかる請求項　（１）に記載の発明は、ニュ
ーラルネットワークをコントローラに用いたので、非線
形プラントにも適用できる。

また、請求項　（２）に記載の発明は、ゲインマトリク
スの調整をニューラルネットワーク部が行うので、初期
状態として制御系を安定にするゲインを見つけ易い。

さらに、請求項（３）に記載の発明は、数時刻前までの
状態量を用いて最適レギュレータが構成され、ニューラ
ルネットワーク内部で誤差が自動的に生成され、学習が
行われる。

〔実施例〕

第１図にこの発明によるニューラルネットワークを用い
た最適レギュレータの原理を示すブロック図を示す。こ
の図で、１はプラント、１０はコントローラで、ニュー
ラルネットワーク部３と適応部４とからなる。

この図に示すように、ニューラルネットワークを用いた
コントローラ１０は、可調節系を構成するニューラルネ
ットワーク部３とその可調節系を学習させる適応部４と
から構成される。ニューラルネットワーク部３の可調節
系は、非飽和関数のシグモイド関数を含んでいるので非
線形の写像能力を有しており、非線形プラントの影響を
コントローラ１０の内部で表現する能力を有している。

また、可調節系を学習させる適応部をプラント１の状態
量ｘ　（ｋ）と制御入力から構成される二次形式評価関
数を最小にするように設定すると、適応部４で作られる
教師信号は自動的に最適レギュレータの最適フィードバ
ックゲインに対応する重みマトリクスを、ニューラルネ
ット型コントローラ内部に生成し、非線形プラント用の
最適レギュレータを実現することができる。このニュー
ラルネットワーク型最適レギュレータは、コンピュータ
または専用の制御装置で構成され、ニューラルネットワ
ークはソフトウェアまたはハードウェアで構成される。

第２図にニューラルネットワークを用いた最適レギュレ
ータ型コントローラの第１の実施例のブロック図を示す
。このコントローラ１０は、通常、ディジタルコビュー
タを用いて実現される場合が多いので、ディジタルコン
トロールを例にとって説明を加える。

この実施例では、最も一般的な多入力多出力系のプラン
ト１を例にとって説明を加える。ただし、制御対象は面
観測、可制御とする。ここで、プラント１の出力誤差を
ｅ＝　（ｅ、、・・・・・・ｅｎ）、入力をｕ＝　（ｕ
ｌ　、・・・・・・、Ｕ、）とする。なお、５は記憶部
である。

第３図にコントローラ１０の内部に作られるニューラル
ネットワーク部３の入出力関係を示すが、ニューラルネ
ットワーク部３の重みをＷＩＩＪまたはｗ　０．、とす
ると、上添字Ｉおよび○はそれぞれ入力層と中間層およ
び中間層と出力層間の重みを示しており、下添字ｉｊは
ｉ番目のユニットから次層のｊ番目のユニット間の重み
を示している。ニューラルネットワーク部３は、第４図
に示す形の飽和関数のシグモイド関数を用いて非線形写
像能力を有しているので、下記に示す非線形フィードバ
ック型を構成できる。

ｕ　（ｋ）　＝Ｇ　（ｅ　（ｋ）　、　Ｗ）　　　　−
”　　（９）第　（９）式で示されるフィードバック型
の利点は、第　（２）式の線形型とは異なる下記に示す
一般的な非線形プラントの場合に効果を発揮する。

ｘ　（ｋ＋１）　＝ｆ　（ｘ　（ｋ）　、　　ｕ　（ｋ
）　）・・・・・・（ｌＯ）評価関数Ｊとして、下記の二次形式を用い、その値が最
小になるようにニューラルネットワーク部３の重みを修
正する。

Ｊ　（ｐ）　＝″Ｘ［ａ”（ｋ＋１）Ｑｅ（ｋ＋１）＋
ｕ”（ｋ）Ｒｕ（ｋ）］−（１２）１１１ここで、ｐは学習の回数を示しており、ｐ回目の学習後
のエラーと制御量を用いた評価関数Ｊとなっている。重
みの修正剤は、文献“ＰａｒａｌｌｅｌＤｉｓｔｒｉｂ
ｕｔｅｄ　Ｐｒｏｃｅｓｓｉｎｇ″著者ランメルハート
およびうクレ−ラントに示されているデルタルールを用
い、下記に示す修正剤で学習を行わせる。

Ｗｉｊ　（＋）”１）・Ｗム」（ｐ）＋αΔＷｉｊ（Ｐ
）　　　　・・・・・・（１３）ΔＬ」（ｐ）−ａＪ（
ｐ）／　７３Ｗｉｊ（ｐ）　　　　−・・−・−（１４
）ただし、αは修正剤のゲインである。

第（１４）式の形を変形し、ｅ　（ｋ）、　ｕ　（ｋ）
およびＷ（ｐ）の関数形で与える。

′；３Ｊ　（ｐ）　／　’ａ　Ｗｉｊ　（ｐ）−Σ　［
ｅＴ（ｋ＋１）Ｑ　（ａ　ｅ（ｋ＋１）／　’ａ　Ｗｉ
ｊ　（ｐ）　）　＋に！１ｕ”（ｋ）Ｒａ、（ｋ）／　９ｗ＋ｊ（ｐ）］−Σ　［
ｅＴ（ｋ＋１）Ｑａ　ｅ（ｋ＋１）／　３　ｕ（ｋ）　
・’ａ　ｕ（ｋ）ｋ＝１／　’ａ　Ｌｊ（ｐ）＋ｕ”（ｋ）Ｒ′ａｕ（ｋ）／　
ａ　Ｗｉｊ　（［））］Σ　（ｅＴ（ｋ＋１）Ｑ２３　
ｅ（ｋ＋１）／　’ａ　ｕ（ｋ）＋ｕ”（ｋ）Ｒ１ｋヨ
ｌ ’ａ　ｕ　（ｋ）　／　３　Ｗｉｊ　（ｐ）　　　　　
　　　　　・・・・・・（１５）ここで、３　ｅ　（ｋ
＋１）／　３　ｕ　（ｋ）は制御量が変化した時のエラ
ー変化量であり、プラント１のダイナミックスと密接に
関係する。プラント１のダイナミックスが次式で与えら
れるように既知の場合は容易に求めることができる。

ｅ　（ｋ＋１）＝ｇ　（ｅ　（ｋ）、　ｕ　（ｋ）　）
・・・・・・（１６）すなわち、次式で与えらえる。

ａｅ　（ｋ＋１）／ａｕ　（ｋ）＝３ｇ／Ｆｕ　（ｋ）
・・・・・・（１７）しかし、プラント１のダイナミックスが未知の場合は、
測定値を用いて近似値を求めることができる。すなわち
、第（１７）式のマトリックスの要素（ｉ、ｊ）は近似
的に次式で与えられる。

（３Ｊ（ｐ）／　ａＷ＋ｊ（１）））　＋」・（Ｌ＋　
（ｋ＋１）−ｅｉ（ｋ））／　（ｕ、＋　（ｋ）　−ｕ
Ｊ　（ｋ−１））　　　　　　　　・・・・”　（１８
）次に’ａ　ｕ　（ｋ）／　Ｗ＋」（ｐ）を求める。ま
ず、最初にニューラルネットワーク部３の人出力関係を
示す。

入力層（Ｉ）、中間層（ｈ）、出力層（０）の第ｊユニ
ットの入力１」と出力Ｏｊはそれぞれ次式で与えられる
。Ｏ’Ｊ＝　Ｉ　’Ｊ＝ｅＪ　　（ｉｃ）Ｉｈｊ＝Σｗ
’ｋｏ’に、　□ｈ、＝Ｓ（ＩｈＪ）１０ｊ＝ΣＷ０ｋ
」Ｏｈｋ、００ｊ＝Ｓ（Ｉｏｊ）ｕｊ　（ｋ）＝○０ｊ
　　　　　　　　　・・・・・・（１９）ただし、Ｓは
シグモイド関数等の飽和関数を示している。

第（１９）式の関係を用いて、ｕｊ（ｋ）　とｅｊ（ｋ
）の関係を示す。

ｕｊ（ｋ）−Ｓ　（ΣＷ０ｋＪＳ（ΣＷ’ｋＪ　ｅｋ（
ｋ））・・・・・・（２０）最初に、中間層から出力層のａｕ（ｋ）／ａＷ０ｋ」（
ｐ）を求める。第ｊ番目の出力に着目すると次の関係が
得られる。

９　ｕｐ（ｋ）　／　９Ｗ’ｉｕ　＝　Ｓ’（Ｉ　０Ｊ
）　Ｏｈｌ。

・・・・・・（２１）ただし、Ｓ′（ｘ）＝ｄＳ／ｄｘ次に、入力層と中間層の３ｕ　（ｋ）／′ａＷ’ｈｊ（
ｐ）を求める。第ｊ番目の出力に同様に着目すると次の
関係が得らえる。

ａｕｊ（ｋ）／ＦＷ’ｋｊ＝Ｓ”（Ｉ’Ｊ）Ｓ’（Ｉｈ
Ｊ）ｅｊ（ｋ）　　　　　　　　　　　　・・・・・・
（２２）以上に示すように、第（１５）弐〜第（２２）
式の計算結果を用いることにより、修正剤を下記の関数
として与えることができる。

ΔＷｉｊ　（１））　＝　　Σ　　ΔＷ　（ｅ　（ｋ＋
１）、ｅ　（ｋ）、ｕ　（ｋ＋ｉ）。

ｋ！＋ “（ｋ）、Ｗ・・（ｐ））　　　　　・・・・・・（２
３）第（１３）式および第（２３）式を用いることによ
り、評価関数Ｊを最小にするように、ニューラルネット
ワークを学習させることができる。

上記のアルゴリズムを用いたニューラルネットワークを
教示する方法を示す。まず最初に、平衡状態を求める。

目標値Ｙ、は与えられるので、制御′ＭｋＵｄを求める
方法を示す。プラント１のダイナミックスが既知の場合
は、第（１５）式より平衡状態の方程式は次式で与えら
れる。

ｇ　（Ｕｄ）　＝Ｏ・・・・・・（２４）第（２４）式
の方程式Ｕｄについて解くと、平衡状態の制御量Ｕｄが
求められる。また、プラント１のダイナミックスが未知
の場合は、適当な制御系を安定にできる初期値をニュー
ラルネットワークに与え、平衡状態になった時の制御量
をＵｄとすると、学習の各ステップでの出力誤差ｅ　（
ｋ）および制御量ｕ　（ｋ）が第　（２）式より求めら
れる。

上記アルゴリズムとブロック線図の関係を以下に述べる
。コントローラ１０の内部のニューラルネットワーク部
３として、第３図のニューラルネットワーク部３を用い
、一連の制御動作時の誤差ｅ　（ｋ）および制御量ｕ　
（ｋ）の記憶を記憶部５で行い、上記学習アルゴリズム
として第（１３）式と第（２３）式のマトリックス修正
則を評価関数型適応部４Ａとして用いることにより、最
適レギュレータが構成できる。

次に、ｐステップの学習プロセスを例にとり、この発明
の学習方法を説明する。（ｐ−１）ステップまでの学習
で得られたニューラルネットワークの重みを用いて、一
連の制御動作を行わせて誤差ｅ　（ｋ）および制御量ｕ
　（ｋ）を記憶部５にメモリする。評価関数型適応部４
Ａは第（１２）式の評価関数Ｊを最小にするように、上
記に示した重み修正アルゴリズムで新たなｐステップ目
の重み決定をする。この手順を繰り返すことにより、重
みＷ口（ｐ）が収束するまで学習を繰り返す。この重み
が収束した時に、ニューラルネットワーク部３は非線形
最適レギュレータを実現できる。

第５図および第６図は第２の実施例であり、フィードバ
ックの情報として第１の実施例とは異なり、数時刻前ま
での状態量を用いて最適レギュレータを構成した例であ
る。本実施例の特徴は、高次項の影響を含んだ次数が未
知のプラントに有効である。この時、最適レギュレータ
の形は第１の実施例の第　（９）式とは異なり、次式の
形で与えられる。

ｕ　（ｋ）　＝Ｇ　（ｅ　（ｋ）　、　　ｅ　（ｋ　−
１）　・・・ｕ　（ｋ　−１）　、　　ｕ　（ｋ−２）
　・・・、　　ｗ）・・・・・・（２４）第７図は第３の実施例であり、第２の実施例の変形であ
る。フィードバックの情報として誤差を与えるのではな
く、目標値Ｙｄ＋過去の出力Ｙ（ｋ）、Ｙ　（ｋ−１）
、・・・・・・、および制御量Ｕ（ｋ−１）、Ｕ　（ｋ
、−２）、・・・・・・を用いることにより最適レギュ
レータを構成しようとするものである。この実施例の特
徴は、ニューラルネットワークの内部で誤差を自動的に
生成しようとするものである。この時の最適レギュレー
タのかたちは次式となる。

ｕ　（ｋ）　＝Ｇ　（Ｙａ　、　Ｙ　（ｋ）、　Ｙ　（
ｋ　　１）・・・・・・、Ｕ　（ｋ−１）、Ｕ　（ｋ−
２）・・・・・・、Ｗ）・・・・・・（２５）第８図は第４の実施例であり、第１．第２．第３の実施
例とは異なり、リカッチの方程式の解法なニューラルネ
ットワークで行わせ、その結果を従来の最適レギュレー
タの制御系に用いようとするものである。すなわち、第
９図で説明した最適レギュレータを構成するゲインマト
リックスＧをニューラルネットワークで求めようとする
ものである。本実施例は構造的に線形フィードバックし
かできないという欠点を有するが、ニューラルネット型
コントローラとは異なり、初期状態として制御系を安定
にするゲインを見つけやすいという利点を有している。

なお、各請求項と各実施例ならびに図面との対応を示す
と、請求項　（１）は第１の実施例（第２図）に対応し
、請求項（２）は第４の実施例（第８図）に対応し、請
求項　（３）は第２．第３の実施例（第５図、第６図、
第７図）に対応している。

〔発明の効果〕

以上説明したように、この発明にかかる請求項（１）の
発明は、非線形プラントのコントローラとしての最適レ
ギュレータにおいて、入力として目標値、過去のプラン
トの出力、過去の制御入力および目標値からの誤差等を
用いるニューラルネットワーク部と、このニューラルネ
ットワーク部に学習を行わせるためのプラントの出力、
制御入力および目標値からの誤差等から構成される二次
形式評価関数を最小にするようにニューラルネットワー
クの重みを変更し、ニューラルネットワーク部の出力を
非線形プラントの入力として用いる評価関数型適応部と
を備えたので、従来線形プラントに限定されていた最適
レギュレータの適用範囲をこの発明を用いれば非常にフ
レキシブルな非線形最適レギュレータが構成できるので
、非線形プラントにも適用が拡張できる利点を有してい
る。

さらに、最適ゲインの調整方法もニューラルネットワー
クの学習によって自動的に行うことができるので、従来
の方法のリカツチの方程式を解くような煩雑な作業を回
避できる利点を有している。

また、請求項　（２）に記載の発明は、プラントの出力
、制御入力および目標値からの誤差等から構成される二
次形式評価関数を最小にするようにニューラルネットワ
ークの重みを変更し、ニューラルネットワーク部の出力
をゲインマトリックスの要素と対応させることによりニ
ューラルネットワークの出力を用いてゲインマトリック
スを調整し、その出力を非線形プラントの入力として用
いる評価関数型適応部を備えたので、初期状態として制
御系を安定にするゲインを見つけやすい利点を有する。

さらに、請求項（３）に記載の発明は、前回までの学習
結果によつえ得られたニューラルネットワークの重みを
用い、一連の制御動作を行わせて各サンプリン時刻での
目標値からのプラントの出力偏差および定常状態からの
制御量偏差を、ある有限時刻までについて記憶する記憶
部を設けるとともに、評価関数型適応部は、初期時刻か
ら有限時刻までの該プラントの出力偏差および定常状態
からの制御量偏差の二次形式を加え合わせたものを評価
関数Ｊとして用い、ニューラルネットワークの重みＷ１
ｊ要素で評価関数Ｊを微分した値を、該記憶情報および
ニューラルネットワークの特ｉ５［量を用いて計算し、
次ステップのニューラルネットワークの重み要素の変更
量を微分した値の符号を変えた量に比例するように変更
する機能を具備させたので、ニューラルネットワークの
内部で誤差が自動的に生成できるので、未知のプラント
に有効に適用できる利点を有する。

【図面の簡単な説明】

第１図はこの発明の原理を示すもので、−船釣なニュー
ラルネットワークを用いたコントローラのブロック線図
、第２図はニューラルネットワークを用いた最適レギュ
レータ型コントローラの第１の実施例を示す図、第３図
は、第２図のニューラルネットワークの人出力関係を示
す図、第４図はシグモイド関数の説明図、第５図は過去
の情報を用いたニューラルネットワークを用いた最適レ
ギュレータ型コントローラの第２の実施例を示す図、第
６図は、第５図のニューラルネットワーク部の人出力関
係を示す図、第７図はフィードバック情報として誤差の
代りにプラントの出力および制御入力を直接用いた第３
の実施例を示す図、第８図はニューラルネットワークを
最適ゲインの調整に用いた第４の実施例を示す図、第９
図は従来の最適レギュレータのブロック図、第１０図（
ａ、）、（ｂ）は最適レギュレータを用いた制御例を示
す図である。図中、１はプラント、２はゲインマトリックス、３はニ
ューラルネットワーク部、４は適応部、４Ａは評価関数
型適応部、５は記憶部、１０はコントローラである。第３図ニューラルネットワーク部第図シグモイド関数第図ニューラルネットワーク部

Claims

【特許請求の範囲】

（１）非線形プラントのコントローラとしての最適レギ
ュレータにおいて、入力として目標値，過去のプラント
の出力、過去の制御入力および目標値からの誤差等を用
いるニューラルネットワーク部と、このニューラルネッ
トワーク部に学習を行わせるためのプラントの出力，制
御入力および目標値からの誤差等から構成される二次形
式評価関数を最小にするようにニューラルネットワーク
の重みを変更し、前記ニューラルネットワーク部の出力
を非線形プラントの入力として用いる評価関数型適応部
とを備えたことを特徴とするニューラルネットワークを
用いた最適レギュレータ。
（２）非線形プラントのコントローラとしての最適レギ
ュレータにおいて、入力として目標値，過去のプラント
の出力，過去の制御入力および目標値からの誤差等を用
いるニューラルネットワーク部と、このニューラルネッ
トワーク部に学習を行わせるためのプラントの出力，制
御入力および目標値からの誤差等から構成される二次形
式評価関数を最小にするようにニューラルネットワーク
の重みを変更し、前記ニューラルネットワーク部の出力
をゲインマトリックスの要素と対応させることにより前
記ニューラルネットワークの出力を用いてゲインマトリ
ックスを調整し、その出力を前記非線形プラントの入力
として用いる評価関数型適応部とを備えたことを特徴と
するニューラルネットワークを用いた最適レギュレータ
。
（３）請求項（１）または（２）に記載のニューラルネ
ットワークを用いた最適レギュレータにおいて、前回ま
での学習結果によって得られたニューラルネットワーク
の重みを用い、一連の制御動作を行わせて各サンプリン
グ時刻での目標値からのプラントの出力偏差および定常
状態からの制御量偏差を、ある有限時刻までについて記
憶する記憶部を設けるとともに、評価関数型適応部に、
初期時刻から有限時刻までの該プラントの出力偏差およ
び定常状態からの制御量偏差の二次形式を加え合わせた
ものを評価関数Ｊとして用い、ニューラルネットワーク
の重みＷ＿ｉ＿ｊ要素で評価関数Ｊを微分した値を、該
記憶情報およびニューラルネットワークの特徴量を用い
て計算し、次ステップのニューラルネットワークの重み
要素の変更量を前記微分した値の符号を変えた量に比例
するように変更する機能を具備させたことを特徴とする
ニューラルネットワークを用いた最適レギュレータ。