JPH0816208A - ニューラルネットワークを用いたコントローラの学習方法 - Google Patents

ニューラルネットワークを用いたコントローラの学習方法

Info

Publication number
JPH0816208A
JPH0816208A JP6148157A JP14815794A JPH0816208A JP H0816208 A JPH0816208 A JP H0816208A JP 6148157 A JP6148157 A JP 6148157A JP 14815794 A JP14815794 A JP 14815794A JP H0816208 A JPH0816208 A JP H0816208A
Authority
JP
Japan
Prior art keywords
output
neural network
plant
input
controller
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP6148157A
Other languages
English (en)
Inventor
Norifumi Yasue
律文 安江
Takayuki Yamada
孝行 山田
Tetsuo Yabuta
哲郎 藪田
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP6148157A priority Critical patent/JPH0816208A/ja
Publication of JPH0816208A publication Critical patent/JPH0816208A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)
  • Control Of Electric Motors In General (AREA)

Abstract

(57)【要約】 【目的】 プラントの特性が変化してもそのまま学習す
ることが可能なニューラルネットワークを用いたコント
ローラの学習方法を提供する。 【構成】 プラント10に対する目標軌道出力Ydをニ
ューラルネットワーク20に入力し、該ニューラルネッ
トワーク20の出力U(p) をプラント10に入力し、こ
の時のプラント10の出力Y(p) と目標軌道出力Ydと
の差分ε(p) を加算器30で求め、該差分ε(p) が最小
となるように重み調整部21で各ニューロン間の結合荷
重を計算し、これを前記目標軌道出力Ydが入力される
度に繰り返すことにより、プラント10の特性が変化し
ても制御を中止することなく、そのままオンラインで学
習することを可能とする。

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は、ロボット、産業用機械
等の各種のプラントを制御するニューラルネットワーク
を用いたコントローラの学習方法に関するものである。
【0002】
【従来の技術】従来のこの種のニューラルネットワーク
を用いたコントローラ及びその学習方法としては、安
江、山田、藪田 著「非最小表現を用いたニューラルネ
ットワーク逆方向同定器」(日本ロボット学会学術講演
会、1993、pp21〜22)に記載されたものがある。以下、
これについて説明する。
【0003】図2は前述した従来のコントローラを示す
もので、図中、1は制御対象となるプラント、2はコン
トローラ本体をなすニューラルネットワークである。ニ
ューラルネットワーク2の各ニューロン間の結合荷重
(重み)は後述する逆方向同定器による学習が十分進ん
だ後の値を備えており、プラント1に対する目標軌道出
力Ydが入力されると、学習を行うことなく直ちに制御
信号UN をプラント1に出力する。プラント1は制御信
号UN が入力されると、目標軌道出力Ydにほぼ等しい
出力信号Yを出力する。
【0004】図3は前述したコントローラの学習を行う
際の装置構成、即ち逆方向同定器を示すもので、図中、
1及び2は前述したプラント及びニューラルネットワー
ク、3は加算器、4はニューラルネットワーク2におけ
る各ニューロン間の結合荷重を調整する重み調整部であ
る。
【0005】信号Uが入力された時のプラント1の出力
信号Yを、ニューラルネットワーク2に目標軌道出力と
して入力し、この時のニューラルネットワーク2の出力
N(p) と信号Uとの差分ε(p) を加算器3で求め、該
差分ε(p) が最小となるように重み調整部4で各ニュー
ロン間の結合荷重を調整する如くなっている。
【0006】図4は従来の学習方法の流れを示すもの
で、前述した逆方向同定器によりニューラルネットワー
クにおける各ニューロン間の結合荷重の調整を行い、こ
の調整後のニューラルネットワークを用いることによ
り、前述したコントローラを実現する如くなっている。
【0007】
【発明が解決しようとする課題】しかしながら、前述し
た従来の学習方法では、逆方向同定器による学習が完了
するまでコントローラとして使用することができず、ま
た、制御対象となるプラントの特性が変化した場合には
プラントの制御を一旦、中止して、即ちオフラインとし
て、逆方向同定器による学習をやり直さなければならな
いという問題があった。
【0008】本発明は前記従来の問題点を解決し、プラ
ントの特性が変化しても制御を中止することなく、その
ままオンラインで学習することが可能なニューラルネッ
トワークを用いたコントローラの学習方法を提供するこ
とを目的とする。
【0009】
【課題を解決するための手段】前記目的を達成するた
め、本発明の請求項1では、一入力一出力離散時間制御
系のプラントを制御するニューラルネットワークを用い
たコントローラの学習方法において、プラントに対する
目標軌道出力が発生する度に該目標軌道出力をニューラ
ルネットワークに入力し、該ニューラルネットワークの
出力をプラントに入力し、この時のプラントの出力と目
標軌道出力との差分を求め、該差分を減少する方向に前
記ニューラルネットワークにおける各ニューロン間の結
合荷重を調整するニューラルネットワークを用いたコン
トローラの学習方法を提案する。
【0010】また、請求項2では、一入力一出力離散時
間制御系のプラントを制御するニューラルネットワーク
を用いたコントローラの学習方法において、予め定めた
サンプリング区間ρでのプラントに対する目標軌道出力
をニューラルネットワークに入力する第1の工程と、該
ニューラルネットワークの出力をプラントに入力する第
2の工程と、前記サンプリング区間ρでのプラントの出
力と前記サンプリング区間ρでの目標軌道出力との差分
を求める第3の工程と、該差分を最小とするように前記
ニューラルネットワークにおける各ニューロン間の結合
荷重を計算する第4の工程とを備え、前記第1の工程か
ら第4の工程までをサンプリング区間ρ毎に繰り返すニ
ューラルネットワークを用いたコントローラの学習方法
を提案する。
【0011】
【作用】本発明の請求項1によれば、プラントの特性が
変化し、プラントの出力と目標軌道出力との差分が大き
くなっても、プラントに対する制御を中止することな
く、該差分を減少する方向にニューラルネットワークに
おける各ニューロン間の結合荷重を調整する、即ち学習
を行うことができる。
【0012】また、請求項2によれば、プラントの特性
が変化し、サンプリング区間ρでのプラントの出力と前
記サンプリング区間ρでの目標軌道出力との差分が大き
くなっても、プラントに対する制御を中止することな
く、サンプリング区間ρ単位で該差分を最小とするよう
にニューラルネットワークにおける各ニューロン間の結
合荷重を計算する、即ち学習を行うことができる。
【0013】
【実施例】まず、本発明のコントローラの学習方法の原
理について説明する。
【0014】本発明が対象とするプラントの線形部の伝
達関数は、 A(z-1)Y(k) =z-d0 B(z-1)U(k) と表すことができる。
【0015】前記(1) 式より、出力Y(k) は、 と表される。以下、(1) ,(2) 式で表現されるプラント
に対し、解折的に説明を行う。
【0016】本発明が対象とするコントローラは、一入
力一出力の離散時間制御系であるので、ニューラルネッ
トワークへの入力I及び出力U(p) は、 IT =[Yd1 ,Yd2 ,Yd3 ,……Ydρ] ……(3) UT (p) =[U1 (p) ,U2 (p) ,U3 (p) ,……Uρ(p) ] ……(4) となる(但し、pは試行回数である。)。
【0017】ここで、G0 =1、d=1とすると、(2)
式は、 となる。
【0018】(5) 式は最小表現されているので、非最小
表現に展開し、マトリクスで表すと、 C・Y=D・U ……(6) となる。
【0019】プラントの上限次数n,mが未知であって
も、C-1の存在には影響を与えないので、(6) 式は、 Y=C-1・D・U ……(7) と表される。
【0020】前記(5) 〜(7) 式をふまえ、Aをプラント
の性質を表すマトリクス、U(p) をプラントの入力信号
の時系列ベクトル、pを試行回数として、プラント出力
信号の時系列ベクトルY(p) を表すと、 Y(p) =A・U(p) ……(8) となり、要素表現すると、 となる。
【0021】また、ω(p) をニューラルネットワークの
中間層から出力層への重みマトリクス、W(p) を入力層
から中間層への重みマトリクス、目標信号の時系列ベク
トルをYdとすると、ニューラルネットワークの出力、
つまりプラントへの入力の時系列ベクトルU(p) は、要
素表現すると、 g(x) =[Xg{1−exp(−4x/Xg)}] /[2{1+exp(−4x/Xg)}] ……(11) となる。但し、g(x) は入力層から中間層における出力
を決定するシグモイド関数、Xgはこのシグモイド関数
の形状を決定するパラメータである。
【0022】この時、Y=Ydとするには、下記(12)式
の評価関数J(p) を最小にするにように、下記(13),(1
4)式で表される各ニューロン間の結合荷重を各試行(サ
ンプリング)毎に調整すれば良い。 但し、ηは学習の速度を決定するパラメータ、g´はg
のxに関する微分である。
【0023】次に、本発明のニューラルネットワークを
用いたコントローラの学習方法の実施例について説明す
る。
【0024】図1は本発明方法にかかるコントローラの
一実施例を示すもので、図中、10は制御対象となるプ
ラント、20はコントローラ本体をなすニューラルネッ
トワーク、30は加算器である。また、21はニューラ
ルネットワーク20の重み調整部である。
【0025】プラント10に対する目標軌道出力Ydを
ニューラルネットワーク20に入力し、該ニューラルネ
ットワーク20の出力U(p) をプラント10に入力し、
この時のプラント10の出力Y(p) と目標軌道出力Yd
との差分ε(p) を加算器30で求め、該差分ε(p) が最
小となるように重み調整部21でニューロンの結合荷重
を調整する如くなっている。
【0026】図5は図1中のニューラルネットワーク2
0の詳細を示すもので、図中、21は重み調整部、22
は入力層、23は中間層、24は出力層、25は重み計
算部A、26は重み計算部Bである。
【0027】ニューラルネットワーク20の入力層31
に、前記(10)式における目標軌道出力ベクトルYdが入
力され、重み計算部A25において重みマトリクスW
(p) と積算される。この計算結果は中間層23に入力さ
れ、重み計算部B26において重みマトリクスω(p) と
積算され、出力層24によりニューラルネットワーク2
0の出力U(p) として出力される。また、重み調整部2
1は重みマトリクスW(p) ,ω(p) を(13),(14)式によ
り調整する。
【0028】図6は本発明のコントローラの学習方法の
流れを示すもので、目標軌道出力Ydが入力される度
に、プラント10の出力Y(p) と目標軌道出力Ydとの
差分ε(p) に基づいて、(12)〜(14)式に示す学習則によ
りニューラルネットワーク20における各ニューロン間
の結合荷重の調整を行う。
【0029】前記(12)〜(14)式に示す学習則の安定性
は、PDP(D.E.ラメルハート,J.L.マクレラ
ンド,PDPリサーチグループ 著「PDPモデル」産
業図書、1989)の意味で保証されている。
【0030】次に、前述した本発明の実施例において、
目標起動出力と実際のプラントの出力との関係をシミュ
レーションした結果を示す。
【0031】本シミュレーションで用いたプラント10
は、差分方程式表現で、 Y(k) =−a1 Y(k-1) −a2 Y(k-2) +U(k-1) +bU(k-2) −a3 Y(k-3) +Cnon 2 (k-1) ……(15) である。但し、a1 =−1.3、a2 =0.3、b=
0.7を用い、非線形項としてa3 =0.1、Cnon
0.2を用いた。また、入力及び出力として50サンプ
リングずつとり、重みマトリクスはそれぞれ50×50
の正方マトリクスとした。
【0032】図7〜図9は前述したシミュレーションの
結果を示すもので、図7は学習回数5回、図8は学習回
数20回、図9は学習回数1500回の場合をそれぞれ
示す。図から明らかなように、プラントの目標軌道出力
(実線)とプラント10の出力(点線)との差は学習が
進むにつれて小さくなっており、本発明のコントローラ
の学習方法が十分有効であることが分かる。
【0033】
【発明の効果】以上説明したように本発明の請求項1に
よれば、一入力一出力離散時間制御系のプラントを制御
するニューラルネットワークを用いたコントローラの学
習方法において、プラントに対する目標軌道出力が発生
する度に該目標軌道出力をニューラルネットワークに入
力し、該ニューラルネットワークの出力をプラントに入
力し、この時のプラントの出力と目標軌道出力との差分
を求め、該差分を減少する方向に前記ニューラルネット
ワークにおける各ニューロン間の結合荷重を調整するた
め、プラントの特性が変化しても該プラントに対する制
御を中止することなく、該差分を減少する方向にニュー
ラルネットワークにおける各ニューロン間の結合荷重を
調整することができ、オンラインで学習を行うことが可
能となる。
【0034】また、本発明の請求項2によれば、一入力
一出力離散時間制御系のプラントを制御するニューラル
ネットワークを用いたコントローラの学習方法におい
て、予め定めたサンプリング区間ρでのプラントに対す
る目標軌道出力をニューラルネットワークに入力する第
1の工程と、該ニューラルネットワークの出力をプラン
トに入力する第2の工程と、前記サンプリング区間ρで
のプラントの出力と前記サンプリング区間ρでの目標軌
道出力との差分を求める第3の工程と、該差分を最小と
するように前記ニューラルネットワークにおける各ニュ
ーロン間の結合荷重を計算する第4の工程とを備え、前
記第1の工程から第4の工程までをサンプリング区間ρ
毎に繰り返すため、プラントの特性が変化しても該プラ
ントに対する制御を中止することなく、サンプリング区
間ρ単位で該差分を最小とするようにニューラルネット
ワークにおける各ニューロン間の結合荷重を計算するこ
とができ、オンラインで学習を行うことが可能となる。
【図面の簡単な説明】
【図1】本発明方法にかかるニューラルネットワークを
用いたコントローラの一実施例を示す構成図
【図2】従来のニューラルネットワークを用いたコント
ローラの一例を示す構成図
【図3】図2のコントローラの学習を行う逆方向同定器
を示す構成図
【図4】従来のコントローラの学習方法を示す流れ図
【図5】図1中のニューラルネットワークの詳細を示す
構成図
【図6】本発明のニューラルネットワークを用いたコン
トローラの学習方法の一実施例を示す流れ図
【図7】本発明方法による目標起動出力と実際のプラン
トの出力との関係のシミュレーション結果を示すグラフ
【図8】本発明方法による目標起動出力と実際のプラン
トの出力との関係のシミュレーション結果を示すグラフ
【図9】本発明方法による目標起動出力と実際のプラン
トの出力との関係のシミュレーション結果を示すグラフ
【符号の説明】
10…プラント、20…ニューラルネットワーク、21
…重み調整部、22…入力層、23…中間層、24…出
力層、25…重み計算部A、26…重み計算部B、30
…加算器。

Claims (2)

    【特許請求の範囲】
  1. 【請求項1】 一入力一出力離散時間制御系のプラント
    を制御するニューラルネットワークを用いたコントロー
    ラの学習方法において、 プラントに対する目標軌道出力が発生する度に該目標軌
    道出力をニューラルネットワークに入力し、 該ニューラルネットワークの出力をプラントに入力し、 この時のプラントの出力と目標軌道出力との差分を求
    め、 該差分を減少する方向に前記ニューラルネットワークに
    おける各ニューロン間の結合荷重を調整することを特徴
    とするニューラルネットワークを用いたコントローラの
    学習方法。
  2. 【請求項2】 一入力一出力離散時間制御系のプラント
    を制御するニューラルネットワークを用いたコントロー
    ラの学習方法において、 予め定めたサンプリング区間ρでのプラントに対する目
    標軌道出力をニューラルネットワークに入力する第1の
    工程と、 該ニューラルネットワークの出力をプラントに入力する
    第2の工程と、 前記サンプリング区間ρでのプラントの出力と前記サン
    プリング区間ρでの目標軌道出力との差分を求める第3
    の工程と、 該差分を最小とするように前記ニューラルネットワーク
    における各ニューロン間の結合荷重を計算する第4の工
    程とを備え、 前記第1の工程から第4の工程までをサンプリング区間
    ρ毎に繰り返すことを特徴とするニューラルネットワー
    クを用いたコントローラの学習方法。
JP6148157A 1994-06-29 1994-06-29 ニューラルネットワークを用いたコントローラの学習方法 Pending JPH0816208A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP6148157A JPH0816208A (ja) 1994-06-29 1994-06-29 ニューラルネットワークを用いたコントローラの学習方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP6148157A JPH0816208A (ja) 1994-06-29 1994-06-29 ニューラルネットワークを用いたコントローラの学習方法

Publications (1)

Publication Number Publication Date
JPH0816208A true JPH0816208A (ja) 1996-01-19

Family

ID=15446537

Family Applications (1)

Application Number Title Priority Date Filing Date
JP6148157A Pending JPH0816208A (ja) 1994-06-29 1994-06-29 ニューラルネットワークを用いたコントローラの学習方法

Country Status (1)

Country Link
JP (1) JPH0816208A (ja)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022054724A1 (ja) * 2020-09-10 2022-03-17 キヤノン株式会社 制御装置およびその調整方法、リソグラフィー装置、ならびに、物品製造方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2022054724A1 (ja) * 2020-09-10 2022-03-17 キヤノン株式会社 制御装置およびその調整方法、リソグラフィー装置、ならびに、物品製造方法

Similar Documents

Publication Publication Date Title
Karakasoglu et al. Identification and decentralized adaptive control using dynamical neural networks with application to robotic manipulators
JP3802965B2 (ja) 非線形の物理的な制御対象の最適制御のための自己組織化方法及び装置
US5719480A (en) Parametric control device
US5285377A (en) Control apparatus structuring system
EP0540168B1 (en) Simulator using a neural network
CN107942679A (zh) 基于模糊免疫神经网络算法的全向底盘控制方法
Omatu et al. Stabilization of inverted pendulum by the genetic algorithm
Yeşildirek et al. A neural network controller for flexible-link robots
Mistry et al. Indirect control of a class of nonlinear dynamic systems
JPH0816208A (ja) ニューラルネットワークを用いたコントローラの学習方法
EP1338937A1 (en) Servo control method
Lin et al. Neurofuzzy-model-following control of MIMO nonlinear systems
Mezghani et al. Multimodel control of discrete systems with uncertainties
WO1991016674A1 (en) Discrete type repetition control method and apparatus therefor
Chang et al. A new neural network control architecture for a class of nonlinear dynamic systems
Ortatepe et al. Two dof robot control with fuzzy based neural networks
JP2929538B2 (ja) 非線形システム学習制御装置
JP3870767B2 (ja) 予測制御方法
Babuška et al. Laboratory evaluation of fuzzy controllers
JPH08147002A (ja) ニューラルネットワークを用いた非最小表現型コントローラ及びその学習方法
KR100970539B1 (ko) 최적 지령 작성 장치
JP2000020104A (ja) 速度制御ゲイン調整方法および装置
JPH0643944A (ja) 防振制御方法
Hamavand et al. Trajectory control of robotic manipulators by using a feedback-error-learning neural network
Colina-Morles et al. Inverse model neural network-based control of dynamic systems