JPH02201607A - ニューラルネットワークを用た適応制御システム - Google Patents

ニューラルネットワークを用た適応制御システム

Info

Publication number
JPH02201607A
JPH02201607A JP1021457A JP2145789A JPH02201607A JP H02201607 A JPH02201607 A JP H02201607A JP 1021457 A JP1021457 A JP 1021457A JP 2145789 A JP2145789 A JP 2145789A JP H02201607 A JPH02201607 A JP H02201607A
Authority
JP
Japan
Prior art keywords
output
control
input
neural network
signal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP1021457A
Other languages
English (en)
Inventor
Takeshi Aoki
武司 青木
Hiroyuki Izumi
泉 寛幸
Ryoichi Narita
成田 良一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujitsu Ltd
Original Assignee
Fujitsu Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fujitsu Ltd filed Critical Fujitsu Ltd
Priority to JP1021457A priority Critical patent/JPH02201607A/ja
Publication of JPH02201607A publication Critical patent/JPH02201607A/ja
Pending legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】 〔目次〕 概要 産業上の利用分野 従来の技術(第13図) 発明が解決しようとする課題 課題を解決するための手段(第1図) 作用 実施例 (a)  システムの説明(第2図〜第6図)(b) 
 ニューラルネットワークの説明(第7図〜第11図) (C)  具体例の説明(第12図) (d)  他の実施例の説明 発明の効果 〔概要〕 非線形系未知制御対象の構造を:j、−ラル1′。
トワークで同定し、その出力を規範モデルの出力に追従
させるためのニコ、−ラル不ノトワーク苓用いた適応制
御システ1、に関し、 非線形系の制御対象に対し゛と、非線形部の関数形が未
知である場合にも、同定、制御することを1」的とし、 制御対象に対して同定と制御を行い、制御対象の出力を
目標値に追従させる適応制御シスうづ、において、過去
の制御人力と制御出力を成分とする内部信号をニューラ
ル不ン1ワークで演算し、演算結果とIFI標埴とから
制御人力を発生ずる制御装置と、該内部信号をニブ、−
ラル不ノトヮークで演算し、演算結果と制御出力とから
同定値を発11;する同定装置と、該制御入力を教師信
号とし、該同定値との誤差から該二1−ラルネン1−ワ
ークの重みを演算する学習装置と、該制御入力と該制御
出力とを格納し、該内部信号を発41−するための人出
カメ−しり、I−仝(」−・jム、 [産業上の利用分野] 末完明巳よ、非線形系未知@I御対象の構造を二□ラル
不ノ)・ワークで同ホ12、その出力を規範モア゛ルの
出力に追征さ1±るためのニューラルネットワークを用
いた適応制御シス−i−J−、に関する。
制御対象のハラメータか未知である場合や、動作環境の
変化によりパラメータが変動するような場合には、制御
対象のバラタ タを同定しながら、制御を行う適応制御
方法が有用である。
このような適応制御力法3として 制御1対象の出力を
規範モデルの出力に追従させる形式のモデル規範形適応
制御が提案されている。
しかし、前述の提案は、制御対象が線形のものに限られ
、制御対象が非線形系の場合には、満足な適応制御方法
が確イfされていない。
実際の産業分野では、制御対象が非線形であることが少
な(なく、非線形系に対しトJ定と制御を行う適応制御
技術か・Rめられ了いろ。
〔従来の技術〕
第13図は従来技術の説明図である。
適応制御の有力な手段であるモデル規範形適応制御を、
非線形系の制御対象に拡張する方法として、第13図に
示すように、関数形が既知の非線形関数の未知の係数W
1〜wnをパラメータとして推定する方法が提案されて
いる。
例えば、1988年第8回適応制御シンポジウム資料第
55頁乃至第58頁の論文1ノルム制約形非線形系のモ
デル規範形適応制御1等に示されている。
即ら、制御対象1に対し制御装置2と同定装置3とを設
け、この制御装置2と同定装置3とに、既知の非線形関
数の系1−nを設&−1、制御人力Uと同定値u次との
同定誤差εにノ、(づいて制御装置2と同定装置3との
系の係数Wl−Wnを変化し、同定誤差εが零となるよ
うに、同定、制御するものである。
〔発明が解決しようとする課題〕
このような従来技術では、非線形部の関数形自体が既知
の場合には、良好に同定、制御が可能である。
しかしながら、非線形部の関数形自体が未知の場合番こ
tよ、同定や制御ができず、モデル規範形適応制御系を
実際の制御対象に適用するのが困難であるという問題を
生じていた。
従って、本発明は、非線形系の制御対象に対して、非線
形部の関数形が未知である場合にも、同定、制御ができ
るニューラルネッl−ワークを用いた適応制御システム
を提供することを目的とする。
[課題を解決するための手段〕 第1図は本発明の原理図である。
本発明は、第1図に示すように、制御対象1に対して同
定と制御を行い、制御対象1の出力を目標値に追従させ
る適応制御システl、において、過去の制御入力と制御
出力を成分とする内部信号をニューラルネットワーク2
aで演算し、演算結果と目標値とから制御人力を発生ず
る制御装置2と、該内部信号をニューラルネットワーク
3aで演算し、演算結果と制御出力とから同定値を発生
ずる同定装置3と、該制御入力を教師信号よし、該同定
値との誤差から該ニューラルネットワーク2a、3aの
重みを演算する学習装置4と、該制御入力と該制御出力
とを格納し、該内部信号を発生ずるための入出カメモリ
5とを有するものである。
〔作用〕
本発明では、ニューラルネットワークが、任意の連続関
数を近似実現しうろことから、制御装置2と同定装置3
にニューラルネットワーク2a、3aを設け、非線形関
数の同定に用いている。
そして、ニューラルネットワーク2a、3aを入出カメ
モリ5の内部信号で動作せしめ、学習装置4が誤差から
ニューラルネットワーク2a、3aの重みを演算、設定
することにより、非線形未知制御対象の同定、制御を可
能とするものである。
〔実施例〕
(a)  システムの説明 第2図は本発明の一実施例構成図である。
図中、第1図及び第13図で示したものと同一のちのは
、同一の記号で示してあり、2b、3bは乗算器であり
、2c、3Cは加算器であり、4aは差分器である。
先ず、次のように問題の設定を行う。
制御対象1を次式の多入力多出力離散時間非線形系と仮
定する。
y (t) −fo [y(t−1) 7. ++、 
y(t−n) 7;u(t−d−1) ”、 −、u(
t−d−m) ’]モgo [y(t−1)T+−+y
(t−n)”;u(t−d−1)T+  −、u(t−
d−−リu(t−d)力、出力であり、1次元縦ベクト
ルとする。
dは既知のむだ時間で定数とする。次数n、mは既知と
する。re(・)、go(・)は、それぞれ非線形関数
を要素とする!次元縦ベクトル、非線形関数を要素とす
る!×i次元行列で、各要素の関数形は未知とする。
(1)式の右辺からy(t−1)、・・・、y(t−d
)を1頌次消去すると、 y(t)=fa [x(t−d)”l +g、+ [x
(t−d)”] u(L−d)  (2)x(t)”=
 I−y(t−1)”、 −、y(t−n)”;u(t
−1)”s=、u(L−d−m)”l (3)となる。
制御対象の入出力を成分とするベクトルx (t)を内
部信号と呼ぶ。
ここで、d et(行列) (gd[x(t−d)コ〕
≠0と仮定すると、(2)式より、制御対象の連系表現
として、 u(t−d)=f [x(t−d)] 十g [x(t
−d)] y(t)    (4)g  [x(t−d
)1−g、[x(t−d)コ −′(5)f  [x(
L−d)]  −−gd [x(t−d)コ  ’ra
  [x(t−d) 」(6)を得る。
制御目的は、時刻tまでに得られた人出力信号から(5
)、(6)式の未知間#9.fc・)、g(・)を推定
し、制御対象の出力V(t)を模範モデルの出力y、%
(1)に追従させることとする。ただし、時刻りでd時
間先の目標(1!ym(y−+d)は利用可能とする。
次に、同定装置3について説明する。
制御対象の同定方法は次のように行う。
制御対象の連系表現(4)式を同定するために同定モデ
ルとして次式を考える。
u”(t−d)=f”  [x(t−d)コ +g’ 
 [x(t−d)]  y(t)   (7)ここで、
(7)式のu”(t−d)、f”i)、g”(・)は、
それぞれ(4)式のu(t−d)、f(・)、g(・)
の推定値である。
尚、同定誤差ε(t−d)、同定二乗誤差E(t−d)
を次式で定義する。
ε(t−d) −u(t−d)−u”(t−d)   
 (8)p(t−d)−EεCt−d) ) 2/ 2
    (9)第3図は第2図構成の4層ニューラルネ
ットワクの説明図、第4図はそのニューラルネットワク
を構成する基本ユニットの説明図である。
同定装置3は、非線形関数f(・)、g(・)を近似実
現するニューラルネットワーク3aを内部に持つ。
ニューラルネットワーク3aの基本ユニット30は、第
4図に示すよう番こ、入力をχ1、重みをKJ8、出力
をy、とすると、閾値θをもつsigmoid関数σ(
・)を使って次の演算を実行する。
neJ−Σ−jiXi十〇   (10)yJ・−σ(
neLJ)        (11)ただし、 σ(netj=1/(1−+−exp(neLJ)) 
  (12)ここで、閾値θの扱いを容易にするために
、6゜−〇、χ。−1とおき、 neJ−Σw;rx+       (13)y、−σ
(neJ)        (14)と計算し、閾値θ
を重みと同等に扱う。
r(・)、g(・)の関数形を近似実現するニューラル
ネットワーク3aは、第3図(A)、(B)に示すよう
に基本ユニット30を多段多層化して構成する。
関数f(・)については、第3図(A)に示すように、
人出力層の出力関数は線形関数、中間の2層の中間層(
隠れ層)の出力関数はどちらもsignoid関数であ
るような4層ニューラルネットワク3aFの構造を持つ
又、関数g(・)については、同様の4層二、ウラルネ
ッ1−ワークを多段重ねた構造3 a Gを持つ。
そして、第2図のように、(7)武に征い、ごれらのネ
・71−ワークの入力にx(t−d)、出力にf泉〔X
(t−d))又はg雀(x(t−d) )を対応させる
そして、第(7)式の実行のため、行列g (x)とベ
クトルV(t)の積を求める乗算器3bと、ベクトルf
(x)とg (x)・yの和を求める加算器3cを、第
2図のように設け、学習装置4から更新された重みを受
けとる。
次に、学習装置4は、ホストコンピュータで構成され、
差分器4aの同定誤差ε(t−d)から、(9)式の同
定二乗誤差を最小にするように、ニューラルネットワー
クの重みの調整を行う機能を持つ。
それは、E(L−d)のf” 1x(t−d)] 、g
” [x(Ld) 1に関する最急鋒下方法として を用いたバックプロパゲーション法による。
第5図は重み調整処理フロー図である。
先ず、f(・)の関数形を近似実現する4層のニューラ
ルネットワークにおいて、 xl、入力層のi番目の出力信号 1、+1)、h(21,,2層の中間層のj番1」の出
力信号f、:出力層の出力信号ベクトル1次のi番目の
要素ε、コ同定誤差εのi番目の要素 、+31..2番目の中間層から出力層への重み12ゝ
1.:1番目の中間層から2番目の中間層への重み、N
)に8層人力層から1番目の中間層への重みΔ、+31
...稈11.の史新縦 11,21Ji、11(21,の更新量Δ−C11,,
,01,の更新量 η:学習の定数 とする。
各層での入出力関係は(12)式のsi(Bmoid関
数σ(・)を用いて、 rJ−Σ−”Jt h”+   (17)hLZ) 、
 = σ(Σ、+z+、  h”’+  )  (18
)hflゝ −・−σ(Σ−tI)J、  x+)  
   (19)と書ける。
13)1の更新は次のように行う。
1ηji(t+1)・w ”’ ; r (t)+6w
”’7i(t)一ηεJh(21 、+21.の更新は次のように行う。
w ” i、(t+1)=w ” 1(t)+Δ、(2
1,、、(L)ただし、 −861w”□、(L) 、(+1J、の更新は次のように行う。
w”J8(t+1)=w”’j+(t)+ΔIf”’j
t(t)  (31)ただし、 ラルネット3aGの重みの更新は(22)、(23)式
及び(28)〜(30)式を除いて、r(・)の場合と
同一である。
g(・)における、(3)jiの更新においては、gj
lkを出力層の出力信号の行列g5の(Ck)要素とす
ると、(17)式は、 gjk=Σw ” 、Hh ” +   (3B)とな
る。
(22)式は、 であり、 以上がf(・)の関数形を近似実現する4層ニューラル
ネットワーク3aFの重みの更新方法である。
次にg(・)の関数形を近似実現する4Nニユー(但し
、ykは制御出力yOk番目の要素)であるから、 6w ”’、+(t) =778jy+i  h ”’
 +   (23′)となる。
(28)式は、 であり、(39)式より、 −Σ ε s  Vkk4 ” sj (t)    
     (30’  )となる。
ホストコンピュータ(学習装置)は、重みの更新を各時
刻tで行い、更新された重みを制御装置2と、同定装置
3のニューラルネットワーク2aF、2aG、3aF、
3aGに転送する。
次に制御装置2について説明する。
制御対象1の制御方法は次のように行う。
制御対象の送糸が(4)式で表されるから、同定装置3
がニューラルネットワーク3aF、3aGによって実現
した推定関数f”(・)、g&(・)を用いて制御入力
を次式で与える。
u(t)−f” [x(t)] +g攻[x(t)] 
yn+(t+d)  (40)この制御入力はx(t)
の内容から実現可能である。
従って、制御装M2は、第3図、第4図の同定装置3と
同一の内部構造を持ち、ホストコンピュタ4から更新さ
れた重みを受は取り、制御に必要な入出力を内部信号と
して記憶している入出カメモリ5から内部信号と目標値
を受は取り、(40)式を実行する。
第6図は、人出カメモリの動作説明図である。
(7)式、(40)式を比較すると、未知関数f(・)
、g(・)の同定はd時間遅れで行われ、内部信号Xの
関数であるから、同定と制御に必要な入出力を内部信号
x(t)、x(t−d)として記憶しておく、第6図の
入出カメモリ5が必要となる。
(3)式から、入出カメモリ5は、x(t)の記憶領域
5aに過去の制御出力y(L−1) 〜y(t−n)、
過去の制御人力u(t−1)〜u(t−d−m)を格納
し、x (t)として出力する。
又、x(t−d)の記憶領域5bに、同様に(3)式か
ら、x (t−d)として、過去の制御出力y(t−d
−4) 〜y(t−d−n)、制御人力u(t−d−1
)〜u(t−2d−+*)を格納し、u(t−d)の記
憶領域5Cにu (t−d)を格納する。
従って、適応制御システムは、第2図に示すよB うに、内部信号の発生のための人出カメモリ5と、(4
0)式により制御人力u(t)を発生ずる制御装置2と
、(7)式により同定人力u”(t−d)を発生ずる同
定装置3と、u (t−d)を教師信号として4層ニュ
ーラルネットワークの重みの更新を行う学習装置(ホス
1−コンピュータ)4とで構成されている。
そして、制御装置2と同定装置:3にニューラルネット
ワーク2aF、2aG、3 a F、3aGが設けられ
ている。
第3図及び第4図のような、siBmoid関数を出力
関数とする4層ニューラルネットワークは、任意の連続
関数を近僚実現しうる(例えば、1988年電子情報通
信学会技術研究報告M B E 889論文[ニューラ
ル・ネットワークによる連続写像の返信的実現について
」参照の事)。
本発明では、この4層ニューラルネットワークを、多入
力多出力の非線形関数の同定に用いている。
この時(4)式から(40)式を引くと、f  [x(
t)]  −f”  [x(t)]  罎PX [x(
t) ]  y(t+d)g” [x(t) ’、l 
ym(L+d)−〇  (41)r [x(t)] −
f” [x(t)−,14g [x(t)]  [y(
t+d)−ym(t+d))+(g [x(t)] −
g” [x(t)] )ym(t+d)=O(42)で
ある。
ニューラルネットワークが非線形関数を近僚実現し、f
 [x(t) ] →f” [x(t) ] 、g [
x(t) ]  →g”[x(t)] (t−+oO)
となれば、det[g(・)IJ−0の仮定より、 y(t+d)→ym(t+d) (t→ω)   (4
3)となり、制御目的が達成される。
従って、任意の未知の非線形関数を含む、多入力多出力
の制御対象1に対して、制御対象1を同定し、制御する
ことを可能とする。
(b)  ニューラルネットワークの説明第7図はニュ
ーラルネットワークの構成図であり、第2図、第3図の
4層のニューラルネットワークの構成を示している。
この実施例では、ニューラルネットワークの階層構造間
のインターフェイスをアナログで実現するものであり、
基本ユニット30の出力はアナログ信号で構成される。
図中、31は各基本ユニット30毎に設けられる重み出
力回路であり、基本ユニット30の重み保持部(後述)
のための重みを出力するもの、32は重み信号線であり
、重み出力回路31の出力を重み保持回路に接続するも
の、33ば入力バタンの次元数に合わせて設けられる初
期信号出力回路であり、階層ネットワークの人力層に対
して入カバターンとなる初期信号を出力するものである
34は同期制御信号線であり、データ転送の制御を実行
する後述する主制御回路からの同″XJ1制御信号、重
みを、重み出力回路31、初期信号出力回路33及び基
本ユニット30の制御回路(後述)に伝えるための信号
線である。なお、この同期制御信号線34ば、図中では
共通線で示しであるが、詳細には、各回路に対し主制御
回路と個別の信号線で接続されている。
35はアナログハスであり、入力信号を入力層(の基本
ユニット30)へ伝え、入力層と中間層、中間層と中間
層、中間層と出力層とを接続するためのものであり、3
6は主制御回路であり、ホストコンピュータ4からの指
示により、同期制御信号及び重みを出力するものである
従って、4層ニューラルネッ1〜ワークは、入力層から
出力層の各層に、人力信号分の基本ユニット30と重み
出力回路31を有し、各層がアナログバス35によって
接続され、主制御回路36の制御で重みがセットされ且
つ同期制御される。
第8図は基本ユニットの構成図である。
図中の乗算処理部302は、乗算型D/Aコンバータ3
02aで構成され、前段層の基本ユニット30から、あ
るいは初期信号出力回路33からのアナログ信号(入カ
スインチ部307を介して入力される)の入力と、その
入力に対して乗算されるべきディジタル信号の重み情報
(重み保持部308を介して入力される)との乗算を行
って、得られた乗算結果をアナログ信号で出力するよう
処理するものである。
累算処理部303は、積分器で構成されるアナログ加算
器303aとアナログ加算器303aの加算結果を保持
するサンプルホールド回路303bとにより構成され、
アナi−Iグ加算器30.3 aは乗算型D/Aコンバ
ータ302 aの出力と、前回に求められてサンプルホ
ールド回路303 h6ご保持されている加算値とを加
算して新たな加痺、値を求めるもの、サンプルホールド
回路303bは、アナログ加算器303aが求めた加算
値をホールドするとともに、そのホールド値を前回の加
算値としてアナログ加算器303aにフィードバンクす
るものであり、これらの加算処理は制御回路309より
出力される加算制御信号に同期して実行される。
闇値処理部304は、アナログの関数発生回路である非
線型関数発生回路304aで構成され、入力に対してシ
グモイド(signoid)関数等の非線形信号を出力
するものであり、人力スイッチ部307を介して人力さ
れるアナログ信号に対する乗算型■〕/Δコンバータ3
02 aによる乗算及びこれらの乗算結果に累算が終了
したときに、サンプルホールド回路303bにホールト
されている加算値Xに対して演算処理を施してアナログ
出力値Yを得るもの、出力保持部305は、サンプルホ
ールド回路で構成され、後段層の基本ユニット30への
出力となる非線型関数発生回路304aのアナログ信号
の出力値Yをホールドするものである。
また、306は出力スイッチ部であり、制御回路309
よりの出力制御信号を受けて一定時間ONすることで、
出力保持部305が保持するところの最終出力をアナロ
グバス35上に出力するよう処理するもの、307は入
力スイッチ部であり、制御回路309よりの人力制御信
号を受けて前段層の基本ユニット30から最終出力、あ
るいは初期信号出力回路33からのアナログ出力が送ら
れてくるときにONすることで入力の受付を行い、この
アナログ値を乗算型D/Aコンバータ302aに与える
ものである。
308は重み保持部であり、パラレルアウトシフl−レ
ジスタ等により構成され、主制御回路36から送られて
くる重み信号がトライステートツマ・ンファ308aの
ゲートがオーブン(制御回路309による重み入力制御
信号がオン)された時に、この重み信号を乗算処理部3
02が必要とする重みとして保持するもの、309は制
御回路で、これらの基本ユニッ1−30の処理機能の制
御を実行する。
乗算処理部302、累算処理部303及び闇値処理部3
04が実行する演算処理は、上述したように、基本ユニ
ット30に接続される複数の人力をYi、この各接続に
対して設定される重みをWlとするならば、乗算処理部
302は、Y i −W i を算出し、累算処理部303は、 X−ΣY】・Wl を算出し、闇値処理部304は、最終出力をYとするな
らば、 Y=1/(1→−cxp(−X(−θ))を算出するこ
とになる。
第9図は第7図構成の主制御回路36の構成図である。
図中の主制御回路36は、外部バスインターフェイス回
路36a、マイクロコードメモリ36b、プログラムシ
ーケンサ36c、制御パターンメモリ36d、重みデー
タ36eを含んで構成される。
外部バスインターフェイス回路36aは、メインバスを
介してホストコンピュータ4と接続されており、ホスト
コンピュータ4からの動作指示を受は取るもの、マイク
ロコードメモリ36bは、プログラムシーケンサ36c
の動作を規定するマイクロコードを格納するもの、プロ
グラムシーケンサ36cは、マイクロコードメモリ36
b内のマイクロコードに応じて制御パターンメモリ36
d及び重みデータ36eをコントロールするものである
制御パターンメモリ36dは、その出力信号線が初期信
号出力回路33、入力層、中間層、出力層における基本
ユニット30のそれぞれに個別に接続されており、プロ
グラムシーケンサ36cからの指示に応じて、各組毎、
すなわち、初期信号出力回路33の組、人力層の組、一
対の中間層の組、出力層の組毎に、各組の内の1つの回
路、あるいは基本ユニット1を時分割に選択するように
出力信号線のオン、オフを設定するだめのもの、重みデ
ータメモリ36eは、プログラムシーケンサ36cの指
示に応じて、時分割人力信号に同期して各基本ユニット
30に重みが与えられるように、各重み出力回路31に
重み(ディジタルブタ)を出力するものである。
第10図はニューラルネットワークの信号処理説明図で
ある。
ホストコンピュータ36からメインバスを介して出カバ
ターンへの変換要求が与えられると、主制御回路36は
、初期信号出力回路33に対して出力制御信号を時系列
的にサイクリックに送出することで、複数の初期信号出
力回路33を順次、時系列的にサイクリックに選択して
いくよう処理する。
すなわち、主制御回路36は、プログラムシーケンサ3
6cの指示に応じて、制御パターンメモリ36dから、
まず、入力層の基本ユニット30に対し−7−同町1制
j卸信シ)を同時に与えるとともに、初期信号出力回路
33を順々に選択するべく、同期制御信号線34を@h
に各初期信号出力回路33毎にオンさせる。
つまり、まず、一番」−の初期信号出力回路33に与え
られる人メツパターンY1をアナログバス35に出力す
べく、9本の同期制御信号線34のうち、初期信号出力
回路33のゲートをオーブンする同期制御信号線34 
(図中では、34 a−1で表している)のみをオンし
、他の同期制御信号線34aはオ゛ノにする。
続いて、次の初期信号出力回路33に与えられる入カバ
ターンY7をアナログバス35に出力すべく、初期信号
出力回路33のゲートをオーブンする同期制御信号線3
4 (図中では、34a−2で表している)のみをオン
し、他の同期制御信号線34はオフにする。
以下同様にして、最後の初期信号出力回路33の入カバ
ターンYnをアナログバス35に出力するまで、同期制
御信号線34aのオン、オフ動作を行う。
また、これと同時に、入力層の各基本ユニット30の各
重み出力回路31に対して重みを与えるべく、各同期制
御信号線34aのオン動作に同期して、同期制御信号線
34bを介して各重み出力回!31毎に重みデータメモ
リ36eの出力を同時にセットする。
第10図(A)では、この同期制御信号線34aの同期
制御信号をYi出力制御信号(i−1〜n)で表して、
初期信号出力回路33を時系列的にサイクリックに選択
していく過程を図示している。ここで、nは初期信号出
力回路33の個数である。
このようにして選択される初期信号出力回路33は、人
力層との間に設けられるアナログハス35(図中では、
入力層アナログバス35aという)上に、入カバターン
として法えられたアナログ信号Yiを送出するよう処理
する。
従って、第10図(A)に示すように、入力層7−+−
ログバス35a」−には、アナログ信号Yiが、初期信
号出力回路33の個数分順序よく送出されるとともに、
最初の入カバターンのYj、続いて次の入カバターンの
Yi、そして次の入力バタンのYiというように、次々
と繰り返し送出されていくことになる。
人力層の各基本ユニット30の乗算処理部302は、こ
の送出されてくるアナログ信号Yiを受は取ると、主制
御回路36からセラ1−されることになる重み保持部3
08の重みWiを使い、上述した演算処理の(Yi−W
i)を実行することになる。
従って、主制御回路36は、第10図(B)に示すよう
に、初期信号出力回路33の選択処理と同期させて、重
み出力回路31を介して、その選択された初期信号出力
回路33に応じた重みWiを、入力層の各基本ユニット
30の重み保持部308にセットしていくことになる。
この基本ユニット30への重みの設定処理は、アナログ
信号かディジタル信号のいずれのモードに従って実現す
ることも可能である。
2つ なお、重みは、接続毎に指定されるものであることから
、上述したように、正確にはWij(jは人力層の基本
ユニット番号)と表すべきであるか、説明を簡単にする
ためにWiとしである。
ここで、第15図の基本ユニットの信号処理タイミング
チャートに従って、法本ユニッI−3(+の動作につい
て説明する。
なお、ここでは、入力層におりる基本ユニント30につ
いて説明するものとする。
まず、制御回路309は、主制御回路36の制御パター
ンメモリ36dから同期制御信号wA34aを介して与
えられる同期制御信号を受は取ると、人力制御信号(c
)をオンにし、人力スイッチ部307を導通させると同
時に、1−ライステートバッファ308aのゲートをオ
ーブンする重み人力制御信号(d)、出力スイッチ部3
06を導通させる出力制御信号(hl)をオンにする。
このとき、主制御回路36は、クロック(a)と同期し
て前述した同期制御信号線34aを順次オンにするので
、このクロック(a)に同ルIして初期信号出力回路3
3a、33b、−33nに保持されている入カバターン
信号Y8が、アナログバス35、入力スイッチ部307
を介して乗算型D/Aコンバータ302aに与えられる
一方、主制御回路36は、同様に、重みデータメモリ3
6eの重みを同期制御信号線34bを介して重み出力回
路31に与えているので、この重み(ディジタルデータ
)Wiがトライステートバッファ308aを通して重み
保持部308に格納される。
また、このとき、出力制御信号(hl)がクロック(a
)の111期分だけオンになるので、基本ユニット30
の出力保持部305のサンプルホールド回路のアナログ
ゲートがこの間オープン状態となり、保持されていたア
ナログ値が出力スイッチ部306を介して中間層アナロ
グバス35上に出力される。
さて、重み保持部308にディジタル値の重みWlが格
納されると、乗算制御信号(e)がオンとなるので、乗
算型D/Aコンバータ302aは、入力スイッチ部30
7を介し7て与えられるアナログ信号Y1と重みWlと
の乗算を行い、乗算結果をアナログ信号として出力する
続いて、加算制御信号CA)がオンになるので、積分器
で構成されるアナログ加算器303aが動作し、サンプ
ルホールド回!303 bに以前保持されていたアナロ
グ値(最初はクリアされており、ゼロである)と乗算型
D/Aコンバータ302aの乗算結果との加算が行われ
、加算結果がサンプルホールド回路303bに再格納さ
れる。
以上の動作により、1バスサイクルが終了し、次のクロ
ック(a)に同期して、入力スイッチ部307からは初
期信号出力回路33bの入力バタンY2が与えられ、重
み出力回路]1からはこの入カバターンY2に対応する
重みW2が与えられるので、入カバターンY2と重みW
2との乗算が行われ、そして、この乗算結果とサンプル
ホールド回路303bのホールド値との加算が行われる
この時に、次の基本ユニット30の出力制御信号(h2
)がオンとなる。そして、これ以降、初期信号出力回路
33nの入カバターンY7に対する処理が終了するまで
この動作を繰り返す。
そして、入カバターンY、lとWnとの乗算が終了する
と、変換制御信号(g)がオンになるので、この乗算結
果を累算した値が、闇値処理部304の非線型関数発生
回路304aに入力され、対応するY値が出力保持部3
05に保持される。すなわち、闇値処理部304は、上
述した Y−1/ (1+exp (−X十〇))という演算処
理を行い、これにより、基本ユニット30の最終的な演
算出力である最終出力値Yが求められ、出力保持部30
5に保持される。この値Yが求まると、累算処理部30
3の累算値(サンプルホールド回路303bの保持内容
)は、次の初期信号出力回路33の選択サイクルと同期
して、入力される同期制御信号によりクリアされる。
以上に説明したような動作を行うことにより、各基本ユ
ニット30は、入カバターンY、と重みW8から最終出
力値Yを得る。
これ以降、第7図に示される実施例の構成乙、ニル、′
って説明する。
第11図を用いて詳述したよ・うに、全−Cの初jtJ
l信号出力回路33にセットされた人カバター二′に対
する処理が終了すると、再度1制御回路36から各基本
ユニット30(識別子としてdないし、nが付くことが
ある)に対して同期制御信号が与えられるので、初期信
号出力回路33に新たにIJ未られる入カバターンY、
とホスI・コンビ、1〜 タ4から、メインバス、外部
ハスインターファーイス回路36aを介して与えられる
新たな重力W、に従って同様の動作を実行する。
一方、このようにして求められる入力層の基本ユニット
30の最終出力値Yは、出力保持部3)05に保持され
て、初期信号出力回路33に対してなされた処理と全く
同じ処理により、アナログバス35を介して、次段に位
置する中間層の基本ユニット30にと、時分割の送信形
式に従−27で送出されていくことになる。
すなわち、主制御回路36は、人力層の各基本コ〜S・
1;よ0 、、、−、 :七□11の制御回路309に
対してトわt11制御制御線′(・ltlを介し、C出
力制御信号りよ〜h、(第11図)5−時j倣目的にサ
イクリックU送出することで、名基本ユニント30a〜
30nの出カス1′ノ千部(jを順次2時系列的にサイ
クリックにONする。これにより、各基本ユニット3 
(l a −3Onの出力保持部305に保持されてい
る最終出力値の−1゛リロク信号が、中間層の各基本コ
ニ7 ト30 a  30 nの乗算処理部302に時
分割の送信形式で送t・ねる、−とになる。
中間層の各基本ユユノ’r ’、; Oa〜30nは、
前i4i Lだと同様の処理動作炎実行j7、この処理
により求められる中間層の基本コ、″′・・・1・30
の最終出力値Yを使い、中間層の基本コニント30に対
して同様の時分割の送信処理を実行することで、出力層
の基本ユニット30の帰路出力値Yが求められることb
こなる。
すなわち、主制御回路36は一対の中間層、出力層の各
基本ユJ〕1〜:((1b、:個別に接続された同期制
御信号線34,3.34 bを介し、て、同様に各;(
6 基本ユニット30a〜30nの制御を行う。
第10図(A)に、初期信号出力回路33へのY、出力
制御信号と対応させて、入力層の基本ユニット30への
出力制御信号のタイミングチャートを示すとともに、中
間層との間に設&Jられるアナログハス35(図中では
、中間層アナログハスという)」二に送出される人力層
の基本ユニット30の最終出力値Yのタイミングチャー
トを示すごとにする。
(C)  具体例の説明 第12図は本発明の詳細な説明図であり、第12図(A
)は倒立振子の制御の例を、第12図(B)はリンク機
構の制御の例を示す。
第12図(A)は、滑らかに動く質量Mの台車上に取り
付けられた、長さ2!、質ψmの倒立振子を示している
。台車に力Uを加えて倒立振子が鉛直方向となす角θを
自由に制御することを考える。ただし、M、m、Eは未
知とする。
倒立振子の運動方程式は次式のようになる。
y(L)・ θ(1)  とおき、 dθ;dt −l:y(t+h)  y<む)1 /h
d20 /d f、”=  [y(t+2h)−2y(
L+h)+y(L)l  /h2と差分近似1−2て、
k+n−tLnhとおくと、y(k+2)=2y(lu
 I)−y(k)11(’ となるから、非線形関数f。(・)、Bo(・)を用い
ζ次式のようにかげる。
y(k)−fn [y(k−])、y(k−2)] +
go Iy(k−2)、] u(k−2) (48)こ
れは本発明の仮定した離散時間非線形系(1)式の形を
しているので、本発明の方法を適用して、制御対象を同
定し、制御することができる。y(k)の目標値V、、
(k)を0にとれば、倒立振子のバランスをとることが
でき、ye(k)を周期的な信号にとれば、倒立振子を
周期的に振動させることができる。
」二連の実施例では、1人力1出力であったが、多入力
多出力であってもよい。
第12図(B)は2本のリンクを持つリンク機構を示し
ている。
各リンクiは質量m1、長さβ、の均質な棒とする。リ
ンク間に発生ずる制御トルクu1とする。θ、は第i−
1番目のリンクから第1番目のリンクの角度を時計まわ
りに測った相対角とする。
2リンク系の運動方程式は次式のようになる。
3(m+42mz)gffi + sinθ++3mz
g!2sin(θ1θ2)+6u+         
        (49)3mzgf25in(θ1+
θ2) +6oz                    (
50)ただし、 L=2  [l111111”+razlz”+3Ta
z1M++lz  CO2O3)  ]   (51)
Mz=2mz l 2”   (52)y(t)−[θ
+(1)、  θz(t)] ”、u(t)= [u+
(t)、uz(t)] Tとおき、前述と同様な差分近
位を行うと、非線形関数ベクトルf0(・)、非線形関
数行列go(・)を用いて、次式のように書ける。
y(k)=fo [y(k−1)”、y(k−2)”]
 +g6 [y(k−2)’] u(k−2) (53
)これも本発明の仮定した離散時間非線形系(1)式の
形をしているので、本発明の方法を適用できる。
ここでは2リンク系に対する本発明の実施例を示したが
、一般のnリンク系に対しても同様に本発明が適用でき
る。
(d)  他の実施例の説明 上述の実施例では、ニューラルネットワークをハードウ
ウアで構成した例で説明したが、プロセンサのソフトウ
ェアによっても実現できる。
又、ニューラルネットワークも4層のもので説明したが
、4層以」二のものであってもよい。
以」二本発明を実施例により説明したが、本発明は本発
明に主旨に従い種々の変形が可能であり、本発明からこ
れらを排除するものではない。
〔発明の効果〕
以上説明した様に、本発明によれば、任意の連続関数を
近似実現しうるニューラルネットワークを用いて制御装
置と同定装置を構成しているので、非線形部が未知であ
る制御対象の適応制御が可能となるという効果を奏し、
種々の制御対象に対して、汎用性のある適用制御システ
ムを構築するのに寄与するところが大きい。
【図面の簡単な説明】
第1図は本発明の原理図、 第2図は本発明の一実施例構成図、 第3図は第2図の4層ニューラルネットワークの説明図
、 第4図は第3図の基本ユニットの説明図、第5図は第2
図の重み調整処理フロー図、第6図は第2図の入出カメ
モリの動作説明図、第7図は第3図のニューラルネット
ワークの構成図、 第8図は第7図の基本ユニットの構成図、第9図は第7
図の主制御回路の構成図、第1O図は第7図のニューラ
ルネットワークの信号処理説明図、 第11図は第8図の基本ユニットの信号処理タイミング
チャート、 第12図は本発明の詳細な説明図、 第13図は従来技術の説明図である。 図中、l−制御対象、 2−制御装置、 3−同定装置、 2a、3a−ニューラルネットワーク、4−学習装置、 入出カメモリ。

Claims (1)

  1. 【特許請求の範囲】 制御対象(1)に対して同定と制御を行い、制御対象(
    1)の出力を目標値に追従させる適応制御システムにお
    いて、 過去の制御入力と制御出力を成分とする内部信号をニュ
    ーラルネットワーク(2a)で演算し、演算結果と目標
    値とから制御入力を発生する制御装置(2)と、 該内部信号をニューラルネットワーク(3a)で演算し
    、演算結果と制御出力とから同定値を発生する同定装置
    (3)と、 該制御入力を教師信号とし、該同定値との誤差から該ニ
    ューラルネットワーク(2a、3a)の重みを演算する
    学習装置(4)と、 該制御入力と該制御出力とを格納し、該内部信号を発生
    するための入出力メモリ(5)とを有することを 特徴とするニューラルネットワークを用いた適応制御シ
    ステム。
JP1021457A 1989-01-31 1989-01-31 ニューラルネットワークを用た適応制御システム Pending JPH02201607A (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP1021457A JPH02201607A (ja) 1989-01-31 1989-01-31 ニューラルネットワークを用た適応制御システム

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP1021457A JPH02201607A (ja) 1989-01-31 1989-01-31 ニューラルネットワークを用た適応制御システム

Publications (1)

Publication Number Publication Date
JPH02201607A true JPH02201607A (ja) 1990-08-09

Family

ID=12055505

Family Applications (1)

Application Number Title Priority Date Filing Date
JP1021457A Pending JPH02201607A (ja) 1989-01-31 1989-01-31 ニューラルネットワークを用た適応制御システム

Country Status (1)

Country Link
JP (1) JPH02201607A (ja)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03255504A (ja) * 1990-03-06 1991-11-14 Nippon Telegr & Teleph Corp <Ntt> ニューラルネットワークを用いたプラントの同定器,シミュレータ及びコントローラ
JPH04155503A (ja) * 1990-10-19 1992-05-28 Matsushita Electric Ind Co Ltd ニューロ制御装置
JPH04190593A (ja) * 1990-11-22 1992-07-08 Matsushita Electric Ind Co Ltd 照明装置
JPH04190591A (ja) * 1990-11-22 1992-07-08 Matsushita Electric Ind Co Ltd 照明装置
JPH04206498A (ja) * 1990-11-30 1992-07-28 Matsushita Electric Ind Co Ltd 照明装置
JPH0548391A (ja) * 1991-01-23 1993-02-26 Fujitsu Ltd 適応等化器
US5259064A (en) * 1991-01-25 1993-11-02 Ricoh Company, Ltd. Signal processing apparatus having at least one neural network having pulse density signals as inputs and outputs
KR100447135B1 (ko) * 1997-12-30 2004-11-03 엘지전자 주식회사 비선형시스템의추종제어장치

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03255504A (ja) * 1990-03-06 1991-11-14 Nippon Telegr & Teleph Corp <Ntt> ニューラルネットワークを用いたプラントの同定器,シミュレータ及びコントローラ
JPH04155503A (ja) * 1990-10-19 1992-05-28 Matsushita Electric Ind Co Ltd ニューロ制御装置
JPH04190593A (ja) * 1990-11-22 1992-07-08 Matsushita Electric Ind Co Ltd 照明装置
JPH04190591A (ja) * 1990-11-22 1992-07-08 Matsushita Electric Ind Co Ltd 照明装置
JPH04206498A (ja) * 1990-11-30 1992-07-28 Matsushita Electric Ind Co Ltd 照明装置
JPH0548391A (ja) * 1991-01-23 1993-02-26 Fujitsu Ltd 適応等化器
US5259064A (en) * 1991-01-25 1993-11-02 Ricoh Company, Ltd. Signal processing apparatus having at least one neural network having pulse density signals as inputs and outputs
KR100447135B1 (ko) * 1997-12-30 2004-11-03 엘지전자 주식회사 비선형시스템의추종제어장치

Similar Documents

Publication Publication Date Title
Runge et al. A framework for the automated design and modelling of soft robotic systems
Arena et al. Multilayer perceptrons to approximate quaternion valued functions
Lakhal et al. Hybrid approach for modeling and solving of kinematics of a compact bionic handling assistant manipulator
Mitrovic et al. Adaptive optimal feedback control with learned internal dynamics models
Song et al. Effects of connectivity structure of complex echo state network on its prediction performance for nonlinear time series
Jordan Constrained supervised learning
Köker Reliability-based approach to the inverse kinematics solution of robots using Elman's networks
Goodman et al. Feed-forward control of a redundant motor system
US6000827A (en) System identifying device and adaptive learning control device
JPH02201607A (ja) ニューラルネットワークを用た適応制御システム
GB2258742A (en) &#34;predictive control method and apparatus&#34;.
Zahra et al. A bio-inspired mechanism for learning robot motion from mirrored human demonstrations
Oyama et al. Inverse kinematics learning for robotic arms with fewer degrees of freedom by modular neural network systems
Medina et al. Impedance-based gaussian processes for predicting human behavior during physical interaction
Li et al. Distributed neural-network-based cooperation control for teleoperation of multiple mobile manipulators under round-robin protocol
Ge et al. Task-space coordinated tracking of multiple heterogeneous manipulators via controller-estimator approaches
Köker Design and performance of an intelligent predictive controller for a six-degree-of-freedom robot using the Elman network
Hafez et al. Improving robot dual-system motor learning with intrinsically motivated meta-control and latent-space experience imagination
Jha et al. Inverse kinematic solution of robot manipulator using hybrid neural network
Kumar et al. A new hybrid force/position control approach for time-varying constrained reconfigurable manipulators
Touvet et al. A biomimetic reach and grasp approach for mechanical hands
JP2021084188A (ja) 制御システム
Yamacli et al. Simulation of a SCARA robot with PD and learning controllers
Kebria et al. Stable neural adaptive filters for teleoperations with uncertain delays
Penco et al. Prescient teleoperation of humanoid robots