JPH02201607A

JPH02201607A - ニューラルネットワークを用た適応制御システム

Info

Publication number: JPH02201607A
Application number: JP1021457A
Authority: JP
Inventors: Takeshi Aoki; 武司青木; Hiroyuki Izumi; 泉　寛幸; Ryoichi Narita; 成田　良一
Original assignee: Fujitsu Ltd
Current assignee: Fujitsu Ltd
Priority date: 1989-01-31
Filing date: 1989-01-31
Publication date: 1990-08-09

Abstract

(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。

Description

【発明の詳細な説明】〔目次〕概要産業上の利用分野従来の技術（第１３図）発明が解決しようとする課題課題を解決するための手段（第１図）作用実施例（ａ）　　システムの説明（第２図〜第６図）（ｂ）　
　ニューラルネットワークの説明（第７図〜第１１図）（Ｃ）　　具体例の説明（第１２図）（ｄ）　　他の実施例の説明発明の効果〔概要〕非線形系未知制御対象の構造を：ｊ、−ラル１′。

トワークで同定し、その出力を規範モデルの出力に追従
させるためのニコ、−ラル不ノトワーク苓用いた適応制
御システ１、に関し、非線形系の制御対象に対し゛と、非線形部の関数形が未
知である場合にも、同定、制御することを１」的とし、制御対象に対して同定と制御を行い、制御対象の出力を
目標値に追従させる適応制御シスうづ、において、過去
の制御人力と制御出力を成分とする内部信号をニューラ
ル不ン１ワークで演算し、演算結果とＩＦＩ標埴とから
制御人力を発生ずる制御装置と、該内部信号をニブ、−
ラル不ノトヮークで演算し、演算結果と制御出力とから
同定値を発１１；する同定装置と、該制御入力を教師信
号とし、該同定値との誤差から該二１−ラルネン１−ワ
ークの重みを演算する学習装置と、該制御入力と該制御
出力とを格納し、該内部信号を発４１−するための人出
カメ−しり、Ｉ−仝（」−・ｊム、［産業上の利用分野］末完明巳よ、非線形系未知＠Ｉ御対象の構造を二□ラル
不ノ）・ワークで同ホ１２、その出力を規範モア゛ルの
出力に追征さ１±るためのニューラルネットワークを用
いた適応制御シス−ｉ−Ｊ−、に関する。

制御対象のハラメータか未知である場合や、動作環境の
変化によりパラメータが変動するような場合には、制御
対象のバラタ　タを同定しながら、制御を行う適応制御
方法が有用である。

このような適応制御力法３として　制御１対象の出力を
規範モデルの出力に追従させる形式のモデル規範形適応
制御が提案されている。

しかし、前述の提案は、制御対象が線形のものに限られ
、制御対象が非線形系の場合には、満足な適応制御方法
が確イｆされていない。

実際の産業分野では、制御対象が非線形であることが少
な（なく、非線形系に対しトＪ定と制御を行う適応制御
技術か・Ｒめられ了いろ。

〔従来の技術〕

第１３図は従来技術の説明図である。

適応制御の有力な手段であるモデル規範形適応制御を、
非線形系の制御対象に拡張する方法として、第１３図に
示すように、関数形が既知の非線形関数の未知の係数Ｗ
１〜ｗｎをパラメータとして推定する方法が提案されて
いる。

例えば、１９８８年第８回適応制御シンポジウム資料第
５５頁乃至第５８頁の論文１ノルム制約形非線形系のモ
デル規範形適応制御１等に示されている。

即ら、制御対象１に対し制御装置２と同定装置３とを設
け、この制御装置２と同定装置３とに、既知の非線形関
数の系１−ｎを設＆−１、制御人力Ｕと同定値ｕ次との
同定誤差εにノ、（づいて制御装置２と同定装置３との
系の係数Ｗｌ−Ｗｎを変化し、同定誤差εが零となるよ
うに、同定、制御するものである。

〔発明が解決しようとする課題〕

このような従来技術では、非線形部の関数形自体が既知
の場合には、良好に同定、制御が可能である。

しかしながら、非線形部の関数形自体が未知の場合番こ
ｔよ、同定や制御ができず、モデル規範形適応制御系を
実際の制御対象に適用するのが困難であるという問題を
生じていた。

従って、本発明は、非線形系の制御対象に対して、非線
形部の関数形が未知である場合にも、同定、制御ができ
るニューラルネッｌ−ワークを用いた適応制御システム
を提供することを目的とする。

［課題を解決するための手段〕第１図は本発明の原理図である。

本発明は、第１図に示すように、制御対象１に対して同
定と制御を行い、制御対象１の出力を目標値に追従させ
る適応制御システｌ、において、過去の制御入力と制御
出力を成分とする内部信号をニューラルネットワーク２
ａで演算し、演算結果と目標値とから制御人力を発生ず
る制御装置２と、該内部信号をニューラルネットワーク
３ａで演算し、演算結果と制御出力とから同定値を発生
ずる同定装置３と、該制御入力を教師信号よし、該同定
値との誤差から該ニューラルネットワーク２ａ、３ａの
重みを演算する学習装置４と、該制御入力と該制御出力
とを格納し、該内部信号を発生ずるための入出カメモリ
５とを有するものである。

〔作用〕

本発明では、ニューラルネットワークが、任意の連続関
数を近似実現しうろことから、制御装置２と同定装置３
にニューラルネットワーク２ａ、３ａを設け、非線形関
数の同定に用いている。

そして、ニューラルネットワーク２ａ、３ａを入出カメ
モリ５の内部信号で動作せしめ、学習装置４が誤差から
ニューラルネットワーク２ａ、３ａの重みを演算、設定
することにより、非線形未知制御対象の同定、制御を可
能とするものである。

〔実施例〕

（ａ）　　システムの説明第２図は本発明の一実施例構成図である。

図中、第１図及び第１３図で示したものと同一のちのは
、同一の記号で示してあり、２ｂ、３ｂは乗算器であり
、２ｃ、３Ｃは加算器であり、４ａは差分器である。

先ず、次のように問題の設定を行う。

制御対象１を次式の多入力多出力離散時間非線形系と仮
定する。

ｙ　（ｔ）　−ｆｏ　［ｙ（ｔ−１）　７．　＋＋、　
ｙ（ｔ−ｎ）　７；ｕ（ｔ−ｄ−１）　”、　−、ｕ（
ｔ−ｄ−ｍ）　’］モｇｏ　［ｙ（ｔ−１）Ｔ＋−＋ｙ
（ｔ−ｎ）”；ｕ（ｔ−ｄ−１）Ｔ＋　　−、ｕ（ｔ−
ｄ−−リｕ（ｔ−ｄ）力、出力であり、１次元縦ベクト
ルとする。

ｄは既知のむだ時間で定数とする。次数ｎ、ｍは既知と
する。ｒｅ（・）、ｇｏ（・）は、それぞれ非線形関数
を要素とする！次元縦ベクトル、非線形関数を要素とす
る！×ｉ次元行列で、各要素の関数形は未知とする。

（１）式の右辺からｙ（ｔ−１）、・・・、ｙ（ｔ−ｄ
）を１頌次消去すると、ｙ（ｔ）＝ｆａ　［ｘ（ｔ−ｄ）”ｌ　＋ｇ、＋　［ｘ
（ｔ−ｄ）”］　ｕ（Ｌ−ｄ）　　（２）ｘ（ｔ）”＝
　Ｉ−ｙ（ｔ−１）”、　−、ｙ（ｔ−ｎ）”；ｕ（ｔ
−１）”ｓ＝、ｕ（Ｌ−ｄ−ｍ）”ｌ　（３）となる。

制御対象の入出力を成分とするベクトルｘ　（ｔ）を内
部信号と呼ぶ。

ここで、ｄ　ｅｔ（行列）　（ｇｄ［ｘ（ｔ−ｄ）コ〕
≠０と仮定すると、（２）式より、制御対象の連系表現
として、ｕ（ｔ−ｄ）＝ｆ　［ｘ（ｔ−ｄ）］　十ｇ　［ｘ（ｔ
−ｄ）］　ｙ（ｔ）　　　　（４）ｇ　　［ｘ（ｔ−ｄ
）１−ｇ、［ｘ（ｔ−ｄ）コ　−′（５）ｆ　　［ｘ（
Ｌ−ｄ）］　　−−ｇｄ　［ｘ（ｔ−ｄ）コ　　’ｒａ
　　［ｘ（ｔ−ｄ）　」（６）を得る。

制御目的は、時刻ｔまでに得られた人出力信号から（５
）、（６）式の未知間＃９．ｆｃ・）、ｇ（・）を推定
し、制御対象の出力Ｖ（ｔ）を模範モデルの出力ｙ、％
（１）に追従させることとする。ただし、時刻りでｄ時
間先の目標（１！ｙｍ（ｙ−＋ｄ）は利用可能とする。

次に、同定装置３について説明する。

制御対象の同定方法は次のように行う。

制御対象の連系表現（４）式を同定するために同定モデ
ルとして次式を考える。

ｕ”（ｔ−ｄ）＝ｆ”　　［ｘ（ｔ−ｄ）コ　＋ｇ’　
　［ｘ（ｔ−ｄ）］　　ｙ（ｔ）　　　（７）ここで、
（７）式のｕ”（ｔ−ｄ）、ｆ”ｉ）、ｇ”（・）は、
それぞれ（４）式のｕ（ｔ−ｄ）、ｆ（・）、ｇ（・）
の推定値である。

尚、同定誤差ε（ｔ−ｄ）、同定二乗誤差Ｅ（ｔ−ｄ）
を次式で定義する。

ε（ｔ−ｄ）　−ｕ（ｔ−ｄ）−ｕ”（ｔ−ｄ）　　　
　（８）ｐ（ｔ−ｄ）−ＥεＣｔ−ｄ）　）　２／　２
　　　　（９）第３図は第２図構成の４層ニューラルネ
ットワクの説明図、第４図はそのニューラルネットワク
を構成する基本ユニットの説明図である。

同定装置３は、非線形関数ｆ（・）、ｇ（・）を近似実
現するニューラルネットワーク３ａを内部に持つ。

ニューラルネットワーク３ａの基本ユニット３０は、第
４図に示すよう番こ、入力をχ１、重みをＫＪ８、出力
をｙ、とすると、閾値θをもつｓｉｇｍｏｉｄ関数σ（
・）を使って次の演算を実行する。

ｎｅＪ−Σ−ｊｉＸｉ十〇　　　（１０）ｙＪ・−σ（
ｎｅＬＪ）　　　　　　　　（１１）ただし、 σ（ｎｅｔｊ＝１／（１−＋−ｅｘｐ（ｎｅＬＪ））　
　　（１２）ここで、閾値θの扱いを容易にするために
、６゜−〇、χ。−１とおき、ｎｅＪ−Σｗ；ｒｘ＋　　　　　　　（１３）ｙ、−σ
（ｎｅＪ）　　　　　　　　（１４）と計算し、閾値θ
を重みと同等に扱う。

ｒ（・）、ｇ（・）の関数形を近似実現するニューラル
ネットワーク３ａは、第３図（Ａ）、（Ｂ）に示すよう
に基本ユニット３０を多段多層化して構成する。

関数ｆ（・）については、第３図（Ａ）に示すように、
人出力層の出力関数は線形関数、中間の２層の中間層（
隠れ層）の出力関数はどちらもｓｉｇｎｏｉｄ関数であ
るような４層ニューラルネットワク３ａＦの構造を持つ
。

又、関数ｇ（・）については、同様の４層二、ウラルネ
ッ１−ワークを多段重ねた構造３　ａ　Ｇを持つ。

そして、第２図のように、（７）武に征い、ごれらのネ
・７１−ワークの入力にｘ（ｔ−ｄ）、出力にｆ泉〔Ｘ
（ｔ−ｄ））又はｇ雀（ｘ（ｔ−ｄ）　）を対応させる
。

そして、第（７）式の実行のため、行列ｇ　（ｘ）とベ
クトルＶ（ｔ）の積を求める乗算器３ｂと、ベクトルｆ
（ｘ）とｇ　（ｘ）・ｙの和を求める加算器３ｃを、第
２図のように設け、学習装置４から更新された重みを受
けとる。

次に、学習装置４は、ホストコンピュータで構成され、
差分器４ａの同定誤差ε（ｔ−ｄ）から、（９）式の同
定二乗誤差を最小にするように、ニューラルネットワー
クの重みの調整を行う機能を持つ。

それは、Ｅ（Ｌ−ｄ）のｆ”　１ｘ（ｔ−ｄ）］　、ｇ
”　［ｘ（Ｌｄ）　１に関する最急鋒下方法としてを用いたバックプロパゲーション法による。

第５図は重み調整処理フロー図である。

先ず、ｆ（・）の関数形を近似実現する４層のニューラ
ルネットワークにおいて、ｘｌ、入力層のｉ番目の出力信号１、＋１）、ｈ（２１，，２層の中間層のｊ番１」の出
力信号ｆ、：出力層の出力信号ベクトル１次のｉ番目の
要素ε、コ同定誤差εのｉ番目の要素、＋３１．．２番目の中間層から出力層への重み１２ゝ
１．：１番目の中間層から２番目の中間層への重み、Ｎ
）に８層人力層から１番目の中間層への重みΔ、＋３１
．．．稈１１．の史新縦１１，２１Ｊｉ、１１（２１，の更新量Δ−Ｃ１１，，
，０１，の更新量 η：学習の定数とする。

各層での入出力関係は（１２）式のｓｉ（Ｂｍｏｉｄ関
数σ（・）を用いて、ｒＪ−Σ−”Ｊｔ　ｈ”＋　　　（１７）ｈＬＺ）　、
　＝　σ（Σ、＋ｚ＋、　　ｈ”’＋　　）　　（１８
）ｈｆｌゝ　−・−σ（Σ−ｔＩ）Ｊ、　　ｘ＋）　　
　　　（１９）と書ける。

１３）１の更新は次のように行う。

１ηｊｉ（ｔ＋１）・ｗ　”’　；　ｒ　（ｔ）＋６ｗ
”’７ｉ（ｔ）一ηεＪｈ（２１、＋２１．の更新は次のように行う。

ｗ　”　ｉ、（ｔ＋１）＝ｗ　”　１（ｔ）＋Δ、（２
１，、、（Ｌ）ただし、 −８６１ｗ”□、（Ｌ）、（＋１Ｊ、の更新は次のように行う。

ｗ”Ｊ８（ｔ＋１）＝ｗ”’ｊ＋（ｔ）＋ΔＩｆ”’ｊ
ｔ（ｔ）　　（３１）ただし、ラルネット３ａＧの重みの更新は（２２）、（２３）式
及び（２８）〜（３０）式を除いて、ｒ（・）の場合と
同一である。

ｇ（・）における、（３）ｊｉの更新においては、ｇｊ
ｌｋを出力層の出力信号の行列ｇ５の（Ｃｋ）要素とす
ると、（１７）式は、ｇｊｋ＝Σｗ　”　、Ｈｈ　”　＋　　　（３Ｂ）とな
る。

（２２）式は、であり、以上がｆ（・）の関数形を近似実現する４層ニューラル
ネットワーク３ａＦの重みの更新方法である。

次にｇ（・）の関数形を近似実現する４Ｎニユー（但し
、ｙｋは制御出力ｙＯｋ番目の要素）であるから、６ｗ　”’、＋（ｔ）　＝７７８ｊｙ＋ｉ　　ｈ　”’
　＋　　　（２３′）となる。

（２８）式は、であり、（３９）式より、 −Σ　ε　ｓ　　Ｖｋｋ４　”　ｓｊ　（ｔ）　　　　
　　　　　（３０’　　）となる。

ホストコンピュータ（学習装置）は、重みの更新を各時
刻ｔで行い、更新された重みを制御装置２と、同定装置
３のニューラルネットワーク２ａＦ、２ａＧ、３ａＦ、
３ａＧに転送する。

次に制御装置２について説明する。

制御対象１の制御方法は次のように行う。

制御対象の送糸が（４）式で表されるから、同定装置３
がニューラルネットワーク３ａＦ、３ａＧによって実現
した推定関数ｆ”（・）、ｇ＆（・）を用いて制御入力
を次式で与える。

ｕ（ｔ）−ｆ”　［ｘ（ｔ）］　＋ｇ攻［ｘ（ｔ）］　
ｙｎ＋（ｔ＋ｄ）　　（４０）この制御入力はｘ（ｔ）
の内容から実現可能である。

従って、制御装Ｍ２は、第３図、第４図の同定装置３と
同一の内部構造を持ち、ホストコンピュタ４から更新さ
れた重みを受は取り、制御に必要な入出力を内部信号と
して記憶している入出カメモリ５から内部信号と目標値
を受は取り、（４０）式を実行する。

第６図は、人出カメモリの動作説明図である。

（７）式、（４０）式を比較すると、未知関数ｆ（・）
、ｇ（・）の同定はｄ時間遅れで行われ、内部信号Ｘの
関数であるから、同定と制御に必要な入出力を内部信号
ｘ（ｔ）、ｘ（ｔ−ｄ）として記憶しておく、第６図の
入出カメモリ５が必要となる。

（３）式から、入出カメモリ５は、ｘ（ｔ）の記憶領域
５ａに過去の制御出力ｙ（Ｌ−１）　〜ｙ（ｔ−ｎ）、
過去の制御人力ｕ（ｔ−１）〜ｕ（ｔ−ｄ−ｍ）を格納
し、ｘ　（ｔ）として出力する。

又、ｘ（ｔ−ｄ）の記憶領域５ｂに、同様に（３）式か
ら、ｘ　（ｔ−ｄ）として、過去の制御出力ｙ（ｔ−ｄ
−４）　〜ｙ（ｔ−ｄ−ｎ）、制御人力ｕ（ｔ−ｄ−１
）〜ｕ（ｔ−２ｄ−＋＊）を格納し、ｕ（ｔ−ｄ）の記
憶領域５Ｃにｕ　（ｔ−ｄ）を格納する。

従って、適応制御システムは、第２図に示すよＢうに、内部信号の発生のための人出カメモリ５と、（４
０）式により制御人力ｕ（ｔ）を発生ずる制御装置２と
、（７）式により同定人力ｕ”（ｔ−ｄ）を発生ずる同
定装置３と、ｕ　（ｔ−ｄ）を教師信号として４層ニュ
ーラルネットワークの重みの更新を行う学習装置（ホス
１−コンピュータ）４とで構成されている。

そして、制御装置２と同定装置：３にニューラルネット
ワーク２ａＦ、２ａＧ、３　ａ　Ｆ、３ａＧが設けられ
ている。

第３図及び第４図のような、ｓｉＢｍｏｉｄ関数を出力
関数とする４層ニューラルネットワークは、任意の連続
関数を近僚実現しうる（例えば、１９８８年電子情報通
信学会技術研究報告Ｍ　Ｂ　Ｅ　８８９論文［ニューラ
ル・ネットワークによる連続写像の返信的実現について
」参照の事）。

本発明では、この４層ニューラルネットワークを、多入
力多出力の非線形関数の同定に用いている。

この時（４）式から（４０）式を引くと、ｆ　　［ｘ（
ｔ）］　　−ｆ”　　［ｘ（ｔ）］　　罎ＰＸ　［ｘ（
ｔ）　］　　ｙ（ｔ＋ｄ）ｇ”　［ｘ（ｔ）　’、ｌ　
ｙｍ（Ｌ＋ｄ）−〇　　（４１）ｒ　［ｘ（ｔ）］　−
ｆ”　［ｘ（ｔ）−，１４ｇ　［ｘ（ｔ）］　　［ｙ（
ｔ＋ｄ）−ｙｍ（ｔ＋ｄ））＋（ｇ　［ｘ（ｔ）］　−
ｇ”　［ｘ（ｔ）］　）ｙｍ（ｔ＋ｄ）＝Ｏ（４２）で
ある。

ニューラルネットワークが非線形関数を近僚実現し、ｆ
　［ｘ（ｔ）　］　→ｆ”　［ｘ（ｔ）　］　、ｇ　［
ｘ（ｔ）　］　　→ｇ”［ｘ（ｔ）］　（ｔ−＋ｏＯ）
となれば、ｄｅｔ［ｇ（・）ＩＪ−０の仮定より、ｙ（ｔ＋ｄ）→ｙｍ（ｔ＋ｄ）　（ｔ→ω）　　　（４
３）となり、制御目的が達成される。

従って、任意の未知の非線形関数を含む、多入力多出力
の制御対象１に対して、制御対象１を同定し、制御する
ことを可能とする。

（ｂ）　　ニューラルネットワークの説明第７図はニュ
ーラルネットワークの構成図であり、第２図、第３図の
４層のニューラルネットワークの構成を示している。

この実施例では、ニューラルネットワークの階層構造間
のインターフェイスをアナログで実現するものであり、
基本ユニット３０の出力はアナログ信号で構成される。

図中、３１は各基本ユニット３０毎に設けられる重み出
力回路であり、基本ユニット３０の重み保持部（後述）
のための重みを出力するもの、３２は重み信号線であり
、重み出力回路３１の出力を重み保持回路に接続するも
の、３３ば入力バタンの次元数に合わせて設けられる初
期信号出力回路であり、階層ネットワークの人力層に対
して入カバターンとなる初期信号を出力するものである
。

３４は同期制御信号線であり、データ転送の制御を実行
する後述する主制御回路からの同″ＸＪ１制御信号、重
みを、重み出力回路３１、初期信号出力回路３３及び基
本ユニット３０の制御回路（後述）に伝えるための信号
線である。なお、この同期制御信号線３４ば、図中では
共通線で示しであるが、詳細には、各回路に対し主制御
回路と個別の信号線で接続されている。

３５はアナログハスであり、入力信号を入力層（の基本
ユニット３０）へ伝え、入力層と中間層、中間層と中間
層、中間層と出力層とを接続するためのものであり、３
６は主制御回路であり、ホストコンピュータ４からの指
示により、同期制御信号及び重みを出力するものである
。

従って、４層ニューラルネッ１〜ワークは、入力層から
出力層の各層に、人力信号分の基本ユニット３０と重み
出力回路３１を有し、各層がアナログバス３５によって
接続され、主制御回路３６の制御で重みがセットされ且
つ同期制御される。

第８図は基本ユニットの構成図である。

図中の乗算処理部３０２は、乗算型Ｄ／Ａコンバータ３
０２ａで構成され、前段層の基本ユニット３０から、あ
るいは初期信号出力回路３３からのアナログ信号（入カ
スインチ部３０７を介して入力される）の入力と、その
入力に対して乗算されるべきディジタル信号の重み情報
（重み保持部３０８を介して入力される）との乗算を行
って、得られた乗算結果をアナログ信号で出力するよう
処理するものである。

累算処理部３０３は、積分器で構成されるアナログ加算
器３０３ａとアナログ加算器３０３ａの加算結果を保持
するサンプルホールド回路３０３ｂとにより構成され、
アナｉ−Ｉグ加算器３０．３　ａは乗算型Ｄ／Ａコンバ
ータ３０２　ａの出力と、前回に求められてサンプルホ
ールド回路３０３　ｈ６ご保持されている加算値とを加
算して新たな加痺、値を求めるもの、サンプルホールド
回路３０３ｂは、アナログ加算器３０３ａが求めた加算
値をホールドするとともに、そのホールド値を前回の加
算値としてアナログ加算器３０３ａにフィードバンクす
るものであり、これらの加算処理は制御回路３０９より
出力される加算制御信号に同期して実行される。

闇値処理部３０４は、アナログの関数発生回路である非
線型関数発生回路３０４ａで構成され、入力に対してシ
グモイド（ｓｉｇｎｏｉｄ）関数等の非線形信号を出力
するものであり、人力スイッチ部３０７を介して人力さ
れるアナログ信号に対する乗算型■〕／Δコンバータ３
０２　ａによる乗算及びこれらの乗算結果に累算が終了
したときに、サンプルホールド回路３０３ｂにホールト
されている加算値Ｘに対して演算処理を施してアナログ
出力値Ｙを得るもの、出力保持部３０５は、サンプルホ
ールド回路で構成され、後段層の基本ユニット３０への
出力となる非線型関数発生回路３０４ａのアナログ信号
の出力値Ｙをホールドするものである。

また、３０６は出力スイッチ部であり、制御回路３０９
よりの出力制御信号を受けて一定時間ＯＮすることで、
出力保持部３０５が保持するところの最終出力をアナロ
グバス３５上に出力するよう処理するもの、３０７は入
力スイッチ部であり、制御回路３０９よりの人力制御信
号を受けて前段層の基本ユニット３０から最終出力、あ
るいは初期信号出力回路３３からのアナログ出力が送ら
れてくるときにＯＮすることで入力の受付を行い、この
アナログ値を乗算型Ｄ／Ａコンバータ３０２ａに与える
ものである。

３０８は重み保持部であり、パラレルアウトシフｌ−レ
ジスタ等により構成され、主制御回路３６から送られて
くる重み信号がトライステートツマ・ンファ３０８ａの
ゲートがオーブン（制御回路３０９による重み入力制御
信号がオン）された時に、この重み信号を乗算処理部３
０２が必要とする重みとして保持するもの、３０９は制
御回路で、これらの基本ユニッ１−３０の処理機能の制
御を実行する。

乗算処理部３０２、累算処理部３０３及び闇値処理部３
０４が実行する演算処理は、上述したように、基本ユニ
ット３０に接続される複数の人力をＹｉ、この各接続に
対して設定される重みをＷｌとするならば、乗算処理部
３０２は、Ｙ　ｉ　−Ｗ　ｉを算出し、累算処理部３０３は、Ｘ−ΣＹ】・Ｗｌを算出し、闇値処理部３０４は、最終出力をＹとするな
らば、Ｙ＝１／（１→−ｃｘｐ（−Ｘ（−θ））を算出するこ
とになる。

第９図は第７図構成の主制御回路３６の構成図である。

図中の主制御回路３６は、外部バスインターフェイス回
路３６ａ、マイクロコードメモリ３６ｂ、プログラムシ
ーケンサ３６ｃ、制御パターンメモリ３６ｄ、重みデー
タ３６ｅを含んで構成される。

外部バスインターフェイス回路３６ａは、メインバスを
介してホストコンピュータ４と接続されており、ホスト
コンピュータ４からの動作指示を受は取るもの、マイク
ロコードメモリ３６ｂは、プログラムシーケンサ３６ｃ
の動作を規定するマイクロコードを格納するもの、プロ
グラムシーケンサ３６ｃは、マイクロコードメモリ３６
ｂ内のマイクロコードに応じて制御パターンメモリ３６
ｄ及び重みデータ３６ｅをコントロールするものである
。

制御パターンメモリ３６ｄは、その出力信号線が初期信
号出力回路３３、入力層、中間層、出力層における基本
ユニット３０のそれぞれに個別に接続されており、プロ
グラムシーケンサ３６ｃからの指示に応じて、各組毎、
すなわち、初期信号出力回路３３の組、人力層の組、一
対の中間層の組、出力層の組毎に、各組の内の１つの回
路、あるいは基本ユニット１を時分割に選択するように
出力信号線のオン、オフを設定するだめのもの、重みデ
ータメモリ３６ｅは、プログラムシーケンサ３６ｃの指
示に応じて、時分割人力信号に同期して各基本ユニット
３０に重みが与えられるように、各重み出力回路３１に
重み（ディジタルブタ）を出力するものである。

第１０図はニューラルネットワークの信号処理説明図で
ある。

ホストコンピュータ３６からメインバスを介して出カバ
ターンへの変換要求が与えられると、主制御回路３６は
、初期信号出力回路３３に対して出力制御信号を時系列
的にサイクリックに送出することで、複数の初期信号出
力回路３３を順次、時系列的にサイクリックに選択して
いくよう処理する。

すなわち、主制御回路３６は、プログラムシーケンサ３
６ｃの指示に応じて、制御パターンメモリ３６ｄから、
まず、入力層の基本ユニット３０に対し−７−同町１制
ｊ卸信シ）を同時に与えるとともに、初期信号出力回路
３３を順々に選択するべく、同期制御信号線３４を＠ｈ
に各初期信号出力回路３３毎にオンさせる。

つまり、まず、一番」−の初期信号出力回路３３に与え
られる人メツパターンＹ１をアナログバス３５に出力す
べく、９本の同期制御信号線３４のうち、初期信号出力
回路３３のゲートをオーブンする同期制御信号線３４　
（図中では、３４　ａ−１で表している）のみをオンし
、他の同期制御信号線３４ａはオ゛ノにする。

続いて、次の初期信号出力回路３３に与えられる入カバ
ターンＹ７をアナログバス３５に出力すべく、初期信号
出力回路３３のゲートをオーブンする同期制御信号線３
４　（図中では、３４ａ−２で表している）のみをオン
し、他の同期制御信号線３４はオフにする。

以下同様にして、最後の初期信号出力回路３３の入カバ
ターンＹｎをアナログバス３５に出力するまで、同期制
御信号線３４ａのオン、オフ動作を行う。

また、これと同時に、入力層の各基本ユニット３０の各
重み出力回路３１に対して重みを与えるべく、各同期制
御信号線３４ａのオン動作に同期して、同期制御信号線
３４ｂを介して各重み出力回！３１毎に重みデータメモ
リ３６ｅの出力を同時にセットする。

第１０図（Ａ）では、この同期制御信号線３４ａの同期
制御信号をＹｉ出力制御信号（ｉ−１〜ｎ）で表して、
初期信号出力回路３３を時系列的にサイクリックに選択
していく過程を図示している。ここで、ｎは初期信号出
力回路３３の個数である。

このようにして選択される初期信号出力回路３３は、人
力層との間に設けられるアナログハス３５（図中では、
入力層アナログバス３５ａという）上に、入カバターン
として法えられたアナログ信号Ｙｉを送出するよう処理
する。

従って、第１０図（Ａ）に示すように、入力層７−＋−
ログバス３５ａ」−には、アナログ信号Ｙｉが、初期信
号出力回路３３の個数分順序よく送出されるとともに、
最初の入カバターンのＹｊ、続いて次の入カバターンの
Ｙｉ、そして次の入力バタンのＹｉというように、次々
と繰り返し送出されていくことになる。

人力層の各基本ユニット３０の乗算処理部３０２は、こ
の送出されてくるアナログ信号Ｙｉを受は取ると、主制
御回路３６からセラ１−されることになる重み保持部３
０８の重みＷｉを使い、上述した演算処理の（Ｙｉ−Ｗ
ｉ）を実行することになる。

従って、主制御回路３６は、第１０図（Ｂ）に示すよう
に、初期信号出力回路３３の選択処理と同期させて、重
み出力回路３１を介して、その選択された初期信号出力
回路３３に応じた重みＷｉを、入力層の各基本ユニット
３０の重み保持部３０８にセットしていくことになる。

この基本ユニット３０への重みの設定処理は、アナログ
信号かディジタル信号のいずれのモードに従って実現す
ることも可能である。

２つなお、重みは、接続毎に指定されるものであることから
、上述したように、正確にはＷｉｊ（ｊは人力層の基本
ユニット番号）と表すべきであるか、説明を簡単にする
ためにＷｉとしである。

ここで、第１５図の基本ユニットの信号処理タイミング
チャートに従って、法本ユニッＩ−３（＋の動作につい
て説明する。

なお、ここでは、入力層におりる基本ユニント３０につ
いて説明するものとする。

まず、制御回路３０９は、主制御回路３６の制御パター
ンメモリ３６ｄから同期制御信号ｗＡ３４ａを介して与
えられる同期制御信号を受は取ると、人力制御信号（ｃ
）をオンにし、人力スイッチ部３０７を導通させると同
時に、１−ライステートバッファ３０８ａのゲートをオ
ーブンする重み人力制御信号（ｄ）、出力スイッチ部３
０６を導通させる出力制御信号（ｈｌ）をオンにする。

このとき、主制御回路３６は、クロック（ａ）と同期し
て前述した同期制御信号線３４ａを順次オンにするので
、このクロック（ａ）に同ルＩして初期信号出力回路３
３ａ、３３ｂ、−３３ｎに保持されている入カバターン
信号Ｙ８が、アナログバス３５、入力スイッチ部３０７
を介して乗算型Ｄ／Ａコンバータ３０２ａに与えられる
。

一方、主制御回路３６は、同様に、重みデータメモリ３
６ｅの重みを同期制御信号線３４ｂを介して重み出力回
路３１に与えているので、この重み（ディジタルデータ
）Ｗｉがトライステートバッファ３０８ａを通して重み
保持部３０８に格納される。

また、このとき、出力制御信号（ｈｌ）がクロック（ａ
）の１１１期分だけオンになるので、基本ユニット３０
の出力保持部３０５のサンプルホールド回路のアナログ
ゲートがこの間オープン状態となり、保持されていたア
ナログ値が出力スイッチ部３０６を介して中間層アナロ
グバス３５上に出力される。

さて、重み保持部３０８にディジタル値の重みＷｌが格
納されると、乗算制御信号（ｅ）がオンとなるので、乗
算型Ｄ／Ａコンバータ３０２ａは、入力スイッチ部３０
７を介し７て与えられるアナログ信号Ｙ１と重みＷｌと
の乗算を行い、乗算結果をアナログ信号として出力する
。

続いて、加算制御信号ＣＡ）がオンになるので、積分器
で構成されるアナログ加算器３０３ａが動作し、サンプ
ルホールド回！３０３　ｂに以前保持されていたアナロ
グ値（最初はクリアされており、ゼロである）と乗算型
Ｄ／Ａコンバータ３０２ａの乗算結果との加算が行われ
、加算結果がサンプルホールド回路３０３ｂに再格納さ
れる。

以上の動作により、１バスサイクルが終了し、次のクロ
ック（ａ）に同期して、入力スイッチ部３０７からは初
期信号出力回路３３ｂの入力バタンＹ２が与えられ、重
み出力回路］１からはこの入カバターンＹ２に対応する
重みＷ２が与えられるので、入カバターンＹ２と重みＷ
２との乗算が行われ、そして、この乗算結果とサンプル
ホールド回路３０３ｂのホールド値との加算が行われる
。

この時に、次の基本ユニット３０の出力制御信号（ｈ２
）がオンとなる。そして、これ以降、初期信号出力回路
３３ｎの入カバターンＹ７に対する処理が終了するまで
この動作を繰り返す。

そして、入カバターンＹ、ｌとＷｎとの乗算が終了する
と、変換制御信号（ｇ）がオンになるので、この乗算結
果を累算した値が、闇値処理部３０４の非線型関数発生
回路３０４ａに入力され、対応するＹ値が出力保持部３
０５に保持される。すなわち、闇値処理部３０４は、上
述したＹ−１／　（１＋ｅｘｐ　（−Ｘ十〇））という演算処
理を行い、これにより、基本ユニット３０の最終的な演
算出力である最終出力値Ｙが求められ、出力保持部３０
５に保持される。この値Ｙが求まると、累算処理部３０
３の累算値（サンプルホールド回路３０３ｂの保持内容
）は、次の初期信号出力回路３３の選択サイクルと同期
して、入力される同期制御信号によりクリアされる。

以上に説明したような動作を行うことにより、各基本ユ
ニット３０は、入カバターンＹ、と重みＷ８から最終出
力値Ｙを得る。

これ以降、第７図に示される実施例の構成乙、ニル、′
って説明する。

第１１図を用いて詳述したよ・うに、全−Ｃの初ｊｔＪ
ｌ信号出力回路３３にセットされた人カバター二′に対
する処理が終了すると、再度１制御回路３６から各基本
ユニット３０（識別子としてｄないし、ｎが付くことが
ある）に対して同期制御信号が与えられるので、初期信
号出力回路３３に新たにＩＪ未られる入カバターンＹ、
とホスＩ・コンビ、１〜　タ４から、メインバス、外部
ハスインターファーイス回路３６ａを介して与えられる
新たな重力Ｗ、に従って同様の動作を実行する。

一方、このようにして求められる入力層の基本ユニット
３０の最終出力値Ｙは、出力保持部３）０５に保持され
て、初期信号出力回路３３に対してなされた処理と全く
同じ処理により、アナログバス３５を介して、次段に位
置する中間層の基本ユニット３０にと、時分割の送信形
式に従−２７で送出されていくことになる。

すなわち、主制御回路３６は、人力層の各基本コ〜Ｓ・
１；よ０　、、、−、　：七□１１の制御回路３０９に
対してトわｔ１１制御制御線′（・ｌｔｌを介し、Ｃ出
力制御信号りよ〜ｈ、（第１１図）５−時ｊ倣目的にサ
イクリックＵ送出することで、名基本ユニント３０ａ〜
３０ｎの出カス１′ノ千部（ｊを順次２時系列的にサイ
クリックにＯＮする。これにより、各基本ユニット３　
（ｌ　ａ　−３Ｏｎの出力保持部３０５に保持されてい
る最終出力値の−１゛リロク信号が、中間層の各基本コ
ニ７　ト３０　ａ　　３０　ｎの乗算処理部３０２に時
分割の送信形式で送ｔ・ねる、−とになる。

中間層の各基本ユユノ’ｒ　’、；　Ｏａ〜３０ｎは、
前ｉ４ｉ　Ｌだと同様の処理動作炎実行ｊ７、この処理
により求められる中間層の基本コ、″′・・・１・３０
の最終出力値Ｙを使い、中間層の基本コニント３０に対
して同様の時分割の送信処理を実行することで、出力層
の基本ユニット３０の帰路出力値Ｙが求められることｂ
こなる。

すなわち、主制御回路３６は一対の中間層、出力層の各
基本ユＪ〕１〜：（（１ｂ、：個別に接続された同期制
御信号線３４，３．３４　ｂを介し、て、同様に各；（
６基本ユニット３０ａ〜３０ｎの制御を行う。

第１０図（Ａ）に、初期信号出力回路３３へのＹ、出力
制御信号と対応させて、入力層の基本ユニット３０への
出力制御信号のタイミングチャートを示すとともに、中
間層との間に設＆Ｊられるアナログハス３５（図中では
、中間層アナログハスという）」二に送出される人力層
の基本ユニット３０の最終出力値Ｙのタイミングチャー
トを示すごとにする。

（Ｃ）　　具体例の説明第１２図は本発明の詳細な説明図であり、第１２図（Ａ
）は倒立振子の制御の例を、第１２図（Ｂ）はリンク機
構の制御の例を示す。

第１２図（Ａ）は、滑らかに動く質量Ｍの台車上に取り
付けられた、長さ２！、質ψｍの倒立振子を示している
。台車に力Ｕを加えて倒立振子が鉛直方向となす角θを
自由に制御することを考える。ただし、Ｍ、ｍ、Ｅは未
知とする。

倒立振子の運動方程式は次式のようになる。

ｙ（Ｌ）・　θ（１）　　とおき、ｄθ；ｄｔ　−ｌ：ｙ（ｔ＋ｈ）　　ｙ＜む）１　／ｈ
ｄ２０　／ｄ　ｆ、”＝　　［ｙ（ｔ＋２ｈ）−２ｙ（
Ｌ＋ｈ）＋ｙ（Ｌ）ｌ　　／ｈ２と差分近似１−２て、
ｋ＋ｎ−ｔＬｎｈとおくと、ｙ（ｋ＋２）＝２ｙ（ｌｕ
　Ｉ）−ｙ（ｋ）１１（’ となるから、非線形関数ｆ。（・）、Ｂｏ（・）を用い
ζ次式のようにかげる。

ｙ（ｋ）−ｆｎ　［ｙ（ｋ−］）、ｙ（ｋ−２）］　＋
ｇｏ　Ｉｙ（ｋ−２）、］　ｕ（ｋ−２）　（４８）こ
れは本発明の仮定した離散時間非線形系（１）式の形を
しているので、本発明の方法を適用して、制御対象を同
定し、制御することができる。ｙ（ｋ）の目標値Ｖ、、
（ｋ）を０にとれば、倒立振子のバランスをとることが
でき、ｙｅ（ｋ）を周期的な信号にとれば、倒立振子を
周期的に振動させることができる。

」二連の実施例では、１人力１出力であったが、多入力
多出力であってもよい。

第１２図（Ｂ）は２本のリンクを持つリンク機構を示し
ている。

各リンクｉは質量ｍ１、長さβ、の均質な棒とする。リ
ンク間に発生ずる制御トルクｕ１とする。θ、は第ｉ−
１番目のリンクから第１番目のリンクの角度を時計まわ
りに測った相対角とする。

２リンク系の運動方程式は次式のようになる。

３（ｍ＋４２ｍｚ）ｇｆｆｉ　＋　ｓｉｎθ＋＋３ｍｚ
ｇ！２ｓｉｎ（θ１θ２）＋６ｕ＋　　　　　　　　　
　　　　　　　　（４９）３ｍｚｇｆ２５ｉｎ（θ１＋
θ２）＋６ｏｚ　　　　　　　　　　　　　　　　　　　　（
５０）ただし、Ｌ＝２　　［ｌ１１１１１１”＋ｒａｚｌｚ”＋３Ｔａ
ｚ１Ｍ＋＋ｌｚ　　ＣＯ２Ｏ３）　　］　　　（５１）
Ｍｚ＝２ｍｚ　ｌ　２”　　　（５２）ｙ（ｔ）−［θ
＋（１）、　　θｚ（ｔ）］　”、ｕ（ｔ）＝　［ｕ＋
（ｔ）、ｕｚ（ｔ）］　Ｔとおき、前述と同様な差分近
位を行うと、非線形関数ベクトルｆ０（・）、非線形関
数行列ｇｏ（・）を用いて、次式のように書ける。

ｙ（ｋ）＝ｆｏ　［ｙ（ｋ−１）”、ｙ（ｋ−２）”］
　＋ｇ６　［ｙ（ｋ−２）’］　ｕ（ｋ−２）　（５３
）これも本発明の仮定した離散時間非線形系（１）式の
形をしているので、本発明の方法を適用できる。

ここでは２リンク系に対する本発明の実施例を示したが
、一般のｎリンク系に対しても同様に本発明が適用でき
る。

（ｄ）　　他の実施例の説明上述の実施例では、ニューラルネットワークをハードウ
ウアで構成した例で説明したが、プロセンサのソフトウ
ェアによっても実現できる。

又、ニューラルネットワークも４層のもので説明したが
、４層以」二のものであってもよい。

以」二本発明を実施例により説明したが、本発明は本発
明に主旨に従い種々の変形が可能であり、本発明からこ
れらを排除するものではない。

〔発明の効果〕

以上説明した様に、本発明によれば、任意の連続関数を
近似実現しうるニューラルネットワークを用いて制御装
置と同定装置を構成しているので、非線形部が未知であ
る制御対象の適応制御が可能となるという効果を奏し、
種々の制御対象に対して、汎用性のある適用制御システ
ムを構築するのに寄与するところが大きい。

【図面の簡単な説明】

第１図は本発明の原理図、第２図は本発明の一実施例構成図、第３図は第２図の４層ニューラルネットワークの説明図
、第４図は第３図の基本ユニットの説明図、第５図は第２
図の重み調整処理フロー図、第６図は第２図の入出カメ
モリの動作説明図、第７図は第３図のニューラルネット
ワークの構成図、第８図は第７図の基本ユニットの構成図、第９図は第７
図の主制御回路の構成図、第１Ｏ図は第７図のニューラ
ルネットワークの信号処理説明図、第１１図は第８図の基本ユニットの信号処理タイミング
チャート、第１２図は本発明の詳細な説明図、第１３図は従来技術の説明図である。図中、ｌ−制御対象、２−制御装置、３−同定装置、２ａ、３ａ−ニューラルネットワーク、４−学習装置、入出カメモリ。

Claims

【特許請求の範囲】制御対象（１）に対して同定と制御を行い、制御対象（
１）の出力を目標値に追従させる適応制御システムにお
いて、過去の制御入力と制御出力を成分とする内部信号をニュ
ーラルネットワーク（２ａ）で演算し、演算結果と目標
値とから制御入力を発生する制御装置（２）と、該内部信号をニューラルネットワーク（３ａ）で演算し
、演算結果と制御出力とから同定値を発生する同定装置
（３）と、該制御入力を教師信号とし、該同定値との誤差から該ニ
ューラルネットワーク（２ａ、３ａ）の重みを演算する
学習装置（４）と、該制御入力と該制御出力とを格納し、該内部信号を発生
するための入出力メモリ（５）とを有することを特徴とするニューラルネットワークを用いた適応制御シ
ステム。