JP2000330610A

JP2000330610A - 学習制御装置および学習制御方法

Info

Publication number: JP2000330610A
Application number: JP11139136A
Authority: JP
Inventors: Akira Ishida; 明石田
Original assignee: Matsushita Electric Industrial Co Ltd
Current assignee: Panasonic Holdings Corp
Priority date: 1999-05-19
Filing date: 1999-05-19
Publication date: 2000-11-30

Abstract

(57)【要約】【課題】ニューロ出力値を用いた目標値追従制御を行
う場合、ニューロ推定値と推定対象パラメータ値との誤
差により、良好な制御性能を得ることができなくなり、
特に過渡変化時に極端に劣化する場合があるが、これに
対策を施すこと。【解決手段】ニューロ演算手段１２のニューロ結合係
数はニューロ学習手段１５内の誤差係数変更手段１６に
より目標値を考慮に入れた学習により算出され、結合係
数書き換え手段１７により書き換えられる。誤差係数変
更手段１６では学習時に用いるニューロ推定値と教師信
号との誤差評価関数の重み係数をニューロ推定値と教師
信号と目標値との相対位置関係に応じて変更し、ニュー
ロ学習手段１５によりこの重み係数を用いた評価関数に
基づき結合係数の学習を行う。

Description

【発明の詳細な説明】

【０００１】

【発明の属する技術分野】本発明は、ニューラルネット
ワークの出力値を用いてその学習制御量を算出する学習
制御装置および学習制御方法に関し、特に、制御目標値
に対し高精度な追従制御が可能となるような学習制御を
実現できるようにしたものに関する。

【０００２】

【従来の技術】近年、ニューラルネットワークが注目を
浴びている。ニューラルネットワークを用いると物理系
や化学系において入力と出力の因果関係を理論的に導き
出すことが困難な場合であっても、学習機能に基づいて
入力の値から出力の値を推定することが可能となる。こ
の点を利用してニューラルネットワークを複雑な制御系
を制御する制御装置、特に、非線形性の強い制御対象を
制御する制御装置に応用することが行われている。この
ようなニューラルネットワークを用いた制御装置の一例
として、自動車の内燃エンジンの空燃比制御装置が挙げ
られる。空燃比とはエンジンの吸気における空気と燃料
との比のことである。自動車の内燃エンジンの空燃比制
御にニューラルネットワークを用いると有効な理由は次
の通りである。自動車より排出される排気ガス中に含ま
れる有毒ガスであるＮＯｘ、ＣＯ、ＨＣは触媒を用いて
これらを低減させるという方法が採られ、例えば代表的
な触媒として三元触媒が使用される。

【０００３】図２２はエンジンの空燃比制御装置の概要
を示すものであり、スロットルＴＬの開度に応じてエン
ジンに流入する空気は、燃料噴射装置ＩＮＪにより噴射
された燃料と混合され、バルブＶ１を通って燃焼室に流
入し、燃焼室内で爆発する。これによりピストンＰに対
する押下力が発生し、排気ガスはバルブＶ２を通って排
気管側に排出されるが、その際空燃比センサＡＦＳによ
り空燃比が感知され、三元触媒ＴＣにより排気ガスが浄
化される。このような触媒がこれらの有害ガスを最も効
果的に浄化するためには、図２３に示すように、空燃比
を、触媒が効果的に働くことのできる一定値（図２３に
示すように１４．７）に保つ必要があり、このため自動
車の運転状態にかかわらず空燃比を一定に保つ空燃比制
御装置が必要となる。

【０００４】このような空燃比制御装置では、通常、ス
ロットル開度等の変化に応じて、燃料噴射量の増量補
正、減量補正等を行うフィードフォワード制御が行わ
れ、さらにフィードバック制御も併用されている。これ
らの制御は、アイドル時や定速走行時などの定常運転域
ではよい結果を得ることができる。しかしながら、加，
減速時などの過渡状態においては、空燃比センサの応答
の遅れや気筒内に実際に流入する燃料量等が運転状態や
外部環境により順次変化していく等の解析困難な要因に
より、空燃比を単純なフィードフォワード制御やフィー
ドバック制御のみで一定値に保つのは現実には非常に困
難である。

【０００５】そこで、空燃比制御の精度をより向上させ
るために、上記燃料噴射等の非線形要素をニューラルネ
ットワークにより学習させ、このニューラルネットワー
クを用いて燃料噴射量の補正量を、過渡時の応答性能の
向上を図るように制御を行うことが考えられる。このよ
うな空燃比制御装置は既に公知となっており、その一例
として、特開平８−７４６３６号公報に示されたものが
ある。

【０００６】この従来のニューラルネットワークを用い
た空燃比制御装置を図１９に示す。図において、Ｅはエ
ンジン、２１０はその状態を検出する状態検出部、２２
０はこの状態検出部２１０により検出された状態に基づ
いて空燃比を推定するニューラルネットワーク（以下、
ＮＮと称す）演算部、２３０はＮＮ演算部２２０の演算
結果に基づいてエンジンの燃料噴射量を算出する燃料噴
射量算出部である。

【０００７】次に動作について説明する。この空燃比制
御装置は、状態検出部２１０によりエンジンＥの状態を
表わす複数の物理量、ここではエンジンの回転数（Ｎ
ｅ）、吸入空気圧（Ｐｂ）、スロットル開度（ＴＨ
Ｌ）、燃料噴射量（Ｇｆ）、吸入空気温（Ｔａ）、冷却
水温（Ｔｗ）、空燃比（Ａ／Ｆｋ）を検出し、ＮＮ演算
部２２０により、これら状態検出部２１０で検出した複
数のパラメータを入力し、状態検出部２１０における空
燃比センサでは過渡時等追従できない，真の空燃比（Ａ
／Ｆｒ）挙動をニューラルネットワークにより推定す
る。そして、燃料噴射量算出部２３０により、この推定
された空燃比（Ａ／Ｆｎｎ）の値と目標空燃比（Ａ／Ｆ
ref）との偏差を小さくするようにフィードバック制御
を行い、目的の空燃比を実現する燃料噴射量（Ｇｂ）を
算出する。このように、通常のセンサではセンサ自体の
応答遅れ等により得ることのできない過渡状態での空燃
比（Ａ／Ｆｒ）の値を得ることにより、適正な空燃比の
制御が可能となる。

【０００８】このような制御を可能とする、上記ニュー
ロ演算部２２０に用いられるニューラルネットワークの
構成例を図２０に示す。図２０に示すように、このニュ
ーラルネットワークは、入力層としての第１層Ｌ１、中
間層としての第２層Ｌ２、出力層としての第３層Ｌ３の
３層により構成される。

【０００９】第１層Ｌ１へは入力パラメータとして図１
９の状態検出部２１０からエンジン回転数（Ｎｅ）、吸
入空気圧（Ｐｂ）、スロットル開度（ＴＨＬ）、燃料噴
射量（Ｇｆ）、吸入空気温（Ｔａ）、冷却水温（Ｔ
ｗ）、検出空燃比（Ａ／Ｆk）等が入力される。この検
出空燃比（Ａ／Ｆｋ）は制御周期において空燃比センサ
が検出した最新の空燃比である。尤も、この空燃比（Ａ
／Ｆk）はセンサの応答遅れにより真の空燃比（Ａ／Ｆ
r）の値を示してはいない。入力された各パラメータは
それぞれのシナプスＳＹにより、学習結果を反映したウ
エイト値を乗算されて第２層Ｌ２の各ニューロンＮＲで
総和が算出されたのち閾値が加算され、非線形のトラン
スファー関数により出力値に変換される。第２層Ｌ２で
変換された値は、さらにそれぞれ別のウエイト値Ｗを乗
算されて第３層Ｌ３の各ニューロンで総和がなされる。
そして、第３層Ｌ３のニューロンＮＲでこの総和がなさ
れた値に別の閾値を加算したものを別のトランスファー
関数により変換して推定空燃比（Ａ／ＦNN）の値が算出
される。

【００１０】このようなニューラルネットワークの学習
課程を図２１を用いて説明する。図２１はエンジン回転
数（Ｎｅ）等を入力パラメータとして、推定空燃比（Ａ
／ＦNN）を得るニューラルネットワークの学習過程を示
す模式図である。まず、学習データを採取するために自
動車のエンジンＥに図１９と同じ状態検出部２１０を設
けており、実際に自動車を運転し学習用のデータを採取
する。採取されたデータは学習用データ生成部２４０ａ
によりセンサの応答遅れ等を調整した学習用データに変
換される。学習用データには、教師データ用の空燃比
（Ａ／Ｆt）と、これに対応する入力パラメータ用のエ
ンジン回転数（Ｎｅ）等がある。教師データ用の空燃比
（Ａ／Ｆt）は空燃比センサにより検出された空燃比
（Ａ／Ｆk）からその検出遅れを考慮して得ることがで
きる。なお、各入力パラメータは時系列的に過去のデー
タも含めるようにすることが望ましいが、ここでは、説
明を簡略化するために過去のパラメータは入力しないも
のとしている。

【００１１】このようにして学習用データ生成部２４０
ａにより生成された学習用データは学習用データ蓄積部
２４０ｂに蓄積される。そして、学習実施部２４０ｃが
蓄積された学習用データを用いてニューラルネットワー
クＮＮの学習を行う。即ち、学習実施部２４０ｃが入力
パラメータ用のエンジン回転数（Ｎｅ）等をニューラル
ネットワークＮＮに入力し、これに応答してニューラル
ネットワークＮＮが出力する，推定された空燃比（Ａ／
ＦNN）と、教師用の空燃比（Ａ／Ｆt）との偏差ｅを差
分器２４０ｄで検出し、この偏差ｅがある許容値以内、
例えば空燃比換算で平均０．１以下となるように、バッ
クプロパゲーション法によりニューラルネットワークＮ
Ｎの構成、つまり、シナプスＳＹのウエイト値やトラン
スファー関数等を変えていく。そして、この偏差ｅがあ
る許容値以内となることにより、あるいはこのような学
習動作が規定回数に達することにより、学習を終了させ
る。

【００１２】こうして学習が終了すると、ニューラルネ
ットワークＮＮは、学習が終了した時点におけるシナプ
スＳＹのウエイト値やトランスファー関数等でもって構
成が確定されるが、この学習が終了したニューラルネッ
トワークＮＮに入力を与えると、空燃比換算で平均０．
１以下の許容値以下の誤差に収まるような空燃比を、そ
の予測値として出力することができる。

【００１３】

【発明が解決しようとする課題】従来の学習制御装置は
以上のように構成されており、この構成によれば、ニュ
ーラルネットワークの出力と教師信号の値との偏差が所
要の値より小さくなるように、ニューラルネットワーク
を学習させることが可能である。この学習を行った結
果、ニューラルネットワークは学習前とはその構成が変
更される。しかしながら、上記のようなニューラルネッ
トワークを用いた制御系では、制御性能を向上させるた
めに、ニューラルネットワークの高精度な学習を行うこ
とが不可欠となる。

【００１４】例えば、推定値を用いて目標値に追従させ
る制御を行う場合、推定値が実際の値とずれることがあ
る。この推定値が目標値に対して実際の値が存在する側
と同じ方向にずれる場合は、制御補正方向としては正し
い値を示しており、補正方向が目標値に向かうように制
御を行うため、好ましい結果が得られるが、この推定値
が目標値に対して実際の値と反対側にずれている場合
は、補正方向が逆向きとなり、目標値と離れる方向に制
御がなされてしまい、却って制御性能を劣化させてしま
うと言う問題がある。これは、空燃比制御の場合を例に
とると、推定空燃比が目標空燃比と反対側の方向にずれ
ていると、燃料をリッチにして加速しなければならない
状況であるにもかかわらず、燃料をリーンにし、エンジ
ンが停止してしまう等の問題が生じる場合である。

【００１５】また、推定精度を向上させるため上記の様
な学習をさせる際に、学習用のデータを特定の範囲に限
ってしまわないように、また、予め制御対象の動作範囲
内の学習データを揃えて学習を行うことが行われてい
る。しかし、この学習データで十分な学習を行えたか否
かは制御を行った結果からしか知ることができず、通常
は学習を行ってはこれに対する評価を行い、評価結果の
悪い領域のデータを採取しては学習データを作成し直
し、再び学習を行う、といった開発ルーチンを繰り返す
必要がある。なお、「領域」とは、少なくとも１つ以上
の入力パラメータの範囲の組み合わせから定まる，エン
ジンの運転状態を表す概念である。

【００１６】また、評価データにより評価を行った結
果、一部のデータの誤差が大きい場合、その誤差を小さ
くするためには、通常その誤差の大きい領域の学習デー
タを増加させ再学習を行う。このとき全体の学習データ
分布のバランスを取るように、即ち各領域毎の学習デー
タの個数のバランスを考えながら追加データを選定し、
再度学習データを作成しなければならない。しかしなが
ら、この選定した追加データを用いて再学習を行った結
果、前回良好な結果が得られていた領域が、今回の学習
により良好な結果が得られなくなる場合や、学習結果が
全体的に劣化する場合が生じることがある。

【００１７】このような場合、再度学習データの選定を
行わなければならず、何度もデータ採取を行い学習し直
さなければならないため、良好な結果が得られるまで多
大な時間がかかってしまう。このように、ニューラルネ
ットワークの推定精度を広範な推定領域に渡って向上さ
せるのは大変困難であり、現在、試行錯誤を行うことで
しかこれを解決することができない。

【００１８】本発明は、上記のような従来のものの問題
点を解決するためになされたもので、ニューラルネット
ワーク出力値を用い目標値に追従する制御量を算出する
学習制御装置および学習制御方法において、高精度に追
従制御が可能な推定値が得られるような高精度な学習を
実現でき、また、他の領域に影響を与えることなく推定
精度の悪い領域の推定精度をのみを再学習により向上で
き、的確かつ効率的に学習ができる学習制御装置および
学習制御方法を得ることを目的とする。

【００１９】

【課題を解決するための手段】上記課題を解決するため
に、本願の請求項１の発明に係る学習制御装置は、推定
対象パラメータに関連する複数の入力パラメータ値の入
力を受け、この入力パラメータ値から推定対象パラメー
タ値を推定し、この推定値を目標値追従制御量演算に用
いるためのニューラルネットワークと、ニューロ推定値
と教師信号との二乗誤差に対し乗算すべき重み係数の値
を、ニューロ推定値と教師信号と目標値との相対関係に
応じて変更する誤差係数変更手段と、前記重み係数を用
いて学習時の評価関数を演算する評価関数演算手段とを
備え、前記評価関数に基づき前記ニューラルネットワー
クの学習を行うようにしたものである。

【００２０】また、本願の請求項２の発明に係る学習制
御方法は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、受け付けた入力パラメータ値
からニューラルネットワークにより推定対象パラメータ
値を推定し、この推定値を目標値追従制御量演算に用い
る際のニューラルネットワークの学習制御を行なう方法
において、ニューロ推定値と教師信号との二乗誤差に対
し乗算すべき重み係数の値を、ニューロ推定値と教師信
号と目標値との相対関係に応じて変更し、前記重み係数
を用いて学習時の評価関数を演算し、前記評価関数に基
づき前記ニューラルネットワークの学習を行うようにし
たものである。

【００２１】また、本願の請求項３の発明に係る学習制
御装置は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、この入力パラメータ値から推
定対象パラメータ値を推定し、この推定値を目標値追従
制御量演算に用いるためのニューラルネットワークと、
ニューロ推定値と目標値との偏差の符号の種類を判定す
る推定偏差符号判定手段と、教師信号と目標値との偏差
の符号の種類を判定する教師偏差符号判定手段と、前記
推定偏差符号判定手段および教師偏差符号判定手段によ
り判定されたそれぞれの符号の種類を比較する符号比較
手段と、前記符号比較手段により符号が異なると判別さ
れた場合、前記ニューロ推定値と前記教師信号との二乗
誤差に乗じるべき重み係数の値を大きくする二乗誤差係
数変更手段と、前記重み係数を用いて学習時の評価関数
を演算する評価関数演算手段とを備え、前記評価関数に
基づき前記ニューラルネットワークの学習を行うように
したものである。

【００２２】また、本願の請求項４の発明に係る学習制
御装置は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、この入力パラメータ値から推
定対象パラメータ値を推定し、この推定値を目標値追従
制御量演算に用いるためのニューラルネットワークと、
ニューロ推定値と目標値との偏差の符号の種類を判定す
る推定偏差符号判定手段と、前記ニューロ推定値と前記
目標値との偏差の絶対値を算出する推定偏差絶対値算出
手段と、教師信号と目標値との偏差の符号の種類を判定
する教師偏差符号判定手段と、前記教師信号と前記目標
値との偏差の絶対値を算出する教師信号偏差絶対値算出
手段と、前記推定偏差符号判定手段および教師信号偏差
符号判定手段により判定されたそれぞれの符号の種類を
比較する符号比較手段と、前記推定偏差絶対値算出手段
および教師信号偏差絶対値算出手段により算出された絶
対値の大小を比較する絶対値比較手段と、前記符号比較
手段により符号の種類が同じであると判別され、かつ前
記絶対値比較手段により前記ニューロ推定値と前記目標
値との偏差の絶対値の方が前記教師信号と前記目標値と
の偏差の絶対値よりも小さいと判定された場合、前記ニ
ューロ推定値と前記教師信号との二乗誤差に乗ずるべき
重み係数の値を大きくする二乗誤差係数変更手段と、前
記重み係数を用いて学習時の評価関数を演算する評価関
数演算手段とを備え、前記評価関数に基づき学習を行う
ようにしたものである。

【００２３】また、本願の請求項５の発明に係る学習制
御装置は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、この入力パラメータ値から推
定対象パラメータ値を推定し、この推定値を目標値追従
制御量演算に用いるための，それぞれの学習条件に対応
した複数のニューロ構成を有するニューラルネットワー
クと、制御対象の動特性に関連する状態量を検出する状
態量検出手段と、前記検出値に基づき前記ニューラルネ
ットワークの学習条件を判定する学習条件判定手段と、
前記状態量に基づき前記ニューラルネットワークのニュ
ーロ構成の中から現在の条件に対応するニューロ出力値
のみを選択するニューロ選択手段とを備えるようにした
ものである。

【００２４】また、本願の請求項６の発明に係る学習制
御装置は、請求項５記載の学習制御装置において、前記
ニューロ選択手段は、現在の状態量がある学習条件を満
たす場合、その条件に対応するニューロ出力に“１”
を、それ以外のニューロ出力には“０”となるステップ
関数を乗ずることによりニューロ出力を選択するものと
したものである。

【００２５】また、本願の請求項７の発明に係る学習制
御装置は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、この入力パラメータ値から推
定対象パラメータ値を推定し、この推定値を目標値追従
制御量演算に用いるための，それぞれの学習条件に対応
した複数のニューロ構成を有するニューラルネットワー
クと、制御対象の動特性に関連する状態量を検出する状
態量検出手段と、前記検出値に基づき前記ニューラルネ
ットワークの学習条件を判定する学習条件判定手段と、
それぞれのニューロ構成の結合係数を学習した学習デー
タセットを格納している学習データ格納手段と、前記状
態量に基づき前記学習条件毎の学習データを作成する学
習データ作成手段と、前記学習データ格納手段で格納さ
れている条件に対応する学習データセットと前記学習デ
ータ作成手段で新たに作成された学習データとを用いニ
ューロ結合係数の学習を行う学習手段と、前記条件に対
応するニューロ構成を選択し前記学習結果である結合係
数に更新する係数更新ニューロ選択手段とを備えるよう
にしたものである。

【００２６】また、本願の請求項８の発明に係る学習制
御装置は、請求項７記載の学習制御装置において、前記
学習手段において実際の学習に用いられる学習データセ
ットは、最新の学習データセットと同数分、古い学習デ
ータセットを消去し更新したものであり、前記学習デー
タセットは常に一定のセット数であるようにしたもので
ある。

【００２７】また、本願の請求項９の発明に係る学習制
御装置は、請求項７または８記載の学習制御装置におい
て、前記学習データ格納手段において、格納されている
学習データセットは、ニューロ演算処理を行うニューラ
ルネットワーク自体が学習対象となっているオンライン
状態において常に更新されている学習データセットであ
る。

【００２８】また、本願の請求項１０の発明に係る学習
制御装置は、推定対象パラメータに関連する複数の入力
パラメータ値の入力を受け、この入力パラメータ値から
推定対象パラメータ値を推定し、この推定値を目標値追
従制御量演算に用いるための，それぞれの学習条件に対
応した複数のニューロ構成を有するニューラルネットワ
ークと、制御対象の動特性に関連する状態量を検出する
状態量検出手段と、前記検出値に基づき学習条件を判定
する学習条件判定手段と、それぞれのニューロ構成の結
合係数を学習した学習データセットを格納している学習
データ格納手段と、前記状態量に基づき前記学習条件毎
の新しい学習データを作成する学習データ作成手段と、
前記学習データ格納手段で格納されている前記学習条件
に対応する全てのニューロ構成の学習データセットと前
記学習データ作成手段で新たに作成された学習データと
を用い、それぞれのニューロ構成に対する学習データセ
ットを作成する学習データセット作成手段と、前記学習
データ格納手段内の対応するデータをこの新たに作成さ
れた学習データセットに更新する学習データ更新手段
と、前記新たに作成された学習データセットを用い前記
学習条件に対応する全てのニューロ結合係数の学習を行
う学習手段と、前記対応する全てのニューロ構成を選択
し前記学習結果である結合係数に更新する係数更新ニュ
ーロ選択手段と、前記学習条件に対応する全てのニュー
ロ構成を選択するニューロ構成選択手段と、前記対応す
る全てのニューロ出力から制御を行う際に用いるニュー
ロ推定値を算出する推定値算出手段とを備え、前記推定
値を制御量演算に用いるようにしたものである。

【００２９】また、本願の請求項１１の発明に係る学習
制御装置は、請求項１０記載の学習制御装置において、
前記ニューラルネットワークにおける，隣り合う条件下
におけるニューロ構成は、共通の制御対象動特性の表現
部分を持つようにしたものである。

【００３０】また、本願の請求項１２の発明に係る学習
制御装置は、請求項１０または１１記載の学習制御装置
において、前記推定値算出手段は、対応する全てのニュ
ーロ出力値の平均値を、制御で用いるニューロ推定値と
して算出するようにしたものである。

【００３１】

【発明の実施の形態】以下、図面を参照しながら本発明
の実施の形態について説明する。

【００３２】（実施の形態１）ニューロ出力値を用いて
目標値追従制御を行う際、ニューロ推定値と推定対象パ
ラメータ値との誤差によっては、良好な目標値制御を行
うことができなくなることがある。本実施の形態１は、
ニューロ推定値を用いた制御性能の向上を図るべく、ニ
ューロ学習時に目標値を考慮に入れた高精度の学習制御
を行うようにしたものである。

【００３３】すなわち、従来例のように、ニューロ推定
値と推定対象パラメータ値の差の絶対値を小さくするこ
とのみを考慮すれば、却って制御性能を劣化させること
があるが、本実施の形態１では、推定値と目標値のずれ
の方向に着目し、制御の方向がこれに一致するような学
習を行うようにしたものである。

【００３４】図１に本願発明の実施の形態１による学習
制御装置の機能ブロック図を示す。図において、１１は
エンジン等の制御対象、１２はこの制御対象１１より得
られるパラメータＹに対しニューロ演算を行い推定値Ｙ
ｎｎを出力するニューロ演算手段、１３はこの制御対象
の制御目標値Ｙｒｅｆを算出する目標値算出手段、１４
はニューロ演算手段１２および目標値算出手段１３の演
算結果に基づいて制御対象１１の制御量Ｕを演算する制
御量演算手段、１５は制御対象１１および目標値算出手
段１３より得られるパラメータに基づきニューロ演算手
段１２を学習させるニューロ学習手段、１６はこのニュ
ーロ学習手段１５に内蔵され誤差係数を変更する誤差係
数変更手段、１７はこの誤差係数変更手段１６によりニ
ューロ演算手段１２の結合係数Ｗを書き換える結合係数
書き換え手段である。

【００３５】次に動作について説明する。制御対象１１
より推定対象パラメータＹに関連する複数の入力パラメ
ータ値の入力を受け付け、受け付けた入力パラメータ値
からニューロ演算手段１２により推定対象パラメータ値
を推定し、目標値算出手段１３により制御対象１１の状
態に応じた制御目標値Ｙｒｅｆを算出し、前記推定値Ｙ
ｎｎを前記目標値Ｙｒｅｆに追従制御させる制御量Ｕを
得る演算を制御量演算手段１４で行う。

【００３６】前記ニューロ演算手段１２のニューロ結合
係数Ｗはニューロ学習手段１５内の誤差係数変更手段１
６により、前記目標値Ｙｒｅｆを考慮に入れた学習によ
り算出され、結合係数書き換え手段１７により書き換え
られる。前記誤差係数変更手段１６では、学習時に用い
るニューロ推定値と教師信号との誤差評価関数の重み係
数αを、ニューロ推定値と教師信号と目標値との相対位
置関係に応じて変更し、ニューロ学習手段１５により、
この重み係数αを用いた評価関数に基づき結合係数の学
習を行う。

【００３７】図２に従来のニューロ学習フロー図を、図
３に本実施の形態１におけるニューロ学習フロー図を示
し、これらを用いて、本実施の形態１によるニューロ学
習を従来例におけるものと対比しながら説明する。従来
のニューロ学習は、先ず、実データを用いて、ニューロ
入力データ列ＩＮＰおよびこれに対応する教師信号Ｙｔ
のセットである学習データセットを作成し（ステップ２
０１）、前記ニューロ入力データ列ＩＮＰｉを用いニュ
ーロ推定値Ｙｎｎ（ｉ）を算出し（ステップ２０２）、
前記教師信号Ｙｔ（ｉ）と前記ニューロ推定値Ｙｎｎ
（ｉ）との誤差ｅ（ｉ）に基づく評価関数Ｅ（＝Σｅ²
／２）を算出し（ステップ２０３）、前記評価関数Ｅを
減少させるべくニューロ結合係数を更新する（ステップ
２０４）。そして、更新された結合係数を用いて評価関
数Ｅｎｅｗを算出し、目標精度を達成しているか否かを
判定し（ステップ２０５）、達成していなければステッ
プ２０２に戻り学習を進めてゆき、達成した時点で学習
が終了となる。

【００３８】これに対し、本実施の形態１では、ステッ
プ２０１で学習データセットを作成し、ステップ２０２
でニューロ推定値Ｙｎｎ（ｉ）を算出し、ステップ３０
１で前記教師信号Ｙｔ（ｉ）、推定値Ｙｎｎ（ｉ）、制
御目標値Ｙｒｅｆ（ｉ）より誤差評価関数の重み係数α
（ｉ）を決定し、ステップ３０２により前記Ｙｔ（ｉ）
とＹｎｎ（ｉ）との誤差ｅ（ｉ）と前記重み係数α
（ｉ）を用い評価関数Ｅ’を算出し、ステップ３０３に
より前記評価関数Ｅ’を減少させるべくニューロ結合係
数を更新する。ステップ３０４において、更新された結
合係数を用いて評価関数Ｅ’ｎｅｗを算出し目標精度を
達成しているか否かを判定し、達成していなければステ
ップ２０２に戻り学習を進めてゆき、目標精度を達成し
た時点で学習が終了となる。

【００３９】すなわち、従来の学習フローでは、図２４
に示すように、単に、ニューロ推定値と目標値との差の
絶対値が小さくなることのみを規範として学習制御を行
っているため、学習後のニューロはニューロ推定値と目
標値との位置関係によっては、目標より遠ざかる方向に
制御を進めてしまい、却って制御性能を劣化させてしま
うことがあった。

【００４０】これに対し、本実施の形態１の学習フロー
によれば、図２５に示すように、たとえ、絶対値が小さ
くても、目標より遠ざかる方向に制御を進めてしまう方
向に対しては誤差評価関数の重み係数αの値をより大き
くし、目標に近づく方向に制御を行う方向に対してはこ
の重み係数αの値をより小さくすることにより、いかな
る場合でも目標に近づく方向に制御を行うような学習を
行うようにしている。このため、フェールセーフな制御
を行うように学習を行うことが可能となり、オンライン
で学習を行う場合でも、常に安全な方向に制御を行うよ
うに学習を制御することが可能となる。

【００４１】図４に図１のニューロ学習手段１５内の処
理機能のブロック図を示す。図において、４１は学習デ
ータセットを作成する学習データセット作成部、４２は
この学習データセットに基づき推定値を算出する推定値
算出部、４３はこの推定値に基づき評価関数を算出する
評価関数算出部、４４はこの評価関数に基づき係数を更
新する係数更新部、４５は推定値に基づき誤差評価を行
う誤差評価部、１６は学習データセット、推定値および
目標値に基づき誤差係数を変更する誤差係数変更手段で
ある。

【００４２】次に動作について説明する。学習データセ
ット作成部４１は制御対象からの複数のパラメータおよ
び制御対象の目標値Ｙに基づき学習データセットを作成
する。推定値算出部４２はこの学習データセット作成部
４１により作成された学習データセットおよび係数更新
部４４からの重み係数Ｗに基づき推定値を算出する。誤
差係数変更手段１６はこの学習データセット作成部４１
からの学習データセット、推定値算出部４２からの推定
値Ｙｎｎ及び図１の目標値算出手段１３からの目標値Ｙ
ｒｅｆに基づき誤差係数αを変更する。そして、誤差関
数算出部４３はこの誤差係数変更手段１６からの誤差係
数α、学習データセット作成部４１からの学習データセ
ットＹｔ、推定値算出部４２からの推定値Ｙｎｎに基づ
き誤差評価関数Ｅを算出し、係数更新部４４はこの評価
関数算出部４３からの誤差評価関数Ｅに基づき重み係数
Ｗを更新する。そして、推定値算出部４２はこの学習デ
ータセット作成部４１からの学習データセットＹｔおよ
び係数更新部４４からの重み係数Ｗに基づき推定値Ｙｎ
ｎを算出し、誤差評価部４５はこの推定値算出部４２か
らの推定値Ｙｎｎに基づき誤差評価を行った重み付けを
結合係数書き換え手段１７に出力する。

【００４３】本実施の形態１によれば、上記構成とする
ことにより、目標値と推定値のずれの方向を考慮に入れ
た学習を行うことが可能となり、ニューロ推定値を用い
た目標値追従制御の制御性能を、従来の学習方式に比べ
向上させることが可能となる。

【００４４】なお、上記制御装置はオンラインで学習を
行う構成としたが、オフラインで予め目標値を考慮に入
れた上記学習フローによりニューロ結合係数を算出して
おき、図５に示すニューロ演算手段５１内の結合係数と
してＲＯＭに書き込んだ構成で制御を行っても、上記と
同様の効果を得ることができる。

【００４５】また、上記の実施の形態１では、ニューロ
の出力が制御対象の出力となる，いわゆる順方向ニュー
ロ構成であり、学習制御装置におけるニューロ推定対象
パラメータは、これが目標値となるように制御したいパ
ラメータとしたが、図６に示すようにニューロ出力が制
御対象への入力となる、即ち制御対象の逆システムを学
習する，いわゆる逆方向ニューロ構成としても良い。逆
方向ニューロ構成においての学習も、前述と同様に目標
値Ｙｒｅｆを考慮に入れた出力誤差評価関数に基づき、
学習を行うことにより、目標値追従制御の制御性能を従
来の学習に比べ向上させることが可能となる。

【００４６】以下では、ニューロ推定値を用いて目標値
追従制御を行う場合の、ニューロ学習方法の一例につい
て具体的に示す。図７に本願発明の実施の形態１による
学習制御装置の誤差係数変更手段の具体的な構成に関す
る機能ブロック図を示す。図７において、７１はニュー
ロ推定値Ｙｎｎと目標値Ｙｒｅｆとの偏差ｅ１の符号を
判定する推定偏差符号判定手段、７２は教師信号Ｙｔと
目標値Ｙｒｅｆとの偏差ｅ２の符号を判定する教師偏差
符号判定手段、７３はそれぞれの符号を比較する符号比
較手段、７４は前記符号比較手段７３により偏差ｅ１と
ｅ２の符号が異なると判別された場合、前記ニューロ推
定値Ｙｎｎと前記教師信号Ｙｔとの二乗誤差ｅ²に掛か
る重み係数αを大きくする二乗誤差係数変更手段、７５
は前記重み係数αを用いて学習時の評価関数Ｅを演算
し、この評価関数Ｅに基づきニューロ結合係数を修正す
る結合係数修正手段であり、図７の学習制御装置はこれ
ら推定偏差符号判定手段７１，教師偏差符号判定手段７
２，符号比較手段７３，二乗誤差係数変更手段７４，お
よび結合係数修正手段７５を有する構成とする。

【００４７】図９にこの図７の学習制御装置の処理フロ
ーを示す。まず、ステップ９０１において、前記Ｙｎｎ
と前記Ｙｒｅｆとの差ｅ１の符号ｓｉｇｎ（ｅ１）を判
定し、次にステップ９０２により前記ＹｔとＹｒｅｆと
の差ｅ２の符号ｓｉｇｎ（ｅ２）を判定する。ステップ
９０３により、前記符号ｓｉｇｎ（ｅ１）とｓｉｇｎ
（ｅ２）の符号が同じ種類かどうかを比較し、ステップ
９０４により、前記比較結果において符号が異なる場
合、前記αにａを、符号が同じ場合はｂを与え（但しａ
＞ｂ＞０とする）、ステップ９０５において、前記Ｙｔ
とＹｎｎとの推定誤差ｅと前記αとにより評価関数Ｅを
算出し、このＥを用い、バックプロパゲーション法等に
よりニューロ結合係数Ｗの修正量△Ｗを演算する。

【００４８】図１０は、学習データにおける教師信号Ｙ
ｔと目標値Ｙｒｅｆとニューロ推定値Ｙｎｎとの位置関
係を示す模式図である。図９のフローにより、図１０
（ａ）に示すように、目標値Ｙｒｅｆに対してＹｔとＹ
ｎｎがそれぞれ反対側にある場合には、αを大きく与
え、図１０（ｂ）に示すように、目標値Ｙｒｅｆに対し
ＹｔとＹｎｎが同じ側にある場合、αを前記（ａ）の状
態で与えた値に比べ小さく設定する。

【００４９】以上の構成で学習を行うことにより、目標
値に対し反対側の推定値を算出する結合係数の場合は、
より修正が進み、推定値が目標値に対し同じ側に来るよ
うに学習が進む。この様に学習されたニューロを用い目
標値となる制御量を算出することにより、逆方向に補正
量を演算してしまうことが少なくなり、制御機能を向上
させることが可能となる。このため、制御結果がフェー
ルセーフとなるような学習を行うことが可能となり、し
たがって、オンラインで学習を行う場合であっても、そ
の学習結果を用いて制御を行う場合に目標値に対し同方
向の推定値を算出することが可能となる。

【００５０】以下では、ニューロ推定値を用いて目標値
追従制御を行う場合の、ニューロ学習方法の他の例につ
いて示すものである。図８に本願発明の実施の形態１に
よる学習制御装置の誤差係数変更手段の具体的な構成に
関する機能ブロック図を示す。図８において、７１はニ
ューロ推定値Ｙｎｎと目標値Ｙｒｅｆとの偏差ｅ１の符
号を判定する推定偏差符号判定手段、７２は教師信号Ｙ
ｔと目標値Ｙｒｅｆとの偏差ｅ２の符号を判定する教師
偏差符号判定手段、７３はそれぞれの偏差ｅ１とｅ２の
符号を比較する符号比較手段、８１は前記ニューロ推定
値Ｙｎｎと前記目標値Ｙｒｅｆとの偏差ｅ１の絶対値を
算出する推定偏差絶対値算出手段、８２は前記教師信号
Ｙｔと前記目標値Ｙｒｅｆとの偏差ｅ２の絶対値を算出
する教師信号偏差絶対値算出手段、８３はそれぞれの絶
対値量を比較する絶対値比較手段、８４は前記符号比較
手段７３により符号が同じ種類であると判別され、且つ
前記絶対値比較手段８３により前記ニューロ推定値Ｙｎ
ｎと前記目標値Ｙｒｅｆとの偏差ｅ１の絶対値の方が前
記教師信号Ｙｔと前記目標値Ｙｒｅｆとの偏差ｅ２の絶
対値よりも小さいと判別された場合、前記ニューロ推定
値Ｙｎｎと前記教師信号Ｙｔとの二乗誤差ｅ²に掛かる
重み係数αを大きくする二乗誤差係数変更手段、７５は
前記重み係数αを用いて学習時の評価関数Ｅを演算し、
この評価関数Ｅに基づきニューロ結合係数を修正する結
合係数修正手段であり、この図８の学習制御装置はこれ
ら推定偏差符号判定手段７１，教師偏差符号判定手段７
２，符号比較手段７３，推定偏差絶対値算出手段８１，
教師信号偏差絶対値算出手段８２，絶対値比較手段８
３，二乗誤差係数変更手段８４，および結合係数修正手
段７５を有する構成とする。

【００５１】図１１にこの図８の学習制御装置の処理フ
ローを示す。まず、ステップ１１０１において、前記Ｙ
ｎｎと前記Ｙｒｅｆとの差ｅ１の符号ｓｉｇｎ（ｅ１）
を判定し、ステップ１１０２により前記ＹｔとＹｒｅｆ
との差ｅ２の符号ｓｉｇｎ（ｅ２）を判定する。またス
テップ１１０３により前記偏差ｅ１の絶対値ａｂｓ（ｅ
１）を算出し、ステップ１１０４により前記偏差ｅ２の
絶対値ａｂｓ（ｅ２）を算出する。ステップ１１０５に
より、前記符号ｓｉｇｎ（ｅ１）とｓｉｇｎ（ｅ２）の
符号が同符号かどうかを比較し、ステップ１１０６によ
り、前記比較結果において符号が異なる場合、前記重み
係数αにａを与える。また前記比較結果において符号が
同符号の場合、ステップ１１０７により、前記偏差の絶
対値ａｂｓ（ｅ１）とａｂｓ（ｅ２）の大小を判定し、
ステップ１１０８により、前記判定結果においてａｂｓ
（ｅ１）の方がａｂｓ（ｅ２）よりも小さい場合、前記
重み係数αにｂ１を、逆の場合はｂ２を与え（但しａ＞
ｂ１（＞１＞）＞ｂ２＞０とする）、ステップ１１０９
において、前記ＹｔとＹｎｎとの推定誤差ｅと前記αと
により評価関数Ｅを算出し、このＥを用い、バックプロ
パゲーション法等によりニューロ結合係数Ｗの修正量△
Ｗを演算する。

【００５２】図１２は、学習データにおける教師信号Ｙ
ｔと目標値Ｙｒｅｆとニューロ推定値Ｙｎｎとの位置関
係を示す模式図である。図１２（ａ）に示すように目標
値Ｙｒｅｆに対してＹｔとＹｎｎが同じ側にあり、かつ
ａｂｓ（ｅ１）＜ａｂｓ（ｅ２）の場合、αを大きく与
え、図１２（ｂ）に示すように目標値Ｙｒｅｆに対しＹ
ｔとＹｎｎが同じ側にあり、かつａｂｓ（ｅ１）≧ａｂ
ｓ（ｅ２）の場合、αを前記（ａ）の状態で与えた値に
比べ小さく設定する。

【００５３】以上の構成で学習を行うことにより、目標
値に対し反対側の推定値を算出する結合係数の場合は、
より修正が進み、また同じ側にあっても、推定値が目標
値寄りにある場合、次回に、修正係数を用いた結果が目
標値とは反対側に移行するのを防ぎ、推定値が目標値に
対し常に同じ側に来るように学習収束する速度を早める
ことが可能となる。この様に学習されたニューロを用い
目標値となる制御量を算出することにより、本来の方向
とは逆方向に補正量を演算してしまうと言うことが少な
くなり、制御性能を向上させることが可能となる。

【００５４】このため、フェールセーフな学習が可能と
なり、したがって、オンラインで学習を行う場合であっ
ても、その学習結果を用いて制御を行う場合に目標値に
対し同方向の推定値を算出することが可能となる。な
お、ａｂｓ（ｅ１）の値に応じてαに与える値を変化さ
せる構成としても良く、例えば、ａｂｓ（ｅ１）がゼロ
に近づくに連れてｂの値をａに近づけていく構成として
も良く、所望の推定結果を早く得ることが可能となる。

【００５５】（実施の形態２）ところで、ある条件下で
採取されたデータに基づいて学習されたニューロの出力
値を用いて制御を行う場合、時間と共に制御対象の動特
性が変わる等、初期の条件下における挙動と異なる挙動
になる場合があり、この場合所望の制御性能を確保する
ことができなくなると言う問題がある。本実施の形態２
は、このような問題を解決するために、簡単な構成で分
割学習を行いうる構成を与えるものである。

【００５６】図１３に本願発明の実際の形態２による学
習制御装置の機能ブロック図を示す。図１３において、
１３１は制御対象１１の動特性に関連する状態量Ｙを検
出する状態量検出手段、１３２は前記検出値に基づき学
習条件を判定する学習条件判定手段、１３４はそれぞれ
の学習条件に対応したニューラルネットワークＮＮ１な
いしＮＮｍからなるニューロ構成を有するニューロ演算
手段、１３３は前記状態量に基づき現在の条件に対応す
るニューロ出力値のみを選択するニューロ選択手段、１
３は前記制御対象１１の状態に応じた制御目標値Ｙｒｅ
ｆを算出する目標値算出手段、１４は前記ニューロ選択
手段１３３で選択されたニューロ構成で演算したニュー
ロ推定値Ｙｎｎと、前記制御目標値Ｙｒｅｆより前記推
定値Ｙｎｎを前記目標値Ｙｒｅｆに追従制御させる制御
量Ｕを算出する制御量演算手段であり、本学習制御装置
はこれら状態量検出手段１３１、学習条件判定手段１３
２、ニューロ演算手段１３４、ニューロ選択手段１３
３、ニューロ演算手段１３４、目標値算出手段１３およ
び制御量演算手段１４を有する構成とする。

【００５７】なお、前記ニューロ選択手段１３３は、現
在の状態量が、ある学習条件を満たす場合、その条件に
対応するニューロ出力に“１”を、それ以外のニューロ
出力には“０”となるステップ関数を掛ける構成として
おり、これにより、システムの構成を簡略化できる。

【００５８】図１４は、一つの検出値により学習条件を
設定した場合のニューロ学習領域の概念を図示したもの
である。制御対象の動特性をニューロで表現する場合、
前記状態量検出手段１３１で検出された値に応じて学習
条件全体を幾つかの学習条件に分割し、その条件内の学
習データを用い、各々のニューロ（ＮＮ１〜ＮＮｋ〜Ｎ
Ｎｍ）を学習する。

【００５９】図１５に、前記ニューロ選択手段１３３お
よびニューロ演算手段１３４の一構成例を示す。図１５
に示すように、ニューロ選択手段１３３は条件１から条
件ｍに対応する出力ポートを有し、前記状態量検出手段
１３１の検出値に対応する条件ｋの出力をＨｉｇｈ（＝
“１”）とし、それ以外はＬｏｗ（＝“０”）とする。
これらの出力値を、前記ニューロ演算手段１３４は入力
データ列作成部１３４ａにより作成された入力データ列
に対し、各ニューロＮＮ１ないしＮＮｍで演算された出
力値に対し、乗算器ｍ１ないしｍｍにより対応するニュ
ーロ選択手段１３３の出力を掛け、その和を加算器１３
４ｂで得ることにより、対応する条件下のみのニューロ
構成を選択することができる。なお、上記構成では全て
のニューロを演算対象としているが、演算処理負荷を低
減させるため、前記ニューロ選択手段１３３で選択され
たニューロ構成のみ演算する構成としても良い。

【００６０】このように、本実施の形態２によれば、以
上のような構成とし、動特性が変化した条件に対応する
ニューロ構成のみを再学習することにより、性能劣化を
防ぐことができ、全ての条件に関してニューラルネット
ワークの学習をし直した場合に、却って制御精度が低下
するという問題を、容易に解消し得るものが得られる。

【００６１】（実施の形態３）本実施の形態３は、オン
ラインで上記実施の形態２の分割学習を行うことができ
る学習制御装置を提供せんとするものである。図１６に
本願発明の実施の形態３による学習制御装置の機能ブロ
ック図を示す。図１６において、１３１は制御対象１１
の動特性に関連する状態量を検出する状態量検出手段、
１３２は前記検出値に基づき学習条件を判定する学習条
件判定手段、１６４はそれぞれの学習条件に対応したニ
ューロ構成を有するニューロ演算手段、１６５はそれぞ
れのニューロ構成の結合係数を学習した学習データセッ
トを格納している学習データ格納手段、１６１は前記状
態量に基づき前記学習条件毎の新しい学習データを作成
する学習データ作成手段、１６２は前記学習データ格納
手段１６５で格納されている条件に対応する学習データ
セットと前記学習データ作成手段１６１で新たに作成さ
れた学習データとを用いニューロ結合係数の学習を行う
学習手段、１６３は対応するニューロ構成の結合係数
を、学習結果である結合係数に更新する係数更新ニュー
ロ選択手段であり、本学習制御装置はこれら状態量検出
手段１３１、学習条件判定手段１３２、学習データ作成
手段１６１、学習手段１６２、係数更新ニューロ選択手
段１６３、ニューロ演算手段１６４、学習データ格納手
段１６５により構成されている。

【００６２】図１５に示すように、ニューロ選択手段１
３３は条件１から条件ｍに対応する出力ポートを有し、
前記状態量検出手段１３１の検出値に対応する条件ｋの
出力をＨｉｇｈ（＝“１”）とし、それ以外はＬｏｗ
（＝“０”）とする。これらの出力値を、前記ニューロ
演算手段１３４は入力データ列作成部１３４ａにより作
成された入力データ列に対し、各ニューロＮＮ１ないし
ＮＮｍで演算された出力値に対し、乗算器ｍ１ないしｍ
ｍにより対応するニューロ選択手段１３３の出力を掛
け、その和を加算器１３４ｂで得ることにより、対応す
る条件下のみのニューロ構成を選択することができる。

【００６３】次に動作について説明する。本学習制御装
置は、上述の実施の形態２の学習制御装置と同様の動作
により、ニューロ選択手段１３３が、現在の状態量が、
ある学習条件を満たす場合、その条件に対応するニュー
ロ出力に“１”を、それ以外のニューロ出力には“０”
となるステップ関数を掛けることにより、ニューロ演算
手段１６４の中から対象となるニューラルネットワーク
を選択する。

【００６４】そして、このように選択された，分割学習
の対象となるべきニューラルネットワークのみに対し、
学習データ作成手段１６１がその学習用のデータを作成
する。すなわち、実施の形態１と同様、制御対象１１よ
り推定対象パラメータＹに関連する複数の入力パラメー
タ値の入力を受け付け、受け付けた入力パラメータ値か
らニューロ演算手段１６４により推定対象パラメータ値
を推定し、目標値算出手段１３により制御対象１１の状
態に応じた制御目標値Ｙｒｅｆを算出し、前記推定値Ｙ
ｎｎを前記目標値Ｙｒｅｆに追従制御させる制御量Ｕを
制御量演算手段１４で演算する。前記ニューロ演算手段
１６４のニューロ結合係数Ｗは学習手段１６２により算
出され、対象となる条件に対応したニューラルネットワ
ークが選択されるとともに、その重み係数が係数更新ニ
ューロ選択手段１６３により書き換えられる。

【００６５】なお、この係数更新ニューロ選択手段１６
３は、実施の形態１と同様、誤差係数変更手段を設け
て、学習時に用いるニューロ推定値と教師信号との誤差
評価関数の重み係数αを、ニューロ推定値と教師信号と
目標値との相対位置関係に応じて変更し、学習手段１６
２により、この重み係数αを用いた評価関数に基づき結
合係数の学習を行うようにしてもよく、これにより、対
象となる条件に対応したニューラルネットワークを、フ
ェールセーフな制御を行うように学習させることが可能
となる。前記学習手段１６２において実際の学習に用い
られる学習データセットは、最新の学習データセットと
同数分、古い学習データセットを消去したものであり、
従って、学習データセットの総数は常に一定のセット数
である。この更新された学習データセットは前記学習デ
ータ格納手段１６５に再度格納される。

【００６６】本実施の形態３によれば、以上のような構
成とすることにより、動特性が変化しニューロ推定精度
が劣化した場合でも、対応する条件下のニューロのみに
限って学習を行う，分割学習をオンラインで行うことが
でき、良好な制御を達成できる。

【００６７】（実施の形態４）本実施の形態４は、複数
の条件に跨り動特性が変化した場合のニューロ制御のつ
ながりを滑らかにするように構成したものである。図１
７に本願発明の実施の形態４による学習制御装置の機能
ブロック図を示す。図１７において、１３１は制御対象
１１の動特性に関連する状態量を検出する状態量検出手
段、１３２は前記検出値に基づき学習条件を判定する学
習条件判定手段、１７６はそれぞれの学習条件に対応し
たニューロ構成を有するニューロ演算手段、１６５はそ
れぞれのニューロ構成の結合係数を学習した学習データ
セットを格納している学習データ格納手段、１６１は前
記状態量に基づき前記学習条件毎の新しい学習データを
作成する学習データ作成手段、１７１は前記学習データ
格納手段１６５で格納されている前記学習条件に対応す
る全てのニューロ構成の学習データセットと前記学習デ
ータ作成手段１６１で新たに作成された学習データとを
用い、それぞれのニューロ構成に対する学習データセッ
トを作成する学習データセット作成手段、１７７は前記
学習データ格納手段１６５内の対応するデータをこの新
たに作成された学習データセットに更新する学習データ
更新手段、１７２はこの新たに作成された学習データセ
ットを用い前記学習条件に対応する全てのニューロ結合
係数の学習を行う学習手段、１７３は対応する全てのニ
ューロ構成を選択し前記学習結果である結合係数に更新
する係数更新ニューロ選択手段、１７４は前記学習条件
に対応する全てのニューロ構成を選択するニューロ構成
選択手段、１７５は対応する全てのニューロ出力から制
御の際に用いるニューロ推定値を算出する推定値算出手
段である。

【００６８】この図１７の学習制御装置は、これら状態
量検出手段１３１，学習条件判定手段１３２，ニューロ
演算手段１７６，学習データ格納手段１６５，学習デー
タ作成手段１６１，学習データセット作成手段１７１，
学習データ更新手段１７７，学習手段１７２，係数更新
ニューロ選択手段１７３，ニューロ構成選択手段１７
４，推定値算出手段１７５を有し、推定値算出手段１７
５により得られた推定値を制御量演算に用いる構成とす
る。

【００６９】次に動作について説明する。本学習制御装
置は、実施の形態３の装置と同様に学習を行うが、学習
条件判定手段１３２が判定した学習条件に基づき、ニュ
ーロ選択手段１７４がニューラルネットワークを選択す
る。推定値算出手段１７５は、条件に応じて選択したニ
ューラルネットワークから出力される推定値に基づい
て、隣合う条件における区間の境界付近で互いの区間に
跨る区間については、両方の区間の推定値に基づいた推
定値、例えばその平均値、を作成し、制御量演算手段１
４はこの新たな推定値をも参照し、目標値算出手段１３
から出力される目標値に向かうように制御対象１１に対
し制御量を出力する。

【００７０】状態量検出手段１３１はこの制御対象の状
態量を検出し、学習条件判定手段１３２はこの状態量に
基づいて、学習条件を判定するとともに、これを学習デ
ータ格納手段１６５に格納する。学習データ作成手段１
６１は、この学習条件判定手段１３２によって判定され
た学習条件に基づき学習データを作成するが、本実施の
形態４では、この学習データに基づき、条件に応じた学
習データセットを作成する。学習手段１７２はこの学習
データセットに基づき、ニューロ演算手段１７６の学習
を進める。係数更新ニューロ選択手段１７３はこの学習
手段１７２により算出された重み係数を、学習条件に対
応する全てのニューラルネットワークを選択して、その
重み係数を更新する。

【００７１】一方、学習データ更新手段１７７は学習デ
ータセット作成手段１７１により作成された学習データ
セットのなかで、新規作成分を検出し、これにより学習
データ格納手段１６５に格納された学習データを更新す
る。学習データセット更新手段１７７は学習データセッ
トを更新するが、これは最新の学習データセットと同数
の古い学習データセットを消去し更新したものであり、
常に一定のセット数である。学習データセット作成手段
１７１が条件に対応するニューラルネットワークの各々
に対応する学習データセットを作成し、学習手段１７２
はこの学習データセットに基づいてニューロ演算手段１
７６の学習を行い、ニューラルネットワークを選択する
とともにその重み係数を更新する。

【００７２】図１８は、一つの状態検出値により学習条
件を設定した場合のニューロ学習領域の概念を図示した
ものである。隣り合う条件のニューロ構成はそれぞれ共
通の動特性部分をニューロで表現する。前記推定値算出
手段１７５では、対応する全てのニューロ出力値の平均
値を、制御の際に用いるニューロ推定値とする。なお、
共通部分の中心からの距離に応じて重み付け平均を取っ
て、制御で用いる推定値としても良い。

【００７３】本実施の形態４によれば、以上のような構
成とすることにより、複数の条件に跨り動特性が変化し
た場合でも、ニューロ制御量は滑らかな値を示し、良好
な制御を達成することが可能となる。

【００７４】

【発明の効果】以上のように、本願の請求項１の発明に
係る学習制御装置によれば、推定対象パラメータに関連
する複数の入力パラメータ値の入力を受け、この入力パ
ラメータ値から推定対象パラメータ値を推定し、この推
定値を目標値追従制御量演算に用いるためのニューラル
ネットワークと、ニューロ推定値と教師信号との二乗誤
差に対し乗算すべき重み係数の値を、ニューロ推定値と
教師信号と目標値との相対関係に応じて変更する誤差係
数変更手段と、前記重み係数を用いて学習時の評価関数
を演算する評価関数演算手段とを備え、前記評価関数に
基づき前記ニューラルネットワークの学習を行うように
したので、目標値を考慮に入れた学習を行うことが可能
となり、ニューロ推定値を用いた目標値追従制御の制御
性能を従来学習に比べ向上させることが可能となり、特
に制御対象が急激に変化する過渡状態時の制御性能劣化
を防ぐことが可能となる学習制御装置が得られる効果が
ある。

【００７５】また、本願の請求項２の発明に係る学習制
御方法によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、受け付けた入力パラメ
ータ値からニューラルネットワークにより推定対象パラ
メータ値を推定し、この推定値を目標値追従制御量演算
に用いる際のニューラルネットワークの学習制御を行な
う方法において、ニューロ推定値と教師信号との二乗誤
差に対し乗算すべき重み係数の値を、ニューロ推定値と
教師信号と目標値との相対関係に応じて変更し、前記重
み係数を用いて学習時の評価関数を演算し、前記評価関
数に基づき前記ニューラルネットワークの学習を行うよ
うにしたので、目標値を考慮に入れた学習を行うことが
可能となり、ニューロ推定値を用いた目標値追従制御の
制御性能を従来学習に比べ向上させることが可能とな
り、特に制御対象が急激に変化する過渡状態時の制御性
能劣化を防ぐことが可能となる学習制御方法が得られる
効果がある。

【００７６】また、本願の請求項３の発明に係る学習制
御装置によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるためのニューラルネットワー
クと、ニューロ推定値と目標値との偏差の符号の種類を
判定する推定偏差符号判定手段と、教師信号と目標値と
の偏差の符号の種類を判定する教師偏差符号判定手段
と、前記推定偏差符号判定手段および教師偏差符号判定
手段により判定されたそれぞれの符号の種類を比較する
符号比較手段と、前記符号比較手段により符号が異なる
と判別された場合、前記ニューロ推定値と前記教師信号
との二乗誤差に乗じるべき重み係数の値を大きくする二
乗誤差係数変更手段と、前記重み係数を用いて学習時の
評価関数を演算する評価関数演算手段とを備え、前記評
価関数に基づき前記ニューラルネットワークの学習を行
うようにしたので、従来学習で得られたニューロ制御に
おける，逆方向に補正量を演算してしまうと言うことが
少なくなり、制御性能を向上させることが可能となる学
習制御装置が得られる効果がある。

【００７７】また、本願の請求項４の発明に係る学習制
御装置によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるためのニューラルネットワー
クと、ニューロ推定値と目標値との偏差の符号の種類を
判定する推定偏差符号判定手段と、前記ニューロ推定値
と前記目標値との偏差の絶対値を算出する推定偏差絶対
値算出手段と、教師信号と目標値との偏差の符号の種類
を判定する教師偏差符号判定手段と、前記教師信号と前
記目標値との偏差の絶対値を算出する教師信号偏差絶対
値算出手段と、前記推定偏差符号判定手段および教師信
号偏差符号判定手段により判定されたそれぞれの符号の
種類を比較する符号比較手段と、前記推定偏差絶対値算
出手段および教師信号偏差絶対値算出手段により算出さ
れた絶対値の大小を比較する絶対値比較手段と、前記符
号比較手段により符号の種類が同じであると判別され、
かつ前記絶対値比較手段により前記ニューロ推定値と前
記目標値との偏差の絶対値の方が前記教師信号と前記目
標値との偏差の絶対値よりも小さいと判定された場合、
前記ニューロ推定値と前記教師信号との二乗誤差に乗ず
るべき重み係数の値を大きくする二乗誤差係数変更手段
と、前記重み係数を用いて学習時の評価関数を演算する
評価関数演算手段とを備え、前記評価関数に基づき学習
を行うようにしたので、目標値に対し反対側の推定値を
算出する結合係数の場合は、より修正が進み、また同じ
側にあっても、推定値が目標値寄りに有る場合、次回修
正係数を用いた結果が反対側に移行するのを防ぎ、推定
値が目標値に対し常に同じ側に来るように学習収束する
速度を早めることが可能となり、この様に学習されたニ
ューロを用い目標値となる制御量を算出することによ
り、従来学習で得られたニューロ制御で課題としてあっ
た逆方向に補正量を演算してしまうと言うことが少なく
なり、制御性能を向上させることが可能となる学習制御
装置が得られる効果がある。

【００７８】また、本願の請求項５の発明に係る学習制
御装置によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるための，それぞれの学習条件
に対応した複数のニューロ構成を有するニューラルネッ
トワークと、制御対象の動特性に関連する状態量を検出
する状態量検出手段と、前記検出値に基づき前記ニュー
ラルネットワークの学習条件を判定する学習条件判定手
段と、前記状態量に基づき前記ニューラルネットワーク
のニューロ構成の中から現在の条件に対応するニューロ
出力値のみを選択するニューロ選択手段とを備えるよう
にしたので、分割学習を行なう構成を実現でき、時間と
共に制御対象の動特性が変わる等、初期の条件下におけ
る挙動と異なる挙動になる場合でも、動特性が変化した
条件に対応するニューロ構成のみを再学習することによ
り、性能劣化を防ぐことができる学習制御装置が得られ
る効果がある。

【００７９】また、本願の請求項６の発明に係る学習制
御装置によれば、請求項５記載の学習制御装置におい
て、前記ニューロ選択手段は、現在の状態量がある学習
条件を満たす場合、その条件に対応するニューロ出力に
“１”を、それ以外のニューロ出力には“０”となるス
テップ関数を乗ずることによりニューロ出力を選択する
ものとしたので、簡単な構成で、分割学習を行なう構成
を実現でき、時間と共に制御対象の動特性が変わる等、
初期の条件下における挙動と異なる挙動になる場合で
も、動特性が変化した条件に対応するニューロ構成のみ
を再学習することにより、性能劣化を防ぐことができる
学習制御装置が得られる効果がある。

【００８０】また、本願の請求項７の発明に係る学習制
御装置によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるための，それぞれの学習条件
に対応した複数のニューロ構成を有するニューラルネッ
トワークと、制御対象の動特性に関連する状態量を検出
する状態量検出手段と、前記検出値に基づき前記ニュー
ラルネットワークの学習条件を判定する学習条件判定手
段と、それぞれのニューロ構成の結合係数を学習した学
習データセットを格納している学習データ格納手段と、
前記状態量に基づき前記学習条件毎の学習データを作成
する学習データ作成手段と、前記学習データ格納手段で
格納されている条件に対応する学習データセットと前記
学習データ作成手段で新たに作成された学習データとを
用いニューロ結合係数の学習を行う学習手段と、前記条
件に対応するニューロ構成を選択し前記学習結果である
結合係数に更新する係数更新ニューロ選択手段とを備え
るようにしたので、動特性が変化しニューロ推定精度が
劣化した場合でも、対応する条件下のニューロのみの学
習をオンラインで行うことができ、良好な制御を達成で
きるように学習を行なうことができる学習制御装置が得
られる効果がある。

【００８１】また、本願の請求項８の発明に係る学習制
御装置によれば、請求項７記載の学習制御装置におい
て、前記学習手段において実際の学習に用いられる学習
データセットは、最新の学習データセットと同数分、古
い学習データセットを消去し更新したものであり、前記
学習データセットは常に一定のセット数であるようにし
たので、学習時間の増大を防ぎ、かつ過去のデータの影
響を小さくし、最新の状況を学習することができる学習
制御装置が得られる効果がある。

【００８２】また、本願の請求項９の発明に係る学習制
御装置によれば、請求項７または８記載の学習制御装置
において、前記学習データ格納手段において、格納され
ている学習データセットは、ニューロ演算処理を行うニ
ューラルネットワーク自体が学習対象となっているオン
ライン状態において常に更新されている学習データセッ
トであるようにしたので、学習時間の増大を防ぎ、かつ
過去のデータの影響を小さくし、最新の状況を学習する
ことができる学習制御装置が得られる効果がある。

【００８３】また、本願の請求項１０の発明に係る学習
制御装置によれば、推定対象パラメータに関連する複数
の入力パラメータ値の入力を受け、この入力パラメータ
値から推定対象パラメータ値を推定し、この推定値を目
標値追従制御量演算に用いるための，それぞれの学習条
件に対応した複数のニューロ構成を有するニューラルネ
ットワークと、制御対象の動特性に関連する状態量を検
出する状態量検出手段と、前記検出値に基づき学習条件
を判定する学習条件判定手段と、それぞれのニューロ構
成の結合係数を学習した学習データセットを格納してい
る学習データ格納手段と、前記状態量に基づき前記学習
条件毎の新しい学習データを作成する学習データ作成手
段と、前記学習データ格納手段で格納されている前記学
習条件に対応する全てのニューロ構成の学習データセッ
トと前記学習データ作成手段で新たに作成された学習デ
ータとを用い、それぞれのニューロ構成に対する学習デ
ータセットを作成する学習データセット作成手段と、前
記学習データ格納手段内の対応するデータをこの新たに
作成された学習データセットに更新する学習データ更新
手段と、前記新たに作成された学習データセットを用い
前記学習条件に対応する全てのニューロ結合係数の学習
を行う学習手段と、前記対応する全てのニューロ構成を
選択し前記学習結果である結合係数に更新する係数更新
ニューロ選択手段と、前記学習条件に対応する全てのニ
ューロ構成を選択するニューロ構成選択手段と、前記対
応する全てのニューロ出力から制御を行う際に用いるニ
ューロ推定値を算出する推定値算出手段とを備え、前記
推定値を制御量演算に用いるようにしたので、複数の条
件に跨り動特性が変化した場合でも、ニューロ制御量は
滑らかな値を示し、良好な制御を達成することが可能と
なる学習制御装置が得られる効果がある。

【００８４】また、本願の請求項１１の発明に係る学習
制御装置によれば、請求項１０記載の学習制御装置にお
いて、前記ニューラルネットワークにおける，隣り合う
条件下におけるニューロ構成は、共通の制御対象動特性
の表現部分を持つようにしたので、複数の条件に跨り動
特性が変化した場合でも、ニューロ制御量は滑らかな値
を示し、良好な制御を達成することが可能となる学習制
御装置が得られる効果がある。

【００８５】また、本願の請求項１２の発明に係る学習
制御装置によれば、請求項１０または１１記載の学習制
御装置において、前記推定値算出手段は、対応する全て
のニューロ出力値の平均値を、制御で用いるニューロ推
定値として算出するようにしたので、複数の条件に跨り
動特性が変化した場合でも、ニューロ制御量は滑らかな
値を示し、良好な制御を達成することが可能となる学習
制御装置が得られる効果がある。

【図面の簡単な説明】

【図１】本願発明の実施の形態１に係る学習制御装置の
機能ブロック図である。

【図２】従来の学習のフローチャートを示す図である。

【図３】本願発明の実施の形態１に係る学習制御装置の
学習のフローチャートを示す図である。

【図４】本願発明の実施の形態１に係る学習制御装置の
ニューロ学習処理機能を示すブロック図である。

【図５】本願発明の実施の形態１に係る学習制御装置の
オフライン学習におけるニューロ制御構成の一例を示す
図である。

【図６】本願発明の実施の形態１に係る学習制御装置の
オフライン学習におけるニューロ制御構成の一例を示す
図である。

【図７】本願発明の実施の形態１に係る学習制御装置の
学習方法に関する機能ブロック図である。

【図８】本願発明の実施の形態１に係る学習制御装置の
学習方法に関する機能ブロック図である。

【図９】本願発明の実施の形態１に係る学習制御装置の
処理フローチャートを示す図である。

【図１０】本願発明の実施の形態１に係る学習制御装置
における目標値と教師信号と推定値との相対関係を示す
模式図である。

【図１１】本願発明の実施の形態１に係る学習制御装置
の処理フローチャートを示す図である。

【図１２】本願発明の実施の形態１に係る学習制御装置
における目標値と教師信号と推定値との相対関係を示す
模式図である。

【図１３】本願発明の実施の形態２に係る学習制御装置
の機能ブロック図である。

【図１４】本願発明の実施の形態２に係る学習制御装置
におけるニューロ学習領域を示す概念図である。

【図１５】本願発明の実施の形態２に係る学習制御装置
におけるニューロ選択手法の一構成例を示す図である。

【図１６】本願発明の実施の形態３に係る学習制御装置
の機能ブロック図である。

【図１７】本願発明の実施の形態４に係る学習制御装置
の機能ブロック図である。

【図１８】本願発明の実施の形態４に係る学習制御装置
における共通部分を有するニューロ学習領域を示す概念
図である。

【図１９】従来のニューラルネットワークを用いた空燃
比制御装置の機能ブロック図である。

【図２０】図２２の空燃比制御装置に用いられるニュー
ラルネットワークの概念図である。

【図２１】従来のニューラルネットワークの学習過程を
模式的に示す図である。

【図２２】エンジンの空燃比制御装置の概略を示す図で
ある。

【図２３】エンジンの空燃比と排気ガスの浄化度の関係
を示す図である。

【図２４】従来の学習制御における推定値と目標値と空
燃比と制御の方向の関係を示す図である。

【図２５】本願発明の学習制御における推定値と目標値
と空燃比と制御の方向の関係を示す図である。

【符号の説明】

１１制御対象１２ニューロ演算手段１３目標値算出手段１４制御量演算手段１５ニューロ学習手段１６誤差係数変更手段１７結合係数書き換え手段４１学習データセット作成部４２推定値算出部４３評価関数作成部４４係数更新部４５誤差評価部７１推定偏差符号判定手段７２教師偏差符号判定手段７３符号比較手段７４二乗誤差係数変更手段７５結合係数修正手段８１推定偏差絶対値算出手段８２教師偏差絶対値算出手段８３絶対値比較手段８４二乗誤差係数変更手段１３１状態量検出手段１３２学習条件判定手段１３３ニューロ選択手段１３４ニューロ演算手段１６１学習データ作成手段１６２学習手段１６３係数更新ニューロ選択手段１６５学習データ格納手段１７１学習データセット作成手段１７５推定値算出手段１７７学習データ更新手段

フロントページの続きＦターム(参考） 3G084 AA03 BA09 BA13 DA04 EB02 EB13 EB20 EB21 EC04 FA02 FA10 FA11 FA13 FA20 FA29 FA33 3G301 HA01 HA06 JA18 MA01 MA11 NA09 ND02 ND25 ND28 ND45 PA07Z PA10Z PA11Z PB03Z PD02Z PE08Z 5H004 GA05 GB12 HA13 HB01 HB04 HB07 HB08 JB07 KA65 KA66 KC02 KC09 KC24 KC28 KD33 KD36 KD45 LB06 9A001 HH05 HH06 KK32 KK54

Claims

【特許請求の範囲】

【請求項１】推定対象パラメータに関連する複数の入
力パラメータ値の入力を受け、この入力パラメータ値か
ら推定対象パラメータ値を推定し、この推定値を目標値
追従制御量演算に用いるためのニューラルネットワーク
と、ニューロ推定値と教師信号との二乗誤差に対し乗算すべ
き重み係数の値を、ニューロ推定値と教師信号と目標値
との相対関係に応じて変更する誤差係数変更手段と、前記重み係数を用いて学習時の評価関数を演算する評価
関数演算手段とを備え、前記評価関数に基づき前記ニューラルネットワークの学
習を行うことを特徴とする学習制御装置。
【請求項２】推定対象パラメータに関連する複数の入
力パラメータ値の入力を受け、受け付けた入力パラメー
タ値からニューラルネットワークにより推定対象パラメ
ータ値を推定し、この推定値を目標値追従制御量演算に
用いる際のニューラルネットワークの学習制御を行なう
方法において、ニューロ推定値と教師信号との二乗誤差に対し乗算すべ
き重み係数の値を、ニューロ推定値と教師信号と目標値
との相対関係に応じて変更し、前記重み係数を用いて学習時の評価関数を演算し、前記評価関数に基づき前記ニューラルネットワークの学
習を行うことを特徴とする学習制御方法。
【請求項３】推定対象パラメータに関連する複数の入
力パラメータ値の入力を受け、この入力パラメータ値か
ら推定対象パラメータ値を推定し、この推定値を目標値
追従制御量演算に用いるためのニューラルネットワーク
と、ニューロ推定値と目標値との偏差の符号の種類を判定す
る推定偏差符号判定手段と、教師信号と目標値との偏差の符号の種類を判定する教師
偏差符号判定手段と、前記推定偏差符号判定手段および教師偏差符号判定手段
により判定されたそれぞれの符号の種類を比較する符号
比較手段と、前記符号比較手段により符号が異なると判別された場
合、前記ニューロ推定値と前記教師信号との二乗誤差に
乗じるべき重み係数の値を大きくする二乗誤差係数変更
手段と、前記重み係数を用いて学習時の評価関数を演算する評価
関数演算手段とを備え、前記評価関数に基づき前記ニューラルネットワークの学
習を行うことを特徴とする学習制御装置。
【請求項４】推定対象パラメータに関連する複数の入
力パラメータ値の入力を受け、この入力パラメータ値か
ら推定対象パラメータ値を推定し、この推定値を目標値
追従制御量演算に用いるためのニューラルネットワーク
と、ニューロ推定値と目標値との偏差の符号の種類を判定す
る推定偏差符号判定手段と、前記ニューロ推定値と前記目標値との偏差の絶対値を算
出する推定偏差絶対値算出手段と、教師信号と目標値との偏差の符号の種類を判定する教師
偏差符号判定手段と、前記教師信号と前記目標値との偏差の絶対値を算出する
教師信号偏差絶対値算出手段と、前記推定偏差符号判定手段および教師信号偏差符号判定
手段により判定されたそれぞれの符号の種類を比較する
符号比較手段と、前記推定偏差絶対値算出手段および教師信号偏差絶対値
算出手段により算出された絶対値の大小を比較する絶対
値比較手段と、前記符号比較手段により符号の種類が同じであると判別
され、かつ前記絶対値比較手段により前記ニューロ推定
値と前記目標値との偏差の絶対値の方が前記教師信号と
前記目標値との偏差の絶対値よりも小さいと判定された
場合、前記ニューロ推定値と前記教師信号との二乗誤差
に乗ずるべき重み係数の値を大きくする二乗誤差係数変
更手段と、前記重み係数を用いて学習時の評価関数を演算する評価
関数演算手段とを備え、前記評価関数に基づき学習を行うことを特徴とする学習
制御装置。
【請求項５】推定対象パラメータに関連する複数の入
力パラメータ値の入力を受け、この入力パラメータ値か
ら推定対象パラメータ値を推定し、この推定値を目標値
追従制御量演算に用いるための，それぞれの学習条件に
対応した複数のニューロ構成を有するニューラルネット
ワークと、制御対象の動特性に関連する状態量を検出する状態量検
出手段と、前記検出値に基づき前記ニューラルネットワークの学習
条件を判定する学習条件判定手段と、前記状態量に基づき前記ニューラルネットワークのニュ
ーロ構成の中から現在の条件に対応するニューロ出力値
のみを選択するニューロ選択手段とを備えたことを特徴
とする学習制御装置。
【請求項６】請求項５記載の学習制御装置において、前記ニューロ選択手段は、現在の状態量がある学習条件
を満たす場合、その条件に対応するニューロ出力に
“１”を、それ以外のニューロ出力には“０”となるス
テップ関数を乗ずることによりニューロ出力を選択する
ものとしたことを特徴とする学習制御装置。
【請求項７】推定対象パラメータに関連する複数の入
力パラメータ値の入力を受け、この入力パラメータ値か
ら推定対象パラメータ値を推定し、この推定値を目標値
追従制御量演算に用いるための，それぞれの学習条件に
対応した複数のニューロ構成を有するニューラルネット
ワークと、制御対象の動特性に関連する状態量を検出する状態量検
出手段と、前記検出値に基づき前記ニューラルネットワークの学習
条件を判定する学習条件判定手段と、それぞれのニューロ構成の結合係数を学習した学習デー
タセットを格納している学習データ格納手段と、前記状態量に基づき前記学習条件毎の学習データを作成
する学習データ作成手段と、前記学習データ格納手段で格納されている条件に対応す
る学習データセットと前記学習データ作成手段で新たに
作成された学習データとを用いニューロ結合係数の学習
を行う学習手段と、前記条件に対応するニューロ構成を選択し前記学習結果
である結合係数に更新する係数更新ニューロ選択手段と
を備えたことを特徴とする学習制御装置。
【請求項８】請求項７記載の学習制御装置において、前記学習手段において実際の学習に用いられる学習デー
タセットは、最新の学習データセットと同数分、古い学
習データセットを消去し更新したものであり、前記学習
データセットは常に一定のセット数であることを特徴と
する学習制御装置。
【請求項９】請求項７または８記載の学習制御装置に
おいて、前記学習データ格納手段において、格納されている学習
データセットは、ニューロ演算処理を行うニューラルネ
ットワーク自体が学習対象となっているオンライン状態
において常に更新されている学習データセットであるこ
とを特徴とする学習制御装置。
【請求項１０】推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるための，それぞれの学習条件
に対応した複数のニューロ構成を有するニューラルネッ
トワークと、制御対象の動特性に関連する状態量を検出する状態量検
出手段と、前記検出値に基づき学習条件を判定する学習条件判定手
段と、それぞれのニューロ構成の結合係数を学習した学習デー
タセットを格納している学習データ格納手段と、前記状態量に基づき前記学習条件毎の新しい学習データ
を作成する学習データ作成手段と、前記学習データ格納手段で格納されている前記学習条件
に対応する全てのニューロ構成の学習データセットと前
記学習データ作成手段で新たに作成された学習データと
を用い、それぞれのニューロ構成に対する学習データセ
ットを作成する学習データセット作成手段と、前記学習データ格納手段内の対応するデータをこの新た
に作成された学習データセットに更新する学習データ更
新手段と、前記新たに作成された学習データセットを用い前記学習
条件に対応する全てのニューロ結合係数の学習を行う学
習手段と、前記対応する全てのニューロ構成を選択し前記学習結果
である結合係数に更新する係数更新ニューロ選択手段
と、前記学習条件に対応する全てのニューロ構成を選択する
ニューロ構成選択手段と、前記対応する全てのニューロ出力から制御を行う際に用
いるニューロ推定値を算出する推定値算出手段とを備
え、前記推定値を制御量演算に用いることを特徴とする学習
制御装置。
【請求項１１】請求項１０記載の学習制御装置におい
て、前記ニューラルネットワークにおける，隣り合う条件下
におけるニューロ構成は、共通の制御対象動特性の表現
部分を持つことを特徴とする学習制御装置。
【請求項１２】請求項１０または１１記載の学習制御
装置において、前記推定値算出手段は、対応する全てのニューロ出力値
の平均値を、制御で用いるニューロ推定値として算出す
ることを特徴とする学習制御装置。