JP2000330610A - 学習制御装置および学習制御方法 - Google Patents
学習制御装置および学習制御方法Info
- Publication number
- JP2000330610A JP2000330610A JP11139136A JP13913699A JP2000330610A JP 2000330610 A JP2000330610 A JP 2000330610A JP 11139136 A JP11139136 A JP 11139136A JP 13913699 A JP13913699 A JP 13913699A JP 2000330610 A JP2000330610 A JP 2000330610A
- Authority
- JP
- Japan
- Prior art keywords
- learning
- value
- neuro
- estimated
- learning data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Landscapes
- Electrical Control Of Air Or Fuel Supplied To Internal-Combustion Engine (AREA)
- Combined Controls Of Internal Combustion Engines (AREA)
- Feedback Control In General (AREA)
Abstract
(57)【要約】
【課題】 ニューロ出力値を用いた目標値追従制御を行
う場合、ニューロ推定値と推定対象パラメータ値との誤
差により、良好な制御性能を得ることができなくなり、
特に過渡変化時に極端に劣化する場合があるが、これに
対策を施すこと。 【解決手段】 ニューロ演算手段12のニューロ結合係
数はニューロ学習手段15内の誤差係数変更手段16に
より目標値を考慮に入れた学習により算出され、結合係
数書き換え手段17により書き換えられる。誤差係数変
更手段16では学習時に用いるニューロ推定値と教師信
号との誤差評価関数の重み係数をニューロ推定値と教師
信号と目標値との相対位置関係に応じて変更し、ニュー
ロ学習手段15によりこの重み係数を用いた評価関数に
基づき結合係数の学習を行う。
う場合、ニューロ推定値と推定対象パラメータ値との誤
差により、良好な制御性能を得ることができなくなり、
特に過渡変化時に極端に劣化する場合があるが、これに
対策を施すこと。 【解決手段】 ニューロ演算手段12のニューロ結合係
数はニューロ学習手段15内の誤差係数変更手段16に
より目標値を考慮に入れた学習により算出され、結合係
数書き換え手段17により書き換えられる。誤差係数変
更手段16では学習時に用いるニューロ推定値と教師信
号との誤差評価関数の重み係数をニューロ推定値と教師
信号と目標値との相対位置関係に応じて変更し、ニュー
ロ学習手段15によりこの重み係数を用いた評価関数に
基づき結合係数の学習を行う。
Description
【0001】
【発明の属する技術分野】本発明は、ニューラルネット
ワークの出力値を用いてその学習制御量を算出する学習
制御装置および学習制御方法に関し、特に、制御目標値
に対し高精度な追従制御が可能となるような学習制御を
実現できるようにしたものに関する。
ワークの出力値を用いてその学習制御量を算出する学習
制御装置および学習制御方法に関し、特に、制御目標値
に対し高精度な追従制御が可能となるような学習制御を
実現できるようにしたものに関する。
【0002】
【従来の技術】近年、ニューラルネットワークが注目を
浴びている。ニューラルネットワークを用いると物理系
や化学系において入力と出力の因果関係を理論的に導き
出すことが困難な場合であっても、学習機能に基づいて
入力の値から出力の値を推定することが可能となる。こ
の点を利用してニューラルネットワークを複雑な制御系
を制御する制御装置、特に、非線形性の強い制御対象を
制御する制御装置に応用することが行われている。この
ようなニューラルネットワークを用いた制御装置の一例
として、自動車の内燃エンジンの空燃比制御装置が挙げ
られる。空燃比とはエンジンの吸気における空気と燃料
との比のことである。自動車の内燃エンジンの空燃比制
御にニューラルネットワークを用いると有効な理由は次
の通りである。自動車より排出される排気ガス中に含ま
れる有毒ガスであるNOx、CO、HCは触媒を用いて
これらを低減させるという方法が採られ、例えば代表的
な触媒として三元触媒が使用される。
浴びている。ニューラルネットワークを用いると物理系
や化学系において入力と出力の因果関係を理論的に導き
出すことが困難な場合であっても、学習機能に基づいて
入力の値から出力の値を推定することが可能となる。こ
の点を利用してニューラルネットワークを複雑な制御系
を制御する制御装置、特に、非線形性の強い制御対象を
制御する制御装置に応用することが行われている。この
ようなニューラルネットワークを用いた制御装置の一例
として、自動車の内燃エンジンの空燃比制御装置が挙げ
られる。空燃比とはエンジンの吸気における空気と燃料
との比のことである。自動車の内燃エンジンの空燃比制
御にニューラルネットワークを用いると有効な理由は次
の通りである。自動車より排出される排気ガス中に含ま
れる有毒ガスであるNOx、CO、HCは触媒を用いて
これらを低減させるという方法が採られ、例えば代表的
な触媒として三元触媒が使用される。
【0003】図22はエンジンの空燃比制御装置の概要
を示すものであり、スロットルTLの開度に応じてエン
ジンに流入する空気は、燃料噴射装置INJにより噴射
された燃料と混合され、バルブV1を通って燃焼室に流
入し、燃焼室内で爆発する。これによりピストンPに対
する押下力が発生し、排気ガスはバルブV2を通って排
気管側に排出されるが、その際空燃比センサAFSによ
り空燃比が感知され、三元触媒TCにより排気ガスが浄
化される。このような触媒がこれらの有害ガスを最も効
果的に浄化するためには、図23に示すように、空燃比
を、触媒が効果的に働くことのできる一定値(図23に
示すように14.7)に保つ必要があり、このため自動
車の運転状態にかかわらず空燃比を一定に保つ空燃比制
御装置が必要となる。
を示すものであり、スロットルTLの開度に応じてエン
ジンに流入する空気は、燃料噴射装置INJにより噴射
された燃料と混合され、バルブV1を通って燃焼室に流
入し、燃焼室内で爆発する。これによりピストンPに対
する押下力が発生し、排気ガスはバルブV2を通って排
気管側に排出されるが、その際空燃比センサAFSによ
り空燃比が感知され、三元触媒TCにより排気ガスが浄
化される。このような触媒がこれらの有害ガスを最も効
果的に浄化するためには、図23に示すように、空燃比
を、触媒が効果的に働くことのできる一定値(図23に
示すように14.7)に保つ必要があり、このため自動
車の運転状態にかかわらず空燃比を一定に保つ空燃比制
御装置が必要となる。
【0004】このような空燃比制御装置では、通常、ス
ロットル開度等の変化に応じて、燃料噴射量の増量補
正、減量補正等を行うフィードフォワード制御が行わ
れ、さらにフィードバック制御も併用されている。これ
らの制御は、アイドル時や定速走行時などの定常運転域
ではよい結果を得ることができる。しかしながら、加,
減速時などの過渡状態においては、空燃比センサの応答
の遅れや気筒内に実際に流入する燃料量等が運転状態や
外部環境により順次変化していく等の解析困難な要因に
より、空燃比を単純なフィードフォワード制御やフィー
ドバック制御のみで一定値に保つのは現実には非常に困
難である。
ロットル開度等の変化に応じて、燃料噴射量の増量補
正、減量補正等を行うフィードフォワード制御が行わ
れ、さらにフィードバック制御も併用されている。これ
らの制御は、アイドル時や定速走行時などの定常運転域
ではよい結果を得ることができる。しかしながら、加,
減速時などの過渡状態においては、空燃比センサの応答
の遅れや気筒内に実際に流入する燃料量等が運転状態や
外部環境により順次変化していく等の解析困難な要因に
より、空燃比を単純なフィードフォワード制御やフィー
ドバック制御のみで一定値に保つのは現実には非常に困
難である。
【0005】そこで、空燃比制御の精度をより向上させ
るために、上記燃料噴射等の非線形要素をニューラルネ
ットワークにより学習させ、このニューラルネットワー
クを用いて燃料噴射量の補正量を、過渡時の応答性能の
向上を図るように制御を行うことが考えられる。このよ
うな空燃比制御装置は既に公知となっており、その一例
として、特開平8−74636号公報に示されたものが
ある。
るために、上記燃料噴射等の非線形要素をニューラルネ
ットワークにより学習させ、このニューラルネットワー
クを用いて燃料噴射量の補正量を、過渡時の応答性能の
向上を図るように制御を行うことが考えられる。このよ
うな空燃比制御装置は既に公知となっており、その一例
として、特開平8−74636号公報に示されたものが
ある。
【0006】この従来のニューラルネットワークを用い
た空燃比制御装置を図19に示す。図において、Eはエ
ンジン、210はその状態を検出する状態検出部、22
0はこの状態検出部210により検出された状態に基づ
いて空燃比を推定するニューラルネットワーク(以下、
NNと称す)演算部、230はNN演算部220の演算
結果に基づいてエンジンの燃料噴射量を算出する燃料噴
射量算出部である。
た空燃比制御装置を図19に示す。図において、Eはエ
ンジン、210はその状態を検出する状態検出部、22
0はこの状態検出部210により検出された状態に基づ
いて空燃比を推定するニューラルネットワーク(以下、
NNと称す)演算部、230はNN演算部220の演算
結果に基づいてエンジンの燃料噴射量を算出する燃料噴
射量算出部である。
【0007】次に動作について説明する。この空燃比制
御装置は、状態検出部210によりエンジンEの状態を
表わす複数の物理量、ここではエンジンの回転数(N
e)、吸入空気圧(Pb)、スロットル開度(TH
L)、燃料噴射量(Gf)、吸入空気温(Ta)、冷却
水温(Tw)、空燃比(A/Fk)を検出し、NN演算
部220により、これら状態検出部210で検出した複
数のパラメータを入力し、状態検出部210における空
燃比センサでは過渡時等追従できない,真の空燃比(A
/Fr)挙動をニューラルネットワークにより推定す
る。そして、燃料噴射量算出部230により、この推定
された空燃比(A/Fnn)の値と目標空燃比(A/F
ref)との偏差を小さくするようにフィードバック制御
を行い、目的の空燃比を実現する燃料噴射量(Gb)を
算出する。このように、通常のセンサではセンサ自体の
応答遅れ等により得ることのできない過渡状態での空燃
比(A/Fr)の値を得ることにより、適正な空燃比の
制御が可能となる。
御装置は、状態検出部210によりエンジンEの状態を
表わす複数の物理量、ここではエンジンの回転数(N
e)、吸入空気圧(Pb)、スロットル開度(TH
L)、燃料噴射量(Gf)、吸入空気温(Ta)、冷却
水温(Tw)、空燃比(A/Fk)を検出し、NN演算
部220により、これら状態検出部210で検出した複
数のパラメータを入力し、状態検出部210における空
燃比センサでは過渡時等追従できない,真の空燃比(A
/Fr)挙動をニューラルネットワークにより推定す
る。そして、燃料噴射量算出部230により、この推定
された空燃比(A/Fnn)の値と目標空燃比(A/F
ref)との偏差を小さくするようにフィードバック制御
を行い、目的の空燃比を実現する燃料噴射量(Gb)を
算出する。このように、通常のセンサではセンサ自体の
応答遅れ等により得ることのできない過渡状態での空燃
比(A/Fr)の値を得ることにより、適正な空燃比の
制御が可能となる。
【0008】このような制御を可能とする、上記ニュー
ロ演算部220に用いられるニューラルネットワークの
構成例を図20に示す。図20に示すように、このニュ
ーラルネットワークは、入力層としての第1層L1、中
間層としての第2層L2、出力層としての第3層L3の
3層により構成される。
ロ演算部220に用いられるニューラルネットワークの
構成例を図20に示す。図20に示すように、このニュ
ーラルネットワークは、入力層としての第1層L1、中
間層としての第2層L2、出力層としての第3層L3の
3層により構成される。
【0009】第1層L1へは入力パラメータとして図1
9の状態検出部210からエンジン回転数(Ne)、吸
入空気圧(Pb)、スロットル開度(THL)、燃料噴
射量(Gf)、吸入空気温(Ta)、冷却水温(T
w)、検出空燃比(A/Fk)等が入力される。この検
出空燃比(A/Fk)は制御周期において空燃比センサ
が検出した最新の空燃比である。尤も、この空燃比(A
/Fk)はセンサの応答遅れにより真の空燃比(A /F
r)の値を示してはいない。入力された各パラメータは
それぞれのシナプスSYにより、学習結果を反映したウ
エイト値を乗算されて第2層L2の各ニューロンNRで
総和が算出されたのち閾値が加算され、非線形のトラン
スファー関数により出力値に変換される。第2層L2で
変換された値は、さらにそれぞれ別のウエイト値Wを乗
算されて第3層L3の各ニューロンで総和がなされる。
そして、第3層L3のニューロンNRでこの総和がなさ
れた値に別の閾値を加算したものを別のトランスファー
関数により変換して推定空燃比(A/FNN)の値が算出
される。
9の状態検出部210からエンジン回転数(Ne)、吸
入空気圧(Pb)、スロットル開度(THL)、燃料噴
射量(Gf)、吸入空気温(Ta)、冷却水温(T
w)、検出空燃比(A/Fk)等が入力される。この検
出空燃比(A/Fk)は制御周期において空燃比センサ
が検出した最新の空燃比である。尤も、この空燃比(A
/Fk)はセンサの応答遅れにより真の空燃比(A /F
r)の値を示してはいない。入力された各パラメータは
それぞれのシナプスSYにより、学習結果を反映したウ
エイト値を乗算されて第2層L2の各ニューロンNRで
総和が算出されたのち閾値が加算され、非線形のトラン
スファー関数により出力値に変換される。第2層L2で
変換された値は、さらにそれぞれ別のウエイト値Wを乗
算されて第3層L3の各ニューロンで総和がなされる。
そして、第3層L3のニューロンNRでこの総和がなさ
れた値に別の閾値を加算したものを別のトランスファー
関数により変換して推定空燃比(A/FNN)の値が算出
される。
【0010】このようなニューラルネットワークの学習
課程を図21を用いて説明する。図21はエンジン回転
数(Ne)等を入力パラメータとして、推定空燃比(A
/FNN)を得るニューラルネットワークの学習過程を示
す模式図である。まず、学習データを採取するために自
動車のエンジンEに図19と同じ状態検出部210を設
けており、実際に自動車を運転し学習用のデータを採取
する。採取されたデータは学習用データ生成部240a
によりセンサの応答遅れ等を調整した学習用データに変
換される。学習用データには、教師データ用の空燃比
(A/Ft)と、これに対応する入力パラメータ用のエ
ンジン回転数(Ne)等がある。教師データ用の空燃比
(A/Ft)は空燃比センサにより検出された空燃比
(A/Fk)からその検出遅れを考慮して得ることがで
きる。なお、各入力パラメータは時系列的に過去のデー
タも含めるようにすることが望ましいが、ここでは、説
明を簡略化するために過去のパラメータは入力しないも
のとしている。
課程を図21を用いて説明する。図21はエンジン回転
数(Ne)等を入力パラメータとして、推定空燃比(A
/FNN)を得るニューラルネットワークの学習過程を示
す模式図である。まず、学習データを採取するために自
動車のエンジンEに図19と同じ状態検出部210を設
けており、実際に自動車を運転し学習用のデータを採取
する。採取されたデータは学習用データ生成部240a
によりセンサの応答遅れ等を調整した学習用データに変
換される。学習用データには、教師データ用の空燃比
(A/Ft)と、これに対応する入力パラメータ用のエ
ンジン回転数(Ne)等がある。教師データ用の空燃比
(A/Ft)は空燃比センサにより検出された空燃比
(A/Fk)からその検出遅れを考慮して得ることがで
きる。なお、各入力パラメータは時系列的に過去のデー
タも含めるようにすることが望ましいが、ここでは、説
明を簡略化するために過去のパラメータは入力しないも
のとしている。
【0011】このようにして学習用データ生成部240
aにより生成された学習用データは学習用データ蓄積部
240bに蓄積される。そして、学習実施部240cが
蓄積された学習用データを用いてニューラルネットワー
クNNの学習を行う。即ち、学習実施部240cが入力
パラメータ用のエンジン回転数(Ne)等をニューラル
ネットワークNNに入力し、これに応答してニューラル
ネットワークNNが出力する,推定された空燃比(A/
FNN)と、教師用の空燃比(A/Ft)との偏差eを差
分器240dで検出し、この偏差eがある許容値以内、
例えば空燃比換算で平均0.1以下となるように、バッ
クプロパゲーション法によりニューラルネットワークN
Nの構成、つまり、シナプスSYのウエイト値やトラン
スファー関数等を変えていく。そして、この偏差eがあ
る許容値以内となることにより、あるいはこのような学
習動作が規定回数に達することにより、学習を終了させ
る。
aにより生成された学習用データは学習用データ蓄積部
240bに蓄積される。そして、学習実施部240cが
蓄積された学習用データを用いてニューラルネットワー
クNNの学習を行う。即ち、学習実施部240cが入力
パラメータ用のエンジン回転数(Ne)等をニューラル
ネットワークNNに入力し、これに応答してニューラル
ネットワークNNが出力する,推定された空燃比(A/
FNN)と、教師用の空燃比(A/Ft)との偏差eを差
分器240dで検出し、この偏差eがある許容値以内、
例えば空燃比換算で平均0.1以下となるように、バッ
クプロパゲーション法によりニューラルネットワークN
Nの構成、つまり、シナプスSYのウエイト値やトラン
スファー関数等を変えていく。そして、この偏差eがあ
る許容値以内となることにより、あるいはこのような学
習動作が規定回数に達することにより、学習を終了させ
る。
【0012】こうして学習が終了すると、ニューラルネ
ットワークNNは、学習が終了した時点におけるシナプ
スSYのウエイト値やトランスファー関数等でもって構
成が確定されるが、この学習が終了したニューラルネッ
トワークNNに入力を与えると、空燃比換算で平均0.
1以下の許容値以下の誤差に収まるような空燃比を、そ
の予測値として出力することができる。
ットワークNNは、学習が終了した時点におけるシナプ
スSYのウエイト値やトランスファー関数等でもって構
成が確定されるが、この学習が終了したニューラルネッ
トワークNNに入力を与えると、空燃比換算で平均0.
1以下の許容値以下の誤差に収まるような空燃比を、そ
の予測値として出力することができる。
【0013】
【発明が解決しようとする課題】従来の学習制御装置は
以上のように構成されており、この構成によれば、ニュ
ーラルネットワークの出力と教師信号の値との偏差が所
要の値より小さくなるように、ニューラルネットワーク
を学習させることが可能である。この学習を行った結
果、ニューラルネットワークは学習前とはその構成が変
更される。しかしながら、上記のようなニューラルネッ
トワークを用いた制御系では、制御性能を向上させるた
めに、ニューラルネットワークの高精度な学習を行うこ
とが不可欠となる。
以上のように構成されており、この構成によれば、ニュ
ーラルネットワークの出力と教師信号の値との偏差が所
要の値より小さくなるように、ニューラルネットワーク
を学習させることが可能である。この学習を行った結
果、ニューラルネットワークは学習前とはその構成が変
更される。しかしながら、上記のようなニューラルネッ
トワークを用いた制御系では、制御性能を向上させるた
めに、ニューラルネットワークの高精度な学習を行うこ
とが不可欠となる。
【0014】例えば、推定値を用いて目標値に追従させ
る制御を行う場合、推定値が実際の値とずれることがあ
る。この推定値が目標値に対して実際の値が存在する側
と同じ方向にずれる場合は、制御補正方向としては正し
い値を示しており、補正方向が目標値に向かうように制
御を行うため、好ましい結果が得られるが、この推定値
が目標値に対して実際の値と反対側にずれている場合
は、補正方向が逆向きとなり、目標値と離れる方向に制
御がなされてしまい、却って制御性能を劣化させてしま
うと言う問題がある。これは、空燃比制御の場合を例に
とると、推定空燃比が目標空燃比と反対側の方向にずれ
ていると、燃料をリッチにして加速しなければならない
状況であるにもかかわらず、燃料をリーンにし、エンジ
ンが停止してしまう等の問題が生じる場合である。
る制御を行う場合、推定値が実際の値とずれることがあ
る。この推定値が目標値に対して実際の値が存在する側
と同じ方向にずれる場合は、制御補正方向としては正し
い値を示しており、補正方向が目標値に向かうように制
御を行うため、好ましい結果が得られるが、この推定値
が目標値に対して実際の値と反対側にずれている場合
は、補正方向が逆向きとなり、目標値と離れる方向に制
御がなされてしまい、却って制御性能を劣化させてしま
うと言う問題がある。これは、空燃比制御の場合を例に
とると、推定空燃比が目標空燃比と反対側の方向にずれ
ていると、燃料をリッチにして加速しなければならない
状況であるにもかかわらず、燃料をリーンにし、エンジ
ンが停止してしまう等の問題が生じる場合である。
【0015】また、推定精度を向上させるため上記の様
な学習をさせる際に、学習用のデータを特定の範囲に限
ってしまわないように、また、予め制御対象の動作範囲
内の学習データを揃えて学習を行うことが行われてい
る。しかし、この学習データで十分な学習を行えたか否
かは制御を行った結果からしか知ることができず、通常
は学習を行ってはこれに対する評価を行い、評価結果の
悪い領域のデータを採取しては学習データを作成し直
し、再び学習を行う、といった開発ルーチンを繰り返す
必要がある。なお、「領域」とは、少なくとも1つ以上
の入力パラメータの範囲の組み合わせから定まる,エン
ジンの運転状態を表す概念である。
な学習をさせる際に、学習用のデータを特定の範囲に限
ってしまわないように、また、予め制御対象の動作範囲
内の学習データを揃えて学習を行うことが行われてい
る。しかし、この学習データで十分な学習を行えたか否
かは制御を行った結果からしか知ることができず、通常
は学習を行ってはこれに対する評価を行い、評価結果の
悪い領域のデータを採取しては学習データを作成し直
し、再び学習を行う、といった開発ルーチンを繰り返す
必要がある。なお、「領域」とは、少なくとも1つ以上
の入力パラメータの範囲の組み合わせから定まる,エン
ジンの運転状態を表す概念である。
【0016】また、評価データにより評価を行った結
果、一部のデータの誤差が大きい場合、その誤差を小さ
くするためには、通常その誤差の大きい領域の学習デー
タを増加させ再学習を行う。このとき全体の学習データ
分布のバランスを取るように、即ち各領域毎の学習デー
タの個数のバランスを考えながら追加データを選定し、
再度学習データを作成しなければならない。しかしなが
ら、この選定した追加データを用いて再学習を行った結
果、前回良好な結果が得られていた領域が、今回の学習
により良好な結果が得られなくなる場合や、学習結果が
全体的に劣化する場合が生じることがある。
果、一部のデータの誤差が大きい場合、その誤差を小さ
くするためには、通常その誤差の大きい領域の学習デー
タを増加させ再学習を行う。このとき全体の学習データ
分布のバランスを取るように、即ち各領域毎の学習デー
タの個数のバランスを考えながら追加データを選定し、
再度学習データを作成しなければならない。しかしなが
ら、この選定した追加データを用いて再学習を行った結
果、前回良好な結果が得られていた領域が、今回の学習
により良好な結果が得られなくなる場合や、学習結果が
全体的に劣化する場合が生じることがある。
【0017】このような場合、再度学習データの選定を
行わなければならず、何度もデータ採取を行い学習し直
さなければならないため、良好な結果が得られるまで多
大な時間がかかってしまう。このように、ニューラルネ
ットワークの推定精度を広範な推定領域に渡って向上さ
せるのは大変困難であり、現在、試行錯誤を行うことで
しかこれを解決することができない。
行わなければならず、何度もデータ採取を行い学習し直
さなければならないため、良好な結果が得られるまで多
大な時間がかかってしまう。このように、ニューラルネ
ットワークの推定精度を広範な推定領域に渡って向上さ
せるのは大変困難であり、現在、試行錯誤を行うことで
しかこれを解決することができない。
【0018】本発明は、上記のような従来のものの問題
点を解決するためになされたもので、ニューラルネット
ワーク出力値を用い目標値に追従する制御量を算出する
学習制御装置および学習制御方法において、高精度に追
従制御が可能な推定値が得られるような高精度な学習を
実現でき、また、他の領域に影響を与えることなく推定
精度の悪い領域の推定精度をのみを再学習により向上で
き、的確かつ効率的に学習ができる学習制御装置および
学習制御方法を得ることを目的とする。
点を解決するためになされたもので、ニューラルネット
ワーク出力値を用い目標値に追従する制御量を算出する
学習制御装置および学習制御方法において、高精度に追
従制御が可能な推定値が得られるような高精度な学習を
実現でき、また、他の領域に影響を与えることなく推定
精度の悪い領域の推定精度をのみを再学習により向上で
き、的確かつ効率的に学習ができる学習制御装置および
学習制御方法を得ることを目的とする。
【0019】
【課題を解決するための手段】上記課題を解決するため
に、本願の請求項1の発明に係る学習制御装置は、推定
対象パラメータに関連する複数の入力パラメータ値の入
力を受け、この入力パラメータ値から推定対象パラメー
タ値を推定し、この推定値を目標値追従制御量演算に用
いるためのニューラルネットワークと、ニューロ推定値
と教師信号との二乗誤差に対し乗算すべき重み係数の値
を、ニューロ推定値と教師信号と目標値との相対関係に
応じて変更する誤差係数変更手段と、前記重み係数を用
いて学習時の評価関数を演算する評価関数演算手段とを
備え、前記評価関数に基づき前記ニューラルネットワー
クの学習を行うようにしたものである。
に、本願の請求項1の発明に係る学習制御装置は、推定
対象パラメータに関連する複数の入力パラメータ値の入
力を受け、この入力パラメータ値から推定対象パラメー
タ値を推定し、この推定値を目標値追従制御量演算に用
いるためのニューラルネットワークと、ニューロ推定値
と教師信号との二乗誤差に対し乗算すべき重み係数の値
を、ニューロ推定値と教師信号と目標値との相対関係に
応じて変更する誤差係数変更手段と、前記重み係数を用
いて学習時の評価関数を演算する評価関数演算手段とを
備え、前記評価関数に基づき前記ニューラルネットワー
クの学習を行うようにしたものである。
【0020】また、本願の請求項2の発明に係る学習制
御方法は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、受け付けた入力パラメータ値
からニューラルネットワークにより推定対象パラメータ
値を推定し、この推定値を目標値追従制御量演算に用い
る際のニューラルネットワークの学習制御を行なう方法
において、ニューロ推定値と教師信号との二乗誤差に対
し乗算すべき重み係数の値を、ニューロ推定値と教師信
号と目標値との相対関係に応じて変更し、前記重み係数
を用いて学習時の評価関数を演算し、前記評価関数に基
づき前記ニューラルネットワークの学習を行うようにし
たものである。
御方法は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、受け付けた入力パラメータ値
からニューラルネットワークにより推定対象パラメータ
値を推定し、この推定値を目標値追従制御量演算に用い
る際のニューラルネットワークの学習制御を行なう方法
において、ニューロ推定値と教師信号との二乗誤差に対
し乗算すべき重み係数の値を、ニューロ推定値と教師信
号と目標値との相対関係に応じて変更し、前記重み係数
を用いて学習時の評価関数を演算し、前記評価関数に基
づき前記ニューラルネットワークの学習を行うようにし
たものである。
【0021】また、本願の請求項3の発明に係る学習制
御装置は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、この入力パラメータ値から推
定対象パラメータ値を推定し、この推定値を目標値追従
制御量演算に用いるためのニューラルネットワークと、
ニューロ推定値と目標値との偏差の符号の種類を判定す
る推定偏差符号判定手段と、教師信号と目標値との偏差
の符号の種類を判定する教師偏差符号判定手段と、前記
推定偏差符号判定手段および教師偏差符号判定手段によ
り判定されたそれぞれの符号の種類を比較する符号比較
手段と、前記符号比較手段により符号が異なると判別さ
れた場合、前記ニューロ推定値と前記教師信号との二乗
誤差に乗じるべき重み係数の値を大きくする二乗誤差係
数変更手段と、前記重み係数を用いて学習時の評価関数
を演算する評価関数演算手段とを備え、前記評価関数に
基づき前記ニューラルネットワークの学習を行うように
したものである。
御装置は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、この入力パラメータ値から推
定対象パラメータ値を推定し、この推定値を目標値追従
制御量演算に用いるためのニューラルネットワークと、
ニューロ推定値と目標値との偏差の符号の種類を判定す
る推定偏差符号判定手段と、教師信号と目標値との偏差
の符号の種類を判定する教師偏差符号判定手段と、前記
推定偏差符号判定手段および教師偏差符号判定手段によ
り判定されたそれぞれの符号の種類を比較する符号比較
手段と、前記符号比較手段により符号が異なると判別さ
れた場合、前記ニューロ推定値と前記教師信号との二乗
誤差に乗じるべき重み係数の値を大きくする二乗誤差係
数変更手段と、前記重み係数を用いて学習時の評価関数
を演算する評価関数演算手段とを備え、前記評価関数に
基づき前記ニューラルネットワークの学習を行うように
したものである。
【0022】また、本願の請求項4の発明に係る学習制
御装置は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、この入力パラメータ値から推
定対象パラメータ値を推定し、この推定値を目標値追従
制御量演算に用いるためのニューラルネットワークと、
ニューロ推定値と目標値との偏差の符号の種類を判定す
る推定偏差符号判定手段と、前記ニューロ推定値と前記
目標値との偏差の絶対値を算出する推定偏差絶対値算出
手段と、教師信号と目標値との偏差の符号の種類を判定
する教師偏差符号判定手段と、前記教師信号と前記目標
値との偏差の絶対値を算出する教師信号偏差絶対値算出
手段と、前記推定偏差符号判定手段および教師信号偏差
符号判定手段により判定されたそれぞれの符号の種類を
比較する符号比較手段と、前記推定偏差絶対値算出手段
および教師信号偏差絶対値算出手段により算出された絶
対値の大小を比較する絶対値比較手段と、前記符号比較
手段により符号の種類が同じであると判別され、かつ前
記絶対値比較手段により前記ニューロ推定値と前記目標
値との偏差の絶対値の方が前記教師信号と前記目標値と
の偏差の絶対値よりも小さいと判定された場合、前記ニ
ューロ推定値と前記教師信号との二乗誤差に乗ずるべき
重み係数の値を大きくする二乗誤差係数変更手段と、前
記重み係数を用いて学習時の評価関数を演算する評価関
数演算手段とを備え、前記評価関数に基づき学習を行う
ようにしたものである。
御装置は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、この入力パラメータ値から推
定対象パラメータ値を推定し、この推定値を目標値追従
制御量演算に用いるためのニューラルネットワークと、
ニューロ推定値と目標値との偏差の符号の種類を判定す
る推定偏差符号判定手段と、前記ニューロ推定値と前記
目標値との偏差の絶対値を算出する推定偏差絶対値算出
手段と、教師信号と目標値との偏差の符号の種類を判定
する教師偏差符号判定手段と、前記教師信号と前記目標
値との偏差の絶対値を算出する教師信号偏差絶対値算出
手段と、前記推定偏差符号判定手段および教師信号偏差
符号判定手段により判定されたそれぞれの符号の種類を
比較する符号比較手段と、前記推定偏差絶対値算出手段
および教師信号偏差絶対値算出手段により算出された絶
対値の大小を比較する絶対値比較手段と、前記符号比較
手段により符号の種類が同じであると判別され、かつ前
記絶対値比較手段により前記ニューロ推定値と前記目標
値との偏差の絶対値の方が前記教師信号と前記目標値と
の偏差の絶対値よりも小さいと判定された場合、前記ニ
ューロ推定値と前記教師信号との二乗誤差に乗ずるべき
重み係数の値を大きくする二乗誤差係数変更手段と、前
記重み係数を用いて学習時の評価関数を演算する評価関
数演算手段とを備え、前記評価関数に基づき学習を行う
ようにしたものである。
【0023】また、本願の請求項5の発明に係る学習制
御装置は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、この入力パラメータ値から推
定対象パラメータ値を推定し、この推定値を目標値追従
制御量演算に用いるための,それぞれの学習条件に対応
した複数のニューロ構成を有するニューラルネットワー
クと、制御対象の動特性に関連する状態量を検出する状
態量検出手段と、前記検出値に基づき前記ニューラルネ
ットワークの学習条件を判定する学習条件判定手段と、
前記状態量に基づき前記ニューラルネットワークのニュ
ーロ構成の中から現在の条件に対応するニューロ出力値
のみを選択するニューロ選択手段とを備えるようにした
ものである。
御装置は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、この入力パラメータ値から推
定対象パラメータ値を推定し、この推定値を目標値追従
制御量演算に用いるための,それぞれの学習条件に対応
した複数のニューロ構成を有するニューラルネットワー
クと、制御対象の動特性に関連する状態量を検出する状
態量検出手段と、前記検出値に基づき前記ニューラルネ
ットワークの学習条件を判定する学習条件判定手段と、
前記状態量に基づき前記ニューラルネットワークのニュ
ーロ構成の中から現在の条件に対応するニューロ出力値
のみを選択するニューロ選択手段とを備えるようにした
ものである。
【0024】また、本願の請求項6の発明に係る学習制
御装置は、請求項5記載の学習制御装置において、前記
ニューロ選択手段は、現在の状態量がある学習条件を満
たす場合、その条件に対応するニューロ出力に“1”
を、それ以外のニューロ出力には“0”となるステップ
関数を乗ずることによりニューロ出力を選択するものと
したものである。
御装置は、請求項5記載の学習制御装置において、前記
ニューロ選択手段は、現在の状態量がある学習条件を満
たす場合、その条件に対応するニューロ出力に“1”
を、それ以外のニューロ出力には“0”となるステップ
関数を乗ずることによりニューロ出力を選択するものと
したものである。
【0025】また、本願の請求項7の発明に係る学習制
御装置は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、この入力パラメータ値から推
定対象パラメータ値を推定し、この推定値を目標値追従
制御量演算に用いるための,それぞれの学習条件に対応
した複数のニューロ構成を有するニューラルネットワー
クと、制御対象の動特性に関連する状態量を検出する状
態量検出手段と、前記検出値に基づき前記ニューラルネ
ットワークの学習条件を判定する学習条件判定手段と、
それぞれのニューロ構成の結合係数を学習した学習デー
タセットを格納している学習データ格納手段と、前記状
態量に基づき前記学習条件毎の学習データを作成する学
習データ作成手段と、前記学習データ格納手段で格納さ
れている条件に対応する学習データセットと前記学習デ
ータ作成手段で新たに作成された学習データとを用いニ
ューロ結合係数の学習を行う学習手段と、前記条件に対
応するニューロ構成を選択し前記学習結果である結合係
数に更新する係数更新ニューロ選択手段とを備えるよう
にしたものである。
御装置は、推定対象パラメータに関連する複数の入力パ
ラメータ値の入力を受け、この入力パラメータ値から推
定対象パラメータ値を推定し、この推定値を目標値追従
制御量演算に用いるための,それぞれの学習条件に対応
した複数のニューロ構成を有するニューラルネットワー
クと、制御対象の動特性に関連する状態量を検出する状
態量検出手段と、前記検出値に基づき前記ニューラルネ
ットワークの学習条件を判定する学習条件判定手段と、
それぞれのニューロ構成の結合係数を学習した学習デー
タセットを格納している学習データ格納手段と、前記状
態量に基づき前記学習条件毎の学習データを作成する学
習データ作成手段と、前記学習データ格納手段で格納さ
れている条件に対応する学習データセットと前記学習デ
ータ作成手段で新たに作成された学習データとを用いニ
ューロ結合係数の学習を行う学習手段と、前記条件に対
応するニューロ構成を選択し前記学習結果である結合係
数に更新する係数更新ニューロ選択手段とを備えるよう
にしたものである。
【0026】また、本願の請求項8の発明に係る学習制
御装置は、請求項7記載の学習制御装置において、前記
学習手段において実際の学習に用いられる学習データセ
ットは、最新の学習データセットと同数分、古い学習デ
ータセットを消去し更新したものであり、前記学習デー
タセットは常に一定のセット数であるようにしたもので
ある。
御装置は、請求項7記載の学習制御装置において、前記
学習手段において実際の学習に用いられる学習データセ
ットは、最新の学習データセットと同数分、古い学習デ
ータセットを消去し更新したものであり、前記学習デー
タセットは常に一定のセット数であるようにしたもので
ある。
【0027】また、本願の請求項9の発明に係る学習制
御装置は、請求項7または8記載の学習制御装置におい
て、前記学習データ格納手段において、格納されている
学習データセットは、ニューロ演算処理を行うニューラ
ルネットワーク自体が学習対象となっているオンライン
状態において常に更新されている学習データセットであ
る。
御装置は、請求項7または8記載の学習制御装置におい
て、前記学習データ格納手段において、格納されている
学習データセットは、ニューロ演算処理を行うニューラ
ルネットワーク自体が学習対象となっているオンライン
状態において常に更新されている学習データセットであ
る。
【0028】また、本願の請求項10の発明に係る学習
制御装置は、推定対象パラメータに関連する複数の入力
パラメータ値の入力を受け、この入力パラメータ値から
推定対象パラメータ値を推定し、この推定値を目標値追
従制御量演算に用いるための,それぞれの学習条件に対
応した複数のニューロ構成を有するニューラルネットワ
ークと、制御対象の動特性に関連する状態量を検出する
状態量検出手段と、前記検出値に基づき学習条件を判定
する学習条件判定手段と、それぞれのニューロ構成の結
合係数を学習した学習データセットを格納している学習
データ格納手段と、前記状態量に基づき前記学習条件毎
の新しい学習データを作成する学習データ作成手段と、
前記学習データ格納手段で格納されている前記学習条件
に対応する全てのニューロ構成の学習データセットと前
記学習データ作成手段で新たに作成された学習データと
を用い、それぞれのニューロ構成に対する学習データセ
ットを作成する学習データセット作成手段と、前記学習
データ格納手段内の対応するデータをこの新たに作成さ
れた学習データセットに更新する学習データ更新手段
と、前記新たに作成された学習データセットを用い前記
学習条件に対応する全てのニューロ結合係数の学習を行
う学習手段と、前記対応する全てのニューロ構成を選択
し前記学習結果である結合係数に更新する係数更新ニュ
ーロ選択手段と、前記学習条件に対応する全てのニュー
ロ構成を選択するニューロ構成選択手段と、前記対応す
る全てのニューロ出力から制御を行う際に用いるニュー
ロ推定値を算出する推定値算出手段とを備え、前記推定
値を制御量演算に用いるようにしたものである。
制御装置は、推定対象パラメータに関連する複数の入力
パラメータ値の入力を受け、この入力パラメータ値から
推定対象パラメータ値を推定し、この推定値を目標値追
従制御量演算に用いるための,それぞれの学習条件に対
応した複数のニューロ構成を有するニューラルネットワ
ークと、制御対象の動特性に関連する状態量を検出する
状態量検出手段と、前記検出値に基づき学習条件を判定
する学習条件判定手段と、それぞれのニューロ構成の結
合係数を学習した学習データセットを格納している学習
データ格納手段と、前記状態量に基づき前記学習条件毎
の新しい学習データを作成する学習データ作成手段と、
前記学習データ格納手段で格納されている前記学習条件
に対応する全てのニューロ構成の学習データセットと前
記学習データ作成手段で新たに作成された学習データと
を用い、それぞれのニューロ構成に対する学習データセ
ットを作成する学習データセット作成手段と、前記学習
データ格納手段内の対応するデータをこの新たに作成さ
れた学習データセットに更新する学習データ更新手段
と、前記新たに作成された学習データセットを用い前記
学習条件に対応する全てのニューロ結合係数の学習を行
う学習手段と、前記対応する全てのニューロ構成を選択
し前記学習結果である結合係数に更新する係数更新ニュ
ーロ選択手段と、前記学習条件に対応する全てのニュー
ロ構成を選択するニューロ構成選択手段と、前記対応す
る全てのニューロ出力から制御を行う際に用いるニュー
ロ推定値を算出する推定値算出手段とを備え、前記推定
値を制御量演算に用いるようにしたものである。
【0029】また、本願の請求項11の発明に係る学習
制御装置は、請求項10記載の学習制御装置において、
前記ニューラルネットワークにおける,隣り合う条件下
におけるニューロ構成は、共通の制御対象動特性の表現
部分を持つようにしたものである。
制御装置は、請求項10記載の学習制御装置において、
前記ニューラルネットワークにおける,隣り合う条件下
におけるニューロ構成は、共通の制御対象動特性の表現
部分を持つようにしたものである。
【0030】また、本願の請求項12の発明に係る学習
制御装置は、請求項10または11記載の学習制御装置
において、前記推定値算出手段は、対応する全てのニュ
ーロ出力値の平均値を、制御で用いるニューロ推定値と
して算出するようにしたものである。
制御装置は、請求項10または11記載の学習制御装置
において、前記推定値算出手段は、対応する全てのニュ
ーロ出力値の平均値を、制御で用いるニューロ推定値と
して算出するようにしたものである。
【0031】
【発明の実施の形態】以下、図面を参照しながら本発明
の実施の形態について説明する。
の実施の形態について説明する。
【0032】(実施の形態1)ニューロ出力値を用いて
目標値追従制御を行う際、ニューロ推定値と推定対象パ
ラメータ値との誤差によっては、良好な目標値制御を行
うことができなくなることがある。本実施の形態1は、
ニューロ推定値を用いた制御性能の向上を図るべく、ニ
ューロ学習時に目標値を考慮に入れた高精度の学習制御
を行うようにしたものである。
目標値追従制御を行う際、ニューロ推定値と推定対象パ
ラメータ値との誤差によっては、良好な目標値制御を行
うことができなくなることがある。本実施の形態1は、
ニューロ推定値を用いた制御性能の向上を図るべく、ニ
ューロ学習時に目標値を考慮に入れた高精度の学習制御
を行うようにしたものである。
【0033】すなわち、従来例のように、ニューロ推定
値と推定対象パラメータ値の差の絶対値を小さくするこ
とのみを考慮すれば、却って制御性能を劣化させること
があるが、本実施の形態1では、推定値と目標値のずれ
の方向に着目し、制御の方向がこれに一致するような学
習を行うようにしたものである。
値と推定対象パラメータ値の差の絶対値を小さくするこ
とのみを考慮すれば、却って制御性能を劣化させること
があるが、本実施の形態1では、推定値と目標値のずれ
の方向に着目し、制御の方向がこれに一致するような学
習を行うようにしたものである。
【0034】図1に本願発明の実施の形態1による学習
制御装置の機能ブロック図を示す。図において、11は
エンジン等の制御対象、12はこの制御対象11より得
られるパラメータYに対しニューロ演算を行い推定値Y
nnを出力するニューロ演算手段、13はこの制御対象
の制御目標値Yrefを算出する目標値算出手段、14
はニューロ演算手段12および目標値算出手段13の演
算結果に基づいて制御対象11の制御量Uを演算する制
御量演算手段、15は制御対象11および目標値算出手
段13より得られるパラメータに基づきニューロ演算手
段12を学習させるニューロ学習手段、16はこのニュ
ーロ学習手段15に内蔵され誤差係数を変更する誤差係
数変更手段、17はこの誤差係数変更手段16によりニ
ューロ演算手段12の結合係数Wを書き換える結合係数
書き換え手段である。
制御装置の機能ブロック図を示す。図において、11は
エンジン等の制御対象、12はこの制御対象11より得
られるパラメータYに対しニューロ演算を行い推定値Y
nnを出力するニューロ演算手段、13はこの制御対象
の制御目標値Yrefを算出する目標値算出手段、14
はニューロ演算手段12および目標値算出手段13の演
算結果に基づいて制御対象11の制御量Uを演算する制
御量演算手段、15は制御対象11および目標値算出手
段13より得られるパラメータに基づきニューロ演算手
段12を学習させるニューロ学習手段、16はこのニュ
ーロ学習手段15に内蔵され誤差係数を変更する誤差係
数変更手段、17はこの誤差係数変更手段16によりニ
ューロ演算手段12の結合係数Wを書き換える結合係数
書き換え手段である。
【0035】次に動作について説明する。制御対象11
より推定対象パラメータYに関連する複数の入力パラメ
ータ値の入力を受け付け、受け付けた入力パラメータ値
からニューロ演算手段12により推定対象パラメータ値
を推定し、目標値算出手段13により制御対象11の状
態に応じた制御目標値Yrefを算出し、前記推定値Y
nnを前記目標値Yrefに追従制御させる制御量Uを
得る演算を制御量演算手段14で行う。
より推定対象パラメータYに関連する複数の入力パラメ
ータ値の入力を受け付け、受け付けた入力パラメータ値
からニューロ演算手段12により推定対象パラメータ値
を推定し、目標値算出手段13により制御対象11の状
態に応じた制御目標値Yrefを算出し、前記推定値Y
nnを前記目標値Yrefに追従制御させる制御量Uを
得る演算を制御量演算手段14で行う。
【0036】前記ニューロ演算手段12のニューロ結合
係数Wはニューロ学習手段15内の誤差係数変更手段1
6により、前記目標値Yrefを考慮に入れた学習によ
り算出され、結合係数書き換え手段17により書き換え
られる。前記誤差係数変更手段16では、学習時に用い
るニューロ推定値と教師信号との誤差評価関数の重み係
数αを、ニューロ推定値と教師信号と目標値との相対位
置関係に応じて変更し、ニューロ学習手段15により、
この重み係数αを用いた評価関数に基づき結合係数の学
習を行う。
係数Wはニューロ学習手段15内の誤差係数変更手段1
6により、前記目標値Yrefを考慮に入れた学習によ
り算出され、結合係数書き換え手段17により書き換え
られる。前記誤差係数変更手段16では、学習時に用い
るニューロ推定値と教師信号との誤差評価関数の重み係
数αを、ニューロ推定値と教師信号と目標値との相対位
置関係に応じて変更し、ニューロ学習手段15により、
この重み係数αを用いた評価関数に基づき結合係数の学
習を行う。
【0037】図2に従来のニューロ学習フロー図を、図
3に本実施の形態1におけるニューロ学習フロー図を示
し、これらを用いて、本実施の形態1によるニューロ学
習を従来例におけるものと対比しながら説明する。従来
のニューロ学習は、先ず、実データを用いて、ニューロ
入力データ列INPおよびこれに対応する教師信号Yt
のセットである学習データセットを作成し(ステップ2
01)、前記ニューロ入力データ列INPiを用いニュ
ーロ推定値Ynn(i)を算出し(ステップ202)、
前記教師信号Yt(i)と前記ニューロ推定値Ynn
(i)との誤差e(i)に基づく評価関数E(=Σe2
/2)を算出し(ステップ203)、前記評価関数Eを
減少させるべくニューロ結合係数を更新する(ステップ
204)。そして、更新された結合係数を用いて評価関
数Enewを算出し、目標精度を達成しているか否かを
判定し(ステップ205)、達成していなければステッ
プ202に戻り学習を進めてゆき、達成した時点で学習
が終了となる。
3に本実施の形態1におけるニューロ学習フロー図を示
し、これらを用いて、本実施の形態1によるニューロ学
習を従来例におけるものと対比しながら説明する。従来
のニューロ学習は、先ず、実データを用いて、ニューロ
入力データ列INPおよびこれに対応する教師信号Yt
のセットである学習データセットを作成し(ステップ2
01)、前記ニューロ入力データ列INPiを用いニュ
ーロ推定値Ynn(i)を算出し(ステップ202)、
前記教師信号Yt(i)と前記ニューロ推定値Ynn
(i)との誤差e(i)に基づく評価関数E(=Σe2
/2)を算出し(ステップ203)、前記評価関数Eを
減少させるべくニューロ結合係数を更新する(ステップ
204)。そして、更新された結合係数を用いて評価関
数Enewを算出し、目標精度を達成しているか否かを
判定し(ステップ205)、達成していなければステッ
プ202に戻り学習を進めてゆき、達成した時点で学習
が終了となる。
【0038】これに対し、本実施の形態1では、ステッ
プ201で学習データセットを作成し、ステップ202
でニューロ推定値Ynn(i)を算出し、ステップ30
1で前記教師信号Yt(i)、推定値Ynn(i)、制
御目標値Yref(i)より誤差評価関数の重み係数α
(i)を決定し、ステップ302により前記Yt(i)
とYnn(i)との誤差e(i)と前記重み係数α
(i)を用い評価関数E’を算出し、ステップ303に
より前記評価関数E’を減少させるべくニューロ結合係
数を更新する。ステップ304において、更新された結
合係数を用いて評価関数E’newを算出し目標精度を
達成しているか否かを判定し、達成していなければステ
ップ202に戻り学習を進めてゆき、目標精度を達成し
た時点で学習が終了となる。
プ201で学習データセットを作成し、ステップ202
でニューロ推定値Ynn(i)を算出し、ステップ30
1で前記教師信号Yt(i)、推定値Ynn(i)、制
御目標値Yref(i)より誤差評価関数の重み係数α
(i)を決定し、ステップ302により前記Yt(i)
とYnn(i)との誤差e(i)と前記重み係数α
(i)を用い評価関数E’を算出し、ステップ303に
より前記評価関数E’を減少させるべくニューロ結合係
数を更新する。ステップ304において、更新された結
合係数を用いて評価関数E’newを算出し目標精度を
達成しているか否かを判定し、達成していなければステ
ップ202に戻り学習を進めてゆき、目標精度を達成し
た時点で学習が終了となる。
【0039】すなわち、従来の学習フローでは、図24
に示すように、単に、ニューロ推定値と目標値との差の
絶対値が小さくなることのみを規範として学習制御を行
っているため、学習後のニューロはニューロ推定値と目
標値との位置関係によっては、目標より遠ざかる方向に
制御を進めてしまい、却って制御性能を劣化させてしま
うことがあった。
に示すように、単に、ニューロ推定値と目標値との差の
絶対値が小さくなることのみを規範として学習制御を行
っているため、学習後のニューロはニューロ推定値と目
標値との位置関係によっては、目標より遠ざかる方向に
制御を進めてしまい、却って制御性能を劣化させてしま
うことがあった。
【0040】これに対し、本実施の形態1の学習フロー
によれば、図25に示すように、たとえ、絶対値が小さ
くても、目標より遠ざかる方向に制御を進めてしまう方
向に対しては誤差評価関数の重み係数αの値をより大き
くし、目標に近づく方向に制御を行う方向に対してはこ
の重み係数αの値をより小さくすることにより、いかな
る場合でも目標に近づく方向に制御を行うような学習を
行うようにしている。このため、フェールセーフな制御
を行うように学習を行うことが可能となり、オンライン
で学習を行う場合でも、常に安全な方向に制御を行うよ
うに学習を制御することが可能となる。
によれば、図25に示すように、たとえ、絶対値が小さ
くても、目標より遠ざかる方向に制御を進めてしまう方
向に対しては誤差評価関数の重み係数αの値をより大き
くし、目標に近づく方向に制御を行う方向に対してはこ
の重み係数αの値をより小さくすることにより、いかな
る場合でも目標に近づく方向に制御を行うような学習を
行うようにしている。このため、フェールセーフな制御
を行うように学習を行うことが可能となり、オンライン
で学習を行う場合でも、常に安全な方向に制御を行うよ
うに学習を制御することが可能となる。
【0041】図4に図1のニューロ学習手段15内の処
理機能のブロック図を示す。図において、41は学習デ
ータセットを作成する学習データセット作成部、42は
この学習データセットに基づき推定値を算出する推定値
算出部、43はこの推定値に基づき評価関数を算出する
評価関数算出部、44はこの評価関数に基づき係数を更
新する係数更新部、45は推定値に基づき誤差評価を行
う誤差評価部、16は学習データセット、推定値および
目標値に基づき誤差係数を変更する誤差係数変更手段で
ある。
理機能のブロック図を示す。図において、41は学習デ
ータセットを作成する学習データセット作成部、42は
この学習データセットに基づき推定値を算出する推定値
算出部、43はこの推定値に基づき評価関数を算出する
評価関数算出部、44はこの評価関数に基づき係数を更
新する係数更新部、45は推定値に基づき誤差評価を行
う誤差評価部、16は学習データセット、推定値および
目標値に基づき誤差係数を変更する誤差係数変更手段で
ある。
【0042】次に動作について説明する。学習データセ
ット作成部41は制御対象からの複数のパラメータおよ
び制御対象の目標値Yに基づき学習データセットを作成
する。推定値算出部42はこの学習データセット作成部
41により作成された学習データセットおよび係数更新
部44からの重み係数Wに基づき推定値を算出する。誤
差係数変更手段16はこの学習データセット作成部41
からの学習データセット、推定値算出部42からの推定
値Ynn及び図1の目標値算出手段13からの目標値Y
refに基づき誤差係数αを変更する。そして、誤差関
数算出部43はこの誤差係数変更手段16からの誤差係
数α、学習データセット作成部41からの学習データセ
ットYt、推定値算出部42からの推定値Ynnに基づ
き誤差評価関数Eを算出し、係数更新部44はこの評価
関数算出部43からの誤差評価関数Eに基づき重み係数
Wを更新する。そして、推定値算出部42はこの学習デ
ータセット作成部41からの学習データセットYtおよ
び係数更新部44からの重み係数Wに基づき推定値Yn
nを算出し、誤差評価部45はこの推定値算出部42か
らの推定値Ynnに基づき誤差評価を行った重み付けを
結合係数書き換え手段17に出力する。
ット作成部41は制御対象からの複数のパラメータおよ
び制御対象の目標値Yに基づき学習データセットを作成
する。推定値算出部42はこの学習データセット作成部
41により作成された学習データセットおよび係数更新
部44からの重み係数Wに基づき推定値を算出する。誤
差係数変更手段16はこの学習データセット作成部41
からの学習データセット、推定値算出部42からの推定
値Ynn及び図1の目標値算出手段13からの目標値Y
refに基づき誤差係数αを変更する。そして、誤差関
数算出部43はこの誤差係数変更手段16からの誤差係
数α、学習データセット作成部41からの学習データセ
ットYt、推定値算出部42からの推定値Ynnに基づ
き誤差評価関数Eを算出し、係数更新部44はこの評価
関数算出部43からの誤差評価関数Eに基づき重み係数
Wを更新する。そして、推定値算出部42はこの学習デ
ータセット作成部41からの学習データセットYtおよ
び係数更新部44からの重み係数Wに基づき推定値Yn
nを算出し、誤差評価部45はこの推定値算出部42か
らの推定値Ynnに基づき誤差評価を行った重み付けを
結合係数書き換え手段17に出力する。
【0043】本実施の形態1によれば、上記構成とする
ことにより、目標値と推定値のずれの方向を考慮に入れ
た学習を行うことが可能となり、ニューロ推定値を用い
た目標値追従制御の制御性能を、従来の学習方式に比べ
向上させることが可能となる。
ことにより、目標値と推定値のずれの方向を考慮に入れ
た学習を行うことが可能となり、ニューロ推定値を用い
た目標値追従制御の制御性能を、従来の学習方式に比べ
向上させることが可能となる。
【0044】なお、上記制御装置はオンラインで学習を
行う構成としたが、オフラインで予め目標値を考慮に入
れた上記学習フローによりニューロ結合係数を算出して
おき、図5に示すニューロ演算手段51内の結合係数と
してROMに書き込んだ構成で制御を行っても、上記と
同様の効果を得ることができる。
行う構成としたが、オフラインで予め目標値を考慮に入
れた上記学習フローによりニューロ結合係数を算出して
おき、図5に示すニューロ演算手段51内の結合係数と
してROMに書き込んだ構成で制御を行っても、上記と
同様の効果を得ることができる。
【0045】また、上記の実施の形態1では、ニューロ
の出力が制御対象の出力となる,いわゆる順方向ニュー
ロ構成であり、学習制御装置におけるニューロ推定対象
パラメータは、これが目標値となるように制御したいパ
ラメータとしたが、図6に示すようにニューロ出力が制
御対象への入力となる、即ち制御対象の逆システムを学
習する,いわゆる逆方向ニューロ構成としても良い。逆
方向ニューロ構成においての学習も、前述と同様に目標
値Yrefを考慮に入れた出力誤差評価関数に基づき、
学習を行うことにより、目標値追従制御の制御性能を従
来の学習に比べ向上させることが可能となる。
の出力が制御対象の出力となる,いわゆる順方向ニュー
ロ構成であり、学習制御装置におけるニューロ推定対象
パラメータは、これが目標値となるように制御したいパ
ラメータとしたが、図6に示すようにニューロ出力が制
御対象への入力となる、即ち制御対象の逆システムを学
習する,いわゆる逆方向ニューロ構成としても良い。逆
方向ニューロ構成においての学習も、前述と同様に目標
値Yrefを考慮に入れた出力誤差評価関数に基づき、
学習を行うことにより、目標値追従制御の制御性能を従
来の学習に比べ向上させることが可能となる。
【0046】以下では、ニューロ推定値を用いて目標値
追従制御を行う場合の、ニューロ学習方法の一例につい
て具体的に示す。図7に本願発明の実施の形態1による
学習制御装置の誤差係数変更手段の具体的な構成に関す
る機能ブロック図を示す。図7において、71はニュー
ロ推定値Ynnと目標値Yrefとの偏差e1の符号を
判定する推定偏差符号判定手段、72は教師信号Ytと
目標値Yrefとの偏差e2の符号を判定する教師偏差
符号判定手段、73はそれぞれの符号を比較する符号比
較手段、74は前記符号比較手段73により偏差e1と
e2の符号が異なると判別された場合、前記ニューロ推
定値Ynnと前記教師信号Ytとの二乗誤差e2に掛か
る重み係数αを大きくする二乗誤差係数変更手段、75
は前記重み係数αを用いて学習時の評価関数Eを演算
し、この評価関数Eに基づきニューロ結合係数を修正す
る結合係数修正手段であり、図7の学習制御装置はこれ
ら推定偏差符号判定手段71,教師偏差符号判定手段7
2,符号比較手段73,二乗誤差係数変更手段74,お
よび結合係数修正手段75を有する構成とする。
追従制御を行う場合の、ニューロ学習方法の一例につい
て具体的に示す。図7に本願発明の実施の形態1による
学習制御装置の誤差係数変更手段の具体的な構成に関す
る機能ブロック図を示す。図7において、71はニュー
ロ推定値Ynnと目標値Yrefとの偏差e1の符号を
判定する推定偏差符号判定手段、72は教師信号Ytと
目標値Yrefとの偏差e2の符号を判定する教師偏差
符号判定手段、73はそれぞれの符号を比較する符号比
較手段、74は前記符号比較手段73により偏差e1と
e2の符号が異なると判別された場合、前記ニューロ推
定値Ynnと前記教師信号Ytとの二乗誤差e2に掛か
る重み係数αを大きくする二乗誤差係数変更手段、75
は前記重み係数αを用いて学習時の評価関数Eを演算
し、この評価関数Eに基づきニューロ結合係数を修正す
る結合係数修正手段であり、図7の学習制御装置はこれ
ら推定偏差符号判定手段71,教師偏差符号判定手段7
2,符号比較手段73,二乗誤差係数変更手段74,お
よび結合係数修正手段75を有する構成とする。
【0047】図9にこの図7の学習制御装置の処理フロ
ーを示す。まず、ステップ901において、前記Ynn
と前記Yrefとの差e1の符号sign(e1)を判
定し、次にステップ902により前記YtとYrefと
の差e2の符号sign(e2)を判定する。ステップ
903により、前記符号sign(e1)とsign
(e2)の符号が同じ種類かどうかを比較し、ステップ
904により、前記比較結果において符号が異なる場
合、前記αにaを、符号が同じ場合はbを与え(但しa
>b>0とする)、ステップ905において、前記Yt
とYnnとの推定誤差eと前記αとにより評価関数Eを
算出し、このEを用い、バックプロパゲーション法等に
よりニューロ結合係数Wの修正量△Wを演算する。
ーを示す。まず、ステップ901において、前記Ynn
と前記Yrefとの差e1の符号sign(e1)を判
定し、次にステップ902により前記YtとYrefと
の差e2の符号sign(e2)を判定する。ステップ
903により、前記符号sign(e1)とsign
(e2)の符号が同じ種類かどうかを比較し、ステップ
904により、前記比較結果において符号が異なる場
合、前記αにaを、符号が同じ場合はbを与え(但しa
>b>0とする)、ステップ905において、前記Yt
とYnnとの推定誤差eと前記αとにより評価関数Eを
算出し、このEを用い、バックプロパゲーション法等に
よりニューロ結合係数Wの修正量△Wを演算する。
【0048】図10は、学習データにおける教師信号Y
tと目標値Yrefとニューロ推定値Ynnとの位置関
係を示す模式図である。図9のフローにより、図10
(a)に示すように、目標値Yrefに対してYtとY
nnがそれぞれ反対側にある場合には、αを大きく与
え、図10(b)に示すように、目標値Yrefに対し
YtとYnnが同じ側にある場合、αを前記(a)の状
態で与えた値に比べ小さく設定する。
tと目標値Yrefとニューロ推定値Ynnとの位置関
係を示す模式図である。図9のフローにより、図10
(a)に示すように、目標値Yrefに対してYtとY
nnがそれぞれ反対側にある場合には、αを大きく与
え、図10(b)に示すように、目標値Yrefに対し
YtとYnnが同じ側にある場合、αを前記(a)の状
態で与えた値に比べ小さく設定する。
【0049】以上の構成で学習を行うことにより、目標
値に対し反対側の推定値を算出する結合係数の場合は、
より修正が進み、推定値が目標値に対し同じ側に来るよ
うに学習が進む。この様に学習されたニューロを用い目
標値となる制御量を算出することにより、逆方向に補正
量を演算してしまうことが少なくなり、制御機能を向上
させることが可能となる。このため、制御結果がフェー
ルセーフとなるような学習を行うことが可能となり、し
たがって、オンラインで学習を行う場合であっても、そ
の学習結果を用いて制御を行う場合に目標値に対し同方
向の推定値を算出することが可能となる。
値に対し反対側の推定値を算出する結合係数の場合は、
より修正が進み、推定値が目標値に対し同じ側に来るよ
うに学習が進む。この様に学習されたニューロを用い目
標値となる制御量を算出することにより、逆方向に補正
量を演算してしまうことが少なくなり、制御機能を向上
させることが可能となる。このため、制御結果がフェー
ルセーフとなるような学習を行うことが可能となり、し
たがって、オンラインで学習を行う場合であっても、そ
の学習結果を用いて制御を行う場合に目標値に対し同方
向の推定値を算出することが可能となる。
【0050】以下では、ニューロ推定値を用いて目標値
追従制御を行う場合の、ニューロ学習方法の他の例につ
いて示すものである。図8に本願発明の実施の形態1に
よる学習制御装置の誤差係数変更手段の具体的な構成に
関する機能ブロック図を示す。図8において、71はニ
ューロ推定値Ynnと目標値Yrefとの偏差e1の符
号を判定する推定偏差符号判定手段、72は教師信号Y
tと目標値Yrefとの偏差e2の符号を判定する教師
偏差符号判定手段、73はそれぞれの偏差e1とe2の
符号を比較する符号比較手段、81は前記ニューロ推定
値Ynnと前記目標値Yrefとの偏差e1の絶対値を
算出する推定偏差絶対値算出手段、82は前記教師信号
Ytと前記目標値Yrefとの偏差e2の絶対値を算出
する教師信号偏差絶対値算出手段、83はそれぞれの絶
対値量を比較する絶対値比較手段、84は前記符号比較
手段73により符号が同じ種類であると判別され、且つ
前記絶対値比較手段83により前記ニューロ推定値Yn
nと前記目標値Yrefとの偏差e1の絶対値の方が前
記教師信号Ytと前記目標値Yrefとの偏差e2の絶
対値よりも小さいと判別された場合、前記ニューロ推定
値Ynnと前記教師信号Ytとの二乗誤差e2に掛かる
重み係数αを大きくする二乗誤差係数変更手段、75は
前記重み係数αを用いて学習時の評価関数Eを演算し、
この評価関数Eに基づきニューロ結合係数を修正する結
合係数修正手段であり、この図8の学習制御装置はこれ
ら推定偏差符号判定手段71,教師偏差符号判定手段7
2,符号比較手段73,推定偏差絶対値算出手段81,
教師信号偏差絶対値算出手段82,絶対値比較手段8
3,二乗誤差係数変更手段84,および結合係数修正手
段75を有する構成とする。
追従制御を行う場合の、ニューロ学習方法の他の例につ
いて示すものである。図8に本願発明の実施の形態1に
よる学習制御装置の誤差係数変更手段の具体的な構成に
関する機能ブロック図を示す。図8において、71はニ
ューロ推定値Ynnと目標値Yrefとの偏差e1の符
号を判定する推定偏差符号判定手段、72は教師信号Y
tと目標値Yrefとの偏差e2の符号を判定する教師
偏差符号判定手段、73はそれぞれの偏差e1とe2の
符号を比較する符号比較手段、81は前記ニューロ推定
値Ynnと前記目標値Yrefとの偏差e1の絶対値を
算出する推定偏差絶対値算出手段、82は前記教師信号
Ytと前記目標値Yrefとの偏差e2の絶対値を算出
する教師信号偏差絶対値算出手段、83はそれぞれの絶
対値量を比較する絶対値比較手段、84は前記符号比較
手段73により符号が同じ種類であると判別され、且つ
前記絶対値比較手段83により前記ニューロ推定値Yn
nと前記目標値Yrefとの偏差e1の絶対値の方が前
記教師信号Ytと前記目標値Yrefとの偏差e2の絶
対値よりも小さいと判別された場合、前記ニューロ推定
値Ynnと前記教師信号Ytとの二乗誤差e2に掛かる
重み係数αを大きくする二乗誤差係数変更手段、75は
前記重み係数αを用いて学習時の評価関数Eを演算し、
この評価関数Eに基づきニューロ結合係数を修正する結
合係数修正手段であり、この図8の学習制御装置はこれ
ら推定偏差符号判定手段71,教師偏差符号判定手段7
2,符号比較手段73,推定偏差絶対値算出手段81,
教師信号偏差絶対値算出手段82,絶対値比較手段8
3,二乗誤差係数変更手段84,および結合係数修正手
段75を有する構成とする。
【0051】図11にこの図8の学習制御装置の処理フ
ローを示す。まず、ステップ1101において、前記Y
nnと前記Yrefとの差e1の符号sign(e1)
を判定し、ステップ1102により前記YtとYref
との差e2の符号sign(e2)を判定する。またス
テップ1103により前記偏差e1の絶対値abs(e
1)を算出し、ステップ1104により前記偏差e2の
絶対値abs(e2)を算出する。ステップ1105に
より、前記符号sign(e1)とsign(e2)の
符号が同符号かどうかを比較し、ステップ1106によ
り、前記比較結果において符号が異なる場合、前記重み
係数αにaを与える。また前記比較結果において符号が
同符号の場合、ステップ1107により、前記偏差の絶
対値abs(e1)とabs(e2)の大小を判定し、
ステップ1108により、前記判定結果においてabs
(e1)の方がabs(e2)よりも小さい場合、前記
重み係数αにb1を、逆の場合はb2を与え(但しa>
b1(>1>)>b2>0とする)、ステップ1109
において、前記YtとYnnとの推定誤差eと前記αと
により評価関数Eを算出し、このEを用い、バックプロ
パゲーション法等によりニューロ結合係数Wの修正量△
Wを演算する。
ローを示す。まず、ステップ1101において、前記Y
nnと前記Yrefとの差e1の符号sign(e1)
を判定し、ステップ1102により前記YtとYref
との差e2の符号sign(e2)を判定する。またス
テップ1103により前記偏差e1の絶対値abs(e
1)を算出し、ステップ1104により前記偏差e2の
絶対値abs(e2)を算出する。ステップ1105に
より、前記符号sign(e1)とsign(e2)の
符号が同符号かどうかを比較し、ステップ1106によ
り、前記比較結果において符号が異なる場合、前記重み
係数αにaを与える。また前記比較結果において符号が
同符号の場合、ステップ1107により、前記偏差の絶
対値abs(e1)とabs(e2)の大小を判定し、
ステップ1108により、前記判定結果においてabs
(e1)の方がabs(e2)よりも小さい場合、前記
重み係数αにb1を、逆の場合はb2を与え(但しa>
b1(>1>)>b2>0とする)、ステップ1109
において、前記YtとYnnとの推定誤差eと前記αと
により評価関数Eを算出し、このEを用い、バックプロ
パゲーション法等によりニューロ結合係数Wの修正量△
Wを演算する。
【0052】図12は、学習データにおける教師信号Y
tと目標値Yrefとニューロ推定値Ynnとの位置関
係を示す模式図である。図12(a)に示すように目標
値Yrefに対してYtとYnnが同じ側にあり、かつ
abs(e1)<abs(e2)の場合、αを大きく与
え、図12(b)に示すように目標値Yrefに対しY
tとYnnが同じ側にあり、かつabs(e1)≧ab
s(e2)の場合、αを前記(a)の状態で与えた値に
比べ小さく設定する。
tと目標値Yrefとニューロ推定値Ynnとの位置関
係を示す模式図である。図12(a)に示すように目標
値Yrefに対してYtとYnnが同じ側にあり、かつ
abs(e1)<abs(e2)の場合、αを大きく与
え、図12(b)に示すように目標値Yrefに対しY
tとYnnが同じ側にあり、かつabs(e1)≧ab
s(e2)の場合、αを前記(a)の状態で与えた値に
比べ小さく設定する。
【0053】以上の構成で学習を行うことにより、目標
値に対し反対側の推定値を算出する結合係数の場合は、
より修正が進み、また同じ側にあっても、推定値が目標
値寄りにある場合、次回に、修正係数を用いた結果が目
標値とは反対側に移行するのを防ぎ、推定値が目標値に
対し常に同じ側に来るように学習収束する速度を早める
ことが可能となる。この様に学習されたニューロを用い
目標値となる制御量を算出することにより、本来の方向
とは逆方向に補正量を演算してしまうと言うことが少な
くなり、制御性能を向上させることが可能となる。
値に対し反対側の推定値を算出する結合係数の場合は、
より修正が進み、また同じ側にあっても、推定値が目標
値寄りにある場合、次回に、修正係数を用いた結果が目
標値とは反対側に移行するのを防ぎ、推定値が目標値に
対し常に同じ側に来るように学習収束する速度を早める
ことが可能となる。この様に学習されたニューロを用い
目標値となる制御量を算出することにより、本来の方向
とは逆方向に補正量を演算してしまうと言うことが少な
くなり、制御性能を向上させることが可能となる。
【0054】このため、フェールセーフな学習が可能と
なり、したがって、オンラインで学習を行う場合であっ
ても、その学習結果を用いて制御を行う場合に目標値に
対し同方向の推定値を算出することが可能となる。な
お、abs(e1)の値に応じてαに与える値を変化さ
せる構成としても良く、例えば、abs(e1)がゼロ
に近づくに連れてbの値をaに近づけていく構成として
も良く、所望の推定結果を早く得ることが可能となる。
なり、したがって、オンラインで学習を行う場合であっ
ても、その学習結果を用いて制御を行う場合に目標値に
対し同方向の推定値を算出することが可能となる。な
お、abs(e1)の値に応じてαに与える値を変化さ
せる構成としても良く、例えば、abs(e1)がゼロ
に近づくに連れてbの値をaに近づけていく構成として
も良く、所望の推定結果を早く得ることが可能となる。
【0055】(実施の形態2)ところで、ある条件下で
採取されたデータに基づいて学習されたニューロの出力
値を用いて制御を行う場合、時間と共に制御対象の動特
性が変わる等、初期の条件下における挙動と異なる挙動
になる場合があり、この場合所望の制御性能を確保する
ことができなくなると言う問題がある。本実施の形態2
は、このような問題を解決するために、簡単な構成で分
割学習を行いうる構成を与えるものである。
採取されたデータに基づいて学習されたニューロの出力
値を用いて制御を行う場合、時間と共に制御対象の動特
性が変わる等、初期の条件下における挙動と異なる挙動
になる場合があり、この場合所望の制御性能を確保する
ことができなくなると言う問題がある。本実施の形態2
は、このような問題を解決するために、簡単な構成で分
割学習を行いうる構成を与えるものである。
【0056】図13に本願発明の実際の形態2による学
習制御装置の機能ブロック図を示す。図13において、
131は制御対象11の動特性に関連する状態量Yを検
出する状態量検出手段、132は前記検出値に基づき学
習条件を判定する学習条件判定手段、134はそれぞれ
の学習条件に対応したニューラルネットワークNN1な
いしNNmからなるニューロ構成を有するニューロ演算
手段、133は前記状態量に基づき現在の条件に対応す
るニューロ出力値のみを選択するニューロ選択手段、1
3は前記制御対象11の状態に応じた制御目標値Yre
fを算出する目標値算出手段、14は前記ニューロ選択
手段133で選択されたニューロ構成で演算したニュー
ロ推定値Ynnと、前記制御目標値Yrefより前記推
定値Ynnを前記目標値Yrefに追従制御させる制御
量Uを算出する制御量演算手段であり、本学習制御装置
はこれら状態量検出手段131、学習条件判定手段13
2、ニューロ演算手段134、ニューロ選択手段13
3、ニューロ演算手段134、目標値算出手段13およ
び制御量演算手段14を有する構成とする。
習制御装置の機能ブロック図を示す。図13において、
131は制御対象11の動特性に関連する状態量Yを検
出する状態量検出手段、132は前記検出値に基づき学
習条件を判定する学習条件判定手段、134はそれぞれ
の学習条件に対応したニューラルネットワークNN1な
いしNNmからなるニューロ構成を有するニューロ演算
手段、133は前記状態量に基づき現在の条件に対応す
るニューロ出力値のみを選択するニューロ選択手段、1
3は前記制御対象11の状態に応じた制御目標値Yre
fを算出する目標値算出手段、14は前記ニューロ選択
手段133で選択されたニューロ構成で演算したニュー
ロ推定値Ynnと、前記制御目標値Yrefより前記推
定値Ynnを前記目標値Yrefに追従制御させる制御
量Uを算出する制御量演算手段であり、本学習制御装置
はこれら状態量検出手段131、学習条件判定手段13
2、ニューロ演算手段134、ニューロ選択手段13
3、ニューロ演算手段134、目標値算出手段13およ
び制御量演算手段14を有する構成とする。
【0057】なお、前記ニューロ選択手段133は、現
在の状態量が、ある学習条件を満たす場合、その条件に
対応するニューロ出力に“1”を、それ以外のニューロ
出力には“0”となるステップ関数を掛ける構成として
おり、これにより、システムの構成を簡略化できる。
在の状態量が、ある学習条件を満たす場合、その条件に
対応するニューロ出力に“1”を、それ以外のニューロ
出力には“0”となるステップ関数を掛ける構成として
おり、これにより、システムの構成を簡略化できる。
【0058】図14は、一つの検出値により学習条件を
設定した場合のニューロ学習領域の概念を図示したもの
である。制御対象の動特性をニューロで表現する場合、
前記状態量検出手段131で検出された値に応じて学習
条件全体を幾つかの学習条件に分割し、その条件内の学
習データを用い、各々のニューロ(NN1〜NNk〜N
Nm)を学習する。
設定した場合のニューロ学習領域の概念を図示したもの
である。制御対象の動特性をニューロで表現する場合、
前記状態量検出手段131で検出された値に応じて学習
条件全体を幾つかの学習条件に分割し、その条件内の学
習データを用い、各々のニューロ(NN1〜NNk〜N
Nm)を学習する。
【0059】図15に、前記ニューロ選択手段133お
よびニューロ演算手段134の一構成例を示す。図15
に示すように、ニューロ選択手段133は条件1から条
件mに対応する出力ポートを有し、前記状態量検出手段
131の検出値に対応する条件kの出力をHigh(=
“1”)とし、それ以外はLow(=“0”)とする。
これらの出力値を、前記ニューロ演算手段134は入力
データ列作成部134aにより作成された入力データ列
に対し、各ニューロNN1ないしNNmで演算された出
力値に対し、乗算器m1ないしmmにより対応するニュ
ーロ選択手段133の出力を掛け、その和を加算器13
4bで得ることにより、対応する条件下のみのニューロ
構成を選択することができる。なお、上記構成では全て
のニューロを演算対象としているが、演算処理負荷を低
減させるため、前記ニューロ選択手段133で選択され
たニューロ構成のみ演算する構成としても良い。
よびニューロ演算手段134の一構成例を示す。図15
に示すように、ニューロ選択手段133は条件1から条
件mに対応する出力ポートを有し、前記状態量検出手段
131の検出値に対応する条件kの出力をHigh(=
“1”)とし、それ以外はLow(=“0”)とする。
これらの出力値を、前記ニューロ演算手段134は入力
データ列作成部134aにより作成された入力データ列
に対し、各ニューロNN1ないしNNmで演算された出
力値に対し、乗算器m1ないしmmにより対応するニュ
ーロ選択手段133の出力を掛け、その和を加算器13
4bで得ることにより、対応する条件下のみのニューロ
構成を選択することができる。なお、上記構成では全て
のニューロを演算対象としているが、演算処理負荷を低
減させるため、前記ニューロ選択手段133で選択され
たニューロ構成のみ演算する構成としても良い。
【0060】このように、本実施の形態2によれば、以
上のような構成とし、動特性が変化した条件に対応する
ニューロ構成のみを再学習することにより、性能劣化を
防ぐことができ、全ての条件に関してニューラルネット
ワークの学習をし直した場合に、却って制御精度が低下
するという問題を、容易に解消し得るものが得られる。
上のような構成とし、動特性が変化した条件に対応する
ニューロ構成のみを再学習することにより、性能劣化を
防ぐことができ、全ての条件に関してニューラルネット
ワークの学習をし直した場合に、却って制御精度が低下
するという問題を、容易に解消し得るものが得られる。
【0061】(実施の形態3)本実施の形態3は、オン
ラインで上記実施の形態2の分割学習を行うことができ
る学習制御装置を提供せんとするものである。図16に
本願発明の実施の形態3による学習制御装置の機能ブロ
ック図を示す。図16において、131は制御対象11
の動特性に関連する状態量を検出する状態量検出手段、
132は前記検出値に基づき学習条件を判定する学習条
件判定手段、164はそれぞれの学習条件に対応したニ
ューロ構成を有するニューロ演算手段、165はそれぞ
れのニューロ構成の結合係数を学習した学習データセッ
トを格納している学習データ格納手段、161は前記状
態量に基づき前記学習条件毎の新しい学習データを作成
する学習データ作成手段、162は前記学習データ格納
手段165で格納されている条件に対応する学習データ
セットと前記学習データ作成手段161で新たに作成さ
れた学習データとを用いニューロ結合係数の学習を行う
学習手段、163は対応するニューロ構成の結合係数
を、学習結果である結合係数に更新する係数更新ニュー
ロ選択手段であり、本学習制御装置はこれら状態量検出
手段131、学習条件判定手段132、学習データ作成
手段161、学習手段162、係数更新ニューロ選択手
段163、ニューロ演算手段164、学習データ格納手
段165により構成されている。
ラインで上記実施の形態2の分割学習を行うことができ
る学習制御装置を提供せんとするものである。図16に
本願発明の実施の形態3による学習制御装置の機能ブロ
ック図を示す。図16において、131は制御対象11
の動特性に関連する状態量を検出する状態量検出手段、
132は前記検出値に基づき学習条件を判定する学習条
件判定手段、164はそれぞれの学習条件に対応したニ
ューロ構成を有するニューロ演算手段、165はそれぞ
れのニューロ構成の結合係数を学習した学習データセッ
トを格納している学習データ格納手段、161は前記状
態量に基づき前記学習条件毎の新しい学習データを作成
する学習データ作成手段、162は前記学習データ格納
手段165で格納されている条件に対応する学習データ
セットと前記学習データ作成手段161で新たに作成さ
れた学習データとを用いニューロ結合係数の学習を行う
学習手段、163は対応するニューロ構成の結合係数
を、学習結果である結合係数に更新する係数更新ニュー
ロ選択手段であり、本学習制御装置はこれら状態量検出
手段131、学習条件判定手段132、学習データ作成
手段161、学習手段162、係数更新ニューロ選択手
段163、ニューロ演算手段164、学習データ格納手
段165により構成されている。
【0062】図15に示すように、ニューロ選択手段1
33は条件1から条件mに対応する出力ポートを有し、
前記状態量検出手段131の検出値に対応する条件kの
出力をHigh(=“1”)とし、それ以外はLow
(=“0”)とする。これらの出力値を、前記ニューロ
演算手段134は入力データ列作成部134aにより作
成された入力データ列に対し、各ニューロNN1ないし
NNmで演算された出力値に対し、乗算器m1ないしm
mにより対応するニューロ選択手段133の出力を掛
け、その和を加算器134bで得ることにより、対応す
る条件下のみのニューロ構成を選択することができる。
33は条件1から条件mに対応する出力ポートを有し、
前記状態量検出手段131の検出値に対応する条件kの
出力をHigh(=“1”)とし、それ以外はLow
(=“0”)とする。これらの出力値を、前記ニューロ
演算手段134は入力データ列作成部134aにより作
成された入力データ列に対し、各ニューロNN1ないし
NNmで演算された出力値に対し、乗算器m1ないしm
mにより対応するニューロ選択手段133の出力を掛
け、その和を加算器134bで得ることにより、対応す
る条件下のみのニューロ構成を選択することができる。
【0063】次に動作について説明する。本学習制御装
置は、上述の実施の形態2の学習制御装置と同様の動作
により、ニューロ選択手段133が、現在の状態量が、
ある学習条件を満たす場合、その条件に対応するニュー
ロ出力に“1”を、それ以外のニューロ出力には“0”
となるステップ関数を掛けることにより、ニューロ演算
手段164の中から対象となるニューラルネットワーク
を選択する。
置は、上述の実施の形態2の学習制御装置と同様の動作
により、ニューロ選択手段133が、現在の状態量が、
ある学習条件を満たす場合、その条件に対応するニュー
ロ出力に“1”を、それ以外のニューロ出力には“0”
となるステップ関数を掛けることにより、ニューロ演算
手段164の中から対象となるニューラルネットワーク
を選択する。
【0064】そして、このように選択された,分割学習
の対象となるべきニューラルネットワークのみに対し、
学習データ作成手段161がその学習用のデータを作成
する。すなわち、実施の形態1と同様、制御対象11よ
り推定対象パラメータYに関連する複数の入力パラメー
タ値の入力を受け付け、受け付けた入力パラメータ値か
らニューロ演算手段164により推定対象パラメータ値
を推定し、目標値算出手段13により制御対象11の状
態に応じた制御目標値Yrefを算出し、前記推定値Y
nnを前記目標値Yrefに追従制御させる制御量Uを
制御量演算手段14で演算する。前記ニューロ演算手段
164のニューロ結合係数Wは学習手段162により算
出され、対象となる条件に対応したニューラルネットワ
ークが選択されるとともに、その重み係数が係数更新ニ
ューロ選択手段163により書き換えられる。
の対象となるべきニューラルネットワークのみに対し、
学習データ作成手段161がその学習用のデータを作成
する。すなわち、実施の形態1と同様、制御対象11よ
り推定対象パラメータYに関連する複数の入力パラメー
タ値の入力を受け付け、受け付けた入力パラメータ値か
らニューロ演算手段164により推定対象パラメータ値
を推定し、目標値算出手段13により制御対象11の状
態に応じた制御目標値Yrefを算出し、前記推定値Y
nnを前記目標値Yrefに追従制御させる制御量Uを
制御量演算手段14で演算する。前記ニューロ演算手段
164のニューロ結合係数Wは学習手段162により算
出され、対象となる条件に対応したニューラルネットワ
ークが選択されるとともに、その重み係数が係数更新ニ
ューロ選択手段163により書き換えられる。
【0065】なお、この係数更新ニューロ選択手段16
3は、実施の形態1と同様、誤差係数変更手段を設け
て、学習時に用いるニューロ推定値と教師信号との誤差
評価関数の重み係数αを、ニューロ推定値と教師信号と
目標値との相対位置関係に応じて変更し、学習手段16
2により、この重み係数αを用いた評価関数に基づき結
合係数の学習を行うようにしてもよく、これにより、対
象となる条件に対応したニューラルネットワークを、フ
ェールセーフな制御を行うように学習させることが可能
となる。前記学習手段162において実際の学習に用い
られる学習データセットは、最新の学習データセットと
同数分、古い学習データセットを消去したものであり、
従って、学習データセットの総数は常に一定のセット数
である。この更新された学習データセットは前記学習デ
ータ格納手段165に再度格納される。
3は、実施の形態1と同様、誤差係数変更手段を設け
て、学習時に用いるニューロ推定値と教師信号との誤差
評価関数の重み係数αを、ニューロ推定値と教師信号と
目標値との相対位置関係に応じて変更し、学習手段16
2により、この重み係数αを用いた評価関数に基づき結
合係数の学習を行うようにしてもよく、これにより、対
象となる条件に対応したニューラルネットワークを、フ
ェールセーフな制御を行うように学習させることが可能
となる。前記学習手段162において実際の学習に用い
られる学習データセットは、最新の学習データセットと
同数分、古い学習データセットを消去したものであり、
従って、学習データセットの総数は常に一定のセット数
である。この更新された学習データセットは前記学習デ
ータ格納手段165に再度格納される。
【0066】本実施の形態3によれば、以上のような構
成とすることにより、動特性が変化しニューロ推定精度
が劣化した場合でも、対応する条件下のニューロのみに
限って学習を行う,分割学習をオンラインで行うことが
でき、良好な制御を達成できる。
成とすることにより、動特性が変化しニューロ推定精度
が劣化した場合でも、対応する条件下のニューロのみに
限って学習を行う,分割学習をオンラインで行うことが
でき、良好な制御を達成できる。
【0067】(実施の形態4)本実施の形態4は、複数
の条件に跨り動特性が変化した場合のニューロ制御のつ
ながりを滑らかにするように構成したものである。図1
7に本願発明の実施の形態4による学習制御装置の機能
ブロック図を示す。図17において、131は制御対象
11の動特性に関連する状態量を検出する状態量検出手
段、132は前記検出値に基づき学習条件を判定する学
習条件判定手段、176はそれぞれの学習条件に対応し
たニューロ構成を有するニューロ演算手段、165はそ
れぞれのニューロ構成の結合係数を学習した学習データ
セットを格納している学習データ格納手段、161は前
記状態量に基づき前記学習条件毎の新しい学習データを
作成する学習データ作成手段、171は前記学習データ
格納手段165で格納されている前記学習条件に対応す
る全てのニューロ構成の学習データセットと前記学習デ
ータ作成手段161で新たに作成された学習データとを
用い、それぞれのニューロ構成に対する学習データセッ
トを作成する学習データセット作成手段、177は前記
学習データ格納手段165内の対応するデータをこの新
たに作成された学習データセットに更新する学習データ
更新手段、172はこの新たに作成された学習データセ
ットを用い前記学習条件に対応する全てのニューロ結合
係数の学習を行う学習手段、173は対応する全てのニ
ューロ構成を選択し前記学習結果である結合係数に更新
する係数更新ニューロ選択手段、174は前記学習条件
に対応する全てのニューロ構成を選択するニューロ構成
選択手段、175は対応する全てのニューロ出力から制
御の際に用いるニューロ推定値を算出する推定値算出手
段である。
の条件に跨り動特性が変化した場合のニューロ制御のつ
ながりを滑らかにするように構成したものである。図1
7に本願発明の実施の形態4による学習制御装置の機能
ブロック図を示す。図17において、131は制御対象
11の動特性に関連する状態量を検出する状態量検出手
段、132は前記検出値に基づき学習条件を判定する学
習条件判定手段、176はそれぞれの学習条件に対応し
たニューロ構成を有するニューロ演算手段、165はそ
れぞれのニューロ構成の結合係数を学習した学習データ
セットを格納している学習データ格納手段、161は前
記状態量に基づき前記学習条件毎の新しい学習データを
作成する学習データ作成手段、171は前記学習データ
格納手段165で格納されている前記学習条件に対応す
る全てのニューロ構成の学習データセットと前記学習デ
ータ作成手段161で新たに作成された学習データとを
用い、それぞれのニューロ構成に対する学習データセッ
トを作成する学習データセット作成手段、177は前記
学習データ格納手段165内の対応するデータをこの新
たに作成された学習データセットに更新する学習データ
更新手段、172はこの新たに作成された学習データセ
ットを用い前記学習条件に対応する全てのニューロ結合
係数の学習を行う学習手段、173は対応する全てのニ
ューロ構成を選択し前記学習結果である結合係数に更新
する係数更新ニューロ選択手段、174は前記学習条件
に対応する全てのニューロ構成を選択するニューロ構成
選択手段、175は対応する全てのニューロ出力から制
御の際に用いるニューロ推定値を算出する推定値算出手
段である。
【0068】この図17の学習制御装置は、これら状態
量検出手段131,学習条件判定手段132,ニューロ
演算手段176,学習データ格納手段165,学習デー
タ作成手段161,学習データセット作成手段171,
学習データ更新手段177,学習手段172,係数更新
ニューロ選択手段173,ニューロ構成選択手段17
4,推定値算出手段175を有し、推定値算出手段17
5により得られた推定値を制御量演算に用いる構成とす
る。
量検出手段131,学習条件判定手段132,ニューロ
演算手段176,学習データ格納手段165,学習デー
タ作成手段161,学習データセット作成手段171,
学習データ更新手段177,学習手段172,係数更新
ニューロ選択手段173,ニューロ構成選択手段17
4,推定値算出手段175を有し、推定値算出手段17
5により得られた推定値を制御量演算に用いる構成とす
る。
【0069】次に動作について説明する。本学習制御装
置は、実施の形態3の装置と同様に学習を行うが、学習
条件判定手段132が判定した学習条件に基づき、ニュ
ーロ選択手段174がニューラルネットワークを選択す
る。推定値算出手段175は、条件に応じて選択したニ
ューラルネットワークから出力される推定値に基づい
て、隣合う条件における区間の境界付近で互いの区間に
跨る区間については、両方の区間の推定値に基づいた推
定値、例えばその平均値、を作成し、制御量演算手段1
4はこの新たな推定値をも参照し、目標値算出手段13
から出力される目標値に向かうように制御対象11に対
し制御量を出力する。
置は、実施の形態3の装置と同様に学習を行うが、学習
条件判定手段132が判定した学習条件に基づき、ニュ
ーロ選択手段174がニューラルネットワークを選択す
る。推定値算出手段175は、条件に応じて選択したニ
ューラルネットワークから出力される推定値に基づい
て、隣合う条件における区間の境界付近で互いの区間に
跨る区間については、両方の区間の推定値に基づいた推
定値、例えばその平均値、を作成し、制御量演算手段1
4はこの新たな推定値をも参照し、目標値算出手段13
から出力される目標値に向かうように制御対象11に対
し制御量を出力する。
【0070】状態量検出手段131はこの制御対象の状
態量を検出し、学習条件判定手段132はこの状態量に
基づいて、学習条件を判定するとともに、これを学習デ
ータ格納手段165に格納する。学習データ作成手段1
61は、この学習条件判定手段132によって判定され
た学習条件に基づき学習データを作成するが、本実施の
形態4では、この学習データに基づき、条件に応じた学
習データセットを作成する。学習手段172はこの学習
データセットに基づき、ニューロ演算手段176の学習
を進める。係数更新ニューロ選択手段173はこの学習
手段172により算出された重み係数を、学習条件に対
応する全てのニューラルネットワークを選択して、その
重み係数を更新する。
態量を検出し、学習条件判定手段132はこの状態量に
基づいて、学習条件を判定するとともに、これを学習デ
ータ格納手段165に格納する。学習データ作成手段1
61は、この学習条件判定手段132によって判定され
た学習条件に基づき学習データを作成するが、本実施の
形態4では、この学習データに基づき、条件に応じた学
習データセットを作成する。学習手段172はこの学習
データセットに基づき、ニューロ演算手段176の学習
を進める。係数更新ニューロ選択手段173はこの学習
手段172により算出された重み係数を、学習条件に対
応する全てのニューラルネットワークを選択して、その
重み係数を更新する。
【0071】一方、学習データ更新手段177は学習デ
ータセット作成手段171により作成された学習データ
セットのなかで、新規作成分を検出し、これにより学習
データ格納手段165に格納された学習データを更新す
る。学習データセット更新手段177は学習データセッ
トを更新するが、これは最新の学習データセットと同数
の古い学習データセットを消去し更新したものであり、
常に一定のセット数である。学習データセット作成手段
171が条件に対応するニューラルネットワークの各々
に対応する学習データセットを作成し、学習手段172
はこの学習データセットに基づいてニューロ演算手段1
76の学習を行い、ニューラルネットワークを選択する
とともにその重み係数を更新する。
ータセット作成手段171により作成された学習データ
セットのなかで、新規作成分を検出し、これにより学習
データ格納手段165に格納された学習データを更新す
る。学習データセット更新手段177は学習データセッ
トを更新するが、これは最新の学習データセットと同数
の古い学習データセットを消去し更新したものであり、
常に一定のセット数である。学習データセット作成手段
171が条件に対応するニューラルネットワークの各々
に対応する学習データセットを作成し、学習手段172
はこの学習データセットに基づいてニューロ演算手段1
76の学習を行い、ニューラルネットワークを選択する
とともにその重み係数を更新する。
【0072】図18は、一つの状態検出値により学習条
件を設定した場合のニューロ学習領域の概念を図示した
ものである。隣り合う条件のニューロ構成はそれぞれ共
通の動特性部分をニューロで表現する。前記推定値算出
手段175では、対応する全てのニューロ出力値の平均
値を、制御の際に用いるニューロ推定値とする。なお、
共通部分の中心からの距離に応じて重み付け平均を取っ
て、制御で用いる推定値としても良い。
件を設定した場合のニューロ学習領域の概念を図示した
ものである。隣り合う条件のニューロ構成はそれぞれ共
通の動特性部分をニューロで表現する。前記推定値算出
手段175では、対応する全てのニューロ出力値の平均
値を、制御の際に用いるニューロ推定値とする。なお、
共通部分の中心からの距離に応じて重み付け平均を取っ
て、制御で用いる推定値としても良い。
【0073】本実施の形態4によれば、以上のような構
成とすることにより、複数の条件に跨り動特性が変化し
た場合でも、ニューロ制御量は滑らかな値を示し、良好
な制御を達成することが可能となる。
成とすることにより、複数の条件に跨り動特性が変化し
た場合でも、ニューロ制御量は滑らかな値を示し、良好
な制御を達成することが可能となる。
【0074】
【発明の効果】以上のように、本願の請求項1の発明に
係る学習制御装置によれば、推定対象パラメータに関連
する複数の入力パラメータ値の入力を受け、この入力パ
ラメータ値から推定対象パラメータ値を推定し、この推
定値を目標値追従制御量演算に用いるためのニューラル
ネットワークと、ニューロ推定値と教師信号との二乗誤
差に対し乗算すべき重み係数の値を、ニューロ推定値と
教師信号と目標値との相対関係に応じて変更する誤差係
数変更手段と、前記重み係数を用いて学習時の評価関数
を演算する評価関数演算手段とを備え、前記評価関数に
基づき前記ニューラルネットワークの学習を行うように
したので、目標値を考慮に入れた学習を行うことが可能
となり、ニューロ推定値を用いた目標値追従制御の制御
性能を従来学習に比べ向上させることが可能となり、特
に制御対象が急激に変化する過渡状態時の制御性能劣化
を防ぐことが可能となる学習制御装置が得られる効果が
ある。
係る学習制御装置によれば、推定対象パラメータに関連
する複数の入力パラメータ値の入力を受け、この入力パ
ラメータ値から推定対象パラメータ値を推定し、この推
定値を目標値追従制御量演算に用いるためのニューラル
ネットワークと、ニューロ推定値と教師信号との二乗誤
差に対し乗算すべき重み係数の値を、ニューロ推定値と
教師信号と目標値との相対関係に応じて変更する誤差係
数変更手段と、前記重み係数を用いて学習時の評価関数
を演算する評価関数演算手段とを備え、前記評価関数に
基づき前記ニューラルネットワークの学習を行うように
したので、目標値を考慮に入れた学習を行うことが可能
となり、ニューロ推定値を用いた目標値追従制御の制御
性能を従来学習に比べ向上させることが可能となり、特
に制御対象が急激に変化する過渡状態時の制御性能劣化
を防ぐことが可能となる学習制御装置が得られる効果が
ある。
【0075】また、本願の請求項2の発明に係る学習制
御方法によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、受け付けた入力パラメ
ータ値からニューラルネットワークにより推定対象パラ
メータ値を推定し、この推定値を目標値追従制御量演算
に用いる際のニューラルネットワークの学習制御を行な
う方法において、ニューロ推定値と教師信号との二乗誤
差に対し乗算すべき重み係数の値を、ニューロ推定値と
教師信号と目標値との相対関係に応じて変更し、前記重
み係数を用いて学習時の評価関数を演算し、前記評価関
数に基づき前記ニューラルネットワークの学習を行うよ
うにしたので、目標値を考慮に入れた学習を行うことが
可能となり、ニューロ推定値を用いた目標値追従制御の
制御性能を従来学習に比べ向上させることが可能とな
り、特に制御対象が急激に変化する過渡状態時の制御性
能劣化を防ぐことが可能となる学習制御方法が得られる
効果がある。
御方法によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、受け付けた入力パラメ
ータ値からニューラルネットワークにより推定対象パラ
メータ値を推定し、この推定値を目標値追従制御量演算
に用いる際のニューラルネットワークの学習制御を行な
う方法において、ニューロ推定値と教師信号との二乗誤
差に対し乗算すべき重み係数の値を、ニューロ推定値と
教師信号と目標値との相対関係に応じて変更し、前記重
み係数を用いて学習時の評価関数を演算し、前記評価関
数に基づき前記ニューラルネットワークの学習を行うよ
うにしたので、目標値を考慮に入れた学習を行うことが
可能となり、ニューロ推定値を用いた目標値追従制御の
制御性能を従来学習に比べ向上させることが可能とな
り、特に制御対象が急激に変化する過渡状態時の制御性
能劣化を防ぐことが可能となる学習制御方法が得られる
効果がある。
【0076】また、本願の請求項3の発明に係る学習制
御装置によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるためのニューラルネットワー
クと、ニューロ推定値と目標値との偏差の符号の種類を
判定する推定偏差符号判定手段と、教師信号と目標値と
の偏差の符号の種類を判定する教師偏差符号判定手段
と、前記推定偏差符号判定手段および教師偏差符号判定
手段により判定されたそれぞれの符号の種類を比較する
符号比較手段と、前記符号比較手段により符号が異なる
と判別された場合、前記ニューロ推定値と前記教師信号
との二乗誤差に乗じるべき重み係数の値を大きくする二
乗誤差係数変更手段と、前記重み係数を用いて学習時の
評価関数を演算する評価関数演算手段とを備え、前記評
価関数に基づき前記ニューラルネットワークの学習を行
うようにしたので、従来学習で得られたニューロ制御に
おける,逆方向に補正量を演算してしまうと言うことが
少なくなり、制御性能を向上させることが可能となる学
習制御装置が得られる効果がある。
御装置によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるためのニューラルネットワー
クと、ニューロ推定値と目標値との偏差の符号の種類を
判定する推定偏差符号判定手段と、教師信号と目標値と
の偏差の符号の種類を判定する教師偏差符号判定手段
と、前記推定偏差符号判定手段および教師偏差符号判定
手段により判定されたそれぞれの符号の種類を比較する
符号比較手段と、前記符号比較手段により符号が異なる
と判別された場合、前記ニューロ推定値と前記教師信号
との二乗誤差に乗じるべき重み係数の値を大きくする二
乗誤差係数変更手段と、前記重み係数を用いて学習時の
評価関数を演算する評価関数演算手段とを備え、前記評
価関数に基づき前記ニューラルネットワークの学習を行
うようにしたので、従来学習で得られたニューロ制御に
おける,逆方向に補正量を演算してしまうと言うことが
少なくなり、制御性能を向上させることが可能となる学
習制御装置が得られる効果がある。
【0077】また、本願の請求項4の発明に係る学習制
御装置によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるためのニューラルネットワー
クと、ニューロ推定値と目標値との偏差の符号の種類を
判定する推定偏差符号判定手段と、前記ニューロ推定値
と前記目標値との偏差の絶対値を算出する推定偏差絶対
値算出手段と、教師信号と目標値との偏差の符号の種類
を判定する教師偏差符号判定手段と、前記教師信号と前
記目標値との偏差の絶対値を算出する教師信号偏差絶対
値算出手段と、前記推定偏差符号判定手段および教師信
号偏差符号判定手段により判定されたそれぞれの符号の
種類を比較する符号比較手段と、前記推定偏差絶対値算
出手段および教師信号偏差絶対値算出手段により算出さ
れた絶対値の大小を比較する絶対値比較手段と、前記符
号比較手段により符号の種類が同じであると判別され、
かつ前記絶対値比較手段により前記ニューロ推定値と前
記目標値との偏差の絶対値の方が前記教師信号と前記目
標値との偏差の絶対値よりも小さいと判定された場合、
前記ニューロ推定値と前記教師信号との二乗誤差に乗ず
るべき重み係数の値を大きくする二乗誤差係数変更手段
と、前記重み係数を用いて学習時の評価関数を演算する
評価関数演算手段とを備え、前記評価関数に基づき学習
を行うようにしたので、目標値に対し反対側の推定値を
算出する結合係数の場合は、より修正が進み、また同じ
側にあっても、推定値が目標値寄りに有る場合、次回修
正係数を用いた結果が反対側に移行するのを防ぎ、推定
値が目標値に対し常に同じ側に来るように学習収束する
速度を早めることが可能となり、この様に学習されたニ
ューロを用い目標値となる制御量を算出することによ
り、従来学習で得られたニューロ制御で課題としてあっ
た逆方向に補正量を演算してしまうと言うことが少なく
なり、制御性能を向上させることが可能となる学習制御
装置が得られる効果がある。
御装置によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるためのニューラルネットワー
クと、ニューロ推定値と目標値との偏差の符号の種類を
判定する推定偏差符号判定手段と、前記ニューロ推定値
と前記目標値との偏差の絶対値を算出する推定偏差絶対
値算出手段と、教師信号と目標値との偏差の符号の種類
を判定する教師偏差符号判定手段と、前記教師信号と前
記目標値との偏差の絶対値を算出する教師信号偏差絶対
値算出手段と、前記推定偏差符号判定手段および教師信
号偏差符号判定手段により判定されたそれぞれの符号の
種類を比較する符号比較手段と、前記推定偏差絶対値算
出手段および教師信号偏差絶対値算出手段により算出さ
れた絶対値の大小を比較する絶対値比較手段と、前記符
号比較手段により符号の種類が同じであると判別され、
かつ前記絶対値比較手段により前記ニューロ推定値と前
記目標値との偏差の絶対値の方が前記教師信号と前記目
標値との偏差の絶対値よりも小さいと判定された場合、
前記ニューロ推定値と前記教師信号との二乗誤差に乗ず
るべき重み係数の値を大きくする二乗誤差係数変更手段
と、前記重み係数を用いて学習時の評価関数を演算する
評価関数演算手段とを備え、前記評価関数に基づき学習
を行うようにしたので、目標値に対し反対側の推定値を
算出する結合係数の場合は、より修正が進み、また同じ
側にあっても、推定値が目標値寄りに有る場合、次回修
正係数を用いた結果が反対側に移行するのを防ぎ、推定
値が目標値に対し常に同じ側に来るように学習収束する
速度を早めることが可能となり、この様に学習されたニ
ューロを用い目標値となる制御量を算出することによ
り、従来学習で得られたニューロ制御で課題としてあっ
た逆方向に補正量を演算してしまうと言うことが少なく
なり、制御性能を向上させることが可能となる学習制御
装置が得られる効果がある。
【0078】また、本願の請求項5の発明に係る学習制
御装置によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるための,それぞれの学習条件
に対応した複数のニューロ構成を有するニューラルネッ
トワークと、制御対象の動特性に関連する状態量を検出
する状態量検出手段と、前記検出値に基づき前記ニュー
ラルネットワークの学習条件を判定する学習条件判定手
段と、前記状態量に基づき前記ニューラルネットワーク
のニューロ構成の中から現在の条件に対応するニューロ
出力値のみを選択するニューロ選択手段とを備えるよう
にしたので、分割学習を行なう構成を実現でき、時間と
共に制御対象の動特性が変わる等、初期の条件下におけ
る挙動と異なる挙動になる場合でも、動特性が変化した
条件に対応するニューロ構成のみを再学習することによ
り、性能劣化を防ぐことができる学習制御装置が得られ
る効果がある。
御装置によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるための,それぞれの学習条件
に対応した複数のニューロ構成を有するニューラルネッ
トワークと、制御対象の動特性に関連する状態量を検出
する状態量検出手段と、前記検出値に基づき前記ニュー
ラルネットワークの学習条件を判定する学習条件判定手
段と、前記状態量に基づき前記ニューラルネットワーク
のニューロ構成の中から現在の条件に対応するニューロ
出力値のみを選択するニューロ選択手段とを備えるよう
にしたので、分割学習を行なう構成を実現でき、時間と
共に制御対象の動特性が変わる等、初期の条件下におけ
る挙動と異なる挙動になる場合でも、動特性が変化した
条件に対応するニューロ構成のみを再学習することによ
り、性能劣化を防ぐことができる学習制御装置が得られ
る効果がある。
【0079】また、本願の請求項6の発明に係る学習制
御装置によれば、請求項5記載の学習制御装置におい
て、前記ニューロ選択手段は、現在の状態量がある学習
条件を満たす場合、その条件に対応するニューロ出力に
“1”を、それ以外のニューロ出力には“0”となるス
テップ関数を乗ずることによりニューロ出力を選択する
ものとしたので、簡単な構成で、分割学習を行なう構成
を実現でき、時間と共に制御対象の動特性が変わる等、
初期の条件下における挙動と異なる挙動になる場合で
も、動特性が変化した条件に対応するニューロ構成のみ
を再学習することにより、性能劣化を防ぐことができる
学習制御装置が得られる効果がある。
御装置によれば、請求項5記載の学習制御装置におい
て、前記ニューロ選択手段は、現在の状態量がある学習
条件を満たす場合、その条件に対応するニューロ出力に
“1”を、それ以外のニューロ出力には“0”となるス
テップ関数を乗ずることによりニューロ出力を選択する
ものとしたので、簡単な構成で、分割学習を行なう構成
を実現でき、時間と共に制御対象の動特性が変わる等、
初期の条件下における挙動と異なる挙動になる場合で
も、動特性が変化した条件に対応するニューロ構成のみ
を再学習することにより、性能劣化を防ぐことができる
学習制御装置が得られる効果がある。
【0080】また、本願の請求項7の発明に係る学習制
御装置によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるための,それぞれの学習条件
に対応した複数のニューロ構成を有するニューラルネッ
トワークと、制御対象の動特性に関連する状態量を検出
する状態量検出手段と、前記検出値に基づき前記ニュー
ラルネットワークの学習条件を判定する学習条件判定手
段と、それぞれのニューロ構成の結合係数を学習した学
習データセットを格納している学習データ格納手段と、
前記状態量に基づき前記学習条件毎の学習データを作成
する学習データ作成手段と、前記学習データ格納手段で
格納されている条件に対応する学習データセットと前記
学習データ作成手段で新たに作成された学習データとを
用いニューロ結合係数の学習を行う学習手段と、前記条
件に対応するニューロ構成を選択し前記学習結果である
結合係数に更新する係数更新ニューロ選択手段とを備え
るようにしたので、動特性が変化しニューロ推定精度が
劣化した場合でも、対応する条件下のニューロのみの学
習をオンラインで行うことができ、良好な制御を達成で
きるように学習を行なうことができる学習制御装置が得
られる効果がある。
御装置によれば、推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるための,それぞれの学習条件
に対応した複数のニューロ構成を有するニューラルネッ
トワークと、制御対象の動特性に関連する状態量を検出
する状態量検出手段と、前記検出値に基づき前記ニュー
ラルネットワークの学習条件を判定する学習条件判定手
段と、それぞれのニューロ構成の結合係数を学習した学
習データセットを格納している学習データ格納手段と、
前記状態量に基づき前記学習条件毎の学習データを作成
する学習データ作成手段と、前記学習データ格納手段で
格納されている条件に対応する学習データセットと前記
学習データ作成手段で新たに作成された学習データとを
用いニューロ結合係数の学習を行う学習手段と、前記条
件に対応するニューロ構成を選択し前記学習結果である
結合係数に更新する係数更新ニューロ選択手段とを備え
るようにしたので、動特性が変化しニューロ推定精度が
劣化した場合でも、対応する条件下のニューロのみの学
習をオンラインで行うことができ、良好な制御を達成で
きるように学習を行なうことができる学習制御装置が得
られる効果がある。
【0081】また、本願の請求項8の発明に係る学習制
御装置によれば、請求項7記載の学習制御装置におい
て、前記学習手段において実際の学習に用いられる学習
データセットは、最新の学習データセットと同数分、古
い学習データセットを消去し更新したものであり、前記
学習データセットは常に一定のセット数であるようにし
たので、学習時間の増大を防ぎ、かつ過去のデータの影
響を小さくし、最新の状況を学習することができる学習
制御装置が得られる効果がある。
御装置によれば、請求項7記載の学習制御装置におい
て、前記学習手段において実際の学習に用いられる学習
データセットは、最新の学習データセットと同数分、古
い学習データセットを消去し更新したものであり、前記
学習データセットは常に一定のセット数であるようにし
たので、学習時間の増大を防ぎ、かつ過去のデータの影
響を小さくし、最新の状況を学習することができる学習
制御装置が得られる効果がある。
【0082】また、本願の請求項9の発明に係る学習制
御装置によれば、請求項7または8記載の学習制御装置
において、前記学習データ格納手段において、格納され
ている学習データセットは、ニューロ演算処理を行うニ
ューラルネットワーク自体が学習対象となっているオン
ライン状態において常に更新されている学習データセッ
トであるようにしたので、学習時間の増大を防ぎ、かつ
過去のデータの影響を小さくし、最新の状況を学習する
ことができる学習制御装置が得られる効果がある。
御装置によれば、請求項7または8記載の学習制御装置
において、前記学習データ格納手段において、格納され
ている学習データセットは、ニューロ演算処理を行うニ
ューラルネットワーク自体が学習対象となっているオン
ライン状態において常に更新されている学習データセッ
トであるようにしたので、学習時間の増大を防ぎ、かつ
過去のデータの影響を小さくし、最新の状況を学習する
ことができる学習制御装置が得られる効果がある。
【0083】また、本願の請求項10の発明に係る学習
制御装置によれば、推定対象パラメータに関連する複数
の入力パラメータ値の入力を受け、この入力パラメータ
値から推定対象パラメータ値を推定し、この推定値を目
標値追従制御量演算に用いるための,それぞれの学習条
件に対応した複数のニューロ構成を有するニューラルネ
ットワークと、制御対象の動特性に関連する状態量を検
出する状態量検出手段と、前記検出値に基づき学習条件
を判定する学習条件判定手段と、それぞれのニューロ構
成の結合係数を学習した学習データセットを格納してい
る学習データ格納手段と、前記状態量に基づき前記学習
条件毎の新しい学習データを作成する学習データ作成手
段と、前記学習データ格納手段で格納されている前記学
習条件に対応する全てのニューロ構成の学習データセッ
トと前記学習データ作成手段で新たに作成された学習デ
ータとを用い、それぞれのニューロ構成に対する学習デ
ータセットを作成する学習データセット作成手段と、前
記学習データ格納手段内の対応するデータをこの新たに
作成された学習データセットに更新する学習データ更新
手段と、前記新たに作成された学習データセットを用い
前記学習条件に対応する全てのニューロ結合係数の学習
を行う学習手段と、前記対応する全てのニューロ構成を
選択し前記学習結果である結合係数に更新する係数更新
ニューロ選択手段と、前記学習条件に対応する全てのニ
ューロ構成を選択するニューロ構成選択手段と、前記対
応する全てのニューロ出力から制御を行う際に用いるニ
ューロ推定値を算出する推定値算出手段とを備え、前記
推定値を制御量演算に用いるようにしたので、複数の条
件に跨り動特性が変化した場合でも、ニューロ制御量は
滑らかな値を示し、良好な制御を達成することが可能と
なる学習制御装置が得られる効果がある。
制御装置によれば、推定対象パラメータに関連する複数
の入力パラメータ値の入力を受け、この入力パラメータ
値から推定対象パラメータ値を推定し、この推定値を目
標値追従制御量演算に用いるための,それぞれの学習条
件に対応した複数のニューロ構成を有するニューラルネ
ットワークと、制御対象の動特性に関連する状態量を検
出する状態量検出手段と、前記検出値に基づき学習条件
を判定する学習条件判定手段と、それぞれのニューロ構
成の結合係数を学習した学習データセットを格納してい
る学習データ格納手段と、前記状態量に基づき前記学習
条件毎の新しい学習データを作成する学習データ作成手
段と、前記学習データ格納手段で格納されている前記学
習条件に対応する全てのニューロ構成の学習データセッ
トと前記学習データ作成手段で新たに作成された学習デ
ータとを用い、それぞれのニューロ構成に対する学習デ
ータセットを作成する学習データセット作成手段と、前
記学習データ格納手段内の対応するデータをこの新たに
作成された学習データセットに更新する学習データ更新
手段と、前記新たに作成された学習データセットを用い
前記学習条件に対応する全てのニューロ結合係数の学習
を行う学習手段と、前記対応する全てのニューロ構成を
選択し前記学習結果である結合係数に更新する係数更新
ニューロ選択手段と、前記学習条件に対応する全てのニ
ューロ構成を選択するニューロ構成選択手段と、前記対
応する全てのニューロ出力から制御を行う際に用いるニ
ューロ推定値を算出する推定値算出手段とを備え、前記
推定値を制御量演算に用いるようにしたので、複数の条
件に跨り動特性が変化した場合でも、ニューロ制御量は
滑らかな値を示し、良好な制御を達成することが可能と
なる学習制御装置が得られる効果がある。
【0084】また、本願の請求項11の発明に係る学習
制御装置によれば、請求項10記載の学習制御装置にお
いて、前記ニューラルネットワークにおける,隣り合う
条件下におけるニューロ構成は、共通の制御対象動特性
の表現部分を持つようにしたので、複数の条件に跨り動
特性が変化した場合でも、ニューロ制御量は滑らかな値
を示し、良好な制御を達成することが可能となる学習制
御装置が得られる効果がある。
制御装置によれば、請求項10記載の学習制御装置にお
いて、前記ニューラルネットワークにおける,隣り合う
条件下におけるニューロ構成は、共通の制御対象動特性
の表現部分を持つようにしたので、複数の条件に跨り動
特性が変化した場合でも、ニューロ制御量は滑らかな値
を示し、良好な制御を達成することが可能となる学習制
御装置が得られる効果がある。
【0085】また、本願の請求項12の発明に係る学習
制御装置によれば、請求項10または11記載の学習制
御装置において、前記推定値算出手段は、対応する全て
のニューロ出力値の平均値を、制御で用いるニューロ推
定値として算出するようにしたので、複数の条件に跨り
動特性が変化した場合でも、ニューロ制御量は滑らかな
値を示し、良好な制御を達成することが可能となる学習
制御装置が得られる効果がある。
制御装置によれば、請求項10または11記載の学習制
御装置において、前記推定値算出手段は、対応する全て
のニューロ出力値の平均値を、制御で用いるニューロ推
定値として算出するようにしたので、複数の条件に跨り
動特性が変化した場合でも、ニューロ制御量は滑らかな
値を示し、良好な制御を達成することが可能となる学習
制御装置が得られる効果がある。
【図1】本願発明の実施の形態1に係る学習制御装置の
機能ブロック図である。
機能ブロック図である。
【図2】従来の学習のフローチャートを示す図である。
【図3】本願発明の実施の形態1に係る学習制御装置の
学習のフローチャートを示す図である。
学習のフローチャートを示す図である。
【図4】本願発明の実施の形態1に係る学習制御装置の
ニューロ学習処理機能を示すブロック図である。
ニューロ学習処理機能を示すブロック図である。
【図5】本願発明の実施の形態1に係る学習制御装置の
オフライン学習におけるニューロ制御構成の一例を示す
図である。
オフライン学習におけるニューロ制御構成の一例を示す
図である。
【図6】本願発明の実施の形態1に係る学習制御装置の
オフライン学習におけるニューロ制御構成の一例を示す
図である。
オフライン学習におけるニューロ制御構成の一例を示す
図である。
【図7】本願発明の実施の形態1に係る学習制御装置の
学習方法に関する機能ブロック図である。
学習方法に関する機能ブロック図である。
【図8】本願発明の実施の形態1に係る学習制御装置の
学習方法に関する機能ブロック図である。
学習方法に関する機能ブロック図である。
【図9】本願発明の実施の形態1に係る学習制御装置の
処理フローチャートを示す図である。
処理フローチャートを示す図である。
【図10】本願発明の実施の形態1に係る学習制御装置
における目標値と教師信号と推定値との相対関係を示す
模式図である。
における目標値と教師信号と推定値との相対関係を示す
模式図である。
【図11】本願発明の実施の形態1に係る学習制御装置
の処理フローチャートを示す図である。
の処理フローチャートを示す図である。
【図12】本願発明の実施の形態1に係る学習制御装置
における目標値と教師信号と推定値との相対関係を示す
模式図である。
における目標値と教師信号と推定値との相対関係を示す
模式図である。
【図13】本願発明の実施の形態2に係る学習制御装置
の機能ブロック図である。
の機能ブロック図である。
【図14】本願発明の実施の形態2に係る学習制御装置
におけるニューロ学習領域を示す概念図である。
におけるニューロ学習領域を示す概念図である。
【図15】本願発明の実施の形態2に係る学習制御装置
におけるニューロ選択手法の一構成例を示す図である。
におけるニューロ選択手法の一構成例を示す図である。
【図16】本願発明の実施の形態3に係る学習制御装置
の機能ブロック図である。
の機能ブロック図である。
【図17】本願発明の実施の形態4に係る学習制御装置
の機能ブロック図である。
の機能ブロック図である。
【図18】本願発明の実施の形態4に係る学習制御装置
における共通部分を有するニューロ学習領域を示す概念
図である。
における共通部分を有するニューロ学習領域を示す概念
図である。
【図19】従来のニューラルネットワークを用いた空燃
比制御装置の機能ブロック図である。
比制御装置の機能ブロック図である。
【図20】図22の空燃比制御装置に用いられるニュー
ラルネットワークの概念図である。
ラルネットワークの概念図である。
【図21】従来のニューラルネットワークの学習過程を
模式的に示す図である。
模式的に示す図である。
【図22】エンジンの空燃比制御装置の概略を示す図で
ある。
ある。
【図23】エンジンの空燃比と排気ガスの浄化度の関係
を示す図である。
を示す図である。
【図24】従来の学習制御における推定値と目標値と空
燃比と制御の方向の関係を示す図である。
燃比と制御の方向の関係を示す図である。
【図25】本願発明の学習制御における推定値と目標値
と空燃比と制御の方向の関係を示す図である。
と空燃比と制御の方向の関係を示す図である。
11 制御対象 12 ニューロ演算手段 13 目標値算出手段 14 制御量演算手段 15 ニューロ学習手段 16 誤差係数変更手段 17 結合係数書き換え手段 41 学習データセット作成部 42 推定値算出部 43 評価関数作成部 44 係数更新部 45 誤差評価部 71 推定偏差符号判定手段 72 教師偏差符号判定手段 73 符号比較手段 74 二乗誤差係数変更手段 75 結合係数修正手段 81 推定偏差絶対値算出手段 82 教師偏差絶対値算出手段 83 絶対値比較手段 84 二乗誤差係数変更手段 131 状態量検出手段 132 学習条件判定手段 133 ニューロ選択手段 134 ニューロ演算手段 161 学習データ作成手段 162 学習手段 163 係数更新ニューロ選択手段 165 学習データ格納手段 171 学習データセット作成手段 175 推定値算出手段 177 学習データ更新手段
フロントページの続き Fターム(参考) 3G084 AA03 BA09 BA13 DA04 EB02 EB13 EB20 EB21 EC04 FA02 FA10 FA11 FA13 FA20 FA29 FA33 3G301 HA01 HA06 JA18 MA01 MA11 NA09 ND02 ND25 ND28 ND45 PA07Z PA10Z PA11Z PB03Z PD02Z PE08Z 5H004 GA05 GB12 HA13 HB01 HB04 HB07 HB08 JB07 KA65 KA66 KC02 KC09 KC24 KC28 KD33 KD36 KD45 LB06 9A001 HH05 HH06 KK32 KK54
Claims (12)
- 【請求項1】 推定対象パラメータに関連する複数の入
力パラメータ値の入力を受け、この入力パラメータ値か
ら推定対象パラメータ値を推定し、この推定値を目標値
追従制御量演算に用いるためのニューラルネットワーク
と、 ニューロ推定値と教師信号との二乗誤差に対し乗算すべ
き重み係数の値を、ニューロ推定値と教師信号と目標値
との相対関係に応じて変更する誤差係数変更手段と、 前記重み係数を用いて学習時の評価関数を演算する評価
関数演算手段とを備え、 前記評価関数に基づき前記ニューラルネットワークの学
習を行うことを特徴とする学習制御装置。 - 【請求項2】 推定対象パラメータに関連する複数の入
力パラメータ値の入力を受け、受け付けた入力パラメー
タ値からニューラルネットワークにより推定対象パラメ
ータ値を推定し、この推定値を目標値追従制御量演算に
用いる際のニューラルネットワークの学習制御を行なう
方法において、 ニューロ推定値と教師信号との二乗誤差に対し乗算すべ
き重み係数の値を、ニューロ推定値と教師信号と目標値
との相対関係に応じて変更し、 前記重み係数を用いて学習時の評価関数を演算し、 前記評価関数に基づき前記ニューラルネットワークの学
習を行うことを特徴とする学習制御方法。 - 【請求項3】 推定対象パラメータに関連する複数の入
力パラメータ値の入力を受け、この入力パラメータ値か
ら推定対象パラメータ値を推定し、この推定値を目標値
追従制御量演算に用いるためのニューラルネットワーク
と、 ニューロ推定値と目標値との偏差の符号の種類を判定す
る推定偏差符号判定手段と、 教師信号と目標値との偏差の符号の種類を判定する教師
偏差符号判定手段と、 前記推定偏差符号判定手段および教師偏差符号判定手段
により判定されたそれぞれの符号の種類を比較する符号
比較手段と、 前記符号比較手段により符号が異なると判別された場
合、前記ニューロ推定値と前記教師信号との二乗誤差に
乗じるべき重み係数の値を大きくする二乗誤差係数変更
手段と、 前記重み係数を用いて学習時の評価関数を演算する評価
関数演算手段とを備え、 前記評価関数に基づき前記ニューラルネットワークの学
習を行うことを特徴とする学習制御装置。 - 【請求項4】 推定対象パラメータに関連する複数の入
力パラメータ値の入力を受け、この入力パラメータ値か
ら推定対象パラメータ値を推定し、この推定値を目標値
追従制御量演算に用いるためのニューラルネットワーク
と、 ニューロ推定値と目標値との偏差の符号の種類を判定す
る推定偏差符号判定手段と、 前記ニューロ推定値と前記目標値との偏差の絶対値を算
出する推定偏差絶対値算出手段と、 教師信号と目標値との偏差の符号の種類を判定する教師
偏差符号判定手段と、 前記教師信号と前記目標値との偏差の絶対値を算出する
教師信号偏差絶対値算出手段と、 前記推定偏差符号判定手段および教師信号偏差符号判定
手段により判定されたそれぞれの符号の種類を比較する
符号比較手段と、 前記推定偏差絶対値算出手段および教師信号偏差絶対値
算出手段により算出された絶対値の大小を比較する絶対
値比較手段と、 前記符号比較手段により符号の種類が同じであると判別
され、かつ前記絶対値比較手段により前記ニューロ推定
値と前記目標値との偏差の絶対値の方が前記教師信号と
前記目標値との偏差の絶対値よりも小さいと判定された
場合、前記ニューロ推定値と前記教師信号との二乗誤差
に乗ずるべき重み係数の値を大きくする二乗誤差係数変
更手段と、 前記重み係数を用いて学習時の評価関数を演算する評価
関数演算手段とを備え、 前記評価関数に基づき学習を行うことを特徴とする学習
制御装置。 - 【請求項5】 推定対象パラメータに関連する複数の入
力パラメータ値の入力を受け、この入力パラメータ値か
ら推定対象パラメータ値を推定し、この推定値を目標値
追従制御量演算に用いるための,それぞれの学習条件に
対応した複数のニューロ構成を有するニューラルネット
ワークと、 制御対象の動特性に関連する状態量を検出する状態量検
出手段と、 前記検出値に基づき前記ニューラルネットワークの学習
条件を判定する学習条件判定手段と、 前記状態量に基づき前記ニューラルネットワークのニュ
ーロ構成の中から現在の条件に対応するニューロ出力値
のみを選択するニューロ選択手段とを備えたことを特徴
とする学習制御装置。 - 【請求項6】 請求項5記載の学習制御装置において、 前記ニューロ選択手段は、現在の状態量がある学習条件
を満たす場合、その条件に対応するニューロ出力に
“1”を、それ以外のニューロ出力には“0”となるス
テップ関数を乗ずることによりニューロ出力を選択する
ものとしたことを特徴とする学習制御装置。 - 【請求項7】 推定対象パラメータに関連する複数の入
力パラメータ値の入力を受け、この入力パラメータ値か
ら推定対象パラメータ値を推定し、この推定値を目標値
追従制御量演算に用いるための,それぞれの学習条件に
対応した複数のニューロ構成を有するニューラルネット
ワークと、 制御対象の動特性に関連する状態量を検出する状態量検
出手段と、 前記検出値に基づき前記ニューラルネットワークの学習
条件を判定する学習条件判定手段と、 それぞれのニューロ構成の結合係数を学習した学習デー
タセットを格納している学習データ格納手段と、 前記状態量に基づき前記学習条件毎の学習データを作成
する学習データ作成手段と、 前記学習データ格納手段で格納されている条件に対応す
る学習データセットと前記学習データ作成手段で新たに
作成された学習データとを用いニューロ結合係数の学習
を行う学習手段と、 前記条件に対応するニューロ構成を選択し前記学習結果
である結合係数に更新する係数更新ニューロ選択手段と
を備えたことを特徴とする学習制御装置。 - 【請求項8】 請求項7記載の学習制御装置において、 前記学習手段において実際の学習に用いられる学習デー
タセットは、最新の学習データセットと同数分、古い学
習データセットを消去し更新したものであり、前記学習
データセットは常に一定のセット数であることを特徴と
する学習制御装置。 - 【請求項9】 請求項7または8記載の学習制御装置に
おいて、 前記学習データ格納手段において、格納されている学習
データセットは、ニューロ演算処理を行うニューラルネ
ットワーク自体が学習対象となっているオンライン状態
において常に更新されている学習データセットであるこ
とを特徴とする学習制御装置。 - 【請求項10】 推定対象パラメータに関連する複数の
入力パラメータ値の入力を受け、この入力パラメータ値
から推定対象パラメータ値を推定し、この推定値を目標
値追従制御量演算に用いるための,それぞれの学習条件
に対応した複数のニューロ構成を有するニューラルネッ
トワークと、 制御対象の動特性に関連する状態量を検出する状態量検
出手段と、 前記検出値に基づき学習条件を判定する学習条件判定手
段と、 それぞれのニューロ構成の結合係数を学習した学習デー
タセットを格納している学習データ格納手段と、 前記状態量に基づき前記学習条件毎の新しい学習データ
を作成する学習データ作成手段と、 前記学習データ格納手段で格納されている前記学習条件
に対応する全てのニューロ構成の学習データセットと前
記学習データ作成手段で新たに作成された学習データと
を用い、それぞれのニューロ構成に対する学習データセ
ットを作成する学習データセット作成手段と、 前記学習データ格納手段内の対応するデータをこの新た
に作成された学習データセットに更新する学習データ更
新手段と、 前記新たに作成された学習データセットを用い前記学習
条件に対応する全てのニューロ結合係数の学習を行う学
習手段と、 前記対応する全てのニューロ構成を選択し前記学習結果
である結合係数に更新する係数更新ニューロ選択手段
と、 前記学習条件に対応する全てのニューロ構成を選択する
ニューロ構成選択手段と、 前記対応する全てのニューロ出力から制御を行う際に用
いるニューロ推定値を算出する推定値算出手段とを備
え、 前記推定値を制御量演算に用いることを特徴とする学習
制御装置。 - 【請求項11】 請求項10記載の学習制御装置におい
て、 前記ニューラルネットワークにおける,隣り合う条件下
におけるニューロ構成は、共通の制御対象動特性の表現
部分を持つことを特徴とする学習制御装置。 - 【請求項12】 請求項10または11記載の学習制御
装置において、 前記推定値算出手段は、対応する全てのニューロ出力値
の平均値を、制御で用いるニューロ推定値として算出す
ることを特徴とする学習制御装置。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11139136A JP2000330610A (ja) | 1999-05-19 | 1999-05-19 | 学習制御装置および学習制御方法 |
US09/329,196 US6678640B2 (en) | 1998-06-10 | 1999-06-10 | Method and apparatus for parameter estimation, parameter estimation control and learning control |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP11139136A JP2000330610A (ja) | 1999-05-19 | 1999-05-19 | 学習制御装置および学習制御方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
JP2000330610A true JP2000330610A (ja) | 2000-11-30 |
Family
ID=15238389
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
JP11139136A Pending JP2000330610A (ja) | 1998-06-10 | 1999-05-19 | 学習制御装置および学習制御方法 |
Country Status (1)
Country | Link |
---|---|
JP (1) | JP2000330610A (ja) |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007303351A (ja) * | 2006-05-10 | 2007-11-22 | Honda Motor Co Ltd | 内燃機関の空燃比制御装置 |
WO2019176772A1 (ja) * | 2018-03-15 | 2019-09-19 | オムロン株式会社 | 学習装置、学習方法、及びそのプログラム |
WO2020129204A1 (ja) * | 2018-12-20 | 2020-06-25 | Tdk株式会社 | ニューロモーフィック回路、ニューロモーフィックアレイの学習方法およびプログラム |
JP2020144717A (ja) * | 2019-03-08 | 2020-09-10 | 三菱電機株式会社 | ニューラルネットワーク装置 |
JP2021015649A (ja) * | 2020-11-16 | 2021-02-12 | 三菱電機株式会社 | ニューラルネットワーク装置 |
CN113168137A (zh) * | 2018-12-12 | 2021-07-23 | 日本电信电话株式会社 | 多设备协同控制装置、多设备协同控制方法及多设备协同控制程序,以及学习装置、学习方法及学习程序 |
JP2021152691A (ja) * | 2020-03-24 | 2021-09-30 | 株式会社 日立産業制御ソリューションズ | 学習画像判定装置、プログラムおよび学習画像判定方法 |
-
1999
- 1999-05-19 JP JP11139136A patent/JP2000330610A/ja active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP2007303351A (ja) * | 2006-05-10 | 2007-11-22 | Honda Motor Co Ltd | 内燃機関の空燃比制御装置 |
JP4673787B2 (ja) * | 2006-05-10 | 2011-04-20 | 本田技研工業株式会社 | 内燃機関の空燃比制御装置 |
CN111684365A (zh) * | 2018-03-15 | 2020-09-18 | 欧姆龙株式会社 | 学习装置、学习方法及其程序 |
JP2019160017A (ja) * | 2018-03-15 | 2019-09-19 | オムロン株式会社 | 学習装置、学習方法、及びそのプログラム |
WO2019176772A1 (ja) * | 2018-03-15 | 2019-09-19 | オムロン株式会社 | 学習装置、学習方法、及びそのプログラム |
US11480931B2 (en) | 2018-03-15 | 2022-10-25 | Omron Corporation | Learning device, learning method, and program therefor |
CN113168137A (zh) * | 2018-12-12 | 2021-07-23 | 日本电信电话株式会社 | 多设备协同控制装置、多设备协同控制方法及多设备协同控制程序,以及学习装置、学习方法及学习程序 |
WO2020129204A1 (ja) * | 2018-12-20 | 2020-06-25 | Tdk株式会社 | ニューロモーフィック回路、ニューロモーフィックアレイの学習方法およびプログラム |
JPWO2020129204A1 (ja) * | 2018-12-20 | 2021-03-11 | Tdk株式会社 | ニューロモーフィック回路、ニューロモーフィックアレイの学習方法およびプログラム |
JP2020144717A (ja) * | 2019-03-08 | 2020-09-10 | 三菱電機株式会社 | ニューラルネットワーク装置 |
JP2021152691A (ja) * | 2020-03-24 | 2021-09-30 | 株式会社 日立産業制御ソリューションズ | 学習画像判定装置、プログラムおよび学習画像判定方法 |
JP7266008B2 (ja) | 2020-03-24 | 2023-04-27 | 株式会社 日立産業制御ソリューションズ | 学習画像判定装置、プログラムおよび学習画像判定方法 |
JP2021015649A (ja) * | 2020-11-16 | 2021-02-12 | 三菱電機株式会社 | ニューラルネットワーク装置 |
JP7086500B2 (ja) | 2020-11-16 | 2022-06-20 | 三菱電機株式会社 | ニューラルネットワーク装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US6678640B2 (en) | Method and apparatus for parameter estimation, parameter estimation control and learning control | |
JPH1185719A (ja) | パラメータ推定装置 | |
JP3703117B2 (ja) | モデルベース制御方法および装置 | |
EP2397676B1 (en) | EGR control apparatus for internal combustion engine | |
JP5006947B2 (ja) | プラントの制御装置 | |
US7813867B2 (en) | Control apparatus and method and control unit | |
US6330553B1 (en) | Autonomic system for updating fuzzy neural network and control system using the fuzzy neural network | |
US9518515B2 (en) | Sliding mode controller and internal combustion engine system control device | |
EP2078842B1 (en) | Control apparatus and method | |
US6990402B2 (en) | Control system and method, and control unit | |
EP1854984A1 (en) | Air-fuel ratio control system and method for internal combustion engine | |
JPH0988685A (ja) | 内燃機関の空燃比制御装置 | |
JP2020045773A (ja) | 内燃機関の制御装置 | |
US6415273B1 (en) | Method of feed-forward control using control logic with anticipatory learning control | |
JP2000330610A (ja) | 学習制御装置および学習制御方法 | |
US6336084B1 (en) | Three-way catalyst model for an engine air-to-fuel ratio control system | |
Ouladsine et al. | Neural modelling and control of a diesel engine with pollution constraints | |
JPH1182137A (ja) | パラメータ推定装置 | |
JPH1011105A (ja) | 状態制御方式 | |
García-Nieto et al. | Air management in a diesel engine using fuzzy control techniques | |
JP3301250B2 (ja) | 空燃比制御装置 | |
JP3508328B2 (ja) | 空燃比制御装置 | |
Copp et al. | Model comparison for feedforward air/fuel ratio control | |
Frith et al. | Adaptive control of gasoline engine air-fuel ratio using artificial neural networks | |
Li et al. | Optimal control based falsification of unknown systems with time delays: A gasoline engine A/F ratio control case study |