JPS608902A - 学習制御方式 - Google Patents
学習制御方式Info
- Publication number
- JPS608902A JPS608902A JP58115849A JP11584983A JPS608902A JP S608902 A JPS608902 A JP S608902A JP 58115849 A JP58115849 A JP 58115849A JP 11584983 A JP11584983 A JP 11584983A JP S608902 A JPS608902 A JP S608902A
- Authority
- JP
- Japan
- Prior art keywords
- rule
- control
- knowledge base
- knowledge
- level
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Classifications
-
- G—PHYSICS
- G05—CONTROLLING; REGULATING
- G05B—CONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
- G05B13/00—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
- G05B13/02—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
- G05B13/04—Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric involving the use of models or simulators
Landscapes
- Engineering & Computer Science (AREA)
- Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Evolutionary Computation (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Automation & Control Theory (AREA)
- Devices For Executing Special Programs (AREA)
- Feedback Control In General (AREA)
Abstract
(57)【要約】本公報は電子出願前の出願データであるた
め要約のデータは記録されません。
め要約のデータは記録されません。
Description
【発明の詳細な説明】
〔発明の利用分野〕
本発明は、制御対象の特性が未知な場合、時間的に変化
する場合、制御対象から検出できる信号が、故障などの
原因で時間的に変化する場合などに、制御効果の高い制
御法を自律的に形成できる学習制御方式に関する。
する場合、制御対象から検出できる信号が、故障などの
原因で時間的に変化する場合などに、制御効果の高い制
御法を自律的に形成できる学習制御方式に関する。
従来の学習制御方式の多くは、制御対象に関するモデル
を事前に作成しておき、制御系の運用過程で得られる情
報を用すてモデルを修正し、この修正したモデルを用い
て適切な制御信号を分析し、これを制御対象に印加する
という方式を取っている。このため、制御対象の特性が
不明な場合や、時間的に変化する場合や、制御対象から
検出できる信号が時間的に変化するような場合には、事
前のモデル作シが困難になる。また、たとえモデルを作
シ得るにしても、モデルを用いて適切な制御信号を生成
するための複雑な手続きが必要であるるために、制御手
続きの設計に多くの労力が要求される。多くの労力をか
けて作成した制御手続きも、例えば検出器の故障等が生
ずると前提条件がくずれて用をなさなくなることもある
など柔軟性に乏しい。さらに、制御効果を高めるために
、検出器の改良や制御信号の種類の変更をおこなおうと
すると、最初から再度、制御対象のモデルや制御手続き
を作シなおす必要が生じるなどの問題があ、つた。
を事前に作成しておき、制御系の運用過程で得られる情
報を用すてモデルを修正し、この修正したモデルを用い
て適切な制御信号を分析し、これを制御対象に印加する
という方式を取っている。このため、制御対象の特性が
不明な場合や、時間的に変化する場合や、制御対象から
検出できる信号が時間的に変化するような場合には、事
前のモデル作シが困難になる。また、たとえモデルを作
シ得るにしても、モデルを用いて適切な制御信号を生成
するための複雑な手続きが必要であるるために、制御手
続きの設計に多くの労力が要求される。多くの労力をか
けて作成した制御手続きも、例えば検出器の故障等が生
ずると前提条件がくずれて用をなさなくなることもある
など柔軟性に乏しい。さらに、制御効果を高めるために
、検出器の改良や制御信号の種類の変更をおこなおうと
すると、最初から再度、制御対象のモデルや制御手続き
を作シなおす必要が生じるなどの問題があ、つた。
本発明の目的は、以上のような、従来の学習制御方式の
問題点を克服し、制御対象の特性が不明な場合、時間的
に変化する場合、検出信号や制御信号の特性が時間的に
変化する場合などに対しても、適切な制御方式を生成で
きる学習制御方式を提供することにある。
問題点を克服し、制御対象の特性が不明な場合、時間的
に変化する場合、検出信号や制御信号の特性が時間的に
変化する場合などに対しても、適切な制御方式を生成で
きる学習制御方式を提供することにある。
上記目的を達成するために、本発明においては′ある検
出信号に対して、ある制御信号を発生したら、制御効果
指標はある値を取った”という事実を、制御過程を通じ
て経験的に蓄積して知識ベースとするものである。これ
によって現在の状況に対して有効であると思われる過去
の経験を知識ベースから引き出して利用すると共に、新
たに経験した事実を知識ベース内の過去の経験事実の内
であまり有用でないものと交替させるという進化論的な
、別の言葉で言えば、イノベイティプな手段を利用する
ものである。
出信号に対して、ある制御信号を発生したら、制御効果
指標はある値を取った”という事実を、制御過程を通じ
て経験的に蓄積して知識ベースとするものである。これ
によって現在の状況に対して有効であると思われる過去
の経験を知識ベースから引き出して利用すると共に、新
たに経験した事実を知識ベース内の過去の経験事実の内
であまり有用でないものと交替させるという進化論的な
、別の言葉で言えば、イノベイティプな手段を利用する
ものである。
以下、本発明の実施例を、図面にょシ詳細に説明する。
第1図は、トンネル内の換気システムである。
図で、100はトンネル、110は換気口、120は山
、130は送風器、140は換気制御システム、150
,160,170,180はトンネル内状態検出器(各
々は例えば、可視距離やCO2濃度を検出する)である
。190は検出信号回線、195は送風器制御信号回線
である。
、130は送風器、140は換気制御システム、150
,160,170,180はトンネル内状態検出器(各
々は例えば、可視距離やCO2濃度を検出する)である
。190は検出信号回線、195は送風器制御信号回線
である。
制御システム140の使命は、できるだけ効率良く(運
転コストは低くおさえて、空気汚染度は減少するように
)トンネル内の空気を換気することである。
転コストは低くおさえて、空気汚染度は減少するように
)トンネル内の空気を換気することである。
トンネル内空気の汚染度は、走行車の量、トンネルの長
さや広さ、送風器の運転状態、その他機様の要因によっ
て定まる。そこで、これらの要因の間の関係を物理モデ
ル、たとえば拡散方程式と流体の運転方程式とを用いて
パラメタ化された形で記述しておき、事後的に検出でき
る情報たとえば空気汚染度の計測値を用いることによシ
、モデルの未知パラメタを推定し、得られたモデルによ
って送風器の最適化制御をおこなうという従来のアプロ
ーチが考えられる。
さや広さ、送風器の運転状態、その他機様の要因によっ
て定まる。そこで、これらの要因の間の関係を物理モデ
ル、たとえば拡散方程式と流体の運転方程式とを用いて
パラメタ化された形で記述しておき、事後的に検出でき
る情報たとえば空気汚染度の計測値を用いることによシ
、モデルの未知パラメタを推定し、得られたモデルによ
って送風器の最適化制御をおこなうという従来のアプロ
ーチが考えられる。
しかしながら、既に述べたように、これらの物理モデル
が不正確である場合、夏と冬とで季節風の向きが変わる
ためにトンネル内の空気力学特性が変わる場合、検出器
が故障して今まで観測可能であった信号が観測不可能に
なる場合、送風器の機能の1部が故障して、今まで3レ
ベルの送風強度を選択できたのにもかかわらず、故障後
は2レベルのみ選択できるようになった場合、等々にお
いては、充分に効率良い制御をおこなうことのできる制
御方式をあらかじめ作成することは困難であるし、たと
え作成できるとしても、多くの労力を要することは明ら
かである。
が不正確である場合、夏と冬とで季節風の向きが変わる
ためにトンネル内の空気力学特性が変わる場合、検出器
が故障して今まで観測可能であった信号が観測不可能に
なる場合、送風器の機能の1部が故障して、今まで3レ
ベルの送風強度を選択できたのにもかかわらず、故障後
は2レベルのみ選択できるようになった場合、等々にお
いては、充分に効率良い制御をおこなうことのできる制
御方式をあらかじめ作成することは困難であるし、たと
え作成できるとしても、多くの労力を要することは明ら
かである。
第2図は、本発明のシステム構成例を示したものであ、
?、200は制御用計算機、210はデータファイルで
あシ、内容は前述した知識ベースである。220は制御
プログラムである。230はトンネル内の状態検出器1
50〜180からのアナログ信号をディジタル信号に変
換するA/D変換器や状態検出器のオン、オフ操作用ス
イッチを含むインクフェイス機能である。240は送風
器130の運転レベルを切シ換えるスイッチ機能である
。
?、200は制御用計算機、210はデータファイルで
あシ、内容は前述した知識ベースである。220は制御
プログラムである。230はトンネル内の状態検出器1
50〜180からのアナログ信号をディジタル信号に変
換するA/D変換器や状態検出器のオン、オフ操作用ス
イッチを含むインクフェイス機能である。240は送風
器130の運転レベルを切シ換えるスイッチ機能である
。
制御用計算機200内のプログラム220は、状態検出
器150〜180からの信号を受け取シ、知識ベース2
10内に蓄積されている制御ルールの内から適当なもの
を呼び出し、ルール上に記述されている制御信号に従っ
てスイッチ機能240を操作し、送風器130を動作さ
せる。ルールに従った制御を終了した後に、制御特性を
評価して評価指標を作成し、これをルール上に記入した
後に、知識ベース210に収納する。
器150〜180からの信号を受け取シ、知識ベース2
10内に蓄積されている制御ルールの内から適当なもの
を呼び出し、ルール上に記述されている制御信号に従っ
てスイッチ機能240を操作し、送風器130を動作さ
せる。ルールに従った制御を終了した後に、制御特性を
評価して評価指標を作成し、これをルール上に記入した
後に、知識ベース210に収納する。
第3図は、送風器動作の一例を示すものである。
図の例では、送風器運転レベルは3レベルとなっておシ
、図中300は、レベル3の運転を時間長すにわたって
実施することを示している。運転レベルの切シ換えは、
スイッチ機能240によって実施される。
、図中300は、レベル3の運転を時間長すにわたって
実施することを示している。運転レベルの切シ換えは、
スイッチ機能240によって実施される。
第4図は、第2図210の知識ベースの内容を示す。
知識ベース内には、条件部410と行動部420とから
成るコード(450〜470等。図の例では480〜5
00は余白であり、未だコードが格納されていないこと
を示している)が蓄積されている。コードの条件部と行
動部の定義について以下に説明する。
成るコード(450〜470等。図の例では480〜5
00は余白であり、未だコードが格納されていないこと
を示している)が蓄積されている。コードの条件部と行
動部の定義について以下に説明する。
検出信号1,2,3.4・・・・・・図中430〜43
3:検出器150〜180のアナログ信号をインクフェ
イス機能230によってディジタル化したものが記入さ
れる。
3:検出器150〜180のアナログ信号をインクフェ
イス機能230によってディジタル化したものが記入さ
れる。
汚染度(事前)・・・・・・図中434二制御ルールに
従った制御を開始した時点(第3図の例では、時刻t)
での、検出信号1〜4をもとにして計算したトンネル内
空気汚染度が記入される(汚染度定義の1例として、例
えば可視距離と002濃度の重みつき合計値を使用する
)。
従った制御を開始した時点(第3図の例では、時刻t)
での、検出信号1〜4をもとにして計算したトンネル内
空気汚染度が記入される(汚染度定義の1例として、例
えば可視距離と002濃度の重みつき合計値を使用する
)。
汚染度(事後)・・・・・・図中435:制御ルールに
従った制御を完了した時点(第3図の例では、時刻t+
b)での空気汚染度が記入される。
従った制御を完了した時点(第3図の例では、時刻t+
b)での空気汚染度が記入される。
送風器運用コスト・・・・・・図中436:制御ルール
に従った制御開始から、完了までの間の運転動力コスト
が記入される。
に従った制御開始から、完了までの間の運転動力コスト
が記入される。
評点Jl (呼出し用)・・・・・・図中437:知識
ベースからルールを呼び出す際に使用される評点が記入
される。評点の定義法は後述する。
ベースからルールを呼び出す際に使用される評点が記入
される。評点の定義法は後述する。
評点J2 (追い出し用)川・・・図中438:知識ペ
ースからルールを追い出す際に使用する評点が記入され
る。
ースからルールを追い出す際に使用する評点が記入され
る。
年令・・・・・・図中439
:制御ルールが作成されて以降の経過時間を示す。作成
された時点でルールの年齢は0才であるが、以降、知識
ペースへのルールの収納操作が実施される度に、知識ベ
ース内の全てのルールの年令に1が加えられる。
された時点でルールの年齢は0才であるが、以降、知識
ペースへのルールの収納操作が実施される度に、知識ベ
ース内の全てのルールの年令に1が加えられる。
呼び出し関数用パラメタr1・・・1図中440追い出
し関数用パラメタ「2・・・・・・図中441年令関連
パラメタα・・・・・・図中442:知識ベースからの
ルールの呼び出し及び実行後のルールの知識ペースへの
格納に際しては各ルールに対して定義される2つの関数
P’+ (V、 y。
し関数用パラメタ「2・・・・・・図中441年令関連
パラメタα・・・・・・図中442:知識ベースからの
ルールの呼び出し及び実行後のルールの知識ペースへの
格納に際しては各ルールに対して定義される2つの関数
P’+ (V、 y。
Jl + ’+ ’1 + ”)およびP2 (V、
V、 J2 。
V、 J2 。
t、r2.α)を使用する。パラメタrl 、r2゜α
はこれらの関数で使用するパラメタであシr1≧0.r
2≧0.α≧0である。第5図は、これらの関数を視覚
化したものである。図でたて軸Pは関数値、横軸Yは検
出信号数だけの次元を持つベクトル空間である(図の例
では1次元空間)。
はこれらの関数で使用するパラメタであシr1≧0.r
2≧0.α≧0である。第5図は、これらの関数を視覚
化したものである。図でたて軸Pは関数値、横軸Yは検
出信号数だけの次元を持つベクトル空間である(図の例
では1次元空間)。
図には2つのルールに対応した合計4個の関数が表示し
である。点yx 、Y2は、2つのルールの条件部(第
4図410)の検出信号ベクトル(第(9) 4図の例では430〜433)を図示したものである。
である。点yx 、Y2は、2つのルールの条件部(第
4図410)の検出信号ベクトル(第(9) 4図の例では430〜433)を図示したものである。
ルール1の関数はpHとPI3、ルール2の関数はP2
1とP22である。上記のパラメタrl。
1とP22である。上記のパラメタrl。
r2+αを変化させると、これらの関数の形を変えるこ
とができる。関数pH+ P21は知識ベースからルー
ルを呼び出す時に使用する。たとえば今仮に知識ベース
内にはこれら2つのルールしか存在しないと仮定し、検
出信号ベクトルがyであったとする。点yにおいて関数
P1の値が最小となるのは、ルール2である。よって、
ルール2を呼び出して制御に使用する。この際、実際に
は、Pl値の小さいルールを複数選び、その中から乱数
によってひとつを選択するという確率的方法を用いる方
式をとる。この理由は、実際には大して有効でないルー
ルであるのにもかかわらず、たまたま良好な特性を示し
たルールが知識ベース内に増殖することを防止するため
である。次に、信号ベクトルyのもとで呼び出したルー
ル2を制御に使用した後に再度知識ベースに格納する場
合の説明をおこなう。知識ベース内にルール収納スペー
ス(10) (第4図では480〜500)が存在すれば、特に問題
は無い。収納スペースが無い場合には、点yにおいて関
数P2の値が最大となるルール(図ではルール1)を追
い出し、そこに格納する。図示したようにPlとしては
単1の最小値をもつ関数を、Plとしては単1の最大値
を持つ関数を選ぶことによシ、検出信号yに類似のyを
持ち、かつ特性の良いルールを呼び出すこと、及びyに
類似のyを持ち、かつ特性の悪いルールを追い出すこと
ができ、知識ベースは使用される都度、洗練されてゆく
。
とができる。関数pH+ P21は知識ベースからルー
ルを呼び出す時に使用する。たとえば今仮に知識ベース
内にはこれら2つのルールしか存在しないと仮定し、検
出信号ベクトルがyであったとする。点yにおいて関数
P1の値が最小となるのは、ルール2である。よって、
ルール2を呼び出して制御に使用する。この際、実際に
は、Pl値の小さいルールを複数選び、その中から乱数
によってひとつを選択するという確率的方法を用いる方
式をとる。この理由は、実際には大して有効でないルー
ルであるのにもかかわらず、たまたま良好な特性を示し
たルールが知識ベース内に増殖することを防止するため
である。次に、信号ベクトルyのもとで呼び出したルー
ル2を制御に使用した後に再度知識ベースに格納する場
合の説明をおこなう。知識ベース内にルール収納スペー
ス(10) (第4図では480〜500)が存在すれば、特に問題
は無い。収納スペースが無い場合には、点yにおいて関
数P2の値が最大となるルール(図ではルール1)を追
い出し、そこに格納する。図示したようにPlとしては
単1の最小値をもつ関数を、Plとしては単1の最大値
を持つ関数を選ぶことによシ、検出信号yに類似のyを
持ち、かつ特性の良いルールを呼び出すこと、及びyに
類似のyを持ち、かつ特性の悪いルールを追い出すこと
ができ、知識ベースは使用される都度、洗練されてゆく
。
関数PI、P2の数式的定義法は種々考えられるがここ
ではその1例を下記に示す。
ではその1例を下記に示す。
Pl(V+ L Js + ’+ ’!+ ”)Pl
(V+ yl J2 + 1+ ’2 * ”)(11
) 式中A (’ l ×)は、ベクトルXの距離(ノルム
)をめる関数であ、9A(r、0)=0である。
(V+ yl J2 + 1+ ’2 * ”)(11
) 式中A (’ l ×)は、ベクトルXの距離(ノルム
)をめる関数であ、9A(r、0)=0である。
r=(r+ I r、)+ X=(XI X2 )の場
合の1例としてA(r、X)”rllXll+r21X
21が可能である。ここで、IXtlはXlの絶対値で
ある。
合の1例としてA(r、X)”rllXll+r21X
21が可能である。ここで、IXtlはXlの絶対値で
ある。
式においてPlとPlの頂点(y=yの点)は、年令1
=00時、P1=Jl、P2=J2となる。
=00時、P1=Jl、P2=J2となる。
yがyから離れるに従ってPIは増加、Plは減少する
。年令tが増大するとPl、Plともに増加して100
に漸近する。ここで定数100は、第5図のたて軸の定
義域の最大値として便宜的に定めたものである。
。年令tが増大するとPl、Plともに増加して100
に漸近する。ここで定数100は、第5図のたて軸の定
義域の最大値として便宜的に定めたものである。
以上知識ベースの条件部について詳述したが、つぎに行
動部について説明する。
動部について説明する。
送風器運転レベル・・・・・・図中443:送風器をど
のレベルで運転するかを示す信号が記入される(第3図
の例では、1,2.3のいずれかの値)。
のレベルで運転するかを示す信号が記入される(第3図
の例では、1,2.3のいずれかの値)。
送風器運転時間・・・・・・図中444(12)
:送風器を、上述したレベルで、伺時間運転するかが記
入される。
入される。
デフォルト・ルール・・・・・・図中450:検出信号
ベクトル部に全て米が記入されている。米は任意の実数
との距離が0である仮想数値であると定めておく。前述
の関数A(r+、V−y)において、例えばY=(Ys
、米)、y=(米、y2)ならば、A=0となる。すな
わち、デフォルト・ルールの検出信号ベクトルと任意の
検出信号ベクトルとの距離はOとなる。次に、J!=9
0.J2 =0.年令関連パラメタα=0である。関数
P+ 、Plの定義にこれらのパラメタを与えると、本
ルールに付随する関数P1゜Plは任意の信号ベクトル
yにおいて、年令tに依存せずPt =90.Pl =
0となることがわかる。すなわち、本ルールはきわめて
呼び出されにくいし、また追い出されにくいが、いかな
る信号ベクトルによってでも呼び出すことができる。す
なわち、他に良好なルールが存在しない時に代用ルール
としての機能を果たすという性質をもって(13) いる。
ベクトル部に全て米が記入されている。米は任意の実数
との距離が0である仮想数値であると定めておく。前述
の関数A(r+、V−y)において、例えばY=(Ys
、米)、y=(米、y2)ならば、A=0となる。すな
わち、デフォルト・ルールの検出信号ベクトルと任意の
検出信号ベクトルとの距離はOとなる。次に、J!=9
0.J2 =0.年令関連パラメタα=0である。関数
P+ 、Plの定義にこれらのパラメタを与えると、本
ルールに付随する関数P1゜Plは任意の信号ベクトル
yにおいて、年令tに依存せずPt =90.Pl =
0となることがわかる。すなわち、本ルールはきわめて
呼び出されにくいし、また追い出されにくいが、いかな
る信号ベクトルによってでも呼び出すことができる。す
なわち、他に良好なルールが存在しない時に代用ルール
としての機能を果たすという性質をもって(13) いる。
その他のルール・・・・・・図中460,470:検出
信号ベクトルをはじめ、棟々の情報が記入されている。
信号ベクトルをはじめ、棟々の情報が記入されている。
これらは、制御経験が蓄積されたものである。図中46
0の意味は次の通シである。
0の意味は次の通シである。
検出信号ベクトル(0,2,0,7,0,9,0,1)
、事前の汚染度2.0のもとで、送風器をレベル3゜0
.4時間の条件で運転制御した結果、事後汚染度は0.
5となったが、送風器運用コストは2.0単位必要であ
った。そこで、Jt = J2 ” 30という評点を
与えた(評点の与え方については後述する)。このルー
ルが形成されてから5単位の時間が経過している。この
ルールに付随する関数PI 。
、事前の汚染度2.0のもとで、送風器をレベル3゜0
.4時間の条件で運転制御した結果、事後汚染度は0.
5となったが、送風器運用コストは2.0単位必要であ
った。そこで、Jt = J2 ” 30という評点を
与えた(評点の与え方については後述する)。このルー
ルが形成されてから5単位の時間が経過している。この
ルールに付随する関数PI 。
Plのパラメタは’1′、’2′、α′である。
第6図は、第2図220のプログラムの動作を示したも
のである。
のである。
制御用計算機200の電源投入と共に、プログラムは動
作開始(600)L、制御対象からの信号検出(610
)をおこなう。この検出信号yにもとづいて、知識ペー
ス内の各ルールに関する関(14) 数値P+(シ゛+ Yr J1+ t、 ’! +α)
を計算するなど、前述の方法を用いて呼び出すルールを
決める(620)。呼び出されたルールを仮にRと記す
。
作開始(600)L、制御対象からの信号検出(610
)をおこなう。この検出信号yにもとづいて、知識ペー
ス内の各ルールに関する関(14) 数値P+(シ゛+ Yr J1+ t、 ’! +α)
を計算するなど、前述の方法を用いて呼び出すルールを
決める(620)。呼び出されたルールを仮にRと記す
。
次に、呼び出したルール凡の行動部のパラメタを乱数に
よって変動させる(630)。これは、過去の経験の単
純な繰り返しを防止するために実施するものである。第
4図のルール470を呼び出したと仮定して、具体的−
例を説明する。運転レベル2に対して(0,1)範囲の
一様乱数を発生させ、乱数値が0.9以上だったらレベ
ルをひとつ増加させるとする。もし増加不可ならばその
ままとする。乱数値が0.1以下だったら、レベルをひ
とつ下げる。同じように、運転時間に対しても適当な方
法で変更操作を加える。
よって変動させる(630)。これは、過去の経験の単
純な繰り返しを防止するために実施するものである。第
4図のルール470を呼び出したと仮定して、具体的−
例を説明する。運転レベル2に対して(0,1)範囲の
一様乱数を発生させ、乱数値が0.9以上だったらレベ
ルをひとつ増加させるとする。もし増加不可ならばその
ままとする。乱数値が0.1以下だったら、レベルをひ
とつ下げる。同じように、運転時間に対しても適当な方
法で変更操作を加える。
次に、事前汚染度を計測してR上の条件部の該当部に記
入し、タイマーを0セツトしく640)、変更後のルー
ルの行動部の情報に従って第2図240のスイッチ機能
を操作する。
入し、タイマーを0セツトしく640)、変更後のルー
ルの行動部の情報に従って第2図240のスイッチ機能
を操作する。
時間計測を繰り返しく650)、上記で設定した運転時
間を超えたら、制御効果の評価(660)(15) をおこなう。その具体的方法の1例は第7図で説明する
。次いで、評価値などを実行筒のルールR上に記入する
(670)。具体的には、検出信号y(ルール凡の呼び
出しに使用したもの)の凡の検出信号部への記入、事後
汚染度の計測とRへの記入、送風器運用コストの計算と
Rへの記入、評点J+ 、J2の作成とRへの記入、R
上の年令項の0セツト、パラメタ’1 + ’2 +α
の設定(これは、呼び出した段階でR上に記入されてい
たものをそのまま使用しても良い。特性の悪いルールを
早く知識ペースから追い出そうと思えば、評点J1に比
例した年令関連パラメタαを設定すれば良い)をおこな
う。これらの情報記入によって、呼び出されたルールR
は変化する。変化後のものをR′と記す。
間を超えたら、制御効果の評価(660)(15) をおこなう。その具体的方法の1例は第7図で説明する
。次いで、評価値などを実行筒のルールR上に記入する
(670)。具体的には、検出信号y(ルール凡の呼び
出しに使用したもの)の凡の検出信号部への記入、事後
汚染度の計測とRへの記入、送風器運用コストの計算と
Rへの記入、評点J+ 、J2の作成とRへの記入、R
上の年令項の0セツト、パラメタ’1 + ’2 +α
の設定(これは、呼び出した段階でR上に記入されてい
たものをそのまま使用しても良い。特性の悪いルールを
早く知識ペースから追い出そうと思えば、評点J1に比
例した年令関連パラメタαを設定すれば良い)をおこな
う。これらの情報記入によって、呼び出されたルールR
は変化する。変化後のものをR′と記す。
以上の評点Jl、J2の作成は実際に制御を作動した結
果にもとづいているが、実際に装置を作動するまでもな
くコンピュータシミュレーションで装置を作動した場合
相当のデータを得て作成することも可能である。
果にもとづいているが、実際に装置を作動するまでもな
くコンピュータシミュレーションで装置を作動した場合
相当のデータを得て作成することも可能である。
(16)
次に、R′を知識ペースに収納する(680)。
この際、R′上の検出信号ベクトルyにおける知識ペー
ス内の各ルールの関数P2の値を用いて、前述した方法
で追い出すべきルールを決める(知識ペースにスペース
余裕があれば、追い出しをおこなわず、スペース上に収
納する)。次に、知識ペース内の全てのルールの年令に
1を加えて加令する。
ス内の各ルールの関数P2の値を用いて、前述した方法
で追い出すべきルールを決める(知識ペースにスペース
余裕があれば、追い出しをおこなわず、スペース上に収
納する)。次に、知識ペース内の全てのルールの年令に
1を加えて加令する。
第7図は、運用コストと、汚染度変化とを与えた時、評
点J+ 、J2を算出する方法の1例を示すものであム
第2図220のプログラムの1部として、あらかじめ組
み込んでおく。運用コストは、送風器運転レベルと、運
転時間と、単位時間あたりの電力費用などから計算する
。計算に必要な基本データは、あらかじめプログラム2
20に組み込んでおく。汚染度変化は、事後汚染度から
事前汚染度を引くことによって計算する。図の例では、
運用コストと汚染度変化を両軸とする平面が、ゾーンA
からゾーンGまでの計6個のゾーンに分割されておシ、
各ゾーンに対して、制御効果(17) 評点Jr 、J2があらかじめ与えである。1例として
、多くの運転コストをかけたのにもかかわらず、汚染度
が増大するような場合はゾーンAに対応し、Jt =J
2 = 120という評点が与えられる。よって、この
ようなルールは知識ペースにたとえ収納されたとしても
、再度呼び出される確率は低く、年令の増加と共に知識
ペースから早急に追い出されてゆく。逆に、ゾーンFに
対応するルールが知識ベース内に収納されると、度々呼
び出され、従って自己の変異形を知識ベース内に増加さ
せる。よって、制御システム全体としてみると、次第に
効果的な制御方式を学習する機能が実現されることにな
る。つぎに送風器の特性が変化した場合の1例として送
風器を新型のものと取り換えたため、運転レベルが追加
された場合に対処できる一方式について説明する。例え
ば、レベル4が追加されたとする。これに対処する1つ
の方式として第8図を示した。第8図は計算でめた制御
タイプ(上記実施例では、レベル1,2.3の3タイプ
があった)を実際の指示に変換するテープ(18) ルであってプログラム220内に保有されている。
点J+ 、J2を算出する方法の1例を示すものであム
第2図220のプログラムの1部として、あらかじめ組
み込んでおく。運用コストは、送風器運転レベルと、運
転時間と、単位時間あたりの電力費用などから計算する
。計算に必要な基本データは、あらかじめプログラム2
20に組み込んでおく。汚染度変化は、事後汚染度から
事前汚染度を引くことによって計算する。図の例では、
運用コストと汚染度変化を両軸とする平面が、ゾーンA
からゾーンGまでの計6個のゾーンに分割されておシ、
各ゾーンに対して、制御効果(17) 評点Jr 、J2があらかじめ与えである。1例として
、多くの運転コストをかけたのにもかかわらず、汚染度
が増大するような場合はゾーンAに対応し、Jt =J
2 = 120という評点が与えられる。よって、この
ようなルールは知識ペースにたとえ収納されたとしても
、再度呼び出される確率は低く、年令の増加と共に知識
ペースから早急に追い出されてゆく。逆に、ゾーンFに
対応するルールが知識ベース内に収納されると、度々呼
び出され、従って自己の変異形を知識ベース内に増加さ
せる。よって、制御システム全体としてみると、次第に
効果的な制御方式を学習する機能が実現されることにな
る。つぎに送風器の特性が変化した場合の1例として送
風器を新型のものと取り換えたため、運転レベルが追加
された場合に対処できる一方式について説明する。例え
ば、レベル4が追加されたとする。これに対処する1つ
の方式として第8図を示した。第8図は計算でめた制御
タイプ(上記実施例では、レベル1,2.3の3タイプ
があった)を実際の指示に変換するテープ(18) ルであってプログラム220内に保有されている。
図に示したように、この例ではあらかじめ5個の制御タ
イプを用意しておき、その内3個については実際の指示
をおこなうが、2個については制御タイプを再計算させ
るようにするものである(810,820による)。制
御タイプ4が追加されると図中の810部のビットを0
にして、830部にビット1を新たに立てる。
イプを用意しておき、その内3個については実際の指示
をおこなうが、2個については制御タイプを再計算させ
るようにするものである(810,820による)。制
御タイプ4が追加されると図中の810部のビットを0
にして、830部にビット1を新たに立てる。
(19)
(20)
以上、トンネルにおける換気制御を実施例として詳細な
説明をおこなったが、本発明はこの倒板外にも種々の対
象に適用可能である。第1表に、本発明の適用可能と考
えられる対象の例と適用に際しての概要および検出信号
、制御信号、制御効果指標を示した。
説明をおこなったが、本発明はこの倒板外にも種々の対
象に適用可能である。第1表に、本発明の適用可能と考
えられる対象の例と適用に際しての概要および検出信号
、制御信号、制御効果指標を示した。
トンネル内、換気制御システムを中心に説明した実施例
の説明内容かられかるように、本発明を用いた学習制御
方式においては、制御対象に関するモデルは必要でない
。第4図450に示したデフォルト・ルールを1本だけ
知識ベース内に収納しておけば、これが使用されるたび
に新しいルールが作成され、知識ベースに追加されてゆ
き、しかも特性の良いルールが特性の悪いルールを次第
に放逐するので知識ベース全体としての特性は高まって
ゆく。このため、従来の学習制御システムの設計でおこ
なわれていたように、制御対象のモデリングや学習制御
方式の設計及びプログラミングに多くの労力をかける必
要はなくなる。
の説明内容かられかるように、本発明を用いた学習制御
方式においては、制御対象に関するモデルは必要でない
。第4図450に示したデフォルト・ルールを1本だけ
知識ベース内に収納しておけば、これが使用されるたび
に新しいルールが作成され、知識ベースに追加されてゆ
き、しかも特性の良いルールが特性の悪いルールを次第
に放逐するので知識ベース全体としての特性は高まって
ゆく。このため、従来の学習制御システムの設計でおこ
なわれていたように、制御対象のモデリングや学習制御
方式の設計及びプログラミングに多くの労力をかける必
要はなくなる。
(21)
次に、制御対象の性質が時間的に変化する場合を考える
。従来の方式では、対象の特性が大幅に変化すると、学
習制御方式の設計前提がくるってしまうので、学習が不
可能になることが多い。これに対して本発明では、対象
の性質を学習制御の前提として利用しておらず、対象か
ら検出した信号とそのもとで実行した制御、及びその時
の効果のみを利用して学習制御をおこなう。このため、
従来方式よシも学習に時間がかかる場合はあるが、対象
の特性が変化する場合にも学習を続行することが可能で
ある。
。従来の方式では、対象の特性が大幅に変化すると、学
習制御方式の設計前提がくるってしまうので、学習が不
可能になることが多い。これに対して本発明では、対象
の性質を学習制御の前提として利用しておらず、対象か
ら検出した信号とそのもとで実行した制御、及びその時
の効果のみを利用して学習制御をおこなう。このため、
従来方式よシも学習に時間がかかる場合はあるが、対象
の特性が変化する場合にも学習を続行することが可能で
ある。
次に、検出器や送風器の特性が故障などによって変化す
る場合について考える。従来の学習制御方式では、これ
らの変化に対して対処することは大変むつかしい。たと
え可能であったとしても、あらかじめ、種々の場合を想
定しておき、学習過程がそれらの変化に対処できるよう
にしておく必要がある。ところが本方式では、それはき
わめて簡単に実現できる。例えば、第2図において、検
出器150が故障し、固定した(例えば0の)値(22
) のみを出力するようになったとする。この時、第4図4
30部の値がOとなったルールしか生成されなくなる。
る場合について考える。従来の学習制御方式では、これ
らの変化に対して対処することは大変むつかしい。たと
え可能であったとしても、あらかじめ、種々の場合を想
定しておき、学習過程がそれらの変化に対処できるよう
にしておく必要がある。ところが本方式では、それはき
わめて簡単に実現できる。例えば、第2図において、検
出器150が故障し、固定した(例えば0の)値(22
) のみを出力するようになったとする。この時、第4図4
30部の値がOとなったルールしか生成されなくなる。
しかしながら、知識ペース内の古い(検出器150が正
常であった時に蓄積した)ルールは年令の増加と共に次
第に追い出されてゆくので、しばらく時間が経過した後
には、知識ペースは検出信号2,3.4のみを前提とし
た学習を完了する。新しい状態に対する学習が充分に進
展するまでの遷移の時間帯においても、特に問題は発生
しない。その理由は、検出器150が正常であった時期
に学習した知識ペース内のルールの内、特性の良いもの
を呼び出すということは常に実施されるからである。逆
に、制御系を設計した当初の段階では利用できなかった
検出器を、制御系設置後に取りつける必要が生じた場合
を考える。この場合に対処するには、あらかじめ第4図
433の部分の右側に余白を設けておき、新たに検出可
能となった信号をここに記入するだけで良い。追加した
信号は、その時点から即座に利用されるようになる。
常であった時に蓄積した)ルールは年令の増加と共に次
第に追い出されてゆくので、しばらく時間が経過した後
には、知識ペースは検出信号2,3.4のみを前提とし
た学習を完了する。新しい状態に対する学習が充分に進
展するまでの遷移の時間帯においても、特に問題は発生
しない。その理由は、検出器150が正常であった時期
に学習した知識ペース内のルールの内、特性の良いもの
を呼び出すということは常に実施されるからである。逆
に、制御系を設計した当初の段階では利用できなかった
検出器を、制御系設置後に取りつける必要が生じた場合
を考える。この場合に対処するには、あらかじめ第4図
433の部分の右側に余白を設けておき、新たに検出可
能となった信号をここに記入するだけで良い。追加した
信号は、その時点から即座に利用されるようになる。
(23)
次に、送風器の特性が変化した場合について考える。第
3図で、運転レベル2が故障して動作不能となったと仮
定する。この結果、今までレベル2の制御を指令してい
たルールを使用した時の制御効果は悪くな)、従って評
点J1+J2は大きな値を取るようになる。このため、
運転レベル2を指令するルールは知識ペースから次第に
追放されてゆく。逆に、送風器を新型のものと取シ換え
たために、運転レベルが追加され、例えば、レベル4が
追加された場合の1対処の仕方については第8図を中心
に説明したがこのほか第6図の630の処理を若干変更
して、レベル4の制御信号を発生できるようにする方式
も可能である。
3図で、運転レベル2が故障して動作不能となったと仮
定する。この結果、今までレベル2の制御を指令してい
たルールを使用した時の制御効果は悪くな)、従って評
点J1+J2は大きな値を取るようになる。このため、
運転レベル2を指令するルールは知識ペースから次第に
追放されてゆく。逆に、送風器を新型のものと取シ換え
たために、運転レベルが追加され、例えば、レベル4が
追加された場合の1対処の仕方については第8図を中心
に説明したがこのほか第6図の630の処理を若干変更
して、レベル4の制御信号を発生できるようにする方式
も可能である。
第1図は、本発明実施例のトンネル空気換気系の概念図
、第2図は、本発明実施例における制御系の構成図、第
3図は、本発明実施例における送風器運転状況の説明図
、第4図は、本発明実施例の構成要素のひとつである知
識ペースと、その内部の説明図、第5図は、本発明実施
例における知(24) 識ペースからのルールの呼び出し及び追い出しに使用す
る関数の概念図、第6図は、本発明実施例におけるプロ
グラムのフローチャート、第7図は、第6図660にお
ける制御効果評価方式の1例を示すグラフ、第8図は、
本発明実施例における制御タイプの変更に対処するだめ
のタイプ変換表の1例を示す説明図。 130・・・送風器、150〜180・・・状態検出器
、200・・・制御用計算機、210・・・知識ペース
用データファイル、220・・・制御プログラム、23
0・・・インタフェイス機能(A/D変換、オンオフ操
(25) 第 2 図 Y 3 図 t 兄十b 第 5図 P Y 乙 図 χ γ 口 第 8 図
、第2図は、本発明実施例における制御系の構成図、第
3図は、本発明実施例における送風器運転状況の説明図
、第4図は、本発明実施例の構成要素のひとつである知
識ペースと、その内部の説明図、第5図は、本発明実施
例における知(24) 識ペースからのルールの呼び出し及び追い出しに使用す
る関数の概念図、第6図は、本発明実施例におけるプロ
グラムのフローチャート、第7図は、第6図660にお
ける制御効果評価方式の1例を示すグラフ、第8図は、
本発明実施例における制御タイプの変更に対処するだめ
のタイプ変換表の1例を示す説明図。 130・・・送風器、150〜180・・・状態検出器
、200・・・制御用計算機、210・・・知識ペース
用データファイル、220・・・制御プログラム、23
0・・・インタフェイス機能(A/D変換、オンオフ操
(25) 第 2 図 Y 3 図 t 兄十b 第 5図 P Y 乙 図 χ γ 口 第 8 図
Claims (1)
- 【特許請求の範囲】 1、少なくも制御対象からの検出信号、制御効果の指標
、を制御ルールに記述するステップと、該制御ルールを
ファイルに蓄積するステップと上記制御対象からの検出
信号によって上記ファイルから適切なルールを呼び出す
ステップと、呼び出したルール上の制御信号部の情報を
改変するステップと該改変後の情報によって制御対象を
制御した際の制御特性を評価して評価指標をルール上に
記入するステップと、該ルールの評価指標にもとすいて
該ルールを上記ファイルに書き込むステップを有するこ
とを特徴とする学習制御方式。 2、該ルールの評価指標と上記ファイル内のルールの評
価指標を比較し、上記ファイル内のルールの抹消の可否
を判断する特許請求の範囲第1項記載の学習制御方式。
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58115849A JPS608902A (ja) | 1983-06-29 | 1983-06-29 | 学習制御方式 |
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP58115849A JPS608902A (ja) | 1983-06-29 | 1983-06-29 | 学習制御方式 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| JPS608902A true JPS608902A (ja) | 1985-01-17 |
Family
ID=14672653
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP58115849A Pending JPS608902A (ja) | 1983-06-29 | 1983-06-29 | 学習制御方式 |
Country Status (1)
| Country | Link |
|---|---|
| JP (1) | JPS608902A (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61208547A (ja) * | 1985-03-14 | 1986-09-16 | Toshiba Corp | 故障診断支援装置 |
| US5493729A (en) * | 1990-03-14 | 1996-02-20 | Hitachi, Ltd. | Knowledge data base processing system and expert system |
Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5716234A (en) * | 1980-07-01 | 1982-01-27 | Yoshiyuki Morita | Device and method for controlling internal combustion engine to optimum |
-
1983
- 1983-06-29 JP JP58115849A patent/JPS608902A/ja active Pending
Patent Citations (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS5716234A (en) * | 1980-07-01 | 1982-01-27 | Yoshiyuki Morita | Device and method for controlling internal combustion engine to optimum |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPS61208547A (ja) * | 1985-03-14 | 1986-09-16 | Toshiba Corp | 故障診断支援装置 |
| US5493729A (en) * | 1990-03-14 | 1996-02-20 | Hitachi, Ltd. | Knowledge data base processing system and expert system |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| CN109765820B (zh) | 一种用于自动驾驶控制策略的训练系统 | |
| US5377308A (en) | Method and system for process control with complex inference mechanism using qualitative and quantitative reasoning | |
| CN110686906B (zh) | 车辆自动驾驶测试方法及装置 | |
| JPH06507991A (ja) | 知識ベースの形成及びそのシミュレーション | |
| CN120012838A (zh) | 具有因果混淆的安全关键场景下车辆的因果强化学习系统 | |
| JPS608902A (ja) | 学習制御方式 | |
| CN111739132A (zh) | 一种基于局部控制器的全身骨骼运动效果修改方法 | |
| US12044598B2 (en) | Method for determining a load prediction for a component of a vehicle | |
| JP7613684B2 (ja) | のり面崩壊発生確率推定モデル学習装置、のり面崩壊発生確率推定装置、のり面崩壊発生確率推定モデル学習方法、のり面崩壊発生確率推定方法及びプログラム | |
| JP2693302B2 (ja) | 自己修復システムを有する画像形成装置 | |
| WO2024252779A1 (ja) | 知的制御装置、知的制御方法および知的制御プログラム | |
| JP2693325B2 (ja) | 自己修復システムを有する画像形成装置 | |
| Glorennec | Forecasting ozone peaks using self-organizing maps and fuzzy logic | |
| JP2644351B2 (ja) | プラント運転訓練模擬装置 | |
| JP2693324B2 (ja) | 自己修復システムを有する画像形成装置 | |
| JP2693305B2 (ja) | 自己修復システムを有する画像形成装置 | |
| JP2693303B2 (ja) | 自己修復システムを有する画像形成装置 | |
| JP2693309B2 (ja) | 自己修復システムを有する画像形成装置 | |
| JP2693308B2 (ja) | 自己修復システムを有する画像形成装置 | |
| JP2693307B2 (ja) | 自己修復システムを有する画像形成装置 | |
| JP2693311B2 (ja) | 自己修復システムを有する画像形成装置 | |
| JP2693300B2 (ja) | 自己修復システムを有する画像形成装置 | |
| JP2693304B2 (ja) | 自己修復システムを有する画像形成装置 | |
| JP2693321B2 (ja) | 自己修復システムを有する画像形成装置 | |
| JP2693301B2 (ja) | 自己修復システムを有する画像形成装置 |