JP3243870B2 - 学習制御方法 - Google Patents

学習制御方法

Info

Publication number
JP3243870B2
JP3243870B2 JP03012093A JP3012093A JP3243870B2 JP 3243870 B2 JP3243870 B2 JP 3243870B2 JP 03012093 A JP03012093 A JP 03012093A JP 3012093 A JP3012093 A JP 3012093A JP 3243870 B2 JP3243870 B2 JP 3243870B2
Authority
JP
Japan
Prior art keywords
control
block
operation amount
target
temperature
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
JP03012093A
Other languages
English (en)
Other versions
JPH06242801A (ja
Inventor
正雄 足立
勝 松島
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hitachi Ltd
Original Assignee
Hitachi Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hitachi Ltd filed Critical Hitachi Ltd
Priority to JP03012093A priority Critical patent/JP3243870B2/ja
Publication of JPH06242801A publication Critical patent/JPH06242801A/ja
Application granted granted Critical
Publication of JP3243870B2 publication Critical patent/JP3243870B2/ja
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Landscapes

  • Feedback Control In General (AREA)

Description

【発明の詳細な説明】
【0001】
【産業上の利用分野】本発明は制御対象や環境の変化に
適応するとともに制御方式設計を容易にする学習制御方
法に関する。
【0002】
【従来の技術】従来の制御方法は、特開平4-24801 号公
報に記載のように偏差のみの情報からファジィルールで
PID制御の操作量を補正したり(ほぼ本発明の第二の
操作量と第三の操作量のみからなる)、特開平4-34602
号公報に記載のように現在の状態量と操作量からニュー
ラルネットにより次ステップの操作量を決定し、ニュー
ラルネットの重みは制御対象への入出力データから推定
・変更したフォワードモデルに基づき変更するものであ
ったり(ほぼ本発明の第一の操作量+モデルの常時学習
機能付き)、特開平4-119402 号公報に記載のように目
標値と外乱に対する異なる特性を二自由度制御で設定し
たり(ほぼ本発明の第一の操作量と第二の操作量のみか
らなる)、 特開平4-123102 号公報に記載のように偏差
フィードバックの制御パラメータを運転データから知識
工学的にオートチューニングする(ほぼ本発明の第二の
操作量と第三の操作量のみからなる)ものであった。
【0003】
【発明が解決しようとする課題】上記従来技術は制御ア
ルゴリズムの最適化を行う範囲や制御アルゴリズム設計
の自動化・高速化について配慮が十分にはされておら
ず、制御精度向上と制御方式設計の高速化がトレードオ
フとなる問題があった。
【0004】本発明の目的は、制御アルゴリズム設計の
自動化・高速化を容易にする制御方法を提供するととも
に、制御アルゴリズムの構造に依存することなく広い範
囲において自動最適化する制御方法を提供することにあ
る。
【0005】
【課題を解決するための手段】上記目的を達成するため
に、〔I〕制御対象に関するモデルと目標状態あるいは
目標状態と計測状態とに基づきフィードフォワードの第
一の操作量を算出する処理、目標状態と計測状態との偏
差よりフィードバックの第二の操作量を算出する処理、
過去の制御の経験との類似度情報から第三の操作量を算
出する処理、この三つの操作量の和を制御対象への入力
とする処理、を施したものである。とくに、〔II〕制御
対象に関するモデルとしてニューラルネットをもちいて
フィードバックの第二の操作量を算出する処理、を施し
たものである。さらに、〔III〕過去の制御の経験との
類似度情報から第三の操作量の算出処理において、類似
度と偏差の比例フィードバックの操作量のみの情報から
第三の操作量を算出する処理、あるいは、繰り返し制御
の場合には三回目の制御時にのみ過去二回の操作量と偏
差の情報から第三の操作量を算出する処理、を施したも
のである。
【0006】
【作用】上記〔I〕の手段によれば、フィードフォワー
ドとフィードバックの二自由度制御をしているので、目
標温度への高速応答性や状態に非線形に依存する影響の
補償はフィードフォワードで、安定性はフィードバック
で保たれるので、制御アルゴリズム設計が容易である。
しかも、フィードバック制御や過去の制御の経験との類
似度情報からフィードバック制御を補正する第三の操作
量があるので、フィードフォワード量算出に用いる制御
対象に関するモデルの精度は従来のように高くする必要
は無い。よって、制御アルゴリズム設計の高速化が容易
となる。また、過去の制御の経験との類似度情報からフ
ィードバック制御を補正する第三の操作量があるので、
自動最適化が実現できる。この自動最適化機能があるの
で、上記制御対象に関するモデルの要求精度はさらに低
くなり、よって、モデリングのための所要時間が短縮さ
れ、制御アルゴリズム設計の高速化が容易となる。
【0007】上記〔II〕の手段によれば、フィードフォ
ワードの操作量を算出するのにニューラルネットを用い
ているので、バックプロパゲーションという学習機能に
よって容易に制御対象のモデリングができる。よって、
制御アルゴリズム設計の自動化・高速化が容易となる。
【0008】上記〔III〕の手段によれば、過去の制御
の経験との類似度情報から第三の操作量の算出処理にお
いて、類似度と偏差の比例フィードバックの操作量のみ
の情報から第三の操作量を算出するので、過去の制御の
経験からの学習により安定性と目標への収束性が向上す
る。あるいは、繰り返し制御の場合には三回目の制御時
にのみ過去二回の操作量と偏差の情報から第三の操作量
を算出するので、目標温度へ近付けるためのフィードバ
ックの補正量を制御対象に関するモデルを使うこと無く
求められるとともに、補正の方向だけでなく量も適切に
求められるので、自動最適化が高速に実現できるととも
に外乱として働くことはない。この自動最適化機能があ
るので、上記制御システムのモデリング精度の要求はさ
らに低くなり、よって、制御アルゴリズム設計の高速化
が容易となる。
【0009】
【実施例】以下、本発明の一実施例を図1−図6により
説明する。
【0010】図1は本実施例の学習制御のブロック線図
を示す。学習制御の目的は、ウェーハ31の全面の温度
を図2に示す目標温度と一致させることである。図3は
本実施例の構成を示す。ウェーハを一枚づつ処理する気
相拡散装置は、ウェーハ31の温度制御用のランプ群3
2(r個のランプ)、ウェーハの温度計測用の放射温度
センサ群33(m個のセンサ)、石英シリンダ34、ド
ーピング用ガス制御装置35、制御用コンピュータ36
で構成されている。オペレータ37がウェーハ31を石
英シリンダ34内にセットして制御開始を制御用コンピ
ュータ36に入力すると、制御用コンピュータ36は、
放射温度センサ群33の計測状態(計測データ)12、
目標状態(ウェーハの目標温度分布の時系列データ)1
1、に基づきランプ群32およびドーピング用ガス制御
装置35への制御指令値を求め、それぞれに温度制御用
操作量13とガス制御指令19を出力して、ウェーハの
温度分布の制御およびドーピング用ガスの石英シリンダ
4内への放出制御をする。以下では、本発明の主要部で
あるコンピュータ36の処理内容について述べる。
【0011】コンピュータ36の処理手順のフローチャ
ートは図4−図5に示す通りである。制御用コンピュー
タ36に電源が接続されると、図4におけるブロック1
00においてイニシャライズの処理として、 Ftc=0, Fgc=0, time=0,time2=0, te
g=0, tce=0, を行ない、ブロック200へ行く。ブロック200にお
いては、オペレータ7からの制御開始入力が入ったかど
うかの判定を行ない、入力有りの場合はブロック300
へ行き、無しの場合はΔt=ti〔ms〕経過の後ごとにブ
ロック200へ行く。ブロック300においては、制御
用コンピュータ36のディスプレー上に「ドーピング制
御開始」と表示し、ブロック400に行く。ブロック4
00からブロック500までの処理はΔt=ti〔ms〕ご
とに繰り返す。この一連の処理はブロック500におい
て制御終了と判定されるまで続けられる。ブロック40
0においては、 time=time+Δt if Ftc=
1, time=0.,time2=0.,Ftc=1 if Ftc=
0, を行ない、ブロック410に行く。ブロック410にお
いては、time2<teg,ならば、ドーピング用ガス放出
終了前と判断してブロック411に行き、time2≧te
g,ならば、温度制御用の加熱終了およびドーピング用
ガス放出終了と判断してブロック450に行く。ブロッ
ク450においては、 Ftc=3,Fgc=0, と置き、温度制御用のr個のランプ群32の各々に対し
加熱せずという制御指令 Ui=0, i=1,…,r を出し、ブロック490に行く。ブロック411におい
ては、放射温度センサ群33(m個のセンサ)の計測デ
ータを読み込み、ブロック412に行く。ブロック41
2においては、読み込まれたN点の温度の内過半数が
Trcsを越えているかどうかを判別し、越えている場合
は繰り返し制御中と判断しブロック413に行き、越え
ていない場合は繰り返し制御前と判断しブロック460
に行く。ブロック460においては、 teg = time + t1 , (ただし、t1:正の定数) tce = time + t2 , (ただし、t2:t1より大きい
定数) を計算し、温度制御用のr個のランプ群32の各々に対
し最大能力で加熱するという制御指令 Ui=Uimax, i=1,…,r (ただし、Uimax:各ラン
プの出力の最大値) を出し、ブロック490に行く。ブロック413におい
ては、 time2=time2+Δt if Ftc=2, Ftc=2 if Ftc=1, を行ない、ブロック414に行く。ブロック414にお
いては、図1のブロック線図に基づき温度制御用の操作
量13を計算し、それを制御指令としてランプ群32へ
出力し、ブロック415に行く。ブロック415におい
ては、読み込まれたN点の温度の内過半数が Tgを越え
ているかどうかを判別し、越えている場合はドーピング
用ガス放出が必要と判断してブロック416に行き、越
えていない場合はドーピング用ガス放出前と判断してブ
ロック490に行く。ブロック416においては、 Fgc=1, と置き、ブロック490に行く。ブロック490におい
ては、 ドーピング用ガス放出制御弁を開 if Fgc=
1, ドーピング用ガス放出制御弁を閉 if Fgc=
0, をガス制御指令19としてドーピング用ガス制御装置3
5へ出力し、ブロック500に行く。ブロック500に
おいては、time2<tce, ならば、ドーピング終了前と
判断してブロック400に戻り、time2≧tce, なら
ば、ドーピング終了と判定されブロック600へ行く。
ブロック600においては、制御用コンピュータ36の
ディスプレー上に「ドーピング終了、ウェーハ取りだし
可能」と表示し、ブロック100に行く。
【0012】図4におけるブロック414の処理手順詳
細のフローチャートは図5に示す通りである。ブロック
1では、現時刻の目標温度 T゜(time2)とΔt時刻先
の目標温度 T゜(time2+Δt)に基づきフィードフォ
ワードの第一の操作量ベクトル Uff≡{〔U1,……,U
r〕の転置}、 を制御対象に関するモデルである次式の
右辺で表わされるニューラルネットをもちいて、 Uff = WR2×〔ΔX−N゜+WK×X+WR1×T゜(time
2)4+WR3×Tout4〕, ただし、ΔXは全ての要素が〔T゜(time2+Δt)−T
゜(time2)〕/Δt であるn次元ベクトル、N゜はガス
流の奪う熱量のノミナルな影響項、Xは全ての要素がT
゜(time2)であるn次元ベクトル、Toutはウェーハを
取り囲むランプ以外の部分の代表温度である定数、WR
2、WK、WR1、WR3、はそれぞれr行n列、n行n列、1
行n列、1行n列、の行列やベクトルでありニューラル
ネットのバックプロパゲーションにより求めたもの、n
はウェーハをn個の等温と見做す領域に分割したときの
分割個数、で計算し、ブロック6へ行く。ブロック6に
おいては、m次元の偏差ベクトルEを Eのi番目の要素 = T゜(time2)− Yi, i=1,
…,m(ただし、Yi はi番目のセンサの計測温度値) で計算し、ブロック2へ行く。ブロック2においては、
フィードバックの比例ゲインKpと積分ゲインKiから、
フィードバックの第二の操作量Ufb*を Ufb* = Kp×E + Ki×∫E×Δt, で計算し、ブロック3へ行く。ブロック3においては、
次々とウェーハを温度制御する時の、各ウェーハ温度制
御過程の類似性の指標として、 k = time2/Δt, を計算し、ブロック4へ行く。ブロック4においては、 k、E、Ufb(Δt時刻前のフィードバック操作量)、 をセットで記憶し、ブロック5へ行く。ブロック5にお
いては、前前回の温度制御時のk+1番目の記憶データセ
ット、(k+1、E、Ufb)、前回の温度制御時のk+1番目
の記憶データセット、(k+1、E、Ufb)、および今回
の温度制御時のk番目の記憶データセット、(k、E、U
fb)のデータを用いて、第三の操作量ΔUfbを ただし、前前回、前回、今回を区別するために変数に(-
2),(-1),(0)を付けて表わしている、また、前回の記憶
データが無いときあるいは3枚目の制御時にはα=0、
それ以外の時にはα=1、であり、3枚目の制御時には
β=1、それ以外の時にはβ=0、である、で計算し、
ブロック7へ行く。ブロック7においては、フィードバ
ックの操作量Ufbを Ufb = Ufb* + ΔUfb, で計算し、ブロック8へ行く。ブロック8においては、
温度制御の操作量U*を U* = Uff + Ufb, で計算し、この値を制御指令値として出力し、ブロック
415へ行く。
【0013】上記の実施例において、(1)操作量が一
部のランプの動作能力範囲を越える時には他のランプで
補正する、(2)定常目標温度分布時にランプ群の動作
能力範囲内でウェーハへの熱入力量と熱出力量がウェー
ハ上任意の点で一致するようにランプ群の位置を決定す
る、(3)ランプ群の加熱制御とランプ群の位置制御に
より温度制御する、等を考慮することにより制御精度を
さらに向上させるとともに制御アルゴリズム設計の自動
化・高速化をさらに容易にすることがかのうである。
【0014】ニューラルネットの重みである WR2、WK、
WR1、WR3、はバックプロパゲーションにより以下で求め
るものである。つまり、各ランプのステップ熱入力の応
答データ(U,X,ΔX)、ただし、 U:r次元の制御入力ベクトル,X:n次元のウェーハ温
度分布ベクトル,ΔX:n次元のウェーハ温度分布の時
間微分ベクトル, の集合Oから、 で重みの更新を行い収束値を求めている。上記におけ
る、η1、η2、η3、η4、は学習率、Uは教師データ、W
Ki,j、WR1i、WR2i,j、WR3i、はWKのi行j列要素、WR1の
i番目要素、WR2のi行j列要素、WR3のi番目要素、E
は学習の評価関数 me2)4+旧WR3・Tout4〕,Σは(U,X,ΔX)の集合Oに
関して行うものであり、 ネットの重み WR2、WK、WR1、WR3、の学習を始める初期
値は、気相拡散装置の設計時に用いたウェーハの動的熱
モデル する。
【0015】本制御方法と従来のPID制御方法の制御
性能の比較を図6に示す。目標温度に対する追従制御の
必要な時刻tsg とteg 間における,ウェーハ上の温度偏
差の分布範囲を各々D1(従来のPID制御時)とD2
(本制御時)で表わしている。この図から、本制御方法
では従来制御時と比較して温度偏差を1/4以下にする
効果があることが分かる。
【0016】
【発明の効果】本発明は、以上説明したように構成され
ているので以下に記載されるような効果がある。フィー
ドフォワードとフィードバックの二自由度制御をしてい
るので、目標温度への高速応答性や状態に非線形に依存
する影響の補償はフィードフォワードで、安定性はフィ
ードバックで保たれるので、制御アルゴリズム設計が容
易となる。しかも、過去の制御の経験との類似度情報か
ら制御を補正するという学習制御の第三の操作量がある
ので、制御アルゴリズムの構造に依存することなく広い
範囲において自動最適化が実現できる。この自動最適化
機能があるので、制御対象に関するモデルの所要精度は
低くなり、よって、制御アルゴリズム設計の高速化が容
易となるとともに適応性が向上する。さらに、制御対象
に関するモデルがニューラルネットである場合には、バ
ックプロパゲーションによって容易に制御対象に関する
モデリングができるので、制御アルゴリズム設計の自動
化・高速化をさらに容易にし、自動最適化する効果があ
る。二重の学習機能があるので、環境の変化、制御対象
の変化、センサ・アクチュエータ特性の経時変化、にた
いし適応的に高い制御精度を保持する効果がある。ま
た、過去の制御の経験との類似度情報から第三の操作量
の算出処理において、類似度と偏差の比例フィードバッ
クの操作量のみの情報から第三の操作量を算出するの
で、過去の制御の経験からの学習により安定性と目標へ
の収束性が向上する。あるいは、繰り返し制御の場合に
は三回目の制御時にのみ過去二回の操作量と偏差の情報
から第三の操作量を算出するので、目標温度へ近付ける
ためのフィードバックの補正量を制御対象に関する数式
モデルを使うこと無く求められるとともに、補正の方向
だけでなく量も適切に求められるので、自動最適化が高
速に実現できるとともに外乱として働くことはない。こ
の自動最適化機能があるので、上記制御システムのモデ
リング精度の要求はさらに低くなり、よって、制御アル
ゴリズム設計の高速化が容易となる。
【図面の簡単な説明】
【図1】本実施例の学習制御用のブロック線図
【図2】ウェーハの目標温度
【図3】本実施例の構成図
【図4】コンピュータの処理手順のフローチャート
【図5】コンピュータの処理手順の一部の詳細フローチ
ャート
【図6】制御性能の比較図
【符号の説明】
13…(温度制御用の)操作量、14…第一の操作量、
15…フィードバック操作量、16…偏差、17……第
二の操作量、18…第三の操作量、19…ガス制御指
令。
───────────────────────────────────────────────────── フロントページの続き (58)調査した分野(Int.Cl.7,DB名) G05B 11/00 - 13/04 G06N 1/00

Claims (2)

    (57)【特許請求の範囲】
  1. 【請求項1】制御対象の状態を計測する手段、制御対象
    への入力を制御する手段とを有する制御系において、制
    御対象に関するモデルと目標状態あるいは目標状態と計
    測状態とに基づきフィードフォワードの第一の操作量を
    算出し、目標状態と計測状態との偏差よりフィードバッ
    クの第二の操作量を算出し、過去の制御の経験との類似
    度情報に基づいて、前記類似度情報が示す類似度と偏差
    の比例フィードバックの操作量から第三の操作量を算出
    し、算出された三つの操作量の和を制御対象への操作量
    として入力することを特徴とする学習制御方法。
  2. 【請求項2】 請求項1に記載の学習制御方法において、 上記制御対象に関するモデルがニューラルネットである
    ことを特徴とする学習制御方法。
JP03012093A 1993-02-19 1993-02-19 学習制御方法 Expired - Fee Related JP3243870B2 (ja)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP03012093A JP3243870B2 (ja) 1993-02-19 1993-02-19 学習制御方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP03012093A JP3243870B2 (ja) 1993-02-19 1993-02-19 学習制御方法

Publications (2)

Publication Number Publication Date
JPH06242801A JPH06242801A (ja) 1994-09-02
JP3243870B2 true JP3243870B2 (ja) 2002-01-07

Family

ID=12294925

Family Applications (1)

Application Number Title Priority Date Filing Date
JP03012093A Expired - Fee Related JP3243870B2 (ja) 1993-02-19 1993-02-19 学習制御方法

Country Status (1)

Country Link
JP (1) JP3243870B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113849011B (zh) * 2021-09-03 2022-08-05 北京三快在线科技有限公司 一种温度控制方法、装置、存储介质及电子设备

Also Published As

Publication number Publication date
JPH06242801A (ja) 1994-09-02

Similar Documents

Publication Publication Date Title
EP0788626B1 (en) A variable horizon predictor for controlling dead time dominant processes, multivariable interactive processes, and processes with time variant dynamics
US5847952A (en) Nonlinear-approximator-based automatic tuner
CN104776446A (zh) 一种锅炉燃烧优化控制方法
Malhotra et al. Boiler flow control using PID and fuzzy logic controller
JP3437807B2 (ja) 制御演算装置及び制御演算方法
Tang et al. Optimal sliding mode control for nonlinear systems with time-delay
JP3798239B2 (ja) 多変数モデル予測制御装置、方法、及びその記憶媒体
Jiang et al. H∞-based minimal energy adaptive control with preset convergence rate
Issa et al. PID controller tuning parameters using meta-heuristics algorithms: comparative analysis
CN115933369A (zh) 一种基于优化pid算法的蒸发镀膜设备衬底温度控制方法
JP3243870B2 (ja) 学習制御方法
Nguyen et al. On-policy and off-policy Q-learning strategies for spacecraft systems: An approach for time-varying discrete-time without controllability assumption of augmented system
JPH07210208A (ja) 火力プラント制御におけるオートチューニング方法及びそれを利用した火力プラント制御装置
Orman Design of a memristor-based 2-DOF PI controller and testing of its temperature profile tracking in a heat flow system
CN113534661B (zh) 基于卡尔曼滤波和非最小状态空间的电阻炉温度控制方法
JP2923000B2 (ja) サーボ制御装置
JPH05143108A (ja) プロセスの適応制御方法
JP3040901B2 (ja) ニューラルネットワークによる制御方法および内蔵制御装置
JPH1063307A (ja) 火力プラント主制御系におけるフィードフォワード制御装置
Vijayalakshmi Design of superheated steam temperature control using fuzzy logic controller
Said et al. ARX Modeling and FPID with model reference controller design of a hot air blower system
Dong et al. Nearly optimal fault-tolerant constrained tracking for multi-axis servo system via practical terminal sliding mode and adaptive dynamic programming
JP3115964B2 (ja) 焼却炉制御方法
JPH0527806A (ja) ニユーラル・ネツトを用いたフイードフオワード制御器
JPH11506553A (ja) ダイナミックプロセスのモデル化装置

Legal Events

Date Code Title Description
LAPS Cancellation because of no payment of annual fees