JP7724656B2 - 制御装置、リソグラフィー装置および物品製造方法 - Google Patents

制御装置、リソグラフィー装置および物品製造方法

Info

Publication number
JP7724656B2
JP7724656B2 JP2021126047A JP2021126047A JP7724656B2 JP 7724656 B2 JP7724656 B2 JP 7724656B2 JP 2021126047 A JP2021126047 A JP 2021126047A JP 2021126047 A JP2021126047 A JP 2021126047A JP 7724656 B2 JP7724656 B2 JP 7724656B2
Authority
JP
Japan
Prior art keywords
control device
manipulated variable
control
probability distribution
substrate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021126047A
Other languages
English (en)
Other versions
JP2023020593A (ja
Inventor
直樹 清原
直樹 北
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to JP2021126047A priority Critical patent/JP7724656B2/ja
Priority to KR1020220087915A priority patent/KR20230019022A/ko
Priority to US17/872,178 priority patent/US20230034598A1/en
Priority to CN202210902358.8A priority patent/CN115685692A/zh
Publication of JP2023020593A publication Critical patent/JP2023020593A/ja
Application granted granted Critical
Publication of JP7724656B2 publication Critical patent/JP7724656B2/ja
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G05CONTROLLING; REGULATING
    • G05BCONTROL OR REGULATING SYSTEMS IN GENERAL; FUNCTIONAL ELEMENTS OF SUCH SYSTEMS; MONITORING OR TESTING ARRANGEMENTS FOR SUCH SYSTEMS OR ELEMENTS
    • G05B13/00Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion
    • G05B13/02Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric
    • G05B13/0265Adaptive control systems, i.e. systems automatically adjusting themselves to have a performance which is optimum according to some preassigned criterion electric the criterion being a learning criterion
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F7/00Photomechanical, e.g. photolithographic, production of textured or patterned surfaces, e.g. printing surfaces; Materials therefor, e.g. comprising photoresists; Apparatus specially adapted therefor
    • G03F7/70Microphotolithographic exposure; Apparatus therefor
    • G03F7/70691Handling of masks or workpieces
    • G03F7/70716Stages
    • GPHYSICS
    • G03PHOTOGRAPHY; CINEMATOGRAPHY; ANALOGOUS TECHNIQUES USING WAVES OTHER THAN OPTICAL WAVES; ELECTROGRAPHY; HOLOGRAPHY
    • G03FPHOTOMECHANICAL PRODUCTION OF TEXTURED OR PATTERNED SURFACES, e.g. FOR PRINTING, FOR PROCESSING OF SEMICONDUCTOR DEVICES; MATERIALS THEREFOR; ORIGINALS THEREFOR; APPARATUS SPECIALLY ADAPTED THEREFOR
    • G03F7/00Photomechanical, e.g. photolithographic, production of textured or patterned surfaces, e.g. printing surfaces; Materials therefor, e.g. comprising photoresists; Apparatus specially adapted therefor
    • G03F7/70Microphotolithographic exposure; Apparatus therefor
    • G03F7/70691Handling of masks or workpieces
    • G03F7/70733Handling masks and workpieces, e.g. exchange of workpiece or mask, transport of workpiece or mask
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/092Reinforcement learning
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Software Systems (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Data Mining & Analysis (AREA)
  • General Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Molecular Biology (AREA)
  • General Health & Medical Sciences (AREA)
  • Biophysics (AREA)
  • Biomedical Technology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Mathematical Analysis (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Medical Informatics (AREA)
  • Automation & Control Theory (AREA)
  • Exposure And Positioning Against Photoresist Photosensitive Materials (AREA)
  • Feedback Control In General (AREA)

Description

本発明は、制御装置、リソグラフィー装置および物品製造方法に関する。
強化学習によって総報酬を最大化する方策を学習する際、行動空間として、連続空間および離散空間のいずれかが、アルゴリズムの制約および環境の性質に応じて選択されうる。離散的な行動空間が選択される場合、探索時の行動戦略としてはε貪欲法(非特許文献1、特許文献1)・ソフトマックス法(非特許文献1)などを用いるのが一般的であり、また、運用時の行動戦略としては貪欲法を用いるのが一般的である。
特開2020-98538号公報
Sutton, R.S., Barto, A.G.: "Reinforcement Learning: An Introduction." MIT Press, Cambridge, MA (1998)
操作量を決定するための確率分布を出力する制御器の性能は、乱数に従ったサンプリングにより操作量を決定する方法によって学習を行うことで向上されうる。しかし、実運用時においても学習時と同様に乱数を用いたサンプリングにより制御量を決定すると、確率的挙動が品質保証に対して好ましくない影響を与えうるので、一般的には確率値が最大になる操作量を選択し続ける。一方、最大の確率を持つ操作量を選択し続けた場合、乱数を用いたサンプリングによって操作量を決定する場合よりも制御性能が悪化する場合がある。
本発明は、運用時の制御性能が学習時の制御性能から低下することを抑えるために有利な技術を提供することを目的とする。
本発明の第1側面は、制御対象を制御する制御装置に係り、前記制御装置は、制御指令と前記制御対象の状態を示す状態情報との差分に基づいて確率分布を生成する生成器と、前記生成器が生成した前記確率分布に基づいて操作量を決定する決定器と、を備え、前記決定器は前記確率分布の期待値に応じて前記操作量を決定する。
本発明の第2側面は、制御対象を制御する制御装置に係り、前記制御装置は、制御指令と、前記制御対象の状態を示す状態情報とに基づいて確率分布を生成する生成器と、前記生成器が生成した前記確率分布に基づいて操作量を決定する決定器と、を備え、 前記決定器は前記確率分布の期待値に応じて前記操作量を決定する。
本発明によれば、運用時の制御性能が学習時の制御性能から低下することを抑えるために有利な技術が提供される。
一実施形態のシステムの構成を例示する図。 図1に示されたシステムをステージ制御装置に適用した場合における制御対象の構成例を示す図。 図2に示されたステージ制御装置をより具体化した構成例を示す図。 強化学習によるニューラルネットワークのパラメータ値の決定方法を例示する図。 ニューラルネットワークの構成例を示す図。 ニューラルネットワーク補償器の動作を例示する図。 確率分布(確率質量関数)を例示する図。 逆関数法を用いたサンプリングの方法を例示する図。 ステージの応答を例示する図。 ニューラルネットワークの他の構成例を示す図。 ステージ制御装置の他の具体化を示す図。 リソグラフィー装置の一例としての露光装置の構成例を示す図。 図12に例示された露光装置の動作例を示す図。
以下、添付図面を参照して実施形態を詳しく説明する。なお、以下の実施形態は特許請求の範囲に係る発明を限定するものではない。実施形態には複数の特徴が記載されているが、これらの複数の特徴の全てが発明に必須のものとは限らず、また、複数の特徴は任意に組み合わせられてもよい。さらに、添付図面においては、同一若しくは同様の構成に同一の参照番号を付し、重複した説明は省略する。
図1には、一実施形態のシステムの構成が例示されている。このシステムは、制御対象1と、制御対象1を制御する制御サーバー2と、制御対象1から制御サーバー2を介して制御結果を取得して学習を行う学習サーバー3とを備えうる。学習サーバー3は、制御サーバー2を介して、制御対象1の内部に構成されるニューラルネットワークに対してニューラルネットワークのパラメータ情報を送信しうる。その後、制御サーバー2は、制御対象1に対して制御指令を送り、制御対象1から制御結果を取得しうる。制御サーバー2が制御対象1から取得した制御結果は、制御サーバー2から学習サーバー3に送信されうる。学習サーバー3は、制御結果に応じて、ニューラルネットワークのパラメータ値の良否を示す報酬を計算し、報酬に基づいてニューラルネットワークのパラメータ値を更新しうる。
ニューラルネットワークのパラメータ値の更新に関わる演算コストが高いため、制御サーバー2と学習サーバー3とを独立した構成とすることが有利である。制御サーバー2と学習サーバー3とを独立させた構成では、複数の制御対象がある場合に、演算コストが高い学習サーバー3を複数用意して、演算コストが低い制御サーバー2を1つとするといった運用が可能になる。
図2には、図1に示されたシステムをステージ制御装置に適用した場合における制御対象1の構成例が示されている。制御対象1は、ステージ5、センサ6、制御基板7、および、ドライバ8を含みうる。制御基板7は、ドライバ8に対して所定の時間間隔で電流指令を供給するように構成されうる。ドライバ8は、電流ドライバおよびアクチュエータを含み、電流ドライバは、電流指令に応じた電流をアクチュエータに供給し、アクチュエータは、ステージ5を駆動しうる。ステージ5の動作は、センサ6によって観測(検出)され、観察結果は制御基板7に供給されうる。
図3は、図2に示されたステージ制御装置をより具体化した構成例が示されている。制御基板(制御部)7は、例えば、減算器76と、補償器71と、ニューラルネットワーク補償器72と、加算器75とを含みうる。制御基板7は、制御サーバー2から供給される操作指令と、センサ6から供給されるステージ5の位置情報と、制御サーバー2から供給されるフェーズ情報とを受信しうる。ステージ5の位置情報は、ステージ5の状態を示す状態情報の一例である。減算器76は、制御サーバー2から供給される操作指令とセンサ5から供給される位置情報との差分、つまり偏差を計算し、その偏差を補償器71およびニューラルネットワーク補償器72に供給しうる。補償器71は、減算器76から供給される偏差に基づいて第1操作量を生成し、その第1操作量を加算器75に供給する。
ニューラルネットワーク補償器72は、減算器76から供給される差分に基づいて第2操作量を生成し、その第2操作量を加算器75に供給する。ニューラルネットワーク補償器72は、ニューラルネットワーク73と、第2操作量を決定する操作量決定器74(決定器)とを含みうる。ニューラルネットワーク73は、減算器76から供給される偏差に基づいて、第2操作量を決定するための確率分布出力しうる。ニューラルネットワーク73は、減算器76から供給される偏差に基づいて、第2操作量を決定するための確率分布を規定する関数を出力する構成要素として理解されてもよい。ニューラルネットワーク73は、第2操作量を決定するための確率分布を生成する確率分布生成器(生成器)として理解されてもよい。
操作量決定器74は、ニューラルネットワーク73から供給される確率分布あるいはそれを規定する関数と、制御サーバー2から供給されるフェーズ情報とに基づいて第2操作量を決定する。フェーズ情報がとりうる値は、ニューラルネットワークのパラメータ値を学習している学習フェーズであることを示す値と、学習が完了したニューラルネットワークのパラメータを用いて制御を行っている運用フェーズであることを示す値とを含みうる。操作量決定器74による操作量の決定方法については後述する。補償器71、ニューラルネットワーク補償器72は、それぞれ第1補償器、第2補償器として理解されてもよい。
加算器75は、補償器71から供給される第1操作量とニューラルネットワーク補償器72から供給される第2操作量とを加算することによって操作量(合成操作量)を生成し、その操作量を電流指令としてドライバ8に供給する。ドライバ8は、前述のように、電流ドライバおよびアクチュエータを含み、電流ドライバは、電流指令に応じた電流をアクチュエータに供給し、アクチュエータは、ステージ5を駆動しうる。なお、ニューラルネットワーク補償器72に対して供給される偏差は、必ずしも位置情報の偏差である必要はなく、例えば、速度、加速度またはジャークの偏差でもよい。
ニューラルネットワーク73のニューラルネットワークパラメータ値(以下、単にパラメータ値)は、事前に何らかの学習手法により決定される必要がある。学習手法としては、例えば、強化学習を挙げることができる。図4には、強化学習によるニューラルネットワーク73のパラメータ値の決定方法(学習シーケンス)が例示的に示されている。まず、ステップS400では、学習サーバー3は、ニューラルネットワーク73のパラメータ値を初期化する。次いで、ステップS401では、学習サーバー3は、ニューラルネットワーク73のパラメータ値を変更する。次いで、ステップS402では、制御基板7は、所定の操作指令データ(例えば、操作指令の時系列データ)に従って制御対象であるステージ5を操作する。
次いで、ステップS403では、学習サーバー3は、制御対象であるステージ5の制御結果、例えば、偏差データ(例えば、偏差の時系列データ)を取得する。ここで、制御基板7は、制御サーバー2を介して制御結果を学習サーバー3に提供しうる。次いで、学習サーバー3は、制御対象の偏差データに基づいて報酬を計算する。一例において、偏差が小さいほど、高い報酬が得られる。次いで、学習サーバー3は、学習が終了したかどうかを判断し、学習が終了してないと判断した場合にはステップS401に処理を進め、学習が終了したと判断した場合にはステップS406に処理を進める。一例において、学習サーバー3は、学習回数が規定回数以下であれば、学習が終了していないと判断し、学習回数が規定回数を超えたら、学習が終了したと判断しうる。ステップ401では、学習サーバー3は、報酬が高くなるようにニューラルネットワーク73のパラメータ値を変更しうる。ステップS406では、学習サーバー3は、最大報酬が得られた時のパラメータ値を学習結果として保存する。学習サーバー3は、学習フェーズにおいて、操作量決定器74が決定する第2操作量に従って制御される制御対象の制御結果に基づいて、ニューラルネットワーク73(確率分布生成器)の動作を定義するパラメータ値を設定する設定部として機能する。
図5には、ニューラルネットワーク73の構成例が示されている。ニューラルネットワーク73は、入力層731と、1又は複数の中間層732と、出力層733と、関数734と、出力層735とを含みうる。入力層731は、入力データ736として、現在を含む過去N制御周期分の偏差を入力しうる。この入力に応答して、1又は複数の中間層732を介して、出力層733の出力データ738が決定されうる。出力層738は、N個の数値(確率)を有しうる。関数734は、例えばソフトマックス関数であり、出力層738のN個の数値をそれぞれ正規化された確率に変換して得られる確率質量関数を出力層735の出力データ739として生成しうる。関数734は、ニューラルネットワーク73の出力を確率質量関数に変換する変換器として機能する。
学習フェーズでは、方策ネットワークを持つProximal Policy Optimization(以下、PPO)などの強化学習手法を用いて学習を行い、操作量は出力データ739の確率質量関数に従うサンプルを生成することで決定しうる。確率質量関数で表される確率分布からのサンプリングには、例えば、逆関数法、MCMC法などの疑似乱数生成アルゴリズムを用いることができる。これにより、探索行動を行いながら学習をすることができる。
学習フェーズが終了したのち、学習フェーズが終了した状態でのパラメータ値、又は最大報酬が得られたパラメータ値などを用いる運用フェーズでは、変換後の出力データ739の確率が最も高い操作量を選択するのが一般的である。しかし、ステージ制御などのローパスフィルターのような過渡応答を示す系では、操作量の累積値がステージ応答に影響を及ぼしうる。そのため、学習フェーズ時に確率質量関数からサンプリングした場合に比べて、最大確率をもつ操作量を選択し続ける場合の報酬が減少してしまうことがある。
そこで、本実施形態では、運用フェーズにおいて各操作量候補とその確率の積の和である期待値をニューラルネットワーク補償器72の出力(即ち、第2操作量)とすることで、学習フェーズと同様の効果を得ることを可能にする。
図6には、ニューラルネットワーク補償器72の動作が例示されている。まず、ステップ601では、ニューラルネットワーク73は、操作量候補を確率変数とする確率分布、換言すると、第2操作量を決定するための確率分布を出力層735に出力する。確率分布は、例えば、確率質量関数でありうるが、後に説明するように、確率密度関数であってもよい。ステップS602では、操作量決定器74は、制御サーバー2から供給される制御指令に含まれるフェーズ情報を受け取って現在のフェーズを確認する。そして、操作量決定器74は、受け取ったフェーズ情報が学習フェーズであることを示している場合にはステップS603に処理を進め、運用フェーズであることをしている場合にはステップS605に処理を進める。
ステップS603では、即ち、学習フェーズでは、操作量決定器74は、ニューラルネットワーク73の出力層735に出力された確率分布(暫定的に設定されている確率分布)に基づいて、第2操作量として、確率変数の値をランダムに決定する。ステップS605では、即ち、運用フェーズでは、操作量決定器74は、ニューラルネットワーク73の出力層735に出力された確率分布の期待値に応じて第2操作量を決定する。ステップS604では、操作量決定器74は、学習フェーズにおいてはステップS603で決定された第2操作量を出力し、運用フェーズにおいてはステップS605で決定された第2操作量を出力する。
ここで、図4に示される処理、即ち、ニューラルネットワーク73のパラメータ値の決定方法(学習シーケンス)の実行時は、ステップS402において、図6に示される処理におけるステップS601、(S602)、S603、S604が実行されることになる。
以下、運用フェーズにおける操作量の決定方法(S605)を例示的に説明する。ここで、N個の操作量候補a(i=0~N)を定義する。各操作量候補aiに割り当てられる確率pが出力層735に出力データ739として現れる。図7には、操作量候補aと確率pとの関係、即ち確率分布(確率質量関数)が例示されている。ステップS605で決定される期待値Eは、ニューラルネットワーク73の出力層735に出力された確率分布の期待値である。期待値Eは、aとpとの積の和であり、(1)式で表現される。
・・・(1)
以下、学習フェーズおける操作量の決定方法(S603)を例示的に説明する。ここでは、一例として、図8を参照しながら逆関数法を説明する。i番目の操作量候補を選択する確率がa[i]である確率質量関数を考える。また、累積分布関数b[i]を(2)式のように定義する。
・・・(2)
区間[0,1]の連続一様乱数rを用いて、r ≦ b[i]となる最小のiを選択することで、確率質量関数で表される確率分布からのサンプルが得られる。つまり、確率分布に基づいて、第2操作量として、確率変数の値をランダムに決定することができる。
学習フェーズで用いる学習方法としては、方策ネットワークを持つPPOなどの強化学習手法以外にも、方策ネットワークを持たないDeep Q Network(DQN)等の強化学習手法が用いられてもよい。その場合、入力層731の入力データ736として、現在を含む過去N制御周期分の操作指令の偏差を入力し、1又は複数の中間層732を介して出力層733の出力データ738としてN個の操作量候補のスコアを得ることができる。操作量候補のスコアに対してソフトマックス関数などの特定関数734を用いて、各操作量候補の確率に変換して出力層735の出力データ739を生成することができる。
図9には、ステージ9の応答が例示されている。実線は、学習フェーズにおけるステージ9の偏差を示している。点線は、運用フェーズにおいて、最も確率が高い操作量候補を第2操作量として出力した場合のステージ9の偏差を示している。破線は、本実施形態に従って、ニューラルネットワーク73の出力層735に出力された確率分布の期待値を第2操作量として出力した場合のステージ9の偏差を示している。図9から分かるように、運用フェーズにおいて最も確率が高い操作量候補を第2操作量として出力すると学習フェーズにおける波形より悪化してしまう。一方、図9から分かるように、運用フェーズにおいて期待値を第2操作量として出力することで、学習フェーズにおける波形と同等の波形を得ることができる。
このように、ステージ制御などのローパスフィルターのような過渡応答を示す系において、離散出力を行うニューラルネットワークの運用フェーズ時の出力を期待値とすることで、学習フェーズ時と同等の偏差抑制効果を得ることができる。
上記のニューラルネットワーク73は一例に過ぎず、例えば、図10に例示されるようなニューラルネットワーク73で置き換えられてもよい。ニューラルネットワーク73は、入力層761と、1又は複数の中間層762と、出力層763と、関数764と、出力層765とを含みうる。入力層761は、入力データ766として、現在を含む過去N制御周期分の操作指令の偏差を入力しうる。1又は複数の中間層762、出力層763、活性化関数764を介して出力層765の出力データ769として、確率密度関数の一種であるベータ分布の係数αとβが決定されうる。第2操作量を決定する際は、係数α,βで表されるベータ分布を、第2操作量の範囲[Fmin, Fmax]になるようスケーリングする。
学習フェーズでは、方策ネットワークを持つPPOなどの強化学習手法を用いて学習を行い、確率密度関数に従うサンプルを生成することで第2操作量は決定しうる。確率密度関数で表される確率分布からのサンプリングには逆関数法や棄却採択法など確率密度関数の種類に応じて適切な疑似乱数生成アルゴリズムを用いることができる。これにより、探索行動を行いながら学習をすることができる。一方、学習フェーズが終了した状態でのパラメータ値、又は最大報酬が得られたパラメータ値などを用いる運用フェーズでは、出力データ769である係数α,βで表されるβ分布の中で最も高い確率となる操作量候補に上記スケーリングを行い出力とするができる。しかし、既に述べたように、ステージ制御などのローパスフィルターのような過渡応答を示す系では、操作量の累積値がステージ応答に影響を及ぼす。そのため、学習フェーズにおける確率密度関数からサンプリングした場合に比べて、最大確率をもつ操作量を選択し続ける場合の報酬が減少してしまうことがある。そこで、(3)式で表されるβ分布の期待値Eに応じて第2操作量を決定するとよい。
・・・(3)
例えば、上記の期待値Eに対して上記スケーリングを行うことによって第2操作量を決定することができ、これにより、学習フェーズと同様の効果を得ることができる。操作量決定器74の動作は、上述のとおりである。また、学習フェーズで用いる学習方法として方策ネットワークを持たない強化学習手法を用いてもよい。
このように、ステージ制御などのローパスフィルターのような過渡応答を示す系において、連続値の出力を行うニューラルネットワークを用いる場合でも、運用フェーズ時に期待値を出力とすることで、学習フェーズ時と同等の偏差抑制効果を得ることができる。
図11には、ステージ制御装置の他の具体化例が示されている。上述の例では、操作指令と位置情報の差分(偏差)がニューラルネットワーク補償器72あるいはニューラルネットワーク73に供給される。しかし、ニューラルネットワークのパラメータ値の良否は、制御対象の偏差データに基づいて計算される報酬によって判断されうる。そのため、必ずしも操作指令と位置情報との差分(偏差)をニューラルネットワーク補償器72の入力とする必要はなく、操作指令およびセンサ6の出力から得られた位置情報のいずれかもしくは両方を入力としてもよい。なお、この場合でもニューラルネットワーク補償器72への入力は必ずしも位置情報である必要はなく、例えば速度、加速度、ジャークでもよい。このような構成においても、運用フェーズにおいて、ニューラルネットワーク73から出力される確率分布の期待値に応じて第2操作量を決定することができる。このように、ニューラルネットワーク補償器72の入力を操作指令と位置情報の差分(偏差)としない場合でも、運用フェーズにおいて確率分布の期待値を第2操作量とすることで、学習フェーズ時と同等の偏差抑制効果を得ることができる。
以上の説明では、補償器71から出力される第1操作量とニューラルネットワーク補償器72から出力される第2操作量とを加算することによってドライバ8に供給する操作量が生成されるが、補償器71は必ずしも必要ではない。例えば、ニューラルネットワーク補償器72から出力される第2操作量がそのままドライバ8に供給されてもよい。
図12には、上記のシステムをリソグラフィー装置の一例としての走査露光装置800に適用した例が示されている。走査露光装置800は、スリットによって整形されたスリット光により基板14を走査露光するステップ・アンド・スキャン方式の露光装置である。走査露光装置800は、照明光学系23、原版ステージ12、投影光学系13、基板ステージ15、原版ステージ位置計測部17、基板ステージ位置計測部18、基板マーク計測部21、基板搬送部22、制御部24、および、温度制御器25を含みうる。
制御部24は、照明光学系23、原版ステージ12、投影光学系13、基板ステージ15、原版ステージ位置計測部17、基板ステージ位置計測部18、基板マーク計測部21、基板搬送部22を制御しうる。制御部24は、原版11に形成されたパターンを基板14に転写する処理(基板14を走査露光する処理)を制御しうる。制御部24は、例えば、FPGA(Field Programmable Gate Arrayの略。)などのPLD(Programmable Logic Deviceの略。)、又は、ASIC(Application Specific Integrated Circuitの略。)、又は、プログラムが組み込まれた汎用コンピュータ、又は、これらの全部または一部の組み合わせによって構成される。また、制御部24はアクチュエータを制御するドライバも含む。
照明光学系23は、原版11を照明する。照明光学系23は、マスクキングブレードなどの遮光部材により、光源(不図示)から射出された光を、例えばX方向に長い帯状または円弧状の形状を有するスリット光に整形し、そのスリット光で原版11の一部を照明しうる。原版11および基板14は、原版ステージ12および基板ステージ15によってそれぞれ保持されており、投影光学系13を介して光学的にほぼ共役な位置(投影光学系13の物体面および像面)にそれぞれ配置される。
投影光学系13は、所定の投影倍率(例えば1/2倍や1/4倍)を有し、原版11のパターンをスリット光により基板14上に投影する。原版11のパターンが投影された基板14上の領域(スリット光が照射される領域)は、照射領域と呼ばれる。原版ステージ装置12および基板ステージ15は、投影光学系13の光軸方向(Z方向)に直交する方向(Y方向)に移動可能に構成されている。原版ステージ12および基板ステージ15は、それぞれ不図示のドライバによって、互いに同期しながら、投影光学系13の投影倍率に応じた速度比で相対的に走査駆動される。これにより、照射領域に対して基板14がY方向に走査され、原版11に形成されたパターンが基板14上のショット領域に転写される。そして、このような走査露光を、基板ステージ15を移動させながら、基板14の複数のショット領域の各々について順次に行うことにより、1枚の基板14における露光処理が完了する。
原版ステージ位置計測部17は、例えばレーザ干渉計を含み、原版ステージ12の位置を計測する。レーザ干渉計は、例えば、レーザ光を原版ステージ12に設けられた反射板(不図示)に向けて照射し、反射板で反射されたレーザ光と基準面で反射されたレーザ光との干渉によって原版ステージ12の変位(基準位置からの変位)を検出する。原版ステージ位置計測部17は、当該変位に基づいて原版ステージ12の現在位置を取得することができる。ここで、原版ステージ位置計測部17は、レーザ光を用いたレーザ干渉計によって原版ステージ12の位置を計測しているが、それに限られるものではなく、例えば、エンコーダによって原版ステージ12の位置を計測してもよい。
基板ステージ位置計測部18は、例えばレーザ干渉計を含み、基板ステージ15の位置を計測する。レーザ干渉計は、例えば、レーザ光を基板ステージ15に設けられた反射板(不図示)に向けて照射し、反射板で反射されたレーザ光と基準面で反射されたレーザ光との干渉によって基板ステージ15の変位(基準位置からの変位)を検出する。基板ステージ位置計測部18は、当該変位に基づいて基板ステージ15の現在位置を取得することができる。ここで、原版ステージ位置計測部17は、レーザ光を用いたレーザ干渉計によって基板ステージ15の位置を計測しているが、それに限られるものではなく、例えば、エンコーダによって基板ステージ15の位置を計測してもよい。
基板マーク計測部21は、例えば撮像素子を含み、基板上に設けられたマークの位置を検出することができる。ここで、本実施形態の基板マーク計測部21は、撮像素子によってマークが検出されるが、それに限られるものではなく、例えば透過型センサによってマークが検出されてもよい。基板搬送部22は、基板を基板ステージ15に供給および回収する。温度制御機25は露光装置内の温度や湿度を一定に保つ。
図13には、図12に例示された露光装置の動作例が示されている。ステップS901では、基板搬送部22によって基板14が基板ステージ15の上に供給される。ステップS902では、露光レシピにおいて指定された基板14上のマークが基板マーク検出部21の計測視野内に入るように基板ステージ15が駆動され、基板14のアライメントが実施される。ステップS903では、基板14の各ショット領域について、基板14が走査露光される。露光順序および露光画角は、露光レシピによる指定に従う。ステップS904では、基板搬送部22によって基板14が基板ステージから回収される。
以下、上記のシステムを基板ステージ(可動部)15の制御に適用した例を説明する。図2におけるセンサ6は基板ステージ位置計測部18に相当し、制御基板7は制御部24に相当し、ドライバ8は不図示の基板ステージドライバに相当し、ステージ5は基板ステージ15に相当する。上記のシステムを基板ステージ15の制御に適用することで、基板ステージ15を駆動した後の偏差が収束するまでの時間である整定時間を短縮できるので、露光装置の精度向上およびスループットを向上させることができる。基板ステージ15を制御する系においても、運用フェーズにおいて、操作量を決定するための確率分布の期待値に応じて操作量を決定することで、学習フェーズ時と同等の偏差抑制効果を得ることができる。
以下、上記のシステムを原版ステージ(可動部)12の制御に適用した例を説明する。図2における制御基板7は制御部24に相当し、ドライバ8は不図示の原版ステージドライバに相当し、センサ6は原版ステージ位置計測部17に相当し、ステージ5は原版ステージ12に相当する。原版ステージ12を制御する系においても、運用フェーズにおいて、操作量を決定するための確率分布の期待値に応じて操作量を決定することで、学習フェーズ時と同等の偏差抑制効果を得ることができる。
以下、上記のシステムを基板搬送部(可動部)22の制御に適用した例を説明する。図2における制御基板7は制御部24に相当し、ドライバ8は不図示の基板搬送部ドライバ(例えば、ACサーボモータ)に相当し、センサ6は不図示のロータリーエンコーダに相当し、ステージ5は基板搬送部22に相当する。上記のシステムを基板搬送部22の制御に適用することで、基板搬送部22の駆動中の偏差を抑制することができ、基板14を基板ステージ15に供給する際の供給位置の再現性を向上することができる。また、加速度、速度を上げつつ、偏差を抑制することで、スループットを向上することもできる。基板搬送部22を制御する系においても、運用フェーズにおいて、操作量を決定するための確率分布の期待値に応じて操作量を決定することで、学習フェーズ時と同等の偏差抑制効果を得ることができる。
ここまで、走査露光装置における基板ステージ、原版ステージ、基板搬送部の駆動装置への適用について述べたが、本発明は、走査露光装置における他の駆動装置に適用してもよい。また、本発明は、原版および基板を静止させて露光する露光装置に適用してもよいし、他のリソグラフィー装置、例えば、インプリント装置に適用してもよい。更に本発明は、制御対象を制御する他の制御装置に適用してもよい。
次に、前述のリソグラフィー装置を利用して物品(半導体IC素子、液晶表示素子、MEMS等)を製造する物品製造方法を説明する。物品は、リソグラフィー装置を用いて、基板に原版のパターンを転写する転写工程と、該パターンが転写された該基板を処理して物品を得る処理工程とを含みうる。リソグラフィー装置が露光装置である場合、物品製造方法は、感光剤が塗布された基板(ウェハ、ガラス基板等)を露光することによって基板に原版のパターンを転写する転写工程と、該パターンが転写された該基板を処理して物品を得る処理工程とを含みうる。該処理工程は、その基板(感光剤)を現像する工程を含みうる。該処理工程は、更に他の周知の工程、例えば、エッチング、レジスト剥離、ダイシング、ボンディング、パッケージングのための工程を含みうる。本物品製造方法によれば、従来よりも高品位の物品を製造することができる。
以上、本発明の好ましい実施形態について説明したが、本発明は、これらの実施形態に限定されず、その要旨の範囲内で種々の変形及び変更が可能である。
なお、今回の一連の実施形態は、ステージ制御装置および露光装置を用いて説明したが、他の構成の制御装置でも構わない。
発明は上記実施形態に制限されるものではなく、発明の精神及び範囲から離脱することなく、様々な変更及び変形が可能である。従って、発明の範囲を公にするために請求項を添付する。

Claims (15)

  1. 制御対象を制御する制御装置であって、
    制御指令と前記制御対象の状態を示す状態情報との差分に基づいて確率分布を生成する生成器と、
    前記生成器が生成した前記確率分布に基づいて操作量を決定する決定器と、を備え、
    前記決定器は前記確率分布の期待値に応じて前記操作量を決定する、
    ことを特徴とする制御装置。
  2. 前記決定器は、
    学習フェーズにおいて、暫定的に設定されている確率分布に従ってランダムに決定される確率変数の値を前記操作量として決定
    運用フェーズにおいて、前記確率分布の期待値に応じて前記操作量を決定する、
    ことを特徴とする請求項1に記載の制御装置。
  3. 前記学習フェーズにおいて、前記決定器が決定する前記操作量に従って制御される前記制御対象の制御結果に基づいて、前記生成器の動作を定義するパラメータ値を設定する設定部を更に備える、
    ことを特徴とする請求項2に記載の制御装置。
  4. 前記確率分布は、確率質量関数である、
    ことを特徴とする請求項1乃至3のいずれか1項に記載の制御装置。
  5. 前記生成器は、複数の操作量候補のスコアを生成するニューラルネットワークを含む、
    ことを特徴とする請求項4に記載の制御装置。
  6. 前記生成器は、前記ニューラルネットワークの出力を確率質量関数に変換する変換器を更に含む、
    ことを特徴とする請求項5に記載の制御装置。
  7. 前記変換器は、前記ニューラルネットワークの出力に対してソフトマックス関数に従う変換を施す、
    ことを特徴とする請求項6に記載の制御装置。
  8. 前記確率分布は、確率密度関数である、
    ことを特徴とする請求項1乃至3のいずれか1項に記載の制御装置。
  9. 前記状態情報は、前記制御対象の位置である、
    ことを特徴とする請求項に記載の制御装置。
  10. 前記状態情報は、前記制御対象の速度、加速度およびジャークのうちの1つである、
    ことを特徴とする請求項に記載の制御装置。
  11. 前記制御指令と前記状態情報との差分に基づいて第1操作量を生成する第1補償器と、
    前記第1操作量と前記決定器が決定する前記操作量とを加算した合成操作量を生成する加算器と、備え
    前記合成操作量が前記制御対象を駆動するドライバに供給される、
    ことを特徴とする請求項に記載の制御装置。
  12. 制御対象を制御する制御装置であって、
    制御指令と前記制御対象の状態を示す状態情報とに基づいて確率分布を生成する生成器と、
    前記生成器が生成した前記確率分布に基づいて操作量を決定する決定器と、を備え、
    前記決定器は前記確率分布の期待値に応じて前記操作量を決定する、
    ことを特徴とする制御装置。
  13. 基板に原版のパターンを転写するリソグラフィー装置であって、
    可動部と、
    前記可動部を制御するように構成された請求項1乃至12のいずれか1項に記載の制御装置と、
    を備えることを特徴とするリソグラフィー装置。
  14. 前記可動部は、基板ステージ、原版ステージ、または、基板搬送部のいずれかである、
    ことを特徴とする請求項13に記載のリソグラフィー装置。
  15. 請求項14に記載のリソグラフィー装置を用いて、基板に原版のパターンを転写する工程と、
    前記パターンが転写された前記基板を処理して物品を得る工程と、
    を含むことを特徴とする物品製造方法。
JP2021126047A 2021-07-30 2021-07-30 制御装置、リソグラフィー装置および物品製造方法 Active JP7724656B2 (ja)

Priority Applications (4)

Application Number Priority Date Filing Date Title
JP2021126047A JP7724656B2 (ja) 2021-07-30 2021-07-30 制御装置、リソグラフィー装置および物品製造方法
KR1020220087915A KR20230019022A (ko) 2021-07-30 2022-07-18 제어장치, 리소그래피 장치 및 물품제조 방법
US17/872,178 US20230034598A1 (en) 2021-07-30 2022-07-25 Control device, lithography apparatus, and article manufacturing method
CN202210902358.8A CN115685692A (zh) 2021-07-30 2022-07-29 控制设备、光刻装置和物品制造方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2021126047A JP7724656B2 (ja) 2021-07-30 2021-07-30 制御装置、リソグラフィー装置および物品製造方法

Publications (2)

Publication Number Publication Date
JP2023020593A JP2023020593A (ja) 2023-02-09
JP7724656B2 true JP7724656B2 (ja) 2025-08-18

Family

ID=85038585

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2021126047A Active JP7724656B2 (ja) 2021-07-30 2021-07-30 制御装置、リソグラフィー装置および物品製造方法

Country Status (4)

Country Link
US (1) US20230034598A1 (ja)
JP (1) JP7724656B2 (ja)
KR (1) KR20230019022A (ja)
CN (1) CN115685692A (ja)

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084834A (ja) 2003-09-05 2005-03-31 Japan Science & Technology Agency 適応型制御器、適応型制御方法および適応型制御プログラム
JP2013242761A (ja) 2012-05-22 2013-12-05 Internatl Business Mach Corp <Ibm> マルコフ決定過程システム環境下における方策パラメータを更新するための方法、並びに、その制御器及び制御プログラム
JP2017208386A (ja) 2016-05-16 2017-11-24 キヤノン株式会社 位置決め装置、リソグラフィー装置および物品製造方法
US20200333752A1 (en) 2019-04-16 2020-10-22 Robert Bosch Gmbh Configuring a system which interacts with an environment
CN112016611A (zh) 2019-09-23 2020-12-01 南京地平线机器人技术有限公司 生成器网络和策略生成网络的训练方法、装置和电子设备
WO2021081445A1 (en) 2019-10-25 2021-04-29 Xy.Health, Inc. System and method with federated learning model for geotemporal data associated medical prediction applications

Family Cites Families (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1019725B (zh) * 1989-12-20 1992-12-30 阿尔卡特股份公司 统计测量方法和使用该方法的电信系统
DE102005010027B4 (de) * 2005-03-04 2007-08-02 Siemens Ag Verfahren zum rechnergestützten Betrieb eines technischen Systems
DE102017211209A1 (de) * 2017-06-30 2019-01-03 Robert Bosch Gmbh Verfahren und Vorrichtung zum Einstellen mindestens eines Parameters eines Aktorregelungssystems, Aktorregelungssystem und Datensatz
CN107422615B (zh) * 2017-09-25 2019-08-06 武汉华星光电技术有限公司 曝光机控制方法、曝光机控制系统及存储介质
EP3660744A1 (en) * 2018-11-30 2020-06-03 ASML Netherlands B.V. Method for decreasing uncertainty in machine learning model predictions
JP7085140B2 (ja) 2018-12-19 2022-06-16 オムロン株式会社 制御装置、制御方法及び制御プログラム
JP7645658B2 (ja) * 2021-02-24 2025-03-14 キヤノン株式会社 制御装置、位置決め装置、リソグラフィー装置および物品製造方法

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2005084834A (ja) 2003-09-05 2005-03-31 Japan Science & Technology Agency 適応型制御器、適応型制御方法および適応型制御プログラム
JP2013242761A (ja) 2012-05-22 2013-12-05 Internatl Business Mach Corp <Ibm> マルコフ決定過程システム環境下における方策パラメータを更新するための方法、並びに、その制御器及び制御プログラム
JP2017208386A (ja) 2016-05-16 2017-11-24 キヤノン株式会社 位置決め装置、リソグラフィー装置および物品製造方法
US20200333752A1 (en) 2019-04-16 2020-10-22 Robert Bosch Gmbh Configuring a system which interacts with an environment
CN112016611A (zh) 2019-09-23 2020-12-01 南京地平线机器人技术有限公司 生成器网络和策略生成网络的训练方法、装置和电子设备
WO2021081445A1 (en) 2019-10-25 2021-04-29 Xy.Health, Inc. System and method with federated learning model for geotemporal data associated medical prediction applications

Also Published As

Publication number Publication date
KR20230019022A (ko) 2023-02-07
US20230034598A1 (en) 2023-02-02
JP2023020593A (ja) 2023-02-09
CN115685692A (zh) 2023-02-03

Similar Documents

Publication Publication Date Title
TWI355565B (en) System and method for moving a component through a
KR102622405B1 (ko) 리소그래피 프로세스의 서브-필드 제어 및 연관된 장치
TWI595329B (zh) 具有波前光學操縱器的投影透鏡、投影曝光方法、與投影曝光裝置
JP7749752B2 (ja) 人工ニューラルネットワークを使用する動き制御
JP7741655B2 (ja) 処理装置、管理装置、リソグラフィ装置、および物品製造方法
KR20230058456A (ko) 제어 장치 및 그 조정 방법, 리소그래피 장치 그리고 물품 제조 방법
JP4729065B2 (ja) 座標変換を伴う駆動システムを有するリソグラフィ装置および方法
KR102823897B1 (ko) 리소그래피 프로세스의 서브-필드 제어 및 연관된 장치
US20250298327A1 (en) Control apparatus, lithography apparatus, and article manufacturing method
JP7724656B2 (ja) 制御装置、リソグラフィー装置および物品製造方法
US9720334B2 (en) Stage apparatus, lithography apparatus, method of manufacturing an article, and determination method
EP3734366A1 (en) Sub-field control of a lithographic process and associated apparatus
TWI749607B (zh) 微影製程之子場控制及相關聯裝置
JP7584925B2 (ja) 管理装置、リソグラフィー装置、管理方法および物品製造方法
CN115616868A (zh) 曝光装置和制造物品的方法
CN114002917A (zh) 曝光设备和用于制造制品的方法
CN121165443A (zh) 控制方法、控制装置、学习方法以及信息处理装置
JP2019152685A (ja) 露光装置、露光方法、および物品製造方法
JP2025100144A (ja) 決定方法、プログラム、露光装置、および物品製造方法
KR20250178248A (ko) 제어 방법, 제어 장치, 학습 방법 및 정보 처리 장치
EP3792693A1 (en) Sub-field control of a lithographic process and associated apparatus
JP2025005682A (ja) 情報処理装置、情報処理方法、プログラム、露光方法、基板処理装置及び物品の製造方法
JP2007115796A (ja) 測定装置及び方法、露光装置、並びにデバイス製造方法

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20240723

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20250219

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20250331

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20250526

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20250707

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20250805

R150 Certificate of patent or registration of utility model

Ref document number: 7724656

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150