WO2024158019A1

WO2024158019A1 - コンピュータプログラム、情報処理方法、及び情報処理装置

Info

Publication number: WO2024158019A1
Application number: PCT/JP2024/002108
Authority: WO
Inventors: 累輝小林; 正樹狐塚
Original assignee: 東京エレクトロン株式会社
Priority date: 2023-01-26
Filing date: 2024-01-24
Publication date: 2024-08-02

Abstract

コンピュータプログラム、情報処理方法、及び情報処理装置の提供。基板処理に関するデータを取得し、データの入力に応じて、データの特徴量を出力するよう学習された第１学習モデルを用いて、取得したデータの特徴量を抽出し、抽出した特徴量を、設定された対象次元の特徴量に変換し、対象次元を有する特徴量の入力に応じて、基板処理に関する予測値を出力するよう学習された第２学習モデルに、次元変換後の特徴量を入力して予測値を求める処理をコンピュータに実行させる。

Description

コンピュータプログラム、情報処理方法、及び情報処理装置

　本発明は、コンピュータプログラム、情報処理方法、及び情報処理装置に関する。

　従来より、基板処理の分野では、仮想計測技術の活用が進められている。仮想計測技術では、例えば、基板などの対象物の処理中に得られる計測データを解析し、結果物についての予測値を演算によって求める。

特表２０１９－５３７２４０号公報

　本開示は、空間相関を考慮した解析を学習モデルで行うことができるコンピュータプログラム、情報処理方法、及び情報処理装置を提供する。

　本発明の一形態に係るコンピュータプログラムは、基板処理に関するデータを取得し、前記データの入力に応じて、前記データの特徴量を出力するよう学習された第１学習モデルを用いて、取得したデータの特徴量を抽出し、抽出した特徴量を、設定された対象次元の特徴量に変換し、前記対象次元を有する特徴量の入力に応じて、基板処理に関する予測値を出力するよう学習された第２学習モデルに、次元変換後の特徴量を入力して予測値を求める処理をコンピュータに実行させるためのコンピュータプログラムである。

　本開示によれば、空間相関を考慮した解析を学習モデルで行うことができる。

実施の形態に係る情報処理システムの構成を説明する説明図である。実施の形態１における予測手法を説明する説明図である。情報処理装置の内部構成を示すブロック図である。予測モデルの生成手順を示すフローチャートである。予測モデルを用いた予測手順を示すフローチャートである。予測モデルの性能評価を説明するための説明図である。観測データ毎の重要度の空間分布を示すグラフである。実施の形態２に係る情報処理装置が実行する処理の手順を示すフローチャートである。実施の形態３における予測手法を説明する説明図である。実施の形態４に係る情報処理装置が実行する処理の手順を示すフローチャートである。実施の形態５に係る情報処理装置が実行する処理の手順を示すフローチャートである。

　以下、図面を参照して一実施形態について説明する。説明において、同一要素又は同一機能を有する要素には同一の符号を付し、重複する説明を省略する。

（実施の形態１）
　図１は実施の形態に係る情報処理システムの構成を説明する説明図である。実施の形態に係る情報処理システムは、通信可能に接続された情報処理装置１００及び基板処理装置２００を備える。

　基板処理装置２００は、例えば、露光装置、エッチング装置、成膜装置、イオン注入装置、アッシング装置、スパッタリング装置などを少なくとも１つ含む半導体製造装置である。代替的に、基板処理装置２００は、液晶ディスプレイパネル、有機ＥＬ（Electro-Luminescence）パネルなどのＦＤＰ（Flat Display Panel）を製造するディスプレイ製造装置であってもよい。

　基板処理装置２００でプロセスが開始される際、基板の温度、チャンパ内の圧力やガス流量、高周波電源より印加する電圧などの各種の設定値が設定される。設定値は、例えばプロセスレシピによって与えられる。また、基板処理装置２００には、基板の温度、チャンバ内の圧力やガス流量、上部電極や下部電極に印加される電圧、プラズマ発光強度等を計測する各種のセンサや機器が設けられており、プロセスの実行中に各種の計測値が計測される。また、基板処理装置２００では、上述した計測値に限らず、プロセス前後の基板（ウェハ）の画像（ＲＧＢデータ）やプロセスログなどの適宜の時系列データが随時収集される。基板処理装置２００は、プロセスの実行中に得られる計測値、画像、時系列データ等を観測データとして情報処理装置１００へ出力する。

　情報処理装置１００は、基板処理に関するデータとして、基板処理装置２００から観測データを取得する。情報処理装置１００は、取得した観測データに基づき、基板処理に関する予測値を求める。

　従来より、観測データを用いた仮想計測が行われている。例えば、従来では、センサ計測値、画像データ、時系列データなどの何らかの入力信号を、入力信号に即した機械学習モデルに入力し、機械学習モデルによる演算を実行することによって、必用な予測値を求めている。

　しかしながら、従来の機械学習モデルでは、空間相関を考慮した設計がなされていないため、精度や解釈可能性に問題がある。例えば、空間相関が考慮されていなければ、場所毎に独立した予測が行われるので、互いに隣接する場所であっても予測値に大きな違いが生じる場合があり、結果として予測結果が空間的に歪む可能性がある。また、空間相関が考慮されていなければ、どのパラメータがどの場所に効きやすいかを把握することは困難である。

　そこで、本実施の形態では、空間相関を考慮した予測モデルＭＤ２として、次元マッピングを導入したモデルを提案する。次元マッピングは、観測データから抽出される特徴量（予測の手がかりとなる変数）の次元を、予測値として算出したい物理的な次元（対象次元）に合わせて変換することを表す。特徴量の抽出には、例えば機械学習の学習モデル（以下、特徴量抽出モデルＭＤ１という）が用いられる。実施の形態１では、ユニモーダルなネットワーク構造に次元マッピングを導入することによって、空間相関を明示的に考慮し、精度及び解釈可能性の向上を実現する。

　図２は実施の形態１における予測手法を説明する説明図である。情報処理装置１００は、基板処理装置２００より基板処理に関するデータを取得する。情報処理装置１００が取得するデータは任意であり、基板処理装置２００のセンサ等より出力される計測データ、処理対象の基板を撮像して得られる画像データ、プロセスログ等の時系列データなどを含む観測データである。

　情報処理装置１００は、観測データを入力として、当該観測データの特徴量を出力するよう学習された特徴量抽出モデルＭＤ１（第１学習モデル）を用いて、基板処理装置２００から取得した観測データの特徴量を抽出する。抽出すべき特徴量は、予測の手がかりとなるような変数であることが好ましい。

　特徴量抽出モデルＭＤ１として、深層学習を含む機械学習の学習モデルを用いることができる。例えば、ＣＮＮ（Convolutional Neural Network）、Ｔｒａｎｓｆｏｒｍｅｒ、ＲＮＮ（Recurrent Neural Networks）、ＬＳＴＭ（Long Short Term Memory）、ＭＬＰ（Multi-Layer Perceptrons）などに基づく学習モデルを用いることができる。代替的に、自己回帰モデル、移動平均モデル、自己回帰移動平均モデルなど、深層学習以外の学習モデルを用いてもよい。特徴量抽出モデルＭＤ１に用いる学習モデルは、入力される観測データや抽出すべき特徴量に応じて適宜設定される。

　特徴量抽出モデルＭＤ１は、例えば、入力層、１又は複数の中間層、及び出力層を備え、入力層への観測データの入力に応じて、出力層から特徴量を出力するよう学習される。代替的に、中間層の何れか１つから出力される値を特徴量として用いてもよい。特徴量抽出モデルＭＤ１は、中間層を備えずに、入力層及び出力層のみ備える構成であってもよい。本実施の形態では、特徴量抽出モデルＭＤ１から出力される特徴量の次元を１次元として説明するが、特徴量の次元は２次元以上であってもよい。

　次いで、情報処理装置１００は、抽出した特徴量の次元を対象次元（予測値として算出したい物理的な次元）に合わせて変換（次元マッピング）する。予測値として、基板面内での各場所でのエッチングレート、エッチング形状（開口幅若しくは開口深さ）、膜厚等を算出したい場合、抽出した特徴量の次元を２次元に変換すればよい。図２の例では、１次元の特徴量から２次元の特徴量への次元マッピングを示している。変換前後は任意の次元でよく、使用する観測データや算出したい予測値に応じて適宜設定される。対象次元は拡大又は縮小される場合もあるし、変換前の特徴量の次元と等しい場合もある。特徴量抽出モデルＭＤ１から出力される特徴量がＮ個（Ｎ＝Ｎ_x ×Ｎ_y ）の要素からなる１次元の特徴量である場合、各要素をＮ_x ×Ｎ_y のマトリクスに配置し直す（マッピングする）ことにより、１次元の特徴量を２次元の特徴量に変換することができる。

　情報処理装置１００は、次元マッピングされた特徴量を入力として、基板処理に関する予測値を出力するよう学習された予測モデルＭＤ２（第２学習モデル）を用いて、基板処理に関する予測値を求める。

　予測モデルＭＤ２として、深層学習を含む機械学習の学習モデルを用いることができる。例えば、ＣＮＮ、Ｔｒａｎｓｆｏｒｍｅｒ、ＲＮＮ、ＬＳＴＭ、ＭＬＰなどに基づく学習モデルを用いることができる。代替的に、自己回帰モデル、移動平均モデル、自己回帰移動平均モデルなど、深層学習以外の学習モデルを用いてもよい。予測モデルＭＤ２に用いる学習モデルは、入力される特徴量の対象次元や算出すべき予測値に応じて適宜設定される。

　本実施の形態では、説明の都合上、次元マッピングを独立した処理として記載したが、予測モデルＭＤ２の内部で実行される処理であってもよい。このため、予測モデルＭＤ２は、次元マッピングモデルとも称される。

　また、本実施の形態では、便宜的に、特徴量抽出モデルＭＤ１と予測モデルＭＤ２とを独立した学習モデルとして記載したが、１つの学習モデルとして構築されてもよい。この場合、１つの学習モデル内で、特徴量の抽出、次元マッピング、予測値の演算が実行される。

　図３は情報処理装置１００の内部構成を示すブロック図である。情報処理装置１００は、例えば、制御部１０１、記憶部１０２、通信部１０３、操作部１０４、及び表示部１０５を備える専用又は汎用のコンピュータである。

　制御部１０１は、ＣＰＵ（Central Processing Unit）、ＲＯＭ（Read Only Memory）、ＲＡＭ（Random Access Memory）などを備える。制御部１０１が備えるＲＯＭには、情報処理装置１００が備えるハードウェア各部の動作を制御する制御プログラム等が記憶される。制御部１０１内のＣＰＵは、ＲＯＭに記憶されている制御プログラムや記憶部１０２に記憶されている後述のコンピュータプログラムを読み込んで実行し、ハードウェア各部の動作を制御することにより、装置全体を本開示の情報処理装置として機能させる。制御部１０１が備えるＲＡＭには、演算の実行中に利用されるデータが一時的に記憶される。

　実施の形態では、制御部１０１がＣＰＵ、ＲＯＭ、及びＲＡＭを備える構成としたが、制御部１０１の構成は上記のものに限定されない。制御部１０１は、例えば、ＧＰＵ（Graphics Processing Unit）、ＦＰＧＡ（Field Programmable Gate Array）、ＤＳＰ（Digital Signal Processor）、量子プロセッサ、揮発性又は不揮発性のメモリ等を備える１又は複数の制御回路又は演算回路であってもよい。また、制御部１０１は、日時情報を出力するクロック、計測開始指示を与えてから計測終了指示を与えるまでの経過時間を計測するタイマ、数をカウントするカウンタ等の機能を備えてもよい。

　記憶部１０２は、ＨＤＤ（Hard Disk Drive）、ＳＳＤ（Solid State Drive）、ＥＥＰＲＯＭ（Electronically Erasable Programmable Read Only Memory）などの記憶装置を備える。記憶部１０２には、制御部１０１によって実行される各種のコンピュータプログラムや制御部１０１によって利用される各種のデータが記憶される。

　記憶部１０２に記憶されるコンピュータプログラム（プログラム製品）は、基板処理装置２００の観測データから基板処理に関する予測値を求める処理をコンピュータに実行させるための予測処理プログラムＰＧ１を含む。予測処理プログラムＰＧ１は、単一のコンピュータプログラムであってもよく、複数のコンピュータプログラムにより構成されるプログラム群であってもよい。予測処理プログラムＰＧ１は、複数のコンピュータにより協働して実行されてもよい。また、予測処理プログラムＰＧ１は、既存のライブラリを部分的に用いるものであってもよい。

　予測処理プログラムＰＧ１を含むコンピュータプログラムは、当該コンピュータプログラムを読み取り可能に記録した非一時的な記録媒体ＲＭにより提供される。記録媒体ＲＭは、ＣＤ－ＲＯＭ、ＵＳＢメモリ、ＳＤ（Secure Digital）カード、マイクロＳＤカード、コンパクトフラッシュ（登録商標）などの可搬型メモリである。制御部１０１は、図に示していない読取装置を用いて、記録媒体ＲＭから各種コンピュータプログラムを読み取り、読み取った各種コンピュータプログラムを記憶部１０２に記憶させる。また、記憶部１０２に記憶されるコンピュータプログラムは、通信により提供されてもよい。この場合、制御部１０１は、通信部１０３を介した通信によりコンピュータプログラムを取得し、取得したコンピュータプログラムを記憶部１０２に記憶させる。

　また、記憶部１０２には、観測データから特徴量を抽出する処理に用いられる特徴量抽出モデルＭＤ１と、対象次元への変換後の特徴量から基板処理に関する予測値を求める処理に用いられる予測モデルＭＤ２とが記憶される。代替的に、これらの特徴量抽出モデルＭＤ１及び予測モデルＭＤ２は、外部装置に格納されてもよい。この場合、情報処理装置１００の制御部１０１は、通信ネットワーク経由で外部装置にアクセスし、基板処理装置２００から取得した観測データを外部装置へ送信し、外部装置による演算結果として得られる予測値を、通信ネットワーク経由で取得してもよい。

　通信部１０３は、外部装置との間で各種のデータを送受信するための通信インタフェースを備える。通信部１０３の通信インタフェースとして、ＬＡＮ（Local Area Network）などの通信規格に準拠した通信インタフェースを用いることができる。外部装置は、上述の基板処理装置２００やユーザ端末（不図示）などである。通信部１０３は、送信すべきデータが制御部１０１から入力された場合、宛先の外部装置へデータを送信し、外部装置から送信されたデータを受信した場合、受信したデータを制御部１０１へ出力する。

　操作部１０４は、タッチパネル、キーボード、スイッチなどの操作デバイスを備え、ユーザ等による各種の操作及び設定を受付ける。制御部１０１は、操作部１０４より与えられる各種の操作情報に基づき適宜の制御を行い、必要に応じて設定情報を記憶部１０２に記憶させる。

　表示部１０５は、液晶モニタや有機ＥＬ（Electro-Luminescence）モニタなどの表示デバイスを備え、制御部１０１からの指示に応じてユーザ等に報知すべき情報を表示する。

　本実施の形態における情報処理装置１００は、単一のコンピュータであってもよく、複数のコンピュータや周辺機器などにより構成されるコンピュータシステムであってもよい。また、情報処理装置１００は、実体が仮想化された仮想マシンであってもよく、クラウドであってもよい。更に、本実施の形態では、情報処理装置１００と基板処理装置２００とを別体として記載したが、情報処理装置１００は基板処理装置２００の内部に設けられてもよい。

　以下、情報処理装置１００の動作について説明する。
　本実施の形態に係る情報処理装置１００は、基板処理装置２００での実運用が開始される前の学習フェーズにおいて、予測モデルＭＤ２を生成する。

　図４は予測モデルＭＤ２の生成手順を示すフローチャートである。予測モデルＭＤ２の生成に先立ち、学習に必要な訓練データが収集される。例えば、プラズマ発光強度に基づき、基板面内の各場所でのエッチング形状を予測値として求める場合、ＯＥＳ（Optical Emission Spectrometer）により計測されるプラズマ発光強度の計測データと、光学観察装置や超音波顕微鏡などを使用して計測される各場所のエッチング形状の計測データとが訓練データとして収集される。訓練データは、プラズマ発光強度及びエッチング形状の計測データに限らず、予測に用いる値の観測データと、予測したい値の実測値とが訓練データとして収集される。収集された訓練データは、情報処理装置１００の記憶部１０２に記憶される。特徴量抽出モデルＭＤ１については、公知のアルゴリズムを用いて事前に生成されているものとする。

　制御部１０１は、記憶部１０２に記憶されている訓練データを読み出し（ステップＳ１０１）、読み出した訓練データから、一組の訓練データを選択する（ステップＳ１０２）。制御部１０１は、選択した訓練データに含まれる観測データ（予測に用いる値）を特徴量抽出モデルＭＤ１に入力し、特徴量抽出モデルＭＤ１による演算を実行することにより、観測データの特徴量を抽出する（ステップＳ１０３）。

　制御部１０１は、観測データから抽出した特徴量の次元を対象次元に変換する（ステップＳ１０４）。すなわち、制御部１０１は、抽出した特徴量の次元を予測値として算出したい物理的な次元に合わせて次元マッピングする。

　制御部１０１は、対象次元に変換された特徴量を予測モデルＭＤ２に入力し、予測モデルＭＤ２による演算を実行することにより、場所毎に予測値を求める（ステップＳ１０５）。学習が開始される前の段階において、予測モデルＭＤ２のモデルパラメータには、初期値が設定されているものとする。また、本フローチャートでは、次元マッピングの処理と、予測モデルＭＤ２による演算処理とをそれぞれ独立した処理として記載したが、次元マッピングは予測モデルＭＤ２の処理の中で実行されてもよい。

　制御部１０１は、ステップＳ１０５で算出した予測値を評価し（ステップＳ１０６）、学習が完了したか否かを判断する（ステップＳ１０７）。予測値の評価には公知の損失関数が用いられる。損失関数を最適化（最小化）する過程で、損失関数の値が閾値未満となった場合、制御部１０１は、予測モデルＭＤ２の学習が完了したと判断することができる。

　学習が完了していないと判断した場合（Ｓ１０７：ＮＯ）、制御部１０１は、予測モデルＭＤ２におけるモデルパラメータ（ノード間の重み係数やバイアス）を更新し（ステップＳ１０８）、ステップＳ１０２へ処理を戻す。

　学習が完了したと判断した場合（Ｓ１０７：ＹＥＳ）、学習済みのモデルが得られるので、制御部１０１は、そのモデルを学習済みの予測モデルＭＤ２として記憶部１０２に記憶させる（ステップＳ１０９）。

　情報処理装置１００は、予測モデルＭＤ２が生成された後の運用フェーズにおいて、予測モデルＭＤ２を用いた予測を行う。図５は予測モデルＭＤ２を用いた予測手順を示すフローチャートである。情報処理装置１００の制御部１０１は、例えば通信部１０３を通じて、予測に用いる観測データを基板処理装置２００より取得する（ステップＳ１２１）。

　制御部１０１は、取得した観測データを特徴量抽出モデルＭＤ１に入力し、特徴量抽出モデルＭＤ１による演算を実行することにより、観測データの特徴量を抽出する（ステップＳ１２２）。

　制御部１０１は、観測データから抽出した特徴量の次元を対象次元に変換する（ステップＳ１２３）。すなわち、制御部１０１は、抽出した特徴量の次元を予測値として算出したい物理的な次元に合わせて次元マッピングする。

　制御部１０１は、対象次元に変換された特徴量を予測モデルＭＤ２に入力し、予測モデルＭＤ２による演算を実行することにより、場所毎に予測値を求める（ステップＳ１２４）。

　制御部１０１は、予測モデルＭＤ２による予測結果を出力する（ステップＳ１２５）。制御部１０１は、予測結果を表示部１０５に表示させてもよく、通信部１０３を通じてユーザ端末等に通知してもよい。

　図６は予測モデルＭＤ２の性能評価を説明するための説明図である。図６に示す各グラフは、エッチング形状（開口幅）を仮想計測若しくは実計測したときの面内分布を示している。各グラフの横軸は基板面内の第１方向に対応し、横軸は第１方向と直交する基板の第２方向に対応する。各グラフに示す濃淡は開口幅の広狭に対応し、濃度が薄い領域ほど開口幅が広く、濃度が濃い領域ほど開口幅が狭いことを示している。図６Ａは従来手法による予測結果（仮想計測）、図６Ｂは本開示の手法による予測結果（仮想計測）、図６Ｃは実計測による実測値を示している。

　実計測では、エッチングにより基板表面に多数の開口を形成し、光学観察装置や超音波顕微鏡などの計測装置を用いて、各開口の開口幅を実測した。仮想計測では、同じ開口が形成された基板表面をカメラで撮像し、得られた撮像画像を観測データに用いて、開口幅の予測を行った。撮像画像には、ウェハ光学検査システムで撮像されるＲＧＢ３色のカラー画像を用いた。

　開口幅の設計値は開口を形成する場所に依らず一定としたが、実際に基板に形成された開口の開口幅を実測したところ、図６Ｃに示すように、基板表面の中心付近では開口幅が最も広く、周縁に向かうに従い開口幅が狭くなるような面内分布が確認された。

　一方、従来手法（この例では線形回帰）で開口幅を予測したところ、図６Ａに示すように、基板表面の中心付近で開口幅が最も広く、周縁に向かって開口幅が徐々に狭くなる傾向は見られるものの、開口幅が同一となる領域がグラフの横方向に拡がっており、予測結果が歪んだ状態となった。

　これに対し、本開示の手法（予測モデルＭＤ２）で開口幅を予測したところ、図６Ｂに示すように、予測結果は特定の方向に歪まず、実測に近い周方向に均一な分布が得られた。従来手法による予測値と実測値との間の平均二乗誤差は０．８程度であったのに対し、本開示の手法による予測値と実測値との間の平均二乗誤差は０．６程度となり、予測精度が有意に改善することが分かった。

　図６では、撮像画像を観測データに用いた予測結果について示したが、プラズマ発光強度やプロセスログを観測データに用いて開口幅の予測を行った結果、本開示の手法は、従来手法と比較して、予測精度が改善することが分かった。

　以上のように、実施の形態１では、次元マッピングを利用して空間相関を機械学習の学習モデルに導入し、当該学習モデル（予測モデルＭＤ２）を用いて仮想計測を行う手法を開示した。空間相関を用いることで、モデルの解釈が容易となり、実際の空間分布を予測に反映させることが可能となった。また、空間相関が考慮されていない従来手法と比較すると、予測精度が有意に改善されることが分かった。

（実施の形態２）
　実施の形態２では、場所毎に特徴量の重要度（寄与度ともいう）を算出し、算出した重要度の空間分布を出力する構成について説明する。

　実施の形態２に係る情報処理装置１００は、予測モデルＭＤ２を用いて、場所毎に特徴量の重要度（寄与度）を算出する。重要度の算出には、Ｌｉｍｅ（Local Interpretable Model-Agnostic Explanations）、ＳＨＡＰ（SHapley Additive exPlanations）、ＣＡＭ（Class Activation Mapping）などの公知の手法が用いられる。ＬｉｍｅやＳＨＡＰは、入力を減らした際に、出力がどれほど変化したのかを特定し、出力が大きく変化したものほど重要度が高いと判断する手法である。ＣＡＭは、学習時の誤差逆伝搬を利用して重要度を算出する手法である。

　図７は観測データ毎の重要度の空間分布を示すグラフである。図７Ａはプラズマ発光強度（ＯＥＳ）、図７Ｂは撮像画像（ウェハ光学検査システム）、図７Ｃはプロセスログ（Ｐ－ｌｏｇｓ）をそれぞれ観測データに用いた場合の重要度の空間分布を示している。各グラフの横軸は基板面内の第１方向に対応し、横軸は第１方向と直交する基板の第２方向に対応する。各グラフに示す濃淡は重要度の高低に対応する。グラフ上の濃度が高い領域は重要度が高い場所を示し、濃度が低い領域は重要度が低い場所を示している。

　プラズマ発光強度を観測データに用いて開口幅を予測した場合、プラズマ発光強度に基づく特徴量の重要度は、基板の中心付近に向かうにつれて低くなり、基板の周縁に向かうにつれて高くなる空間分布となった（図７Ａ）。このグラフより、プラズマ発光強度を観測データに用いる場合、基板の周縁において開口幅を良好に予測できることが分かる。プロセスログを観測データに用いた場合についても同様の結果が得られた（図７Ｃ）。

　一方、ウェハ光学検査システムによる撮像画像を観測データに用いて開口幅を予測した場合、撮像画像に基づく特徴量の重要度は、基板周縁の一部の領域（グラフの右上隅及び左下隅に対応した領域）で低くなり、それ以外の領域で高くなる空間分布となった（図７Ｂ）。このグラフより、撮像画像を用いる場合には、基板周縁の一部を除く領域で開口幅を良好に予測できることが分かる。

　このように、観測データの種類（特徴量）に応じて、重要度の空間分布が異なるので、予測モデルＭＤ２を生成する際に、場所毎に重みを調整した損失関数を用いて学習を行ってもよい。例えば、プラズマ発光強度やプロセスログを観測データに用いる場合、周縁部の重みを大きくした損失関数を用いて学習を行うことにより、周縁部に特化した予測モデルＭＤ２を生成してもよい。また、ウェハ光学検査システムによる撮像画像を観測データに用いる場合、中心部の重みを大きくした損失関数を用いて学習を行うことにより、中心部に特化した予測モデルＭＤ２を生成してもよい。

　また、本実施の形態では、場所毎に特徴量の寄与度を確認することができるので、例えば、プロセスログに存在するセンサ出力値が基板のどの部分に寄与するのかを把握することができ、センサ出力値が変化するようにプロセスを調整することで、プロセス改善に繋げることができる。また、現実の基板処理において、周縁部のプロセス状態が良くないため歩留まりが悪い等の事情があれば、上述した手法により周縁部に特化した予測モデルＭＤ２を作成し、予測モデルＭＤ２による予測結果を加味してプロセスを改善してもよい。

　図８は実施の形態２に係る情報処理装置１００が実行する処理の手順を示すフローチャートである。情報処理装置１００の制御部１０１は、例えば通信部１０３を通じて、予測に用いる観測データを基板処理装置２００より取得する（ステップＳ２０１）。

　制御部１０１は、取得した観測データに基づき場所毎の予測値を算出する（ステップＳ２０２）。予測値の算出方法は、実施の形態１と同様である。すなわち、制御部１０１は、取得した観測データを特徴量抽出モデルＭＤ１に入力して特徴量を抽出し、抽出した特徴量の次元を対象次元（予測値として算出したい物理的な次元）に次元マッピングする。次いで、制御部１０１は、次元マッピングされた特徴量を予測モデルＭＤ２に入力して演算を行うことにより、場所毎の予測値を算出する。

　制御部１０１は、算出した予測値に対する観測データの寄与度を場所毎に算出する（ステップＳ２０３）。寄与度は、例えば予測モデルＭＤ２を用いて算出することができるＳＨＡＰ値である。ＳＨＡＰ値は、複数の観測データを予測モデルＭＤ２に入力して算出される予測値と、当該複数の観測データのうち一の観測データが無かった場合に予測モデルＭＤ２より算出される予測値との差分に相当する値である。寄与度はＳＨＡＰ値に限らず、ＬｉｍｅやＣＡＭなどの既存の手法を用いて算出され得る。

　制御部１０１は、寄与度の空間分布を出力する（ステップＳ２０４）。制御部１０１は、ステップＳ２０３で算出した場所毎の寄与度に基づき、例えば、図７Ａ～図７Ｃに示すようなグラフ（カラーコンターマップ）を作成し、表示部１０５に表示させる。また、制御部１０１は、作成したグラフをユーザ端末へ送信してもよい。

　制御部１０１は、場所毎の寄与度に応じた制御を実行する（ステップＳ２０５）。制御部１０１は、場所毎の寄与度に応じて制御対象に対するパラメータを調整し、調整後のパラメータに従ってプロセスを制御する。例えば、特定の周波数のプラズマ発光強度が周縁部付近に良く寄与することが分かった場合、その発光強度を上げるようにガスの流量を調整し、面内均一性を向上させるといったプロセス制御が可能となる。寄与度に対するパラメータの調整量は例えばルールベースで定められる。

　なお、図８のフローチャートでは、ステップＳ２０４で寄与度の空間分布を出力した後、ステップＳ２０５で寄与度に応じた制御を実行する手順としたが、これらの手順は前後してもよく、何れか一方の手順のみが実行されてもよい。

　以上のように、実施の形態２では、場所毎に特徴量の重要度（寄与度）を算出し、算出した重要度の空間分布を出力するので、どのパラメータがどの場所に効きやすいのを把握することが可能となり、プロセスの改善や制御に繋げることができる。

（実施の形態３）
　実施の形態３では、複数種の観測データから予測値を算出する構成について説明する。

　通常、一枚のウェハには幾つかの測定点が存在する。この測定点を独立に算出するのではなく、測定点の物理的な次元に即して特徴量抽出ないしは予測値を算出することで高精度かつ解釈性の高いモデルが実現できる。

　図９は実施の形態３における予測手法を説明する説明図である。実施の形態３では、空間相関を考慮したマルチモーダル仮想計測について説明する。情報処理装置１００は、複数種の観測データを取得する。図９において、入力１～入力３はそれぞれ特徴量抽出モデルＭＤ１１、ＭＤ１２、ＭＤ１３に入力される観測データである。例えば、入力１はＯＥＳによるプラズマ発光強度、入力２はウェハ光学検査システムによる撮像画像、入力３はプロセスログである。予測に用いる観測データは３種類に限らず、２種類または４種類以上であってもよい。

　特徴量抽出モデルＭＤ１１は、実施の形態１で説明した特徴量抽出モデルＭＤ１に対応するモデルであり、入力１の観測データが入力された場合、当該観測データの特徴量を出力するように学習される。特徴量抽出モデルＭＤ１２，ＭＤ１３についても同様であり、それぞれ入力１，入力２の観測データが入力された場合、それぞれの特徴量を出力するよう学習される。情報処理装置１００の記憶部１０２には、学習済みの特徴量抽出モデルＭＤ１１，ＭＤ１２，ＭＤ１３が記憶される。

　情報処理装置１００は、特徴量抽出モデルＭＤ１１～ＭＤ１３を用いて、入力１～入力３の特徴量をそれぞれ抽出し、抽出した各特徴量の次元を対象次元の特徴量に変換する。特徴量の次元変換には、実施の形態１で説明した次元マッピングが使用される。特徴量抽出モデルＭＤ１１から抽出した特徴量を例えばＮ_x ×Ｎ_y の２次元の特徴量に変換する場合、特徴量抽出モデルＭＤ１２，ＭＤ１３から抽出した特徴量についてもＮ_x ×Ｎ_y の２次元の特徴量に変換する。

　情報処理装置１００は、次元変換後の特徴量を連結層ＣＬにて連結する。各特徴量について、Ｎ_x ×Ｎ_y の２次元の特徴量が得られた場合、チャネルを追加し、Ｎ_x ×Ｎ_y ×Ｃのようにチャネル方向に特徴量を連結すればよい。ここで、Ｃは入力の数（観測データの種類の数）であり、図９のケースではＣ＝３である。

　情報処理装置１００は、連結層ＣＬで連結された特徴量を予測モデルＭＤ２０に入力し、予測値を求める。予測モデルＭＤ２０は、実施の形態１で説明した予測モデルＭＤ２に対応するモデルであり、特徴量の入力に応じて、基板処理に関する予測値を出力するよう学習される。予測モデルＭＤ２０に使用できるモデルの種類やモデルの学習方法等は実施の形態１と同様である。情報処理装置１００の記憶部１０２には、学習済みの予測モデルＭＤ２０が記憶される。情報処理装置１００は、記憶部１０２に記憶された予測モデルＭＤ２０を用いて、基板の各場所における予測値を算出する。

　以上のように、実施の形態３では、空間相関を導入した学習モデル（予測モデルＭＤ２０）を用いてマルチモーダル仮想計測を行う手法を開示した。予測モデルＭＤ２０について実施の形態２で開示した手法を適用することにより、モーダル毎及び場所毎に特徴量の寄与度を算出することができる。これにより、モーダル毎に得意な次元内の箇所を理解することができ、解釈性が向上する。

　また、モーダル毎に得意な次元内の箇所を明示的に使用することが可能である。例えば、ＯＥＳによるプラズマ発光強度やプロセスログを用いて基板周縁部の予測を行い、ウェハ光学検査システムによる撮像画像を用いて基板周縁部を除く領域の予測を行うことで、予測精度を向上させることができる。更に、どのモーダルがどの場所に影響を与えるか分析し、モデルやプロセスの改善に繋げることが可能となる。

（実施の形態４）
　実施の形態４では、予測値に応じて警報を出力する構成について説明する。

　図１０は実施の形態４に係る情報処理装置１００が実行する処理の手順を示すフローチャートである。情報処理装置１００の制御部１０１は、例えば通信部１０３を通じて、予測に用いる観測データを基板処理装置２００より取得する（ステップＳ４０１）。

　制御部１０１は、取得した観測データに基づき場所毎の予測値を算出する（ステップＳ４０２）。予測値の算出方法は、実施の形態１と同様である。すなわち、制御部１０１は、取得した観測データを特徴量抽出モデルＭＤ１に入力して特徴量を抽出し、抽出した特徴量の次元を対象次元に次元マッピングする。次いで、制御部１０１は、次元マッピングされた特徴量を予測モデルＭＤ２に入力して演算を行うことにより、場所毎の予測値を算出する。予測に用いる観測データとして複数種の観測データが得られる場合、制御部１０１は、実施の形態３に開示した手法を用いて、予測モデルＭＤ２０により予測値を算出してもよい。

　制御部１０１は、算出した予測値に応じて警報出力の要否を判断する（ステップＳ４０３）。例えば、制御部１０１は、算出した予測値と事前に設定された閾値とを比較し、予測値が閾値を超える場合（若しくは閾値未満の場合）に、警報出力を要と判断する。代替的に、制御部１０１は、予測値が事前に設定された正常範囲内に入るか否かを判断し、予測値が正常範囲から外れる場合に警報出力を要と判断してもよい。なお、閾値や正常範囲は予測対象の場所毎に設定されてもよい。

　警報出力を不要と判断した場合（Ｓ４０３：ＮＯ）、制御部１０１は、警報を出力することなく、本フローチャートによる処理を終了する。

　警報出力を要と判断した場合（Ｓ４０３：ＹＥＳ）、制御部１０１は、警報を出力する（ステップＳ４０４）。例えば、制御部１０１は、基板処理が正常でない旨の情報を表示部１０５に表示することによって警報を出力する。代替的に、制御部１０１は、基板処理が正常でない旨の情報を通信部１０３をユーザ端末等に通知してもよい。

　本実施の形態では、空間相関を考慮した予測モデル（予測モデルＭＤ２，ＭＤ２０）を用いて予測を行うので、より精度の高い予測値が得られる。本実施の形態では、このような精度の高い予測値を閾値や正常範囲と比較するので、より正確に警報出力の要否を判断できる。

（実施の形態５）
　実施の形態５では、予測値に基づき基板処理における制御を実行する構成について説明する。

　図１１は実施の形態５に係る情報処理装置１００が実行する処理の手順を示すフローチャートである。情報処理装置１００の制御部１０１は、例えば通信部１０３を通じて、予測に用いる観測データを基板処理装置２００より取得する（ステップＳ５０１）。

　制御部１０１は、取得した観測データに基づき場所毎の予測値を算出する（ステップＳ５０２）。予測値の算出方法は、実施の形態１と同様である。すなわち、制御部１０１は、取得した観測データを特徴量抽出モデルＭＤ１に入力して特徴量を抽出し、抽出した特徴量の次元を対象次元に次元マッピングする。次いで、制御部１０１は、次元マッピングされた特徴量を予測モデルＭＤ２に入力して演算を行うことにより、場所毎の予測値を算出する。予測に用いる観測データとして複数種の観測データが得られる場合、制御部１０１は、実施の形態３に開示した手法を用いて、予測モデルＭＤ２０により予測値を算出してもよい。

　制御部１０１は、算出した予測値に基づき、基板処理装置２００での基板処理に関する制御を実行する（ステップＳ５０３）。例えば、制御部１０１は、算出した予測値と事前に設定された基準値とを比較し、予測値と基準値との間のずれに基づいて基板処理装置２００に対する制御値（例えば、予測値が基準値に近づくような制御値）を求める。基準値は予測対象の場所毎に設定されてもよい。制御部１０１は、求めた制御値を含む制御命令を基板処理装置２００へ出力することにより、基板処理に関する制御を行う。

　本実施の形態では、空間相関を考慮した予測モデル（予測モデルＭＤ２，ＭＤ２０）を用いて予測を行うので、より精度の高い予測値が得られる。本実施の形態では、このような精度の高い予測値に基づき、基板処理に関する制御を行うので、プロセス改善に繋げることができる。

　今回開示された実施形態は、全ての点において例示であって、制限的なものではないと考えられるべきである。本発明の範囲は、上述した意味ではなく、請求の範囲によって示され、請求の範囲と均等の意味及び範囲内での全ての変更が含まれることが意図される。

　各実施形態に記載した事項は相互に組み合わせることが可能である。また、請求の範囲に記載した独立請求項及び従属請求項は、引用形式に関わらず全てのあらゆる組み合わせにおいて、相互に組み合わせることが可能である。さらに、請求の範囲には他の２以上のクレームを引用するクレームを記載する形式（マルチクレーム形式）を用いているが、これに限るものではない。マルチクレームを少なくとも一つ引用するマルチクレーム（マルチマルチクレーム）を記載する形式を用いて記載してもよい。

　１００　情報処理装置
　１０１　制御部
　１０２　記憶部
　１０３　通信部
　１０４　操作部
　１０５　表示部
　２００　基板処理装置
　ＰＧ１　予測処理プログラム
　ＭＤ１　特徴量抽出モデル
　ＭＤ２　予測モデル
　ＲＭ　記録媒体

Claims

　基板処理に関するデータを取得し、
　前記データの入力に応じて、前記データの特徴量を出力するよう学習された第１学習モデルを用いて、取得したデータの特徴量を抽出し、
　抽出した特徴量を、設定された対象次元の特徴量に変換し、
　前記対象次元を有する特徴量の入力に応じて、基板処理に関する予測値を出力するよう学習された第２学習モデルに、次元変換後の特徴量を入力して予測値を求める
　処理をコンピュータに実行させるためのコンピュータプログラム。
　次元変換後の特徴量の空間分布を示すデータを出力する
　処理を前記コンピュータに実行させるための請求項１記載のコンピュータプログラム。
　前記第２学習モデルは、前記特徴量の空間分布に対して重みを設定した損失関数を用いて学習してある
　請求項１記載のコンピュータプログラム。
　前記基板処理に関する複数種のデータを取得し、
　取得した複数種のデータの夫々について、前記第１学習モデルを用いて特徴量を抽出し、
　前記複数種のデータの夫々から抽出した特徴量の夫々を、前記対象次元の特徴量に変換し、
　次元変換後の特徴量の夫々を前記第２学習モデルに入力して予測値を求める
　処理を前記コンピュータに実行させるための請求項１記載のコンピュータプログラム。
　前記予測値に対する基板の場所毎の特徴量の寄与度を算出し、
　算出結果を出力する
　処理を前記コンピュータに実行させるための請求項１記載のコンピュータプログラム。
　前記データの基板の各場所への寄与度を算出し、
　算出結果に応じて、前記基板処理における制御を実行する
　処理を前記コンピュータに実行させるための請求項１記載のコンピュータプログラム。
　前記第２学習モデルを用いて求めた予測値に応じて警報を出力する
　処理を前記コンピュータに実行させるための請求項１記載のコンピュータプログラム。
　前記第２学習モデルを用いて求めた予測値に基づき、前記基板処理における制御を実行する
　処理を前記コンピュータに実行させるための請求項１記載のコンピュータプログラム。
　前記特徴量の空間分布に対して重みを設定した損失関数を用いて、前記第２学習モデルを学習してある
　請求項１記載のコンピュータプログラム。
　基板処理に関するデータを取得し、
　前記データの入力に応じて、前記データの特徴量を出力するよう学習された第１学習モデルを用いて、取得したデータの特徴量を抽出し、
　抽出した特徴量を、設定された対象次元の特徴量に変換し、
　次元変換後の特徴量の空間分布に対し、損失関数における重みを設定し、
　重みが設定された損失関数を用いて、前記特徴量の入力に応じて、前記基板処理に関する予測値を出力する第２学習モデルを生成する
　処理をコンピュータに実行させるためのコンピュータプログラム。
　基板処理に関するデータを取得し、
　前記データの入力に応じて、前記データの特徴量を出力するよう学習された第１学習モデルを用いて、取得したデータの特徴量を抽出し、
　抽出した特徴量を、設定された対象次元の特徴量に変換し、
　前記対象次元を有する特徴量の入力に応じて、基板処理に関する予測値を出力するよう学習された第２学習モデルに、次元変換後の特徴量を入力して予測値を求める
　処理をコンピュータにより実行する情報処理方法。
　基板処理に関するデータを取得する取得部と、
　前記データの入力に応じて、前記データの特徴量を出力するよう学習された第１学習モデルを用いて、取得したデータの特徴量を抽出する抽出部と、
　抽出した特徴量を、設定された対象次元の特徴量に変換する変換部と、
　前記対象次元を有する特徴量の入力に応じて、基板処理に関する予測値を出力するよう学習された第２学習モデルに、次元変換後の特徴量を入力して予測値を求める予測値算出部と
　を備える情報処理装置。