JP2005061853A - Surface inspection system - Google Patents

Surface inspection system Download PDF

Info

Publication number
JP2005061853A
JP2005061853A JP2003207463A JP2003207463A JP2005061853A JP 2005061853 A JP2005061853 A JP 2005061853A JP 2003207463 A JP2003207463 A JP 2003207463A JP 2003207463 A JP2003207463 A JP 2003207463A JP 2005061853 A JP2005061853 A JP 2005061853A
Authority
JP
Japan
Prior art keywords
types
image
feature
optimum
candidates
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2003207463A
Other languages
Japanese (ja)
Inventor
Hiroyuki Abe
啓之 阿部
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nikon Corp
Original Assignee
Nikon Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nikon Corp filed Critical Nikon Corp
Priority to JP2003207463A priority Critical patent/JP2005061853A/en
Publication of JP2005061853A publication Critical patent/JP2005061853A/en
Pending legal-status Critical Current

Links

Images

Abstract

<P>PROBLEM TO BE SOLVED: To provide a surface inspection system capable of appropriately classifying a plurality of optimal candidates of system conditions decided based on images of an object (substrate) to be inspected. <P>SOLUTION: The images of the object to be inspected are captured under a plurality of system conditions respectively, and the plurality of optimal candidates of system condition are decided from the plurality of system conditions, based on these images. Then, two or more kinds of feature quantity of the images defined beforehand are extracted from respective images corresponding to the plurality of candidates being obtained (S12), and the two or more kinds of feature quantity are processed statistically, and one or more optimal kinds are selected from the two or more kinds (S14), and the optimal kinds of the feature quantity are processed statistically, thereby classifying the plurality of candidates (S15). <P>COPYRIGHT: (C)2005,JPO&NCIPI

Description

【0001】
【発明の属する技術分野】
本発明は、半導体回路素子や液晶表示素子の製造工程において基板の表面を検査する表面検査装置に関する。
【0002】
【従来の技術】
従来より、半導体回路素子や液晶表示素子の製造工程では、基板(ウエハやプレート)の表面に形成された繰り返しパターンの欠陥検査が行われている。自動化された表面検査装置では、基板の表面に検査用の照明光を照射し、基板上の繰り返しパターンから発生する回折光などに基づいて基板の画像を取り込み、この画像の明暗差(コントラスト差)により繰り返しパターンの欠陥箇所を特定する。
【0003】
また、従来の表面検査装置では、その装置条件(例えば基板のチルト角)を自動的に変更しながら基板の画像を取り込み、得られた複数の画像に基づいて最適な装置条件を決定する(例えば特許文献1を参照)。そして、この最適な装置条件の下で所定の検査を行う。
【特許文献1】
特開2002−162368号公報
【0004】
【発明が解決しようとする課題】
しかしながら、上記した従来の表面検査装置では、基板上の繰り返しパターンの種類数に応じて多数の最適な装置条件が得られ、これらの最適な装置条件の下で順に検査を行うと、全体の処理時間が長くなってしまう。処理時間を短縮するためには、多数の最適な装置条件を絞り込み、検査に適するものを選び出す必要がある。さらに、その前処理として、多数の最適な装置条件を分類することも必要となるが、適切な分類方法はまだ提案されていない。なお以下の説明では、上記のように基板の画像に基づいて決定した多数の最適な装置条件を「最適な装置条件の候補」と言うことにする。
【0005】
本発明の目的は、被検物体(基板)の画像に基づいて決定した多数の最適な装置条件の候補を適切に分類可能な表面検査装置を提供することにある。
【0006】
【課題を解決するための手段】
請求項1に記載の表面検査装置は、被検物体の画像を複数の装置条件の各々で取り込む画像取込手段と、前記画像取込手段により取り込まれた複数の前記画像に基づいて、前記複数の装置条件の中から最適な装置条件の候補を複数決定する決定手段と、前記決定手段により決定された複数の前記候補の各々に対応する前記画像ごとに、該画像の予め定めた複数の種類の特徴量を抽出する抽出手段と、前記複数の種類の特徴量を統計的に処理し、前記複数の種類の中から1つ以上の最適な種類を選択する選択手段と、前記最適な種類の特徴量を統計的に処理し、前記複数の候補を分類する分類手段とを備えたものである。
【0007】
請求項2に記載の発明は、請求項1に記載の表面検査装置において、前記選択手段は、前記複数の種類の各々における前記特徴量の分散値または標準偏差値を大小比較することにより、前記最適な種類を選択するものである。
請求項3に記載の発明は、請求項1に記載の表面検査装置において、前記選択手段は、前記複数の種類のうち任意の2種類における前記特徴量どうしの相関値を大小比較することにより、前記最適な種類を選択するものである。
【0008】
請求項4に記載の発明は、請求項1に記載の表面検査装置において、前記選択手段は、前記複数の種類の各々における前記特徴量の分散値または標準偏差値を大小比較すると共に、前記複数の種類のうち任意の2種類における前記特徴量どうしの相関値を大小比較することにより、前記最適な種類を選択するものである。
【0009】
【発明の実施の形態】
以下、図面を用いて本発明の実施形態を詳細に説明する。
【0010】
本実施形態は、請求項1〜請求項4に対応する。
本実施形態の表面検査装置10は、図1に示すように、被検物体であるウエハ11を支持するホルダ12と、ウエハ11の表面に照明光L1を照射する照明系13と、ウエハ11の表面からの回折光L2を受光する受光系14と、画像処理装置15と、制御装置16とで構成されている。
【0011】
表面検査装置10は、半導体回路素子の製造工程において、ウエハ11の表面を自動的に検査する装置である。ウエハ11の表面には、図2に示すように、複数のチップ20がxy方向に配列されている。各々のチップ20には、複数種類の繰り返しパターンが形成されている。繰り返しパターンとは、周期的に繰り返される線配列形状の回路パターン(レジストパターン)のことである。各々のチップ20における繰り返しパターンの配置は同様である。
【0012】
概略、表面検査装置10では、ウエハ11の表面の検査(繰り返しパターンの欠陥検出)を行う前に、ウエハ画像の濃度情報に基づいて最適な装置条件(例えば後述のチルト角や照明光量や照明波長など)の候補を多数決定し、得られた多数の候補をクラスタリング処理により分類する。そして、分類の結果を考慮して最適な装置条件に設定し、検査を行う。なお、多数の候補が得られる理由は、ウエハ11に複数種類の繰り返しパターンが存在するからである。
【0013】
ここで、表面検査装置10の各部の説明を行う。
ホルダ12は、不図示の搬送装置によって搬送されてきたウエハ11を上面に載置し、例えば真空吸着により固定保持する。また、ホルダ12は、不図示のチルト機構によって、ウエハ11の表面を通る軸Ax1のまわりに所定の角度範囲内でチルト可能である。ホルダ12のチルト角Tは、制御装置16によって任意に設定可能な装置条件の1つである。
【0014】
なお、図1の軸Ax2は、ホルダ12の法線に相当する。ここで、ホルダ12が水平に保たれた状態での軸Ax2(基準法線)に平行な方向をZ方向とする。
また、軸Ax1に平行な方向をX方向とする。さらに、X方向およびZ方向に直交する方向をY方向とする。
照明系13は、光源21とライトガイド22と凹面反射鏡23とで構成された偏心光学系である。ライトガイド22は、光源21からの光を伝送し、端面22aから凹面反射鏡23に向けて射出する。端面22aは、凹面反射鏡23の前側焦点位置に配置されている。
【0015】
凹面反射鏡23は、球面の内側を反射面とした反射鏡であり、ホルダ12の斜め上方に配置されている。つまり、凹面反射鏡23の中心とホルダ12の中心とを通る軸(光軸O1)がZ方向に対して所定の角度θiだけ傾けられている。θiは固定値である。
また、凹面反射鏡23は、光軸O1がホルダ12の軸Ax1(X方向)に対して直交すると共に、後側焦点面がウエハ11の表面と略一致するように配置されている。表面検査装置10の照明系13は、ウエハ11側に対してテレセントリックな光学系である。
【0016】
上記の照明系13において、光源21からの光は、ライトガイド22と凹面反射鏡23とを介して、ウエハ11の表面全体に照射される(照明光L1)。照明光L1は、ウエハ11上の任意の点に到達する光束の中心線が光軸O1に略平行な光束である。照明光L1の入射角(θi−T)は、ウエハ11の表面に垂直な軸Ax2と光軸O1との間の角度に相当し、ホルダ12のチルト角Tに応じて変化する。
【0017】
また、照明光L1の波長λと光量は、光源21から射出される光の波長と光量に応じて変化する。例えば光源21に波長選択フィルタとニュートラルデンシティ(ND)フィルタを設けた場合、各々のフィルタを制御することにより、照明光L1の波長λと光量を変化させることができる。照明光L1の波長λと光量も、上記のチルト角Tと同様、制御装置16によって任意に設定可能な装置条件の1つである。
【0018】
このようにして照明光L1が照射されると、ウエハ11の表面に形成された繰り返しパターンからは、後述する回折の条件にしたがって回折光L2が発生する。回折光L2の回折角(θr+T)は、ウエハ11の表面に垂直な軸Ax2と回折光L2の進行方向との間の角度に相当し、チルト角Tに応じて変化する。θrは、回折光L2の進行方向とZ方向との間の角度を表す。なお、回折光L2を発生させる繰り返しパターンの直線方向は、ホルダ12の軸Ax1に略平行である。
【0019】
ここで、回折の条件は、照明光L1の波長λおよび入射角(θi−T)、回折光L2の回折角(θr+T)および回折次数n、繰り返しパターンのピッチpを用いると、次式(1)で表すことができる。
sin(θi−T) − sin(θr+T) = nλ/p …(1)
式(1)において、入射角(θi−T)および回折角(θr+T)は、ウエハ11の表面に垂直な軸Ax2を基準として入射側に見込む角度方向をプラス、反射側に見込む角度方向をマイナスとする。回折次数nは、n=0の0次回折光(正反射光)を基準として入射側に見込む角度方向をプラス、反射側に見込む角度方向をマイナスとする。
【0020】
また、式(1)において、θiはZ方向と光軸O1との間の角度(固定値)を表し、θrはZ方向と回折光L2の進行方向との間の角度を表している。チルト角Tは、ホルダ12が水平状態に保たれたときをT=0とし、入射側への角度方向をプラス、反対側への角度方向をマイナスとする。θiは、チルト角T=0のときの照明光L1の入射角に相当する。θrは、チルト角T=0のときの回折光L2の回折角に相当する。
【0021】
式(1)から分かるように、チルト角Tを変化させることにより、照明光L1の入射角(θi−T)をチルト角Tに応じて変化させることができ、結果として、回折光L2の回折角(θr+T)も変化させることができる。
受光系14は、回折光L2を受光する光学系であり、凹面反射鏡27と、CCDカメラ28とで構成された偏心光学系である。
【0022】
凹面反射鏡27は、上記の凹面反射鏡23と同様の反射鏡であり、ホルダ12の斜め上方に配置される。つまり、凹面反射鏡27の中心とホルダ12の中心とを通る軸(光軸O2)が基準法線(Z方向)に対して所定の角度θdだけ傾くように配置されている。θdは固定値である。以下、ウエハ11の表面に垂直な軸Ax2と光軸O2との間の角度(θd+T)を受光角という。この受光角(θd+T)も、上記の入射角(θi−T)と同様、チルト角Tに応じて変化する。
【0023】
また、CCDカメラ28は、その撮像面が凹面反射鏡23の焦点面と略一致するように配置される。CCDカメラ28の撮像面には、複数の画素が2次元的に配列されている。
上記の受光系14において、ウエハ11の表面の繰り返しパターンから発生した回折光L2は、凹面反射鏡23を介して集光され、CCDカメラ28の撮像面上に到達する。CCDカメラ28の撮像面上には、回折光L2によるウエハ11の像(ウエハ回折像)が形成される。CCDカメラ28は、ウエハ回折像を撮像して、画像信号を画像処理装置15に出力する。
【0024】
上記のように、照明系13と受光系14が固定されているため(θi,θdは固定値)、ホルダ12のチルト角Tと照明光L1の波長λとの組み合わせを調整して、回折光L2の回折角(θr+T)が受光角(θd+T)と一致するように設定すれば、ウエハ11の表面の繰り返しパターンから発生した回折光L2を受光系14の光軸O2に沿って進行させることができる。
【0025】
そして、受光系14の光軸O2に沿って導かれる回折光L2の光量が適量である場合には、CCDカメラ28によって、コントラストの良好なウエハ回折像を撮像することができる。回折光L2の光量は、ウエハ11に照射される照明光L1の光量を調整することで、適量に設定できる。
コントラストの良好なウエハ回折像を撮像するために調整すべき装置条件は、ホルダ12のチルト角Tと照明光L1の波長λと光量である。その他、CCDカメラ28の露出時間や電気的な感度などが調整可能な場合、これらを装置条件として含めてもよい。また、ホルダ12が軸Ax2のまわりに回転可能な場合、その回転角を装置条件に含めてもよい。装置条件の調整は制御装置16が行う。
【0026】
ここで、回折光L2の強度は、ウエハ11の表面の繰り返しパターンの欠陥箇所と正常箇所とで異なる。このため、CCDカメラ28の撮像面に形成されるウエハ回折像には、繰り返しパターンの欠陥箇所と正常箇所とに起因する明暗差(コントラスト差)が生じることになる。
画像処理装置15は、CCDカメラ28から得られるウエハ回折像の画像信号を所定ビット(例えば8ビット)のディジタル画像に変換し、ウエハ画像としてメモリに記憶させる。さらに、そのときの装置条件(ホルダ12のチルト角Tや照明光L1の波長λなどの組み合わせ)も併せてメモリに記憶させる。
【0027】
また、画像処理装置15は、ウエハ11の表面に形成された繰り返しパターンの欠陥検出を行う前に、制御装置16と協同して、最適な装置条件(チルト角Tや波長λなどの組み合わせ)の候補を多数決定する(図3参照)。そして、画像処理装置15は、得られた多数の候補をクラスタリング処理により分類する(図4参照)。上述したように、多数の候補が得られる理由は、ウエハ11に複数種類の例えばピッチの異なる繰り返しパターンが存在するからである。
【0028】
次に、最適な装置条件(チルト角Tや波長λなどの組み合わせ)の候補の決定処理について説明する。この決定処理は、画像処理装置15と制御装置16とが、図3に示すフローチャートの手順にしたがって行う。
ウエハ11がホルダ12上に固定されると、制御装置16は、ホルダ12や光源21などを制御して装置条件を例えば初期値に設定する(ステップS1)。そして、画像処理装置15は、そのときの装置条件を制御装置16から取り込み、CCDカメラ28からウエハ画像を取り込み(ステップS2)、装置条件とウエハ画像を対応づけてメモりに記憶する(ステップS3)。
【0029】
ステップS1〜S3の処理は、予め想定された全ての装置条件(チルト角Tや波長λなどの組み合わせ)の各々で処理済になる(つまりステップS4の判定がYesとなる)まで、繰り返し行われる。この間、制御装置16による装置条件の設定変更ごとに、画像処理装置15によるウエハ画像の取り込みが行われ、メモリには装置条件とウエハ画像との記憶情報が蓄積していく。
【0030】
そして、全ての装置条件で処理済になる(ステップS4がYes)と、画像処理装置15は、メモリに記憶させた各ウエハ画像ごとに、全画素の輝度値を調べて、最大輝度値を求める(ステップS5)。さらに、各ウエハ画像に対応づけられた装置条件と最大輝度値との関係を調べ、最大輝度値が極大値を示す多数の装置条件を「最適な装置条件の候補」と決定する(ステップS6)。決定された多数の候補は、メモリ内でウエハ画像に対応づけられている。以下の説明では、決定された候補の数をM個とする。
【0031】
次に、多数の候補の分類処理について説明する。分類処理は、画像処理装置15が、図4に示すフローチャートの手順にしたがって行う。
画像処理装置15は、まず、各々の候補に対応づけられたウエハ画像のチップ平均画像を求める(ステップS11)。つまり、各ウエハ画像の中から図2に示す複数のチップ20に対応する部分画像(以下「チップ画像」という)を抜き出し、得られた複数のチップ画像の濃度を画素ごとに平均化し、チップ平均画像を生成する。
【0032】
上述したように、1つのウエハ11内で各々のチップ20における繰り返しパターンの配置は同様であるため、各々のチップ画像の濃度分布も同様である。したがって、複数のチップ画像の濃度平均により得られたチップ平均画像は、ウエハ画像(ウエハ11の全体像)の特徴を示すと考えられる。
図5に、チップ平均画像の例を示す。M個(図5では9個)のチップ平均画像の各々は、M個の候補の各々に対応づけられたウエハ画像から生成されたものである。このため、M個のチップ平均画像も、メモリ内で各々の候補に対応づけられる。チップ平均画像どうしを比較すると、候補の装置条件の相違に応じて、濃度分布も少しずつ異なることが分かる。
【0033】
次に、画像処理装置15は、図4のステップS12において、各々のチップ平均画像ごとに、チップ平均画像の予め定めた複数の種類(例えば22種類)の特徴量を抽出する。ここで、チップ平均画像の特徴量の例を説明する。
(1) 各チップ平均画像の中で図6(a)に示すような2つの注目領域A,Bを指定し、注目領域A,Bの各々の平均濃度を計算する。そして、2つの平均濃度の違い(領域濃度差や領域濃度比)を計算し、特徴量f,fとする。また、他の図6(b)〜(e)に示すような注目領域A,Bでも同様の計算を行い、特徴量f〜f10とする。
【0034】
(2) 各チップ平均画像の全体で、平均濃度を計算して特徴量f11とし、濃度の標準偏差を計算して特徴量f12とする。また、各チップ平均画像の全体で、濃度を重みとして重心座標を計算し、特徴量f13,f14とする。さらに、各チップ平均画像のうち濃度の高い部分(明部)で同様の計算を行い(偏向させた重心座標)、特徴量f15,f16とする。濃度の高い部分としては、平均濃度以上の部分や(平均濃度+濃度標準偏差)以上の部分が考えられる。
【0035】
(3) 各チップ平均画像の全体で、画像中心回りの慣性モーメントを計算して特徴量f17とし、X軸,Y軸回りの慣性モーメントを計算して特徴量f18,f19とする。また、各チップ平均画像のうち濃度の高い部分(明部)で、偏向させた画像中心回りの慣性モーメントを計算して特徴量f80とし、偏向させたX軸,Y軸回りの慣性モーメントを計算して特徴量f21,f22とする。
【0036】
画像処理装置15は、ここまでの処理により、多数の候補に対応づけられたチップ平均画像(図5)の各々に関して22種類の特徴量f〜f22を抽出し終えると、図4のステップS13の処理に進み、各チップ平均画像の特徴量f〜f22を正規化する。これは、次の選択処理やクラスタリング処理の際に、22種類の特徴量f〜f22を同じ尺度で扱えるようにするための処理である。
【0037】
そして、画像処理装置15は、正規化された後の特徴量f〜f22に基づいて、ステップS14の選択処理を行う。以下の説明では、正規化後の特徴量を、単に「特徴量」という。
ステップS14において、画像処理装置15は、22種類の特徴量f〜f22を統計的に処理し(詳細は次に説明)、22種類の中から例えば5個の“最適な種類”を選択する。この選択処理は、次のクラスタリング処理の性能を向上させるための前処理であり、例えば次の手順[1],[2],[3],…にしたがって行われる。
【0038】
[1] 22個の種類(全種類)の各々における特徴量f〜f22の標準偏差値σを計算する。標準偏差値σは、特徴量f〜f22のばらつきに関する統計値である。その計算結果の一例を図7に示す。図7の「Ave.」「Devi.」「Cent.X」「Cent.Y」「C.X−up」「C.Y−up」「I−mmt.」「I−mmtX.」は、各々、上記した特徴量f11〜f18の種類を表している。各々のチップ平均画像は、M個の候補の各々に対応づけられている。図7の数値は、特徴量f〜f22の値である。
【0039】
[2] 22個の種類(全種類)を標準偏差値σの大きい順に並べる(ランキング)。例えば、図7の計算例では、「C.Y−up」→「Cent.Y」→「C.X−up」→「Cent.X」→「Ave.」→「I−mmt.」→「Devi.」→「I−mmtX.」という順になる。統計的な考え方によれば、標準偏差値σの小さい種類(例えばI−mmtX.)は、その特徴量(例えばチップ平均画像No.1,2,3,…の各々の特徴量f18)が平均値を中心とした同じような値を持つ。このため、情報量が少ない。これに対して、標準偏差値σの大きい種類(例えばC.Y−up)は、その特徴量のバラツキが大きく、多くの情報量を含む。したがって、後述のクラスタリング処理には、標準偏差値σの大きい種類を“最適な種類”として用いることが好ましい。
【0040】
[3] まず、標準偏差値σが最も大きい種類「C.Y−up」を“最適な種類”の1つとして選択する。
[4] 次に、標準偏差値σが2番目に大きい種類「Cent.Y」を“最適な種類”の候補として注目し、この種類「Cent.Y」の特徴量f14と、上記[3]で選択した種類「C.Y−up」の特徴量f16との相関値Cを計算する。そして、この相関値Cを予め定めた閾値C(例えば0.6)と大小比較し、相関値Cが閾値C以下の場合には、いま注目している種類「Cent.Y」も“最適な種類”の1つとして選択する。逆に、相関値Cが閾値Cより大きい場合には、注目している種類「Cent.Y」を“最適な種類”から除外する。
【0041】
統計的な考え方によれば、種類「C.Y−up」「Cent.Y」の特徴量f16,f14どうしの相関値Cが高い場合、これらの2種類は似た特徴量である。このため、両方の種類を後述のクラスタリング処理に用いても情報が冗長なだけであり、無駄である。これに対し、相関値Cが低い場合は、上記の2種類が異なる傾向を持つため、その両方を用いることがクラスタリング処理にとって有益である。
【0042】
したがって、手順[4]では、相関値Cが閾値C以下の場合のみ、注目した種類「Cent.Y」を“最適な種類”の1つとして選択する。その結果、“最適な種類”としては、2つの種類「C.Y−up」「Cent.Y」が選択されたことになる。また、注目した種類「Cent.Y」を“最適な種類”から除外した場合、現段階における“最適な種類”は、手順[3]で選択した種類「C.Y−up」のみとなる。
【0043】
ここで、22個の種類(全種類)のうち任意の2種類における特徴量f〜f22どうしの相関値を総当たりで計算した結果(相関係数マトリクス)の一例を図8に示す。図8の「Ave.」「Devi.」「Cent.X」「Cent.Y」「C.X−up」「C.Y−up」「I−mmt.」は、図7と同じである。また、図8の「Mmt−up」「MmtX−up」「MmtY−up」「P1」「P2」…は、各々、上記した特徴量f80,f21,f22,f,f,…の種類を表す。図8の数値は、相関値である。
【0044】
図8の計算例では、手順[4]における種類「C.Y−up」「Cent.Y」の特徴量f16,f14どうしの相関値Cが 0.483 であり、閾値C以下である。このため、手順[4]では、注目した候補の種類「Cent.Y」が“最適な種類”の1つとして選択される。
【0045】
[5] 次に、標準偏差値σが3番目に大きい種類「C.X−up」を“最適な種類”の候補として注目し、この種類「C.X−up」の特徴量f15と、既に選択された“最適な種類”の特徴量との、同様の相関演算および比較処理を行う。
既に選択された“最適な種類”が1個の種類「C.Y−up」のみの場合、手順[5]での相関演算および比較処理は、上記[4]と同じである。つまり、注目した種類「C.X−up」の特徴量f15と“最適な種類「C.Y−up」”の特徴量f16との相関値Cを計算し、相関値Cが閾値C以下の場合のみ、注目した候補の種類「C.X−up」を“最適な種類”の1つとして選択する。
【0046】
また、既に選択された“最適な種類”が2個の種類「C.Y−up」「Cent.Y」の場合、手順[5]での相関演算および比較処理は、次のようになる。つまり、注目した種類「C.X−up」の特徴量f15と“最適な種類「C.Y−up」”の特徴量f16との相関値C、および、注目した種類「C.X−up」の特徴量f15と“最適な種類「Cent.Y」”の特徴量f14との相関値Cを計算する。そして、2つの相関値C,Cの各々を閾値Cと大小比較し、2つの相関値C,Cが共に閾値C以下の場合のみ、注目した候補の種類「C.X−up」を“最適な種類”の1つとして選択する。
【0047】
図8の計算例では、手順[5]における種類「C.X−up」「C.Y−up」の特徴量f15,f16どうしの相関値Cが 0.026 であり、種類「C.X−up」「Cent.Y」の特徴量f15,f14どうしの相関値Cが 0.246 であり、共に閾値C以下である。このため、手順[5]では、注目した候補の種類「C.X−up」が“最適な種類”の1つとして選択される。
【0048】
[6] その後も同様に、標準偏差値σの大きい種類から順に“最適な種類”の候補として注目し、『注目した種類の特徴量と選択済の“最適な種類”の特徴量との相関値が全て閾値C以下の場合のみ、注目した候補の種類を“最適な種類”の1つとして選択する』という処理を繰り返す。そして、“最適な種類”の選択数が例えば5個になった時点で、図4のステップS14の選択処理を終了する。
【0049】
この選択処理の結果、22種類の中から例えば5個の“最適な種類”が選択されたことになる。5個の“最適な種類”とは、個々の標準偏差値σが大きく、かつ、特徴量どうしの相関値が閾値C以下のものである。すなわち、ステップS14の選択処理の結果、多くの情報量を含むと共に、互いに異なる傾向を持つ5個の種類が、“最適な種類”として選択されたことになる。
【0050】
次に、画像処理装置15は、ステップS15において、例えば5個の“最適な種類”の特徴量を統計的に処理する。つまり、“最適な種類”の特徴量に基づいて、クラスタリング処理を行う。そして、多数の候補を分類する。
具体的には、5個の“最適な種類”をそれぞれ軸とする5次元のユークリッド空間(特徴量空間)を設定し、この特徴量空間に類似性の尺度を導入して、多数の候補を似たものどうしのグループ(つまりクラスター)に分類する。なお、特徴量空間の各軸は正規化すれば距離的に等価に扱うことができる。
【0051】
クラスタリング処理について簡単に説明する。画像処理装置15は、まず、M個の候補の各々を全てクラスターとする。この時点でクラスター数はM個である。各クラスターに含まれる要素の数は1個である。次に、クラスター間の距離(つまり要素の間のユークリッド距離)を全ての組み合わせで計算する。
そして、クラスター間の距離が最小である一対のクラスターを選び、併合する。この併合により、一対のクラスターは、1つのクラスターとなる。これには2つの要素が含まれることになる。この時点でのクラスター数は(M−1)個である。次に、クラスター間の距離を同様にして計算する。ただし、1つのクラスターに複数の要素が含まれる場合、クラスター間の距離は群間平均により求められる。
【0052】
画像処理装置15では、距離の計算を終えると、上記と同様、最小距離の一対のクラスターの併合処理を行う。さらに、クラスター間の距離の計算と併合処理を繰り返し、クラスター数が所定数(例えば5個)になると、多数の候補の分類処理(図4)を終了する。なお、最終的なクラスター数は、分類処理の対象となった候補の数などに応じて変更可能である。
【0053】
図9に、5個のクラスターに分類された候補と、それに対応付けられたチップ平均画像の例を示す。図9に示すように、M個のチップ平均画像(図5)は5個のクラスターに分類され、各々のクラスターには類似性の高いチップ平均画像が含まれている。したがって、それぞれのチップ平均画像に対応する候補の装置条件も、類似性の高いものが同じクラスターに分類されたことになる。
【0054】
本実施形態によれば、多数の候補に対応づけられた各チップ平均画像から22種類の特徴量(f〜f22)を抽出し、この22種類の中から選択した例えば5個の“最適な種類”の特徴量に基づいてクラスタリング処理を行うため、多数の候補を類似性の高いものが含まれる所定数(例えば5個)のクラスターに分類することができる。つまり、多数の最適な装置条件の候補を適切に分類できる。
【0055】
また、本実施形態では、特徴量の“最適な種類”の選択数を例えば5個としたため、クラスタリング処理における特徴量空間をサンプル数(候補の数,M個,例えば数10個)に応じた適切な次元数に設定することができる。その結果、クラスタリング処理の性能が向上する。
ちなみに、“最適な種類”の選択数(つまり特徴量空間の次元数)が少ないと、クラスタリング処理における空間の分離が不充分になってしまう。逆に、“最適な種類”の選択数(つまり次元数)が多くなると、必要なサンプル数が指数関数的に増大して、実際のサンプル数(数10個)が相対的に不足する。このため、“最適な種類”の選択数を例えば5個とすることにより、クラスタリング処理の性能を向上させることができる。
【0056】
クラスタリング処理により多数の最適な装置条件の候補を適切に分類した後、画像処理装置15では、各クラスターから代表的な候補の装置条件を選んで最適条件に決定することができる。この場合に、決定される最適条件の数は、クラスター数(例えば5個)と同数であり、候補の全数(M個)よりも少ない。したがって、それぞれの最適条件の下でウエハ11の検査を1回ずつ行うとしても、全ての候補を最適条件に設定して1回ずつ検査する場合と比較して、全体の処理時間を短縮することができる。
【0057】
さらに、分類後の各クラスターから選んだ代表的な候補をさらに厳選し、その中から最も検査に適するものを最適条件として選ぶことも可能である。このような場合、選択の対象となる母体数を減らすことができるので、より容易に最適条件を選ぶことができる。
また、本実施形態によれば、チップ平均画像を用いたことにより、特徴量の抽出を効率よく行うことができる。そのため、多数の候補の分類を正確かつ容易に行うことができる。
【0058】
(変形例)
なお、上記した実施形態では、特徴量の“最適な種類”の選択処理において標準偏差値σを大小比較したが、標準偏差値σの代わりに、分散値σを大小比較してもよい。分散値σも、特徴量f〜f22のばらつきに関する統計値である。
さらに、上記した実施形態では、特徴量の“最適な種類”の選択処理において、標準偏差値σの大小比較後に、相関値の大小比較を行ったが、その順序は逆にすることもできる。つまり、相関値の大小比較後に、標準偏差値σの大小比較を行ってもよい。
【0059】
この場合の選択処理としては、図8の相関係数マトリクスの中で、相関値が閾値C以上のペア(2個の種類の組み合わせ)を探し、そのどちらか一方を“最適な種類”として選択し、他方を除外することが考えられる。このとき、標準偏差値σが高い方の種類を選択して、低い方の種類を除外することが好ましい。さらに、この選別後、標準偏差値σによりランキングして、標準偏差値σの大きいものから所定数(例えば5個)を最終的な“最適な種類”選択してもよい。
【0060】
また、上記した実施形態では、特徴量の“最適な種類”の選択処理において、標準偏差値σ(または分散値σ)と相関値との双方を用いたが、標準偏差値σ(または分散値σ)のみを用いてもよいし、相関値のみでもよい。
さらに、上記した実施形態では、各ウエハ画像の最大輝度値に基づいて最適条件の候補を決定した(図3のステップS5,S6)が、本発明はこれに限定されない。各ウエハ画像の平均輝度値や他のファクター(輝度情報)に基づいて最適条件の候補を決定しても構わない。
【0061】
また、本実施形態では、多数の候補を分類する際に、ウエハ画像からチップ平均画像を求め、そのチップ平均画像から特徴量を抽出したが、本発明はこれに限定されない。(1)ウエハ画像から特徴量を抽出しても良い。これは、ウエハ11などの基板の表面に塗布されたレジスト膜の厚みの不均一性や、基板の歪みなどに起因する欠陥を検査する場合に有効である。(2)ウエハ1画像からショット平均画像を求め、そのショット平均画像から特徴量を抽出するようにしても良い。
これは、ショット領域が1つのチップ20より小さいときでも有効である。
【0062】
さらに、本実施形態では、クラスタリング処理を行う際に、特徴量空間としてユークリッド空間を用いる例を示したが、他の距離(例えばマハラノビス距離)や空間を用いるようにしても良い。
また、本実施形態では、ウエハ11の表面からの回折光L2を用いて検査を行う例を示したが、ウエハ11の表面からの散乱光を用いて検査を行うようにしても良いし、ウエハ11の表面からの回折光L2と散乱光との両方を用いて検査を行うようにしても良い。
【0063】
さらに、本実施形態の表面検査装置10とは構成が異なる表面検査装置に本発明を適用しても良い。例えば、固定されたホルダに対して、照明系および受光系が可動であり、照明系および受光系を動かすことで、ホルダのチルトと同様の効果が得られる表面検査装置に適用しても良い。
また、本実施形態では、表面検査装置10の画像処理装置15により多数の候補の決定処理や分類処理などを行ったが、表面検査装置10に接続された外部のコンピュータを用いた場合でも、同様の効果を得ることができる。
【0064】
【発明の効果】
以上説明したように、本発明によれば、被検物体(基板)の画像に基づいて決定した多数の最適な装置条件の候補を適切に分類することができる。
【図面の簡単な説明】
【図1】表面検査装置10の全体構成を示す図である。
【図2】ウエハ11の表面の外観を示す概略図である。
【図3】最適な装置条件の候補の決定処理を示すフローチャートである。
【図4】多数の候補の分類処理を示すフローチャートである。
【図5】チップ平均画像の例を示す図である。
【図6】チップ平均画像の注目領域A,Bの一例を示す図である。
【図7】各々のチップ平均画像から抽出した複数の種類の特徴量と各種類ごとに計算した標準偏差値σの一例を示す図である。
【図8】相関係数マトリクスの一例を示す図である。
【図9】クラスタリングによる分類結果の一例を示す図である。
【符号の説明】
10 表面検査装置
11 ウエハ
12 ホルダ
13 照明系
14 受光系
15 画像処理装置
16 制御装置
20 チップ
21 光源
22 ライトガイド
23,27 凹面反射鏡
28 CCDカメラ
[0001]
BACKGROUND OF THE INVENTION
The present invention relates to a surface inspection apparatus for inspecting the surface of a substrate in a manufacturing process of a semiconductor circuit element or a liquid crystal display element.
[0002]
[Prior art]
Conventionally, in a manufacturing process of a semiconductor circuit element or a liquid crystal display element, a defect inspection of a repetitive pattern formed on the surface of a substrate (wafer or plate) has been performed. An automated surface inspection system irradiates the surface of the substrate with illumination light for inspection, captures the image of the substrate based on the diffracted light generated from the repetitive pattern on the substrate, and the contrast difference between the images. To identify the defective part of the repeated pattern.
[0003]
Further, in a conventional surface inspection apparatus, an image of a substrate is captured while automatically changing the apparatus conditions (for example, the tilt angle of the substrate), and optimum apparatus conditions are determined based on the obtained images (for example, (See Patent Document 1). Then, a predetermined inspection is performed under the optimum apparatus conditions.
[Patent Document 1]
JP 2002-162368 A
[0004]
[Problems to be solved by the invention]
However, in the conventional surface inspection apparatus described above, a number of optimum apparatus conditions can be obtained according to the number of types of repetitive patterns on the substrate. When inspection is performed sequentially under these optimum apparatus conditions, the entire process is performed. The time will be longer. In order to shorten the processing time, it is necessary to narrow down a number of optimum apparatus conditions and select one suitable for inspection. Further, as the pre-processing, it is necessary to classify a number of optimum apparatus conditions, but an appropriate classification method has not yet been proposed. In the following description, a number of optimum apparatus conditions determined based on the substrate image as described above are referred to as “optimum apparatus condition candidates”.
[0005]
An object of the present invention is to provide a surface inspection apparatus capable of appropriately classifying a number of optimum apparatus condition candidates determined based on an image of a test object (substrate).
[0006]
[Means for Solving the Problems]
The surface inspection apparatus according to claim 1, wherein the plurality of images are acquired based on an image capturing unit that captures an image of a test object under each of a plurality of apparatus conditions, and the plurality of images captured by the image capturing unit. Determining means for determining a plurality of optimum apparatus condition candidates from among the apparatus conditions, and a plurality of predetermined types of the image for each of the images corresponding to each of the plurality of candidates determined by the determining means Extraction means for extracting the feature quantity, a selection means for statistically processing the plurality of types of feature quantities and selecting one or more optimum types from the plurality of types, and And classifying means for statistically processing feature quantities and classifying the plurality of candidates.
[0007]
According to a second aspect of the present invention, in the surface inspection apparatus according to the first aspect, the selection unit compares the variance value or the standard deviation value of the feature amount in each of the plurality of types, The most appropriate type is selected.
According to a third aspect of the present invention, in the surface inspection apparatus according to the first aspect, the selection unit compares the correlation values of the feature quantities in any two types of the plurality of types by comparing the magnitudes thereof. The optimum type is selected.
[0008]
According to a fourth aspect of the present invention, in the surface inspection apparatus according to the first aspect, the selection means compares the variance value or the standard deviation value of the feature amount in each of the plurality of types, and the plurality of the plurality of types. The optimum type is selected by comparing the correlation values of the feature quantities in any two of the types.
[0009]
DETAILED DESCRIPTION OF THE INVENTION
Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
[0010]
This embodiment corresponds to claims 1 to 4.
As shown in FIG. 1, the surface inspection apparatus 10 of the present embodiment includes a holder 12 that supports a wafer 11 that is an object to be inspected, an illumination system 13 that irradiates the surface of the wafer 11 with illumination light L <b> 1, and the wafer 11. The light receiving system 14 that receives the diffracted light L <b> 2 from the surface, the image processing device 15, and the control device 16 are configured.
[0011]
The surface inspection apparatus 10 is an apparatus that automatically inspects the surface of the wafer 11 in the manufacturing process of semiconductor circuit elements. On the surface of the wafer 11, as shown in FIG. 2, a plurality of chips 20 are arranged in the xy direction. Each chip 20 has a plurality of types of repeated patterns. The repetitive pattern is a circuit pattern (resist pattern) having a line array shape that is periodically repeated. The arrangement of the repeated patterns in each chip 20 is the same.
[0012]
Generally, in the surface inspection apparatus 10, before performing inspection of the surface of the wafer 11 (defect pattern defect detection), optimum apparatus conditions (for example, a tilt angle, illumination light amount, and illumination wavelength described later) based on the density information of the wafer image. Etc.) are determined, and the obtained many candidates are classified by clustering processing. Then, in consideration of the classification result, an optimum apparatus condition is set and an inspection is performed. The reason why a large number of candidates are obtained is that a plurality of types of repetitive patterns exist on the wafer 11.
[0013]
Here, each part of the surface inspection apparatus 10 will be described.
The holder 12 places the wafer 11 transported by a transport device (not shown) on the upper surface, and fixes and holds the wafer 11 by, for example, vacuum suction. Further, the holder 12 can be tilted within a predetermined angle range about an axis Ax1 passing through the surface of the wafer 11 by a tilt mechanism (not shown). The tilt angle T of the holder 12 is one of the device conditions that can be arbitrarily set by the control device 16.
[0014]
1 corresponds to the normal line of the holder 12. The axis Ax2 in FIG. Here, a direction parallel to the axis Ax2 (reference normal) in a state where the holder 12 is kept horizontal is defined as a Z direction.
A direction parallel to the axis Ax1 is defined as an X direction. Further, a direction orthogonal to the X direction and the Z direction is defined as a Y direction.
The illumination system 13 is a decentered optical system that includes a light source 21, a light guide 22, and a concave reflecting mirror 23. The light guide 22 transmits light from the light source 21 and emits the light from the end face 22a toward the concave reflecting mirror 23. The end surface 22 a is disposed at the front focal position of the concave reflecting mirror 23.
[0015]
The concave reflecting mirror 23 is a reflecting mirror having a spherical inner surface as a reflecting surface, and is disposed obliquely above the holder 12. That is, an axis (optical axis O1) passing through the center of the concave reflecting mirror 23 and the center of the holder 12 is inclined by a predetermined angle θi with respect to the Z direction. θi is a fixed value.
The concave reflecting mirror 23 is disposed so that the optical axis O1 is orthogonal to the axis Ax1 (X direction) of the holder 12 and the rear focal plane substantially coincides with the surface of the wafer 11. The illumination system 13 of the surface inspection apparatus 10 is an optical system that is telecentric with respect to the wafer 11 side.
[0016]
In the illumination system 13, the light from the light source 21 is applied to the entire surface of the wafer 11 through the light guide 22 and the concave reflecting mirror 23 (illumination light L1). The illumination light L1 is a light beam in which the center line of the light beam reaching an arbitrary point on the wafer 11 is substantially parallel to the optical axis O1. The incident angle (θi−T) of the illumination light L1 corresponds to the angle between the axis Ax2 perpendicular to the surface of the wafer 11 and the optical axis O1, and changes according to the tilt angle T of the holder 12.
[0017]
Further, the wavelength λ and the amount of light of the illumination light L1 change according to the wavelength and the amount of light emitted from the light source 21. For example, when a wavelength selection filter and a neutral density (ND) filter are provided in the light source 21, the wavelength λ and the light amount of the illumination light L1 can be changed by controlling each filter. Similarly to the tilt angle T, the wavelength λ and the light amount of the illumination light L1 are one of the apparatus conditions that can be arbitrarily set by the control device 16.
[0018]
When the illumination light L1 is irradiated in this way, diffracted light L2 is generated from the repetitive pattern formed on the surface of the wafer 11 according to the diffraction conditions described later. The diffraction angle (θr + T) of the diffracted light L2 corresponds to the angle between the axis Ax2 perpendicular to the surface of the wafer 11 and the traveling direction of the diffracted light L2, and changes according to the tilt angle T. θr represents an angle between the traveling direction of the diffracted light L2 and the Z direction. The linear direction of the repeated pattern that generates the diffracted light L2 is substantially parallel to the axis Ax1 of the holder 12.
[0019]
Here, the diffraction condition is expressed by the following equation (1) using the wavelength λ and the incident angle (θi−T) of the illumination light L1, the diffraction angle (θr + T) and the diffraction order n of the diffracted light L2, and the pitch p of the repetitive pattern. ).
sin (θi−T) −sin (θr + T) = nλ / p (1)
In Expression (1), the incident angle (θi−T) and the diffraction angle (θr + T) are positive for the angle direction expected on the incident side with reference to the axis Ax2 perpendicular to the surface of the wafer 11, and are negative for the angle direction expected on the reflection side. And With respect to the diffraction order n, the angle direction expected on the incident side with respect to 0th order diffracted light (regular reflection light) of n = 0 is positive, and the angle direction expected on the reflection side is negative.
[0020]
In Expression (1), θi represents an angle (fixed value) between the Z direction and the optical axis O1, and θr represents an angle between the Z direction and the traveling direction of the diffracted light L2. The tilt angle T is T = 0 when the holder 12 is kept in a horizontal state, the angle direction toward the incident side is plus, and the angle direction toward the opposite side is minus. θi corresponds to the incident angle of the illumination light L1 when the tilt angle T = 0. θr corresponds to the diffraction angle of the diffracted light L2 when the tilt angle T = 0.
[0021]
As can be seen from the equation (1), by changing the tilt angle T, the incident angle (θi−T) of the illumination light L1 can be changed according to the tilt angle T. As a result, the rotation of the diffracted light L2 can be changed. The folding angle (θr + T) can also be changed.
The light receiving system 14 is an optical system that receives the diffracted light L <b> 2, and is an eccentric optical system that includes a concave reflecting mirror 27 and a CCD camera 28.
[0022]
The concave reflecting mirror 27 is a reflecting mirror similar to the concave reflecting mirror 23 described above, and is disposed obliquely above the holder 12. That is, the axis (optical axis O2) passing through the center of the concave reflecting mirror 27 and the center of the holder 12 is arranged so as to be inclined by a predetermined angle θd with respect to the reference normal line (Z direction). θd is a fixed value. Hereinafter, an angle (θd + T) between the axis Ax2 perpendicular to the surface of the wafer 11 and the optical axis O2 is referred to as a light receiving angle. The light receiving angle (θd + T) also changes in accordance with the tilt angle T, similar to the incident angle (θi−T).
[0023]
The CCD camera 28 is arranged so that its imaging surface substantially coincides with the focal plane of the concave reflecting mirror 23. A plurality of pixels are two-dimensionally arranged on the imaging surface of the CCD camera 28.
In the light receiving system 14, the diffracted light L <b> 2 generated from the repetitive pattern on the surface of the wafer 11 is collected via the concave reflecting mirror 23 and reaches the imaging surface of the CCD camera 28. On the imaging surface of the CCD camera 28, an image of the wafer 11 (wafer diffraction image) is formed by the diffracted light L2. The CCD camera 28 captures a wafer diffraction image and outputs an image signal to the image processing device 15.
[0024]
As described above, since the illumination system 13 and the light receiving system 14 are fixed (θi and θd are fixed values), the combination of the tilt angle T of the holder 12 and the wavelength λ of the illumination light L1 is adjusted to produce diffracted light. If the diffraction angle (θr + T) of L2 is set so as to coincide with the light receiving angle (θd + T), the diffracted light L2 generated from the repetitive pattern on the surface of the wafer 11 can travel along the optical axis O2 of the light receiving system 14. it can.
[0025]
When the amount of the diffracted light L2 guided along the optical axis O2 of the light receiving system 14 is an appropriate amount, the CCD camera 28 can capture a wafer diffraction image with good contrast. The light amount of the diffracted light L2 can be set to an appropriate amount by adjusting the light amount of the illumination light L1 applied to the wafer 11.
The apparatus conditions to be adjusted in order to capture a wafer diffraction image with good contrast are the tilt angle T of the holder 12, the wavelength λ of the illumination light L1, and the amount of light. In addition, when the exposure time and electrical sensitivity of the CCD camera 28 can be adjusted, these may be included as device conditions. Further, when the holder 12 can rotate around the axis Ax2, the rotation angle may be included in the apparatus conditions. The controller 16 adjusts the apparatus conditions.
[0026]
Here, the intensity of the diffracted light L <b> 2 is different between a defective portion and a normal portion of the repeated pattern on the surface of the wafer 11. For this reason, in the wafer diffraction image formed on the imaging surface of the CCD camera 28, a light / dark difference (contrast difference) due to a defective portion and a normal portion of the repetitive pattern occurs.
The image processing device 15 converts the image signal of the wafer diffraction image obtained from the CCD camera 28 into a digital image of a predetermined bit (for example, 8 bits) and stores it in the memory as a wafer image. Furthermore, the apparatus conditions at that time (a combination of the tilt angle T of the holder 12 and the wavelength λ of the illumination light L1) are also stored in the memory.
[0027]
In addition, the image processing apparatus 15 cooperates with the control apparatus 16 before performing defect detection of the repetitive pattern formed on the surface of the wafer 11 to obtain optimum apparatus conditions (combination of tilt angle T, wavelength λ, etc.). A large number of candidates are determined (see FIG. 3). Then, the image processing apparatus 15 classifies the obtained many candidates by clustering processing (see FIG. 4). As described above, the reason why a large number of candidates are obtained is that there are a plurality of types of repeated patterns having different pitches, for example, on the wafer 11.
[0028]
Next, a process for determining candidates for optimal apparatus conditions (combination of tilt angle T, wavelength λ, etc.) will be described. This determination process is performed by the image processing device 15 and the control device 16 in accordance with the procedure of the flowchart shown in FIG.
When the wafer 11 is fixed on the holder 12, the control device 16 controls the holder 12, the light source 21, and the like to set the device conditions to, for example, initial values (step S 1). Then, the image processing device 15 captures the device conditions at that time from the control device 16, captures the wafer image from the CCD camera 28 (step S2), and stores the device conditions and the wafer image in association with each other (step S3). ).
[0029]
The processing in steps S1 to S3 is repeatedly performed until processing is completed under each of all the presumed apparatus conditions (combinations such as tilt angle T and wavelength λ) (that is, the determination in step S4 is Yes). . During this period, every time the apparatus condition is changed by the controller 16, the image processing apparatus 15 takes in the wafer image, and the memory stores information about the apparatus condition and the wafer image.
[0030]
When the processing is completed under all the apparatus conditions (Yes in step S4), the image processing apparatus 15 examines the luminance values of all the pixels for each wafer image stored in the memory to obtain the maximum luminance value. (Step S5). Further, the relationship between the apparatus condition associated with each wafer image and the maximum luminance value is examined, and a large number of apparatus conditions whose maximum luminance value has a maximum value are determined as “optimum apparatus condition candidates” (step S6). . The determined many candidates are associated with the wafer image in the memory. In the following description, the determined number of candidates is M.
[0031]
Next, a large number of candidate classification processes will be described. The classification processing is performed by the image processing apparatus 15 according to the procedure of the flowchart shown in FIG.
First, the image processing apparatus 15 obtains a chip average image of the wafer image associated with each candidate (step S11). That is, partial images (hereinafter referred to as “chip images”) corresponding to the plurality of chips 20 shown in FIG. 2 are extracted from each wafer image, and the density of the obtained plurality of chip images is averaged for each pixel. Generate an image.
[0032]
As described above, since the arrangement of the repeated patterns in each chip 20 in one wafer 11 is the same, the density distribution of each chip image is also the same. Therefore, it is considered that the chip average image obtained by the density average of a plurality of chip images shows the characteristics of the wafer image (the entire image of the wafer 11).
FIG. 5 shows an example of a chip average image. Each of the M (9 in FIG. 5) chip average images is generated from a wafer image associated with each of the M candidates. For this reason, the M chip average images are also associated with each candidate in the memory. Comparing the chip average images, it can be seen that the density distribution is slightly different according to the difference in the candidate apparatus conditions.
[0033]
Next, in step S12 of FIG. 4, the image processing apparatus 15 extracts a plurality of predetermined types (for example, 22 types) of feature amounts of the chip average image for each chip average image. Here, an example of the feature amount of the chip average image will be described.
(1) Two attention areas A and B as shown in FIG. 6A are designated in each chip average image, and the average density of each of the attention areas A and B is calculated. Then, the difference between the two average densities (area density difference or area density ratio) is calculated, and the feature value f 1 , F 2 And Further, the same calculation is performed for the attention areas A and B as shown in other FIGS. 3 ~ F 10 And
[0034]
(2) For each chip average image, the average density is calculated to calculate the feature value f. 11 And calculate the standard deviation of the density and calculate the feature value f 12 And In addition, the center of gravity coordinates are calculated using the density as a weight for the entire chip average image, and the feature value f 13 , F 14 And Further, the same calculation is performed on the high density portion (bright portion) of each chip average image (deflected barycentric coordinates), and the feature value f 15 , F 16 And As the high density part, a part having an average density or higher and a part having (average density + density standard deviation) or higher can be considered.
[0035]
(3) By calculating the moment of inertia around the center of the image of each chip average image, the feature value f 17 And calculate the moment of inertia around the X-axis and Y-axis 18 , F 19 And Also, the feature amount f is calculated by calculating the moment of inertia around the deflected image center in the high density portion (bright portion) of each chip average image. 80 And calculate the moment of inertia about the deflected X and Y axes to calculate the feature value f 21 , F 22 And
[0036]
The image processing apparatus 15 has obtained 22 types of feature values f for each of the chip average images (FIG. 5) associated with a large number of candidates by the processing so far. 1 ~ F 22 4 is extracted, the process proceeds to step S13 in FIG. 1 ~ F 22 Is normalized. This is because 22 types of feature values f are used in the next selection process or clustering process. 1 ~ F 22 Is a process for making it possible to handle with the same scale.
[0037]
The image processing apparatus 15 then calculates the feature value f after normalization. 1 ~ F 22 Based on the above, the selection process of step S14 is performed. In the following description, the normalized feature quantity is simply referred to as “feature quantity”.
In step S14, the image processing apparatus 15 performs 22 types of feature values f. 1 ~ F 22 Are statistically processed (details will be described next), and, for example, five “optimal types” are selected from the 22 types. This selection process is a pre-process for improving the performance of the next clustering process, and is performed, for example, according to the following procedures [1], [2], [3],.
[0038]
[1] Feature amount f in each of 22 types (all types) 1 ~ F 22 The standard deviation value σ of is calculated. The standard deviation value σ is the feature value f 1 ~ F 22 It is a statistical value about the dispersion | variation in. An example of the calculation result is shown in FIG. “Ave.”, “Devi.”, “Cent. X”, “Cent. Y”, “C.X-up”, “C. Y-up”, “I-mmt.”, And “I-mmtX.” In FIG. , Feature amount f described above 11 ~ F 18 Represents the type. Each chip average image is associated with each of the M candidates. The numerical value of FIG. 1 ~ F 22 Is the value of
[0039]
[2] Arrange 22 types (all types) in descending order of standard deviation value σ (ranking). For example, in the calculation example of FIG. 7, “C.Y-up” → “Cent.Y” → “C.X-up” → “Cent.X” → “Ave.” → “I-mmt.” → “ Dev. "→" I-mmtX. " According to a statistical concept, a type with a small standard deviation value σ (for example, I-mmtX.) Has a characteristic amount (for example, a characteristic amount f of each of the chip average images No. 1, 2, 3,...). 18 ) Has a similar value centered on the average value. For this reason, the amount of information is small. On the other hand, the type with a large standard deviation value σ (for example, CY-up) has a large variation in the feature amount and includes a large amount of information. Therefore, it is preferable to use a type having a large standard deviation value σ as an “optimal type” for the clustering process described later.
[0040]
[3] First, the type “CY-up” having the largest standard deviation value σ is selected as one of the “optimal types”.
[4] Next, attention is paid to the type “Cent. Y” having the second largest standard deviation value σ as a candidate of the “optimal type”, and the feature amount f of this type “Cent. Y”. 14 And the feature value f of the type “C.Y-up” selected in [3] above 16 Correlation value C A Calculate And this correlation value C A Is a predetermined threshold C S (For example, 0.6), and the correlation value C A Is threshold C S In the following cases, the type “Cent. Y” that is currently focused on is also selected as one of the “optimal types”. Conversely, the correlation value C A Is threshold C S If it is larger, the focused type “Cent. Y” is excluded from the “optimal type”.
[0041]
According to a statistical concept, the feature quantity f of types “C.Y-up” and “Cent.Y” 16 , F 14 Inter-correlation value C A When is high, these two types are similar feature amounts. For this reason, even if both types are used for the clustering process described later, the information is only redundant and useless. In contrast, the correlation value C A When the value is low, the above two types have different tendencies, so it is useful for the clustering process to use both.
[0042]
Therefore, in the procedure [4], the correlation value C A Is threshold C S Only in the following cases, the focused type “Cent. Y” is selected as one of the “optimal types”. As a result, two types “C.Y-up” and “Cent.Y” are selected as the “optimal types”. When the noticed type “Cent.Y” is excluded from the “optimal type”, the “optimal type” at the current stage is only the type “C.Y-up” selected in the procedure [3].
[0043]
Here, the feature value f in any two of the 22 types (all types) 1 ~ F 22 FIG. 8 shows an example of the result (correlation coefficient matrix) obtained by calculating the correlation values between each other. “Ave.”, “Devi.”, “Cent. X”, “Cent. Y”, “C.X-up”, “C. Y-up”, and “I-mmt.” In FIG. Further, “Mmt-up”, “MmtX-up”, “MmtY-up”, “P1”, “P2”,... In FIG. 80 , F 21 , F 22 , F 1 , F 2 Indicates the type of. The numerical values in FIG. 8 are correlation values.
[0044]
In the calculation example of FIG. 8, the feature amount f of the types “C.Y-up” and “Cent.Y” in the procedure [4]. 16 , F 14 Inter-correlation value C A Is 0.483 and the threshold value C S It is as follows. Therefore, in the procedure [4], the candidate type “Cent. Y” of interest is selected as one of the “optimal types”.
[0045]
[5] Next, attention is paid to the type “C.X-up” having the third largest standard deviation value σ as a candidate of the “optimal type”, and the feature amount f of this type “C.X-up”. 15 And the same correlation calculation and comparison processing with the “optimum type” feature quantity already selected.
When the “optimum type” that has already been selected is only one type “C-Y-up”, the correlation calculation and comparison processing in the procedure [5] is the same as the above [4]. That is, the feature amount f of the noticed type “C.X-up” 15 And “optimum type“ C-Y-up ”” feature amount f 16 Correlation value C B And the correlation value C B Is threshold C S Only in the following cases, the candidate type “C.X-up” to which attention is paid is selected as one of the “optimal types”.
[0046]
When the “optimum type” already selected is the two types “C.Y-up” and “Cent.Y”, the correlation calculation and the comparison process in the procedure [5] are as follows. That is, the feature amount f of the noticed type “C.X-up” 15 And “optimum type“ C-Y-up ”” feature amount f 16 Correlation value C C , And the feature amount f of the noted type “C.X-up” 15 And “optimum type“ Cent.Y ”” feature quantity f 14 Correlation value C D Calculate And two correlation values C C , C D Each with threshold C S The two correlation values C C , C D Are both threshold C S Only in the following cases, the candidate type “C.X-up” to which attention is paid is selected as one of the “optimal types”.
[0047]
In the calculation example of FIG. 8, the feature quantity f of the types “C.X-up” and “C.Y-up” in the procedure [5]. 15 , F 16 Inter-correlation value C C Is 0.026, and the feature amount f of types “C.X-up” and “Cent.Y” 15 , F 14 Inter-correlation value C D Is 0.246, both of which are threshold values C S It is as follows. For this reason, in the procedure [5], the candidate type “C.X-up” of interest is selected as one of the “optimum types”.
[0048]
[6] Similarly, attention is paid to “optimum type” candidates in descending order of the standard deviation value σ, and “correlation between the feature type of the noticed type and the feature quantity of the selected“ optimal type ”. All values are threshold C S Only in the following cases, the process of selecting the focused candidate type as one of “optimal types” is repeated. Then, when the number of selections of “optimum type” reaches 5, for example, the selection process in step S14 of FIG.
[0049]
As a result of this selection process, for example, five “optimum types” are selected from the 22 types. The five “optimum types” mean that each standard deviation value σ is large and the correlation value between the feature quantities is a threshold value C. S It is as follows. That is, as a result of the selection process in step S14, five types that include a large amount of information and have different tendencies from each other are selected as “optimal types”.
[0050]
Next, in step S15, the image processing apparatus 15 statistically processes, for example, five “optimum types” feature amounts. That is, the clustering process is performed based on the “optimal type” feature amount. Then, a large number of candidates are classified.
Specifically, a five-dimensional Euclidean space (feature space) with five “optimal types” as axes is set, and a similarity measure is introduced into this feature space, and a large number of candidates are selected. Classify similar groups (ie clusters). In addition, if each axis of the feature amount space is normalized, it can be treated equivalently in terms of distance.
[0051]
The clustering process will be briefly described. First, the image processing apparatus 15 sets all of the M candidates as clusters. At this point, the number of clusters is M. The number of elements included in each cluster is one. Next, the distance between clusters (that is, the Euclidean distance between elements) is calculated for all combinations.
Then, a pair of clusters having the smallest distance between the clusters is selected and merged. By this merging, the pair of clusters becomes one cluster. This will include two elements. The number of clusters at this time is (M-1). Next, the distance between clusters is calculated similarly. However, when a plurality of elements are included in one cluster, the distance between the clusters is obtained by an average between groups.
[0052]
When the calculation of the distance is completed, the image processing apparatus 15 performs the merging process of the pair of clusters having the minimum distance as described above. Further, the calculation of the distance between the clusters and the merging process are repeated, and when the number of clusters reaches a predetermined number (for example, 5), the classification process of many candidates (FIG. 4) is terminated. Note that the final number of clusters can be changed according to the number of candidates subjected to classification processing.
[0053]
FIG. 9 shows an example of candidates classified into five clusters and chip average images associated therewith. As shown in FIG. 9, the M chip average images (FIG. 5) are classified into five clusters, and each cluster includes a chip average image with high similarity. Therefore, candidate apparatus conditions corresponding to the respective chip average images are also classified into the same cluster having high similarity.
[0054]
According to this embodiment, 22 types of feature quantities (f) are obtained from each chip average image associated with a large number of candidates. 1 ~ F 22 ) And the clustering process is performed based on, for example, five “optimum types” feature quantities selected from the 22 types. 5) clusters. That is, a large number of optimum apparatus condition candidates can be appropriately classified.
[0055]
In this embodiment, since the number of selections of “optimal types” of feature quantities is set to five, for example, the feature quantity space in the clustering process corresponds to the number of samples (number of candidates, M, for example, several tens). An appropriate number of dimensions can be set. As a result, the performance of the clustering process is improved.
Incidentally, if the number of “optimal types” selected (that is, the number of dimensions of the feature space) is small, space separation in the clustering process becomes insufficient. On the other hand, when the number of “optimal types” selected (that is, the number of dimensions) increases, the number of necessary samples increases exponentially, and the actual number of samples (several tens) becomes relatively short. For this reason, the performance of the clustering process can be improved by setting the number of “optimum types” to five, for example.
[0056]
After appropriately classifying a number of optimum apparatus condition candidates by clustering processing, the image processing apparatus 15 can select representative candidate apparatus conditions from each cluster and determine them as optimum conditions. In this case, the number of optimum conditions determined is the same as the number of clusters (for example, 5), which is smaller than the total number of candidates (M). Therefore, even if the wafer 11 is inspected once under each optimum condition, the entire processing time can be shortened as compared with the case where all candidates are set to the optimum condition and inspected once. Can do.
[0057]
Furthermore, it is possible to further select representative candidates selected from each cluster after classification, and select the most suitable candidate from among them as the optimum condition. In such a case, since the number of matrixes to be selected can be reduced, the optimum condition can be selected more easily.
Further, according to the present embodiment, the feature amount can be extracted efficiently by using the chip average image. Therefore, a large number of candidates can be classified accurately and easily.
[0058]
(Modification)
In the above-described embodiment, the standard deviation value σ is compared in size in the process of selecting the “optimal type” of the feature amount. Instead of the standard deviation value σ, the variance value σ 2 May be compared. Variance σ 2 Is also the feature amount f 1 ~ F 22 It is a statistical value about the dispersion | variation in.
Furthermore, in the above-described embodiment, the correlation value magnitude comparison is performed after the standard deviation value σ magnitude comparison in the “optimal type” selection process of the feature quantity, but the order may be reversed. That is, the standard deviation value σ may be compared after the correlation value is compared.
[0059]
As a selection process in this case, in the correlation coefficient matrix of FIG. S It is conceivable to search for the above pair (a combination of two types), select one of them as the “optimal type”, and exclude the other. At this time, it is preferable to select a type having a higher standard deviation value σ and exclude a lower type. Further, after this selection, ranking may be performed based on the standard deviation value σ, and a predetermined number (for example, five) having a large standard deviation value σ may be finally selected.
[0060]
In the above-described embodiment, the standard deviation value σ (or the variance value σ 2 ) And the correlation value, but the standard deviation value σ (or variance value σ 2 ) May be used, or only the correlation value may be used.
Furthermore, in the above-described embodiment, the optimum condition candidate is determined based on the maximum luminance value of each wafer image (steps S5 and S6 in FIG. 3), but the present invention is not limited to this. Optimal condition candidates may be determined based on the average luminance value of each wafer image and other factors (luminance information).
[0061]
Further, in this embodiment, when a large number of candidates are classified, a chip average image is obtained from the wafer image and a feature amount is extracted from the chip average image. However, the present invention is not limited to this. (1) A feature amount may be extracted from a wafer image. This is effective when inspecting defects caused by unevenness of the thickness of a resist film applied to the surface of a substrate such as the wafer 11 or distortion of the substrate. (2) A shot average image may be obtained from the wafer 1 image, and a feature amount may be extracted from the shot average image.
This is effective even when the shot area is smaller than one chip 20.
[0062]
Furthermore, in this embodiment, when performing the clustering process, an example in which the Euclidean space is used as the feature amount space is shown, but other distances (for example, Mahalanobis distance) and spaces may be used.
Further, in this embodiment, an example in which the inspection is performed using the diffracted light L2 from the surface of the wafer 11 has been shown, but the inspection may be performed using the scattered light from the surface of the wafer 11, or the wafer. The inspection may be performed using both the diffracted light L2 from the surface 11 and the scattered light.
[0063]
Furthermore, the present invention may be applied to a surface inspection apparatus having a configuration different from that of the surface inspection apparatus 10 of the present embodiment. For example, the present invention may be applied to a surface inspection apparatus in which the illumination system and the light receiving system are movable with respect to a fixed holder, and the same effect as the tilt of the holder can be obtained by moving the illumination system and the light receiving system.
In this embodiment, a large number of candidate determination processes and classification processes are performed by the image processing apparatus 15 of the surface inspection apparatus 10, but the same applies even when an external computer connected to the surface inspection apparatus 10 is used. The effect of can be obtained.
[0064]
【The invention's effect】
As described above, according to the present invention, it is possible to appropriately classify a large number of optimum apparatus condition candidates determined based on an image of a test object (substrate).
[Brief description of the drawings]
FIG. 1 is a diagram showing an overall configuration of a surface inspection apparatus 10;
FIG. 2 is a schematic view showing the appearance of the surface of a wafer 11. FIG.
FIG. 3 is a flowchart showing a process for determining an optimum apparatus condition candidate.
FIG. 4 is a flowchart showing classification processing of a large number of candidates.
FIG. 5 is a diagram illustrating an example of a chip average image.
FIG. 6 is a diagram illustrating an example of attention areas A and B of a chip average image.
FIG. 7 is a diagram illustrating an example of a plurality of types of feature amounts extracted from each chip average image and a standard deviation value σ calculated for each type.
FIG. 8 is a diagram illustrating an example of a correlation coefficient matrix.
FIG. 9 is a diagram illustrating an example of a classification result by clustering.
[Explanation of symbols]
10 Surface inspection equipment
11 Wafer
12 Holder
13 Lighting system
14 Light receiving system
15 Image processing device
16 Control device
20 chips
21 Light source
22 Light Guide
23, 27 Concave reflector
28 CCD camera

Claims (4)

被検物体の画像を複数の装置条件の各々で取り込む画像取込手段と、
前記画像取込手段により取り込まれた複数の前記画像に基づいて、前記複数の装置条件の中から最適な装置条件の候補を複数決定する決定手段と、
前記決定手段により決定された複数の前記候補の各々に対応する前記画像ごとに、該画像の予め定めた複数の種類の特徴量を抽出する抽出手段と、
前記複数の種類の特徴量を統計的に処理し、前記複数の種類の中から1つ以上の最適な種類を選択する選択手段と、
前記最適な種類の特徴量を統計的に処理し、前記複数の候補を分類する分類手段とを備えたことを特徴とする表面検査装置。
Image capturing means for capturing an image of a test object under each of a plurality of apparatus conditions;
Determining means for determining a plurality of optimum apparatus condition candidates from the plurality of apparatus conditions based on the plurality of images captured by the image capturing means;
Extraction means for extracting a plurality of predetermined types of feature amounts of the image for each of the images corresponding to each of the plurality of candidates determined by the determination means;
A selection means for statistically processing the plurality of types of feature values and selecting one or more optimum types from the plurality of types;
A surface inspection apparatus comprising: a classifying unit that statistically processes the optimum type of feature quantity and classifies the plurality of candidates.
請求項1に記載の表面検査装置において、
前記選択手段は、前記複数の種類の各々における前記特徴量の分散値または標準偏差値を大小比較することにより、前記最適な種類を選択することを特徴とする表面検査装置。
The surface inspection apparatus according to claim 1,
The surface inspection apparatus, wherein the selection unit selects the optimum type by comparing the variance value or standard deviation value of the feature amount in each of the plurality of types.
請求項1に記載の表面検査装置において、
前記選択手段は、前記複数の種類のうち任意の2種類における前記特徴量どうしの相関値を大小比較することにより、前記最適な種類を選択することを特徴とする表面検査装置。
The surface inspection apparatus according to claim 1,
The surface inspection apparatus, wherein the selection unit selects the optimum type by comparing the correlation values of the feature quantities of any two types among the plurality of types.
請求項1に記載の表面検査装置において、
前記選択手段は、前記複数の種類の各々における前記特徴量の分散値または標準偏差値を大小比較すると共に、前記複数の種類のうち任意の2種類における前記特徴量どうしの相関値を大小比較することにより、前記最適な種類を選択することを特徴とする表面検査装置。
The surface inspection apparatus according to claim 1,
The selection means compares the variance value or standard deviation value of the feature amount in each of the plurality of types, and compares the correlation value between the feature amounts in any two types of the plurality of types. Thus, the surface inspection apparatus is characterized in that the optimum type is selected.
JP2003207463A 2003-08-13 2003-08-13 Surface inspection system Pending JP2005061853A (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2003207463A JP2005061853A (en) 2003-08-13 2003-08-13 Surface inspection system

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2003207463A JP2005061853A (en) 2003-08-13 2003-08-13 Surface inspection system

Publications (1)

Publication Number Publication Date
JP2005061853A true JP2005061853A (en) 2005-03-10

Family

ID=34363927

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2003207463A Pending JP2005061853A (en) 2003-08-13 2003-08-13 Surface inspection system

Country Status (1)

Country Link
JP (1) JP2005061853A (en)

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008158776A (en) * 2006-12-22 2008-07-10 Canon Inc Feature detection method and device, program, and storage medium
WO2008105460A1 (en) * 2007-02-28 2008-09-04 Nikon Corporation Observation device, inspection device and inspection method
US20100235140A1 (en) * 2009-03-16 2010-09-16 Fuji Xerox Co., Ltd. Detected data processing apparatus and computer readable medium for detecting data
JP2014142213A (en) * 2013-01-22 2014-08-07 Canon Inc Photographing parameter determination device and control method of the same
JP2018160691A (en) * 2018-06-26 2018-10-11 株式会社Screenホールディングス Substrate holding inspection method and substrate processing apparatus

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2008158776A (en) * 2006-12-22 2008-07-10 Canon Inc Feature detection method and device, program, and storage medium
US8072612B2 (en) 2006-12-22 2011-12-06 Canon Kabushiki Kaisha Method and apparatus for detecting a feature of an input pattern using a plurality of feature detectors, each of which corresponds to a respective specific variation type and outputs a higher value when variation received by the input pattern roughly matches the respective specific variation type
WO2008105460A1 (en) * 2007-02-28 2008-09-04 Nikon Corporation Observation device, inspection device and inspection method
JPWO2008105460A1 (en) * 2007-02-28 2010-06-03 株式会社ニコン Observation method, inspection apparatus, and inspection method
TWI449898B (en) * 2007-02-28 2014-08-21 尼康股份有限公司 Observation device, inspection device and inspection method
US20100235140A1 (en) * 2009-03-16 2010-09-16 Fuji Xerox Co., Ltd. Detected data processing apparatus and computer readable medium for detecting data
JP2010216912A (en) * 2009-03-16 2010-09-30 Fuji Xerox Co Ltd Detected data processing apparatus and program
JP4730451B2 (en) * 2009-03-16 2011-07-20 富士ゼロックス株式会社 Detection data processing apparatus and program
US8326564B2 (en) 2009-03-16 2012-12-04 Fuji Xerox Co., Ltd Detected data processing apparatus and computer readable medium for detecting data
JP2014142213A (en) * 2013-01-22 2014-08-07 Canon Inc Photographing parameter determination device and control method of the same
JP2018160691A (en) * 2018-06-26 2018-10-11 株式会社Screenホールディングス Substrate holding inspection method and substrate processing apparatus

Similar Documents

Publication Publication Date Title
CN113302728B (en) Method and system for inspecting semiconductor structure using automatically generated defect features
JP4802481B2 (en) Surface inspection apparatus, surface inspection method, and exposure system
JP5934874B2 (en) System and method for inspecting a wafer
US6879392B2 (en) Method and apparatus for inspecting defects
JP2019049556A (en) System and method for inspecting wafers
US7505619B2 (en) System and method for conducting adaptive fourier filtering to detect defects in dense logic areas of an inspection surface
JP2005321237A (en) Pattern inspection method and pattern inspection device
EP1174707A1 (en) Defect inspection method and defect inspection apparatus
CN111819596B (en) Method and system for combined simulation and optical microscopy to determine inspection mode
CN112106180B (en) Performance monitoring based on design alignment
TWI778258B (en) Methods, systems, and non-transitory computer readable medium of defect detection
JP5450161B2 (en) Defect inspection apparatus and defect inspection method
CN115777060A (en) Optical image contrast metric for optical target search
TWI829958B (en) System and method for inspecting semiconductor devices
JP2005061853A (en) Surface inspection system
TWI829980B (en) Method and system of semiconductor wafer inspection, and non-transitory computer readable medium
JP2006294684A (en) Surface inspection apparatus
TW202211340A (en) Binning-enhanced defect detection method for three-dimensional wafer structures
JP2005072048A (en) Data managing device
JP2004264276A (en) Surface inspection device and surface inspection method
US20230122514A1 (en) Laser Anneal Pattern Suppression
TW202301191A (en) Image contrast metrics for deriving and improving imaging conditions
JP2005062950A (en) Image processing device
JP2005003476A (en) Surface-analysis device
JP2006190016A (en) Clustering method